BAB I PENGANTAR
1. 1 PENGERTIAN STATISTIK Statistik berasal dari dua kata, yaitu: Statia yang merupakan istilah yang digunakan untuk menyebutkan catatan administrasi pemerintahan di Amerika Serikat, dan Stochos yang berarti anak panah (bahasa Yunani) atau sesuatu yang mengandung ketidak pastian Secara umum para ahli mendefenisikan statistik sebagai ilmu yang membahas tentang pengambilan data, pengolahan data sampai kesimpulan yang diperoleh dari perhitungan dan pengolahan data tadi, serta membuat keputusan yang dapat diterima berdasarkan analisis. Dalam bidang bisnis aplikasi statistik akan sangat bermanfaat diantaranya:
Akuntansi Perusahaan akuntan publik seringkali menggunakan prosedur pengambilan sampel (contoh) yang memenuhi kaidah-kaidah statistik ketika melakukan audit terhadap kliennya. Keuangan (Finance) Penasehat keuangan menggunakan berbagai jenis informasi statistik, termasuk priceearnings ratio dan hasil dividen, untuk membantu dalam memberikan rekomendasi investasi. Pemasaran Pengambilan sampel masyarakat sebagai calon konsumen untuk diminta pendapat tentang produk yang akan diluncurkan oleh suatu perusahaan seringkali menggunakan kaidah statistik. Ekonomi Para ahli ekonomi menggunakan prosedur statistik dalam melakukan peramalan tentang kondisi perekonomian pada masa yang akan datang.
1.2 DATA DAN VARIABEL Statistik dalam prakteknya tidak bisa dilepaskan dari data yang berupa angka, baik itu dalam statistik deskriptif yang menggambarkan data, maupun statistik inferensi yang melakukan analisis terhadap data. Data adalah sekumpulan datum yang berisi fakta-fakta serta gambaran suatu fenomena yang dikumpulkan, dirangkum, dianalisis dan selanjutnya diinterpretasikan. Variabel adalah: karakteristik data yang menjadi perhatian (Dajan 1987) Data yang baik harus memenuhi beberapa syarat berikut: (1) Data harus obyektif, sesuai dengan keadaan sebenarnya (as it is). (2) Data harus bisa mewakili (representative). (3) Kesalahan baku (standard error) harus kecil Suatu perkiraan (estimate) dikatakan baik (memiliki tingkat ketelitian tinggi) jika kesalahan bakunya kecil. Syarat (2) & (3) sering disebut sebagai syarat data yang dapat diandalkan (reliable). (4) Harus tepat waktu (up to date).
(5) Harus relevan, yaitu data yang dikumpulkan harus ada hubungannya dengan masalah yang akan dipecahkan (Anonim 2007) Pembagian data adalah sebagai berikut: (1) Data berdasarkan susunannya o Data acak atau data tunggal: Adalah data yang belum tersusun atau dikelompokkan ke dalam kelas-kelas interval. o Data berkelompok: Adalah data yang tersusun atau dikelompokkan ke dalam kelaskelas interval. Data kelompok disusun dalam bentuk distribusi frekuensi atau tabel frekuensi. (2) Data berdasarkan jenisnya o Data kualitatif: Adalah data yang tidak berbentuk bilangan. Data kualitatif mempunyai ciri tidak bisa dilakukan operasi matematika, seperti penambahan, pengurangan, eprkalian dan pembagian. Yang termasuk data kulitatif adalah data nominal dan data ordinal. o Data kuantitatif: Adalah data yang berbentuk bilangan. Jadi, berbagai operasi matematika bisa dilakukan pada data kuantitatif. Yang termasuk data kuantitatif adalah data interval dan data rasio. (3) Data berdasarkan waktu pengumpulan o Data berkala/time series: Adalah data yang terkumpul dari waktu ke waktu untuk memberikan gambaran perkembangan suatu kegiatan. o Data cross section: Adalah data yang terkumpul pada suatu waktu tertentu untuk memberikan gambaran perkembangan keadaan atau kegiatan pada waktu itu. (4) Data berdasarkan sumber pengambilannya o Data primer : Adalah data yang diperoleh atau dikumpulkan oleh orang yang melakukan penelitian atau yang bersangkutan yang memerlukannya. Data ini juga disebut data asli atau data baru. o Data sekunder: Adalah data yang diperoleh atau dikumpulkan oleh orang dari sumber-sumber yang telah ada. Data itu biasanya diperoleh dari perpustakaan atau dari laporan-laporan peneliti yang terdahulu. Data ini juga disebut sebagai data tersedia. (5) Data berdasarkan skala pengukuran Skala pengukuran adalah peraturan penggunaan notasi bilangan dalam pengukuran. o Data nominal: Adalah data yang diberikan pada objek atau kategori yang tidak menggambarkan kedudukan objek atau kategori tersebut terhadap objek atau kategori lainnya, tetapi hanya sekedar label atau kode saja. Data itu hanya mengelompokkan objek atau kategori ke dalam kelompok tertentu. Data ini mempunyai dua ciri, yaitu : 1. Kategori data bersifat saling lepas 2. Kategori data tidak disusun secara logis Data bertipe nominal adalah data yang paling ‘rendah’ dalam level pengukuran data. Jika suatu pengukuran hanya menghasilkan satu dan hanya satu-satunya kategori, data tersebut adalah data nominal (data kategori). Contoh: Status Kewarganegaraan ( 1 untuk indonesia, 2 untuk Amerika,3 untuk China)
o
Data ordinal: Adalah data yang penomoran objek atau kategorinya disusun menurut besarnya, yaitu dari tingkat terendah ke tingkat tertinggi atau sebaliknya dengan jarak / rentang yang tidak harus sama. Data ini memiliki ciri seperti pada ciri data nominal ditambah satu ciri lagi, yaitu kategori data dapat disusun berdasarkan urutan logis dan sesuai dengan besarnya karakteristik yang dimiliki. Data ordinal seperti pada data nominal, adalah juga data kualitatif namun dengan level yang lebih ‘tinggi’ daripada data nominal. Jika pada data nominal semua data kategori dianggap sama, maka pada data ordinal ada tingkatan data. Contoh: Tingkat pendidikan, rangking
Data interval: Adalah data dimana objek/kategori dapat diurutkan berdasarkan suatu atribut yang memberikan informasi tentang interval antara tiap objek/kategori sama. Besarnya interval dapat ditambah atau dikurangi. Data ini memiliki ciri yang sama dengan ciri pada data ordinal ditambah satu ciri lagi yaitu urutan kategori data mempunyai jarak yang sama. Data interval menempati pengukuran data yang lebih ‘tinggi’ dari data ordinal, karena selain bisa bertingkat urutannya, juga urutan tersebut bisa dikuantitatifkan. Data interval juga tidak memiliki nilai 0 absolut. Contoh: Nilai test: o Nilai A untuk nilai dari 80-100 o Nilai B untuk nilai dari 65-79 o Nilai C untuk nilai dari 55-64 o Nilai D untuk nilai dari 45-54 o Nilai E untuk nilai dari 0 - 44 o Data rasio: Adalah data yang memiliki sifat-sifat data nominal, data ordinal, dan data interval, dilengkapi dengan titik nol absolut dengan makna empiris. Karena terdapat angka nol maka pada data ini dapat dibuat perkalian atau pembagian. Angka pada data menunjukkan ukuran yang sebenarnya dari objek/ kategori yang diukur. Data rasio adalah data dengan pengukuran paling ‘tinggi’ di antara jenis data lainnya. Contoh: suhu, berat badan (Murtiyasa, 2007) (6) Data berdasarkan sifatnya o Data diskret: Data yang didapat dengan cara menghitung. o Data kontinu: Data yang dapat mempunyai nilai yang terletak dalam suatu interval (7) Data berdasarkan sumbernya o Data Internal: Data yang menggambarkan kegiatan atau keadaan di dalam suatu organisasi. o Data Eksternal : Data yang menggambarkan kegiatan atau keadaan di luar suatu organisasi. 1.3 PEMBAGIAN STATISTIK Statistik secara umum dibedakan atas dua topik kajian utama yaitu: (1) Statistik deskriptif Merupakan teknik statistik di mana di sini dilakukan pengambilan data, penyajian data tanpa adanya kesimpulan. Beberapa hal yang perlu diperhatikan mengenai karakteristik data adalah pemahaman tentang: cara-cara penyajian data (histogram, distribusi frekuensi),
Untuk letak atau ukuran kecenderungan (berbagai macam mean, berbagai macam median, modus, akar mean kuadrat, persentil dan kuartil) dan ukuran deviasi (simpangan kuartil, rentang, simpangan baku, mean absolut simpang, variansi). (2) Statistik inferensia Teknik statistik mempunyai pengumpulan data, pengolahan serta penganalisaan terhadap data yang diperoleh sehingga nantinya dapat diambil suatu kesimpulan. Statistik inferensi meliputi perumusan hipotesis statistik (pernyataan tentang populasi), pemilihan uji yang sesuai, penentuan taraf yang signifikan, analisa statistik. Statistik induktif meliputi 2 hal yaitu o Teknik pengolahan data secara parametrik o Teknik pengolahan data secara non parametrik Dalam dua sesi pelatihan kedepan akan dibahas mengenai aplikasi statistik bagi kebutuhan bisnis yang difokuskan pada statistik deskriptif dan statistik parametrik. EVALUASI (1) Jelaskan perbedaan antara populasi dan sampel ! (2) Berikut diberikan data informasi finansial dari beberapa sampel perusahaan asing untuk 1 Juli 2011 Company A B C D E F G H I a. b. c. d. e. f.
Price ($) 18 10 13 84 14 28 37 22 28
Price/Earnings per share 12.6 18.2 39.5 18.6 48.2 23.6 18.6 23.3 17.5
Annual Dividend ($) Ratio 0.36 0.12 0 1.20 0 0.08 0.05 0.30 1.00
Sector per share services basic materials technology financial healthcare technology healthcare consumer-noncyclical consumer-cyclical
Ada berapa banyak element dalam set data tersebut? Ada berapa banyak variabel dalam set data tersebut? Manakah variabel-variabel yang tergolong kualitatif Manakan variabel-variabel yang tergolong kuantitatif Apakah data tersebut merupakan data cross sectional ataukah time series? Untuk kesemua variabel diatas, berikan skala pengukuran yang digunakan.
BAB II STATISTIK DESKRIPTIF 2.1 MEAN, MEDIAN, MODUS DAN UKURAN PEMUSATAN DATA LAINNYA Nilai mean (rata-rata hitung) dari suatu himpunan N bilangan X1, X2, ..., XN ditunjukkan oleh X dan dirumuskan sebagai berikut:
Median adalah data yang berada ditengah sampel atau populasisetalah data tersebut diurutkan, sedangkan modus adalah data yang paling sering muncul atau data yang memiliki frekuensi terbesar. Modus mungkin tidak ada atau tidak unik. Beberapa ukuran pemusatan data lainnya (Matjik dan Sumertajaya 2002) adalah: (1) Kuartil merupakan ukuran letak yang membagi data kedalam empat kelompok yang sama besar (2) Desil merupakan ukuran letak yang membagi data ke dalam 10 kelompok yang sama besar (3) Persentil merupakan ukuran letak yang membagi data ke dalam 100 kelompok yang sama besar 2.3 Simpangan baku dan ragam (varians) Simpangan baku adalah deviasi atau penyimpangan suatu data terhadap rata-ratanya. Simpangan baku dari N data dapat dirumuskan:
Varians suatu himpunan didefinisikan sebagai kuadrat simpangan baku (S2). Bilamana diperlukan untuk membedakan simpangan baku populasi dari simpangan baku sampel yang berasal dari populasi ini seringkali kita menggunakan lambang S untuk simpangan baku sampel dan σ untuk simpangan baku populasi. Jadi S2 mewakili variansi sampel dan σ2 mewakili variansi populasi. 2.4 ANALISIS STATISTIK DESKRIPTIV DENGAN MICROSOFT EXCEL Berdasarkan data pada halaman 9 maka beberapa fungsi analisis statistik deskriprtif dengan menggunakan EXCEL adalah:
Hasil dari perhitungan tersebut:
Cara lebih mudah adalah dengan menggunakan fasilitas statistik deskriptif pada data analisis yang telah disediakan oleh EXCEL (3) Klik DATA > DATA ANALYSIS > DESCRIPTIVE STATISTICS
(4) Lengkapi semua kolom isian, masukkan sel A1:A21 kedalam input range, centangi Labels in first row, taruh output range di salah satu sel bebas, dan centangi summary statistics, confidence level for mean, Kth largest, kth smallest (5) Hasilnya adalah sebagai berikut:
Perhatikan bahwa hasil diatas sama persis dengan langkah penyelesaian sebelumnya dengan memasukkan fungsi statistik. 2.2 PENYAJIAN DATA Penyajian data dapat dilakukan dengan dua cara yaitu: Tabel dan grafik. (1) Tabel, dapat dibedakan atas: o Tabel satu arah (one-way table) o Tabulasi silang (lebih dari satu arah (two-way table), dst.) o Tabel Distribusi Frekuensi (2) Grafik: o Batang (Bar Graph), untuk perbandingan/pertumbuhan
o o o
Lingkaran (Pie Chart), untuk melihat perbandingan (dalam persentase/proporsi) Grafik Garis (Line Chart), untuk melihat pertumbuhan Grafik Peta, untuk melihat/menunjukkan lokasi
Aplikasi Excel memudahkan kita untuk melakukan penyajian data. Yang akan dibahas adalah pembuatan tabel frekuensi dan histogram A. Pembuatan tabel distribusi frekuensi dilakukan dengan tahap-tahap berikut: 1. Untuk latihan, misalnya kita punya data umur dari hasil survai terhadap 20 orang konsumen sebagai berikut: 20 18 25 30 34 32 35 17 22 21 38 17 28 30 35 36 32 22 30 32 2. Ketikkan kedalam excel, buat dalam satu kolom misalnya range A2-A21
3. Banyaknya kelas dihitung berdasarkan aturan sturges dimana jumlah kelas (k): k = 1+(3,33 * log n) = 1 + (3,33 * log 20) = 5 4. Range atau kisaran data dihitung dengan fungsi =MAX(A2:A21)-MIN(A2:A21) = 38 – 17 = 21 Sehingga lebar kelas adalah = 21/5 = 4,2 ≈ 5 Interval data misalnya: 15-19, 20-24, 25-29, 30-34, 36-49, tuliskan batas atas interval data (nilai tertinggi setiap kelas) kedalam sel C2-C6 5. Setelah itu, di sel D2 ketikkan rumus berikut: =FREQUENCY(A2:A21,C2:C6). 6. blok range dari D2:D6, kemudian tekan F2 dan tekan CTRL+SHIFT+ENTER bersamaan. Maka hasil distribusi frekuensi kita akan muncul pada range D2:D6. 7. Kita juga bisa menambahkan persentase di kolom berikutnya. Jumlahkan terlebih dahulu distribusi frekuensi tersebut dan tempatkan jumlahnya pada sel D7. Kemudian pada sel E2 ketikkan rumus berikut: =(D2/D$7)*100. Selanjutnya, copy rumus tersebut sampai pada sel Hasil pekerjaan kita akan tampak sebagai berikut:
Cara lebih mudah dapat dilakukan dengan menggunakan fasilitas Histogram pada EXCEL, sebagi berikut: 5.
Setelah kita menentukan batas atas interval setiap kelas: klik Data >> Data Analysis >> Histogram
6. Akan muncul kotak dialog:
7. Masukkan range A2-A21 di kotak INPUT RANGE, dan C2-C6 di kotak BIN RANGE, beri check list pada bagian CUMULATIVE PERCENTAGE DAN CHART OUTPUT 8. Pilih output range di salah satu sel, atau pilih NEW WORKSHEET PLY jika ingin menampilkannya di sheet terpisah atau NEW WORKBOOK jika inging menampilkannya di Book baru. 9. Hasilnya akan tampak sebagai berikut
Secara tidak langsung anda telah berkenalan dengan histogram. Histogram merupakan gambaran secara grafik dari distribusi frekuensi. Histogram atau histogram frekuensi ini terdiri dari himpunan siku empat yang mempunyai : o Alas pada sumbu mendatar (sumbu-x) dengan pusat markah (titik tengah kelas) dan panjang sama dengan ukuran selang kelas. o Luas sebanding terhadap frekuensi kelas. Jika semua selang kelas mempunyai ukuran sama, tinggi segi empat sebanding terhadap frekuensi kelas dan merupakan kebiasaan untuk mengambil tinggi secara numerik sama dengan frekuensi kelas. Dari suatu histogram, kita bisa mengetahui informasi mengenai data yang kita teliti, apakah data tersebut homogen atau tidak, menyebar secara normal atau tidak dan sebagainya. Data yang kita miliki terlihat tidak proporsional dalam hal ini tidak menyebar secara merata dimana lebih banyak responden yang berumur 34-39 tahun. Berdasarkan tampilan data pada histogram dikenal istilah kemencengan (skewness) dan kurtosis (derajat kepuncakan) b. Kemencengan Skewness atau kemencengan adalah derajat ketaksimetrisan, atau kejauhan dari simetri dari suatu distribusi. Berdasarkan kemencengannya, grafik distribusi terbagi menjadi tiga, yaitu: Negatively skewed distribution, yaitu kurva frekuensi suatu distribusi yang mempunyai ekor yang lebih panjang ke kiri dari maksimum pusat daripada yang ke kanan, distribusi ini disebut juga menceng ke kiri atau mempunyai kemencengan negatif. Positively skewed distribution, yaitu kurva frekuensi suatu distribusi yang mempunyai ekor yang lebih panjang ke kanan dari maksimum pusat daripada yang
ke kiri, distribusi ini disebut juga menceng ke kanan atau mempunyai kemencengan positif. Symmetric distribution, yaitu kurva frekuensi suatu distribusi yang mempunyai ekor yang sama panjang dari maksimum pusat. Untuk distribusi yang menceng, mean cenderung terletak pada sisi yang sama dari modus sebagai ekor yang panjang. Jadi suatu ukuran tak simetri diperlihatkan oleh selisih (mean-modus). c. Kurtosis Kurtosis adalah derajat kepuncakan dari suatu distribusi, biasanya diambil secara relatif terhadap suatu distribusi normal. Berdasarkan kurtosisnya, grafik distribusi terbagi menjadi tiga, yaitu: Leptokurtik, yaitu distribusi yang mempunyai puncak relatif tinggi. Platikurtik, yaitu distribusi yang mempunyai puncak mendatar. Mesokurtik, yaitu grafik yang berdistribusi normal yang puncaknya tidak terlalu lancip atau berpuncak mendatar bentuk grafik seperti ini dikenal juga sebagai grafik sebaran normal/distribusi normal
Grafik 1. Distribusi kemencengan (atas) dan jenis-jenis distribusi secara kurtosis (bawah)
EVALUASI Diketahui hasil penjualan roti produksi Lab. TPG Politani adalah selama 1 bulan adalah sebagai berikut (dalam puluhan) adalah: 10 20 10 15 30 30 35 40 35 35 35 40 50 45 48 55 33 33 32 33 34 35 33 32 25 34 47 46 28 22 Buatlah analisis statistik deskriptif, lengkapi dengan penyajian data dalam tabel frekuensi dan histogram. Beri kesimpulan anda!
BAB III STATISTIK PARAMETRIK 3.1 PENGERTIAN Metode parametrik merupakan cara pengujian hipotesis didasarkan pada anggapan bahwa sampel acak diambil dari populasi normal. Kebanyakan uji tersebut masih dapat diandalkan bila penyimpangannya dari kenormalan hanya sedikit, terutama sekali bila ukuran sampelnya besar. Statistik parametrik merupakan salah satu teknik statistik inferensia dimana dilakukan pengumpulan data, pengolahan serta penganalisaan terhadap data yang diperolah sehingga nantinya dapat diambil suatu kesimpulan. Ciri-ciri data parametrik adalah: 1. Data berdistribusi normal 2. Merupakan data interval atau data rasio 3. Jumlah data lebih dari sama dengan 30 (n ≥ 30) 3.2 Sebaran Peluang Populasi Sebaran peluang dalam analisis statistika menjadi sangat penting. Dengan diketahuinya sebaran peluang pada satu populasi pengamatan memungkinkan seorang statistikawan akan dapat dengan mudah melakukan inferensia. Sebaran yang terpenting dalam sebaran peluang populasi adalah sebaran normal (Setiafindari 2011). Sebaran normal merupakan fungsi kepekatan peluang kontine yang paling sering digunakan dalam bidang statistika. Digunakan untuk menerangkan fenomena alam, industri, perdagangan, tingkat pendapatan masyarakat, dsb. Ciri-ciri kurva kepekatan peluang normal adalah: (1) (2) (3) (4)
kurva bersifat simetrik dan setangkup pada titik x=μ modus = median = mean pada titik x=μ titik belok kurva pada x=μ ± σ luas daerah di bawah kurva adalah 1 n(x) 0.3 0.25 0.2 0.15 0.1 0.05 0 -6
-4
-2
0
2
4
x
Grafik 2. Distribusi sebaran Normal Sebaran Z dirumuskan sebagai berikut: Z=
6
Dalam prakteknya jarang sekali orang begitu beruntung mengetahui ragam populasi yang digunakan sebagai acuan dalam pengambilan contoh. Untuk contoh acak berukuran n ≥ 30 taksiran σ2 yang baik adalah statistik s2. Tetapi bila n ≤ 30 nilai S berubah cukup besar dari contoh ke contoh dan nila tersebut tidak lagi menyebar normal baku. Dalam hal ini kita menghadapi sebaran statistik yang akan disebut sebagai t-student. t=
̅ ⁄ √
dimana nilai ini adalah peubahacak yang menyebar t-student dengan derajat bebas n-1 3.3 Jenis-jenis uji statistik parametrik Beberapa jenis uji statistik parametrik yang paling populer digunakan adalah sebagai berikut:
Uji Kebaikan-Suai/Goodness of fit test Uji Goodness of Fit digunakan untuk menentukan apakah suatu populasi mempunyai suatu distribusi teoritis tertentu. Uji tersebut didasarkan atas baiknya kesesuaian yang ada antara frekuensi terjadinya pengamatan pada sampel teramati dan frekuensi harapan yang diperoleh dari distribusi yang dihipotesiskan. Uji goodness of fit adalah uji hipotesis statistik yang digunakan untuk menaksir bentuk apakah observasi X1,X2,…Xn adalah independen sampel dari distribusi khusus dengan fungsi distribusi F. Uji goodness of fit dapat digunakan untuk menguji serangkaian uji hipotesis nol. Salah satu jenis uji goodness of fit yang paling sering digunakan adalah Chi-square test. Chi-square test dapat dirumuskan sebagai berikut:
f f e 2 x 2 0 fe Dimana test statistics adalah setara dengan selisih kuadrat antara frekuensi yang diamati (f0)dengan yang diharapkan (fe) dibagi banyaknya frekuensi yang diharapkan (fe) dari masingmasing pengamatan. (fe) merupakan frekuensi yang diharapkan atau jika H0 adalah benar. 2
Uji Anova Anova sering disebut sebagai analisis varians. Sampel acak ukuran n diambil masing-masing dari k populasi. Ke k populasi yang berbeda ini diklasifikasikan menurut perlakuan atau grup yang berbeda. Dewasa ini istilah perlakuan digunakan secara umum dengan arti klasifikasi, apakah itu kelompok, adukan, penganalisis, pupuk yang berbeda, atau berbagai daerah di suatu negara. Pada Anova terdapat pengujian hipotesis nol bahwa rataan ke k populasi sama lawan tandingan bahwa paling sedikit dua dari rataan ini tidak sama. Uji yang akan dipakai didasarkan pada perbandingan dua taksiran bebas dari kesamaan variansi populasi σ2. Perlu dibandingkan ukuran varians antara perlakuan yang sesuai dengan variansi dalam perlakuan, agar dapat ditemukan perbedaan yang berarti dalam pengamatan akibat pengaruh perlakuan (Sunaryo 2010). Analisis varians untuk klasifikasi satu arah (one way) dapat dilihat pada tabel di bawah ini yang sama dengan tabel Anova.
Tabel 1.Analisis varians untuk one way ANOVA test
Uji F Pada pengujian kesamaan dua variansi populasi σ12 dan σ22 yang ingin diuji adalah hipotesis nol Ho bahwa σ12 = σ22lawan salah satu tandingan σ12 < σ22, σ12 > σ22, atau σ12 ≠ σ22. Untuk dua sampel acak berukuran masing-masing n1 dan n2 dari dua populasi, nilai f untuk menguji σ12 = σ22ialah nisbah :
dengan s12 dan s22 variansi yang dihitung dari dua sampel. Jika kedua populasiberdistribusi hampir normal dan hipotesis nol benar maka nisbah f = s12/s22 suatu nilai distribusi – F dengan derajat kebebasan v1 = n1 – 1 dan v2 = n2 – 1. Dengancdemikian daerah kritis berukuran α yang sesuai dengan tandingan one way σ12< σ22, σ12 > σ22 adalah masing-masing f > f1-α (v1,v2) dan f > fα- (v1,v2). Untuk tandingan dua pihak σ12 ≠ σ22, daerah kritis adalah f < f1-α (v1,v2) dan f > fα/2 (v1,v2). Untuk mengambil keputusan disesuaikan dengan daerah kritis, bila nilai peluang berada didaerah kritis maka ditolak dan begitupun sebaliknya. Dalam pengambilan keputusan dapat dengan membandingkan nilai P hasil perhitungan dengan α. Jika P lebih besar daripada α, maka Ho diterima dan begitupun sebaliknya. Uji T Dalam uji menyangkut dua rataan keadaan yang lebih umum berlaku ialah keadaan dengan variansi tidak diketahui. Bila si peneliti bersedia menganggap bahwa kedua distribusi normal dan bahwa σ1 = σ2 = σ, maka uji t gabungan (sering disebut uji-t dua sampel) dapat digunakan. Uji statistik tersebut berbentuk :
Untuk
Hipotesis dua arah (two way) ditolak apabila
Dapat juga dengan membandingkan nilai P perhitungan dengan taraf kepercayaan (0,05). Jika P lebih besar maka Ho diterima, dan apabila sebaliknya maka Ho ditolak. Pengamatan Berpasangan Perhitungan selang kepercayaan untuk μ1 - μ2 dalam hal ini didasarkan pada peubah acak dengan statistik hasil perhitungannya adalah:
3.4 PENGUJIAN STATISTIK PARAMETRIK DENGAN MICROSOFT EXCEL (1) sebaran normal Misal X menyebar normal dengan nilai tengah 10 dan ragam 4, hitunglah peluang berikut: a. P(X>10) b. P(X<5) c. P(4<x<8) Langkah penyelesaian menggunakan EXCEL adalah: Masukkan formula: =NORMDIST(X;MEAN,STDEV;CUMULLATIVE) Dimana NORMDIST = fungsi matematika untuk penghitungan sebaran peluang; X = nilai yang ingin kita uji, MEAN = rataan/nilai tengah, STDEV = standar deviasi dalam hal ini adalah akar dari ragam; CUMULLATIVE adalah fungsi logika yang kita gunakan dalam hal ini TRUE atau FALSE, Jawaban: a. P(X>10) = NORMDIST(10;10;2;TRUE) = 0,5 b. P (X<5) = NORMDIST (5;10;2;TRUE) = 0,0062 c. P (4<X<8) = P(X<8) –P(X>4) = NORMDIST(8;10;2;TRUE)-NORMDIST(4;10;2;TRUE) =0,158 Untuk melihat nilai Z sebagaimana tabel Z maka dapat digunakan fungsi =NORMSDIST(Z) Contoh nilai dari z = -1,91 = NORMSDIST(1,91) =0,0280 (2) Uji Chi-square Kaos Sepak bola Terjual diharapkan terjual
Ch. Owen Beckham Ronaldo Ronaldinho Zidane Ronaldo 30 60 40 20 50 70 50
50
50
50
50
50
Berdasakan data tersebut Uji Chi Square adalah: =CHITEST(array1;array2) = ..... ? (3) Uji F Sebuah perusahaan telekomunikasi berhasil menemukan alat baru untuk mempermudah koneksi internet mobile. Untuk mengetahui efektifitas alat baru tersebut, dilakukan uji coba pada 10 lokasi berbeda dengan membandingkannya dengan alat yang diproduksi oleh perusahaan saingan mereka yang diketahui memiliki kemampuan koneksi paling baik. Tingkat kecepatan pengiriman data (Kbps) disajikan dalam tabel berikut:
Langkah penyelesaiannya adalah: a. Pilih F-test Two-sample for Variances pada Analysis Tools di Data Analysis:
b. Masukkan input kedua pasang data tersebut
c. Klik ok dan hasilnya adalah sebagai berikut:
F-Test Two-Sample for Variances Lama Baru Mean 107,6 107,5 Variance 444,2667 429,1667 Observations 10 10 Df 9 9 F 1,035184 P(F<=f) one-tail 0,479882 F Critical one-tail 3,178893 Dengan demikian terima H0 bahwa alat baru yang digunakan memiliki kemampuan yang sama dengan alat lama yang diproduksi oleh perusahaan lain. (4) Uji T Dengan menggunakan data yang sama maka Uji T dapat dilakukan dengan memilih analysis tools yang sesuai, misalnya DATA > DATA ANALYSIS > t-Test: Paired Two Sample for Means. Hasilnya adalah: t-Test: Paired Two Sample for Means Lama Baru 107,6 107,5 444,2667 429,1667 10 10 0,926241
Mean Variance Observations Pearson Correlation Hypothesized MeanDifference 0 Df 9 t Stat 0,039361 P(T<=t) one-tail 0,484731 t Critical one-tail 1,833113 P(T<=t) two-tail 0,969462 t Critical two-tail 2,262157 Hasilnya juga menunjukkan bahwa nilai tengah kedua kumpulan data tersebut tidak berbeda nyata, dengan begitu terima H0 (5) Uji anova Misalkan suatu perusahaan pupuk organik ingin mengujikan respon tinggi sawi terhadap pupuk organik formulasi baru yang diberikan:
a. Masukkan data diatas kedalam EXCEL, untuk kolom mewakili perlakuan dan untuk baris mewakili ulangan. b. Pilih Data > Data analysis > Anova-single factor
c. Kemudian isikan input range dan output range, pada pilihan grouped by, pilih coloumns
d. Klik OK dan hasilnya adalah sebagai berikut: Anova: Single Factor
SUMMARY Groups Column 1 Column 2 Column 3 Column 4 Column 5 ANOVA Source of Variation Between Groups Within Groups
Count 5 5 5 5 5
SS 223,34 84
Sum Average Variance 156 31,2 4,325 177 35,4 3,3 182,5 36,5 7,5 198,5 39,7 3,2 163 32,6 2,675
df 4 20
MS F P-value F crit 55,835 13,29405 0,0000192283991718726 2,866081 4,2
Total 307,34 24 Hasilnya dapat disimpulkan bahwa minimal terdapat 1 perlakuan dalam hal ini jenis pupuk organik yang efektif meningkatkan pertumbuhan tanaman sawi atau dengan kata lain tolak H0 2. Analisis Anova dua faktor dengan ulangan Di bawah ini adalah hasil survei terhadap banyaknya pembelian voucher pulsa yang biasa dibeli dan bentuk pengisian voucher di tiga kounter yang dipilih secara acak: voucher perusahaan 10 20 15 50 100 Elektrik 96 92 92 74 50 98 88 94 74 50 94 90 84 68 54 non-elektrik 90 88 78 0 0 94 92 82 0 0 92 94 74 0 0 Analisis anova dua faktor dengan ulangan adalah sebagai berikut: (1) Input data diatas ke dalam EXCEL (2) Klik DATA > DATA ANALYSIS > Anova: Two-Factor With Replication (3) Masukkan data input, PENTING : RANGE DATA INPUT HARUS MENGANDUNG 1 BARIS LABEL:
Perhatikan pada input range dimulai dari sel A@
(4) Masukkan angka 3 pada Rows per sample sesuai jumlah ulangan
(5) Aplha 0,05 menunjukkan selang kepercayaan (6) Klik output range di bagian kosong dari work sheet atau jika ingin menampilkannya pada sheet baru/book baru klik di New Worksheet ply atau New Workbook (7) Klik OK (8) Hasilnya adalah sebagai berikut Anova: Two-Factor With Replication SUMMARY
10
20
15
3 288 96 4
3 270 90 4
3 270 90 28
3 3 276 274 92 91,33333 4 9,333333
3 234 78 16
6 6 564 544 94 90,66667 8 5,866667
6 504 84 60,8
50
100 Total
elektrik
Count Sum Average Variance
3 3 15 216 154 1198 72 51,33333 79,8666667 12 5,333333 295,12381
non-elektrik
Count Sum Average Variance
3 0 0 0
3 15 0 784 0 52,2666667 0 1982,20952
Total
Count Sum Average Variance ANOVA Source of Variation Sample Columns Interaction Within
SS 5713,2 25459,2 6258,133 165,3333
Total
37595,87
Df 1 4 4 20
6 6 216 154 36 25,66667 1560 792,6667
MS F 5713,2 691,112903 6364,8 769,935484 1564,533 189,258065 8,266667
P-value F crit 5,53E-17 4,35124348 1,37E-21 2,8660814 1,37E-15 2,8660814
29
Tabel SUMMARY merupakan hasil ringkasan terhadap jenis pengisian pulsa terhadap jumlah pulsa yang dibeli. Hasil analisis ANOVA dua faktor terlihat bahwa baik faktor tunggal jenis pengisian pulsa, nominal pulsa maupun interaksi antara keduanya berpengaruh terhadap keputusan pembelian pulsa dari pembeli di ketiga kounter tersebut. Sehingga tolak H0
EVALUASI 1. 5 macam cat diuji ketahanannya terhadap perubahan cuaca, hasil persentase kerusakannya terhadap cuaca kemudian dicatat sebagai berikut: Rep
Sherwin
Fuller
Frazee
Pratt
SanLuis
1
13
15
28
16
33
2
19
19
22
10
41
3
9
27
25
20
29
Buatlah analisis sidik ragam (ANOVA) dari ke-5 macam cat tersebut 2. Misalkan X menyebar normal dengan nilai tengah 25 dan ragam 16. Hitunglah : a. P (X < 10) b. P (X>50) c. P (20 < X <35) 3. Diketahui kelompok data hasil penjualan dua sales motor selama 9 bulan dibawah ini: A 20 25 30 31 20 24 15 20 16 B 22 24 32 40 30 22 14 25 19 Manakah diantara keduanya yang berhak mendapatkan bonus dari perusahaan? Berikan argumen anda berdasarkan uji statistik yang anda lakukan! 4. Hasil program penurunan berat badan dari suatu perusahaan kecantikan diperoleh tingkat penurunan berat badan sebagai berikut: Diet Olahraga Tanpa 3 x seminggu Setiap hari Tanpa -5 -1 5 -2 9 0 0 3 3 3 4 5 Rendah Kalori 1 2 6 3 1 2 -2 3 4 6 5 8 Rendah Karbo -1 3 2 0 6 4 4 12 8 3 7 4 Modifikasi cairan 0 6 5 2 11 9 4 8 7 2 2 4 Apakah ada hubungan antara berolahrhga dengan penurunan berat badan?
DAFTAR PUSTAKA Anonymous. 2007. Slide Statistik Ekonomi. (Online). https://doc-14-0odocs.googleusercontent.com/docs/securesc/q5pgn8nd1eaf9hua7juvenocqnb4pshi/ef60opm 473iqgmq6tec6tnsqumk0ogbg/1319715900000/07613135239192579928/07613135239192 579928/1eSlD6hw0CQcLmsfmrbMEvT9N0aHEzxoynWTyqwkY1U1hjMfvC5bjE7M0Nw?e=do wnloadnonce=r70acntinbb9g&user=0.7613135239192579928&hash=2vhl9npg3pmp17o8ta o6embv75iagk3b. Diakses 27 Oktober 2011 Dajan,Anto. (1987). Pengantar Metode Statistik, Jilid 1 & 2. 11. LP3ES. Jakarta. Matjik, A.A dan Sumartejaya, M. 2002. Perancangan Percobaan. IPB Press. Bogor. Setiafindari, W. Slides Distirbusi Normal. (online) http://amriarul.files.wordpress.com/2011/06/ distribusi-normal.ppt. diakses 27 Oktober 2011 Sunaryo, S. 2010. Modul Statistika Bisnis-Statistika inferensia (ANOVA). Program Magister Manajemen Teknik. Institut Teknologi 10 November, Surabaya.