...
Sab XIII UpHipotesa
KAT A KUNCI chi-square test adalah metode statistik untuk menguji hipotesa yang kedua faktomya independen. goodness-of-fit test adalah prosedur statistik untuk menguji hipotesa yang distribusi probabilitas khusus cocok dengan susunan data yang diobservasi. hipotesa nol adalah hipotesa yang akan diuji pada uji hipotesa; hipotesa nol sering berbunyi "Tidak ada hubungan antara dua kuantitas". test statistik adalah perhitungan dari kuantitas yang diobservasi yang digunakan untuk menguji hipotesa nol; tes statistik berasal dari distribusi yang diketahui jika hipotesa nol benar; hipotesa nol akan ditolakjika tes statistik tidak berasal dari distribusi yang diketahui. Pada bab 3 terdapat problem uji hipotesa yang spesifik: Jika Anda melemparkan uang logam berkali-kali, bagaimana Anda dapat mengatakan bahwa pelemparan itu adil? Kini kita akan memikirkan metode yang dipakai oleh para ahli statistik pada saat mereka merumuskan dan menguji hipotesa. Ingat, bahwa hipotesa yang akan kita tes dinamakan hipotesa nol (Ho), dan hipotesa yang berbunyi "Hipotesa nol adalah salah" dinamakan hipotesa altematif. contoh hipotesa nol: Pelemparan uang logam yang adil. Jumlah rata-rata kismis pada sejumlah kotak kismis adalah 7. Perbedaan kemanjuran antara empat obat flu terjadi secara keseluruhan dengan tidak terduga. Perhitungan pemilihan Mahkamah Agung dengan distribusi normal. JiRamenolak hipotesa nol, berarti kita hampir yakin hipotesa tersebut benar. Biasanya pada tes kita buat kemungkinan 5 persen menolak hipotesa jika benar. Jika kita terima hipotesa, tidak berarti hipotesa itu benar. ltu hanya berarti kita belum menemukan bukti secara statistik untuk menolaknya.
·· ·
·
TES STA TISTIK Prosedur normal pada statistik adalah menghitung kuantitas khusus, yang dinamakan tes statistik. Ada beberapa tes statistik. Salah satu yang Anda gunakan tergantung pada problem yang dihadapi. Perhatikan beberapa contoh pada bab ini.
168
---- _.. __ - __ __ __ - __ u_ __ ___
Tes statistik dibuat jika hipotesa nol benar, Anda mengetabui dengan pasti distribusi tes statistik. Anggaplah hipoesa nol adalah benar. Pada kasus tersebut apakah nilai tes statistik merupakan nilai yang sangat masuk akal? Jika tes statistik tidak seperti yang terjadi, maka hipotesa tersebut salah. MENGUJI HIPOTESA NOL Anggaplah Anda sedang menguji hipotesa nol menggunakan tes statistik Z. Anda mengetabui Z mempunyai distribusi normal jika hipotesa nol benar. Hitung nilai Z. Jika misalnya, nilai Z adalah 0,878, maka hal itu baik. Anda tidak dapat menolak hipotesa tersebut. Anggaplah nilai observasi tes statistik Z adalah 3, maka Anda akan menjadi curigal Dapat Anda lihat pada tabel, probabilitasnya hanya 0,0026 yang variabel random normal berada di luar 3. (Seteusnya kita pakai istilah di dalam dan di luar. Z beada di -c atau jika Z > c. Dengan kata lain Z berada di dalam c jika Z < c dan Z berada di luar c jika Z > c). Anda dapat mengatakan kepada pendukung hipotesa nol. "Anda tidak dapat menipu saya. Saya tabu bahwa nilai tes statistik tidak seperti yang terjadi jika hipotesa nol benar, sehingga saya akan menolak hipotesa itu." Pendukung hipotesa nol mungkin menjawab, "Jawab Anda menolak hipotesa nol, Anda akan melakukan kesalahan (error) tipe 1, karena menurut kami hipotesa nol adalah benar. Tes statistik kami buruk dan tidak masuk akal, tetapi masih ada kemungkinan Anda meletakkan angka 3 dari distribusi normal. MENGHINDARI
ERROR TIPE 1 DAN TIPE 2
Ada sedikit kemungkinan bahwa hipotesa nol mungkin benar, sehingga Anda dapat, melakukan error tipe 1 secara salah menolak hipotesa. Tetapi itu merupakan risiko yang Anda ambil. (Ingatbahwaerrortipe 1 tejadijikaAndamenolakhipotesanol bilahipotesaitu benar. Error tipe 2 terjadi jika Anda menerima hipotesa nol bila hipotesa itu salah. Lihat bab3). Secara normal tes kita buat sedemikian rupa sehingga resiko melakukan error tipe 1 kurang dari 5 persen. Resiko melakukan error tipe 1dinamakan tingkat signifIkan. Dengan demikian, dapat kita katakan bahwa tes kita buat dengan tingkat signifIkan 5 persen. Dari tabel standar normal qapat kita lihat bahwa ada kemungkinan 95 persen Z berada di dalam 1,96, sehingga hipotesa nol diterima jika Z berada di dalam 1,96 dan menolak hipotesajika berada di luar 1,96. Dengan demikian daerah di dalam 1,96 dinamakan daerah penerimaan dan daerah di luar 1,96 dinamakan daerah kritis (lihat gambar 13-1). Seringkali angka yang merupakan bagtas antara daerah kritis dan daerah penerimaan disebut nilai kritis.
Padakasusini nilaikritisadalah 1,96dan -1,96.
.
Kita dapat melihat pada tes berikut: Pr (menolak Ho jika Ho benar)
= Pr[(Z
> 1,96) atau (Z < 1,96)]
169 - - - --
- - -
--
- -
---
-
-
= 0,025 + 0,025
=0,05 Jika nilai pengamatan berada di luar 1,96, kita akan menolak hipotesa pada tingkat signifIkan 5 persen. Gambar 13-1
2,5% ofare
Critical region
2,5% of are
o 95% of area
V
}
Critical region
Zone of acceptance
Misalnya kita ingin lebih waspada. Anggap bahwa menolak hipotesa secara salah adalah sangat mahal biayanya bagi kita, maka kita perlu meyakinkan bahwa probabilitas dari kejadian ini hanya sebesar 1 persen. Kemudian kita perlu memperbesar daerah penerimaan (lihat gambar 13-2). Ada kemungkinan 99 persen Z berada di dalam 2,58. Dengan demikian kita dapat memastikan bahwa hanya ada kemungkinan sebesar 1 persen dalam melakukan error tipe hanya ada kemungkinan sebesar 1 persen dalam melakukan error tipe 1 jika kita buat tes tersebut hingga daerah penerimaan terletak dari -2,58 sampai 2,58. Jika nilai tes statistik sebesar -2,6, maka kita dapat menilai hipotesa pada tingkat signifIkan sebesar 1 persen. Anggap nilai statistik Z sebesar 2. Pada kasus tersebut, kita tidak dapat menolak hipotesa pada tingkat 1 persen. Seperti yang telah kita lihat pada tes statistik sebesar 2 kita dapat menolak hipotesa pada tingkat 5 persen. Tes statistik seperti ini adalah daerah yang diarsir. Apakahhipotesa tersebut benar? Tidak seorangpun yang mengetahui, dan saat ii bahkan kita tidak yakin apakah menerima hipotesa. Jika kita menanggung resiko pada kemungkinan 5 persen dari error tipe 1,kita dapat menolak hipotesa. Jika kita ingin lebih waspada, kita akan menerima hipotesa. . Keadaan yang lebih tepat apabila t~s statistik adalah sebesar 3 atau lebih besar. Pada kasus ini kita dapat menolak hipotesa pada setiap tingkat signifIkan.
·
· 170
Jika Z berdistribusi normal bila hipotesa nol benar, maka Jika -1,96 < Z < 1,96, terima hipotesa pada tingkat 5 persen. Jika -2,58 < Z < 2,58, terima hipotesa pada tingkat 1 persen.
-",
Garnbar 13-2
0.5% ofare o Critical region
99%
of area
V
Critical region
Zone of acceptance
YANG HARUS DIINGAT 1. Defmisi yang perlu diketahui tentang uji hipotesa: Hipotesa nol: hipotesa yang akan Anda uji (Ho). Hipotesa altematif: hipotesa yang mengatakan, "Hipotesa nol adalah salah". Error tipel:
mengatakan hipotesa noI adalah salah bila hipotesa tersebut benar.
Error tipe2:
mengatakan hipotesa nol adalah benar bila hipotesa tersebut salah.
2.
Prosedur normal uji hipotesa adalah menghitung kuantitas, berdasarkan pengarnatan Anda disebut tes statistik.
3.
Jika hipotesa nol benar, maka tes statistik menjadi variabel random dengan distribusi yang diketahui.
4.
Jika kelihatannya masuk akal bahwa bilai yang dihitung berasal dari distribusi ini, maka terima hipotesa DOl.
5.
Jika tes statistik yang dihitung tidak berasal dari distribusi ini, maka tolak hipotesa noI.
UJI HILAI RATA-RATA Kini kita lihat tes statistik apa yang muncul pada prakteknya. Misalnya kita mengarnati sejumlah angka berasal dari distribusi normal. Anggap kita mengetahui variance, tetapi ratarata tidak diketahui. Kita akan menguji hipotesa bahwa J.lsarna dengan nilai khusus u*. Menggunakan notasi Ho, maka
=
Ho : J.l J.l*
Contoh, misalnya kita akan menyelidiki sejumlah kismis pada tiap kotak kecil. Jika terlalu banyak kismis pada kotak, pembeli akan mengeluh. Sebaliknya jika terlalu banyak kismis pada kotak, perusahaan akan rugi. Kismis tersebut dimasukkan ke kotak-kotak menggunakan mesin. Kita mengetahui mesin tersebut bekerja dengan carajumlah kismis tiap 171
kotak mempunyai distribusi nonnal dengan variance 16,16.Rata-rata tiap kotak terdiri dari 7 kismis. Tugas kita adalah menguji hipotesa nol bahwa rata-rata J.1=7. Kita mempunyai 13 buah sampel pengamatan : 9, 11,6, 10; 7, 4, 0, 7,8,6,8,2,
18
Rata-rata sampel x adalah 7,38. Apakah itu cukup mendekati 7 dan kita hams menerima hipotesa? Ataukah itu terlalu jauh? Kita tabu jika hipotesa benar, x mempunyai distribusi normal dengan rata-rata J.1=7 dan variance 16,16/n, maka
z=
~n (x - 7) cr
=
--113(7,38 - 7)
4,02
mempunyai distribusi normal. Z merupakan tes statistik. Nilai z - 0,341 dimana terletak di daerah penerimaan. Otomatis kita dapat menerima hipotesa bahwa J.1= 7. Tentu saja, pada umumnya kita tidak dapat menggunakan tes statistik Z = (X - J.1*)/s,
karena biasanya kita tidak tahu nilai a. Bagaimanapun juga, jika hipotesa nol J.1=J.1*adalah benar, maka tes statistik X - J.1*
t=~n akan mempunyai distribusi t dengan df n - 1(lihat bab 11). Contoh, data di bawah ini menunjukkan sampel dari berat 27 orang pemain sepak bola: 160,185,235,208,170,185,204,180,205 215,185,188,180,220,220,221,205,235 225,190,180,205,250,210,230,210,218 Anda ingin menguji hipotesa yang berat tersebut dipilih dari distribusi normal dengan rata-rata 220. Anda perlu menghitung x = 204,4dans2=22,1.MakaAndadapatmenghitung tes statistik t: 204,4 - 220
t=
{27 = -3,67 22.1
Jika hipotesa benar, t akan mempunyai distribusi t dengan df26. Jika Anda lihathasilnya pada tabel t, maka nilai kritis untuk tes 1 persen adalah 2,779. Dengan kata lain, Anda dapat menolak hipotesa nol pada tingkat 1 persen jika tes statistik di luar 2,779
. Karena
-3,67
terletak di daerah kritis, Anda mempunyai bukti secara statistik untuk menolak hipotesa bahwa sampel pemain sepak bole yang terpilih dari populasi dengan rata-rata 220. 172
Langkah Umum Menguji Hipotesa u Dersal dari Distribusi Normal
=u*, Dila Anda Mempunyai
Observasi n yang
Cara 1. Jika variance (cr2)distribusi diketahui. 1. Hitung rata-rata sampel x. 2. Hitung tes statistik Z: -..In (X - Jl*)
Z= a 3. 4.
Jika Anda ingin menguji hipotesa pada tingkat signifikan 5 persen, maka terima hipotesa Jl =Jl*jika beradadiantara-1,96dan 1,96;selainitu tolakhipotesa. JikaAnda ingin menguji hipotesa pada tingkat signifikan yang lain, maka lihatpada tabel 11-1 atau A3-2 untuk mendapatkan nilai kritis untuk.
Cara 2. Jika variance (cr2)distribusi tidak diketahui. 1. Hitung rata-rata sampel x. 2. Hitung variance sampel S22: (xl
-
X)2
+ (x2 n
3.
- X)2 + ... + (xn -
X)2
-1
Hitung t statistik:
(x - Jl*)
t=-..In 4.
Statistikt akanmempunyai distribusidengandf n - 1.Lihat tabelA3-5 untukmendapatkan nilai kritis distribusi t dengan df yang tepat. Ada hubungan yang dekat antara uji hipotesa untuk rata-rata dan confidence interval untuk rata-rata pada bab 11.Dapat kita hitung confidence interval 95 persen untuk berat ratarata yang tidak dikets statistik Z: X - 5000
Z= ..J10.000/4
=
56
= - 1,12 50
Nilai ini berada pada 95 persen daerah penerimaan, jadi kita dapat menerima hipotesa pada tingkat signifikan 5 persen. Contoh lain, misalnya 4884 kepala hasil dari 10.000pelemparan, maka nilai tes statistik adalah -116/50 = -2,32. Nilai ni berada di luar 1,96,maka kita tolak hipotesa pada tingkat 5 173
--
---
persen. -2,32 tidak beradadi luardaerah penerimaan pada tingkat signifIkan 1persen, makakita ingin lebih waspada kita tidak dapat menolak hipotesa pelemparan uang logam yang adil. Kita kembali pada situasi pertama, dimana 5056 kepala muncul pada pelemparan 10.000 kali. Misalnya sebenarnya kita tidak percaya bahwa pelemparan tersebut adil, sehingga menurut kita pelemparan uang logam tidak seimbang dan munculnya kepala berkurang. Pada khususnya, kita akan menguji hipotesa bahwa p =0,51. Jika hipotesa nol benar, maka X akan berdistribusi normal dengan kasus ini nilai tes statistiknya adalah -44/49,98 = -0,880. Nilai ini berada pada daerah penerimaan, maka kita tidak dapat menolak hipotesa p =0,5. Adalah tidak mungkin bahwa kedua hipotesa tersebut menjadi benar, tetapi kita tidak dapat hanya menggunakan informasi saja. Mungkin Anda dapat menebak bahwa hal itu sangat sulit untuk membedakan kedua hipotesa tersebut. Kenyataan ini menggambarkan metode uji hipotesa dapat membuktikan hipotesa benar. Jika Anda memutuskan hipotesa nol, ini tidak berarti tidak ada hipotesa lain yang cukup dapat menjelaskan data. Jika Anda ingin lebih yakin bahwa hipotesa Anda benar, maka Anda akan dapat melakukan hal itu pada contoh uang logam, kita tidak dapat mengatakan bahwa pelemparan itu adil. Kita hanya mempunyai satu harapan -jika kita melempar banyak uang logam berkali-kali, dan akhirnya kita dapatkan alasan dimana kita mengatakan perbedaan antara hipotesa p = 0,5 dan p = 0,51. Pada kenyataannya Anda sering tidak dapat memperbesar ukuran sampel Anda.
YANG HARUS DIINGA T 1. Membuktikan hipotesa salah lebih mudah daripada membuktikan hipotesa benar. 2. Jika kita satupun kedua hipotesa dapat dibuktikan salah, maka diperoleh jalan buntu. UJI PERBEDAANANTARADUA RATA-RATA Misalnya Anda mempunyai dua populasi yang berbeda yang akan dibandingkan. Asumsikan variabel random x. (mean fl., variance cra2)dan xb (meanb, variance crb2) mempunyai distribusi normal. Jika Anda mengambil sampel masing-masing nadan nb, maka rata-rata sampel x. dan xb merupakan variabel random dan perbedaan keduanya adalah v'ariabel random dengan mean fl. -
~
dan variance cra2/n. + crb2/nb.
Contoh, hipotesa nol berbunyi rata-rata populasi adalah sarna. fl. = ~ atau fl. - ~ = 0 Lebih umumnya, anggap hipotesa nol menjadi
fl.-~=D Jika variance populasi sa2 dan sb2 diketahui, kita dapat membentuk tes statistik Z:
Z=
174
yang berdistribusi nonnal jika hipotesa nol benar. Misalnya kita mempunyai dua mata dadu A dan B. Kita mengharapkan dadu A mempunyai rata-rata nilai 0,7 lebih besar daripada dadu B. Dadu A dilempar 20 kali dan menghasilkan nilai: 4,5,3,6,3,5,6,3,3,6,5,
1,4,2,6,6,
1,5,5,6,2,
Dadu B dilempar 15 kali dan menghasilkan nilai: 4,3,5,4,3,2,5,1,4,1,5,6,3,6,1, bahwa cra2 =
Diketahui
3,0 dan crb2= 2,8, sehingga diperoleh tes statistik:
=0,580
-+.sehingga: 4,04 - 3,53 - 0,7
z=
= -0,310 0,58
Karena hasilnya berada dalam daerah penerimaan, maka kita akan menerima hipotesa DOl. Jika variance populasi tidak diketahui, kita hams kembali lagi pada statistik t. Jika hipotesa nol benar, dan kitajuga mengetahui bahwa cra2= crb2,maka
T=
mempunyai distribusi t dengan df n. + "" - 2, dimana
.
(n - 1) sa2 + (nb - 1) sb2 Sp2
=
n. + "" -2 dan (Xa2- Xa2)n. sa2=
(Xb2- Xb2)"" dan sb2=
n. - 1
nb-1
175 ---
- -
- -
-
(lihat bab 16) Contoh: Uji Perbedaan Antara Dua Rata-rata Kita putuskan nilai cra2dan crb2dan contoh sebelumnya, tidak dapat dipercaya. Kita anggapbahwa cra2= crb2.Sekali lagi kita ingin menguji hipotesa J.1a- J.1b=0,7. Dengan demikian dapat kita hitung: sa2
= 2,892 sb2 = 2,981
Sp2 = 2,930
dan 4,05
- 3,53 - 0,7
T=
= -0,308 ..J
2,9300/20
+ 1/15)
yang merupakan distribusi t yang mempunyai df33 jika hipotesa kita benar. Periksa tabel A35, kita lihat bahwa kita akan menerima hipotesa nol pada tingkat 5 persen -0,308 berada di dalarn nilai kritis 2,030. Langkah Umum Menyelesaikan Uji Hipotesa Perbedaan Antara Dua Rata-rata Cara 1. Jika nilai aa2 dan ab2 diketahui, 1. Hitung x. dan xb. 2. Hitung ges statistik Z:
.
(X -x b) -D T=
3.
Jika Anda ingin menguji hipotesa pada tingkat signiflkan 5 persen, maka terima hipotesa
=Djika Z diantara-1,96dan 1,96;selainitu hipotesaditolak.
bahwa J.1a- J.1b
4.
Jika Anda ingin menguji hipotesa pada tingkat signiflkan yang lain, maka lihatlah pada tabel 11-1 untuk mendapatkan nilai kritis untuk Z.
Cara 2. Jika nilai cra2dan crb2tidak diketahui tetapi diasumsikan sarna: 1. Hitung x. dan xb. 2. Hitung vriance sarnpai (versi 2) untuk kedua sarnpel: sa2dan sb2. 3. Hitung pooled estimator sp2: (n. - l)sa2 + (~ - 1) sb2
176
4.
Hitung tes statistik T:
.
x -x b -D
T= 5.
Jika hipotesa nol benar, maka T merupakan distribusi t dengan df na + nb - 2. Lihat pada A3-5 untuk mendapatkan nilai kritis untuk distribusi t yang tepat.
UJI PERBEDAAN ANTARA DUA PROPORSI Misalnya kita mempunyai dua buah data yang akan dites. Tes A ditunjukkan oleh na, dengan masing-masing tes mempunyai probabilitas berhasil pa yang tidak diketabui. Jika X.
p
adalah jumlah dari keberhasilan, maka a = X/n. merupakan penaksir p.. Jika na besar, maka teori central limit mengatakan bahwa pa berdistribusi normal dengan rata-rata pa dan variance p. (1 - p.)/n.. Serupa dengan itu, jika ~ merupakan jumlah keberhasilan pada percobaan ~ untuk tes B, masing-masing dengan probabilitas berhasil pb, maka untuk~, b besar = XJ~ berdistribusi normal dengan rata-rata pb dan vriance Pb (1 - pb)/~. Dengan demikian p - Pbjuga berdistribusi normal dengan rata-rata (P. - Pb) dan variance sarna dengan [P.(1-p.)/n. + Pb(1-pJ/nJ.
p
.
Jika pa - pb = D, maka kuantitas ini: ... ... pa-pb-D
mempunyai distribusi normal. Jikakita buat hip90tesa bhawa p. -Pb= D, makakita uji hipotesa ini menggunakan statistik diatas. Sayangnya, kita perlu mengetahui nilai p. dan Pb untuk menghitung statistik itu. Tetapi jika kita sudah tabu nilai-nilai tersebut, kita tidak perlu menguji hipotesa pada urutan pertama. Seberapajauh kita akan mengganti p. untuk p. dan Pbuntuk Pb?Jika n. besar, maka Ip.
- p. I akan
lebih kecil, I(P. - p .)/na) Iakan tetap kecil. alasan yang sarna juga diterapkan
untuk
mengganti Pbuntuk Pb' dan juga jika hipotesa nol benar dan pa -pb = D, maka tes statistik Z:
Z= --JP . (1 - P .)/n. + P b
(1
- PJ/~
mempunyai distribusi normal.
177 --
-
--
Contoh: Uji Hipotesa Perbedaan Antara Dua Proporsi Misalnya ada dua perusahaan A dan B menawarkan bola lampu kepada perusahaan Anda. Anda mengira bahwa bole lampu perusahaan B kurang baik mutunya daripada bole lampu perusahaan A. Kenyataannya probabilitas bola lampu perusahaan B mengalami kerusakan O,OOllebih besar daripada kerusakan bola lampu pabrik A. Apakah perkiraan Anda benar? Sampel random dari 1000 bola lampu pabrik A mengalami kerusakan sebanyak 15 buah, sedangkan bola lampu pabrik B mengalami kerusakan sebanyak 36 buah. Dengan demikian, 15 ....
=0,015
P.=
36
....
=0,018
Pb=
1000
....
2000
....
....
P .(a - P.)
....
Pb(1 - Pb) = 0,0000148
na
= 0,00000883
nb
dan nilai Z adalah 0,015
Z=
- 0,018 - (-0,001)
"'/0,0000148 + 0,00000883
=
-0,412
Anda menerima hipotesa bahwa p. - Pb= -0,001 pada tingkat signifIkan sebesar 5 persen karena -9,96 < -0,412 < 1,96. Jika D
= 0,
kita dapat menemukan estimasi yang lebih baik untuk pa dan pb (yang
diasumsikan sarna pada kasus ini). Kita akan menggunakan estimator oJ. Letakkan untuk p. dan Pbpada penyebut, maka
Z= .../p (1
- p) (1/n. + 1I~)
Problem: Anggap bahwa kita mengharapkan hipotesa nol adalah p. = Pb' Dengan demikian, 15 + 36 ....
= 0,017
P =1000 + 2000 178
p =(X.+ Xb) / (n. +
0,015 - 0,018
= 0,599
[
p(l - p)
:.
=0,005007 danZ =
I,J
+
0,005007
Kita terima hipotesa nol pada tingkat 5 persen karena -1,96 < -0,599 < 11,96.
-
Langkah Umum Uji Hipotesa Bahwa Pa Pb = D, Tes A Mempunyai Keberhasilan Xa Pada Percobaan na' Tes B Mempunyai Keberhasilan XbPada Percobaan nbdan nadan nb adalah Besar Cara 1. Jika D tidak sarna dengan nol. 1. Hitung P. dan Pb: ...
P.=2.
x.
dan
n.
...
Pb=
Hitung Z :
z= 3.
Jika Anda ingin menguji hipotesa pada tingkat signifIkan5 persen. Maka terima hipotesa jika Z diantara -1,96 dan 1,96; selain itu hipogtgesa ditolak. 4. Jika Anda ingin menguji hipotesa pada tingkat signiflkan yang lain, maka lihat tabelll1 untuk mendapatkan nilai kritis Z. Cara 2. Jika p. = Pb'D = 0 1. Hitung p , p. dan P b : ...
X.+
P.=
p= n.+
2.
X.
...
-
n.
...
Pb=-
Hitung Z : ...
...
P.-Pb Z= .
P (1 -p)
(1/n. + a/)
179 -
--
---
--
3.
Jika Anda ingin menuji hipotesa pada tingkat signiftkan 5 persen, maka terima hipotesa jika Z diantara - 1,96 dan 1,96; selain itu tolak hipotesa. 4. Jika Anda ingin menguji hipotesa pada tingkat signiftkan yang lain, maka lihat tabel111 untuk mendapatkan nilai kritis untuk Z. CHI-SQUARE TEST T ABEL KEMUNGKINAN Misalnya kita mencoba menguji apakah ada perbedaan antara 4 obat flu. Tidak sampun obat-obat tersebutdijamin bekerjadengan baik, tetapi masing-masing menjanjikan mengurangi kemungkinan terkena flu. Jumlah orang-orang yang mencoba tiap obat dan terkena flu dapat dianggap sebagai variabel random. Anggap kita telah memeriksa sampel sebanyak 495 orang. Kita menanyakan mereka obat jenis mana yang mereka gunakan. Baik yang terkena flu maupun yang tidak. Hasilnya kita dapatkan:
Berapa banyak yang terkena flu Berapa banyak yang tidak terkena flu Total
Obat 1
Obat 2
15
26
9
14
64
111
107
96
117
431
126 126
133 133
105 105
131 131
495 495
Obat 3
Obat 4
Total
(Tipe tabel ini disebut tabel kemungkinan pada kasus ini dengan 2 baris dan empat kolom). Dapat kita lihat dari tabel bahwa obat 3 lebih efektif; hanya 8,5 persen dari orang-orang yang mencoba obat 3 yang terkena flu. Bagaimanapun juga ada Qanyak faktor yang menentukan terkena flu. Mungkin orang-orang yang menggunakan obat 3 kebetulan hanya mempunyai bakteri flu yang lebih sedikit. Dengan demikian hipotesa nol kita adalah: Tidak adaperbedaanyang mendasarkanantara4 obattersebut.Padakasus itu,perbedaanpengamatan antara obat-obat tersebut semata-mata timbul karena adanya kemungkinan. MEMBUA T TES ST ATISTIK Kini kita perlu membuat tes statistik untuk memeriksa hipotesa ini. Kita dapat mengam atinya pada total sampel, fraksi orang-orang yang terkena flu adalah 0,129 dan fraksi yang tidak terkena flu adalah 0,871. Jika benar tidak ada perbedaan antara obat -obat tersebut, maka fraksi baik yang terkena flu maupun yang tidak pada tiap kelompok seharusnya mendekati fraksi-fraksi tersebut. Kita dapat membuat tabe1 perbandingan antara kenyataan dan pengamatan untuk jumlah orang pada tiap kelompok.
180
Jumlah yang flu kenyataan ramalan Jumlah yang tidak flu kenyataan ramalan
Obat 1
Obat 2
Obat 3
Obat 4
15 16.254
26 17.157
9 13.545
14 16.899
111 109.746
107 115.843
96 91.455
117 114.101
(Tiap lokasi pada tabel disebut sel. Tabel ini mempunyai delapan sel). Kita ingin menempatkan tes statistik pada perbedaan antara frekuensi pengamatan dan frekuensi peramalan jika pada kenyataannyha tidak ada perbedaan antara obat-obat tersebut. Jika perbedaannya kecil, kita dapat menerima hipotesa yang tidak mempunyai perbedaan. Jika perbedaannya besar, maka hipotesa kita tolak. f;mewakili frekuensi observasi pada sel i dan fi mewakili frekuensi peramalan untuk sel i. Maka, jika ada n sel, kita akan menggunakan tes statistik ini: ...
+ f(
=
(fn - f)2 n
(f2- fY
(f1- fl s=
n L;=I
+ fn
f2
(fj- f) f.I
Kita mempunyai delapan sel, dan nHai tes statistik adalah (15 - 16,254)2
(26 - 17,157)2 +
(9 - 13.545)2 +
16,254
17,157
(111 - 109,746)2 +
13,545
(107 - 115,843)2 +
109,746
(14 - 16,899)2 + 16.899 (96 - 91,455)2
+ 115,843
9,455
(117 - 114,101)2
= 7,666
+ 114,101
Jika hipotesa benar maka tes statistik mempunyai distribusi chi-square, sehingga statistik chi-square. Derajat kebebasannya (df) adalah: 181 - -
--
df =(jumlah baris -1) x (jumlah kolom - 1) Kita punya dua baris dan empat kolom, sehingga statistik chi-squree di atas mempunyai (2 - 1) x (4 - 1) = 3. Setelah kita dapatkan tes statistik, selanjutnya kita lihat nilai kritis p[ada tabel chi-squre. Variabel random A X 32 mempunyai kemungkinan 5 persen menjadi lebih besar daripada 7,8. Karena tes statistik yang didapat kurang dari 7,8, maka kita tidak dapat menolak hipotesa pada tingkat siggniflkan 5 persen. Menggunakan data-data ini, kita tidak dapat menetapkan bahwa ada beberapa perbedaan antara obat-obat tersebut. Nilai pengamatan tes statistik 7,666 adalah hampir mendekat 7,8, sehingga data ini menunjukkan bahwa lebih bervariasi antara obat-obat tersebut daripada mengharapkan kejadian yang disebutkan oleh kemungkinan murni. Dengan demikian, data-data ini cenderung menyarankan bahwa kita seharusnya menyelidiki pertanyaan ini lebihjauh. Catat bahwa chi-square test merupakan pengujian satu sisi, karena kita menolak hipotesa hanyajika tes statistik yang dihitung terlalu besar. Langkah Umum Chi-square Test Misalnya Anda mempunyai tabel kemungkinan dengan m baris (kategori) dan n kolom (kelompok): Kategori
Kelompok 1
Kelompok 2
Kelompok 3
al bl cl
a2 b2 c2
a3 b3 c3
Kategori a Kategori b Kategori c
...
Kelompok n an bn cn
Chi-saure tes digunakan untuk menguji hipotesa yang tidak ada perbedaan signifIkan antara kelompok. Dengan kata lain, beberapa perbedaan pengamatan pada proprosi tiap kelompok milik kategori khusus semata-mata timbul oleh kemungkinan.
1. Hitung jumlah total pengamatan pada tiap kategori: atotal= a) + a2 + ... + an biota):= b) + b2 + ...+ bn
dan seterusnya.
2.
Hitung jumlah total pengamatan pada tiap kelompok: t) t2
= a) + b)
+ c) +
....
=a2 + b2 + c2 + ....
.................................
tn = an + bn + cn + ....
182
3.
Hitung jumlah total keseluruhan pengamatan :
4.
Hitung proporsi tiap kategori:
Pa=
T
T dan seterusnya.
5.
Hitung frekue~si kejadian yang diramal tiap sel. fal = Patl fa2 = Pat2 .... fbl = Pbtlb2 = Pbt2 ....
6.
fan= Patn fbn= pbtn
Hitung nilai chi-square tes s: (an - fan)2
(~ - fa2f +
s=
+ ... + fan
+
7.
+... +
+
Jika hipotesa nol benar, tes statistik s akan mempunyai distribusi chi-square dengan dr (m - 1) x ( (n - 1). Lihat nilai kritis pada tabel A3-3. Jika nilai pengamatan.lebih besar daripada nilai kritis, maka hendaknya Anda menolak hipotesa. Kita dapat meringkas formula statistik chi-square dengan lambang: (pengamatan (statistik chi-square)
- yang
diharapkan)2
=L yang diharapkan
dimana kita dapat menghitung pengamatan tiap sel pada tabel kemungkinan dan frekuensi yang diharapkan terjadi pada tiap sel, menganggap hipotesa nol benar, dan kemudian menjumlahkan semua sel.
183 -
-
--
-
-
APLIKASI CHI-SQUARE TEST Pada umumnya, chi-square test dapat digunakan untuk menguji apakah dua faktor saling independen. Berikut ini merupakan contoh ekstrim. Misalnya kita mempunyai sebuah pabrik dan kita akan menguji apakah barang yang dibuat pada hari Senin dan Jum'at lebih kurang (rusak)daripadabarang yang dibuatpadahari-hari lain.Dibawah iniadalahtabel pengamatan: Hari
Barang yang rusak
Barang yang baik
16 4 5 2 13
132 140 138 149 126
Senin Selasa Rabu Kamis Jum'at
Secara jelas dapat kita lihat bahwa ada proporsi yang lebih besar secara signiftkan dari barang yang rusak yang dibuat pada hari Senin dan Jum'at. Kita dapat menggunakan chisquaretes untuk menguji hipotesa nol bahwaadakemungkinan barang yang rusak independen pada hari saat barang itu dibuat. Tabel yang membandingkan frekuensi pengamatan dan frekuensi yang diharapkan adalah sebagai berikut:
Barang yang rusak
Barang yang barik
Hari pengamatan
Senin Selasa Rabu Kamis Jum'at
16 4 5 2 13
yang diharapkan 8,166 7,945 7,890 8,331 7,669
Pengamatan
132 140 138 149 126
yang diharapkan 139,835 136,055 135,110 142,669 131,331
Nilai statistik chi-square yang dihitung adalah 20,16. Dfnya adalah (5 - 1) x (2 - 1) =4. Nilai kritis 95 persen dari tabel adalah 9,48, maka hipotesa nol kita tolak. Contoh lain, anggaplah bahwa kita mengevaluasi pengaruh 3 macam proghram latihan kerja terhadap pegawai. Hipotesa nol mengatakan bahwaevaluasi tidak dipengaruhi oleh macam program latihan kerja. Datanya adalah sebagai berikut:
184
Evaluasi Diatas rata-rata
Program 1. 2 3
Rata-rat
36 24 33
78 53 67
Dibawah Rata-rata 29 21 28
Sekilas terlihat bhawa angka-angka ini tidak menunjukkan perbedaan yang banyak antara program latihan kerja. Nilai statistik chi-square yang dihitung adalah 0,19, sehingga kita sehamsnya menerima hipotesa DOl. YANG HARUS DIINGAT 1. Chi-square tes digunakan apakah ada beberapa perbedaan antara beberapa kelompok atau apakah perbedaan pengamatan dapat terjadi oleh kemungkinan. 2. Chi-square tes berdasarkan perbedaan antara frekuensi pengamatan pada tabel kemungkinan dan frekuensi yang diharapkan yang terjadi jika hipotesa nol benar. 3. Hipotesa nol ditolak jika nilai yang dihitung untuk statistik chi-square lebih besar daripada nilai kritisnya. GOODNESS-OF-FITTESTS Chi-square tes juga dapat digunakan untuk menguji apakah distribusi probabilitas khusus sesuai dengan data pengamatan. Tipe tes demikian disebut goodness-of-fit test. Sekali lagi, kita akan membandingkan frekuensi pengamatan f dari kejadian khusus dengan frekuensi yang diharapkan f* yang diperkirakan terjadi jika distribusi benar-benar sesuai dengan data. Sekali lagi, kita hitung statistik (f.I - fY I f.I
Jika hipotesa nol benar, tes statistik akan mendekati distribusi chi-square. Jika nilai tes statistik menjadi terlalu besar, maka terlalu banyak perbedaan antara hasil pengamatan dan hasil yang diramal, sehingga kita dapat menolak hipotesa bahwa' distribusi perkiraan atau ramalan sesuai dengan data. Degree of freedom untuk chi-square statistik adalah n
- 1 - Uumlah parameter
yang hams Anda estimasi menggunakan sampel)
Contoh, jika Anda menggunakan sampel untuk mengestimasi rata-rata distribusi yang Anda gunakan, maka statistik X2akan memiliki degree of freedom n - 2. Marilah menggunakan goodness-of-fit tes untuk melihat apakah distribusi Poisson sesuai untuk memprediksi angka penegak hukum yang akan dipilih untuk periode 5 tahun. Tabell3-1 menunjukkan angka yang telah dibuat menurut sejarah. 185 ---
-
----
--
Rata-ratanya adalah 2,605, maIm pada rata-rata 2,605 pengangkatan penegak hukum dilakukan pada periode 5 tahun. Frekuensi distribusi data-data ini adalah sebagai berikut: Angka yang terletak di atas merupakan banyak pengangkatan; sedangkan angka yang di bawah merupakan periooe dimana terjadi bebeapa pengangkatan.
o 2
2 10
1 8
3 6
4 8
5 3
6 1
Tabel 13-1: Pengangkatan Penegak Hukum Periode
Banyak pengangkatan
1885-89 1890-94 1895-99 1900-04 1905-09 1910-14 1915-19 1920-24 1925-29 1930-34 1935-39 1940-44 1945-49 1950-54 1955-59 1960-64 1965-69 1790-74 1975-79
3 4 2 2 2 0 1 2 1 5 1 3 2 1 5 0 4 1 4
1790-94 1795-99 1800-04 1805-09 1810-14 1815-19 1820-24 1825-29 1830-34 1835-39 1840-44 1845-49 1850-54 1855-59 1860-64 1865-69 1870-74 1875-79 1880-84
Periode
Banyak penangkatan 3 4 2 2 2 6 2 4 1 3 4 5 4 1 4 2 3 3 1
Jika banyak pengangkatan ditentukan oleh distribusi Poisson yang mempunyai rata-rata 2,605, distribusi frekuensi yang diperkirakan adalah sebagai berikut: o
1
2
3
4
5
6.
2,77 7,30 9,50 8,25 5,36 2,77 1,22 Kita dapat menghitung statistik chi-square:
186
(2 - 2,77)2 2,77
(8 - 7,30)2 +
(10 - 9,50)2 +
+ 7,30
9,50
(8 - 5,36)2 (3 - 2,77)2 +
+ 5,36
8,25
(1 - 1,22)2 +
2,77
(6 - 8,25)2
=2,28 1,22
Kita mempunyai n = 7 kategori dan kita harns menggunakan sampel untuk mengestimasi rata-rata, sehingga dfnya adalah 7 - 1 - 1 = 5. Dapatkita lihat dari tabelchi-squarebahwa variabel X52mempunyai kemungkinan 95 persen yang kurang dari 11.07; sehingga daerah kritis berada pada nilai tes statistik di atas 11,07. Nilai pengamatan berada di antara batas tersebut, sehingga kita akan menerima hipotesa yang mengatakan bahwa pengangkatan penegak hukum dapat dijelskan oleh distribusi Poisson. (Catat bahwa ini merupakan pengujian satu sisi. Karena kita akan menolak hipotesa jika hanya tes statistik sangat kecil, frekuensi perkiraan sangat mendekati frekuensi pengamatan). YANG HARUS DIINGAT 1. Goodness-of-fit test menggunakan statistik chi-square yang digunakan untuk menguji apakah distribusi khusus sesuai dengan sejumlah observasi. 2. Statistik chi-square berdasarkan dari perbedaan antara frekuensi pengamatan dan frekuensi yang diharapkan terjadi jika hipotesa nol adalah benar.
187 - ---
- --