Suplemen Responsi
Pertemuan
ANALISIS DATA KATEGORIK (STK351)
2
Departemen Statistika – FMIPA IPB Pokok Bahasan
Sub Pokok Bahasan
Referensi
Uji Hipotesis Dua Populasi
Uji Mann-Whitney Uji beda proporsi contoh besar Uji tanda dan uji peringkat bertanda Wilcoxon data berpasangan
Applied Nonparametric Statistic Daniel (1990)
Waktu
Jumat 21 Sept 2012 15.30 – 17.30
Kelengkapan: Tabel Normal Baku, Tabel Binomial, Tabel Wilcoxon dan Tabel Mann-Whitney
Uji Mann-Whitney Prosedur nonparametrik yang digunakan untuk menguji hipotesis mengenai median dua populasi yang saling bebas diperkenalkan oleh Mann dan Whitney (1947). Prosedur ini dinamakan uji Mann-Whitney (Mann-Whitney test). Asumsi a. Data terdiri dari contoh acak X1, X2, …, Xn yang berasal dari populasi 1 dengan median Mx, dan contoh acak Y1, Y2, …, Yn dari populasi 2 dengan median My. Nilai Mx dan My tidak diketahui. b. Kedua contoh saling bebas c. Peubah acak bersifat kontinu d. Skala pengukuran minimal ordinal e. Fungsi sebaran dari kedua populasi hanya dipisahkan oleh lokasi parameter Hipotesis a. (Dua arah) : H0 : Mx = My vs. H1 : Mx ≠ My b. (Satu arah) : H0 : Mx ≥ My vs. H1 : Mx < My c. (Satu arah) : H0 : Mx ≤ My vs. H1 : Mx > My Statistik Uji Statistik uji Mann-Whitney dapat ditentukan melalui prosedur berikut : 1. Gabungkan kedua data contoh. 2. Peringkatkan setiap pengamatan dari yang terkecil hingga terbesar. Jika terdapat ties (nilai yang sama), beri peringkat tengah (mid-rank). 3. Jumlahkan peringkat yang berasal dari populasi 1. Nyatakan hasilnya sebagai S. 4. Statistik uji Mann-Whitney dapat diperoleh melalui rumus :
T S
n1 ( n1 1) 2
Kaidah Keputusan a. (Hipotesis a) : Tolak H0 jika T < wα/2 atau T > w1–α/2, di mana w1–α/2 = n1n2 – wα/2 b. (Hipotesis b) : Tolak H0 jika T < wα c. (Hipotesis c) : Tolak H0 jika T > w1–α, di mana w1–α = n1n2 – wα w adalah nilai kritis bagi T Tabel A.7 : Mann-Whitney Catatan Untuk contoh berukuran besar (yaitu n1, n2 > 20) dapat didekati dengan sebaran normal sebagai berikut : Jika ada ties :
Z
T
n1 n 2 2 n1 n 2 t 3
n1 n 2 n1 n 2 1 t 12 12 n1 n 2 n1 n 2 1
Jika tidak ada ties :
Z
T
n1 n 2
2 n1n 2 n1 n 2 1 12
Keputusan : Tolak H0 jika Zhit > Zα
Contoh : Di bawah ini adalah data berat badan 12 mahasiswa (6 putra dan 6 putri). Apakah benar bahwa berat badan mahasiswa putra melebihi berat badan mahasiswa putri? Kriteria Mahasiswa Putra (X) Mahasiswa Putri (Y)
Hipotesis
63 47
59 45
Berat Badan (kg) 74 52 57 54
70 59
61 50
: H0 : Mx ≤ My H1 : Mx > My
Statistik Uji : Mahasiswa Putra (X) Mahasiswa Putri (Y)
Tinggi Peringkat Tinggi Peringkat
63 10 47 2
59 7.5 45 1
74 12 57 6
52 4 54 5
70 11 59 7.5
61 9 50 3
Jumlah 53.5
Dari tabel diketahui bahwa jumlah peringkat contoh dari populasi mahasiswa putra adalah 53.5, sehingga S = 53.5. Dengan demikian, statistik uji adalah :
T S
n1 ( n1 1) 6(6 1) 53.5 32.5 2 2
2/8
Keputusan
: Hipotesis yang diujikan adalah H1 : Mx > My sehingga H0 ditolak jika T > w1–α. Berdasarkan tabel A.7, untuk n1=6, n2=6 dan α=.05 diperoleh wα=8, sehingga w1–α = n1n2 – wα = (6)(6) – 8 = 28 Dengan demikian, karena T =32.5 lebih besar dari w1–α = 28 dapat disimpulkan bahwa berat badan mahasiswa putra melebihi berat badan mahasiswa putri.
Output MINITAB Mann-Whitney Test and CI: Berat_Putra (X); Berat_Putri (Y) Berat_Putra (X) Berat_Putri (Y)
N 6 6
Median 62,00 52,00
Point estimate for ETA1-ETA2 is 11,50 95,5 Percent CI for ETA1-ETA2 is (2,00;20,00) W = 53,5 Test of ETA1 = ETA2 vs ETA1 > ETA2 is significant at 0,0125 The test is significant at 0,0124 (adjusted for ties)
Uji Median Uji median (median test) adalah salah satu prosedur yang paling sederhana untuk menguji hipotesis awal bahwa dua contoh yang saling bebas berasal dari populasi dengan median sama. Asumsi a. Data terdiri dari contoh acak X1, X2, …, Xn yang berasal dari populasi 1 dengan median Mx, dan contoh acak Y1, Y2, …, Yn dari populasi 2 dengan median My. Nilai Mx dan My tidak diketahui. b. Skala pengukuran minimal ordinal. c. Peubah yang diamati bersifat kontinu. d. Kedua populasi mempunyai bentuk sebaran yang sama. e. Jika dua populasi mempunyai median yang sama, untuk setiap populasi, peluang p sebuah nilai pengamatan akan melebihi grand median adalah sama. Hipotesis H0 : Mx = My H1 : Mx ≠ My Uji median juga dapat digunakan untuk uji satu arah, namun membutuhkan perhitungan yang kompleks. Statistik Uji Statistik uji Mann-Whitney dapat ditentukan melalui prosedur berikut : 1. Gabungkan seluruh pengamatan dari kedua populasi dan hitung median dari n1 n2 pengamatan.
3/8
2. Klasifikasikan pengamatan-pengamatan tersebut : (a) apakah merupakan contoh 1 atau contoh 2, dan (b) apakah nilainya di atas atau di bawah median contoh. Biasanya, klasifikasi ini disajikan dalam bentuk tabel kontingensi :
1 A C
Contoh 2 B D
A + C = n1
B + D = n2
Hubungan terhadap median contoh Di atas Di bawah Total
Total A+B C+D N = n1 + n2
Berdasarkan tabel kontingensi di atas, jika hipotesis awal benar maka A dan C mendekati n1/2 serta B dan D mendekati n2/2. 3. Jika contoh mendekati sebaran normal, statistik uji dapat dihitung melalui rumus :
T
( A / n1 ) ( B / n2 ) p (1 p ) (1 / n1 ) (1 / n2 )
A B di mana p N
Kaidah Keputusan Untuk taraf nyata α tertentu, nilai kritis bagi T akan bersesuaian dengan nilai z pada tabel normal baku (A.2). Dengan demikian, untuk hipotesis H0 : Mx = My lawan H1 : Mx ≠ My, tolak H0 jika T ≤ -z atau T ≥ z. Contoh : Sebuah studi hendak meneliti apakah terdapat penurunan kemampuan eliminasi obat pada penderita penyakit hati. Dua sampel diteliti, sampel normal (sehat) dan sampel penderita cirrhosis hepatis. Setiap subjek mendapat phenylbutazone per oral 19 mg/kg BB. Melalui analisis darah, waktu konsentrasi plasma tertinggi (dalam jam) diukur pada masing-masing subjek. Hasilnya dapat dilihat pada tabel berikut: waktu konsentrasi plasma tertinggi (jam) phenylbutazone pada subjek normal (X) 45.6 49.0 13.7 37.9 26.8 30.6 4.0 35.5
41.3 32.5 8.8 17.4 13.8 26.3 14.4
waktu konsentrasi plasma tertinggi (jam) phenylbutazone pada subjek cirrhosis hepatis (Y) 20.1 21.5 14.0 7.0 42.3 11.2 29.7 18.0 17.8 27.9 22.6 15.0 10.7
Ujilah pada taraf nyata 5%, apakah median waktu puncak konsentrasi plasma phenylbutazone tidak berbeda antara subjek normal dengan subjek dengan cirrhosis hepatis? (http://www.scribd.com/doc/87515950/Uji-Median, 19 september 2012)
4/8
Hipotesis
: H0 : Mx = My H1 : Mx ≠ My
Statistik Uji : Median n1 n2 adalah (15 13) / 2 14 . Jumlah pengamatan pada setiap contoh yang berada di atas dan di bawah 14 disajikan dalam tabel berikut : Hubungan terhadap median=14 Di atas Di bawah Total
X A=9 C=6
Contoh Y B=5 D=8
n1 = 15
n2 = 13
Total A + B = 14 C + D = 14 N = 28
Selanjutnya dapat dihitung : p (9 5) / 28 0.50 sehingga
T
(9 / 15) (5 / 13) 1.14 (0.50)(1 0.50)[(1 / 15) (1 / 13)]
Berdasarkan tabel normal baku, untuk α = 0.05 nilai kritis statistik uji median adalah z = 1.96. Karena statistik uji T = 1.14 lebih kecil dari z = 1.96 maka H0 tidak ditolak dan simpulkan bahwa median dua populasi tersebut sama. Nilaip untuk uji ini adalah 2(0.50–0.3729)=0.2542. Output MINITAB Mood Median Test: Respon versus Subjek Mood median test for Respon Chi-Square = 1,29 DF = 1 Subjek Cirrhosis hepatis Normal
N<= 8 6
N> 5 9
P = 0,256 Median 18,0 26,8
Q3-Q1 12,7 24,1
Overall median = 20,8 A 95,0% CI for median(Cirrhosis hepatis) - median(Normal): (-21,5;8,2)
Uji Tanda untuk Data Berpasangan Prosedur uji tanda untuk data berpasangan atau disebut juga uji tanda dua contoh yang saling berhubungan (sign test for two related sample) sangat mirip dengan uji tanda satu contoh (Pertemuan 1). Pada prinsipnya, selisih dua data berpasangan akan diubah menjadi serangkaian tanda ‘plus’ (+) dan ‘minus’ (-). Uji tanda ini berguna ketika data yang digunakan diukur dalam skala ordinal. Asumsi a. Data terdiri dari n pasang pengamatan (X1, Y1), (X2, Y2), …, (Xn, Yn). Peubah yang diamati adalah Xi – Yi = Di, yang merupakan selisih nilai data berpasangan. Median D dinyatakan sebagai MD. b. Masing-masing pasangan saling bebas.
5/8
c. Skala pengukuran minimal ordinal pada setiap pasangan. d. Peubah yang diamati bersifat kontinu. Hipotesis a. (Dua arah) : H0 : MD = 0 vs. H1 : MD ≠ 0 b. (Satu arah) : H0 : MD ≤ 0 vs. H1 : MD > 0 c. (Satu arah) : H0 : MD ≥ 0 vs. H1 : MD < 0 Statistik Uji Hitung selisih setiap data berpasangan Xi – Yi = Di. Hitung banyaknya nilai D yang bertanda ‘minus’ (S-) dan banyaknya nilai yang bertanda ‘plus’ (S+). Apabila terdapat ties, Xi = Yi atau Di =0, hilangkan pengamatan tersebut. Statistik uji yang akan digunakan untuk setiap hipotesis adalah : a. (Hipotesis a) : S = S’ = min (S-, S+) b. (Hipotesis b) : S = Sc. (Hipotesis c) : S = S+ Kaidah Keputusan a. (Hipotesis a) : Tolak H0 jika P(x ≤ S’ | b(n,0.5)) ≤ α/2 b. (Hipotesis b) : Tolak H0 jika P(x ≤ S- | b(n,0.5)) < α c. (Hipotesis c) : Tolak H0 jika P(x ≤ S+ | b(n,0.5)) < α
Contoh : Misalkan, suatu survei dilakukan untuk mengetahui pendapat mahasiswa mengenai derajat kesulitan kuliah pada tingkat II dan tingkat III, dengan hipotesis bahwa “perkuliahan tingkat II lebih mudah dari tingkat III”. Diperoleh data sebagai berikut : Mahasiswa keTingkat II Tingkat III
Dimana : Hipotesis
1 2 1
2 2 1
3 3 2
4 2 1
5 2 1
6 3 2
7 3 3
8 2 2
9 2 1
10 3 1
9 2 1 1 +
10 3 1 2 +
1 : Sangat sulit, 2 : Sulit, 3 : Mudah, 4 : Sangat mudah : H0 : MII ≤ MIII atau MD ≤ 0 H1 : MII > MIII atau MD > 0
Mahasiswa keTingkat II Tingkat III D Tanda
1 2 1 1 +
2 2 1 1 +
3 3 2 1 +
4 2 1 1 +
5 2 1 1 +
6 3 2 1 +
7 3 3 0
8 2 2 0
Statistik Uji : Berdasarkan data di atas, n=8, S+=8, S-=0. Karena hipotesis nol MD ≤ 0, maka statisitik uji yang digunakan adalah S-.
6/8
Keputusan
: Dari tabel binomial (A.2) diperoleh P(S ≤ 0 | b(8,0.5)) = 0.0039, sehingga pada taraf nyata 5% hipotesis nol ditolak dan simpulkan bahwa perkuliahan di tingkat III lebih sulit daripada di tingkat III.
Uji Peringkat Bertanda Wilcoxon untuk Data Berpasangan Prosedur uji peringkat bertanda Wilcoxon untuk data berpasangan (Wilcoxon signedrank test for paired observation) pada dasarnya sama seperti uji peringkat bertanda Wilcoxon pada populasi tunggal. Perbedaannya terletak pada data yang diuji. Pada pengujian data berpasangan, yang digunakan adalah data selisih data yang berpasangan. Asumsi a. b. c. d. e.
Data yang dianalisis terdiri dari n pengamatan dengan selisih Di = Yi – Xi. Selisih berupa peubah acak kontinu. Sebaran populasi dari selisih adalah simetris denga nilai tengah MD Selisih saling bebas Selisih yang diukur minimal berskala selang/interval
Hipotesis a. (Dua arah) : H0 : MD = 0 vs. H1 : MD ≠ 0 b. (Satu arah) : H0 : MD ≤ 0 vs. H1 : MD > 0 c. (Satu arah) : H0 : MD ≥ 0 vs. H1 : MD < 0 Statistik Uji Prosedur umum uji peringkat bertanda Wilcoxon adalah sebagai berikut : 1. Hitung selisih nilai Di = Yi – Xi. Jika hasilnya Di = 0, abaikan pengamatan tersebut. 2. Beri peringkat untuk |Di|. Jika ada nilai yang sama (disebut ties) beri peringkat tengah (mid-rank). 3. Pasangkan tanda ‘plus’ dan ‘minus’ pada peringkat sesuai nilai pada langkah pertama. 4. Hitunglah : jumlah peringkat bertanda ‘plus’ (T+), dan jumlah peringkat bertanda ‘minus’ (T-). Statistik uji yang digunakan untuk masing-masing hipotesis adalah adalah : a. (Hipotesis a) : T = T’ = min (T-, T+) b. (Hipotesis b) : T = Tc. (Hipotesis c) : T = T+ Kaidah Keputusan a. (Hipotesis a) : Tolak H0 jika T’ ≤ Tn(α/2) b. (Hipotesis b) : Tolak H0 jika T- ≤ Tn(α) c. (Hipotesis c) : Tolak H0 jika T+ ≤ Tn(α) Catatan Untuk contoh berukuran besar dapat didekati dengan sebaran normal baku menggunakan rumus : 7/8
T*
nn 1 4 nn 12n 1 24 T
Contoh : Ujilah hipotesis pada contoh soal sebelumnya dengan uji Wilcoxon untuk data berpasangan : Hipotesis
: H0 : MII ≤ MIII atau MD ≤ 0 H1 : MII > MIII atau MD > 0
Mahasiswa keTingkat II Tingkat III D Tanda Peringkat
1 2 1 1 + 4
2 2 1 1 + 4
3 3 2 1 + 4
4 2 1 1 + 4
5 2 1 1 + 4
6 3 2 1 + 4
7 3 3 0
8 2 2 0
9 2 1 1 + 4
10 3 1 2 + 8
Statistik Uji : Berdasarkan data di atas diperoleh n=8, T+=36, T-=0. Karena hipotesis nol MD ≤ 0, maka statisitik uji yang digunakan adalah T-. Keputusan
: Dari tabel Wilcoxon (A.3), diperoleh T8(0.05)=6 (p-value=0.0547). Karena T- < T8(0.05) hipotesis nol ditolak dan simpulkan bahwa perkuliahan di tingkat II lebih mudah daripada di tingkat III.
Bonus 1. Exercise 3.4, chapter 3, p. 97 (di buku referensi) 2. Exercise 3.2, chapter 3, p. 89 (di buku referensi) 3. Nilai-nilai yang diberikan pada pengukuran kualitas produk kertas yang diproduksi melalui dua proses yang berbeda, yang didasarkan pada sampel random berukuran 9 dari masing-masing proses, ditunjukan sebagai berikut: Tipe Proses Proses A Proses B
1 6.1 9.1
2 9.2 8.2
3 8.7 8.6
4 8.9 6.9
5 7.6 7.5
6 7.1 7.9
7 9.5 8.3
8 8.3 7.8
9 9.0 8.9
Ujilah bahwa tidak ada perbedaan dalam kualitas produk dari dua proses produksi kertas itu ! gunakan taraf nyata 10% (Mendenhall 1969 dalam Djarwanto 19871) Note : CMIWW (Correct Me If We’re Wrong)
1
Djarwanto. 1987. Kumpulan Soal dan Penyelesaiannya: Statistik Nonparametrik. Yogyakarta: BPFE
Prepared by : Nur Andi Setiabudi, S. Stat Edited by : Didin Saepudin
8/8