BabXVII MetodeNonparametrik
KAT A KUNCI metode nonparametrik merupakan merode statistik yang tidak mengasumsikan bentuk khusus distribusi dan oleh karena itu tidak menitik beratkan pada nilai parameter yang tidak diketahui; beberapa contoh adalah sign test, Fredman F test, Wilcoxon rank sum test, Kruskal-Wallis test dan Wilcoxon signed rang test. Anda telah melihat urutan biasanya pada bab sebelumnya. Saat uji hipotesa atau menghasilkan confidence interval, kita telah mengasumsikan bahwa populasi kita sampling dengan distribusi yang telah ditentukan, biasanya normal. Meskipun kita tidak mengetahui parameter (rata-rata dan variance), kita dapat mengestimasinya dari sampel dan bertolak dari sana. Seringkali kita mengasumsi data kontinu, sepertitinggi badan seseorang dalam em 180,1 atau 180,11atau 180,109.Apa yang harus kita lakukanjika data terdiri dari orang-orang yang menggolongkan produk atau service tertentu pada skala 1 sampai 10? Bagaimana kita mengikuti kenyataan bahwa penggolongan bersifat subyektif, yang produk 8 tidak berguna seperti produk 4 menurut orang yang sarna? Padahal inikita tidakmempunyaidistribusibiasanyadanparameteruntukmengandalakan, dan untuk prosedur yang berbeda disebut metode nonparametrik. YANG HARUS DIINGA T 1. Kebanyakan metode statistik yang telah kita bicarakan di muka, mengandung pengestimasian nilai parameter yang tidak diketahui bila bentuk distribusi khusus diasumsikan untuk diterapkan. 2. Metode statistik lain, disebut metode nonparametrik, dapat diterapkan untuk keadaan dimana tidak perlu membuat asumsi bentuk distribusi. SIGN TEST Salah satu metode nonparametrik yang paling mudah disebut sign test. Adalah sangat berguna bila mengevaluasi pengamatan yang lebih disukai pengamat, tetapi bukan dengan berapa banyak. Contoh, Anggap perusahaan Coca Cola menguji coba rasa produknya untuk membandingkan dengan saingannya, perusahaan Pepsi Cola. Kita akan menguji hipotesa nol
253 ---
---
diantara populasi seluruhnya tidak terdapat perbedaan antara dua produk tersebut. Jika riap orang memberikan estimasi yang tepat tentang kesukaan masing-masing pada skala 1sampai 10, kita dapat menggunakan metode statistik yang telah dilakukan sebelum dengan statistik t. Bagaimanapun juga kita tidak mempunyai urutan yang tersedia; terlebih lagi kita mungkin ragu ketepatan perbandingan golongan perorangan jika tersedia. Oleh karena itu kita akan menggunakan sign test. Dengan mudah kita akan menanyakan 20 orang pada pengamatan cola yang mana yang mereka suka, menggunakan tanda tambahan untuk menunjukkan orang-orang yang lebih suka coca cola dan tanda kurang untuk menunjukkan orang-orang yang lebih suka Pepsi Cola. Anggap hasilnya sebagai berikut: +, -, +, +, +, +, -, +, +, -, +, +, +, -, +, +, -, +, +, + Dari 20 orang tersebut, 15 orang lebih menyukai coca cola dan 5 orang lebih menyukai Pepsi Cola. Jika hipotesa nol benar, maka tiap individual mempunyai kemungkinan 50 persen memilih coca cola dan 50 persen memilih Pepsi cola. Oleh karena itu, lambang tambah berasal dari distribusi binomial dengan n 20 dan p =0,5. Kita akan menggunakan n+untuk lambang tambah. Maka
=
E(n)
= np = 10 dan
Var(n)
= np(l-p) = 20/4 = 5
Kita dapat menggunakan distribusi normal sebagai perkiraan distribusi binomial. (Untuk sign test perkiraan ini secara umum akanberlaku bila n > 10).Oleh karena itu kita akan menggunakan tes statistik Z:
=
Z-
2n+ - n
Vnp(l-p) - -r;jl yang akan berdistribusi normal jika hipotesa nol benar. Pada kasus kita n+ = 15 dan n =20, maka kita dapat menghitung Z =2,236. Kita dapat menolak hipotesa nol pada tingkat 5 persen karena 2,236 di luar 1,96. Satu manfaat penting dari sign test adalah Anda tidak perlu membuat asumsi yang dibatasi tentang populasi alamiah. Contoh, Anda tidak perlu mengasumsikan kesukaan yang terdistribusi menurut distribusi normal. Kelemahan sign test adalah mengabaikan beberapa informasi yang Anda miliki pada kasus yang pasti. Jika pada contoh cola, informasi yang tersedia hanya mengatakan merk mana yang lebih disukai, maka Anda akan menggunakan sign test. Kekuatan kesukaan tiap orang, maka sign test tidak efektif karena mengabaikan informasi itu. FRIEDMAN Fr TEST
Di atas, dimana kita menguji hanya dua pilihan, kita hanya memperhatikan orang yang mana yang lebih suka. Tentukan tiga atau lebih pilihan, kita mungkin juga ingin mengetahui 254
orang yang mana yang menyukai kedua terbaik, ketiga terbaik dan seterusnya. Tentukan pilihan n, kita akan menanyakan orang-orang untuk mengurutkan yang lebih disukai mereka. Hal ini melanggar hipotesa nol yang mengasumsikan distribusi binomial (mudah dimengerti generalisasi kasus dua pilihan), yang hanya menganggap pilihan yang mana yang paling disukai seseorang. Dengan demikian kita menggunakan Friedman Fr test dan membentuk tes statistik barn: 12 Fr=
(
k
J(
bk (k + 1)
IRj2 j=l
-3b(k+l)
J
dimana b adalah besar sampel k adalah banyak pilihan R.J adalah jumlah rank (urutan) pilihan ke-j (jumlah pilihan k dan juga k > 5 atau b > 5, maka Fr berdistribusi chi-square dengan df k - 1, yang dapat digunakan menguji hipotesa no1.
Contoh: Aplikasi Friedman Fr Test Misalnya 10 salesmen sebuah perusahaan membandingkan penjualannya (bekerja secara independen) di 4 negara. Tes dilakukan untuk melihat apakah mereka bekerja lebih baik atau lebih buruk daripada rata-rata di beberapa negara. Berikut ini adalah tabel data: Salesman Kotal 1 2 3 4 5 6 7 8 9 10
Rank 1 Kota 2 Rank 2 Kota 3 Rank 3 Kota 4 Rank 4
15 19 27 43 18 12 20 14 40 9 Rl
3 3 4 4 4 4 4 1 4 1
= 32
18 20 7 9 17 10 13 22 14 14
4 4 1 1 3 2 1 2 2 2
9 13 15 19 16 11 16 23 25 26
R2 = 22
1 2 3 2 2 3 2 3 3 3 R3=24
11 6 8 29 18 9 18 31 13 19
2 1 2 3 3 1 3 4 1 4 R4 = 22
Jawab: b =10, k = 4, Fr = 4,08dandenganmelihatpadatabelA3-3,kita lihatbahwakitadapat menerima hipotesa nol pada tingkat 2 persen. 255
----
--
--
-
-
--
Prosedur umum, pengamatan yang ditentukan menghasilkan urutan pilihan yang lebih disukai (karena data numerik tidak tersedia atau karena tidak sesuai dengan distribusi yang diketahui), sehingga hipotesa nol adalah tidak ada yang lebih disukai diantara pilihan, bila besar sampel (b) atau banyak pilihan (k) lebih besar dari 5. Langkah Friedman Fr Test 1. Hitung jumlah rank Rj. 2. Hitung 12 Fr =
k
(
bk (k + 1)
3.
J
L Rp ~j=1
-3b(k+l)
J
Fr berdistribusi chi-square dengan dfk - 1. Periksa tabel A3-3 untuk dfk - 1. Terima atau tolak hipotesa nol pada tingkat signifikan yang telah dipilih.
Catatan : Angka seri dapat terjadi pada saat mengurutkan data numerik. Jika hanya ada beberapa angka seri, rata-rata ranking 1,5,4,1,5,3, karena ada angka seri pada ranking pertama dan kedua. Jika terdapat banyak angka seri, maka data Anda tidak dapat dipercaya. YANG HARUS DIINGAT 1. Sign test digunakan untuk menguji hipotesa bahwa tidak ada perbedaan antara dua kuantitas saat Anda meranking menggantikan nilai numerik. 2. Friedman Fr test digunakan untuk menguji hipotesa bahwa tidak ada perbedaaan antara yang lebih disukai bila ada lebih dari dua kemungkinan. WILCOXON RANK SUM TEST Misalnya kini Anda mempunyai sampel (tidak perlu sarna besar) dari dua populasi yang Anda kira mempunyai distribusi yagn sarna (tidak diketahui). Salah satu cara mengu ji apakah keduanya berasal dari distribusi yang sarna atau tidak adalah dengan menggabungkan sampel dan melihat bagaimana keduanya tercampur. Jika semua nilai dari satu sampellebih kecil daripda semua nilai sampellain, maka Anda hendaknya menolak hipotesa nol (bahwa dua populasi mempunyai distribusi yang sarna). Disamping itu, jika keduanya tercampur baik, maka Anda tidak punya alasan untuk menolak hipotesa. Cara mengukur seberapa baik sampel yang tergabung itu tercampur disebut Wilcoxon rank sum test. Itu terdiri dari gabungan sampel A dan B, merankingnya, dan menabmah rank yang ditentukan pada A ke bentuk jumlah rank T. Jika besar tiap sampel paling sedikit 8, maka T berdistribusi normal dengan parameter
dan
Ilr=
2 256
0:T = 12 dimana n A = besar sampel A dan nB= besar sampel B. Maka dengan membandingkan (T - f.lT)/ crTdengan tabel A3-2, kita dapat menentukan apakah menerima hipotesa atau tidak. Contoh: Aplikasi Wilcoxon Rank Sum Test Misalnya 9 orang profesor ekonomi dari Astina dan 8 orang dari Alengka memprediksi inflasi untuk tahun depan:
Astina
Prediksi inflasi (persen)
Rank
Alengka
Prediksi inflasi (persen)
Rank
1 2 3 4 5 6 7 8 9
8,6 9,7 11,8 17,1 12,9 11,7 12,4 10,3 8,9
1 3 6 16 10 5 4 4 2
1 2 3 4 5 6 7 8
15,8 13,4 12,2 17,3 12,6 14,3 14,2 13,5
15 11 7 17 9 14 13 12
Uji hipotesa nol bahwa prediksi profesor berdistribusi sarna. Jawab: T=55
(18) f.lr= -= 2
81
(9) (8) (18)
crT =
= 108
= -2,5
12 dan bandingkan dengan tabel A3 - 2, kita lihat bahwa kita dapat menolak hipotesa pada tingkat 95 persen. Kita mempunyai prosedur yang ditunjukkan di bawahuntuk menguji hipotesa nol bahwa sampel berasal dari dua populasi dengan distribusi yang sarna. 257 -
--
-
---
Prosedur Wilcoxon Rank Sum Test 1. Gabung sarnpel 2. Ranking (juka ada beberapa angka seri, rankingnya adalah rata-ratanya) 3. Hitungjumlah rank T untuk sarnpel A =
nA (nA+ nB + 1)
dan
2
a T= 4.
nAnB(nA+ nB + 1)
12
Bandingkan variabel random normal (T - uT)aT dengan tabel A3-2 pada tingkat tang telah ditentukan untuk menentukan apakah kita menerima hipotesa atau tidak.
KRUSKAL-WALLISH TEST Kruskal-Wallis H Test merupakan generalisasi Wilcoxon rank sum test untuk lebih dari dua populasi. Contoh: Aplikasi Kruskal-Wallis H Test Misalnya kita mempunyai sampel k populasi dan kita ingin menguji hipotesa bahwa populasi mempunyai distribusi yang sarna. Pemecahan: Kita kembali menggabungkan sarnpeldan merankingnya. Tes statistikuntuk hal ini agak rumit:
dimana k
n
=I.nj j=l
n.J
= besar
sampel populasi ke-j dan R.J =rank sum ke-j.
H berdistribusi chi-square dengan df k - 1,jika tiap n.J lebih besar dari 5. Tentukan tingkat signifikan dan sampel dari populasi k yang berbeda (dengan setiap besar sarnpellebih besar dari 5), hitung H dan periksa Tabel A3-3 dfk - 1untuk menentukan apakah menerima hipotesa nol atau tidak (populasi berdistribusi sarna).
258
WILCOXON SIGNED RANK TEST Seperti yang telah Anda kira, Wilcoxon signed rank test hampir sama caranya dengan Wilcoxon rank sum test. Ini dapat dipakai pada keadaan yang mirip dengan pembicaraan sign test. Hipotesa nol menyatakan bahwa htidak ada perbedaan antara dua populasi. Misalnya kita menanyakan orang-orang untuk mengevaluasi dua pilihan A dan B. Saat ini, menyatakan yang mana yang lebih disukai, mereka menggolongkan masing-masing pada skala (misalnya, dari 1 sampai 10 atau 100). Kemudian kita ranking nilai absolut positif dan perbedaan negatif, tandai T+ dan T_.Jika kita anggap T lebih kecil dari T+ dan T_,dan besar sampel N adalah besar, maka T adalah variabel random normal dengan parameter
N (N + 1) J.lT
=
N (N + 1) (2N + 1) dan aT
4
=
24
jika hipotesa nol benar. Kemudian kita mempunyai variabel random normal (T -1lr)/crT yang dapat kita bandingkan dengan tabel A3-2 untuk memutuskan apakah menerima hipotesa atau tidak. Contoh: Aplikasi Wilcoxon Signed Rank Test Misalnya kita mengambil sampel random dari 10 orang yang menyewa mobil dari Jatayu Ekspres dan Baker Ekspres dan menyuruh mereka untuk menggolongkan kedua persewaan tersebut pada skala 1 sampai 10. Kita dapatkan tabel berikut ini:
Orang
A
B
A-B
A-B
1
4
-3
2 3 4 5 6 7 8 9 10
5 9 5 4 9 5 7 3 3
7 6 6 7 5 8 4 6 5 6
3 1 3 2 1 1 1 1 6,5 3
-1 3 -2 -1 1 1 1 -2 -3
Rank 9 3 9. 6,5 3 3 3 3
+
9
9 3 9 3 3
3 3 3 6,5 9
9 total
-
18
37
Ujilah hipotesa bahwa tidak ada perbedaan antara dua perusahaan.
259 - --
Jawab: T+ = 18 T- = 37 T=T+=I8
10(11)
JlT=
4
= 27,5
10 (11) (21)
aT =
= 96,25 24
(T - 1lr)/crT= -0,97 dan kita dapat menerima hipotesa pada tingkat 95 persen. Pada kasus angka seri, maka ranking adalah rata-ratanya. Jika seseorang memberikan golongan yang sarna pada A dan B (maka A - B = 0), buat tes dua kali, pertarna hitung 0 sebagai perbedaan positif, kedua hitung 0 sebagai perbedaan negatif. Jika hasilnya sesuai, baik. Jika tidak, data Anda tidak dapat dipercaya. Dibawah ini adalahprosedur penggolongan yang telah ditentukan dari duapilihan yang dilakukan oleh N orang (perusahaan, departemen, dan sebagainya). Prosedur Wilcoxon Signed Rank Test 1. Ranking nilai absolut dari perbedaan golongan 2. Hitung jumlah rank T+ dan T3. Anggap T lebih kecil dari T+ dan TN (N + 1) JlT =
N (N + 1)(2N + 1)
dan crT= 4
24
4.
Bandingkan (T -1lr)/crTdengan tabel A3-2 untuk menentukan apakah menerimahipotesa nol atau tidak pada tingkat signifIkan yang ditentukan. YANG HARUS DIINGA T
1. Wilcoxon rank sum test digunakan untuk menguji hipotesa yang tidak ada perbedaan antara rata-rata populasi. 2. Kruskal-Wallis H test adalah generalisasi dari Wilcoxon rank sum test, digunakan saat ada lebih dari dua populasi. 3. Wilcoxon signed rank test digunakan untuk menguji hipotesa yang tidak ada perbedaan antara rata-rata populasi.
260