Statistik Non Parametrik Tjipto Juwono, Ph.D.
March 2017
TJ (SU)
Non Parametrik
March 2017
1 / 26
Tipe-tipe Variabel dan Level Pengukuran
Tipe-tipe Variabel kualitatif Bersifat non-numerik (tidak dapat dinyatakan dengan angka). kuantitatif Bersifat numerik (dapat dinyatakan dengan angka). Ada dua macam: 1 diskrit 2 kontinu
TJ (SU)
Non Parametrik
March 2017
2 / 26
Tipe-tipe Variabel dan Level Pengukuran
Level Pengukuran 1
Ordinal
2
Nominal
3
Interval
4
Ratio
TJ (SU)
Non Parametrik
March 2017
3 / 26
Statistik Parametrik vs Statistik Non-Parametrik
Statistik Parametrik: Berurusan dengan variabel kuantitatif, dengan level pengukuran interval atau ratio. Kita melakukan uji hipotesa di mana populasinya mempunyai bentuk tertentu (misalnya distribusi normal). Statistik Non-Parametrik: Kita tidak mengandaikan bahwa populasinya mempunyai bentuk tertentu. Statistik non-paramterik dapat kita gunakan untuk menganalisa data-data dengan variabel yang bertipe kualitatif dengan level pengukuran ordinal atau nominal.
TJ (SU)
Non Parametrik
March 2017
4 / 26
Distribusi Chi-Square
Salah satu distribusi yang dapat digunakan untuk analisa statistik non-parametrik adalah distribusi Chi-square (χ2 ). Distribusi ini tidak menggambarkan distribusi dari populasi (ingat bahwa dalam statistik non-parametrik kita tidak mengandaikan bentuk dari distribusi populasi). Distribusi ini menggambarkan distribusi dari suatu besaran yang disebut Chi-square (χ2 ). X (fo − fe )2 2 χ = (1) fe Dengan fo adalah frekuensi observasi dan fe adalah frekuensi ekspektasi. Bandingkan dengan distribusi-Z di mana besaran Z merupakan besaran dari populasi.
TJ (SU)
Non Parametrik
March 2017
5 / 26
Distribusi Chi-Square
Statistik χ2 juga digunakan untuk menganalisa apakah suatu kelompok data adalah dari populasi normal. Dalam hal ini statistik Chi-square digunakan sebab kita tidak dapat mengasumsikan bahwa data itu adalah dari populasi normal. Penggunaan lain dari statistik χ2 adalah untuk melakukan analisa kontingensi. Data didistribusikan dalam suatu tabel kontingensi, dan kita ingin mengetahui apakah suatu kategori adalah lebih penting daripada kategori lainnya.
TJ (SU)
Non Parametrik
March 2017
6 / 26
Karakteristik distribusi Chi-Square
TJ (SU)
Non Parametrik
March 2017
7 / 26
Karakteristik distribusi Chi-Square
Positively skewed Non-negative Bergantung pada df
TJ (SU)
Non Parametrik
March 2017
8 / 26
Goodness-of-Fit Test
f0 : Frekuensi hasil observasi fe : Frekuensi yang diekspektasi Hipotesa H0 : Tidak ada perbedaan antara frekuensi observasi dengan frekuensi ekspektasi H1 : Ada perbedaan antara frekuensi observasi dengan frekuensi ekspektasi.
TJ (SU)
Non Parametrik
March 2017
9 / 26
Goodness-of-Fit Test
Statistik Tes adalah X (fo − fe )2 χ = fe 2
(2)
Nilai kritis-nya adalah nilai χ2 dengan df = (k − 1); k adalah jumlah kategori.
TJ (SU)
Non Parametrik
March 2017
10 / 26
Goodness-of-Fit Test Sebuah restoran ingin mengetahui apakah ada preferensi terhadap makanan favorit. Survey dilakukan dengan mengambil sampel 120 orang dewasa yang ditanya makanan favorit mereka. Diperoleh hasil sebagai berikut. Makanan Favorit Ayam Ikan Daging Pasta Total
Frekuensi 32 24 35 29 120
Dapatkah disimpulkan bahwa tidak ada preferensi di antara keempat macam makanan tersebut? (Level of significance α = 0.05). TJ (SU)
Non Parametrik
March 2017
11 / 26
Goodness-of-Fit Test
Step 1 Nyatakan H0 dan H1 H0 : tidak ada perbedaan antara f0 dan fe H1 : ada perbedaan antara f0 dan fe Step 2 Pilih level of significance α = 0.05 Step 3 Pilih statistik tes X (fo − fe )2 χ = fe 2
TJ (SU)
Non Parametrik
March 2017
12 / 26
Goodness-of-Fit Test Step 4 Nyatakan Decision Rule H0 ditolak jika: X (fo − fe )2 > 7.815 fe
df=n-1 TJ (SU)
Non Parametrik
March 2017
13 / 26
Goodness-of-Fit Test Step 5 Hitung χ2 dan buat keputusan Makanan Favorit Ayam Ikan Daging Pasta Total
fo 32 24 35 29 120
fe 30 30 30 30 120
(fo − fe )2 /fe 0.133 1.200 0.833 0.033 2.200
χ2data < χ2critical Kesimpulan: H0 tidak ditolak. Artinya: tidak ada preferensi. Tidak ada makanan yang lebih disukai daripada lainnya.
TJ (SU)
Non Parametrik
March 2017
14 / 26
Frekuensi ekspektasi tidak sama
Menurut sebuah survei nasional, diperoleh data tentang warga berusia lanjut. Dalam satu tahun, 40% tidak pernah masuk rumah sakit, 30% masuk rumah sakit sekali, 20% dua kali, dan 10% tiga kali atau lebih. Sebuah sampel yang terdiri dari 150 warga berusia lanjut mempunyai komposisi: 55 tidak pernah masuk rumah sakit dalam setahun, 50 masuk satu kali, 32 dua kali, dan sisanya tiga kali atau lebih. Dapatkah kita menyimpulkan bahwa data sampel itu konsisten dengan hasil survei nasional? Gunakan α = 0.05.
TJ (SU)
Non Parametrik
March 2017
15 / 26
Frekuensi ekspektasi tidak sama
Jumlah Masuk RS 0 1 2 3 atau lebih Total
Survei (%) 40 30 20 10 100
fo 55 50 32 13 150
fe 60 45 30 15 150
Dapatkah kita menyimpulkan bahwa data sampel itu konsisten dengan hasil survei nasional?
TJ (SU)
Non Parametrik
March 2017
16 / 26
Frekuensi ekspektasi tidak sama
Step 1 Nyatakan H0 dan H1 H0 : tidak ada perbedaan antara fo dan fe H1 : ada perbedaan antara fo dan fe Step 2 Pilih level of significance → α = 0.05 Step 3 Pilih statistik tes → χ2 Step 4 Nyatakan Decision Rule H0 ditolak jika: X (fo − fe )2 > 7.815 fe
TJ (SU)
Non Parametrik
March 2017
17 / 26
Frekuensi ekspektasi tidak sama Step 5 Hitung χ2 dan buat keputusan Jumlah Masuk RS 0 1 2 3 atau lebih Total
Survei (%) 40 30 20 10 100
fo 55 50 32 13 150
fe 60 45 30 15 150
(fo − fe )2 /fe 0.4167 0.5556 0.1333 0.2667 1.3723
χ2data < χ2critical Kesimpulan: H0 tidak ditolak. Data sampel konsisten dengan hasil survei nasional.
TJ (SU)
Non Parametrik
March 2017
18 / 26
Limitasi Chi-square
Jika jumlah cell hanya dua, maka frekuensi ekspektasi pada masing-masing cell paling sedikit harus sama dengan 5. Individu Dapat membaca Buta huruf
TJ (SU)
Non Parametrik
fo 641 7
fe 642 6
March 2017
19 / 26
Limitasi Chi-square Jika jumlah cell lebih dari dua, maka Chi-square tidak dapat digunakan jika lebih dari 20% dari cell yang ada memuat fe < 5
TJ (SU)
Non Parametrik
March 2017
20 / 26
Limitasi Chi-square Jika lebih dari 20% dari cell yang ada memuat fe < 5, kita dapat berusaha menggabungkan beberapa cell menjadi satu.
TJ (SU)
Non Parametrik
March 2017
21 / 26
Menguji Apakah Distribusi Suatu Data Berasal dari suatu Populasi Normal Penjualan 180 Kendaraan. Dengan mean=$1843.17 dan standard deviasi $643.63.
TJ (SU)
Non Parametrik
March 2017
22 / 26
Menguji Apakah Distribusi Suatu Data Berasal dari suatu Populasi Normal Gunakan rumus berikut untuk menghitung Z Z=
TJ (SU)
X −µ σ
Non Parametrik
March 2017
23 / 26
Menguji Apakah Distribusi Suatu Data Berasal dari suatu Populasi Normal
Dari tabel, H0 ditolak jika χ2 > 11.07. Kesimpulan: H0 tidak ditolak. Artinya, data berbentuk normal.
TJ (SU)
Non Parametrik
March 2017
24 / 26
Analisa Kontingensi
TJ (SU)
Non Parametrik
March 2017
25 / 26
Analisa Kontingensi
(27 − 24)2 (35 − 30)2 (33 − 36)2 (25 − 20)2 + + + ... + 24 30 36 20 = 5.729 (3)
χ2 =
H0 ditolak jika χ2 > 11.345. Jadi, kesimpulan? TJ (SU)
Non Parametrik
March 2017
26 / 26