Suplemen Responsi
Pertemuan
ANALISIS DATA KATEGORIK (STK351)
8
Departemen Statistika – FMIPA IPB Pokok Bahasan
Sub Pokok Bahasan
Referensi
Korelasi Peringkat (Rank Correlation) Bag. 2
Koefisien korelasi peringkat Parsial Asosiasi untuk tabel kontingensi Korelasi biserial
Applied Nonparametric Statistic Daniel (1990)
Waktu
Jumat 23 Nov 2012 15.45 – 17.45
Pokok bahasan pada pertemuan ini adalah lanjutan dari pertemuan minggu yang lalu, yaitu korelasi peringkat (rank correlation). Terdiri dari tiga bahasan utama yaitu koefisien korelasi peringkat parsial, ukuran asosiasi untuk tabel kontingensi dan koefisien korelasi biserial.
Koefisien Peringkat Parsial Koefisien korelasi sederhana, seperti yang dibahas pada pertemuan lalu, mengukur keeratan dan arah hubungan antar dua peubah tanpa mengakomodasi pengaruh-pengaruh lain. Korelasi parsial memberikan solusi untuk permasalah itu. Korelasi parsial mengukur keeratan dan arah hubungan antar dua peubah dengan mengendalikan satu atau peubah lain di luar dua peubah itu. Hal ini sangat bermanfaat, misalnya dalam konteks analisis regresi. Ilustrasi korelasi parsial misalnya sebagai berikut. Korelasi antara jenis pupuk dan produktifitas tanaman dengan mengatur faktor kemiringan lahan konstan. Atau korelasi antara harga dan daya beli masyarakat dengan mengendalikan faktor nilai tukar mata uang, dan lain-lain. Korelasi parsial dapat diterapkan untuk metode korelasi Pearson serta korelasi Spearman dan tau-Kendall. Pada kelompok nonparametrik, korelasi parsial Spearman adalah yang paling sederhana. Perhitungannya cukup dilakukan dengan mengganti nilai sebenarnya dengan peringkat-peringkat yang tepat dan kemudian lakukan analisis korelasi parameterik. Koefisien korelasi parsial tau-Kendall antara X dan Y dengan Z konstan, ˆXY .Z , akan dibahas berikut ini : Hipotesis a. b. c.
H0 H1 H0 H1 H0 H1
: : : : : :
XY.Z = 0 XY.Z 0 XY.Z 0 XY.Z > 0 XY.Z ≥ 0 XY.Z < 0
Statistik Uji Koefisien korelasi parsial tau-Kendall sekaligus statistik uji yang digunakan dihitung dengan rumus :
ˆXY .Z
ˆXY ˆXZˆYZ 2 2 (1 ˆXZ )(1 ˆYZ )
Kaidah Keputusan Nilai kritis untuk ukuran contoh dan taraf nyata tertentu diberikan pada tabel korelasi parsial tau-Kendall (Tabel A.24). Pengambilan keputusan mengenai XY.Z adalah sebagai berikut : a.
Tolak H0 jika nilai statistik uji ˆXY .Z lebih besar daripada ˆXY .Z pada tabel untuk n
dan 1 – α/2 tertentu. b.
Tolak H0 jika nilai statistik uji ˆXY .Z lebih besar daripada ˆXY .Z pada tabel untuk n
dan 1 – α tertentu. c.
Tolak H0 jika nilai statistik uji ˆXY .Z lebih kecil daripada ˆXY .Z pada tabel untuk n
dan 1 – α tertentu. Contoh : Berikut ini adalah data tinggi (dalam cm) dan berat badan (dalam kg) dan lingkar dada (dalam cm) beberapa mahasiswa dari suatu kelas. Hitung nilai korelasi tau Kendall antara tinggi dan berat badan jika lingkar dada konstan. Apakah dapat disimpulkan bahwa tinggi dan berat badan saling bebas! Tinggi
Berat
Lingkar dada
Tinggi
Berat
Lingkar dada
171 161 160 163 168 153 170 173
49 59 50 56 58 47 54 60
99 103 98 105 104 100 102 106
155 180 145 152 158 165 140 181
43 73 38 46 41 65 37 85
96 108 92 101 93 107 95 109
Hipotesis
: H0 : TB.L = 0 H1 : TB.L ≠ 0
Statistik uji : Nilai korelasi parsial tau Kendall dapat diperoleh dengan prosedur berikut ini. Korelasi tau Kendall antara tinggi dan berat badan, sebagai mana sudah dibahas pada bab 7, adalah ˆTB 0.6833 . Dengan cara yang sama dapat diperoleh korelasi tau kendall antara tinggi badan dan lingkar dada serta berat badan dan lingkar dada : ˆTL 0.6000 dan ˆBL 0.8833 . Sehingga apabila lingkar dada konstan, korelasi tau Kendall antara tinggi badan dan berat badan adalah :
2/5
ˆTB ˆTLˆBL
ˆTB. L
ˆTB.L
2 2 (1 ˆTL )(1 ˆBL )
0.6833 (0.6000)(0.8833) (1 0.60002 )(1 0.88332 )
0.40886
Statistik uji : Untuk n = 16 dan 1 – α/2 = 0.975 diperoleh titik kritis sebesar 0.361 (Tabel A.24). Karena statistik uji lebih besar dari titik kritisnya, maka hipotesis nol ditolak dan simpulkan bahwa saat lingkar dada konstan, tinggi badan dan berat badan tidak saling bebas.
Asosiasi pada Tabel Kontingensi Perhatikan layout tabel kontingensi 2 2 berikut : Peubah X 1 2 Total
Peubah Y 1 a c a+c
2 b d b+d
Total a+b c+d n=a+b+c+d
Asosiasi antara peubah kategori X dan peubah kategori Y dapat dihitung dengan menggunakan beberapa cara, diantaranya : Koefisien phi
Dihitung dengan menggunakan rumus :
ad bc (a b)(c d )(a c)(b d )
Koefisien phi bernilai dari 1 sampai dengan +1. Jika nilai mutlak dari koefisien phi mendekati satu, berarti ada asosiasi yang kuat antara dua peubah. Koefisien phi memiliki hubungan dengan khi-kuadrat, yaitu :
2 X 2 / n Q Yule
Hanya dapat digunakan untuk tabel kontingensi 2 2. Rumusnya adalah
Q
ad bc ad bc
Statistik Cramer Dapat digunakan untuk mengukur asosiasi antara dua peubah dalam berbagai dimensi tabel kontingensi. Statistik Cramer dihitung dengan rumus :
C
X2 n(t 1)
Dalam hal ini, X 2 adalah nilai khi-kuadrat, n ukuran contoh dan t adalah banyaknya baris dan kolom yang paling kecil.
3/5
Contoh : Hitunglah ukuran asosiasi antara jenis kelamin dan kebiasaan merokok yang datanya ditampilkan dalam tabel kontingensi berikut : Jenis kelamin Laki-laki Perempuan Total
Kebiasaan merokok Ya Tidak 28 11 4 32 32 43
Total 39 36 75
Nilai khi-kuadrat untuk tabel kontingensi di atas adalah X 2 28.1809 (prosedur perhitungan khi-kuadrat ada pada Bab 5). Sehingga dapat dihitung : Koefisien phi
(28)(32) (4)(11) 0.6130 (39)(36)(32)(43)
atau 28.1809 / 75 0.6130 Q Yule
Q
Statistik Cramer
C
(28)(32) (4)(11) 0.9064 (28)(32) (4)(11) 28.1809 0.6130 75(2 1)
Selain ketiga statistik tersebut, asosiasi dalam tabel kontingensi juga dapat diukur dengan koefisien Goodman – Kruskall G. Penjelasan lengkap tentang koefisien G disampaikan pada Daniel (1990, pp. 404 – 408).
Koefisien Korelasi Point Biserial Koefisien korelasi point biserial digunakan untuk mengukur hubungan antara peubah kontinu dengan peubah biner (hanya mempunyai dua kemungkinan nilai). Sebagai contoh aplikasi ini adalah untuk mengukur hubungan umur dengan terjangkit suatu penyakit, hubungan IPK dengan keberhasilan lulus studi tepat waktu dan lain-lain. Koefisien korelasi antara peubah kontinu X dengan peubah biner Y (sukses, Y = 1; gagal Y = 0) dihitung denga rumus :
rpb
n1n0 x1 x0 n ( x x ) 2
Dengan n1 dan x1 adalah banyaknya pengamatan dan rata-rata X jika Y = 1, n0 dan x0 adalah banyaknya pengamatan dan rata-rata X untuk Y = 0. Contoh : Tabel berikut menunjukkan IPK dan keberhasilan mahasiswa dalam menyelesaikan studi tepat waktu. Hitunglah rpb ! IPK (x)
3.75
2.50
4/5
3.45
3.10
3.30
3.67
2.85
Selesai studi tepat waktu? (Y=1, T=0)
1
0
1
1
1
1
0
IPK (x) Selesai studi tepat waktu? (Y=1, T=0)
2.98 0
3.76 0
3.08 1
3.23 1
3.44 1
3.00 0
3.05 0
Dari data diperoleh
n0 6 , n1 8 , n 14 ,
x 3.2257 ,
x0 3.0233 ,
x1 3.3775 ,
( x x ) 1.7067 , sehingga : 2
rpb
Tugas
(8)(6) 3.3775 3.0233 0.5020 14 1.7076
: Buku Daniel (1990) hal. 400 latihan 9.19 (soal: korelasi parsial antara x dan y saat z konstan dan korelasi parsial antara w dan z saat y konstan, α=0.01), dan hal. 417 latihan 9.47 tentang korelasi point biserial.
CUIWW (Correct Us If We’re Wrong) Prepared by : Nur Andi Setiabudi, S. Stat Edited by : Didin Saepudin
5/5