Suplemen Responsi
Pertemuan
ANALISIS DATA KATEGORIK (STK351)
7
Departemen Statistika – FMIPA IPB Pokok Bahasan
Sub Pokok Bahasan
Referensi
Korelasi Peringkat (Rank Correlation) Bag. 1
Koefisien Korelasi Peringkat Spearman dan Ujinya Koefisien Korelasi Peringkat Tau-Kendall dan Ujinya Koefisien Konkordansi Kendall
Applied Nonparametric Statistic Daniel (1990)
Waktu
Jumat 26 Nov 2010 15.30 – 16.30
Salah satu pertanyaan yang umum diajukan dalam sebuah studi atau penelitian adalah apakah dua atau lebih peubah saling berhubungan atau saling bebas. Pada Bab 5, telah dibahas asosiasi antarpeubah kategori (nominal dan ordinal) yang diuji dengan menggunakan uji khi-kuadrat. Pada kesempatan tersebut, pertanyaan apakah dua peubah saling berhubungan atau saling bebas dapat terjawab, namun ukuran keeratan hubungannya belum dapat dijelaskan. Bab ini membahas dua aspek analisis asosiasi, yaitu apakah peubah saling berhubungan (berasosiasi) dan berapa erat hubungan itu. Ukuran keeratan hubungan antar dua peubah yang sering digunakan adalah koefisien korelasi Pearson, r. Koefisien korelasi Pearson antara X dan Y, rxy adalah :
rxy
n i 1
n i 1
( X i X )(Yi Y ) n
( X i X ) 2 i 1 (Yi Y ) 2
rxy merupakan koefisien korelasi contoh yang dipat digunakan untuk menduga koefisien korelasi populasi, xy. Beberapa karakteristik koefisien korelasi Pearson antara lain adalah sebagai berikut : (1) Jika nilai X besar berpasangan dengan nilai Y besar (dan sebaliknya nilai X kecil berpasangan dengan nilai Y kecil), koefisien korelasi pearson akan positif dan mendekati 1. Hubungan seperti ini disebut sebagai hubungan searah (direct relationship); (2) Jika nilai X kecil berpasangan dengan nilai Y besar (dan sebaliknya nilai X besar berpasangan dengan nilai Y kecil), koefisien korelasi pearson akan negatif dan mendekati –1. Hubungan seperti ini disebut sebagai hubungan berkebalikan (inverse relationship); (3) Jika nilai X besar berpasangan dengan nilai Y besar dan juga nilai Y kecil, koefisien korelasi pearson akan mendekati nol. Pada kondisi ini dapat dikatakan bahwa X dan Y tidak berhubungan atau saling bebas; (4) Nilai korelasi berkisar antara –1 dan +1. Pengujian ataupun inferensia statistik tentang r dapat digunakan apabila contoh berasal dari populasi yang menyebar bivariat normal. Jika tidak, diperlukan prosedur korelasi atau asosiasi nonparameterik – seperti yang akan kita pelajari pada kesempatan ini. Beberapa yang akan dipelajari adalah koefisien korelasi peringkat Spearman, Tau-Kendall, koefisien konkordansi Kendall, korelasi peringkat parsial dan lain-lain.
Koefisien Korelasi Peringkat Spearman, rs Ukuran asosiasi yang sering digunakan adalah koefisien korelasi peringkat Spearman (Spearman rank correlation coefficient) yang diperkenalkan oleh Spearman (1904). Asumsi a. Data terdiri dari contoh acak sebanyak n pasang pengamatan, dapat berupa numeric maupun non-numerik. b. Setiap pengamatan berpasangan menggambarkan dua pengukuran yang diambil dari objek yang sama, disebut unit asosiasi. Hipotesis a. b. c.
H0 H1 H0 H1 H0 H1
: : : : : :
X dan Y saling bebas (s = 0) X dan Y memiliki hubungan searah atau berkebalikan (s ≠ 0) X dan Y saling bebas (s = 0) X dan Y memiliki hubungan searah (s > 0) X dan Y saling bebas (s = 0) X dan Y memiliki hubungan berkebalikan (s < 0)
Statistik Uji Prosedur untuk menghitung statistik uji korelasi peringkat Spearman antara peubah X dan Y, rs, adalah sebagai berikut : 1.
2. 3. 4.
Urutkan nilai-nilai pengamatan peubah X dari yang paling kecil hingga paling besar. Peringkat untuk nilai ke-i ditulis sebagai R(Xi). Jika Xi adalah nilai terkecil pada peubah X, maka R(Xi)=1. Lakukan langkah 1) untuk peubah Y. Jika ada beberapa nilai yang sama (ties) berikan peringkat tengah (mid-rank). Statistik uji korelasi peringkat Spearman adalah :
rs 1
6di2 n(n 2 1)
2 dalam hal ini di
2
n
R( X ) R(Y ) i 1
i
i
Statistik uji rs merupakan koefisien korelasi peringkat Spearman yang mengukur keeratan hubungan antara peringkat-peringkat pengamatan contoh. Ties. Jika ada nilai yang sama (ties) baik pada peubah X maupun Y maka diberikan peringkat tengah (mid-rank). Ties sangat kecil pengaruhnya terhadap nilai hitung rs , kecuali dalam jumlah yang banyak. Ketika data mengandung ties, rs dapat dikoreksi jika diinginkan. Jika tx dan ty adalah banyaknya pengamatan X dan Y yang ties dan misalkan
Tx
Ty
t x3 t x 12 3 ty ty
12
n3 n Tx 12 n3 n y 2 Ty 12 x 2
2/9
Jika koreksi terhadap ties diterapkan, maka statistik uji menjadi :
rs *
x 2 y 2 di2 2 x 2 y 2
Kaidah Keputusan Nilai kritis koefisien korelasi peringkat Spearman rs ditunjukkan pada Tabel A.21. Kaidah keputusan untuk masing-masing hipotesis yang dituliskan di atas adalah : a. b. c.
Tolak H0 jika nilai mutlak statistik uji |rs| lebih besar dari nilai tabel untuk ukuran contoh n dan taraf nyata α(2) Tolak H0 jika nilai statistik uji rs lebih besar dari nilai tabel untuk ukuran contoh n dan taraf nyata α(1) Tolak H0 jika nilai statistik uji rs lebih kecil dari nilai tabel untuk ukuran contoh n dan taraf nyata α(1).
Contoh besar. Jika contoh berukuran lebih dari 100, kita tidak dapat menggunakan Tabel A.21 untuk menguji rs. Karenanya kita dapat menghitung :
z rs n 1 yang menyebar normal baku. Contoh : Berikut ini adalah data jumlah kehadiran dalam kuliah, nilai tugas dan nilai ujian akhir. Hitung korelasi peringkat Spearman antara jumlah kehadiran dalam kuliah dan nilai ujian akhir. Uji apakah kedua peubah tersebut saling bebas! Mahasiswa
Kehadiran
Nilai Ujian
A B C D E F G H I J
13 12 15 15 10 13 15 13 16 16
53 42 70 69 32 76 73 45 58 45
Hipotesis
: H0 : Kehadiran dalam kuliah dan nilai ujian akhir saling bebas H1 : Kehadiran dalam kuliah dan nilai ujian akhir memiliki hubungan searah atau berkebalikan
Statistik Uji : Untuk mendapatkan statistik uji atau koefisien korelasi peringkat Spearman, rs dilakukan prosedur yang diringkas pada tabel sebagai berikut :
3/9
A B C D E F G H I J
Kehadiran
Nilai Ujian
(Xi)
(Yi)
R(Xi)
R(Yi)
di = R(Xi) - R(Yi)
di2
13 12 15 15 10 13 15 13 16 16
53 42 70 69 32 76 73 45 58 45
4 2 7 7 1 4 7 4 9 10
5 2 8 7 1 10 9 3.5 6 3.5
–1 0 –1 0 0 –6 –2 0.5 3 6.5
1 0 1 0 0 36 4 0.25 9 42.25
d i2 93.5 Dengan menggunakan rumus rs 1
rs 1
6di2 diperoleh : n(n 2 1)
6(93.5) 1 0.567 0.433 10(102 1)
Menurut tabel di atas, data kita mempunyai ties. Sehingga akan lebih baik jika rs dihitung ulang dengan mengakomodasi ties tersebut.
x 2
33 3 103 10 2 78.5 12 12
y 2
103 10 23 2 82 12 12
Sehingga dengan rumus rs *
rs * Keputusan
x 2 y 2 di2 2 x 2 y 2
diperoleh :
78.5 82 93.5 0.418 2 (78.5)(82)
: Berdasarkan Tabel A.21 untuk hipotesis dua arah n=10 dan α=0.05 diperoleh nilai kritis 0.648. Karena nilai rs (maupun rs*) lebih kecil dari nilai kritisnya, maka hipotesis bahwa kehadiran dalam kuliah dan nilai ujian akhir saling bebas diterima.
Tau Kendall, Salah satu ukuran keeratan hubungan antar dua peubah yang popular adalah Tau Kendall (dilambangkan dengan untuk populasi atau untuk contoh). Seperti koefisien korelasi peringkat Spearman, Tau Kendall juga berdasarkan peringkat pengamatan dan nilainya berkisar pada selang –1 sampai dengan +1. Meskipun ada kesamaan antara dengan rs, keduanya memiliki perbedaan dalam hal nilai sebagai akibat adanya perbedaan dalam prosedur perhitungan. Perbedaan yang paling penting adalah bahwa merupakan penduga tidak bias bagi parameter populasi sedangkan rs bukan.
4/9
Statistik didefinisikan sebagai peluang konkordan minus peluang diskordan. Pasangan pengamatan (Xi, Yi) dan (Xj, Yj) disebut konkordan apabila perbedaan antara Xi dan Xj mempunyai arah yang sama dengan Yi dan Yj. Dengan kata lain, dikatakan konkordan apabila X i > Xj dan Yi > Yj atau Xi < Xj dan Yi < Yj. Sebaliknya, apabila arah perbedaannya tidak sama disebut diskordan. Sedangkan apabila Xi=Xj dan/atau Yi=Y j dikatakan pengamatan tersebut tidak konkordan maupun diskordan. Asumsi a.
b.
Data terdiri dari contoh acak sebanyak n pasang pengamatan, dapat berupa numerik maupun non-numerik. Setiap pengamatan berpasangan menggambarkan dua pengukuran yang diambil dari objek yang sama, disebut unit asosiasi. Skala pengukuran minimal ordinal sehingga data dapat diurutkan.
Hipotesis a. b. c.
H0 H1 H0 H1 H0 H1
: : : : : :
X dan Y saling bebas ( = 0) ≠0 X dan Y saling bebas >0 X dan Y saling bebas <0
Statistik Uji Statistik uji Tau Kendall, yang juga merupakan ukuran keeratan hubungan antar dua peubah adalah :
S n( n 1) / 2
dalam hal ini n adalah banyaknya pasangan pengamatan (X, Y). Untuk mendapatkan nilai S, lakukan prosedur berikut : 1. 2.
3. 4.
Urutkan pasangan pengamatan (Xi, Yi) dari yang terkecil hingga terbesar berdasarkan peubah X, sehingga X dikatakan dalam natural order. Bandingkan setiap nilai Y dengan nilai Y yang ada di bawahnya. Satu pasang nilai Y dikatakan konkordan (natural order) apabila nilai Y yang di bawah lebih besar daripada nilai Y yang di atas. Jika sebaliknya, katakan bahwa pasangan nilai Y adalah diskordan (reverse natural order). Nyatakan banyaknya Y yang konkordan sebagai P, dan diskordan sebagai Q. S=P–Q
Ties. Jika ada nilai yang sama (ties) baik pada peubah X maupun Y direkomedasikan untuk menghitung ulang nilai dengan prosedur sebagai berikut : 1. 2. 3.
Urutkan pengamatan secara ascending berdasarkan peubah X Dalam pengamatan X yang sama, urutkan pengamatan Y secara ascending. Hitung banyaknya pasangan nilai Y yang konkordan dan banyaknya pasangan Y diskordan. Perhatikan, jangan bandingkan nilai-nilai Y yang berada pada X yang ties.
5/9
4.
Jika terdapat banyak sekali ties, nilai dapat dihitung kembali dengan rumus :
*
S 1 2
n( n 1) Tx
1 2
n (n 1) Ty
dalam hal ini :
Tx 12 t x (t x 1)
Ty 12 t y (t y 1)
t x = banyaknya nilai pengamatan X yang ties t y = banyaknya nilai pengamatan Y yang ties Kaidah Keputusan Nilai kritis statistik Tau Kendall ditunjukkan pada Tabel A.22. Untuk setiap hipotesis yang relevan, untuk ukuran contoh n, H0 ditolak pada taraf nyata α apabila : a. b. c.
| | *( n , /2) *( n , ) *( n , )
Contoh besar. Untuk contoh berukuran besar, statistik uji yang digunakan adalah :
z
3 n( n 1) 2(2n 5)
yang menyebar normal baku. Contoh : Berikut ini adalah data tinggi (dalam cm) dan berat (dalam kg) badan beberapa mahasiswa dari suatu kelas. Hitung nilai Tau Kendall antara tinggi dan berat badan tersebut. Apakah dapat disimpulkan bahwa tinggi dan berat badan saling bebas! Tinggi
Berat
Tinggi
Berat
171 161 160 163 168 153 170 173
49 59 50 56 58 47 54 60
155 180 145 152 158 165 140 181
43 73 38 46 41 65 37 85
Hipotesis
: H0 : Tinggi dan berat badan saling babas H1 : ≠ 0
Statistik Uji : Untuk mendapatkan statistik uji atau nilai Tau Kendall dilakukan prosedur yang diringkas pada tabel sebagai berikut :
6/9
Tinggi (Terurut)
Berat
140 145 152 153 155 158 160 161 163 165 168 170 171 173 180 181
37 38 46 47 43 41 50 59 56 65 58 54 49 60 73 85
Pasangan Berat yang konkordan
Pasangan Berat yang diskordan
15 14 11 10 10 10 8 4 5 2 3 3 3 2 1 0 P = 101
0 0 2 2 1 0 1 4 2 4 2 1 0 0 0 0 Q = 19
Dari tabel di atas diperoleh S = P – Q = 101 – 19 = 82. Untuk n = 16, dapat dihitung :
82 0.683 16(16 1) / 2
Untuk n=16, α=0.05, dari Tabel A.22 diperoleh *(n,α/2)=0.383, sehingga cukup bukti untuk menyatakan ada korelasi antara tinggi dan berat badan.
Koefisien Konkordansi Kendall, W Pada suatu kesempatan kita barangkali memperingkatkan sebuah kelompok yang terdiri dari k objek atau individu berdasarkan b karakteristik. Selanjutnya kita ingin mengukur keeratan hubungan di antara b peringkat tersebut. Sebagai contoh, 10 mahasiswa diurutkan berdasarkan perolehan nilai UAS pada semester tertentu yang terdiri dari lima mata kuliah. Selanjutnya kita dapat menguji apakah di antara enam mata kuliah tersebut ada hubungan yang nyata atau tidak. Untuk tujuan tersebut kita dapat menggunakan koefisien konkordansi Kendall W. Asumsi a. Data terdiri dari b kelompok pengukuran atau pengamatan pada k objek secara lengkap. b. Skala pengukuran minimal ordinal c. Data dapat diurutkan atau dapat dikonversi kedalam data urutan. Hipotesis H0 : Tidak ada asosiasi antar karakteristik H1 : Ada korelasi antar karakteristik
7/9
Statistik Uji Koefisien konkordansi Kendall dapat dihitung dengan rumus :
W
12 kj 1R 2j 3b 2 k (k 1)2 b 2 k (k 2 1)
Dalam hal ini, b adalah banyaknya karakteristik (gugus peringkat), k adalah banyaknya pengamatan dan Rj adalah jumlah peringkat untuk objek atau individu ke-j. Jika terjadi ties, W dapat dikoreksi dengan cara mengganti penyebut pada rumus di atas dengan b 2 k (k 2 1) b(t 3 1) , dalam hal ini t adalah banyaknya ties. Kaidah Keputusan Untuk b dan k kecil dapat menggunakan tabel koefisien konkordansi Kendall (A.14). Hipotesis nol ditolak jika p-value yang ditampilkan untuk W, b, dan k kurang dari taraf nyata α yang ditetapkan. Untuk b dan k yang tidak tercantum dalam tabel A.14, kita dapat menghitung
X 2 b(k 1)W untuk kemudian dibandingkan dengan nilai pada tabel khi-kuadrat (A.11) dengan derajat bebas k – 1. Contoh : Berikut ini adalah nilai UAS 10 mahasiswa pada lima mata kuliah. Selidiki apakah ada asosisasi antar mata kuliah tersebut. Mata Kuliah Aljabar matriks Pengantar peluang Teori statistika I Metode Penarikan Contoh Perancangan Percobaan
Hipotesis
1 55 80 60 88 78
2 59 62 73 80 80
3 81 88 74 90 79
4 72 73 62 82 72
Mahasiswa 5 6 61 75 82 85 72 70 78 87 81 73
7 60 70 63 84 77
8 74 75 80 86 74
9 83 91 87 85 76
10 62 65 68 75 75
: H0 : Lima mata kuliah tidak berasosiasi H1 : Lima mata kuliah berasosisasi
Statistik Uji : Untuk mendapatkan nilai koefisien konkordansi Kendall, data nilai UAS di atas diurutkan untuk setiap mata kuliah. Hasil pengurutan adalah sebagai berikut : Mata Kuliah Aljabar matriks Pengantar peluang Teori statistika I Metode Penarikan Contoh Perancangan Percobaan Jumlah
1 1 6 1 9 7 24
2 2 1 7 3 9 22
3 9 9 8 10 8 44
8/9
4 6 4 2 4 1 17
Mahasiswa 5 6 4 8 7 8 6 5 2 8 10 2 29 31
7 3 3 3 5 6 20
8 7 5 9 7 3 31
9 10 10 10 6 5 41
10 5 2 4 1 4 16
Sehingga koefisien konkordansi Kendall adalah :
W
12(242 162 ) 3(52 )(10)(10 1)2 0.3987 (52 )(10)(102 1)
Karena untuk b=5 dan k=10 tidak tercantum dalam tabel A.14, maka digunakan hampiran khi-kuadrat :
X 2 5(10 1)(0.3987) 17.9455 Untuk derajat bebas 10 – 1 = 9 dan taraf nyata 0.05 diperoleh 2=16.919. Dengan demikian, karena X 2 2 maka hipotesis nol ditolak dan simpulkan bahwa ada asosiasi yang nyata antar lima mata kuliah tersebut.
E.O.F
CMIIW : CORRECT ME IF I AM WRONG
9/9