Koefisien Korelasi Spearman
Lain halnya dengan koefisien korelasi product-moment Pearson, korelasi Spearman dapat digunakan untuk data berskala minimal ordinal untuk kedua variabel yang hendak diperiksa korelasinya. Langkah pertama yang dilakukan untuk menghitung koefisien korelasi Spearman adalah mengurutkan data masing-masing variabel dari data terkecil sampai dengan data terbesar. Apabila Xi < Xj, harus berlaku rank(Xi) < rank(Xj), dengan rank(Xi) menyatakan peringkat/ranking dari data Xi. Berikut ini adalah pedoman untuk memberikan peringkat pada data. Misalkan diketahui n buah pasangan data (X1,Y1), (X2, Y2), …, (Xn,Yn). Apabila berlaku Xi ≠ Xj untuk setiap i ≠ j (baca: setiap nilai data X tunggal), peringkat terendah yang diberikan adalah 1 dan peringkat tertinggi yang diberikan adalah n. Demikian pula apabila Yi ≠ Yj untuk setiap i ≠ j (baca: setiap nilai data Y tunggal), peringkat terendah yang diberikan adalah 1 dan peringkat tertinggi yang diberikan adalah n. Apabila ada dua atau lebih data bernilai sama, akan berlaku peringkat terendah ≥1 dan peringkat tertinggi ≤ n. Untuk memperingkas pembahasan, yang akan diuraikan di sini adalah cara memberikan peringkat untuk variabel X. Pemberian peringkat untuk variabel Y dilakukan dengan cara yang sama. Apabila ada dua atau lebih data yang bernilai sama, pemeringkatan dilakukan dengan cara berikut: Langkah 1 (Penomoran data). Berikan nomor mulai nomor 1, 2, 3, dst. sampai dengan n (bukan peringkat) pada data Xi dengan ketentuan n(i) < n(j) jika dan hanya jika Xi ≤ Xj, dengan i, j = 1, 2, …, n dan n(i) menyatakan nomor untuk data Xi, n(j) nomor untuk data Xj. Catatan: apabila Xi = Xj diberikan keleluasaan untuk memberlakukan n(i) < n(j) atau n(j) < n(i). Langkah 2 (Pengurutan data). Definisikan untuk i = 1, 2, 3, …, n: X’i = Xω (ω = 1, 2, 3, …, n) sedemikian hingga n(ω) = i. Langkah 3 (Pemberian peringkat). Tinjau urut-urutan bilangan X 1′ , X 2′ , X 3′ , L , X n′ . Pemberian peringkat untuk k1 buah data pertama dalam ditentukan sebagai berikut: Tentukan nilai k1 sebesar-besarnya sedemikian hingga X 1′ = X 2′ = L = X k′1 . Untuk setiap Xi yang bernilai sama dengan X’1, tetapkan
k1
rank ( X i ) =
∑i i =1
k1
. Selanjutnya, tentukan nilai k2 sebesar-besarnya sedemikian hingga
X k′1 +1 = X k′1 + 2 = L = X k′1 + k 2 . Untuk setiap Xi yang bernilai sama dengan X k′1 +1 tetapkan k2
rank ( X i ) =
∑ (k i =1
1
+ i)
. Begitu pun selanjutnya, tentukan nilai k3 sebesar-besarnya sedemikian
k2
hingga X k′1 + k2 +1 = X k′1 + k2 + 2 = L = X k′1 + k 2 + k3 . Untuk setiap Xi yang bernilai sama dengan k3
rank ( X i ) =
X k′1 + k 2 +1 tetapkan
∑ (k i =1
1
+ k2 + i)
. Lanjutkan proses ini dengan pola serupa,
k3
sampai semua Xi memiliki peringkat. Contoh: Perhatikan kelompok pasangan data berikut. i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Xi
37
45
37
37
45
53
65
71
65
75
65
80
65
80
65
Yi
90
53
52
53
67
71
72
90
41
52
45
63
67
90
88
Langkah 1 dan Langkah 2 dapat diringkaskan pada tabel berikut.
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Xi
37
45
37
37
45
53
65
71
65
75
65
80
65
80
65
n(i) 2
4
1
3
5
6
7
12
8
13
9
14
11
15
10
X’i
37
37
45
45
53
65
65
65
65
65
71
75
80
80
37
Langkah 3: k1 = 3 karena X’1 = X’2 = X’3 = 37. Perhatikan bahwa X1 = X3 = X4 = 37 sehingga rank ( X 1 ) = rank ( X 3 ) = rank ( X 4 ) =
1+ 2 + 3 = 2. 3
k2 = 2 karena X’4 = X’5 = 45. Perhatikan bahwa X2 = X5 = 45 sehingga rank ( X 2 ) = rank ( X 5 ) =
4+5 = 4,5 . 2
k3 = 1. Dalam hal ini X6 = X’6 =53 sehingga rank ( X 6 ) =
6 = 6. 1
k4 = 5 karena X’7 = X’8 = X’9 = X’10 = X’11 = 65. Perhatikan bahwa X7 = X9 = X11 = X13 = X15 sehingga rank ( X 7 ) = rank ( X 9 ) = rank ( X 11 ) = rank ( X 13 ) = rank ( X 15 ) = k5 = 1. Dalam hal ini X8 = X’12 =71 sehingga rank ( X 8 ) =
7 + 8 + 9 + 10 + 11 =9 5
12 = 12 . 1
k6 = 1. Dalam hal ini X10 = X’13 =75 sehingga rank ( X 10 ) =
13 = 13 . 1
k7 = 2 karena X’14 = X’15 = 80. Perhatikan bahwa X12 = X14 = 80 sehingga rank ( X 12 ) = rank ( X 14 ) =
14 + 15 = 14,5 . 2
Hasil pemberian peringkat itu dapat disajikan secara ringkas dalam tabel berikut: i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Xi
37
45
37
37
45
53
65
71
65
75
65
80
65
80
65
X’i
37
37
37
45
45
53
65
65
65
65
65
71
75
80
80
2
4,5 6
9
12
9
13
9
14,5 9
Rank 2
4,5 2
14,5 9
(Xi)
Pemberian peringkat untuk Yi dilakukan secara serupa, dan hasilnya dapat dilihat pada tabel berikut: i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Yi
90
53
52
53
67
71
72
90
41
52
45
63
67
90
88
Y’i
41
45
52
52
53
53
63
67
67
71
72
88
90
90
90
5,5 3,5 5,5 8,5 10
11
14
1
3,5
2
7
8,5 14
12
Rank 14 (Yi)
Yang menjadi input untuk menghitung koefisien korelasi Spearman adalah rank masing-masing data. Jadi, yang menjadi input untuk contoh di atas adalah sebagai berikut.
i
Rank(Xi) Rank(Yi)
1
2
14
2
4,5
5,5
3
2
3,5
4
2
5,5
5
4,5
8,5
6
6
10
7
9
11
8
12
14
9
9
1
10
13
3,5
11
9
2
12
14,5
7
13
9
8,5
14
14,5
14
15
9
12
Setelah mengurutkan data, langkah selanjutnya adalah menentukan di = rank(Xi) – rank(Yi), untuk selanjutnya dipergunakan dalam rumus: n
rs = 1 −
6∑ d i2 i =1
n3 − n
Jadi, untuk nilai rs untuk contoh di atas dihitung (untuk sementara) sebagai berikut.
di 2
i
Xi
Yi
Rank(Xi)
Rank(Yi)
di
1
37
90
2
14
-12
144
2
45
53
4,5
5,5
-1
1
3
37
52
2
3,5
-1,5
2,25
4
37
53
2
5,5
-3,5
12,25
5
45
67
4,5
8,5
-4
16
6
53
71
6
10
-4
16
7
65
72
9
11
-2
4
8
71
90
12
14
-2
4
9
65
41
9
1
8
64
10
75
52
13
3,5
9,5
11
65
45
9
2
7
12
80
63
14,5
7
7,5
56,25
13
65
67
9
8,5
0,5
0,25
14
80
90
14,5
14
0,5
0,25
15
65
88
9
12
-3
9
90,25 49
Jumlah
468,50
n
rs = 1 −
6∑ d i2 i =1 3
n −n
= 1−
6 ⋅ 468,50 ≈ 0,16 15 3 − 15
Apabila proporsi nilai ganda (baik untuk Xi maupun Yi) cukup besar, perlu dilakukan gx
(
)
gy
(
koreksi bagi rs. Faktor-faktor koreksi tersebut adalah Tx = ∑ t xi − t xi dan Ty = ∑ t yi − t yi i =1
3
i =1
3
)
dengan gx adalah banyaknya pengelompokan nilai-nilai ganda yang berbeda bagi rank(Xi), gy adalah banyaknya pengelompokan nilai-nilai ganda yang berbeda bagi rank(Yi), t xi adalah banyaknya peringkat ganda dalam pengelompokan ke-i variabel X, dan t yi adalah banyaknya peringkat ganda dalam pengelompokan ke-i variabel Y. Untuk contoh di atas, gx = 4 karena ada 4 kelompok nilai ganda yang berbeda bagi rank(Xi), yaitu 2, 41/2, 9, dan 14 1/2. Demikian pula gy = 4 karena ada 4 kelompok nilai ganda yang berbeda bagi rank(Yi), yaitu 3 1/2, 5 1/2, 8 1
/2, dan 14. Penghitungan Tx dan Ty sebagai berikut: Tx = (33 – 3) + (23 – 2) + (53 – 5) + (23 –
2) = 156, Ty = (23 – 2) + (23 – 2) + (23 – 2) + (33 – 3) = 42. Dengan faktor koreksi, rumus rs menjadi:
rs =
(n (n
3
3
)
− n − 6∑ d i2 − (Tx + T y ) 2
)
n
i =1
(
)
− n − (Tx + T y ) n 3 − n + TxT y 2
Pada di atas, n3 – n = 153 – 15 = 3360, Tx + Ty = 156 + 42 = 198, dan TxTy = 6552 sehingga rs menjadi:
rs =
3360 − 6 ⋅ 468,5 − 198 / 2 3360 2 − 198 ⋅ 3360 + 6552
≈ 0,14
Apabila rs diperoleh dari hasil sampling, fluktuasi sampling perlu dipertimbangkan dalam memeriksa apakah ada hubungan di antara kedua variabel yang sedang ditinjau. Karena itu, perlu dilakukan uji hipotesis H0: tak ada hubungan antara X dan Y melawan H1: ada hubungan antara X dan Y (kasus uji dua sisi) atau H1: ada hubungan positif (atau negatif) antara X dan Y (kasus uji satu sisi). Perlu ditegaskan di sini jangan menuliskan hipotesis H0:
ρs = 0 melawan H1: ρs ≠ 0 karena ρs = 0 tidak dapat memberikan kesimpulan bahwa kedua variabel saling bebas (independent) kecuali kedua varibel berdistribusi normal. Cara pengujian hipotesis tersebut harus dibedakan menurut banyaknya sampel. Apabila n ≤ 50, gunakan Tabel Nilai Kritis rs. Apabila n > 50 hipotesis nol dapat diuji dengan statistik z = rs n − 1 . Untuk n > 50 statistik tersebut berdistribusi mendekati normal baku. Jadi, untuk contoh di atas, apabila digunakan taraf nyata α = 0,05 dengan H0: tak ada hubungan antara X dan Y melawan H1: ada hubungan antara X dan Y kita tak boleh menolak H0 karena nilai kritis rs untuk n = 15 dengan α = 0,05 adalah 0,521 (> rs = 0,14). Apabila rs ≥ 0,521, H0 ditolak pada taraf nyata 0,05 dan kita simpulkan ada hubungan di antara X dan Y; pernyataan tersebut signifikan pada taraf nyata 0,05. Andaikan hasil rs = 0,14 diperoleh dengan banyaknya sampel 80 buah, menurut uraian di atas, untuk memeriksa signifikansi rs digunakan statistik z. Jadi, z = 0,14√(15-1) ≈ 0,52. Dari tabel luas daerah di bawah kurva normal baku, diperoleh bahwa z0,025 = 1,96 sehingga nilai statistik z jatuh di daerah penolakan H0 dengan taraf nyata 0,05 apabila dilakukan uji dua sisi. Dalam hal ini kita simpulkan ada hubungan signifikan antara X dan Y.