NILAI MAKSIMUM DARI KOEFISIEN KORELASI Hangga Mula Kurnia1*, Firdaus2, Sigit Sugiarto2
[email protected] 1
Mahasiswa program Studi S1 Matematika 2 Dosen Jurusan Matematika FMIPA-UR Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Riau Kampus Binawidya Pekanbaru (28293), Indonesia
ABSTRACT The strength and dependence between variables is a central problem that we want to know on a lot of research. At the time of perfectly correlation occurs sometimes in some cases the value of size is not reached 1 . In this article discusses the methods used to obtain the maximum value of the correlation measure. The method are simple method, using the Expectation, and model of Association. Keywords : Analysis Correlation, Contingency Table, Maximum Value, Technique Correlation of Contingency Coefficient
1. PENDAHULUAN Korelasi berarti hubungan timbal balik. Dua buah variabel dikatakan berkorelasi apabila setiap perubahan pada satu variabel selalu diikuti dengan perubahan variabel lain dan masing-masing perubahan terjadi secara proporsional. Sedangkan analisa korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik pengukuran asosiasi. Kekuatan dan sifat ketergantungan antar variabel merupakan masalah pokok yang ingin diketahui pada banyak penelitian. Indeks yang mengkuantifikasi hubungan antar variabel disebut ukuran asosiasi [6]. Tak ada satu ukuran asosiasi pun yang mampu menggambarkan suatu model asosiasi dengan sempurna. Dalam aplikasinya, interpretasi tentang asosiasi sempurna, sedang, dan lemah berbeda antara satu ukuran asosiasi dan ukuran asosiasi lainnya, sekalipun memiliki persamaan rentang indeks (misalnya dari 0 sampai dengan 1). Apabila dikelompokkan, tingkatan nilai korelasi dapat dilihat pada tabel berikut [4]
1
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi
2
Tabel 1.1 Tingkatan nilai koefisien korelasi Interval nilai r
Tingkat hubungan
0 r 0.2
Sangat rendah
0.2 r 0.4
Rendah
0.4 r 0.6
Sedang
0.6 r 0.8
Kuat
0.8 r 1
Sangat kuat
Dalam memilih indeks asosiasi perlu dipertimbangkan beberapa hal khusus, yaitu jenis data, hipotesis penelitian, serta sifat-sifat ukuran asosiasi. Tidak dianjurkan untuk menghitung semua indeks asosiasi tetapi kemudian hanya melaporkan indeks yang memberi gambaran hubungan yang paling mengesankan. Ukuran kekuatan hubungan dua variabel berskala nominal yang sering dijumpai adalah pengembangan dari statistik chi square yang biasa dilambangkan dengan 2 . Statistik ini sebenarnya bukan merupakan indeks yang akurat untuk mengukur hubungan antara variabel [6]. Akan tetapi karena uji independensi 2 banyak dipakai sehingga para matematikawan terdorong untuk mengembangkan ukuran asosiasi berdasarkan statistik 2 . Untuk memperkecil pengaruh ukuran sampel, derajat bebas, dan untuk menjaga rentang besaran nilai koefisien asosiasi tidak melebihi 0 dan 1 maka statistik chi square mengalami berbagai macam modifikasi. Modifikasi tersebut yakni Koefisien Phi, Koefisien Kontingensi, dan Koefisien V Cramer [6].
2. ANALISA KORELASI DAN EKSPEKTASI BERSYARAT 2.1 Tabel Kontingensi Tabel kontingensi merupakan barisan bilangan-bilangan asli dalam bentuk matrik yang bilanganbilangan tersebut mewakili jumlah atau frekuensi dari data yang diamati [5]. Banyak data hasil pengamatan yang dapat digolongkan ke dalam beberapa faktor, variabel, karakteristik, atau atribut terdiri dari beberapa klasifikasi, kategori, golongan atau mungkin tingkatan. Berdasarkan hasil pengamatan terhadap fenomena tersebut akan diselidiki mengenai asosiasi atau hubungan antara variabel itu. Bentuk paling sederhana dari tabel kontingensi disebut juga dengan dikotomi yakni tabel kontingensi yang berukuran 2 2 . Dalam bentuk umum, misalkan terdapat sampel acak berukuran f. Pada setiap pengamatan diduga terjadi karena adanya dua macam variabel, yaitu variabel A dan variabel B. variabel A terbagi atas c taraf atau tingkatan dan demikian juga dengan
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi
3
variabel B terbagi atas r taraf [5]. Banyakya pengamatan yang terjadi karena taraf ke i pada variabel A ( i =1,2,3, . . c ) dan taraf ke j pada variabel B ( j =1,2,3, . . r ) akan dimisalkan dengan fij. Hasilnya dapat dinyatakan dalam tabel kontingensi berukuran r c berikut ini : Tabel 2.1 Tabel kontingensi berukuran r c Variabel A Variabel B
A1
A2
Ac
Total
B1
f 11
f12
f 1.
B2
f 21
f 22
f c1 f c2
Br
f1r
f 2r
f rc
f r.
Total
f .1
f .2
f .c
f
f 2.
Jumlah dari baris ke i dinyatakan dengan :
f i. f i1 f i 2 f ic c
f ij
(1)
j 1
Jumlah dari kolom ke j dinyatakan dengan :
f . j f1 j f 2 j f rj r
f ij i 1
(2)
Demikian pula : r
c
f .. f ij i 1 j 1 r
c
i 1
j 1
f .. f i. f . j (3)
2.2 Uji Statistik Teknik uji chi square ( chi dibaca kai ) ditemukan oleh helmet pada tahun 1990 dan pertama kali diperkenalkan oleh Karl Pearson [7]. Oleh karena itu kebanyakan di dalam penggunaannya
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi
4
sering dinamakan dengan Pearson Chi Square ( 2 ) . Uji ini digunakan untuk menguji kebebasan antara dua variabel yang disusun dalam tabel r c atau menguji keselarasan di mana pengujian dilakukan untuk memeriksa ketergantungan dan homogenitas dari data sampel yang diambil untuk menunjang hipotesis yang menyatakan bahwa populasi asal sampel tersebut mengikuti distribusi yang telash ditetapkan. Ada beberapa hal yang perlu diperhatikan dalam penggunaan 2 pada tabel kontingensi, yaitu [7] : 1. 2 digunakan untuk menganalisa data yang berbentuk frekuensi, 2. Tidak dapat digunakan untuk menentukan besar atau kecilnya korelasi dari variabelvariabel yang dianalisa, 3. Pada dasarnya belum dapat menghasilkan kesimpulan yang memuaskan, 4. Cocok digunakan untuk data kategorik,data diskrit atau data nominal. Terdapat dua keadaan ketika mengambil suatu keputusan yang salah, yakni apabila H0 benar terjadi kesalahan dengan menolak H0. Keadaan selanjutnya adalah kesalahan ketika menerima H0 ketika H0 salah. Hal ini dijelaskan dalan definisi berikut Definisi 2.2.1 [ 5:hal. 78] Tipe kesalahan pertama adalah menolak suatu hipotesis nol yang benar. Definisi 2.2.2 [ 5:hal. 78] Tipe kesalahan kedua adalah menerima suatu hipotesis nol yang salah. Untuk menghitung nilai statistik 2 data telebih dahulu diajukan hipotesis untuk mengetahui hubungan antara kedua variabel, maka hipotesis yang diuji berdasarkan data pada tabel 2.1, yaitu :
H 0 : tidak terdapat hubungan yang positif antara variabel A dan variabel B
H 1 : terdapat hubungan positif yang signifikan antara variabel A dan variabel B Pengujian secara eksak sulit untuk digunakan, maka akan dilakukan pengujian yang bersifat pendekatan. Untuk itu diperlukan frekuensi teoretis atau banyaknya gejala yang diharapkan terjadi ( eij ) [6], dengan rumus :
eij
f i . f. j f
f i. jumlah data pada baris ke i f . j jumlah data pada kolom ke j
(4)
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi
5
Nilai f i . dan f . j diperoleh dengan menggunakan (1) dan (2). Dengan demikian misalnya didapat nilai teoretis dari masing-masing data, yaitu :
f1. f .1 f f f e12 1. .2 f e11
e21
f 2. f .1 f
e22
f 2. f .2 f
dan seterusnya … jelas bahwa jumlah data pengamatan dinyatakan dengan :
f f1. f 2. f r. f .1 f .2 f .c Selanjutnya nilai statistik 2 digunakan untuk menguji hipotesis yang diajukan sebelumnya berdasarkan data tabel kontingensi berukuran r c .Untuk menentukan 2 tabel kontingensi berukuran r c digunakan rumus umum berikut [6] : r
c
ht 2
f
i 1 j 1
eij
2
ij
eij
(5)
ht Chi Square hitung 2
f ij frekuensi yang diamati eij frekuensi yang diperoleh (hasil dari rumus (4)) i 1,2,, r j 1,2,, c
Hasil dari penghitungan ht selanjutnya dibandingkan dengan tabel dengan derajat kebebasan 2
2
(df) adalah r 1c 1 sehingga dapat diambil kesimpulan. Apabila harga ht hitung sama atau 2
lebih besar dari ( r 1( c 1) tabel maka hipotesa nol ( H 0 ) 2
ditolak dan hipotesa alternatif ( H 1 )
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi
6
2 diterima. Apabila harga ht lebih kecil dibandingkan ( r 1( c 1) tabel maka ( H 0 ) diterima dan ( H 1 ) 2
ditolak [8]. 2.3 Ekspektasi Bersyarat Definisi 2.3.1 Ekspektasi [2:hal. 61] Misalkan X adalah variabel random dengan fungsi densitas f x , maka ekspektasi dari X yang dinotasikan dengan E X didefinisikan dengan : n
E ( X ) x f ( x ) jika X diskrit x 1
E( X )
xf ( x)dx
jika X kontinu
Definisi 2.3.2 Ekspektasi bersyarat [2:hal. 180] Misalkan X dan Y adalah variabel random distribusi gabungan, maka ekspektasi bersyarat X bila diketahui Y y yang dinotasikan dengan E ( X y) didefinisikan dengan E ( X y) x f x y , jika X dan Y diskrit x
E X y x f x y dx , jika X dan Y kontinu x
Teorema 2.3.3 [3:hal. 150] Misalkan X dan Y variabel random kontinu, (i) Jika a konstanta maka E (a) a (ii) Jika a konstanta maka E (aX ) aE ( X ) Bukti Dari definisi 2.4.1 maka diperoleh
(i) E (a) a f ( x)dx a f ( x)dx a □
(ii) E (aX ) ax f ( x)dx a x f ( x)dx aE ( X ) □ 2.4 Teknik Korelasi Koefisien Kontingensi Dalam memilih teknik korelasi perlu diperhatikan jenis data yang diteliti karena setiap jenis data berbeda teknik korelasi yang dipakai. Berikut ini pemakaian teknik korelasi berdasarkan jenis data yang diteliti
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi
7
Tabel 2.5 Pemakaian teknik korelasi berdasarkan jenis data yang diteliti jenis data Nominal Ordinal Interval/Rasio
teknik korelasi teknik korelasi koefisien kontingensi teknik korelasi Spearman Rank teknik korelasi Kendall Tau teknik korelasi Produk momen teknik korelasi Parsial teknik korelasi Ganda
Kegunaan teknik korelasi koefisien kontingensi adalah untuk mencari atau menghitung keeratan hubungan antara dua variabel yang mempunyai gejala ordinal (kategori), atau paling tidak berjenis nominal [7]. Koefisien kontingensi (C) disebut juga koefisien bersyarat. Koefisien kontingensi memiliki pengertian yang sama dengan koefisien korelasi. Misalnya hasil penelitian dihasilkan dalam bentuk tabel r c dan jika C bernilai nol berarti tidak ada hubungan, akan tetapi batas atas C tidak bernilai satu tergantung atau sebagai fungsi banyaknya kategori (baris atau kolom). Untuk menghitung koefisien kontingensi digunakan rumus : C
2
(6)
2 f
3. NILAI MAKSIMUM DARI KOEFISIEN KORELASI Data yang diuji menggunakan 2 belum dapat menghasilkan kesimpulan yang memuaskan maka dari itu perlu dilakukan uji lanjutan [9]. Hal ini karena pengujian menggunakan tidak dapat menentukan besar atau kecilnya korelasi dari variabel-variabel yang dianalisa. Maka dari itu 2
dilakukan pengujian dengan menggunakan pengembangan dari uji kontingensi.
2
yakni koefisien
Pada pengujian dengan menggunakan koefisien kontingensi, bentuk yang dipakai mengalami modifikasi sehingga dapat disesuaikan dengan metode yang dibahas pada bab ini. Dengan menyederhanakan (5) apabila ditambah dengan f maka diperoleh 2
n
f ij2
n
f 2
i 1 j 1
n
eij n
f i 1 j 1
f ij2 f i. f . j
(7)
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi
8
dengan menarik akar dari bentuk (6) maka diperoleh C2
2
(8)
2 f
kemudian subtitusi (7) ke (8) menjadi n
f ij2
n
f C 2
f i. f . j
i 1 j 1 n
n
f i 1 j 1
1
f
f ij2 f i. f . j
1 n
n
f i 1 j 1
(9)
f ij2 f
i. . j
Nagres Abbasi [1] mengemukakan cara menentukan batas atas minimum dari bentuk n
n
f i 1 j 1
f ij2
(10)
f
i. . j
Pada skripsi ini dibahas metode yang dikemukakan Nagres Abbasi untuk menentukan batas atas minimum dari bentuk (10) pada tabel kontingensi berukuran n n . 3.1 Model Sederhana Dalam penggunaan metode sederhana bisa dilakukan pada tabel kontingensi r c maupun n n . Dengan menggunakan metode sederhana akan ditentukan nilai C dari tabel kontingensi berukuran n n , misalkan untuk n 2 . Tabel 3.1 Tabel kontingensi berukuran 2 2
Variabel B
Variabel A
Total
A1
A2
B1
f 11
f12
B2
f 21
f 22
f 1. f 2.
Total
f .1
f .2
f
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi
f11 f f f , b 12 , p 11 , dan q 21 f .1 f .2 f 1. f 2. dari permisalan nilai a, b, p, dan q terlihat bahwa 0 a, b, p, q 1 Dengan menguraikan bentuk (10) Misalkan a
n
f ij2
n
f i 1 j 1
i.
2
f. j
f ij2
2
i 1 j 1
2
2
i 1 j 1
f i. f . j
f ij f ij f i. f . j
2 f f f f i1 i1 i 2 i 2 f i. f .2 i 1 f i . f .1
f f f f f f f f 11 11 12 12 21 21 22 22 f1. f .2 f 2. f .1 f 2. f .2 f1. f .1 pa 1 p b q1 a 1 b1 q
p q a b 1
pa 1 n
f ij2
n
f i 1 j 1
2
i. f . j
dengan mensubtitusikan nilai yang diperoleh ke bentuk (9) maka
1
C2 1
2
2
f i 1 j 1
f ij2
1 1 1 2 2 C
1
2
f
i. . j
9
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi
10
dengan menarik bentuk akar dari C diperoleh dua nilai koefisien kontingensi yakni 2 2 dan C . Data yang diteliti merupakan data yang berkorelasi positif sehingga C 2 2 2 nilai yang diambil adalah nilai C . Diperoleh koefisien kontingensi untuk tabel 3.1 2 C 0.707 . Nilai korelasi ini dikategorikan kuat karena nilainya berada dalam kategori ke empat pada tabel 2.1 0.6 C 0.8 . Untuk tabel kontingensi dengan ukuran tabel r c , (10) diuraikan menjadi r
f ij2
c
f i 1 j 1
i.
r
f. j
c
i 1 j 1
f ij f ij f i. f . j
r f f f f f f i1 i1 i 2 i 2 ic ic f i. f .2 f i . f .c i 1 f i . f .1
r
c
f i 1 j 1
f ij2 i.
f. j
f f f f f f f f f f 11 11 12 12 1c 1c 21 22 2c 2c f1. f .1 f1. f .2 f1. f .c f 2. f 2. f 2. f .c
f f f f f f r1 r1 r 2 r 2 rc rc f 2. f .2 f r . f .c f r. f r.
(11)
3.2 Menggunakan Ekspektasi Batas atas minimum dari bentuk (10) juga dapat dihitung dengan menggunakan ekspektasi, yang dinyatakan dalam bentuk n
f ij2
n
f i 1 j 1
n
n
f
i. . j
i 1 j 1
f ij f ij f i. f . j n
berdasarkan definisi ekspektasi bersyarat 2.4.2 maka dapat dinyatakan
j 1
bentuk ekspektasi EB A Ai , sehingga n
n
i 1 j 1
n f ij E B A Ai f f . j i 1 .j
f ij f ij
f
i.
karena f ij f . j maka nilai
f ij f. j
1
f ij
f
i.
menjadi
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi
11
f ij n E B A A (1) ,berdasarkan teorema 2.4.3 maka E B A Ai i i 1 f . j i 1 n
n
1 i 1
n
Dengan mensubtitusikan nilai yang diperoleh ke (9), maka untuk setiap tabel kontingensi berukuran n n nilai maksimum koefisien kontingensinya dapat dinyatakan dengan n 1 C (12) n 3.3 Model Asosiasi Nilai minimum dari 2 terjadi ketika dua variabel random yang diteliti saling bebas dan nilai maksimum dari 2 dari kedua variabel berkorelasi sempurna. Hal ini dapat dilihat apabila nilai korelasinya mendekati satu. Pada kasus ini dua variabel kuantitas terdapat hubungan linier dengan peluang sama dengan satu. Dua variabel random dengan PY aX b 1 . Tentunya pilihan nilai dari X dan Y harus sama. Model asosiasi ini pada faktor kualitas dinyatakan dengan f f jj n f jumlah data pada tabel kontingensi n ukuran tabel kontingensi dengan syarat i j atau f ij f ij 1 f i. f . j untuk i j 1,2,3,, n
(13)
apabila diuraikan (13) menjadi
f f f f f f f f f11 f11 f12 f12 1n 1n 2 n 2 n 3n 3n nn nn 1 f1. f .1 f1. f .2 f1. f .n f 2. f .n f 3. f .n f n. f . n
(14)
untuk i j f ij f ij f i. f . j
0
(15)
Hangga Mula Kurnia et.al. – Nilai Maksimum dari Koefisien Korelasi
12
apabila (15) diuraikan menjadi
f f f f f f f f f11 f11 f12 f12 1n 1n 2 n 2 n 3n 3n nn nn 0 f1. f .1 f1. f .2 f1. f .n f 2. f .n f 3. f .n f n. f .n
(16)
Maka nilai maksimum dari (10) dengan menggunakan model asosiasi adalah n. [1]
DAFTAR PUSTAKA Abbasi, Nagres. 2008. On Maximum Value of Correlation Coefficient. Department of Statistics Payame Noor University. 34, 1655-1658.
[2]
Bain, L.J and Engelhardt, Max. 1992. Introduction to Probability and matematical Statistics. 2nd ed. Duxbury Press. Belmon, California.
[3]
Bradlow Thomas, Eric. G.S.Hardie, Bruce & S.fader, Peter. 2002. Bayesian Inference for the Negative Binomial Distribution via Polynomial Expansion. Journal of Computational and Graphical Statistics. Vol.11. pp 189-201.
[4]
Burhanuddin, Muhammad. 2012. Koefisien Korelasi, Signifikansi, dan Determinasi. 28 Juni 2012. http://alvinburhani.wordpress.com/2012/06/28/koefisien-korelasi-signifikansi-determinasi/, 17 Desember 2012. Pk.10.30, Conover, W. J. 1980. Practical Nonparametric Statistic. John Wiley & Sons, New York.
[5] [6] [7] [8] [9]
Everit, B.S. 1992. The Analysis of Contingency Tables. Chapman & Hall. Second Edition, London. Sarah, Mahdia. 2011. Pemodelan Regresi Nonparametrik dengan B-Spline dan Mars. http://repository.usu.ac.id/handle/123456789/29996, 23 Desember 2012. Pk 09.00, Sudjana. 1996. Metoda Statistika. PT Tarsito. Bandung. Zuliana, S.U. 2009. Metode Statistika Lanjut. 42 hal. http://images.dedi1968.multiply.multiplycontent.com/attachment/0/SNSPdgoKCEEAAC4 3Iic1/2.Lilliefors%26Tabel%2520Kategorik.pdf?key=dedi1968:journal:70&nmid=116333 237, 18 Juni 2012. Pk. 13.02,