Pengertian Multikolinearitas Secara historis multikolinearitas menunjukkan hubungan yang sempurna antara variabel-variabel independent λ1 X 1 + λ2 X 2 + . . . + λk X k = 0
(1)
λ1 , λ2 , . . . , λk adalah konstanta-konstanta yang tidak semuanya sama dengan nol. Dewasa ini, istilah multikolinearitas digunakan untuk hubungan yang tidak sempurna juga λ1 X 1 + λ2 X 2 + . . . + λk X k + ν i = 0 Dengan νi adalah suku error random/stokastik.
Persamaan [4] menunjukkan bahwa X2 mempunyai relasi linear yang tidak eksak linear dengan semua variabel independent lainnya karena adanya suku stokastik (−1/λ2 )νi .
TJ
Multicol.
Contoh Multikolinearitas Table 1: Tabel Kolinear
X2 10 15 18 24 30
X3 50 75 90 120 150
X3∗ 52 75 97 129 152
Tabel 1 di atas memperlihatkan bahwa X3i = 5X2i . Berarti ada kolinearitas sempurna antara X2 dan X3 karena r23 = 1. X3∗ diperoleh dengan menambahkan angka random 2,0,7,9,2 pada X3 . Sekarang kita mempunyai X3i∗ = 5X2i + νi yang bukan merupakan kolinearitas sempurna. Namun koefisien korelasi antara X3 dan X3∗ adalah 0.9959, yang merupakan korelasi yang kuat. TJ
Multicol.
Multikolinearitas
TJ
Multicol.
Multikolinearitas
TJ
Multicol.
Relasi Non Linear Pembahasan tentang multikolinearitas hanya memperhitungkan hubungan linear antara variabel-variabel independen. Hubungan non-linear tidak diperhitungkan. Contoh hubungan non-linear Yi = β0 + β1 Xi + β2 Xi2 + β3 Xi3 + ui Variabel-variabel Xi2 dan Xi3 jelas terhubung dengan Xi namun hubungannya tidak bersifat linear.
TJ
Multicol.
(5)
Apa akibat multikolinearitas? Mengapa Classical Linear Regression Model (CLRM) mengasumsikan ketiadaan multikolinieritas? Jika multikolinearitas sempurna. Koefisien regresi dari variabel-variabel independent menjadi indeterminate dan standard errornya tak berhingga. Jika multikolinearitas tidak sempurna. Walaupun koefisien regresi determinate namun standard errornya besar, sehingga koefisien regresi tersebut tidak mempunyai akurasi yang baik.
TJ
Multicol.
Alasan munculnya multikolinearitas? 1
2
3
4
5
Metode pengambilan data. Sampling tidak dilakukan dengan baik. Multikolinearitas yang muncul dari model itu sendiri. Pada waktu menyusun model, orang memilih variabel-variabel yang secara natural berkaitan satu sama lain. Misalnya, regresi antara penggunaan listrik terhadap income dan ukuran rumah. Namun biasanya ada kaitan antara income dan ukuran rumah. Semakin besar incomenya, semakin besar pula ukuran rumah. Spesifikasi model. Misalnya menambahkan suku-suku polinomial terutama jika range dari X kecil Model yang berlebihan. Jumlah variabel independen lebih banyak dari jumlah observasi. Trend yang serempak pada variabel independen. Biasanya muncul pada data-data time series di mana variabel-variabel independen-nya mempunya common trend. Yang satu naik, yang lain ikut naik. Atau sebaliknya. TJ
Multicol.
MENGAPA INDETERMINATE? Dua variabel independen: yˆi = βˆ1 + βˆ2 x2i + βˆ3 x3i + uˆi P P P 2 ) − ( y x )( x2i x3i ) y x )( x i 3i i 2i 3i P 2 P 2 P βˆ2 = ( x2i )( x3i ) − ( x2i x3i )2 P P P P ( yi x3i )( x2i2 ) − ( yi x2i )( x2i x3i ) ˆ P P P β3 = ( x2i2 )( x3i2 ) − ( x2i x3i )2 (
P
Apa yang terjadi jika X3i = λX2i ?
TJ
Multicol.
(6)
(7) (8)
MENGAPA INDETERMINATE? Misalkan X3i = λX2i maka dapat dibuktikan bahwa 0 βˆ2 = 0
(9)
0 βˆ3 = 0
(10)
TJ
Multicol.
MENGAPA INDETERMINATE? Mengapa kita memperoleh hasil yang indeterminate? Ingat arti dari βˆ2 , yaitu merupakan laju perubahan Y ketika X2 berubah sebanyak satu unit dengan menjaga X3 tetap konstant. Tetapi jika X2 dan X3 kolinear secara sempurna, maka mustahil untuk menjaga X3 tetap konstan apabila X2 dirubah nilainya. Jika X2 berubah, maka X3 juga berubah dengan faktor λ Artinya? Tidak mungkin untuk memisahkan pengaruh X2 dan X3 pada sampel yang tersedia.
TJ
Multicol.
Bagaimana jika multikolinearitas tidak sempurna? βˆ2 dan βˆ3 dapat dihitung. Standard error besar, sehingga hasilnya tidak akurat. Confidence interval lebih lebar Harga-t cenderung tidak signifikan, tetapi R 2 dapat sangat tinggi Estimasi koefisien regresi dan standard error dapat menjadi sangat sensitif terhadap perubahan kecil pada data. Pertanda multikolinearitas yang paling kelihatan: R 2 tinggi, H0 ditolak berdasarkan F-test, tetapi harga-t ternyata tidak signifikan.