BAHAN AJAR EKONOMETRIKA AGUS TRI BASUKI UNIVERSITAS MUHAMMADIYAH YOGYAKARTA
UJI MULTIKOLINEARITAS DAN PERBAIKAN MULTIKOLINEARITAS 6.1.
Uji Multikolinearitas Sebagaimana dikemukakan di atas, bahwa salah satu asumsi regresi linier klasik adalah tidak adanya multikolinearitas sempurna (no perfect multicolinearity) tidak adanya hubungan linier antara variabel penjelas dalam suatu model regresi. Istilah ini multikoliniearitas itu sendiri pertama kali diperkenalkan oleh Ragner Frisch tahun 1934. Menurut Frisch, suatu model regresi dikatakan terkena multikoliniearitas bila terjadi hubungan linier yang sempurna (perfect) atau pasti (exact) di antara beberapa atau semua variabel bebas dari suatu model regresi. Akibatnya akan kesulitan untuk dapat melihat pengaruh variabel penjelas terhadap variabel yang dijelaskan (Maddala, 1992: 269-270). Berkaitan dengan masalah multikoliniearitas, Sumodiningrat (1994: 281-182) mengemukakan bahwa ada 3 hal yang perlu dibahas terlebih dahulu: 1. Multikoliniearitas pada hakekatnya adalah fenomena sampel. Dalam model fungsi regresi populasi (Population Regression Function = PRF) diasumsikan bahwa seluruh variabel bebas yang termasuk dalam model mempunyai pengaruh secara individual terhadap variabel tak bebas Y, tetapi mungkin terjadi bahwa dalam sampel tertentu. 2. Multikoliniearitas adalah persoalan derajat (degree) dan bukan persoalan jenis (kind). Artinya bahwa masalah Multikoliniearitas bukanlah masalah mengenai apakah korelasi di antara variabel-variabel bebas negatif atau positif, tetapi merupakan persoalan mengenai adanya korelasi di antara variabelvariabel bebas. 3. Masalah Multikoliniearitas hanya berkaitan dengan adanya hubungan linier di antara variabel-variabel bebas Artinya bahwa masalah Multikoliniearitas tidak akan terjadi dalam model regresi yang bentuk fungsinya berbentuk non-linier, tetapi masalah Multikoliniearitas akan muncul dalam model regresi yang bentuk fungsinya berbentuk linier di antara variabel-variabel bebas.
1|U ji Mul tik oli nea ri ta s d an Pe rbai ka n M ul tik olin ea ritas
Multikonearitas adalah adanya hubungan eksak linier antar variabel penjelas. Multikonearitas diduga terjadi bila nilai R 2 tinggi, nilai t semua variabel penjelas tidak signifikan, dan nilai F tinggi. Konsekuensi multikonearitas: 1. Kesalahan stkitar cenderung semakin besar dengan meningkatnya tingkat korelasi antar variabel. 2. Karena besarnya kesalahan stkitar, selang keyakinan untuk parameter populasi yang relevan cenderung lebih besar. 3. Taksiran koefisian dan kesalahan stkitar regresi menjadi sangat sensitif terhadap sedikit perubahan dalam data. Konsekuensi multikearitas adalah invalidnya signifikansi variable maupun besaran koefisien variable dan konstanta. Multikolinearitas diduga terjadi apabila estimasi menghasilkan nilai R kuadrat yang tinggi (lebih dari 0.8), nilai F tinggi, dan nilai t-statistik semua atau hampir semua variabel penjelas tidak signifikan. (Gujarati, 2003) Sebagai indikasi awal, perhatikan nilai R kuadrat, F-statistik, dan tstatistik dari hasil regresi table III. Tabel III, dalam table ini merupakan kasus baru yaitu kasus negara Kertagama, dimana defenden variabelnya konsumsi dan indefenden variabelnya GNP, Subsidi dan PRM. Variabel PRM merupakan variable antah berantah yang sengaja dimasukkan dalam model dengan nilai hampir dua kali lipat dari nilai GNP untuk masing-masing periode ( disengaja agar semakin memperjelas munculnya masalah multikolinier). Tabel III, korelasi antar variable penjelas dan hasil analisis dapat dilihat dibawah ini. Bagaimana penilaian saudara? Untuk lebih pastinya, lakukan regresi antar variabel penjelas: Kasus Perhatikan nilai R kuadrat. Nilai R kuadrat jauh lebih rendah dibandingkan dengan nilai R kuadrat regresi variabel dalam level (regresi awal). Namun demikian, hal tersebut sama sekali tidak perlu dirisaukan. R kuadrat regresi persamaan dalam difference jelas jauh lebih kecil daripada R kuadrat regresi persamaan dalam level. R kuadrat kedua persamaan berbada bentuk tersebut (difference versus level) sama sekali tidak dapat dibandingkan (uncomparable). Untuk membuktikan terobatinya multikolinearitas, lakukan regresi antar variabel penjelas dalam perbedaan pertama. Jika nilai t-statistik salah satu variabel independen masih signifikan, berarti masih terdapat 2|U ji Mul tik oli nea ri ta s d an Pe rbai ka n M ul tik olin ea ritas
multikolinearitas pada persamaan tersebut. Hal sebaliknya terjadi jika nilai tstatistik tidak signifikan. Dilihat dari t statistiknya memang terdapat perbaikan dengan model regresi first difference, tetapi belum dapat menyelesaikan masalah multikoliniernya. Perintah untuk regresi antar variabel penjelas dalam perbedaan pertama: pengobatan multikolinearitas melalui perbedaan pertama, akan kehilangan informasi jangka panjang. Perbedaan pertama hanya mengandung informasi jangka pendek. Hal ini riskan apabila kita melakukan pengkajian empiris terhadap suatui teori karena teori berkaitan dengan informasi jangka panjang. Bagaimana solusinya? Klein mengajukan solusi yang kemudian disebut dengan Klein’s Rule of Thumb: Multikolinearitas tidak usah dirisaukan apabila nilai R kuadrat regresi model awal lebih besar daripada nilai R kuadrat regresi antar variabel penjelas Langkah berikutnya sebetulnya dengan menambah sample, tetapi dalam kasus ini tidak dapat dilakukan sehingga terpaksa satu variabel yaitu PRM atau GNP yang harus diamputasi dari model. Technik amputasinya dipilih variabel yang bukan variabel utama, sedangkan jika dua variabel tersebut memiliki kedudukan sejajar maka variabel yang nilai prob-valuenya yang besarlah yang diamputasi. Variabel yang diregres jangan dibuang, jika memang masih dibutuhkan, dan dijadikan regresi tunggal dengan defenden tetap variabel konsumsi. Jika model kita mengandung multikolinieritas yang serius yakni korelasi yang tinggi antar variabel independen, Ada dua pilihan yaitu kita membiarkan model tetap mengandung multikolinieritas dan kita akan memperbaiki model supaya terbebas dari masalah multikolinieritas. Tanpa Ada Perbaikan Multikolinieritas sebagaimana kita jelaskan sebelumnya tetap menghasilkan estimator yang BLUE karena masalah estimator yang BLUE tidak memerlukan asumsi tidak adanya korelasi antar variabel independen. Multikolinieritas hanya menyebabkan kita kesulitan memperoleh estimator dengan standard error yang kecil. Masalah multikolinieritas biasanya juga timbul karena kita hanya mempunyai jumlah observasi yang sedikit. Dalam kasus terakhir ini berarti kita tidak punya pilihan selain tetap menggunakan model untuk analisis regresi walaupun mengandung masalah multikolinieritas.
3|U ji Mul tik oli nea ri ta s d an Pe rbai ka n M ul tik olin ea ritas
6.2.
Perbaikan Multikolinearitas a. Menghilangkan Variabel Independen Ketika kita menghadapi persoalan serius tentang multikolinieritas, salah satu metode sederhana yang bisa dilakukakan adalah dengan menghilangkan salah satu variabel independen yang mempunyai hubungan linier kuat. Misalnya dalam kasus hubungan antara tabungan dengan pendapatan dan kekayaan, kita bisa menghilangkan variabel independen kekayaan. Akan tetapi menghilangkan variabel independen di dalam suatu model akan menimbulkan bias spesifikasi model regresi. Masalah bias spesifikasi ini timbul karena kita melakukan spesifikasi model yang salah di dalam analisis. Ekonomi teori menyatakan bahwa pendapatan dan kekayaan merupakan faktor yang mempengaruhi tabungan sehingga kekayaan harus tetap dimasukkan di dalam model. b. Transformasi Variabel Misalnya kita menganalisis perilaku tabungan masyarakat dengan pendapatan dan kekayaan sebagai variabel independen. Data yang kita punyai adalah data time series. Dengan data time series ini maka diduga akan terjadi multikolinieritas antara variabel independen pendapatan dan kekayaan karena data keduanya dalam berjalannya waktu memungkinkan terjadinya trend yakni bergerak dalam arah yang sama. Ketika pendapatan naik maka kekayaan juga mempunyai trend yang naik dan sebaliknya jika pendapatan menurun diduga kekayaan juga menurun. Dalam mengatasi masalah multikolinieritas tersebut, kita bisa melakukan transformasi variabel. Misalnya kita mempunyai model regresi time series sbb: Yt 0 1 X 1t 2 X 2t et
(6.1)
dimana : Y = tabungan; X1 = pendapatan; X2 = kekayaan Pada persamaan (6.1) tersebut merupakan perilaku tabungan pada periode t, sedangkan perilaku tabungan pada periode sebelumnya t-1 sbb: 4|U ji Mul tik oli nea ri ta s d an Pe rbai ka n M ul tik olin ea ritas
Yt 1 0 1 X 1t 1 2 X 2t 1 et 1
(6.2)
Jika kita mengurangi persamaan (6.1) dengan persamaan (6.2) akan menghasilkan persamaan sbb: Yt Yt 1 (1 X 1t 1 X 1t 1 ) ( 2 X 2t 2 X 2t 1 ) (et et 1 )
(6.3)
Yt Yt 1 1 ( X 1t X 1t 1 ) 2 ( X 2t X 2t 1 ) vt
(6.4)
dimana vt = et – et-1 Persamaan (6.4) tersebut merupakan bentuk transformasi variabel ke dalam bentuk diferensi pertama (first difference). Bentuk diferensi pertama ini akan mengurangi masalah multikolinieritas karena walalupun pada tingkat level X1 dan X2 terdapat multikolinieritas namun tidak berarti pada tingkat diferensi pertama masih terdapat korelasi yang tinggi antara keduanya. Transformasi variabel dalam persamaan (6.4) akan tetapi menimbulkan masalah berkaitan dengan masalah variabel gangguan. Metode OLS mengasumsikan bahwa variabel gangguan tidak saling berkorelasi. Namun transformasi variabel variabel gangguan vt = et – et-1 diduga mengandung masalah autokorelasi. Walaupun variabel gangguan et awalnya adalah independen, namun variabel gangguan vt yang kita peroleh dari transformasi variabel dalam banyak kasus akan saling berkorelasi sehingga melanggar asumsi variabel gangguan metode OLS. c.
Penambahan Data Masalah multikolinieritas pada dasarnya merupakan persoalan sampel. Oleh karena itu, masalah multikolinieritas seringkali bisa diatasi jika kita menambah jumlah data. Kita kembali ke model perilaku tabungan sebelumnya pada contoh 6.5. dan kita tulis kembali modelnya sbb: Yi 0 1 X 1i 2 X 2i ei
(6.5)
dimana:Y= tabungan; X1= pendapatan; X2 = kekayaan. Varian untuk 1 sbb:
5|U ji Mul tik oli nea ri ta s d an Pe rbai ka n M ul tik olin ea ritas
var( ˆ1 )
2
(6.6)
x12i (1 r122 )
Ketika kita menambah jumlah data karena ada masalah multikolinieritas antara X 1 dan X2 maka x1i2 akan menaik sehingga menyebabkan varian dari ˆ1 akan mengalami penurunan. Jika varian mengalami penurunan maka otomatis standard error juga akan mengalami penurunan sehingga kita akan mampu mengestimasi 1 lebih tepat. Dengan kata lain, jika multikolinieritas menyebabkan variabel independen tidak signifikan mempengaruhi variabel dependen melalui uji t maka dengan penambahan jumlah data maka sekarang variabel independen menjadi signifikan mempengaruhi variabel dependen. Contoh Kasus 6.1: Data perkembangan Ekspor, Konsumsi, impor, angkatan kerja dan populasi di Negara ABC sebagai berikut : Tabel 6.1. Perkembangan Ekspor, Konsumsi, impor, angkatan kerja dan populasi Tahun Eks Cons Imp 1990 468359 119802 95842 1991 556306 140805 112644 1992 632582 157484 125987 1993 671218 192959 154367 1994 737948 228119 182495 1995 794926 279876 223901 1996 855022 332094 265676 1997 921714 387171 309737 1998 1024791 647824 518259 1999 698856 813183 650547 2000 883948 856798 685439 2001 889649 1039655 831724 2002 878823 1231965 985572 2003 930554 1372078 1097662 2004 1056442 1532888 1226311 2005 1231826 1785596 1428477
AK 72574728 73845896 75104839 76349299 77575965 78783138 79970646 81141540 82301397 83457632 84616171 85779320 86947635 88123124 89307442 90501881
Pop 181436821 184614740 187762097 190873248 193939912 196957845 199926615 202853850 205753493 208644079 211540428 214448301 217369087 220307809 223268606 226254703
6|U ji Mul tik oli nea ri ta s d an Pe rbai ka n M ul tik olin ea ritas
Tahun 2006 2007 2008 2009 2010 2011 2012 2013 2014
Eks 1347685 1462818 1602275 1447012 1667918 1914268 1945064 2026120 2046740
Cons 2092656 2510504 2999957 3290996 3858822 4340605 4858331 5456626 6035674
Imp 1674125 2008403 2399966 2632797 3087057 3472484 3886665 2359212 2580527
AK 91705592 111244331 113031121 115053936 116495844 118515710 120426769 122125092 124061112
Pop 229263980 232296830 235360765 238465165 241613126 244808254 248037853 251268276 254454778
Lakukan regresi LS EKS C CONS IMP AK POP Kita peroleh hasil persamaan regresi sebagai berikut : Dependent Variable: EKS Method: Least Squares Date: 01/09/17 Time: 04:26 Sample: 1990 2014 Included observations: 25 Variable
Coefficient
Std. Error t-Statistic
Prob.
C CONS IMP AK POP
-892281.2 0.119704 0.022910 0.007369 0.005041
712567.2 -1.252206 0.049762 2.405542 0.064591 0.354693 0.006623 1.112725 0.003399 1.483299
0.2249 0.0259 0.7265 0.2790 0.1536
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.959611 0.951533 107567.9 2.31E+11 -322.3311 118.7968 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
1147715. 488609.5 26.18649 26.43026 26.25410 1.357171
7|U ji Mul tik oli nea ri ta s d an Pe rbai ka n M ul tik olin ea ritas
Dari hasil output regresi diatas dapat kita susun persamaan sebagai berikut : EKS = -892281 + 0.12*CONS + 0.023*IMP + 0.007*AK + 0.005*POP (0.0498) (0.0645) (0.0066) (0.0033) T hitung 2.4055*** 0.3546 1.1127 1.4832 2 R = 0.959 F hitung = 118.796 Konsekuensi multikearitas adalah invalidnya signifikansi variable maupun besaran koefisien variable dan konstanta. Multikolinearitas diduga terjadi apabila estimasi menghasilkan nilai R kuadrat yang tinggi (lebih dari 0.8), nilai F tinggi, dan nilai t-statistik semua atau hampir semua variabel penjelas tidak signifikan. (Gujarati, 2003) Untuk medeteksi awal apakah dalam suatu model mengandung multikolinearitas, maka tindakan awal dengan melihat estimasi nilai R 2 yang tinggi (lebih dari 0.8), nilai F tinggi, dan nilai t-statistik semua atau hampir semua variabel penjelas tidak signifikan. Dari hasil diatas dapat kita lihat R 2 tinggi, F tinggi namun sebagian besar tidak signifikan. Artinya ada kemungkinan model diatas mengandung multikolinearitas yang serius.. Uji selanjutnya, bandingkan R kuadrat regresi diatas dengan R kuadrat regresi antar variable bebasnya.
Regres LS AK IMP CONS POP C Dependent Variable: AK Method: Least Squares Date: 01/09/17 Time: 04:49 Sample: 1990 2014 Included observations: 25 Variable
Coefficient
Std. Error
t-Statistic
Prob.
IMP CONS POP C
5.078742 4.832311 0.137917 47839133
1.816942 1.255603 0.107873 21030811
2.795215 3.848599 1.278517 2.274716
0.0108 0.0009 0.2150 0.0335
R-squared
Adjusted R-squared S.E. of regression
0.964931 Mean dependent var
0.959922 S.D. dependent var 3544388. Akaike info criterion
93561606 17704591 33.14528
8|U ji Mul tik oli nea ri ta s d an Pe rbai ka n M ul tik olin ea ritas
Sum squared resid Log likelihood F-statistic Prob(F-statistic)
2.64E+14 Schwarz criterion -410.3159 Hannan-Quinn criter. 192.6086 Durbin-Watson stat 0.000000
33.34030 33.19937 1.277394
Jika kita bandingkan R12 regresi LS EKS C CONS IMP AK POP dengan R22 regresi LS AK IMP CONS POP C, maka R12 = 0.959611lebih kecil dari R22 =
0.964931, sehingga dapat disimpulkan model diatas mengandung multikolearitas. Cara menghilangkan multikonearitas : Dengan menghilangkan variable yang tidak signifikan Misal variable konsumsi kita hilangkan Regres LS EKS C IMP AK POP Dependent Variable: EKS Method: Least Squares Date: 01/09/17 Time: 05:02 Sample: 1990 2014 Included observations: 25 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C IMP AK POP
-2058947. 0.010873 0.017615 0.007095
578495.0 0.071359 0.005620 0.003646
-3.559144 0.152363 3.134436 1.946095
0.0019 0.8804 0.0050 0.0651
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.947925 0.940486 119198.4 2.98E+11 -325.5077 127.4227 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
1147715. 488609.5 26.36061 26.55563 26.41470 1.280160
Hasil regresi diatas : R kuadrat yang tinggi (lebih dari 0.8), nilai F tinggi, dan nilai t-statistik hampir semua variabel penjelas signifikan. 9|U ji Mul tik oli nea ri ta s d an Pe rbai ka n M ul tik olin ea ritas
DAFTAR PUSTAKA Agus Widarjono, Ekonometrika Teori dan Aplikasi untuk Ekonomi dan Bisnis, Edisi Kedua, Cetakan Kesatu, Penerbit Ekonisia Fakultas Ekonomi UII Yogyakarta 2007. Catur Sugiyanto. 1994. Ekonometrika Terapan. BPFE, Yogyakarta Gujarati, Damodar N. 2003. Basic Econometrics. Third Edition.Mc. Graw-Hill, Singapore. Koutsoyiannis, A (1977). Theory of Econometric An Introductory Exposition of Econometric Methods 2nd Edition, Macmillan Publishers LTD. Maddala, G.S (1992). Introduction to Econometric, 2nd Edition, Mac-Millan Publishing Company, New York. Nachrowi, D.N. dan H. Usman (2002). Penggunaan Teknik Ekonometrika. Jakarta: PT Raja Grafindo Persada. Pindyck, S and Daniel. L. Rubinfeld,” Econometrics Model and Economic Forecast, 1998, Singapore: McGraw-Hill, pp. 163-164 Sritua Arif.1993. Metodologi Penelitian Ekonomi. BPFE, Yogyakarta. Sumodiningrat, Gunawan. 2001. Ekonometrika Pengantar. Yogyakarta: PFEYogyakarta. Supranto, J. 1984. Ekonometrika. Jakarta: Lembaga Penerbit Fakultas Ekonomi Universitas Indonesia. Thomas, R.L. 1998. Modern Econometrics : An Intoduction. Addison-Wesley. Harlow, England.
10 | U j i M u l t i k o l i n e a r i t a s d a n P e r b a i k a n M u l t i k o l i n e a r i t a s