KOLINEARITAS GANDA (MULTICOLLINEARITY) Oleh Bambang Juanda
Model: Yi = 1 X1 + 2 X2 +…+ k Xk + εi 1. Hubungan Linear Sempurna (eksak), Jika k
C
i
X i 0
Ci konstanta yg tdk semuanya 0.
i 1
• Mudah diketahui krn tdk ada dugaan parameter koef dgn OLS, juga ragamnya. • Kolinearitas ganda hanya untuk hubungan linear. bukan, Yi (biaya)=f(output) = 0 + 1 X + 2 X2 +…+ p Xp • Karena asumsi X nonstokastik (fixed), multikolinearitas hanya fenomena sample saja.
2. Hubungan Linear Tidak Sempurna, jika : k
C X i
i
v i 0,
v i sisaan
i 1
Konsekuensinya (dan Juga mendeteksinya) : Masih bersifat Tak Bias, tapi tidak berarti ragamnya harus kecil
E ˆ i Tidak Bias, Tapi 2ˆ Besar i
Tidak bisa (sulit) memisahkan pengaruh masing -masing peubah 2 bebas,karena besar ˆ i
ˆ
Koefisien sulit diinterpretasi (Asumsi Ceteris Paribus?) R2 tinggi, tapi tidak ada (sedikit) koefisien yang nyata, bahkan tandanya bisa terbalik Koefisien korelasi sederhana atau
Note : rxi x j
R2j utk X j f X lainnya
merupakan syarat cukup bukan syarat perlu Multikolinearitas
tinggi.
2 1 ˆ Var j 2 2 x 1 R j j
VIF : Variance Inflation Factor = 1
max K min
1 1 R 2j
ˆ Kenaikan Var j karena korelasi antara peubah penjelas.
2
λ = akar ciri matriks (X`X)
Aturan praktis : kolinearitas jika K ≥ 30; atau K ≥ (VIFjmax)1/2……………(Berk 1977)
Mengatasi Kolinearitas Ganda : 1. Manfaatkan Informasi sebelumnya ( a Prior information) Mis: tingkat perubahan konsumsi (Y) terhadap perubahan kekayaan (x3) sepersepuluh dari tingkat perubahannya terhadap perubahan pendapatan (x2) β3 = 0,1 β2 Yi = 1 + 2 Xi + εi
; + Xi = X2i + 0.1 X3i
2. Mengeluarkan peubah dengan kolinearitas tinggi (Kesalahan Spesifikasi)
3. Transformasi data dengan perbedaan pertama (first differnce form) utk data time series. 4. Menggunakan PCA , Ridge Regression berbias tapi Var(i ) kecil 5. Menggabungkan data ‘cross section’ dan ‘time series” Mis :
ln Qt 1 2 ln Pt 3 ln Yt t
Karena rPY maka
Q *t ln Qt 3 ln Yt *
Q t 1 2 ln Pt 6. Penambahan data baru
2 x j i
, Misal : 3 dari SUSENAS dimana harga tidak begitu bervariasi
2 j
7. Cek kembali asumsi waktu membuat model (Mis :CRS,IRS,..komponen error) seringkali jika tidak nyata dianggap masalah kolinearitas ganda ?! Dan umumnya di pecahkan dengan mencari prosedur pendugaan
HETEROSCEDASTICITY (Heteroskedastisitas) -Sering terjadi dlm data “cross section” misal: Hubungan pendapatan & pengeluaran RT, Perusahaan -Biasanya tdk terjadi dlm data “ Time Series” -Jika Var (εi) , E (εi2)=σi2, penduga koefisien OLS tetap tak bias dan konsisten, tapi tidak efisien, bahkan Var( )OLS berbias Dlm model linear sederhana: ^
xi y xi
2
i
x ( x x i
i
i ) 2
i
E ( xi i ) E ( ) ; 2 xi
Var( ) OLS
2 2 xi
2 2 xi x 2 2 2 2 i i ci Var ( ) ci i c e i (White,1980) 2 2 2 i ( xi ) xi
Tetapi tetap inefisien dibandingkan penduga tak bias berikut ini : Mis.
i2 2 ki , 2
2 xi ki 2 2 xi
ˆ Var ( )
2 xi k i 2 xi
Jika
ki: konstanta yg tdk harus sama
2
2 xi ki 2 xi
2 xi
1 MakaVar ˆ OLSunderestimate dan thit overestimate
Mendeteksi Heteroskedastisitas
• •
Metode grafik (Y , ei 2 ) atau (x, e 2 ) diplotkan. Uji Heteroskedastisitas : 2 2 2 Ho : 1 2 ... N H1 : tergantung pendugaan yang dianggap akan menghasilkan koreksi heteroskedastisitas yang paling diinginkan.
1.
UJI PARK (Econometrica, vol 34, No. 4, 1966) menganjurkan fungsi : 2
i 2 xi e vi signifikan ? masalah pola vi? 2
Plot i dengan ei
2
2. UJI GLEJSER (seperti uji Park)
Fungsi Linear |ei| terhadap :
3.
1 1 xi , xi , , ,... xi xi
UJI Korelasi Pangkat SPEARMAN (urutan ei dan Xi)
di 2 rs n 2 rs 1 6 t( n 2) t 2 2 n(n 1) 1 rs
4. UJI GOLDFELD-QUANDT (JASS, Vol 60, 1965)
2
H1 : i cxi
2
Cara : 1. Urutkan data peubah bebas x. 2. Keluarkan d pengamatan di tengah (jika tidak ada `natural break`) misal : d= 1 N 5
3. Hitung 2 model regresi terpisah tersebut, dengan dbe=(N-d-2k)/2 4. Hitung JKS1 dan JKS2 5. Dengan asumsi masing-masing εi ~Normal,
JKS 2 F( dbe1 ,dbe ) JKS1
Note : - Jika k>2, urutkan pengamatan berdasarkan salah satu peubah bebasnya - Supaya kuasa uji tinggi (salah jenis II lebih keci), harus dengan restriksi dimana kedua model regresi tersebut mempunyai parameter koefisien yang sama
5. UJI BREUSCH-PAGAN ( Econometrica, Vol 47, 1979 ) Misal Model : Yi=α + β xi + εi 2 dengan asumsi umum: i f ( zi ) z dapat merupakan peubah bebas x atau suatu kelompok peubah bebas selain x. 2 > gunakan 2 i i untuk menghitung N > Lakukan Regresi:
i2
i2
zi vi
merupakan statistik uji yang cocok. JKR 2 ( p) 2 Jika nyata (heteroskedastisitas), koreksinya menggunakan peubah z
> Jika εi ~Normal,
6. WHITE TEST (Econometrica, Vol. 48, 1980) • •
Tidak perlu asumsi kenormalan seperti B-test. 2 Dengan asumsi umum :
i zi vi ,
dengan R2 sebagai ukuran `goodness of fit`. Jika homoskedastisitas, NR 2 2 ( p)
CARA MENGATASI (MENGOREKSI) HETEROSKEDASTISITAS
a) Jika σ2 diketahui diturunkan maximum. Note : JKS
Yi xi 2 1 2 2 (Yi xi ) ( ) i i
simpangan (pengamatan) ekstrim dpt timbangan kecil 2
x y / x /
Weighted Least Squares (MKT tertimbang); kasus khusus dari GLS, yg dpt dari fungsi kemungkinan
i
i
2
i
i
i 2
x *y * x * i
i
i
xi yi dimana xi * dan yi * i i
1 Cara Transformasi Model: Y x ... x | x | i 1 2 2i k ki i i Yi x2 i xki i 1 1 2 ... k i i i i i
Yi * 1 x1 * 2 x2i * ... k xki * i * 1 Var ( i *) 2 Var ( i ) 1 i
b. Jika σi2 tidak diketahui sering menggunakan asumsi tentang σi2 Misal Asumsi : Var(εi)=C X2i2 lakukan seperti di atas dengan transformasi: x (X2i)-1
Yi x3i xki i 1 1 2 3 ... k x2 i x2 i x2 i x2 i x2 i
Var ( i *) c
c. Dapat dengan Transformasi Log (memperkecil skala) kadangkala dapat masalah baru, seperti Spurious correlation, kolinearitas.
Teladan : Dengan OLS : Y i 0.89 0.237 xi ; R 2 0.93 ; F 252.7 (4.4) (15.9) statistik t Dengan WLS : Y 1 i
xi
* *
xi
i *
Yi 1 0.249 0.7529 ; R 2 0.76 ; F 58.7 xi xi
(21.3) (7.7) R2WLS < R2OLS jangan dianggap sebagai indikasi bahwa koreksi heteroskedastisitas kurang baik karena prosedur WLS melibatkan transformasi peubah tak bebas (Y*) Dengan indikator : JKS tidak harus 0 - 1 i Yi (0.7529 0.249 X i ) R 2 1 JKT
Yi
r
Yi Yi