LECTURE NOTES #6 HETEROKEDASTISITAS I.
Pendahuluan Pada bagian sebelumnya telah dibahas penggunaan Ordinary Least Square untuk mengestimasi suatu garis regresi linier berganda serta prosedur inferensinya. Seperti yang diketahui jika asumsi klasik (Gauss-Markov) dipenuhi maka parameter yang diperoleh dengan teknik ini adalah bersifat Best Liniear Unbiased Estimator (BLUE). Dalam prakteknya sangat mungkin sekali satu atau lebih asumsi tersebut tidak dapat dipenuhi. Dengan demikian maka estimator OLS tidak lagi BLUE. Pada kasus yang ekstrim estimator dan/atau pengujian hipotesa bahkan tidak dapat dilakukan. Dalam bagian ini akan dibahas suatu pelanggaran asumsi klasik yang sering terjadi yakni heterokedastisitas. Pelanggaran asumsi ini terjadi ketika residual tidak lagi konstan melainkan bersifat variabel. Kita akan membahas konsep/pengertian dari heterokedastisitas dan implikasi yang ditimbulkannya. Pada beberapa kasus heterokedastisitas dapat diobservasi secara kasual (pengamatan melalui pola residual), namun sering kali tidak. Untuk itu perlu dikembangkan teknik pengujian formal berdasarkan suatu kaidah statistik. teknik deteksi dan metoda koreksi.
II.
Konsep Heterokedastisitas Salah satu asumsi penting (asumsi Gauss Markov) didalam penggunaan estimator OLS agar ia bersifat Best Liniear Unbiased Estimator (BLUE) adalah varians yang konstan. Varians dari residual tidak berubah dengan berubahnya satu atau lebih variabel bebas (Homokedastisitas). Secara grafis hal ini ditunjukkan pada grafik 1.
Grafik 1. Residual dengan Sifat Homokedastis
1
Secara formal homokedastisitas dinyatakan sbg
Var (u x1 , x2 ,..., xk ) = σ 2
………………………1)
Jika asumsi ini terlanggar maka dapat dinyatakan
Var (u x1 , x2 ,..., xk ) = σ i 2
………………………2)
Dimana indeks I menunjukkan bahwa varians berubah dari observasi ke observasi (bersifat variabel). Secara grafis hal ini ditunjukkan sbb
Grafik 2. Residual dengan Sifat Heterokedastis Terdapat beberapa alasan mengapa residual regresi dapat bersifat seperti ini, diantaranya: a. Terdapat situasi error learning, misalnya kita ingin mengetahui hubungan tingkat kesalahan mengetik terhadap berbagai variabel. Jika kita menggunakan sample yang bersifat panel/time series akan sangat mungkin model yang dimiliki akan bersifat heterokedastis. Hal ini disebabkan kesalahan pengetikan akan menurun dari waktu ke waktu dan terjadi konvergensi diantara elemen sample (kesalahan anggota sample yang paling tidak terampir akan menurun mendekati mereka yang awalnya sudah terampil). b. Peningkatan diskresi. Hal ini tampak jelas pada penelitian dengan menggunakan variabel pendapatan. Aktivitas oleh individu yang memiliki pendapatan tinggi akan jauh lebih variatif dibandingkan mereka yang berpendapatan rendah. Dengan demikian suatu model regresi dengan menggunakan variabel semacam ini akan mengalami peningkatan residual kuadrat dengan semakin besarnya pendapatan. c. Perbaikan teknik pengambilan data. Kembali hal ini relevan jika data bersifat panel (data diambil dari individu yang sama pada titik waktu berbeda-beda). Peneliti akan belajar untuk menarik informasi dengan
2
benar dengan demikian kesalahan akibat proses ekstraksi data akan semakin menurun. d. Keberadaan Outlier. Outlier adalah data yang memiliki karakteristik sangat berbeda dari kondisi yang umum. Misalnya kita memiliki suatu set data pendapatan dengan kisaran IDR 2-5 juta per bulan, keberadaan individu dengan pendapatan 100 juta dapat dikatakan outlier. e. Masalah spesifikasi. Jika model pada populasi adalah non linier (misalnya eksponensial) namun kita memaksa penggunaan model linier. Disini kuadrat residual akan meningkat dengan cepat dengan meningkatnya nilai variabel bebas. III. Implikasi Heterokedastisitas Terlanggarnya asumsi ini (disebut Heterokedastisitas) tidak menyebabkan estimator (βi) menjadi bias karena residual bukanlah komponen didalam perhitungan. Sebagai ilustrasi, kita gunakan model regresi sederhana dua variabel sbb:
y = β 0 + β1 x + u
………………………3)
Parameter model regresi dapat dihitung dengan formula sbb: n
^
β1 =
_
∑ ( x − x)( y − y) i
i =1
i
n
_
∑ ( x − x) _
2
=
Cov( x, y ) Var ( x)
i
i =1
^
_
_
β 0 = y − β1 x
………………………4)
Dapat dilihat pada persamaan 4, residual kuadrat bukanlah komponen didalam perhitungan parameter. Namun demikian heterokedastisitas menyebabkan standar error dari model regresi menjadi bias, dan sebagai konsekuensinya matriks varians-kovarians yang digunakan untuk menghitung standar error parameter menjadi bias pula. Untuk model sederhana diatas, standar error parameter dapat dihitung sbb:
3
σ2
^
V ar( β 1 ) =
n
_
∑ ( x − x) i =1
………………………5) 2
i
Dengan demikian pada asumsi heterokedastisitas dapat ditunjukkan formula yang valid bagi persamaan 5 adalah n
^
V ar( β 1 ) =
_
∑ ( x − x) σ 2
i
i =1
n
_
∑ ( x − x) i =1
2 i
………………………6) 2
i
Hasil kedua formula ini umumnya adalah berbeda, akan sama jika σi2 = σ2, suatu konstanta. Seperti yang diketahui pengujian hipotesa baik t test maupun F test sangatlah tergantung pada standar error yang benar. Dengan demikian masalah heterokedastisitas akan menyebabkan pengambilan kesimpulan berdasarkan rejection rule yang ada akan menjadi tidak valid. IV. Teknik Deteksi Kita dapat mendeteksi keberadaan heterokedastisitas melalui suatu metoda kasual, yakni mengamati pola residual kuadrat. Jika heterokedastisitas ada pada model hal ini dapat terlihat dengan adanya suatu pola tertentu pada grafik residual kuadrat.
Grafik 3. Berbagai Pola Residual Kuadrat
4
Grafik 3 menunjukkan pola-pola residual kuadrat yang mungkin sering diamati pada penelitian. Disini kita melakukan plotting residual kuadrat terhadap fitted value namun pola yang sama juga dapat diperoleh jika kita mengganti fitted valued dengan nilai observasi salah satu variabel bebas. Pola 3a. menunjukkan situasi homokedastisitas, disini residual kuadrat berada pada interval yang sama pada setiap tingkat fitted value. Sedangkan pola 3b s/d 3e menunjukkan bahwa selang residual kuadrat adalah bersifat variabel (misalnya kuadratik pada pola 3d). Kita tentunya membutuhkan suatu prosedur formal yang dapat digunakan untuk mendeteksi adanya heterokedastisitas (pengamatan kasual tidaklah mencukupi). Terdapat banyak test yang dikembangkan untuk menguji keberadaan heterokedastisitas, namun disini kita akan membahas 2 metoda yang paling popular, yakni: Breusch-Pagan Test dan White Test (lihat Gujarati, 2003 untuk jenis test lainnya). Prosedur Breusch-Pagan (1980) mengasumsikan bahwa ketika varians residual adalah tidak konstan maka ia akan berhubungan dengan satu atau lebih variabel dalam spesifikasi yang linier. Adapun langkah-langkah test dapat diuraikan sbb: a. Estimasi model, misalnya dengan k regresor sbb
y = β 0 + β1 x1 + β 2 x2 + ... + β k xk + u
………………………7)
b. Jika kita menduga bahwa model ini mengalami heterokedastisitas, maka laksanakan regresi auxiliary sbb ^2
u = δ 0 + δ1 x1 + δ 2 x2 + ... + δ k xk + v
………………………8)
^ 2
Nilai u diperoleh dari residual persamaan 7, yakni ^
^
^
^
^
u i = y − β 0 − β 1 x1 − β 2 x2 − ... − β k xk
………………………9)
c. Set up hipotesis yang digunakan disini adalah
H 0 : δ1 = δ 2 = ... = δ k =0 H1 : Paling tidak satu δ i ≠ 0
……………………10)
Hipotesis null yang digunakan adalah tidak terdapat heterokedastisitas (residual memiliki pola homokedastis). d. Hitung statistik uji Fht atau LM sbb:
5
Raux 2 / k Fht = ; 2 (1 − Raux ) /(n − k − 1)
……………………11)
LM = nRaux 2 Dimana Raux2 diperoleh dari regresi auxiliary (persamaan 8), n adalah jumlah sample dan k adalah jumlah variabel bebas (diluar intersep). e. Statistik Fht dan LM masing-masing didistribusikan mengikuti F(df : k, n-k-1) dan Chi Square, χ2 (df=k). Dengan demikian kita dapat menggunakan salah satu criteria rejection rule: nilai kritis atau p value pada α yang relevan (misalnya 5% atau 1%). Jika hipotesis null tidak dapat ditolak, maka dapat disimpulkan bahwa model regresi yang dimiliki tidak mengalami masalah heterokedastisitas (paling tidak jika ia berbentuk linier). Sedangkan penolakan terhadap hipotesis null memberikan indikasi bahwa model mengalami heterokedastisitas dan perlu dilakukan koreksi. Contoh 1: Dengan menggunakan data Hprice1.raw, kita akan melakukan estimasi model regresi linier yang menghubungkan harga rumah (price) terhadap variabel lotsize, sqrft dan bdrms. Hasil regresi yang dilakukan diberikan pada tabel 1. Dependent Variable: PRICE Method: Least Squares Date: 06/08/08 Time: 10:00 Sample: 1 88 Included observations: 88 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C LOTSIZE SQRFT BDRMS
-21.77031 0.002068 0.122778 13.85252
29.47504 0.000642 0.013237 9.010145
-0.738601 3.220096 9.275093 1.537436
0.4622 0.0018 0.0000 0.1279
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.672362 0.660661 59.83348 300723.8 -482.8775 2.109796
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
293.5460 102.7134 11.06540 11.17800 57.46023 0.000000
Tabel 1. Print Output Regresi Contoh 1
6
Kita akan menggunakan prosedur Breusch-Pagan untuk mendeteksi keberadaan heterokedastisitas. Untuk itu kita mentabulasikan dahulu residual dari regresi diatas dengan nama u dan melakukan regresi auxiliary residual kuadrat terhadap seluruh variabel bebas. Ketika ini dilaksanakan hasil yang diperoleh adalah Dependent Variable: U^2 Method: Least Squares Date: 06/08/08 Time: 10:01 Sample: 1 88 Included observations: 88 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C LOTSIZE SQRFT BDRMS
-5522.795 0.201521 1.691037 1041.760
3259.478 0.071009 1.463850 996.3810
-1.694380 2.837961 1.155198 1.045544
0.0939 0.0057 0.2513 0.2988
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.160141 0.130146 6616.646 3.68E+09 -896.9860 2.351111
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
3417.316 7094.384 20.47695 20.58956 5.338919 0.002048
Tabel 2. Auxiliary Regression Contoh 1 Dengan demikian nilai F atau LM dapat dihitung dengan cara
1.601/ 3 ≈ 5.34 (1 − 1.601) /(84) LM = (88)(1.601) ≈ 14.09 Fht =
……………………12)
Nilai p value terkait dengan Fht dan LM adalah masing-masing 0.02 dan 0.028, dan keduanya dibawah 5%. Dengan demikian hasil test menunjukkan model regresi mengalami heterokedastisitas. White (1980) melakukan evaluasi terhadap pola-pola residual kuadrat serta mengkaitkannya dengan asumsi Gauss Markov: Homokedastisitas. Dalam analisisnya tersebut ia berkesimpulan bahwa asumsi ini dapat diperlunak dengan menyatakan bahwa residual kuadrat tidak berkorelasi dengan seluruh variabel bebas (xj), kuadrat variabel bebas (x2j) dan cross product (xjxh dimana j≠h).
7
Preposisi ini dapat diuji melalui model regresi auxiliary berikut ^2
u = δ 0 + δ1 x1 + ... + δ k xk + δ k +1 x12 + ... + δ k + k xk 2 + δ k + k +1 x1 x2 + ... + δ k + k + C xk −1 xk + error
……………………13)
dimana C = kombinasi 2 dari pilihan k Adapun set up hipotesis yang digunakan adalah
H 0 : δ1 = δ 2 = ... = δ k + k +C =0 H1 : Paling tidak satu δ m ≠ 0 (m=1,...,k+k+C)
……………………14)
Rejection rule dilakukan dengan menggunakan statistik F atau LM dengan perhitungan sebagaimana diberikan pada persamaan 11. Pengujian sebagaimana diuraikan diatas memiliki kelemahan karena memakan banyak degree of freedom. Disini terlalu banyak parameter yang diestimasi, sebagai contoh dengan model hanya 3 variabel kita akan mengestimasi 9 parameter (=3+3+3). Untuk itu Wooldridge (2005) menyarankan modifikasi dengan menggunakan fitted value, ingat bahwa fitted value dapat diperoleh dengan cara ^
^
^
^
^
y i = β 0 + β 1 x1i + β 2 x2i + ... + β k xki
……………………15)
dimana i adalah observasi. Dengan demikian kita dapat memodifikasi persamaan 13 menjadi ^2
^
^2
u = δ 0 + δ1 y + δ 2 y + error
……………………16)
Rejection rule terhadap null hipotesis δ1=δ1=0 dapat dilakukan dengan menggunakan statistik F atau LM dengan perhitungan sebagaimana diberikan pada persamaan 11. Contoh 2. Masih dengan menggunakan data pada contoh 1, disini kita mengganti prosedur Breusch-Pagan dengan White test. Prosedur White Test dapat
8
diakses pada sub menu output hasil regresi (tabel 1), menu View, Residual Test, White Heterocedasticity (cross terms). Hasil yang diperoleh diberikan oleh tabel 3. White Heteroskedasticity Test: F-statistic Obs*R-squared
5.386953 33.73166
Prob. F(9,78) Prob. Chi-Square(9)
0.000010 0.000100
Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/09/08 Time: 08:45 Sample: 1 88 Included observations: 88 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C LOTSIZE LOTSIZE^2 LOTSIZE*SQRFT LOTSIZE*BDRMS SQRFT SQRFT^2 SQRFT*BDRMS BDRMS BDRMS^2
15626.24 -1.859507 -4.98E-07 0.000457 0.314647 -2.673918 0.000352 -1.020860 -1982.841 289.7541
11369.41 0.637097 4.63E-06 0.000277 0.252094 8.662183 0.001840 1.667154 5438.483 758.8303
1.374411 -2.918719 -0.107498 1.649673 1.248135 -0.308689 0.191484 -0.612337 -0.364595 0.381843
0.1733 0.0046 0.9147 0.1030 0.2157 0.7584 0.8486 0.5421 0.7164 0.7036
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.383314 0.312158 5883.814 2.70E+09 -883.3955 2.052712
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
3417.316 7094.384 20.30444 20.58596 5.386953 0.000010
Tabel 3. White Heterocedasticity Test Seperti yang dapat dilihat pada tabel 3, prosedur yang ada pada Eviews menggunakan spesifikasi persamaan 13. Baik F maupun LM test menunjukkan hipotesis null homokedastisitas dapat ditolak. Dengan demikian sejalan dengan Breusch-Pagan Test, White Test juga mengindikasikan model mengalami heterokedastisitas.
9
Suatu catatan terkait dengan pengujian heterokedastisitas perlu diberikan disini. Dari pembahasan penyebab heterokedastisitas diketahui bahwa fenomena ini dapat terjadi karena masalah misspesifikasi bentuk fungsional. Disisi lain uji yang telah dipelajari mengasumsikan bahwa pola heterokedastisitas adalah linier terhadap variabel bebas. Dengan demikian Wooldridge (2005) menyarankan untuk melakukan uji spesifikasi terdahulu terhadap model sebelum melakukan uji heterokedastisitas. Uji heterokedastisitas dilakukan jika bentuk fungsional model sudah benar. V.
Prosedur Koreksi Jika pada suatu model regresi terdeteksi heterokedastisitas maka standar error dari regresi menjadi bias. Sebagai konsekuensinya seluruh tipe uji hipotesis (parsial dan exclusion) menjadi menyesatkan. Untuk itu perlu dilakukan koreksi terhadap model. Terdapat 2 tipe koreksi yakni (1) koreksi terhadap standar error regresi dan (2) Generalized Least Square/GLS. Tipe koreksi yang pertama dilakukan hanya terbatas pada standar error regresi. Tidak ada modifikasi atau estimasi ulang atas parameter yang diperoleh dari OLS. Koreksi terhadap standar error regresi dilakukan melalui prosedur yang diuraikan oleh White (1980) dan dikenal dengan nama Heterocedasticity Robust Standard Error. Uraian bagaimana koreksi dilakukan terhadap varians error model regresi bersifat sangat teknis, dan kita tidak akan membahasnya. White (1980) menunjukkan bahwa suatu standar error yang bersifat robust terhadap heterokedastisitas (yang bahkan bersifat unknown form) dapat dihitung dengan formulas sbb: n
^
V ar( β j ) =
∑r
^ 2 ij
i =1 n
ui _
∑ ( x − x) i =1
^
^2
; 2
i
……………………17)
^
SE ( β j ) = V ar( β j ) ^2
dimana r ij menunjukkan residual ke i dari regresi variabel xj terhadap seluruh variabel independen lainnya. Dengan diperolehnya standar error yang robust terhadap heterokedastisitas (persamaan 17) maka perhitungan statistik uji t dapat dilakukan dengan menggantikan standar error OLS semula dengan formula yang baru ini.
10
Hampir semua paket software ekonometrika/statistik telah memasukkan Heterocedasticity Robust Standard Error kedalam routine yang dimilikinya. Namun demikian perhitungan exclusion test dan overall significance test bersifat jauh lebih rumit dan kita tidak akan membahasnya. Bagi pembaca yang tertarik dapat merujuk pada Wooldrige hal 253-254. Contoh 3. Dengan menggunakan data pada GPA3.raw, kita akan mengestimasi regresi cumgpa terhadap sat, hsperc, tothrs, female, black dan white. Dengan menggunakan prosedur biasa diperoleh hasil pada tabel 4 Dependent Variable: CUMGPA Method: Least Squares Date: 06/09/08 Time: 08:54 Sample: 1 732 IF SPRING=1 Included observations: 366 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C SAT HSPERC TOTHRS FEMALE BLACK WHITE
1.470065 0.001141 -0.008566 0.002504 0.303433 -0.128284 -0.058722
0.229803 0.000179 0.001240 0.000731 0.059020 0.147370 0.140990
6.397063 6.388504 -6.906003 3.425510 5.141165 -0.870486 -0.416497
0.0000 0.0000 0.0000 0.0007 0.0000 0.3846 0.6773
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Prob(F-statistic)
0.400560 0.390542 0.469286 79.06233 -238.9029 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic
2.334153 0.601126 1.343732 1.418372 39.98208
Tabel 4. Print Out Regresi Contoh 3. Model ini mengalami masalah heterokedastisitas. Hal ini dapat dilihat melalui pengujian White Heterocedasticity Test, dimana baik nilai p value maupun F, menunjukkan dengan sangat kuat bahwa hipotesis null homokedastisitas adalah ditolak. White Heteroskedasticity Test: F-statistic Obs*R-squared
3.629836 71.81422
Prob. F(23,342) Prob. Chi-Square(23)
0.000000 0.000001
11
Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/09/08 Time: 10:05 Sample: 1 732 IF SPRING=1 Included observations: 366 Collinear test regressors dropped from specification Variable
Coefficient
Std. Error
t-Statistic
Prob.
C SAT SAT^2 SAT*HSPERC SAT*TOTHRS SAT*FEMALE SAT*BLACK SAT*WHITE HSPERC HSPERC^2 HSPERC*TOTHRS HSPERC*FEMALE HSPERC*BLACK HSPERC*WHITE TOTHRS TOTHRS^2 TOTHRS*FEMALE TOTHRS*BLACK TOTHRS*WHITE FEMALE FEMALE*BLACK FEMALE*WHITE BLACK WHITE
0.748114 -0.000930 6.85E-07 -8.15E-07 -6.69E-06 -0.000232 0.000798 0.000342 -0.007883 7.75E-05 -5.63E-06 -0.000903 0.001311 0.004146 -0.000258 5.05E-05 -0.000609 -0.003979 -0.002024 0.190255 -0.045258 0.127827 -0.433255 -0.305580
1.006458 0.001461 6.21E-07 5.94E-06 3.76E-06 0.000303 0.000810 0.000722 0.008268 3.74E-05 2.69E-05 0.002409 0.005295 0.004907 0.006853 1.73E-05 0.001214 0.005439 0.005387 0.432399 0.319959 0.305694 0.896341 0.821256
0.743314 -0.636818 1.102059 -0.137065 -1.779145 -0.767388 0.985402 0.473846 -0.953522 2.069623 -0.209662 -0.375028 0.247640 0.845006 -0.037671 2.921279 -0.502005 -0.731463 -0.375695 0.439999 -0.141450 0.418152 -0.483360 -0.372089
0.4578 0.5247 0.2712 0.8911 0.0761 0.4434 0.3251 0.6359 0.3410 0.0392 0.8341 0.7079 0.8046 0.3987 0.9700 0.0037 0.6160 0.4650 0.7074 0.6602 0.8876 0.6761 0.6291 0.7101
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Prob(F-statistic)
0.196214 0.142158 0.323101 35.70277 -93.41635 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic
0.216017 0.348846 0.641619 0.897530 3.629836
Tabel 5. White Heterocedasticity Test Contoh 3. Dengan demikian perlu dilakukan koreksi terhadap standar error dari parameter. Hasil yang diperoleh dari prosedur ini diberikan oleh tabel 6. 12
Dependent Variable: CUMGPA Method: Least Squares Date: 06/09/08 Time: 08:55 Sample: 1 732 IF SPRING=1 Included observations: 366 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable
Coefficient
Std. Error
t-Statistic
Prob.
C SAT HSPERC TOTHRS FEMALE BLACK WHITE
1.470065 0.001141 -0.008566 0.002504 0.303433 -0.128284 -0.058722
0.220680 0.000192 0.001418 0.000741 0.059138 0.119241 0.111392
6.661516 5.955817 -6.041464 3.380845 5.130949 -1.075833 -0.527163
0.0000 0.0000 0.0000 0.0008 0.0000 0.2827 0.5984
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Prob(F-statistic)
0.400560 0.390542 0.469286 79.06233 -238.9029 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic
2.334153 0.601126 1.343732 1.418372 39.98208
Tabel 6. Reestimasi Contoh 3 dengan Heterocedasticity Robust Standard Error Generalized Least Squares (GLS) adalah prosedur koreksi heterokedastisitas dengan cara melakukan transformasi dan reestimasi. Jika kita mengetahui bentuk spesifik dari heterokedastisitas (misalnya linier terhadap variabel bebas) maka kita dapat memodifikasi nilai variabel tergantung dan variabel bebas sesuai dengan bentuk heterokedastisitas dan mengestimasinya kembali. Salah satu bentuk yang paling sering digunakan dalam mengasumsikan heterokedastisitas adalah multiplicative constant, yakni
Var (u x) = σ 2 h( x)
……………………18)
dimana x menyatakan seluruh variabel bebas dan h(x) adalah suatu fungsi dari variabel bebas yang menentukan heterokedastisitas. Dengan demikian heterokedastisitas dalam asumsi ini dapat dinyatakan sebagai
σ 2i = Var (ui xi ) = σ 2 h( xi ) = σ 2 hi
……………………19)
13
Selanjutnya kita dapat melakukan transformasi atas model awal yang mengalami heterokedastisitas, yakni
yi = β 0 + β1 x1i + β 2 x2i + ... + β k xki + ui
……………………20)
menjadi suatu model dengan residual yang homokedastisitas. Hal ini dapat dilakukan dengan membagi seluruh regressor dan regresand dengan hi (disebut dengan penimbang/bobot). Dapat ditunjukkan disini residual model hasil transformasi, yakni
( ) ( h ) + (u / h )
)
yi / hi = β 0 / hi + β1 x1i / hi + β 2 x2i / hi + ...
(
+ β k xki /
i
i
……………………21)
i
atau y *i = β 0 x *0i + β1 x *1i + β 2 x *2i +... + β k x *ki +u *i memiliki pola homokedastis, atau
(
Var (u *i ) = Var (ui / hi ) = E ⎡ ui / hi ⎢⎣ = E ( ui ) / hi = σ 2 hi / hi = σ 2
) ⎤⎥⎦ 2
2
……………………22)
Transformasi ini adalah suatu kelas khusus dari GLS yang disebut weighted least squares (WLS). Standar error hasil regresi yang ditransformasi (persamaan 21) adalah tidak bias dan dengan demikian prosedur pengujian (t dan F test) menjadi valid. Tidak ada yang berubah dalam formula perhitungan dan rejection rule, kita tetap menggunakan standar intrepretasi regresi linier berganda. Disamping itu meskipun kita melakukan transformasi terhadap model regresi, intrepretasi koefisien tetap dilakukan seperti regresi awal. Contoh 4 Dengan menggunakan data saving.raw, kita akan mengestimasi hubungan tingkat simpanan rumah tangga (sav) terhadap pendapatan (inc), ukuran RT (size), pendidikan (educ), usia (age) dan ras (black). Hasil estimasi awal dirangkum pada tabel Dependent Variable: SAV Method: Least Squares Date: 06/10/08 Time: 07:04
14
Sample: 1 100 Included observations: 100 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C INC SIZE EDUC AGE BLACK
-1605.416 0.109455 67.66119 151.8235 0.285722 518.3934
2830.707 0.071432 222.9642 117.2487 50.03108 1308.063
-0.567143 1.532304 0.303462 1.294885 0.005711 0.396306
0.5720 0.1288 0.7622 0.1985 0.9955 0.6928
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.082775 0.033987 3228.598 9.80E+08 -946.7804 1.594808
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
1582.510 3284.902 19.05561 19.21192 1.696615 0.142998
Tabel 7. Print Out Regresi Contoh 4 Selanjutnya jika kita menduga bahwa heterokedastisitas terjadi dengan mengambil bentuk linier terhadap inc (σ2i=σ2 inc) maka transformasi dilakukan dengan menggunakan akar kuadrat inc sebagai bobot. Pada Eviews hal ini dilakukan melalui sub menu output/estimate/option isikan opsi Weighted LS/TSLS dengan (inc)^-0.5. Hasil yang diperoleh adalah pada tabel 8. Dependent Variable: SAV Method: Least Squares Date: 06/10/08 Time: 07:06 Sample: 1 100 Included observations: 100 Weighting series: (INC)^-0.5 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C INC SIZE EDUC AGE BLACK
-1854.814 0.100518 -6.868501 139.4802 21.74721 137.2842
2351.797 0.077251 168.4327 100.5362 41.30598 844.5941
-0.788680 1.301184 -0.040779 1.387363 0.526491 0.162545
0.4323 0.1964 0.9676 0.1686 0.5998 0.8712
Weighted Statistics R-squared
0.104200
Mean dependent var
1364.931
15
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.056551 2686.849 6.79E+08 -928.4125 1.598984
S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
2675.843 18.68825 18.84456 2.186836 0.062100
Unweighted Statistics R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat
0.077644 0.028582 3237.617 1.578383
Mean dependent var S.D. dependent var Sum squared resid
1582.510 3284.902 9.85E+08
Tabel 8. Weighted Least Squares Contoh 4 Seperti yang dapat dilihat pada tabel 8, terjadi perubahan signifikan pada nilai koefisien. Namun demikian jika model ini memang benar mengalami heterokedastis, maka nilai koefisien pada tabel 8 adalah lebih valid. Ada kalanya teori maupun pertimbangan ilmiah tidak memberikan dukungan untuk mengasumsikan suatu pola heterokedastisitas tertentu. Jika ini terjadi maka kita harus mengestimasi bentuk dari h(xi) dan mentransformasikan model awal dengan nilai estimasi dari h(xi). Prosedur ini disebut Feasible GLS (FGLS) atau Estimated GLS (EGLS). Kita tidak akan membicarakan landasan teoritis penggunaan FGLS, pembaca yang tertarik dapat merujuk pada Wooldridge, 2005 (hal 266-267). Adapun prosedur FGLS dapat diuraikan sebagai berikut: ^ 1. Regresikan model awal (persamaan 20) dan peroleh residual,u i . ^ 2
2. Buat series log (u i) . ^ 3. Estimasi regresi auxiliary berikut dan peroleh nilai g i ^2
log(u ) = δ 0 + δ1 x1 + ... + δ k xk + e ^2
^
^
^
^
g i = log(u ) = δ 0 + δ 1 x1i + ... + δ k xki ^
4. Hitung hi dimana ^
^
h i = exp( g i )
^
5. Transformasi persamaan 20 dengan bobot 1/ hi .
16
Contoh 5. Dengan menggunakan data smoke.raw akan diestimasi regresi cigs terhadap log(income), log(cigpric), educ, age, age^2 dan restaurn. Hasil yang diperoleh dirangkum pada tabel 9. Dependent Variable: CIGS Method: Least Squares Date: 06/10/08 Time: 08:51 Sample: 1 807 Included observations: 807 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C LOG(INCOME) LOG(CIGPRIC) EDUC AGE AGE^2 RESTAURN
-3.639823 0.880268 -0.750862 -0.501498 0.770694 -0.009023 -2.825085
24.07866 0.727783 5.773342 0.167077 0.160122 0.001743 1.111794
-0.151164 1.209519 -0.130057 -3.001596 4.813155 -5.176494 -2.541016
0.8799 0.2268 0.8966 0.0028 0.0000 0.0000 0.0112
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.052737 0.045632 13.40479 143750.7 -3236.227 2.012825
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
8.686493 13.72152 8.037737 8.078448 7.423062 0.000000
Tabel 9. Print Out Regresi Contoh 5 Dengan melaksanakan prosedur FGLS sebagaimana diuraikan diatas, diperoleh hasil sbb: Dependent Variable: CIGS Method: Least Squares Date: 06/10/08 Time: 08:59 Sample: 1 807 Included observations: 807 Weighting series: (H)^-0.5 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C LOG(INCOME) LOG(CIGPRIC)
5.635471 1.295239 -2.940314
17.80314 0.437012 4.460145
0.316544 2.963855 -0.659242
0.7517 0.0031 0.5099
17
EDUC AGE AGE^2 RESTAURN
-0.463446 0.481948 -0.005627 -3.461064
0.120159 0.096808 0.000939 0.795505
-3.856953 4.978378 -5.989706 -4.350776
0.0001 0.0000 0.0000 0.0000
Weighted Statistics R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.113409 0.106760 11.69611 109439.1 -3126.188 2.049719
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
7.158227 11.66855 7.765025 7.805736 17.05549 0.000000
Unweighted Statistics R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat
0.045739 0.038582 13.45421 2.011453
Mean dependent var S.D. dependent var Sum squared resid
8.686493 13.72152 144812.7
18