REGRESI LINIER SEDERHANA Model fungsi :
Y = f (X) LAHIR = F (WUS)
LAHIR, yaitu data jumlah kelahiran setahun lalu di sejumlah Kecamatan di Jateng WUS, yaitu data jumlah wanita usia subur di sejumlah Kecamatan di Jateng Dependent Variable: LAHIR Method: Least Squares Date: 10/17/12 Time: 22:39 Sample: 1 21 Included observations: 21 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-128.2673
124.0071
-1.034354
0.3140
WUS
0.050203
0.007701
6.518797
0.0000
R-squared
0.691030
Mean dependent var
650.2857
Adjusted R-squared
0.674769
S.D. dependent var
268.1692
S.E. of regression
152.9343
Akaike info criterion
12.98829
Sum squared resid
444389.3
Schwarz criterion
13.08777
F-statistic
42.49471
Prob(F-statistic)
0.000003
Log likelihood
-134.3770
Durbin-Watson stat
2.437122
HASIL INI TIDAK SIGNIFIKAN DALAM HAL KONSTANTA, SEHINGGA DIPERBAIKI MODELNYA MENJADI MODEL REGRESI TANPA KONSTANTA
Dependent Variable: LAHIR Method: Least Squares Date: 10/17/12 Time: 22:45 Sample: 1 21 Included observations: 21 Variable
Coefficient
WUS
0.042531
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
0.673632 0.673632 153.2013 469412.8 -134.9522
Std. Error
t-Statistic
0.002076
20.48508
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat
Prob. 0.0000 650.2857 268.1692 12.94783 12.99757 2.364382
1
REGRESI LINIER BERGANDA MODEL FUNGSI ADALAH :
Y = f (X1, X2, X3.....Xn) Y = KWH, pemakaian listrik dalam triwulan 1 tahun 2003 X1 = LUAS, yaitu luas wilayah desa X2 = PENDUDUK, banyaknya orang tinggal di desa X3 = KEPALA KELUARGA, banyaknya keluarga di desa X4 = JTM, jaringan tegangan menengah X5 = JTR, jaringan tegangan rendah X6 = PELANGGAN, banyaknya pengguna listrik X7 = DAYA, yaitu besarnya kekuatan listrik yang digunakan
Dependent Variable: KWH Method: Least Squares Date: 10/17/12 Time: 22:17 Sample: 1 58 Included observations: 58 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-414.0713
6043.637
-0.068514
0.9457
LUAS
0.114815
0.516969
0.222092
0.8251
PELANGGAN
15.34951
15.87184
0.967091
0.3382
PENDUDUK
0.306840
1.854892
0.165422
0.8693
KEPALA_KELUARGA
1.957205
1.735093
1.128012
0.2647
JTR JTM
-0.156272 -0.184593
0.282735 0.955581
-0.552716 -0.193173
0.5829 0.8476
DAYA
393.6333
18.13101
21.71050
0.0000
R-squared
0.982831
Mean dependent var
155426.7
Adjusted R-squared
0.980428
S.D. dependent var
128553.2
S.E. of regression
17984.63
Akaike info criterion
22.55986
Sum squared resid
1.62E+10
Schwarz criterion
22.84406
Log likelihood Durbin-Watson stat
-646.2361 2.142101
F-statistic Prob(F-statistic)
408.9014 0.000000
HASIL MENUNJUKKAN BAHWA BANYAK VARIABEL INDEPENDEN YANG TIDAK BERPENGARUH NYATA TERHADAP VARIABEL DEPENDEN. MODEL DAPAT DIPERBAIKI DENGAN CARA BACKWARD ANALYSIS, SEHINGGA DIPEROLEH HANYA VARIABEL INDEPENDEN YANG BERPENGARUH NYATA SAJA YANG MASUK DALAM FUNGSI. Dependent Variable: KWH Method: Least Squares Date: 10/17/12 Time: 23:12 Sample: 1 58 Included observations: 58 Variable
Coefficient
Std. Error
t-Statistic
Prob.
DAYA
417.6971
4.755119
87.84157
0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
0.981760 0.981760 17361.93 1.72E+10 -647.9921
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat
155426.7 128553.2 22.37904 22.41456 2.008668
2
UJI DIAGNOSTIC PLOT REGRESI HISTOGRAM DAN NILAI STATISTIK DESKRIPTIF RESIDUAL DARI OBYEK MODEL REGRESI “FORECAST”. TERLIHAT BAHWA RESIDUAL TIDAK TERDISTRIBUSI NORMAL (PERIKSA NILAI JARQUE-BERA), SEHINGGA MODEL HARUS MENTRANSFORMASIKAN VARIABEL DEPENDEN, MISALNYA DENGAN METODA TRANSFORMASI BOX-COX.
CATATAN : dengan melihat hasil uji diagnostic di atas, terlihat bahwa ada autokorelasi dalam residu, sehingga untuk peramalan yang baik, perlu dipertimbangkan untuk “mengeluarkan” 2 data yang outlier, yang dapat dilihat dari gambar scatter seperti di bawah ini. Selain itu, pertimbangan lain adalah dengan mentransformasikan data variabel dependen, melalui Metoda Transformasi Box-Cox agar data sebarannya menjadi normal.
Gambar diagnostic plot dari regresi (periksa, ada outlier pada scatter)
3
UJI ASUMSI KLASIK : UJI AUTOKORELASI RESIDUAL DATA DARI AUTOCORRELATION.WF1 (Bab 5 buku rujukan pertama). MODEL :Y = F (X) Y adalah indeks kompensasi riil per jam Amerika Serikat, 1959-1998, dg tahun dasar 1992 X adalah output per jam dari sektor bisnis Amerika Serikat,1959-1998, dg tahun dasar 1992. Dependent Variable: Y Method: Least Squares Date: 10/18/12 Time: 06:15 Sample: 1959 1998 Included observations: 40 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C X
29.51925 0.713659
1.942347 0.024105
15.19773 29.60658
0.0000 0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.958449 0.957356 2.675533 272.0220 -95.09761 0.122904
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
85.64500 12.95632 4.854881 4.939325 876.5495 0.000000
HASIL ANALISIS : D-W MENUNJUKKAN NILAI 0.122904. Sehingga dL = 1.442 dan dU=1.544. (untuk n=40 dan k=1). Kesimpulannya terdapat Autokorelasi serial, pada order 1. Oki, harus diuji dengan Breusch Godfrey LM (BGLM). Breusch-Godfrey Serial Correlation LM Test: F-statistic Obs*R-squared
48.70865 32.27057
Probability Probability
0.000000 0.000000
Test Equation: Dependent Variable: RESID Method: Least Squares Date: 10/18/12 Time: 06:32 Presample missing value lagged residuals set to zero. Variable
Coefficient
Std. Error
t-Statistic
Prob.
C X RESID(-1) RESID(-2) RESID(-3)
0.274567 -0.004240 1.001553 -0.090229 -0.012490
0.926831 0.011683 0.174512 0.246372 0.190092
0.296242 -0.362966 5.739175 -0.366233 -0.065707
0.7688 0.7188 0.0000 0.7164 0.9480
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.806764 0.784680 1.225495 52.56437 -62.22072 1.531582
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
-5.76E-15 2.641008 3.361036 3.572146 36.53149 0.000000
HASIL: TERNYATA HANYA NYATA PADA AUTOCORRELATION LAG-1 SEHINGGA PERLU DILAKUKAN UJI SERUPA UNTUK LAG-1 4
Uji BGLM dengan Residu Lag-1 Breusch-Godfrey Serial Correlation LM Test: F-statistic Obs*R-squared
152.8566 32.20464
Probability Probability
0.000000 0.000000
Test Equation: Dependent Variable: RESID Method: Least Squares Date: 10/18/12 Time: 06:30 Presample missing value lagged residuals set to zero. Variable
Coefficient
Std. Error
t-Statistic
Prob.
C X RESID(-1)
0.374039 -0.005712 0.916866
0.869499 0.010794 0.074159
0.430178 -0.529151 12.36352
0.6696 0.5999 0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.805116 0.794582 1.196986 53.01273 -62.39060 1.378264
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
-5.76E-15 2.641008 3.269530 3.396196 76.42828 0.000000
HASIL : TERDAPAT AUTOKORELASI KARENA OBS*R-SQUARED SANGAT NYATA PROBABILITASNYA, yaitu Obs*R-squared= 32.20464, dengan p sangat kecil. Dengan demikian, Ho ditolak, artinya terdapat autokorelasi order-1 pada residual.
Bagaimana mengatasinya? (1) Uji korelasi serial dengan berbagai lag, misalnya lag-1 s/d lag-5. Lag yang optimal adalah yang nilai AIC (Akaike Information Criterion) dan/atau BIC (Bayesian Schwarz Information Criterion) terkecil. [ternyata setelah diuji, AIC dan BIC terkecil pada lag-1). (2)
Gunakan metoda Weighted Least Square (WLS) dengan Two Step Durbin-Watson, dengan mengestimasi p = 1-(d/2). Model regresi baru adalah model dengan nilai Yt=Yt – pYt-1 dan Xt=Xt-pXt-1 yang akan terbebas dari masalah autokorelasi residual. [Untuk data di atas, d Durbin-Watson adalah 0.122904, sehingga p=0.938548. dengan demikian model yang diestimasi adalah: Yt-0.938548Yt-1 = a+b(Xt-0.938548Xt-1.
5
HASILNYA ADALAH : Dependent Variable: Y-0.938548*Y(-1) Method: Least Squares Date: 10/18/12 Time: 09:42 Sample(adjusted): 1960 1998 Included observations: 39 after adjusting endpoints Variable
Coefficient
Std. Error
t-Statistic
Prob.
C X-0.938548*X(-1)
3.156657 0.510573
0.629957 0.095892
5.010908 5.324477
0.0000 0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.433818 0.418516 0.872732 28.18145 -49.00310 1.601589
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
6.427273 1.144490 2.615544 2.700854 28.35005 0.000005
SELANJUTNYA, PERIKSA SERIAL KORELASI RESIDU DENGAN SERIAL CORRELATION LM TEST PADA RESIDUAL ORDER 1. DIPEROLEH OUTPUT: Breusch-Godfrey Serial Correlation LM Test: F-statistic Obs*R-squared
0.688094 0.731454
Probability Probability
0.412280 0.392412
Test Equation: Dependent Variable: RESID Method: Least Squares Date: 10/18/12 Time: 09:44 Presample missing value lagged residuals set to zero. Variable
Coefficient
Std. Error
t-Statistic
Prob.
C X-0.938548*X(-1) RESID(-1)
-0.181729 0.029750 0.160261
0.669489 0.102760 0.193199
-0.271445 0.289507 0.829514
0.7876 0.7739 0.4123
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.018755 -0.035758 0.876434 27.65290 -48.63390 1.814177
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
1.59E-16 0.861172 2.647892 2.775859 0.344047 0.711201
DARI OUTPUT DI ATAS, DAPAT DILIHAT BAHWA AUTOKORELASI RESIDU TELAH DAPAT DIHILANGKAN DAN KOMPONEN KONSTANTA DAN VARIABEL X MERUPAKAN VARIABEL YANG SIGNIFIKAN. JADI PERSAMAAN REGRESI FORECASTNYA ADALAH : Yt-0.938548Yt-1 = 3.156657 + 0.510573 (Xt-0.938548Xt-1.)
6
UJI ASUMSI KLASIK : UJI HETEROSKEDASTISITAS DATA DARI SUMBER : HETEROSKEDASTISITAS.WF1. (BUKU RUJUKAN BAB 5). FUNGSI : MPG = f (SP, HP, WT), dimana : MPG = rata-rata mil per galon SP = kecepatan tertinggi, dalam mil per jam HP = horse power, WT = berat kendaraan. Dependent Variable: MPG Method: Least Squares Date: 10/18/12 Time: 09:56 Sample: 1 81 Included observations: 81 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C SP HP WT
189.9597 -1.271697 0.390433 -1.903273
22.52879 0.233117 0.076246 0.185516
8.431865 -5.455179 5.120719 -10.25936
0.0000 0.0000 0.0000 0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.882864 0.878301 3.507873 947.4985 -214.5388 1.023742
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
33.83457 10.05541 5.396019 5.514263 193.4526 0.000000
UJI HETEROSKEDASTISITAS DENGAN UJI WHITE. White Heteroskedasticity Test: F-statistic Obs*R-squared
8.686636 33.47376
Probability Probability
0.000000 0.000008
Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 10/18/12 Time: 09:58 Sample: 1 81 Included observations: 81 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C SP SP^2 HP HP^2 WT WT^2
2339.156 -33.18490 0.098336 6.406445 -0.009948 -18.35650 0.123796
504.9905 7.960441 0.030483 1.620861 0.002856 4.080770 0.049459
4.632078 -4.168726 3.225893 3.952496 -3.482819 -4.498294 2.502985
0.0000 0.0001 0.0019 0.0002 0.0008 0.0000 0.0145
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.413256 0.365683 18.92066 26491.36 -349.4341 1.901058
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
11.69751 23.75653 8.800841 9.007769 8.686636 0.000000
HASIL UJI WHITE, TERNYATA ADA HETEROSKEDASTISITAS (Obs*R-squared = 33.47376).
7
BAGAIMANA MENGATASI HETEROSKEDASTISITAS? GUNAKAN GLS (Generalized Least Square), yaitu White HC (WHITE Heteroscedasticity Consistent Coefficient Covariance, dengan melakukan koreksi terhadap standard error dari koefisien regresi.
Dependent Variable: MPG Method: Least Squares Date: 10/18/12 Time: 10:04 Sample: 1 81 Included observations: 81 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable
Coefficient
Std. Error
t-Statistic
Prob.
C SP HP WT
189.9597 -1.271697 0.390433 -1.903273
33.90605 0.336039 0.108781 0.285077
5.602531 -3.784375 3.589180 -6.676352
0.0000 0.0003 0.0006 0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.882864 0.878301 3.507873 947.4985 -214.5388 1.023742
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
33.83457 10.05541 5.396019 5.514263 193.4526 0.000000
HASIL : BANDINGKAN HASIL GLS INI DENGAN METODA OLS. DALAM GLS INI, SEMUA KOEFISIEN REGRESI SIGNIFIKAN. SE DAN MSE TURUN DRASTIS, SEHINGGA DAPAT DIKATAKAN HETEROSKEDASTIS TIDAK ADA LAGI (HOMOSKEDASTIS).
8
UJI ASUMSI KLASIK : UJI MULTIKOLINEARITAS
DATA MULTIKOLINEARITAS.WF1 (DARI BUKU RUJUKAN PERTAMA). Y = jumlah populasi pekerja(ribuan) X1 = GNP price deflator X2= GNP dalam jutaan dolar X3= jumlah orang yang tidak bekerja X4= jumlah tentara X5= jumlah populasi berumur 14 tahun ke atas X6= TIME= indeks tahun, sama dengan 1 untuk 1947, 2 untuk 1948 dst... 16 untuk 1962. Dependent Variable: Y Method: Least Squares Date: 10/18/12 Time: 10:10 Sample: 1947 1962 Included observations: 16 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C X1 X2 X3 X4 X5 TIME
77.27012 0.001506 -0.035819 -0.002020 -0.001033 -0.051104 1.829151
22.50671 0.008491 0.033491 0.000488 0.000214 0.226073 0.455478
3.433204 0.177376 -1.069516 -4.136427 -4.821985 -0.226051 4.015890
0.0075 0.8631 0.3127 0.0025 0.0009 0.8262 0.0030
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.995479 0.992465 0.304854 0.836424 0.906650 2.559488
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
65.31700 3.511968 0.761669 1.099676 330.2853 0.000000
HASIL MENUNJUKKAN BAHWA BANYAK VARIABEL X YANG TIDAK SIGNIFIKAN, DENGAN RSQUARED YANG SANGAT TINGGI. SELANJUTNYA KITA LIHAT KORELASI SPEARMAN ANTAR VARIABEL X, SBB: X1 X1 X2 X3 X4 X5
1.000000 0.991149 0.995273 0.668257 0.417245 0.993953
X2 0.991149 1.000000 0.991589 0.620633 0.464744 0.979163
X3 0.995273 0.991589 1.000000 0.604261 0.446437 0.991090
X4 0.668257 0.620633 0.604261 1.000000 -0.177421 0.686552
X5 0.417245 0.464744 0.446437 -0.177421 1.000000 0.364416
TIME 0.993953 0.979163 0.991090 0.686552 0.364416 1.000000
TIMEHASIL :KORELASI SANGAT KUAT DIANTARA VARIABEL INDEPENDEN.
BAGAIMANA MENGATASI MULTIKOLINEARITAS? DAPAT DILAKUKAN DENGAN : (1) MEMBUANG VARIABEL INDEPENDEN, MISALNYA DENGAN BACKWARD REGRESSION. (2) TRANSFORMASIKAN VARIABEL INDEPENDEN. (3) KONSTRUKSIKAN MODEL LAINNYA.
9