Econometric Modeling: Model Specification Tjipto Juwono, Ph.D.
Nov 18, 2015
TJ
Modeling
Model Spesification Error
Salah satu asumsi dalam CLRM adalah bahwa model regresi yang digunakan dalam analisa adalah model yang dispesifikasi secara tepat. Jika tidak, maka kita berurusan dengan Model Spesification Error.
TJ
Modeling
Beberapa Pertanyaan Penting
1
Bagaimana cara menentukan model yang tepat? Apa kriteria penentuan model dalam suatu analisa empirik?
2
Apa saja model specification error yang dijumpai dalam praktek?
3
Apa konsekuensi dari model specification error?
4
Bagaimana cara mendeteksi model specification error?
5
Setelah berhasil mendeteksi adanya model specification error, apa saja tindakan perbaikan yang dapat dilakukan?
6
Bagaimana cara mengevaluasi berbagai model yang diajukan untuk data yang sama?
TJ
Modeling
Kriteria Pemilihan Model
1
Ketersediaan data: Model harus dapat digunakan untuk memprediksi.
2
Konsisten dengan teori: Masuk akal secara ekonomik.
3
Variabel independen harus independen terhadap suku error, baik itu di masa lampau, masa kini, atau di masa depan.
4
Parameter-parameter harus bersifat konstan/stabil. Jika tidak, maka prediksi menjadi sulit atau tidak dapat dipercaya.
5
Koherensi data: residu yang diperoleh dari model harus bersifat random. Jika tidak, maka berarti ada specification error.
6
Jika ada model baru yang diajukan, maka model baru ini harus juga dapat menjelaskan model yang lama.
TJ
Modeling
Mengabaikan variabel yang penting
Misalkan model yang benar adalah: Yi = β1 + β2 Xi + β3 Xi2 + β4 Xi3 + u1i
(1)
dengan Y = total cost, dan X = output. Namun model yang digunakan adalah: Yi = α1 + α2 Xi + α3 Xi2 + u2i
(2)
Sehingga suku error dalam persamaan (2) menjadi u2i = u1i + β4 Xi3
TJ
Modeling
(3)
Menambahkan variabel yang tidak relevan
Misalkan model yang benar adalah persamaan (1), namun yang digunakan adalah: Yi = λ1 + λ2 Xi + λ3 Xi2 + λ4 Xi3 + λ5 Xi4 + u3i
(4)
Sehingga suku error dalam persamaan (4) menjadi u3i = u1i − λ5 Xi4
TJ
Modeling
(5)
Y vs X 2
Y=β1+β2X 200
Y
150
100
50
0
0
10
5
15
X Figure 1: Y vs X
TJ
Modeling
20
Y vs X 2 2
Y=β1+β2X 200
Y
150
100
50
0
0
100
200
300
2
X
Figure 2: Y vs X 2
TJ
Modeling
400
Menggunakan Bentuk Fungsional yang Keliru
lnY = γ1 + γ2 Xi + γ3 Xi2 + γ4 Xi3 + u4i
(6)
Persamaan (1) berbentuk linear, sedangkan persamaan (6) adalah log-lin.
TJ
Modeling
Bias Pengukuran
∗ Yi∗ = β1∗ + β2∗ Xi∗ + β3∗ Xi∗2 + β4∗ Xi∗3 + u1i
Dengan Yi∗ = Yi + ǫi Xi∗ = Xi + ωi .
TJ
Modeling
(7)
Kekeliruan Spesifikasi Suku Error
Yang benar: Yi = βXi ui
(8)
Yi = αXi + ui
(9)
Yang digunakan:
TJ
Modeling
Underfitting vs Overfitting
Jika ada variabel independen yang seharusnya ada tetapi diabaikan, maka kita melakukan underfitting Jika kita menambahkan variabel independen yang seharusnya tidak ada, maka kita melakukan overfitting
TJ
Modeling
Beberapa akibat Underfitting
Misalkan model yang benar adalah Yi = β1 + β2 X2i + β3 X3i2 + ui
(10)
Tetapi kita menggunakan persamaan (11) untuk analisa regresi. Yi = α1 + α2 X2i + νi Maka kita melakukan underfitting.
TJ
Modeling
(11)
Beberapa akibat Underfitting Jika X2 berkorelasi dengan X3 maka r23 tidak sama dengan nol. Akibatnya, αˆ1 dan αˆ2 menjadi bias dan tidak konsisten. Jika X2 tidak berkorelasi dengan X3 (r23 =0). Dalam hal ini, αˆ1 tetap bias walaupun αˆ2 menjadi tidak bias. Variance σ 2 menjadi tidak tepat. Variance dari αˆ2 adalah biased estimator dari variance dari estimator yang sesungguhnya, yaitu βˆ2 . Confidence interval dan prosedur uji hipotesa akan memberikan konklusi yang kurang tepat tentang seberapa signifikan secara statistik hasil estimasi-estimasi parameternya. Secara umum, hasil prediksi berdasarkan model yang keliru cenderung kurang dapat dipercaya.
TJ
Modeling
Beberapa akibat Overfitting
Misalkan model yang benar adalah: Yi = β1 + β2 X2i + ui
(12)
Tetapi kita menggunakan persamaan (13): Yi = α1 + α2 X2i + α3 X3i + νi Maka kita melakukan overfitting.
TJ
Modeling
(13)
Beberapa akibat Overfitting
OLS estimator dari parameter dari model yang keliru adalah unbiased dan konsisten. Dengan kata lain: E (α1 ) = β1 , E (αˆ2 ) = β2 , E (αˆ3 ) = β3 = 0 σ 2 diestimasi dengan cukup tepat. Prosedur confidence interval dan uji hipotesa tetap valid. Variance dari α’s secara umum lebih besar dari variance dari β’s. Sehingga estimasi α menjadi tidaak efisien.
TJ
Modeling
TUGAS
Download ”Spesifikasi1.xlsx” dari website. 1
Buat regresi lengkap Y vs X 1, Y vs X 1, X 2, dan Y vs X 1, X 2, X 3.
2
Berdasarkan regresi di atas, tentukan manakah dari ketiga regresi di atas yang menunjukkan (a) regresi yang benar, (b) underfitting, (c) overfitting. Jelaskan alasannya!
TJ
Modeling