MODUL I
EKONOMETRIKA UNTUK DATA PANEL (APLIKASI EVIEWS DAN STATA)
MUHAMMAD FIRDAUS TONY IRAWAN
Universitas Brawijaya, 10 Agustus 2009
TEORI MODEL DATA PANEL
Kelemahan dalam pendekatan cross section telah memotivasi penggunaan model time series. Sebagai contoh analisis pertumbuhan ekonomi suatu wilayah yang dilihat dari pertumbuhan PDRB, tingkat investasi dan tingkat konsumsi. Jika hanya menggunakan data cross section, yang diamati hanya pada satu titik waktu, maka perkembangan ekonomi wilayah-wilayah tersebut antar waktu tidak dapat dilihat. Di sisi lain, penggunaan model time series juga menimbulkan persoalan tersendiri melalui peubah-peubah yang diobservasi secara agregat dari satu unit individu sehingga mungkin memberikan hasil estimasi yang bias. Berdasarkan latar belakang tersebut, dewasa ini muncul perhatian dalam penggunaan pendekatan data panel, yaitu menggunakan informasi dari gabungan kedua pendekatan tersebut (cross section dan time series). Terdapat dua keuntungan penggunaan model data panel dibandingkan data time series dan cross section saja (Verbeek, 2004). Pertama, dengan mengkombinasikan data time series dan cross section dalam data panel membuat jumlah observasi menjadi lebih besar. Dengan menggunakan model data panel marginal effect dari peubah penjelas dilihat dari dua dimensi (individu dan waktu) sehingga paramater yang diestimasi akan lebih akurat dibandingkan dengan model lain. Secara teknis menurut Hsiao (2004), data panel dapat memberikan data yang informatif, mengurangi kolinearitas antar peubah serta meningkatkan derajat kebebasan yang artinya meningkatkan efisiensi. Kedua, keuntungan yang lebih penting dari penggunaan data panel adalah mengurangi masalah identifikasi. Data panel lebih baik dalam mengidentifikasi dan mengukur efek yang secara sederhana tidak dapat diatasi dalam data cross section saja atau data time series saja. Data panel mampu mengontrol heterogenitas individu. Dengan metode ini estimasi yang dilakukan dapat secara eksplisit memasukkan unsur heterogenitas individu. Data panel juga lebih baik untuk studi dynamics of adjustment. Hal ini berkaitan dengan observasi pada cross section yang sama secara berulang, sehingga data panel lebih baik dalam mempelajari perubahan dinamis. Terdapat dua pendekatan yang umum diaplikasikan data panel, yaitu Fixed Effect Model (FEM) dan Random effects Model (REM). Keduanya dibedakan berdasarkan pada asusmsi atau tidaknya korelasi antara komponen error dengan peubah bebas (regresor). Misalkan: yit = αi + Xit β + εit Pada one way error components model, komponen error dispesifikasikan dalam bentuk: εit = λi + uit Untuk two way error components model, komponen error dispesifikasi dalam bentuk:
it i t uit Pada pendekatan one way, error term hanya memasukkan komponen error yang merupakan efek dari individu (λi). Pada two way dimasukkan efek dari waktu (μt) ke
dalam komponen error. Jadi perbedaan antara FEM dan REM terletak pada ada atau tidaknya korelasi antara λi dan μt dengan Xit. 1.1. Fixed Effect Model (FEM) FEM muncul ketika antara efek individu dan peubah penjelas memiliki korelasi dengan Xit atau memiliki pola yang sifatnya tidak acak. Asumsi ini membuat komponen error dari efek individu dan waktu dapat menjadi bagian dari intersep, yaitu: Untuk one way komponen error: yit = αi + λi + Xit β + uit Untuk two way error component: yit = αi + λi + μt+ Xit β + uit Penduga pada FEM dapat dihitung dengan beberapa teknik sebagai berikut: 1.1.1. Pendekatan Pooled Least Square (PLS) Pada prinsipnya, pendekatan ini adalah menggunakan gabungan dari seluruh data (pooled), sehingga terdapat N x T observasi, dimana N menunjukkan jumlah unit cross section dan T menunjukkan jumlah series yang digunakan, yang diregresikan dengan model: yit = αi + Xit β + uit dimana αi bersifat konstan untuk semua observasi, atau αi = α. Formula perhitungan adalah:
dimana
dan
Dengan mengkombinasikan atau mengumpulkan semua data cross section dan data time series, dapat meningkatkan derajat kebebasan sehingga dapat memberikan hasil estimasi yang lebih efisien, sehingga:
Pendekatan ini memiliki kelemahan yaitu dugaan parameter β akan bias. Hal ini ditunjukkan dari arah kemiringan PLS yang tidak sejajar dengan garis regresi dari masing-masing individu (Gambar 1.1).
Slop yang bias ketika fixed effect diabaikan
Gambar 1.1. Estimasi dengan Pendekatan Pooled Least Square Parameter yang bias ini disebabkan karena PLS tidak dapat membedakan observasi yang berbeda pada periode yang sama, atau tidak dapat membedakan observasi yang sama pada periode yang berbeda. 1.1.2. Pendekatan Within Group (WG) Pendekatan ini digunakan untuk mengatasi masalah bias pada PLS. Teknik yang digunakan adalah dengan menggunakan data deviasi dari rata-rata individu dimana:
Dalam hal ini
dan Jika yit = αi + xit β + uit , maka diperoleh:
atau
sehingga,
Berdasarkan persamaan tersebut terlihat bahwa FEM dengan pendekatan WG tidak memiliki intersep. Untuk mengilustrasikan bagaimana pendekatan ini bekerja dapat dilihat pada Gambar 1.2.
Gambar 1.2. Estimasi dengan Pendekatan Within Group Kelebihan dari WG ini adalah dapat menghasilkan parameter β yang tidak bias, tetapi kelemahannya adalah nilai var (βWG) cenderung lebih besar dari var (βPLS) sehingga dugaan WG menjadi relatif lebih tidak efisien. Untuk melihat hal ini dapat dibuktikan dengan: pertama, didefinisikan:
sehingga dapat dilihat bahwa:
diketahui bahwa
sehingga, varians dari penduga β dengan pendekatan WG adalah: =
= Dari persamaan tersebut dapat dilihat bahwa var(β) pada WG lebih besar dari var(β) pada PLS. Kelemahan lain dari WG adalah tidak dapat mengakomodir karakteristik timeinvariant pada FEM, seperti terlihat dari tidak dimasukkannya intersep ke dalam model. 1.1.3. Pendekatan Least Square Dummy Variable (LSDV) Metode ini bertujuan untuk dapat merepresentasikan perbedaan intersep, yaitu dengan dummy variable. Untuk mengilustrasikan pendekatan ini misalkan persamaan awal seperti pada persamaan PLS dan kelompok dummy variable dgit = 1 (g = i). dengan memasukkan sejumlah dgit = 1 (g = i), persamaan awal menjadi: yit
uit
persamaan ini dapat diestimasi dengan pendekatan OLS sehingga diperoleh parameter βLSDV. Kelebihan pendekatan ini (LSDV) adalah dapat menghasilkan dugaan parameter β yang tidak bias dan efisien. Tetapi kelemahannya jika jumlah unit observasinya besar maka terlihat cumbersome. Untuk menguji apakah intersep memang signifikan atau tidak dapat menggunkan f-test dengan hipotesis sebagai berikut: H0 : α1 = α2 = α3 = ..... = αN dan H1 : satu dari α ada yang tidak sama
Hipotesis ini dapat secara langsung digunakan untuk menguji apakah lebih baik menggunakan PLS ataulah LSDV. Dasar penolakan terhadap H0 adalah dengan menggunakan F-statistik yaotu
dimana: = koefisien determinasi LSDV = koefisien determinasi Pooled Least Square k
= banyaknya peubah
Jika nilai F-Stat hasil pengujian lebih besar dari F-tabel, maka cukup bukti untuk melakukan penolakan terhadap hipotesis nol sehingga dugaan bahwa α adalah sama untuk semua individu dapat ditolak. 1.1.4. Two Way Error Components Fixed Effect Model Model ini disusun berdasarkan fakta bahwa terkadang fixed effects tidak hanya berasal dari variasi antar individu (time invariants) tetapi juga berasal dari variasi antar waktu atau time effect, sehingga model dasar yang digunakan adalah: dimana
merepresentasikan time effect.
Jika masing-masing pengaruh individu (αi) dan time-effect (γt) diasumsikan berbeda, sehingga dengan menambahkan sejumlah zsit = 1 (s = t) peubah dummy akan diperoleh persamaan:
Penambahan sejumlah dummy variable ke dalam persamaan menyebabkan masalah pada penggunaan two way fixed effect yaitu berkurangnya derajat kebebasan, yang pada akhirnya akan mengurangi efisiensi dari parameter yang diestimasi. 1.2.Random effects Model (REM) REM muncul ketika antara efek individu dan regresor tidak ada korelasi. Asumsi ini membuat komponen error dari efek individu dan waktu dimasukkan ke dalam error, dimana: Untuk one way error component: yit = αi + Xit β + uit+ λi Untuk two way error component: yit = αi + Xit β + uit+ λi + μt Beberapa asumsi yang biasa digunakan dalam REM, yaitu:
untuk i = j dan t = s
untuk i = j
dimana: Utuk one way error component, ηi = λi Untuk two way error component, ηi = λi + μi Dari semua asumsi di atas, yang paling penting dikaitkan dengan REM adalah asumsi bahwa nilai harapan dari xit untuk setiap ηi adalah 0, atau E(ηi xit) = 0. Terdapat dua jenis pendekatan yang digunakan untuk menghitung estimator REM, yaitu between estimator dan Generalized Least Square (GLS). 1.2.1. Pendekatan Between Estimator Pendekatan ini berkaitan dengan dimensi antar data (differences between individual), yang ditentukan sebagaimana OLS estimator pada sebuah regresi dari ratarata individu y dalam nilai x secara individu. Between estimator konsisten untuk N tak hingga, dengan asumsi bahwa peubah bebas dengan error tidak saling berkorelasi atau E (xit, εi = 0) begitu juga dengan nilai rata-rata error E (xit, εi = 0) 1.2.2. Pendekatan Generalized Least Square (GLS) Pendekatan GLS mengkombinasikan informasi dari dimensi antar dan dalam (between dan within) data secara efisien. GLS dapat dipandang sebagai rata-rata yang dibobotkan dari estimasi between dan within dalam sebuah regresi. Bila bobot yang dihitung tersebut tetap, maka estimator yang diperoleh disebut random effectss estimator. Dalam bentuk persamaan hal ini dapat dinyatakan sebagai berikut:
RE = Between + (Ik - ) Within 1.3. Hausman Test Dalam memilih apakah fixed atau random effectss yang lebih baik, dilakukan pengujian terhadap asumsi ada tidaknya korelasi antara regresor dan efek individu. Untuk menguji asumsi ini dapat digunakan Hausman Test. Dalam uji ini dirumuskan hipotesis sebagai berikut:
H0: E(τi xit) = 0 atau REM adalah model yang tepat H1: E(τi xit) = 0 atau FEM adalah model yang tepat Sebagai dasar penolakan H0 maka digunakan statistik Hausman dan membandingkannya dengan Chi square. Statistik Hausman dirumuskan dengan: H = (βREM – βfEM )‟ (MFEM –MREM)-1 (βREM – βfEM ) ~ χ2 (k) dimana: M adalah matriks kovarians untuk parameter β k adalah degrees of freedom Jika nilai H hasil pengujian lebih besar dari χ2 tabel, maka cukup bukti untuk melakukan penolakan terhadap H0 sehingga model yang digunakan adalah model fixed effects, begitu juga sebaliknya.
APLIKASI EVIEWS 5.1 UNTUK DATA PANEL
2.1. Data Panel Sebelum memulai penggunaan data panel dengan eviews 5.1 terlebih dahulu pastikan sumber data penelitian sudah dalam bentuk seperti terlihat pada Gambar 2.1 yang berada dalam format microsoft excel. Pada kolom A menunjukan unit-unit cross section yang digunakan, pada kolom B menunjukan periode waktu penelitian, masingmasing unit cross section memiliki tiga titik waktu pengamatan. Kolom C menunjukkan peubah terikat, serta kolom D, E, F, G, H, I, J, K dan L menunjukkan peubah penjelas. Pada Eviews, bentuk data seperti ini juga dikenal dengan nama “stacked data”.
Gambar 2.1. Data Panel dalam Format Microsoft Excel
2.2. Membuat Workfile Data Panel Setelah kita berada pada window eviews, maka terlebih dahulu kita harus membuat workfile. Prosedur membuat workfile adalah sebagai berikut: 1. Klik „File‟ dan „New‟, yang dilanjutkan dengan memilih opsi „Workfile‟; seperti yang terlihat dalam Gambar 2.2.
Gambar 2.2 Membuat Workfile 2. Akan muncul sebuah window (diiustrasikan dengan Gambar 2.3) yang mengandung beberapa pertanyaan mengenai tipe data yang digunakan, yaitu terdiri dari: 1. ‘Unstructured/undated’ untuk data cross section 2. ‘Dated-regular frequency’ untuk data time series 3. ‘Balanced panel’ untuk data panel Dalam hal ini, pilihlah ‘Balanced panel’ dengan mengklik 1 kali, kemudian akan muncul „panel specification’ yang berisi: 1. ‘frequency’, berhubungan dengan frekuensi data yang digunakan. Pilih ‟annual’ untuk data tahunan, ’monthly’ untuk data bulanan, ’semi-annual’ untuk data semesteran, ’quarterly’ untuk data 4 bulanan, ’weekly’ untuk data mingguan, dll. Dalam pelatihan ini, data yang digunakan merupakan data yang berjenis tahunan (annual), oleh karena itu pilihlah ‘Annual’. 2. ‘Start date’ berhubungan dengan waktu dimulainya penelitian. Dalam pelatihan ini tahun awal penelitian adalah tahun 2001. 3. „End date‟ berhubungan dengan periode akhir penelitian, yaitu tahun 2003. 4. ‘number of cross section’ berhubungan dengan banyaknya observasi (unit cross section) yang digunakan. Dalam penelitian ini yaitu sebanyak 23 individu. setelah selesai klik OK.
Gambar 2.3. Membuat Workfile Data panel Kemudian akan muncul window seperti terlihat pada Gambar 2.4.
Gambar 2.4. Workfile Data panel 2.3. Entry Data Ada beberapa prosedur yang dapat dilakukan untuk menginput data yang akan digunakan. Pada contoh ini entry data dilakukan dengan meng-copy paste dari data yang telah disusun pada Gambar 2.1. Prosedurnya adalah sebagai berikut: 1. Buka data yang akan digunakan sebagai data penelitian yang masih dalam format microsoft excel. Blok kolom peubah terikat dan peubah bebas. klik kanan, lalu copy.
Gambar 2.5 Meng-copy Data dari Microsoft Excel 2. Masuk ke halaman workfile eviews. Klik ‘quick’ lalu pilih ‘empty group’.
Gambar 2.6. Prosedur Meng-entry Data
Kemudian akan muncul window ‘group’ seperti yang terlihat pada Gambar 2.7.
Gambar 2.7. Window „Group‟ 3. Pastikan kursor telah berada pada bagian ujung dari window ‘group’, kemudian paste data yang telah di-copy pada langkah sebelumnya. Maka akan tampak seperti pada Gambar 2.8.
Gambar 2.8. Window „Group‟ Berisi Data Panel
2.4. Estimasi dengan Dua Pendekatan Analisis model data panel yang akan dibahas menggunakan dua pendekatan yaitu pendekatan fixed effects dan pendekatan random effects. 2.4.1 Pendekatan Fixed effects Masalah terbesar dalam pendekatan OLS adalah asumsi intersep dan slope dari persamaan regresi yang dianggap konstan baik antar individu maupun antar waktu yang kurang sesuai dengan tujuan penggunaan data panel. Untuk mengatasi hal tersebut maka dapat digunakan pendekatan fixed effects. Model fixed effects yaitu model yang dapat digunakan dengan mempertimbangkan bahwa peubah-peubah yang dihilangkan dapat mengakibatkan perubahan dalam intersep-intersep cross section dan time series. Peubah dummy dapat ditambahkan ke dalam model untuk memungkinkan perubahan-perubahan intersep ini, lalu model diduga dengan OLS, yaitu: Yit = ∑ αi Di + β Xit + εit dimana: Yit = peubah terikat Xit = peubah bebas α = intersep model yang berubah-ubah antar unit cross section β = slope D = peubah dummy i = individu ke-i ; dan t = periode waktu ke-t ε = error dari persamaan di atas, telah ditambahkan sebanyak N-1 peubah dummy ke dalam model, sehingga besarnya derajat kebebasan berkurang menjadi NT-N-K. 2.4.2. Pendekatan Random effects Keputusan untuk memasukkan peubah dummy dalam model fixed effects akan menimbulkan konsekuensi tersendiri yaitu dapat mengurangi banyaknya derajat kebebasan yang pada akhirnya akan mengurangi efisiensi dari parameter yang diestimasi. Untuk mengatasi masalah tersebut maka dapat digunakan model random effects. Dalam model ini, parameter yang berbeda antar individu maupun antar waktu dimasukkan ke dalam error, karena hal inilah model ini sering juga disebut sebagai error component model. Bentuk model random effects dapat dijelaskan dengan persamaan berikut: Yit = α0 + β Xit + εit εit = uit + vit + wit dimana: 2 uit ~ N (0, δU) = error component cross section 2 vit ~ N (0,δV) = error component time series 2 wit ~ N (0,δW) = error component combinations Asumsi yang digunakan dalam model ini adalah error secara individual tidak saling berkolerasi, begitu pula dengan error kombinasinya.
Penggunaan pendekatan random effects dapat menghemat derajat kebebasan dan tidak mengurangi jumlahnya sepeti pada pendekatan fixed effects. Hal ini berimplikasi pada parameter hasil estimasi akan menjadi efisien. Semakin efisien maka model akan semakin baik. Penggunaan Eviews 5.1 untuk estimasi ketiga pendekatan tersebut relatif lebih mudah dibandingkan dengan versi sebelumnya. Setelah data di-entry, kita dapat melakukan estimasi dengan cara meng-klik ‘Quick’ pada window eviews, lalu sorot ‘estimate equation’, maka akan muncul box seperti terlihat pada Gambar 2.9.
Gambar 2.9. Prosedur Estimasi masukkan persamaan yang dimaksud dengan format: peubah terikat diikuti oleh peubahpeubah bebas yang masing-masing dipisahkan dengan satu spasi. Lalu klik OK.
Gambar 2.10. Box „Equation Estimation‟
Maka akan muncul window hasil estimasi seperti terlihat pada Gambar 2.11.
Gambar 2.11. Hasil Estimasi dengan Pendekatan Pooled Least Square Karena sebelumnya kita belum melakukan ‘panel option’ maka output yang keluar adalah pendekatan Pooled Least Square. Kita dapat menyimpan hasil output ini dengan meng-klik ‘name’ pada window ‘equation’. Pada pelatihan ini, diberi nama “pooled”, lalu klik OK.
Gambar 2.12. Menyimpan Hasil Estimasi
Kita dapat memilih pendekatan lain yang dapat digunakan pada model data panel. Dengan prosedur yang sama seperti sebelumnya, klik menu ‘Quick’ lalu sorot ‘estimate equation’, kamudian muncul box seperti terlihat pada Gambar 4.2, Perbedaannya yaitu pada penggunaan ‘panel option’ dari box ‘Equation Estimation’, maka akan muncul box seperti terlihat pada Gambar 2.13. Terdapat pilihan ‘effect specification’ yang terdiri dari ‘cross section’ dan ‘period’. Masing-masing terdiri dari 3 pendekatan yaitu ‘none’ untuk pendekatan pooled, ‘Fixed’ untuk pendekatan fixed effectsdan ‘Random’ untuk pendekatan random effects. Sementara ini abaikan pilihan-pilihan ‘weigths’ dan ‘coef covariance method’.
Gambar 2.13. Prosedur Estimasi dengan Pendekatan Efek Tetap kita akan memilih ‘effect specification’ dengan cross section ‘fixed’. Kemudian akan muncul output seperti terlihat pada Gambar 2.14.
Gambar 2.14. Hasil Estimasi dengan Pendekatan Efek Tetap Dengan langkah yang sama kita dapat menyimpan output ini dengan mengklik ‘name’ kemudian beri nama “fixed”. Selain pendekatan fixed effects kita juga dapat melakukan pendekatan random effects dengan cara yang sama, tapi pada ‘effect specification’ ‘cross section’ pilih ‘random’.
Gambar 2.15. Hasil Estimasi dengan Pendekatan Random effects
Dengan langkah yang sama pula kita dapat menyimpan output ini dengan mengklik ‘name’ kemudian beri nama “random”. 2.5. Pemilihan Pendekatan: Uji Hausman Alur pengujian statistik untuk memilih pendekatan yang digunakan dapat diperlihatkan pada Gambar 2.16. Penggunaan pendekatan Pooled Least Square dirasakan kurang sesuai dengan tujuan digunakannya data panel. Karena itu dalam pelatihan ini hanya mempertimbangkan penggunaan pendekatan fixed effectsdan random effects.
Fixed Effect Hausman Test Chow Test LM Test Random Effect Gambar 2.16. Pengujian Pemilihan Model dalam Pengolahan Data Panel
Dengan menggunakan Hausman Test, pada Eviews 5.1 kita dapat langsung memilih pendekatan terbaik yang dapat digunakan, prosedurnya adalah sebagai berikut: 1. Pastikan kita berada pada window hasil estimasi dengan pendekatan random effects, kemudian klik „View’, pilih ‘Fixed/Random effects testing’ ‘Correlated Random effects-Hausman Test’, lalu klik.
Gambar 2.17. Prosedur Uji Hausman Window hasil estimasi dengan pendekatan random effects akan berubah menjadi correlated random effects, seperti terlihat pada Gambar 2.18.
Gambar 2.18. Hasil Uji Hausman
Nilai statistik Hausman test menunjukkan angka sebesar 35.671, lebih kecil dari nilai Chi-Square yang berarti hipotesis untuk menggunakan random effects ditolak, sehingga disimpulkan pendekatan fixed effectslebih baik digunakan pada penelitian ini. Keputusan menggunakan Fixed effects secara mudahnya dapat dilihat dari nilai probabilitas Chi-Square, berdasarkan hasil estimasi diperoleh nilai probabilitas sebesar 0.000 yang berarti tolak H0.
APLIKASI STATA 9 UNTUK DATA PANEL
3.1 Data Panel Seperti apa yang dibutuhkan pada Eviews 5.1 terlebih dahulu kita harus memastikan sumber data penelitian sudah dalam bentuk seperti terlihat pada Gambar 3.1 yang berada dalam format microsoft excel. Pada kolom A menunjukan unit-unit cross section yang digunakan, pada kolom B menunjukan periode waktu penelitian, masingmasing unit cross section memiliki tiga titik waktu pengamatan. Kolom C menunjukkan peubah terikat, serta kolom D, E, F, G, H, I, J, K dan L menunjukkan peubah penjelas. Pada STATA, bentuk data seperti ini dikenal dengan nama “long format”.
Gambar 3.1. Data Panel dalam Format Microsoft Excel 3.2. Entry Data Berbeda dengan Eviews, pada Stata kita dapat langsung melakukan entry data dan selanjutnya didefinisikan jenis data yang kita gunakan. Jika tidak didefinisikan maka program STATA akan membacanya sebagai data cross section. Ada beberapa prosedur yang dapat dilakukan untuk menginput data yang akan digunakan. Pada contoh ini entry data dilakukan dengan meng-copy paste dari data yang telah disusun pada Gambar 3.1. Prosedurnya adalah sebagai berikut: 1. Buka data yang akan digunakan sebagai data penelitian yang masih dalam format microsoft excel. Blok seluruh kolom yang digunakan, klik kanan, lalu copy.
Gambar 3.2 Meng-copy Data dari Microsoft Excel 2. Buka STATA. Klik ‘Data’ lalu pilih ‘Data editor’.
Gambar 3.3. Prosedur Meng-entry Data Kemudian akan muncul window ‘Data editor’ seperti yang terlihat pada Gambar 3.4.
Gambar 3.4. Window „Data Editor‟ 3. Pastikan kursor telah berada pada bagian ujung dari window ‘Data editor’, kemudian paste data yang telah di-copy pada langkah sebelumnya. Maka akan tampak seperti pada Gambar 3.5.
Gambar 3.5. Window „Data editor‟ Berisi Data Panel
3.3. Pendefinisian Jenis Data Langkah selanjutnya adalah mendefinisikan jenis data yang kita entry kedalam sistem STATA. Untuk data panel kita definisikan sebagai berikut: Dikarenakan observasi yang diinput termasuk variable jenis “string” maka kita rubah terlebih dahulu agar menjadi “numeric” dengan mengisi kolom “command” dengan perintah sebagai berikut: egen prov = group(provinsi)
Gambar 3.6. Merubah Variable String Menjadi Numeric Terdapat berbagai cara untuk mendefinisikan bahwa data yang kita entry merupakan panel data, salah satunya adalah sebagai berikut: sort prov tahun tsset prov tahun
Maka pada window STATA akan kita dapatkan sebagai berikut:
Gambar 3.7. Pendefinisian Jenis Data 3.4. Estimasi dengan Dua Pendekatan Seperti yang kita lakukan pada bagian aplikasi Eviews 5.1 untuk data panel, berikut akan dilakukan analisa model data panel dengan dua pendekatan yaitu pendekatan fixed effects dan pendekatan random effects. Model yang kita gunakan disini sama persis dengan apa yang digunakan pada bagian Eviews. Pada dasarnya ada 2 cara yang dapat dilakukan untuk melakukan estimasi model data panel pada STATA, yakni dengan memanfaatkan kolom command atau dengan menggunakan fasilitas “short cut” yang telah disediakan pada property STATA 9. Secara umum, pengolahan data pada STATA akan lebih mudah dilakukan bila kita memanfaatkan kolom command yang ada pada bagian bawah window STATA. Khusus untuk panel data, command sebagian besar diawali dengan xt. Berikut secara berturut-turut akan dicontohkan prosedur pengolahan panel data dengan metode pooled least square, fixed effects dan random effects dengan menggunakan kedua cara yang dipaparkan sebelumnya, yakni dengan command dan short cut. Untuk pooled least square, maka kita ketik pada kolom command sebagai berikut: reg (variabel dependent) (variabel independent) reg lpe roadens lurban loc lspec rpak gdrpcap public adm lopenreg
Maka akan muncul window hasil estimasi seperti terlihat pada Gambar 3.8.
Gambar 3.8. Hasil Estimasi dengan Pendekatan Pooled Least Square dengan Memanfaatkan command Jika kita hanya menggunakan command reg (sama seperti command untuk regresi berganda) maka hasil regresi yang kita dapatkan adalah pendekatan Pooled Least Square. Hasil yang sama juga dapat kita dapatkan dengan mengklik Statistic – Linear models and related – linear regression seperti yang ditunjukkan pada gambar berikut:
Gambar 3.9. Prosedur Estimasi Pooled Least Square (1)
Selanjutnya akan muncul box seperti Gambar 3.10.
Gambar 3.10. Prosedur Estimasi Pooled Least Square (2) Selanjutnya isilah kolom-kolom yang kosong dengan model yang akan diestimasi.
Gambar 3.11. Prosedur Estimasi Pooled Least Square (3)
Berikutnya kita akan dapatkan hasil seperti yang ditunjukkan pada Gambar 3.12.
Gambar 3.12. Hasil Estimasi Pooled Least Square Untuk mengestimasi dengan menggunakan metode fixed effects maka command yang kita gunakan akan berbeda dengan pendekatan sebelumnya. Command yang kita gunakan untuk pendekatan fixed effects adalah dengan mengetik perintah sebagai berikut pada kolom command. xtreg (variabel dependent) (variabel independent), fe xtreg lpe roadens lurban loc lspec rpak gdrpcap public adm lopenreg, fe Maka akan muncul window hasil estimasi seperti terlihat pada Gambar 3.13.
Gambar 3.13. Hasil Estimasi dengan Pendekatan Fixed Effects Hasil yang sama juga kita dapatkan jika kita menggunakan property dari STATA 9 dengan mengklik Statistics – Longitudinal/Panel Data – Linear Model – Linear Regression (FE, PE, RA, BE), seperti di bawah ini.
Gambar 3.14. Prosedur Pendekatan Fixed Effects
Selanjutnya akan diberikan kolom kosong yang harus kita isi sesuai dengan model yang kita gunakan dan pilih model type Fixed-effects, seperti contoh berikut:
Gambar 3.15. Prosedur Pendekatan Fixed effects (2) Maka hasil estimasinya akan sama persis dengan Gambar 3.13. Dengan langkah yang mirip kita dapat mengestimasi random effects (random effects). Command yang kita gunakan untuk pendekatan random effects adalah dengan mengetik perintah sebagai berikut pada kolom command. xtreg (variabel dependent) (variabel independent), re xtreg lpe roadens lurban loc lspec rpak gdrpcap public adm lopenreg, re Maka akan muncul window hasil estimasi seperti terlihat pada Gambar 3.16.
Gambar 3.16. Hasil Estimasi dengan Pendekatan Random Effects Hasil yang sama juga kita dapatkan jika kita menggunakan property dari STATA 9 dengan mengklik Statistics – Longitudinal/Panel Data – Linear Model – Linear Regression (FE, PE, RA, BE), seperti Gambar 3.14. Selanjutnya, kita hanya tinggal merubah model type-nya, dari fixed effects menjadi GLS random effects. Pada box terdapat 5 macam pendekatan yang dapat kita gunakan, namun sesuai dengan apa yang kita lakukan pada Eviews 5.1, pendekatan yang kita lakukan disini adalah random effects dengan pendekatan GLS.
Gambar 3.17. Hasil Estimasi dengan Pendekatan Random effects 3. 5. Pemilihan Pendekatan: Uji Hausman Seperti yang dilakukan pada Eviews 5.1, salah satu metode uji yang dapat kita gunakan untuk memutuskan apakah akan menggunkan fixed effects atau random effects adalah dengan menggunakan uji Hausman. Hausman test pada STATA 9 dilakukan dengan hipotesis yang sama dengan Eviews 5.1, yakni: H0: model random effects H1: model fixed effects Sebagai dasar penolakan H0 maka digunakan statistik hausman dan membandingkannya dengan Chi square. Jika nilai χ2 –statistik hasil pengujian lebih besar dari χ2 – tabel, maka cukup bukti untuk melakukan penolakan terhadap H0 sehingga pendekatan yang digunakan adalah fixed effects, begitu juga sebaliknya. Pada STATA 9 , untuk melakukan uji hausman maka terlebih dahulu kita harus memiliki hasil estimasi baik fixed effects maupun random effects. Prosedur yang harus kita lakukan adalah: 1. Estimasi dengan menggunakan fixed effects 2. Simpan (save) dan beri nama hasil estimasi 3. Estimasi dengan menggunakan random effects 4. Uji hausman dengan menggunakan H0: random effects Secara keseluruhan yang harus kita ketik pada kolom command secara berurutan adalah sebagai berikut: xtreg lpe roadens lurban loc lspec rpak gdrpcap public adm lopenreg, fe estimates store fixed xtreg lpe roadens lurban loc lspec rpak gdrpcap public adm lopenreg,re hausman fixed
Window hasil estimasi dengan pendekatan random effects akan terlihat seperti pada Gambar 5.1.
Gambar 3.18. Hasil Uji Hausman Nilai statistik Hausman test menunjukkan angka sebesar 82.46 yang berarti hipotesis untuk menggunakan random effects ditolak, sehingga disimpulkan pendekatan fixed effectslebih baik digunakan pada penelitian ini. Keputusan menggunakan Fixed effects secara mudahnya dapat dilihat dari nilai probabilitas Chi-Square, berdasarkan hasil estimasi diperoleh nilai probabilitas sebesar 0.0000 yang berarti tolak H0. 3.6. Uji Asumsi 3.6.1. Heteroskedastisitas Salah satu asumsi yang harus dipenuhi dalam persamaan regresi adalah bahwa taksiran parameter dalam model regresi bersifat BLUE (Best Linier Unbiased Estimate) maka var (ui) harus sama dengan ζ2 (konstan), atau semua residual atau error mempunyai varian yang sama. Kondisi itu disebut dengan homoskedastisitas. Sedangkan bila varian tidak konstan atau berubah-ubah disebut dengan heteroskedastisitas. Untuk mendeteksi adanya heteroskedastisitas maka kita harus melakukan beberapa prosedur, yakni dengan membandingkan hasil dengan menggunakan Generalized Least Square (GLS) yang memasukkan option heteroskedasticity dan yang tanpa menggunakan option heteroskedasticity. Selanjutnya digunakan lrtest untuk membandingkan kedua model tersebut.
xtgls lpe roadens lurban loc lspec rpak gdrpcap public adm lopenreg, igls panels(heteroskedastic) estimates store hetero xtgls lpe roadens lurban loc lspec rpak gdrpcap public adm lopenreg local df = e(N_g) - 1 lrtest hetero, df(`df') Setelah semua command dijalankan maka kita akan dapatkan hasil sebagai berikut. Hipotesis nol pada tes ini adalah bahwa model bersifat homoskedastik. Pada hasil tes ini dapat kita lihat bahwa probability dari chi square adalah 0.000 yang mengartikan bahwa kita harus menolak hipotesis nol, atau dengan kata lain model yang digunakan melanggar asumsi homoskedastisitas. .
Gambar 3.19. Hasil Uji Heteroskedastisitas Selain cara di atas, terdapat command lain yang dapat kita gunakan untuk melakukan uji heteroskedastisitas, yakni dengan menggunakan command “xttest3”. Langkah pertama yang harus kita lakukan adalah menginstall ado file terlebih dahulu dengan mengetik perintah berikut pada kolom command (computer harus terkoneksi dengan internet terlebih dahulu): ssc install xttest3 Selanjutnya dapat dengan mudah kita ketik perintah berikut: xtreg lpe roadens lurban loc lspec rpak gdrpcap public adm lopenreg, fe xttest3
Hipotesis nol yang digunakan disini adalah homoskedastisitas, sehingga jika kita tolak hipotesis nol maka model memiliki masalah heteroskedastisitas. Output yang akan kita dapatkan adalah:
Gambar 3.20. Hasil Uji Heteroskedastisitas dengan xttest3 6.2. Uji Autokorelasi Untuk melakukan uji autokorelasi pada STATA, kita dapat menggunakan ado file tambahan ”xtserial” atau ”Wooldridge test” yang dikembangkan oleh David Drukker dengan mengetik perintah pada kolom command sebagai berikut: findit xtserial net sj 3-2 st0039 net install st0039
(or click on st0039) (or click on click here to install)
Setelah itu maka secara otomatis, uji autokorelasi dengan menggunakan xtserial langsung terinstall dalam program. Uji autokorelasi dapat dengan mudah kita lakukan dengan mengetik perintah berikut ke dalam kolom command: xtserial (variabel dependent) (variabel independent) xtserial lpe roadens lurban loc lspec rpak gdrpcap public adm lopenreg, output Ketika kita menjalankan perintah ini, STATA 9 akan merespon ”no observation”. Hal ini terjadi karena tahun yang kita masukkan adalah 1995, 2000 dan 2005. Akibatnya ketika kita melakukan uji autokorelasi program tidak mampu mencari periode t-1. Oleh karena itu, hal pertama yang kita lakukan adalah sedikit ”menipu” program dengan cara merubah tahunnya menjadi berurutan seperti 1995, 1996 dan 1997. Di dalam STATA hal ini dapat dengan mudah dilakukan dengan cara menggunakan command ”replace”. replace tahun =1996 if tahun==2000 replace tahun =1997 if tahun==2005
Lalu kita lakukan tsset lagi, karena format tahun sudah berubah. Hal ini dapat dilakukan dengan menggunakan command: tsset prov tahun Sehingga kita akan mendapatkan output sebagai berikut:
Gambar 3.21. Melakukan tsset setelah Merubah Format Tahun Setelah itu dapat kita lakukan uji autokorelasi dengan menggunakan command: xtserial (variabel dependent) (variabel independent) xtserial lpe roadens lurban loc lspec rpak gdrpcap public adm lopenreg, output Pada STATA, H0 dari uji autokorelasi ini adalah tidak ada korelasi. Artinya, jika kita memiliki hasil yang signifikan, berarti kita tolak H0, atau dengan kata lain, model yang kita uji memiliki masalah autokorelasi.
Gambar 3.22. Hasil Uji Autokorelasi dengan Menggunakan Wooldridge Test Berdasarkan hasil uji heteroskedastisitas dan uji autokorelasi, model yang digunakan memiliki masalah heteroskedastisitas dan autokorelasi. Oleh karena itu, agar model menjadi BLUE, terlebih dahulu harus dilakukan modifikasi model. Pada Eviews 5.1 kita melakukan pendekatan fixed effectsdengan pembobotan White cross-section untuk mengatasi kedua pelanggaran asumsi tersebut. Pada STATA, kita dapat melakukan modifikasi lainnya yakni dengan menggunakan pendekatan Panel-Corrected Standard Errors, dimana metode ini akan mengatasi masalah heteroskedasticity dan autokorelasi. Command yang dapat kita gunakan adalah: xtpcse lpe roadens lurban loc lspec rpak gdrpcap public adm lopenreg, correlation(ar1) Berdasarkan model ini berarti kita melakukan koreksi kepada permasalahan heteroskedastisitas, contemporaneously correlated across panel, dan first order autokorelasi (ar1). Hasil dari model ini akan ditunjukkan pada gambar di bawah ini.
Gambar 3.23. Hasil Estimasi dengan Pendekatan Panel-Corrected Standard Errors