3. METODE PENELITIAN 3.1
Jenis dan Sumber Data Penelitian ini menggunakan data sekunder yang diperoleh dari Badan Pusat
Statistik (BPS), Perusahaan Listrik Negara (PLN) dan Departemen Kesehatan. Data yang digunakan dalam penelitian ini terdiri adalah: 1.
Produk Domestik Regional Bruto (PDRB) atas dasar harga konstan 1993, yang dipublikasikan oleh BPS.
2.
Data kependudukan masing-masing provinsi di Indonesia yang didapatkan dari hasil Sensus Penduduk dan Survei Antar Sensus (SUPAS) yang diambil dari buku Statistik Indonesia BPS.
3.
Data jumlah tenaga kerja, bersumber dari BPS.
4.
Data penduduk miskin masing-masing provinsi di Indonesia, bersumber dari BPS.
5.
Data panjang jalan kondisi baik dan sedang, yang diambil dari publikasi Statistik Perhubungan BPS.
6.
Data energi listrik yang terjual, yang diambil dari PT. PLN.
7.
Data volume air bersih yang disalurkan PDAM, bersumber dari BPS.
8.
Data jumlah puskesmas, bersumber dari Departemen Kesehatan
9.
Data jumlah kendaraan bermotor, yang diambil dari Statistik Perhubungan BPS.
10. Data jumlah rumahtangga, bersumber dari BPS. 11. Data jumlah pengangguran, bersumber dari BPS. 12. Data jumlah rata-rata lama sekolah pekerja, bersumber dari BPS. Data yang digunakan dalam penelitian ini adalah data panel pada level propinsi. Data panel adalah gabungan antara data silang (cross section) dengan data runtut waktu (time series). Dalam data panel, data cross section yang sama diobservasi menurut waktu. Jika setiap unit cross section memiliki jumlah observasi time series yang sama maka disebut sebagai balanced panel (total jumlah observasi = N x T). Sebaliknya jika jumlah observasi berbeda untuk setiap unit cross section maka disebut unbalanced panel.
Ada beberapa keunggulan dalam penggunaan data panel (Baltagi, 2005), diantaranya sebagai berikut: 1. Mampu mengontrol heterogenitas individu sehingga estimasi yang dilakukan dapat secara eksplisit memasukkan unsur heterogenitas individu. 2. Memberikan data yang informatif, mengurangi kolinearitas antar variabel, meningkatkan derajat bebas dan lebih efisien. 3. Lebih baik untuk studi dynamics of adjustment. Hal ini karena berkaitan dengan observasi cross section yang berulang, maka data panel lebih baik dalam mempelajari perubahan dinamis. 4. Lebih baik dalam mengidentifikasi dan mengukur efek yang secara sederhana tidak dapat diatasi dalam data cross section saja atau data time series saja. Kendati demikian, ada juga keterbatasan dalam penggunaan data panel, di antaranya adalah: 1. Relatif besarnya data panel karena melibatkan komponen cross section dan time series menimbulkan masalah disain survei panel, pengumpulan dan manajemen data (masalah yang umumnya dihadapi di antaranya: coverage, nonresponse, kemampuan daya ingat responden (recall), frekuensi, dan waktu wawancara. 2. Distorsi kesalahan pengamatan (measurement errors). Measurement errors umumnya terjadi karena respon yang tidak sesuai. 3. Masalah selektivitas (selectivity) yang mencakup hal-hal berikut: a. Self-selectivity : permasalahan yang muncul karena data-data yang dikumpulkan untuk suatu penelitian tidak sepenuhnya dapat menangkap fenomena yang ada. b. Non response : permasalahan yang muncul dalam panel data ketika ada ketidaklengkapan jawaban yang diberikan oleh responden (sampel rumahtangga). c. Attrition : jumlah responden yang cenderung berkurang pada survei lanjutan yang biasanya terjadi karena responden pindah, meninggal dunia atau biaya menemukan responden yang terlalu tinggi 4. Dimensi waktu (time series) yang pendek. Jenis panel mikro biasanya mencakup data tahunan yang relatif pendek untuk setiap individu.
3.2
Metode Analisis
3.2.1
Analisis Deskriptif Analisis deskriptif merupakan bentuk analisis sederhana yang bertujuan
mendeskripsikan dan mempermudah penafsiran yang dilakukan dengan membaca tabel dan grafik. Analisis deskriptif pada penelitian ini digunakan untuk melihat dinamika perkembangan infrastruktur selama periode penelitian. Melalui gambaran umum ini, diharapkan dapat menguatkan analisis ekonometrika yang akan dibahasa selanjutnya, terkait dengan hipotesis yang telah disusun untuk menjawab penelitian ini.
3.2.2 Analisis Parsial Simultan Panel Pada penelitian ini analisis regresi yang digunakan adalah analisis regresi data panel statis. Analisis data panel statis merupakan analisis data panel yang regressor-nya tidak melibatkan variabel lag dependent dalam model. Terdapat beberapa tipe model analisis data panel statis, antara lain: 1. Pooled Estimator, yang umumnya digunakan pada model cross section dan time series murni. Sebagaimana dibahas sebelumnya bahwa data panel memiliki jumlah observasi lebih banyak dibandingkan data cross section dan time series murni. Akibatnya, ketika data digabungkan menjadi pool data, regresi yang dihasilkan cenderung lebih baik dibandingkan regresi yang menggunakan data cross section dan time series murni. Akan tetapi, dengan mengabungkan data, maka variasi atau perbedaan baik antara individu dan waktu tidak dapat terlihat. 2. Tipe model data panel lainnya adalah fixed effect model (FEM), yang digunakan ketika efek individu dan efek waktu mempunyai korelasi dengan X it
atau memiliki pola yang sifatnya tidak acak. Asumsi ini membuat
komponen error dari efek individu dan waktu dapat menjadi bagian dari intecept. yit = αi + x’it β + uit ;
i=1,….,N; t=1…..,T ………………
(3.1)
dimana uit =μi + vit , untuk one way error component dan uit = μi + λt+ vit untuk two way error component.
3.
Random Effect Model (REM), REM digunakan ketika efek individu dan efek waktu tidak berkorelasi dengan X it atau memiliki pola yang sifatnya acak. Keadaan ini membuat komponen error dari efek individu dan efek waktu dimasukkan ke dalam error. Persamaan model random effects dapat ditulis sebagai berikut: ………………….(3.2) Adapun regresi yang digunakan dalam panel statis ini adalah regresi
parsial simultan panel. Alasan pemilihan metode parsial simultan mengacu pada tujuan penelitian yang ingin melihat pengaruh infrastruktur terhadap kemiskinan secara parsial. Ada transmisi mekanisme dalam melihat pengaruh infrastruktur terhadap kemiskinan. Infrastruktur tidak berpengaruh secara langsung terhadap pengentasan kemiskinan, tetapi infrastruktur berpengaruh terhadap pertumbuhan, dan pertumbuhan tersebut yang berpengaruh terhadap kemiskinan. Suatu sistem persamaan simultan (simultaneous-equations system) ialah suatu himpunan persamaan dimana variabel tak bebas dalam satu atau lebih persamaan juga merupakan variabel bebas dalam beberapa persamaan lainnya, yaitu keadaan di mana di dalam sistem persamaan suatu variabel sekaligus mempunyai dua peranan, yaitu sebagai variabel tak bebas dan variabel bebas. Oleh karena itu, pemberian nama variabel bebas dan variabel tak bebas di dalam sistem persamaan simultan sudah tidak tepat lagi. Sehingga untuk selanjutnya dalam persamaan simultan akan ada yang namanya variabel endogen dan variabel yang ditetapkan lebih dulu (predetermined variable). Variabel yang ditetapkan lebih dulu bisa berupa variabel eksogen sekarang, eksogen waktu lampau dan endogen waktu lampau. Variabel endogen ialah variabel tak bebas di dalam sistem persamaan simultan, yang nilainya ditentukan di dalam sistem persamaan, walaupun variabel-variabel tersebut mungkin juga muncul sebagai variabel bebas di dalam sistem persamaan. Variabel eksogen ialah variabel yang nilainya ditentukan di luar model. Dalam persamaan simultan perlu dilakukan identifikasi model terlebih dahulu sebelum memilih metode untuk menduga parameter pada setiap persamaan. Suatu persamaan dikatakan teridentifikasi kalau koefisiennya dapat diperkirakan. Rumus identifikasi model adalah sebagai berikut:
(K – M) ≥
– 1)
Keterangan : K = total peubah dalam model (peubah endogen dan peubah predeterminan) M = jumlah peubah endogen dan eksogen yang dimasukkan ke dalam suatu persamaan tertentu dalam model G = banyaknya persamaan Kriteria identifikasi model dapat dinyatakan sebagai berikut: 1. Jika (K-M)=(G-1), maka persamaan dalam model dinyatakan teridentifikasi secara tepat (exactly identified) 2. Jika
(K-M)<(G-1),
maka
persamaan
dalam
model
dikatakan
tidak
teridentifikasi (unidentified) 3. Jika (K-M)>(G-1), maka persamaan dalam model dikatakan teridentifikasi berlebih (overidentified). Model persamaan simultan dengan kondisi setiap persamaannya teridentifikasi berlebih, maka pendugaan parameter dapat menggunakan beberapa metode yang ada seperti two stage least square (2 SLS) atau three stage least square (3 SLS). Namun, penelitian ini menggunakan metode 2 SLS. Analisis parsial simultan dapat diestimasi dengan menggunakan teknik least square estimator. Pada
tahap pertama, persamaan pertama
diestimasi
dengan
menggunakan OLS. Tahap selanjutnya adalah mengestimasi persamaan kedua dengan menggunakan OLS juga, namun dengan mengganti nilai variabel endogen dengan nilai prediksi dari hasil regresi sebelumnya (Verbeek, 2008).
3.2.3 Pemilihan Metode Regresi Data Panel Pemilihan metode yang digunakan dalam sebuah penelitian perlu dilakukan berdasarkan pertimbangan statistik. Hal ini ditujukan untuk memperoleh dugaan yang efisien. Proses ini dilakukan dengan membandingkan fixed effects model dengan random effect model. Dalam memilih apakah fixed atau random effects yang lebih baik, dilakukan pengujian terhadap asumsi ada tidaknya korelasi antara regresor dan efek individu. Untuk menguji asumsi ini dapat digunakan Hausman Test. Dalam uji ini dirumuskan hipotesis sebagai berikut:
H0: E(τi | xit) = 0
atau REM adalah model yang tepat
H1: E(τi | xit) ≠ 0
atau FEM adalah model yang tepat
Sebagai
dasar penolakan H0
maka digunakan statistik
Hausman
dan
membandingkannya dengan Chi square. Statistik Hausman dirumuskan dengan: H = (βREM – βfEM )‟ (MFEM –MREM)-1 (βREM – βFEM ) ~ χ2 (k) ........... (3.3) dimana: M adalah matriks kovarians untuk parameter β k adalah degrees of freedom Jika nilai H hasil pengujian lebih besar dari χ2 tabel, maka cukup bukti untuk melakukan penolakan terhadap H0 sehingga model yang digunakan adalah model fixed effects, begitu juga sebaliknya.
Uji Asumsi Uji asumsi dilakukan untuk memenuhi persyaratan sebuah model yang akan digunakan. Setelah kita memutuskan untuk menggunakan suatu model tertentu (FEM atau REM) berdasarkan Hausman Test, maka kita dapat melakukan uji terhadap asumsi yang digunakan dalam model. Uji asumsi yang dilakukan dalam mengestimasi hasil dalam penelitian ini terdiri dari uji heteroskedastisitas dan uji autokorelasi. 1. Uji Heteroskedastisitas Salah satu asumsi yang harus dipenuhi dalam persamaan adalah bahwa taksiran parameter dalam model regresi bersifat BLUE (Best Linier Unbiased Estimate) maka var (ui) harus sama dengan σ2 (konstan) atau semua residual atau error mempunyai varian yang sam. Kondisi demikian disebut dengan homoskedastisitas. Sedangkan bila varian tidak konstan atau berubah-ubah disebut dengan heteroskedastisitas. Untuk mendeteksi adanya heteroskedastisitas, dapat dilakukan dengan metode general least square.
2. Uji Autokorelasi Model regresi mengasumsikan tidak terjadi autokorelasi, yaitu korelasi yang terjadi antar observasi dalam satu peubah atau korelasi antar error masa yang lalu dengan error masa sekarang. Autokorelasi yang terjadi dalam model
regresi dapat mempengaruhi efisiensi dari estimatornya. Pengujian ada tidaknya autokorelasi dalam model dapat dilakukan dengan menggunakan Wooldridge Test. Metode Wooldrigde menggunakan residual dari model regresi pada first differences. Model regresi terbebas dari masalah autokorelasi jika korelasi residual dari model regresi pada first differences terhadap lag-nya adalah -0,05 (Drukker, 2003).
3.2.4 Uji Beda Koefisien Uji beda antara dua koefisien dilakukan terkait dengan dihasilkannya model regresi untuk Jawa dan Luar Jawa. Selain itu juga untuk memastikan secara statistik mengenai perbedaan antara kedua koefisien yang dihasilkan (koefisien regresi di Jawa dan Luar Jawa). Hipotesis dari uji beda dua koefisien tersebut adalah: H0 : βjawa = βluar jawa = β H1 : βjawa ≠ βluar jawa Statistik Uji yang digunakan untuk menguji beda antara koefisien di Jawa dan Luar Jawa adalah: ^
thit =
^ ^ βjt – βljt
^ ^ se (βjt)2 + se (βljt)2 Keterangan :
nj
nlj
βjt
: Koefisien estimasi variabel di Pulau Jawa pada waktu t
βljt
: Koefisien estimasi variabel di Luar Jawa pada waktu t
se (βjt) : Kesalahan standar koefisien estimasi βjt se (βljt) : Kesalahan standar koefisien estimasi βljt nj
: Jumlah provinsi di Pulau Jawa
nlj
: Jumlah provinsi di Luar Jawa
Kriteria keputusan jika menggunakan taraf nyata α Jika thitung < ttabel maka terima H0 Jika thitung > ttabel maka terima H1
Asumsi bahwa covariance sama dengan nol didasari oleh tidak ada satu provinsi pun yang bisa tercakup di Jawa dan Luar Jawa, artinya setiap provinsi hanya bisa berada di salah satu wilayah saja. Misalnya provinsi DKI Jakarta, hanya ada di Kelompok Jawa, tidak akan mungkin ada di Luar Jawa. Setelah mendapatkan hasil dari uji beda koefisien, maka dikonstruksi suatu model baru yang sedikit berbeda dengan model untuk Jawa ataupun Luar Jawa. Perbedaannya adalah dengan penambahan variabel baru berupa interaksi antara dummy wilayah (Jawa dan Luar Jawa) dengan variabel yang berbeda nyata hasil uji beda dua koefisien. Juanda (2009) menyatakan bahwa jika ada pengaruh interaksi antara variabel, maka perlu ditambahkan suatu peubah bebas baru yang merupakan perkalian antara dua peubah bebas yang berinteraksi tersebut.
3.3 Spesifikasi Model Ada dua model dalam penelitian ini, yaitu model Jawa, yang sama bentuknya dengan model Luar Jawa. Model yang kedua adalah model gabungan (Indonesia). Pada bab 3 ini, peneliti hanya mencantumkan model untuk di Jawa dan Luar Jawa. Sedangkan untuk model gabungan tidak dicantumkan karena tidak dapat ditentukan di awal penelitian, tapi tergantung pada hasil uji beda koefisien. Model pada penelitian ini mengacu pada penelitian Laabas dan Limam (2004) yang telah dimodifikasi. LN PDRBit
= α0 + α1 LN_ JLNit + α2 LN_LISTRIKit + α3 LN_ABit + α4 LN_PUSKESMASit + α5 LN_TK it + DD it + ε it…. (3.4)
LN_MISKIN it = γ0 + γ1 LN_ PDRB it + γ2 LN_PENGANGGURAN it + γ3 LN_RATA-RATA SKLH it + μ it …………….… (3.5) Keterangan: I
: Provinsi
T
: Tahun
LN
: Logaritma natural
PDRB
: Agregat output yang dihasilkan oleh suatu provinsi dalam satu tahun (satuan juta rupiah).
α0, γ0
: Unobserved heterogenity
JLN
: Rasio panjang jalan kondisi baik dan sedang terhadap banyaknya kendaraan
LISTRIK
: Rasio antara energi listrik terjual terhadap banyaknya
rumah
tangga
(satuan
GWh/rumahtangga). AB
: Rasio volume air yang disalurkan oleh PDAM terhadap banyaknya
rumahtangga
(satuan
3
m /rumahtangga). PUSKESMAS
:
Rasio jumlah puskesmas terhadap jumlah penduduk (unit/orang).
TK
:
Jumlah tenaga kerja (satuan orang).
MISKIN
:
Jumlah penduduk miskin (satuan orang)
PENGANGGURAN
:
Jumlah pengangguran (satuan orang).
RATA-RATA SKLH
:
Rata-rata lama sekolah pekerja (satuan tahun)
DD
:
Dummy desentralisasi
ε,µ
:
Komponen error
3.3
Definisi Operasional Definisi Operasional masing-masing variabel yang digunakan dalam
model dari penelitian dapat dijelaskan sebagai berikut: 1.
PDRBit merupakan output yang didekati dengan PDRB atas dasar harga konstan 1993 pada provinsi i dan tahun t (satuan juta rupiah).
2.
JLNit adalah rasio panjang jalan kondisi baik dan sedang terhadap jumlah kendaraan bermotor di provinsi i dan tahun t. Panjang jalan merupakan gabungan jalan negara, provinsi, dan kabupaten/kota yang berada di provinsi tersebut.
3.
LISTRIKit adalah rasio energi listrik terjual terhadap jumlah rumahtangga di provinsi i dan tahun t (satuan GWh/rumahtangga). Energi listrik terjual merupakan total energi listrik yang dikonsumsi seluruh kelompok pelanggan di provinsi tersebut.
4.
ABit adalah rasio jumlah air bersih yang disalurkan oleh PDAM terhadap jumlah rumahtangga di provinsi i dan tahun t (satuan m3/rumahtangga).
Jumlah air bersih yang disalurkan merupakan total air bersih yang dikonsumsi seluruh kelompok pelanggan. 5.
PUSKESMASit adalah rasio jumlah puskesmas terhadap jumlah penduduk provinsi i dan tahun t (satuan unit/rumahtangga).
6.
TKit merupakan jumlah tenaga kerja di provinsi i dan tahun t (satuan orang).
7.
MISKINit merupakan jumlah penduduk miskin di provinsi i dan tahun t (satuan ribu orang).
8.
PENGANGGURANit merupakan jumlah pengangguran di provinsi i dan tahun t (satuan orang).
9.
RATA-RATA SKLH it merupakan rata-rata lama sekolah pekerja di provinsi i dan tahun t (satuan tahun).
10. DDit merupakan dummy desentralisasi fiskal yang digunakan untuk melihat dampak desentralisasi fiskal terhadap pertumbuhan. Variabel dummy akan bernilai 0 untuk waktu sebelum desentralisasi dan bernilai 1 untuk masa setelah desentralisasi.