III. METODE PENELITIAN
3.1. Jenis dan Sumber Data Data yang digunakan dalam penelitian ini merupakan data sekunder yang dikumpulkan dari berbagai instansi pemerintah terutama Badan Pusat Statistik (BPS) dan Kementrian Keuangan, dengan time series tahun 2007- 2010 dan cross section kabupaten-kabupaten perbatasan darat Indonesia. Data yang digunakan antara lain PDRB per kapita, rasio penduduk miskin, rasio tingkat pengangguran terbuka, rasio murid terhadap guru, rasio penduduk terhadap tenaga kesehatan, rasio jalan terhadap luas wilayah, belanja pemerintah bidang pendidikan dan kesehatan serta data-data lainnya yang relevan dengan penelitian Pengelolaan data dalam penelitian ini menggunakan Software Excel dan Eviews 6. Software Excel digunakan untuk membuat tabel dan grafik demi menunjang analisis deskriptif. Program Eviews 6 digunakan untuk membuat analisis regresi data panel mengenai faktor-faktor yang memengaruhi indeks pembangunan manusia. 3.2. Metode Analisis 3.2.1 Analisis Deskriptif Analisis Deskriptif merupakan bentuk analisis sederhana yang bertujuan mendeskripsikan dan mempermudah penafsiran yang dilakukan dengan membaca tabel dan gambar. Analisis deskriptif pada penelitian ini digunakan untuk melihat kondisi sosial ekonomi di wilayah perbatasan, seberapa besar faktor-faktor yang diteliti memengaruhi IPM dan bagaimana implikasi kebijakan pemerintah dengan realitas keadaan pembangunan manusia di wilayah perbatasan. Analisis deskriptif disajikan dalam bentuk tabel dan gambar agar dapat dengan mudah dipahami pembaca. 3.2.2 Analisis Regresi Data Panel: Fixed Effect Model (FEM) Data panel (longitudinal data) adalah data yang memiliki dimensi ruang (individu) dan waktu. Dalam data panel, data cross section yang sama diobservasi menurut waktu. Jika setiap unit cross section memiliki jumlah observasi time
41
42
series yang sama maka disebut sebagai balanced panel (total jumlah observasi = N x T). Sebaliknya jika jumlah observasi berbeda untuk setiap unit cross section disebut unbalanced panel. Penggabungan data cross section dan time series dalam studi data panel digunakan untuk mengatasi kelemahan dan menjawab pertanyaan yang tidak dapat dijawab oleh model cross section dan time series murni. Penggunaan data panel telah memberikan banyak keuntungan secara statistik maupun menurut teori ekonomi diantaranya sebagai berikut: 1. Mampu mengontrol heterogenitas individu. Dengan metode ini estimasi yang dilakukan dapat secara eksplisit memasukkan unsur heterogenitas individu. 2. Dengan mengkombinasikan data time series dan cross section, data panel dapat memberikan data yang informatif, mengurangi kolinearitas antar peubah, meningkatkan derajat kebebasan dan lebih efisien. 3. Lebih baik untuk studi dynamics of adjustment. Karena berkaitan dengan observasi cross section yang berulang, maka data panel lebih baik dalam mempelajari perubahan dinamis. 4. Lebih baik dalam mengidentifikasi dan mengukur efek yang secara sederhana tidak dapat diatasi dalam data cross section saja atau data time series saja. Selain manfaat yang diperoleh dengan penggunaan panel data, metode ini juga memiliki keterbatasan di antaranya adalah: 1. Masalah dalam disain survei panel, pengumpulan dan manajemen data. Masalah yang umum dihadapi diantaranya: cakupan (coverage), nonresponse, kemampuan daya ingat responden (recall), frekuensi dan waktu wawancara. 2. Distorsi kesalahan pengamatan (measurement errors). Measurement errors umumnya terjadi karena respon yang tidak sesuai. 3. Masalah selektivitas (Selectivity) yang mencakup hal-hal berikut: a. Self-selectivity. Permasalahan ini muncul karena data-data yang dikumpulkan untuk suatu penelitian tidak sepenuhnya dapat menangkap fenomena yang ada. b. Nonresponse . Permasalahan ini muncul dalam panel data ketika ada ketidak lengkapan jawaban yang diberikan oleh responden.
43
c. Attrition . Yaitu jumlah responden yang cenderung berkurang pada survei lanjutan yang biasanya terjadi karena responden pindah, meninggal dunia atau biaya menemukan responden yang terlalu tinggi 4. Dimensi waktu (time series) yang pendek. Jenis panel mikro biasanya mencakup data tahunan yang relatif pendek untuk setiap individu. 5. Cross-section dependence. Sebagai contoh, apabila makro panel dengan unitanalisis negara atau wilayah dengan deret waktu yang panjang mengabaikan cross-country dependence akan mengakibatkan inferensi yang salah (misleading inference). Analisis data panel secara garis besar dibedakan menjadi dua macam yaitu statis dan dinamis. Pada analisis data panel dinamis, regressor-nya mengandung variabel lag dependent-nya, sedangkan pada analisis data panel statis tidak. Penelitian ini menggunakan analisis data panel statis sehingga pembahasannya dibatasi untuk analisis statis saja. Secara umum, terdapat dua pendekatan dalam metode data panel, yaitu Fixed Effect Model (FEM) dan Random Effect Model (REM). Keduanya dibedakan berdasarkan ada atau tidaknya korelasi antara komponen error dengan peubah bebas. Struktur datanya sebagai berikut. periode 1 periode 2 periode T
x111 x112 …
x211 x212
… …
xK11 xK12
…
…
…
x11T x121 x121 …
x21T x221 x221 …
… … … …
xK1T xK21 xK21 …
x12T … …
x22T … …
… … …
xKNT … …
x1N1
x2N1
…
xKN1
x1N1 … x1NT
x2N1 ... x2NT
… ... …
xKN1 … xKNT
Individu ke 1
Individu ke 2
Individu ke N
44
Misalkan diberikan persamaan regresi data panel sebagi berikut: yit = ai + X itβ +εit
(3.1)
dimana: yit : nilai dependent variabel untuk setiap unit individu i pada periode t dimana i = 1, • n dan t = 1,……., T ai
: unobserved heterogenity
Xit
: nilai independent variabel yang terdiri dari sejumlah K variabel.
Pada one way, komponen error dispesifikasikan dalam bentuk: εit = λi + uit dimana: λi uit
(3.2)
: efek individu (individual invariant) : disturbance yang besifat acak (uit~N(0,σ2u))
Untuk two way, komponen error dispesifikasikan dalam bentuk: εit = λi + µt+ uit
(3.3)
Dimana: µt : efek waktu (time invariant) Pada pendekatan one waykomponen error hanya memasukkan komponen error yang merupakan efek dari individu ( λi). Pada two way telah memasukkan efek dari waktu ( µt) ke dalam komponen error, uit diasumsikan tidak berkorelasi dengan Xit. Jadi perbedaan antara FEM dan REM terletak pada ada atau tidaknya korelasi antara λi, µt, dengan Xit. 3.2.2.1 PengujianModel Terbaik a. Fixed Effect Model (FEM) FEM digunakan ketika efek individu dan efek waktu mempunyai korelasi dengan Xit atau memiliki pola yang sifatnya tidak acak. Asumsi ini membuat komponen error dari efek individu dan waktu dapat menjadi bagian dari intercept. Untuk one way komponen error: yit = ai +λi + Xitβ + uit Untuk two way komponen error: yit = ai +λi +µt + Xitβ + uit Penduga FEM dapat dihitung dengan beberapa teknik, yaitu Pooled Least Square (PLS), Within Group (WG), Least Square Dummy Variable (LSDV), dan Two Way Error Component Fixed Effect Model.
45
b. Random Effect Model (REM) REM digunakan ketika efek individu dan efek waktu tidak berkorelasi dengan Xit atau memiliki pola yang sifatnya acak. Keadaan ini membuat komponen error dari efek individu dan efek waktu dimasukkan ke dalam error. Untuk one way komponen error: yit = ai +λi + Xitβ + uit Untuk two way komponen error: yit = ai +λi +µt + Xitβ + uit Asumi yang digunakan dalam REM adalah: E (uit| τi )
=0
E (u2it| τi )
= σ2u
E (τi | xit )
=0
untuk semua i dan t
E (τ2i | xit )
= σ2τ
untuk semua i dan t
E (uitτj )
=0
untuk semua i,t dan j
E (uitujs )
=0
untuk i ≠ j dan t ≠ s
E (τi τj)
=0
untuk i ≠ j
Dimana untuk: One way error component:τi = λi Two way error component:τi = λi+µ t
Dari semua asumsi di atas, yang paling penting adalah E (τ i | xit ) = 0. Pengujian asumsi ini menggunakan Hausman test. Uji hipotesis yang digunakan adalah: H0 : E (τi | xit ) = 0
Tidak ada korelasi antara komponen error dengan peubah bebas
H1 : E (τi | xit ) ≠ 0
Ada korelasi antara komponen error dengan peubah bebas.
' 1 H = ( ( REM FEM ) (M REM M FEM ) ( REM FEM ) ~
dimana
2
(k )
M : matrik kovarians untuk parameter β k
: derajat bebas
Jika H > χ2tabel maka komponen error mempunyai korelasi dengan peubah bebas dan artinya model yang valid digunakan adalah REM. Penduga REM dapat dihitung dengan dua cara yaitu pendekatan Between Estimator (BE) dan Generalized Least Square (GLS).
46
c. Pemilihan Model dalam Pengujian Data Panel Pemilihan model yang digunakan dalam sebuah penelitian perlu dilakukan berdasarkan pertimbangan statitik. Hal ini ditujukan untuk memperoleh dugaan yang efisien. Diagram pengujian statistik untuk memilih model yang digunakan diperlihatkan pada Gambar 3.1 FIXED EFFECT Hausman Test Chow Test
RANDOM EFFECT LM Test POOLED LEAST SQUARE
Gambar3.1. Pengujian pemilihan model dalam pengolahan data panel
Pengujian model untuk memutuskan apakah akan menggunakan fixed effect atau random effect menggunakan uji Hausman. Hausman Test dilakukan dengan hipotesis sebagai berikut: H0 : E (τi | xit ) = 0 atau REM adalah model yang tepat H1 : E (τi | xit ) ≠ 0 atau FEM adalah model yang tepat Sebagai dasar penolakan H0 maka digunakan statistic Hausman dan membandingkannya dengan Chi square. Jika nilai χ2 statistik pengujian lebih besar dari χ2 tabel ,maka cukup bukti untuk melakukan penolakan terhadap sehingga pendekatan yang digunakan adalah , begitu juga sebaliknya. 3.2.2.2 Uji Asumsi Uji asumsi dilakukan untuk memenuhi persyaratan sebuah model yang akan digunakan. Setelah kita memutuskan untuk menggunakan suatu model
47
tertentu (FEM atau REM) berdasarkan Hausman Test, maka kita dapat melakukan uji terhadap asumsi yang digunakan dalam model. a. Uji Homoskedastisitas Salah satu aumsi yang harus dipenuhi dalam persamaan regresi adalah bahwa taksiran parameter dalam model regresi bersifat BLUE (Best Linier Unbiased Estimate) maka var (ui) harus sama dengan σ2 (konstan), atau semua residual atau error mempunyai varians yang sama. Kondisi ini disebut dengan homoskedastisitas. Sedangkan bila varian tidak konstan atau berubah-ubah disebut heteroskedastisitas.
Untuk
mendeteksi
adanya
heteroskedastisitas
dapat
menggunakan metode General Least Square (Cross Section Weights) yaitu dengan membandingkan Sum Square Residu pada Weighted Statistics dengan Sum Square Residu Unweighted Statistics.
Jika Sum Square Residu pada
Weighted Statistics lebih besar dari Sum Square Residu Unweighted Statistics, maka terjadi heteroskedastisitas. b. Uji Autokorelasi Autokorelasi adalah korelasi yang terjadi antar observasi dalam satu peubah atau korelasi antar error masa yang lalu dengan error masa sekarang.Uji autokorelasi yang dilakukan tergantung pada jenis data dan sifat model yang digunakan.Autokorelasi dapat mempengaruhi efisiensi dari estimatornya. Tata cara untuk mendeteksi adanya korelasi serial adalah dengan melihat nilai Durbin Watson (DW). Cara untuk melihat ada /tidaknya autokorelasi dilakukan dengan membandingkan DW statistik dengan DW tabel. Adapun kerangka identifikasi terangkum dalam tabel berikut. Korelasi serial ditemukan jika error dari periode waktu yang berbeda saling berkorelasi. Hal ini bisa dideteksi dengan melihat pola random error dari hasil regresi. Tabel 3. Kerangka identifikasi autokorelasi Nilai DW 4 – dl < DW < 4 4 – du < DW < 4 – dl 2 < DW < 4 – du Du < DW < 2 dl < DW< du 0 < DW < dl Sumber: Gujarati,2004
Hasil Terdapat korelasi serial regresi Hasil tidak dapat ditentukan Tidak ada korelasi serial Tidak ada korelasi serial Hasil tidak dapat ditentukan Terdapat korelasi serial regresi
48
3.2.2.3 Evaluasi Model a
Uji-F Uji-F digunakan untuk melakukan uji hipotesis koefisien (slope) regresi
secara bersamaan. Jika nilai probabilitas F-statistic < taraf nyata, maka tolak H0 dan itu artinya minimal ada satu peubah bebas yang berpengaruh nyata terhadap peubah terikat, dan berlaku sebaliknya. b. Uji-t Setelah melakukan uji koefisien regresi secara keseluruhan, maka langkah selanjutnya adalah menghitung koefisien regresi secara individu dengan menggunakan uji-t. Hipotesis pada uji-t adalah: H0 : β i = 0 H1 : β i ≠ 0 Jika t-hitung > t-tabel maka tolah H 0 yang berarti peubah bebas secara statistik nyata pada taraf
nyata yang telah ditentukan dalam penelitian dan
berlaku hal yang sebaliknya. Jika nilai probabilitas t-statistik < taraf nyata, maka tolak H0 dan berarti bahwa peubah bebas nyata secara statitik. c. Koefisien Determinasi (R2) Koefisien determinasi (Goodness of Fit) merupakan suatu ukuran yang penting dalam regresi, karena dapat menginformasikan baik atau tidaknya model regresi yang terestimasi.
Nilai R2 mencerminkan seberapa besar variasi
daripeubah terikat Ydapat diterangkan oleh peubah bebas X. Jika R2 = 0, maka variasi Y tidak dapat diterangkan oleh X sama sekali; Jika R2 = 1, artinya bahwa variasi dari Y secara keseluruhan dapat diterangkan oleh X. d. Uji Normalitas Uji normalitas dilakukan untuk memeriksa apakah error term mendekati distribusi normal atau tidak. Jika asumsi tidak terpenuhi maka prosedur pengujian menggunakan statistik t menjadi tidak sah. Uji normalitas error term dilakukan dengan menggunakan uji Jarque Bera. Berdasarkan nilai probabilitas Jarque Bera
49
yang lebih besar dari taraf nyata 5 persen, maka dapat disimpulkan bahwa error term terdistribusi normal. 3.2.2.4 Spesifikasi Model Penelitian Proses estimasi yang digunakan untuk mengetahui pengaruh variabel independen
terhadap
variabel dependen
dalam
penelitian
ini
adalah
penggabungan data antar waktu dengan data antar individu yang disebut dengan pooling. Sedangkan data yang dihasilkan disebut dengan pooled data atau panel data atau longitudinal data. Analisis data panel dalam penelitian ini dipergunakan untuk mengetahui faktor-faktor yang mempengaruhi indeks pembangunan manusia daerah perbatasan. Untuk mengetahui faktor yang mempengaruhi indeks pembangunan manusia, model dimodifikasi dari Ramirez, et. al (2000) menjadi: Yit= β0 + β1INCit+ β2POVit+ β3EDU1it + β4EDU2it + β5GOVEit + β6 GOVH it + β7HLTHit+ β8INFit + β9TPTit + εit
dimana: Y
: IPM
INC
: PDRBpPerkapita (Juta Rupiah)
POV
: Rasio penduduk miskin
EDU1 : Rasio murid SD terhadap guru EDU2 : Rasio murid SMPterhadap guru GOVE : Pengeluaran pemerintah bidang pendidikan GOVH : Pengeluaran pemerintah bidang kesehatan HLTH : Rasio dokter terhadap jumlah penduduk INF
: Rasio infrastruktur jalan
TPT
: Rasio tingkat pengangguran terbuka
ε
: error term
i
: Kabupaten/Kota
t
: Tahun
50
3.3
Definisi Operasional Pada bagian sebelumnya telah dijelaskan faktor-faktor yang berpengaruh
terhadap indeks pembangunan manusia. Berdasarkan faktor-faktor tersebut, berikut definisi operasional beberapa variabel yang digunakan dalam penelitian: 1. PDRB per kapita adalah penjumlahan seluruh komponen nilai tambah bruto yang mampu diciptakan oleh sektor-sektor ekonomi atas berbagai aktifitas produksinya yang dihitung berdasarkan harga konstan tahun 2000, dibagi dengan jumlah penduduk. Satuan PDRB per kapita adalah ribu rupiah 2. Rasio jumlah penduduk miskin adalah rasio jumlah penduduk
yang
mempunyai pengeluaran per kapita di bawah garis kemiskinan dibagi dengan jumlah penduduk. Rasio jumlah penduduk dihitung dengan satuan persentase. 3. Rasio murid SD terhadap guru adalah jumlah seluruh penduduk usia 7- 12 tahun dibagi dengan jumlah total guru SD. Rasio murid SD terhadap guru dihitung dengan satuan persentase. 4. Rasio murid SLTP terhadap guru adalah jumlah seluruh penduduk usia 13- 15 tahun dibagi dengan jumlah total guru SMP. Rasio murid SMP terhadap guru dihitung dengan satuan persentase. 5. Pengeluaran pemerintah bidang pendidikan adalah nilai realisasi pengeluaran pembangunan yang digunakan untuk melihat kemampuan daerah dalam segi pendanaan dalam rangka pembangunan bidang pendidikan. Satuan untuk pengeluaran pemerintah bidang pembangunan adalah juta rupiah. 6. Pengeluaran pemerintah bidang kesehatan adalah nilai realisasi pengeluaran pembangunan yang digunakan untuk melihat kemampuan daerah dalam segi pendanaan dalam rangka pembangunan bidang kesehatan. Satuan untuk pengeluaran pemerintah bidang pembangunan adalah juta rupiah. 7. Rasio dokter terhadap jumlah penduduk adalah jumlah dokter dibagi dengan jumlah penduduk. Rasio dokter terhadap penduduk dihitung dengan satuan persentase. 8. Rasio infrastruktur jalan jumlah seluruh jalan dalam kondisi baik/sedang dibagi jumlah penduduk. Rasio infrastruktur di hitung dengan satuan persentase. 9. Rasio tingkat pengangguran terbuka adalah rasio antara angkatan kerja yang sedang mencari pekerjaan dengan jumlah seluruh penduduk usia kerja. Rasio tingkat pengangguran ini dihitung dengan satuan persentase.