BAB III METODOLOGI
3.1.
Sumber Data Data yang digunakan dalam penelitian ini adalah data sekunder yang
berasal dari Badan Pusat Statistik (BPS) dan kementrian terkait. Data yang bersumber dari BPS adalah data tenaga kerja, upah, dan Produk Domestik Regional Bruto tahun 2003-2010. Data investasi berasal dari Badan Koordinasi Penanaman Modal.
3.2.
Cakupan Penelitian Penelitian ini menggunakan periode data tahun 2003-2010. Cakupan
wilayah penelitian meliputi seluruh provinsi di Pulau Jawa yaitu DKI Jakarta, Jawa Barat, Jawa Tengah, DI Yogyakarta, Jawa Timur, dan Banten.
3.3.
Analisis Deskriptif Analisis deskriptif merupakan analisis sederhana yang digunakan untuk
memaparkan perkembangan tenaga kerja, pertumbuhan ekonomi, upah minimum provinsi dan investasi di seluruh provinsi di Pulau Jawa.
3.4.
Analisis Model Regresi untuk Data Panel Data panel menurut Gujarati (2004) merupakan suatu data cross-section
(individu/sektor) yang disusun berdasarkan runtun waktu (time series). Struktur data panel menggabungkan antara data sektoral atau individu dan runtun waktu
24
yang biasanya berdiri sendiri menjadi sebuah satu kesatuan data. Beberapa keuntungan yang diperoleh dengan data panel antara lain: Semakin banyak jumlah observasi akan memperbesar derajat kebebasan
1.
(degree of freedom) dan menurunkan kemungkinan kolinearitas antar variabel bebas. Penggunaan data panel memberikan kemungkinan untuk menganalisis
2.
karakteristik baik antar sektor atau individu maupun menurut waktu secara terpisah dengan proses estimasi yang simultan. Dengan kata lain, secara simultan akan dapat diestimasi karakteristik individu yang mencerminkan dinamika antar waktu dari masing masing variabel yang dianalisis. Analisis terhadap hasil estimasi
menjadi lebih komprehensif dan
mencakup hal-hal yang lebih mendekati realita.
3.4.1
Bentuk Model Regresi dengan Data Panel Data panel adalah satu set observasi yang terdiri dari beberapa individu
pada suatu periode tertentu. Observasi tersebut merupakan pasangan yit (variabel terikat) dengan xit (variabel bebas) dimana i menunjukkan individu, t menunjukkan waktu, dan j menunjukkan variabel bebas yang dinyatakan dalam sebuah persamaan berikut:
yit xjit it .............................................................................
(3.1)
i = urutan provinsi t = tahun Selain harus memenuhi asumsi klasik seperti non-autokorelasi, homoskedastisitas, dan non-multikolinearitas, terdapat beberapa asumsi tambahan untuk model
25
regresi data panel, yaitu tidak terdapatnya hubungan (korelasi) antara: (1) Individu satu dengan individu lainnya; (2) α dan it ; dan (3) it dan xit. Ada tiga macam model estimasi data panel yaitu Pooled Model, Fixed Effect Model, Random Effect Model. 1. Pooled Model Jika semua asumsi tersebut terpenuhi maka metode Ordinary Least Square (OLS) dapat digunakan untuk mengestimasi model untuk data panel yang disebut dengan Pooled Estimation. Metode ini mengasumsikan bahwa intersept α dan slope β konstan, berlaku untuk seluruh individu. Persamaan pada estimasi menggunakan pooled least square dapat dituliskan dalam bentuk sebagai berikut: Yit = α + βj xjit + μit..........................................................................................................................
(3.2)
i = urutan provinsi j = urutan variabel independen t = tahun 2. Fixed Effect Model Fixed Effects Model memasukkan unsur variabel dummy sehingga intersept α bervariasi antar individu maupun antar unit waktu. Fixed effects model lebih tepat digunakan jika data yang diteliti ada pada tingkat individu atau apabila syarat (3) dilanggar, yaitu terdapat korelasi antara it dan xit. Spesifikasi Fixed effects model yang dibahas pada penelitian ini yaitu: Yit= β1i+ β2X2it+ β3X3it+ uit ..................................................................................................
(3.3)
26
yang menggambarkan bahwa intercept dari individu berbeda-beda, tetapi model masih memiliki koefisien slope sama
3. Random Effect Pada Random Effect, intersept α diintegrasikan ke dalam komponen error it sehingga menjadi cross section error (αi), time series error (αt) dan combination error (αit). Random effect akan lebih tepat digunakan jika memang benar bahwa tidak ada hubungan antara it dan xit karena jika it dan xit berkorelasi maka estimasi menggunakan random effect model akan bias. (Judge, 1998). Model ini sering disebut sebagai juga Error Correction Model (ECM) dengan ide dasar: Yit= β1i+ β2X2it+ β3X3it+ uit .........................................................................................
(3.4)
β1i = β1+ εi
i = 1, 2, . . . ,N ............................................
(3.5)
Yit = β1 + β2X2it+ β3X3it+ εi+ uit= β1+ β2X2it+ β3X3it+ wit .......................
(3.6)
wit= εi+ uit ..............................................................................................................................
(3.7)
εi~ N(0, δε2) = komponen cross section error uit ~ N(0, δu2) = komponen time series error E(εiuit) = 0
E(εiεj) =0
(
E(uituis) = E(uitujt) = E(uitujs) =0 (
j) j;t
)
Error secara individual dan error secara kombinasi diasumsikan tidak berkolerasi.
27
3.4.2 Penyimpangan terhadap Asumsi Model Regresi Tiga masalah yang seringkali muncul sehingga mengakibatkan asumsi dasar model regresi tidak terpenuhi yaitu multikolinearity, heteroskedastisity, dan autocorrelation. 1. Multikolinearity Salah satu asumsi dasar model regresi adalah tidak ada hubungan linear antara variabel-variabel bebas dalam model. Cara untuk mendeteksi multicolinearity adalah dengan menghitung korelasi-korelasi antara dua variabel bebas. Jika korelasi lebih besar dari 0,8 maka multicolinearity merupakan masalah. 2. Heteroskedastisity Asumsi dasar lainnya adalah varians dari error yang dihasilkan adalah konstan. Dampak heteroskedastisity adalah hasil uji t dan F dapat menjadi tidak berarti (tidak ada gunanya). Mendeteksi adanya heteroskedastisitas dapat
dilakukan
melalui
paket
program
Eviews
6.0
dengan
membandingkan sum square resid pada hasil estimasi weighted dan unweighted.
Masalah
heteroskedastisitas
dapat
diatasi
dengan
menggunakan metode white-heteroskedastisity. Pada paket program Eviews 6.0 juga terdapat opsi yang memungkinkan untuk menghasilkan penduga yang dapat mengatasi masalah heteroskedastisity dan korelasi error antar individu dalam data yaitu opsi Cross Section SUR. Cross Section SUR akan melakukan koreksi
28
terhadap keberadaan heteroskedastisity dan korelasi error antar individu (Zellner’s dalam Hecth dan Haye, 2009). 3. Autocorrelation Asumsi yang terakhir adalah tidak adanya korelasi antar error yang dihasilkan. Autocorrelation dapat memengaruhi efisiensi model. Cara mendeteksi Autocorelation adalah dengan uji Durbin Watson. Hipotesis dalam pengujian autokorekasi adalah: H0: tidak ada Otokorelasi positif atau negatif H1: terdapat masalah Otokorelasi positif atau negatif. Kriteria pengujian:
0
d L L
dU
2
Tidak ada kesimpulan
Tolak H0 Ada masalah Otokorelasi positif
4dU
4dL
4
Tidak ada kesimpulan
Tidak Tolak H0 tidak ada masalah Otokorelasi
Tolak H0 Ada masalah Otokorelasi
positif/negatif
negatif
Sumber: Yamin, 2010
Gambar 4. Kriteria pengujian autokorelasi dengan Uji Durbin Watson Tolak H0 bila
Nilai d hitung atau nilai Durbin Watson Model lebih besar daripada nilai Durbin Watson table batas bawah (dL) yang berarti terdapat masalah otokorelasi positif (dw < dL)
d
29
Atau, nilai d hitung ataunilai Durbin Watson Model terletak antara nilai (4–dL < dw < 4) yang berarti terdapat masalah otokorelasi negatif
Tidak tolak H0 bila
Nilai d hitung atau nilai Durbin Watson Model terletak antara nilai (dU < dw < 4-dU)
3.4.3
Pemilihan Model Terbaik Berdasarkan asumsi model yang sudah dijelaskan sebelumnya akan
dilakukan pemilihan model terbaik dengan menggunakan Uji Chow untuk memilih antara Pooled Model dan Fixed Effects Model (FEM) serta Uji Hausman untuk menentukan apakah Random Effects Model (REM) atau Fixed Effect Model yang lebih tepat digunakan. 1. Chow Test Chow Test atau beberapa buku menyebutnya pengujian F Statistics adalah pengujian untuk memilih apakah model yang digunakan Pooled Least Square atau Fixed Effect. Seperti yang kita ketahui, terkadang asumsi bahwa setiap unit cross section memiliki perilaku yang sama cenderung tidak realistis mengingat dimungkinkan saja setiap unit cross section memiliki perilaku yang berbeda. Dalam pengujian ini dilakukan dengan hipotesa sebagai berikut: H0: Model Pooled Least Square H1: Model Fixed Effect
30
Dasar penolakan terhadap hipotesa nol adalah dengan menggunakan FStatistik seperti yang dirumuskan oleh Chow: CHOW
( RRSS URSS ) /( N 1) URSS /( NT N K ) .................................................
(3.8)
Dimana: RRSS = Restricted Residual Sum Square URSS = Unrestricted Residual Sum Square N
= Jumlah data cross section
T
= Jumlah data time series
K
= Jumlah variabel penjelas,
Chow Test ini mengikuti distribusi F-statistik yaitu FN-1, NT-N-K. Jika nilai CHOW Statistics (F-Stat) hasil pengujian lebih besar dari F Tabel, maka cukup bukti untuk melakukan penolakan terhadap hipotesa nol sehingga model yang digunakan adalah fixed effect model, begitu juga sebaliknya. Pengujian ini disebut sebagai Chow Test karena kemiripannya dengan Chow Test yang digunakan untuk menguji stabilitas dari parameter (stability test). 2. Hausman Test Hausman Test adalah pengujian statistik sebagai dasar pertimbangan kita dalam memilih apakah menggunakan fixed effect model atau random effect model. Seperti yang kita ketahui bahwa penggunaan model fixed effect model mengandung suatu unsur trade off yaitu hilangnya derajat kebebasan dengan memasukkan variabel dummy. Namun, penggunaan
31
metode random effect model pun harus memperhatikan ketiadaan pelanggaran asumsi dari setiap komponen galat. Hausman Test dilakukan dengan hipotesa sebagai berikut: H0: Random Effects Model H1: Fixed Effects Model. Sebagai dasar penolakan Hipotesa nol maka digunakan statistik hausman dan membandingkannya dengan chi square. Statistik hausman dirumuskan dengan: m b M 0 M 1 '
1
b
~ X 2 K .................................
(3.9)
Dimana adalah vektor untuk statistik variabel fixed effect, b adalah vektor statistik variabel random effect, ( M 0 ) adalah matriks kovarians untuk dugaan FEM dan ( M 1 ) adalah matriks kovarians untuk dugaan REM.
3.5 Uji Statistik 1.
Pengujian Koefisien Regresi Secara Simultan (Uji F-Statistik) Uji-F digunakan untuk mengetahui tingkat signifikansi pengaruh variabel
bebas secara serentak terhadap variabel tidak bebas. Adapun pengujiannya dilakukan dengan rumus sebagai berikut (Gujarati, 2004): R2 F
(k 1)
(1 R 2 )
...........................................................................
(n k )
F
= Nilai F hitung
R2
= Koefisien determinan (R-Square)
(3.10)
32
k
= Banyaknya variabel dalam penelitian
n
= Banyaknya sampel
Dengan derajat kebebasan (df) = (k-1)(n-1) dan tingkat keyakinan 95% atau α=0,05. Hipotesis Statistik: a.
H0: bi = 0 (i = 0,1,...,n) artinya variabel bebas (independent variable) yang bekerja secara bersamasama tidak berpengaruh terhadap variabel tidak bebasnya (dependent variable)
b.
H0: bi ≠ 0 (i = 0,1,...,n), atau sekurang-kurangnya satu koefisien variabel bebas tidak sama dengan nol artinya variabel bebas (independent variable) yang bekerja secara bersamasama berpengaruh terhadap variabel tidak bebasnya (dependent variable)
Kriteria Pengujian: a.
H0 diterima jika F hitung ≤ F tabel, artinya variabel bebas (independent variable) yang bekerja secara bersama-sama tidak berpengaruh secara signifikan terhadap variabel tidak bebasnya (dependent variable)
b.
H0 ditolak jika F hitung > F tabel, artinya variabel bebas (independent variable) yang bekerja secara bersama-sama berpengaruh secara signifikan terhadap variabel tidak bebasnya (dependent variable)
33
2.
Pengujian Koefisien Regresi Secara Parsial (Uji t-Statistik) Uji-t digunakan untuk mengetahui tingkat signifikansi pengaruh dari
masing-masing
variabel
bebas
terhadap
variabel
tidak
bebas.
Adapun
pengujiannya dilakukan dengan rumus sebagai berikut (Gujarati, 2004):
t
bi ............................................................................................... Sbi
(3.11)
t
= Nilai t hitung
bi
= Koefisien regresi variabel bebas ke-i
Sbi
= Kesalahan baku regresi/standar eror koefisien regresi variabel bebas ke-i
Dengan derajat kebebasan (df) = (n-k) dan tingkat keyakinan 95% atau α = 0,05. Hipotesis Statistik: a.
H0: bi = 0 (i = 0,1,...,n) artinya variabel bebas (independent variable) yang bekerja secara parsial atau individu tidak berpengaruh terhadap variabel tidak bebasnya (dependent variable)
b.
H0: bi ≠ 0 (i = 0,1,...,n), atau sekurang-kurangnya satu koefisien variabel bebas tidak sama dengan nol artinya variabel bebas (independent variable) yang bekerja secara parsial atau individu berpengaruh terhadap variabel tidak bebasnya (dependent variable)
Kriteria Pengujian: a.
H0 diterima jika t hitung negatif ≥ t tabel ≥ t hitung positif, artinya variabel bebas (independent variable) yang bekerja secara parsial atau individu tidak
34
berpengaruh secara signifikan terhadap variabel tidak bebasnya (dependent variable) b.
H0 ditolak jika t hitung negatif ≤ t tabel atau t hitung positif ≥ t tabel, artinya varibel bebas (independent variable) yang bekerja secara parsial atau individu berpengaruh secara signifikan terhadap variabel tidak bebasnya (dependent variable)
3.
Uji Koefisien Determinasi (R²) Nilai Uji R² mengukur kecocokan (goodnes of fit) dari persamaan regresi
yaitu memberikan proporsi atau presentasi variasi total dalam variabel tidak bebas yang dijelaskan oleh variabel bebas atau merupakan suatu ukuran yang menunjukkan seberapa baik garis regresi sampel menggambarkan populasi. Atau dengan kata lain bahwa Uji R² digunakan untuk menghitung seberapa besar variasi dari variabel bebas yang dapat menjelaskan variasi dari variabel tidak bebas. Nilainya berkisar antara 0-1. Jika nilai R² sama dengan 1, maka variasi variabel bebas mampu menjelaskan 100 persen variasi variabel tidak bebas. Sebaliknya jika nilai R² sama dengan 0, maka variasi variabel bebas tidak mampu menjelaskan sedikitpun variasi variabel tidak bebas. Kecocokan model dikatakan ”lebih baik” jika nilai R² semakin dekat dengan 1.
4.
Uji Elastisitas Untuk mengetahui variabel mana yang paling berpengaruh dari variabel
bebas terhadap variabel tidak bebas maka digunakan uji elastisitas, yaitu dengan membandingkan besarnya nilai koefisien beta dari variabel bebas yang terbesar.
35
3.6 Spesifikasi Model Rancangan model yang akan diajukan adalah model regresi linear berganda dengan empat variabel bebas. Variabel independennya adalah jumlah tenaga kerja terserap pada sektor industri. Data yang diperoleh pada variabel-variabel tersebut memiliki satuan yang berbeda. Oleh karena itu, untuk memudahkan dalam mengolah data dan interpretasi hasil akhirnya, keempat variabel ini akan diubah bentuknya sehingga menjadi bentuk satuan yang sama, yaitu dalam persentase. Beberapa variabel akan diubah menjadi bentuk log natural sehingga koefisien hasil regresi diinterpretasikan sebagai elastisitas. Dengan model tersebut, diharapkan bahwa hasil regresi yang diperoleh akan lebih efisien dan mudah untuk diinterprestasikan. Sesuai dengan keterangan di atas, maka model tersebut secara ekonometrika akan menjadi: Ln (TK_INDit) = α + β1 ln(UMP_RIILit) + β2 ln(PDRB_INDit) + β3 (PMA_INDit) + β4 (PMDN_INDit) Dimana: TK_INDit
=
Jumlah tenaga kerja terserap pada sektor industri provinsi i tahun t (orang)
UMP_RIILit
=
Upah Minimum Provinsi Riil provinsi i tahun t (Rp/bulan)
PDRB_INDit
=
Nilai PDRB sektor industri pada provinsi i tahun t (milyar rupiah)
PMA_INDit
=
Persentase Nilai PMA sektor industri terhadap Total PMA provinsi i tahun t (persen)
36
PMDN_it
=
Persentase Nilai PMDN sektor industri terhadap Total PMDN provinsi i tahun t (persen)
3.7 Definisi Variabel Operasional Definisi operasional variabel yang digunakan dalam model penelitian ini antara lain: 1)
TK_IND Variabel TK_IND merupakan variabel yang merepresentasikan penyerapan tenaga kerja sektor industri. Nilai variabel TK ini merupakan jumlah tenaga kerja terserap sektor industri pada provinsi i dan tahun t yang diperoleh dari hasil Survei Angkatan Kerja Nasional (SAKERNAS) periode Agustus yang dilakukan oleh BPS.
2)
PMA_IND Variabel
PMA_IND
merupakan
variabel
yang
merepresentasikan
penanaman modal asing langsung pada sektor industri. Nilai variabel PMA_IND ini merupakan nilai PMA sektor indurti suatu provinsi selama satu tahun dibagi nilai total PMA. Nilai PMA sektor industri merupakan jumlah investasi asing riil yang meliputi investasi ke dalam aset-aset secara nyata berupa pembangunan pabrik-pabrik, pengadaan berbagai macam barang modal, pembelian tanah untuk keperluan produksi, dan sebagainya (tidak termasuk investasi portofolio). Data yang digunakan merupakan realisasi PMA berdasarkan ijin usaha yang diperoleh dari BKPM.
37
3)
PMDN_IND Variabel
PMDN_IND
merupakan
variabel
yang merepresentasikan
penanaman modal domestik langsung pada sektor industri. Nilai variabel PMDN_IND ini merupakan nilai PMDN sektor industri suatu provinsi selama satu tahun dibagi nilai total PMDN. Nilai PMDN sektor industri merupakan jumlah investasi riil dalam negeri yang meliputi investasi ke dalam aset-aset secara nyata berupa pembangunan pabrik-pabrik, pengadaan berbagai macam barang modal, pembelian tanah untuk keperluan produksi, dan sebagainya (tidak termasuk portofolio). Data yang digunakan merupakan realisasi PMDN berdasarkan ijin usaha yang diperoleh dari BKPM. 4)
PDRB_IND Variabel PDRB_IND merupakan variabel yang merepresentasikan output sektor industri selama setahun pada suatu provinsi. Nilai variabel PDRB_IND ini merupakan jumlah PDRB sektor industri atas dasar harga konstan tahun 2000 pada provinsi i tahun t.
5)
UMP_RIIL Variabel UMP merupakan variabel yang merepresentasikan upah minimum riil pada suatu provinsi. Nilai variabel UMP ini merupakan nilai nominal UMP dibagi dengan Indeks Harga Konsumen (IHK) tahun dasar tahun 2002.