Seminar Nasional Statistika IX Institut Teknologi Sepuluh Nopember, 7 November 2009
PEMODELAN REGRESI PROBIT ORDINAL TERHADAP INDEKS PEMBANGUNAN MANUSIA PROPINSI JAWA TENGAH TAHUN 2007 Defi Yusti Faidah1 dan Purhadi2 1
Mahasiswa Jurusan Statistika FMIPA-ITS 2 Dosen Jurusan Statistika FMIPA-ITS
ABSTRAK Pembangunan manusia merupakan paradigma pembangunan yang menempatkan manusia sebagai fokus dan sasaran akhir dari seluruh kegiatan pembangunan, yaitu tercapainya penguasaan atas sumber daya guna memperoleh pendapatan untuk mencapai hidup layak, peningkatan derajat kesehatan agar dapat memperpanjang usia hidup dan meningkatkan pendidikan. Semua indikator yang merepresentasikan dimensi pembangunan manusia tersebut terangkum dalam satu nilai tunggal, yaitu angka Indeks Pembangunan Manusia. Penilitian ini akan mengkaji faktor-faktor yang mempengaruhi Indeks Pembangunan Manusia (IPM) di Propinsi Jawa Tengah dengan menggunakan model regresi probit ordinal. Penaksiran parameter model ini menggunakan metode maximum likelihood estimator (MLE) yang fungsi likelihoodnya dimaksimumkan dengan metode NewtonRaphson untuk mendapatkan nilai penaksir parameternya. Pemilihan model terbaik digunakan kriteria AIC dan SBIC. Setelah diperoleh model terbaik, maka faktor-faktor yang mempengaruhi IPM adalah persentase penduduk yang berpendidikan di atas
SLTP dan rasio ketergantungan penduduk. Kata Kunci : Regresi probit ordinal, maximum likelihood estimator, Indeks Pembangunan Manusia
1.
Pendahuluan Pembangunan manusia merupakan paradigma pembangunan yang menghendaki adanya
perubahan kualitas manusia menjadi lebih baik dari kualitas yang lebih rendah menjadi lebih tinggi tingkatannya. Dilihat dari data IPM tahun 2007 di tingkat Propinsi, Jawa Tengah berhasil menempati peringkat IPM ke-14 yang lebih tinggi dari Jawa Timur dan Jawa Barat. Penelitian sebelumnya tentang IPM Propinsi Jawa Timur tahun 2006 telah dilakukan oleh Salam (2008) yang mengkaji faktor-faktor yang mempengaruhi IPM di Propinsi Jawa Timur dengan menggunakan regresi logistik ordinal. Metode lain yang dapat digunakan untuk menjelaskan hubungan antara variabel respon yang merupakan variabel diskrit berskala ordinal dengan variabel bebas yang terdiri dari variabel kontinu, diskrit atau campuran antara keduanya adalah regresi probit ordinal. Beberapa penelitian sebelumnya yang mengkaji pemodelan regresi probit ordinal telah dilakukan diantaranya oleh McKelvey dan Zavoina 1
(1975) mengkaji penaksiran parameter model menggunakan metode MLE dan pengujian parameter model menggunakan metode likelihood ratio test dan hasil kajian diaplikasikan pada voting anggota kongres parlemen Amerika Serikat dalam pembuatan kebijakan. O’Donnell dan Connor (1996) menggunakan model regresi probit ordinal untuk mengetahui faktor-faktor yang mempengaruhi pengendara sepeda motor mengalami luka ringan, sedang, berat dan sangat berat akibat kecelakaan sepeda motor di New South Wales Australia. Kockelman dan Kweon (2002) menggunakan model regresi probit ordinal untuk mengetahui faktor-faktor yang mempengaruhi pengendara mobil mengalami luka ringan, sedang, berat dan sangat berat akibat kecelakaan mobil di Amerika Serikat. Berdasarkan uraian di atas, makalah ini bertujuan untuk mendapatkan faktor-faktor yang mempengaruhi IPM di Propinsi Jawa Tengah dengan harapan dapat dijadikan sebagai salah satu acuan pemerintah dalam mengambil kebijakan untuk meningkatkan IPM. Selain itu, berdasarkan model yang telah diperoleh dapat diketahui seberapa besar ketepatan pengklasifikasian objek pengamatan. 2.
Tinjauan Pustaka Pustaka yang digunakan dalam penelitian ini meliputi konsep regresi probit ordinal,
metode Maximum Likelihood, dan penaksiran parameter regresi probit ordinal. Secara lengkap, masing-masing akan dijelaskan sebagai berikut. 2.1 Regresi Probit Ordinal Pemodelan regresi probit ordinal diawali dengan memperhatikan model sebagai berikut
(O’Donnel dan Connor, 1996; Greene, ):
Y* 0 j βT x
(1)
dimana Y* adalah variabel respon yang merupakan variabel kontinu, 0 j adalah parameter intersep yang tidak diketahui, β adalah vektor parameter koefisien dengan
β 1 2 p T , x adalah vektor variabel bebas, dengan x 1 X1 Xp T dan adalah error yang diasumsikan berdistribusi N 0, 2 . Y* (0 j βT x) Selanjutnya dari persamaan (1) dilakukan transformasi ke dalam bentuk Z ,
dimana
Z ~N(0,1)
kategori maka untuk
Y secara ordinal Misal terdapat 3 1 Y* 2 dikategorikan dengan
Kemudian dilakukan pengkategorian terhadap
Y 1 *
dikategorikan dengan
2
Y 1, untuk
*
dan untuk Y* k dikategorikan dengan ordinal sebagai berikut :
Y 2,
Y 3,
sehingga diperoleh model regresi probit
1 (01 βT x) (2) PY 1 (02 βT x) 1 (01 βT x) (3) PY 2 2 2 (02 βT x) PY 3 1 (4) dimana 1, 2 , 3 adalah batasan (threshold), Y 1 untuk kategori terendah, Y 3 untuk kategori tertinggi dan
adalah fungsi distribusi kumulatif distribusi normal.
2.2 Metode Maksimum Likelihood Estimator (MLE)
Metode MLE adalah salah satu metode penaksiran parameter yang dapat digunakan untuk menaksir parameter suatu model yang diketahui distribusinya. Metode MLE merupakan metode yang memaksimumkan fungsi likelihood. Untuk mempermudah perhitungan, maka dilakukan transformasi log terhadap fungsi likelihood sehingga bisa dibentuk fungsi log likelihood. Secara umum estimasi parameter didapatkan dengan melakukan turunan parsial pertama fungsi log likelihood terhadap parameter yang akan diestimasi dan disamakan dengan nol (Agresti, 2002). 2.3 Penaksiran Parameter Regresi Logistik Ordinal Untuk menaksir parameter regresi probit ordinal, digunakan metode MLE. Metode ini biasanya digunakan untuk menaksir parameter suatu model yang diketahui distribusinya. Penaksiran parameter regresi probit ordinal dengan metode maksimum likelihood ini diawali dengan membuat fungsi likelihood sebagai berikut :
Lβ Y1, Y2 , Y3 PYu P Y1u Y2u Y3u n
u1
n
u1
( β x ) y0u ( βT x ( βT x ) y1u 01 u 2 02 u 1 01 u 1 n Lβ T T 2 (02 β xu 2 (02 β xu u1 1 1 T
T 1 2 (02 β xu )
(5)
3
dan fungsi log-natural likelihoodnya adalah :
1 (01 βTxu ) 2 (02 βTxu ) ln Lβ y1uln ln 1 u1 n
(02 βT xu ) 1 (01 βT xu ) 2 (02 βT xu ) y2u ln 2 ln 1 2 (02 βT xu ) ln1 n 2 (02 βTxu ) 2 (02 βTxu ) ( βTxu ) n 1 1 y1u ln 1 01 y ln 1 n ln iu u1 u1 i0
2 (02 βT xu 1 (01 βT xu y iu ln u1 i1 n 1 01 βT xu n 2 2 02 βT xu y1u ln 1 yiu ln1 u1 u1 i1 n 2 (02 βT xu ) 1 (01 βT xu ) (6) y 2u ln u1 Penaksir untuk β dapat diperoleh dengan memaksimumkan fungsi ln likelihood yaitu dengan n
2
mencari turunan pertama dari fungsi ln likelihood. Hasil yang diperoleh adalah sebagai berikut :
1 1 (01 βT xu ) 1 1 (01 βT xu ) y1u y2u n ln Lβ n T T T 01 u1 β xu u1 2 (02 β xu ) 1 (01 β xu ) 1 01 2 1 2 (02 βTxu ) 1 2 (02 βTxu ) 1 y y 2u n ln Lβ n i1 iu T T T 02 ( β xu ) u1 u1 2 (02 β xu ) 1 (01 β xu ) 1 2 02
(7)
(8)
xu 1 (01 βT xu ) 2 xu 2 (02 βT xu ) y1u yiu n 1 ln Lβ n i1 T T T β (01 β xu ) (02 β xu ) u1 u1 1 1 2 4
xu 2u (02 βT xu ) 1 (01 βT xu ) y2u n 2u (02 βT xu ) 1 (01 βT xu ) u1
(9)
β , maka persamaan di atas disamakan dengan nol. Setelah menyamakan persamaan dengan nol ternyata penaksir untuk β tidak bisa langsung diperoleh karena fungsinya berbentuk implisit. Akibatnya penaksir untuk β tidak bisa langsung didapat. Sehingga untuk mendapatkan penaksir maksimum likelihood untuk β digunakan metode iteratif Newton-Raphson Untuk mendapatkan penaksir untuk
dengan rumus
β(t 1) β(t) , dimana 3.
dan proses iterasi pada rumus tersebut akan berhenti jika
β(t 1) β(t) H1 β(t) g β(t)
adalah bilangan yang kecil sekali atau iterasi berhenti jika
t T .
Metodologi Penelitian Sumber data yang digunakan dalam penelitian ini berasal dari Badan Pusat Statistik (BPS) data
yang diambil dari publikasi maupun data dari hasil survei. Data publikasi yang diambil adalah data publikasi propinsi dalam angka tahun 2007 dan publikasi Laporan Pembangunan Manusia Indonesia tahun 2007 sedangkan data survei yang diambil adalah data Survei Sosial Ekonomi Nasional (SUSENAS) tahun 2007. Pada penelitian ini yang dijadikan unit observasi adalah kabupaten/kota dimana pada tahun 2007 Propinsi Jawa Tengah terdiri dari 35 kabupaten/kota. Variabel yang digunakan meliputi variabel respon yaitu Indeks Pembangunan Manusia yang terbagi menjadi rendah, sedang dan tinggi. Sedangkan variabel prediktornya adalah persentase penduduk yang tinggal di daerah perkotaan (X1), persentase penduduk yang berpendidikan di atas SLTP (X2), rata-rata pendapatan perkapita (X3), rasio ketergantungan (X 4), peranana sektor industri dalam PDRB (X5) dan persentase penduduk miskin (X 6). Pemilihan model IPM terbaik berdasarkan nilai AIC dan SBIC yang terkecil. Sehingga dari model tersebut dapat diketahu factor-faktor yang mempengaruhi IPM Propinsi Jawa Tengah.
4.
Analisa Dan Pembahasan Sebagai gambaran awal dilakukan analisis statistik deskriptif terhadap semua variabel
yang diteliti untuk mengetahui karakteristik dari kabupaten/kota di di Propinsi Jawa Tengah. Karakteristik yang dimaksud meliputi eksplorasi variabel respon maupun prediktor sehingga
5
diperoleh informasi yang lebih luas. Hasil analisis deskriptif dapat dilihat pada Tabel 1 dan Tabel 2. Tabel 1. Persentase Kelompok Kabupaten/Kota Propinsi Jawa Tengah Kelompok Rendah Menengah Tinggi
Jawa Tengah Jumlah Persentase 13 37.14 18 51.43 4 11.43
Berdasarkan Tabel 1 dapat diketahui bahwa 37,14 persen Kabupatern/Kota di Jawa tengah tergolong dalam wilayah yang memiliki tingkat IPM yang rendah. Sebagaian besar Kabupaten/Kota di Jawa Tengah tergolong dalam wilayah yang memiliki IPM sedang yaitu mencapi 51,43 persen. Sedangkan 11,43 persen tergolong dalam wilayah yang memiliki IPM tinggi.
Sedangkan untuk mengetahui perbedaan karakteristik antara kelompok kabupaten/kota dengan tingkat IPM rendah, menengah dan tinggi, maka dilakukan eksplorasi data statistika deskriptif yang disajikan pada Tabel 2. Tabel 2. Persentase Karakteristik Kelompok Kabupaten/Kota Propinsi Jawa Tengah Keseluruhan
Rendah
Menengah
Tinggi
Variabel
RataRata
Standar Deviasi
RataRata
Standar Deviasi
RataRata
Standar Deviasi
RataRata
Standar Deviasi
X1
46,92
27,63
32,53
13,46
46,17
25,42
97,06
3,43
X2
37,4
11,35
28,92
5,43
38,19
6,73
61,38
1,65
X3
277,23
66,82
239,85
26,89
269,47
35,63
433,61
38,58
X4
0,52
0,05
0,56
0,03
0,52
0,04
0,45
0,01
X5
21,45
15,28
17,38
9,66
25,17
18,77
17,97
10,27
X6
19,31
7,15
23,59
4,55
18,41
6,92
9,48
3,45
Persentase penduduk yang tinggal di perkotaan berpengaruh terhadap tingkat pendidikan, tingkat pendapatan dan tingkat pengeluaran. Apabila tidak dibedakan berdasarkan kategori maka 46,92 persen penduduknya tinggal di daerah perkotaan. Kelompok kabupaten/kota dengan tingkat IPM tinggi, 97,06 persen penduduknya tinggal di daerah perkotaan, sedangkan kabupaten/kelompok dengan IPM yang rendah hanya 35,53 persen saja. Kelompok kabupaten/kota dengan IPM sedang, 46,17 persen penduduknya tinggal di perkotaan. Selain itu memiliki standar deviasi paling besar dibanding dengan kelompok yang lain. Hal ini berarti bahwa adanya variasi yang sangat tajam di antara kabupaten/kota pada tersebut. Rata-rata penduduk yang berpendidikan di atas SLTP di Propinsi Jawa Tengah adalah 37,4 persen. Pada kelompok kabupaten/kota dengan IPM tinggi adalah mencapai 61,38 6
persen, kabupaten/ kota dengan IPM sedang 38,19 persen sedangkan kabupaten dengan IPM rendah hanya 28,92 persen. Secara keseluruhan rata-rata pendapatan perkapita adalah 277,23. Kabupaten dengan IPM tinggi memiliki rata-rata pendapatan perkapita yang
paling besar, sedangkan
kabupaten/kota dengan IPM rendah rata-rata pendapatan perkapita hanya sebesar 239,85. Rasio ketergantungan penduduk dapat digunakan untuk menganalisis ketenagakerjaan. Semakin tinggi nilai rasio memungkinkan rendahnya perkembangan wilayah. Secara keseluruhan rasio ketergantungan penduduk Propinsi Jawa Tengah adalah 0,52 sedangkan untuk kabupaten/kota dengan IPM rendah, sedang dan tinggi masing-masing adalah 0,56; 0,52 dan 0,45 persen. Dari ketiga kelompok tersebut, rasio ketergantungan penduduknya masih cenderung tinggi, tetapi standar deviasinya cukup kecil. Hal ini berarti kabupaten/kota di ketiga kelompok mempunyai rasio ketergantungan penduduk yang hampir sama. Besarnya pengeluaran sektor industri terhadap PDRB akan berpengaruh terhadap pengeluaran konsumsi penduduk, mengingat daerah yang maju sektor industrinya akan meningkatkan tingkat pendidikan dan kesejahteraan masyarakatnya. Kelompok dengan IPM sedang memiliki persentase pengeluaran sektor industri terhadap PDRB paling besar dibanding yang lain. Persentase jumlah penduduk miskin pada kelonpok dengan IPM tinggi hanya sebesar 9,48 persen, sedangkan kelompok dengan IPM rendah sebesar 23,59 persen. 4.2 Hasil Pemodelan Regresi Probit Ordinal Setelah diketahui karakteristik dari masing-masing variabel maka selanjutnya akan dilakukan pemilihan model terbaik dengan menggunakan kriteria AIC dan SBIC dengan memasukkan satu per satu variabel prediktor. Model terbaik adalah model yang memiliki nilai AIC dan SBIC terkecil yaitu sebagai berikut:
(10) 5,0825 0,1746X2 19,7234X4 PˆY 1 0,9906 (0,9) 0,4353 0,1746X2 19,7234X4 PˆY 2 0,9906 (10) 5,0825 0,1746X2 19,7234X4 0,9906 (0,9) 0,4353 0,1746X2 19,7234X4 PˆY 3 1 0,9906 7
Berdasarkan model di atas maka faktor yang berpengaruh terhadap IPM dengan menggunakan AIC maupun SBIC adalah persentase penduduk yang berpendidikan di atas SLTP (X2) dan rasio ketergantungan penduduk (X4). Dengan nilai minimum AIC adalah 0,93257 dan SBIC adalah 1,110324. Untuk mengetahui apakah model yang diperoleh dengan menggunakan kriteria AIC dan SBIC dapat digunakan atau tidak maka dilakukan pengujian parameter terhadap model tersebut. Pengujian dilakukan secara multivariat dengan menggunakan nilai Likelihood Ratio. Nilai LR = 42,40199 >
02,05; 3 7,815sehingga tolak H0.
Hal ini dapat disimpulkan bahwa parameter dalam model tersebut tidak sama dengan nol. Berdasarkan model yang diperoleh maka tabel klasifikasinya adalah sebagai berikut : Tabel 3. Klasifikasi Hasil Prediksi dan Data Asli Predicted Group
Actual Group 0
1
2
0
9
4
0
1
3
15
0
2
0
0
4
Berdasarkan tabel di atas, model yang telah diperoleh memiliki kemampuan mengklasifikasikan objek dengan benar cukup tinggi yaitu mencapai 80 persen. 5.
Kesimpulan Penaksiran parameter model regresi probit ordinal menggunakan metode MLE
menghasilkan penaksir yang berbentuk implisit dan untuk mendapatkan nilai penaksir parameternya dapat diperoleh dengan metode Newton-Raphson. Berdasarkan model yang telah diperoleh maka faktor-faktor yang mempengaruhi IPM Propinsi Jawa Tengah adalah persentase penduduk yang berpendidikan di atas SLTP (X2) dan rasio
ketergantungan penduduk (X4) yang memiliki ketepatan pengklasifikasian objek mencapai 80 persen. . 6.
Daftar Pustaka
Agresti, A. (2002). Categorical Data Analysis, 2nd edition. John Willey and Sons, New York. Aitchison, J., & Silvey, S. D. (1957). The Generalization of Probit Analysis to The Case of Multiple Response. Biometrika, 44, 131 – 140. Hosmer, D. W., & Lemeshow, S. (2000). Applied Logistic Regression. John Wiley and Son, New York.
8
Kockelman, K.M., & Kweon, Y.J. (2002). Driver Injury Severity: an Application of Ordered Probit Models. Accident Analysis and Prevention, 34, 313 – 321. McKelvey, R.D., & Zavoina, W. (1975). A Statistical Model for the Analysis of Ordinal Level Dependent Variables. Journal of Mathematical Sociology, 4, 103 – 120. O’Donnell, C., & Connor, D.H. (1996). Predicting the Severity of Motor Vehicle Accident Injuries Using Models of Ordered Multiple Choice. Accident Analysis and Prevention, 28(6), 739 – 753.
9