Seminar Nasional Statistika IX Institut Teknologi Sepuluh Nopember, 07 November 2009
MODEL REGRESI LOGISTIK ORDINAL IPM PROVINSI JAWA TENGAH PERIODE TAHUN 2007 Citra Fatimah Nur Mahasiswa Jurusan Statistika, Institut Teknologi Sepuluh Nopember Kampus ITS, Sukolilo, Surabaya 60111 Email :
[email protected] Purhadi Dosen Jurusan Statistika, Institut Teknologi Sepuluh Nopember Kampus ITS, Sukolilo, Surabaya 60111 Email :
[email protected] Regresi logistik ordinal merupakan salah satu metode statistika untuk menganalisis variabel respon (dependen) yang mempunyai skala ordinal yang terdiri atas tiga kategori atau lebih. Variabel prediktor (independen) yang dapat disertakan dalam model berupa data kategori atau kontinu yang terdiri atas dua variabel atau lebih. Indeks Pembangunan Manusia (IPM) merupakan indikator keberhasilan pembangunan manusia dalam suatu wilayah dan dapat dikategorikan menjadi bawah, menengah-bawah, menengah-atas, dan atas. Berdasarkan pengkategorian tersebut selanjutnya, dalam penelitian ini ingin diketahui lebih lanjut model IPM dengan menggunakan metode Regresi Logistik Ordinal, dengan variabel prediktor yang diduga mempengaruhi, yaitu : Persentase penduduk yang tinggal di daerah perkotaan (X1), Persentase penduduk yang berpendidikan di atas SLTP (X2), Rata-rata Pendapatan per kapita (X3), rasio ketergantungan penduduk (X4), peranan sektor industri dalam PDRB (X 5), dan Persentase penduduk miskin (X6). Berdasar Model Regresi Logistik Ordinal diperoleh beberapa variable prediktor yang signifikan mempengaruhi nilai IPM. Key Words : Ordinal Logistic Regression, Human Development Index Abstrak.
1. Latar belakang Jumlah penduduk miskin di Jateng masih sangat tinggi. Dari data Badan Pusat Statistik (BPS) pada 2006, dari 33,18 juta jiwa penduduk Jateng, sebanyak 12,68 juta jiwa (26%) di antaranya masuk kategori miskin. Jumlah warga miskin tersebut terdiri atas 3,17 juta rumah tangga miskin (RTM). Gubernur Jateng Mardiyanto mengungkapkan, data tersebut berdasarkan survei BPS dengan menggunakan 14 variabel. Namun, dari data tersebut, penduduk yang dikategorikan sangat miskin hanya 0,34 juta RTM (1,39 juta jiwa). Menurut Gubernur dalam LKPJ yang disampaikan ke DPRD Jateng, kategori miskin 1,54 juta RTM (6,16 juta jiwa) dan kategori hampir miskin sebanyak 1,27 juta RTM (5,08 juta jiwa). (www.depdagri.go.id) Sejak era pembangunan ber-Pelita mulai tahun 1969 propinsi Jawa Tengah “terjepit” di antara 2 propinsi besar Jawa Barat-DKI Jakarta dan Jawa Timur, yang keduanya “maju pesat” melalui industrialisasi yang berpusat di “Jabotabek” dan Surabaya. Memang benar Jawa Tengah memperoleh “pelimpahan kemakmuran” (trickle down) dari kemajuan propinsi-propinsi tetangganya ini, tetapi pada saat yang sama juga menerima 1
dampak negatif karena menjadi pemasok tenaga kerja murah yang hanya dinikmati mereka yang meninggalkan desanya. Akibatnya kemiskinan tetap luas dan SDM-nya terdiri atas mereka yang “tersisa”, yang kualitasnya bukan yang terbaik. Nilai Indek Pembangunan Manusia (IPM) Jawa Tengah tahun 1996 adalah 67,0 lebih rendah dari IPM Jakarta 76,1 dan Surabaya 72,1. Yang menarik, IPM Semarang kecuali dalam pendidikan selalu lebih baik dari IPM Surabaya meskipun selalu lebih buruk dibanding 3 kota lainnya yaitu Jakarta, Bandung, dan Yogyakarta. Amat jelas IPM kota Semarang yang tinggi berbeda jauh sekali dengan IPM terburuk di Jawa Tengah yaitu Brebes (60.5, 1996) dan Pemalang (56.1, 1999). (Mubyarto, 2002) Penelitian sebelumnya ,Rita Diana (2009), telah mengungkap beberapa faktor yang mempengaruhi nilai IPM di Jawa Tengah dengan metode regresi multivariat, meliputi : Persentase penduduk yang tinggal di daerah perkotaan, Persentase penduduk yang berpendidikan di atas SLTP, Rata-rata Pendapatan per kapita, rasio ketergantungan penduduk, peranan sektor industri dalam PDRB , dan Persentase penduduk miskin. Mengingat Indeks Pembangunan Manusia adalah nilai yang menunjukkan seberapa tinggi tingkat pembangunan manusia yang dapat dikategorikan menjadi 4 kategori, yaitu : rendah, menengah-bawah, menengah atas, dan tinggi, maka pada penelitian kali ini ingin mengungkap faktor-faktor yang mempengaruhi IPM dengan metode Regresi Logistik Ordinal. Sehingga untuk ke depannya dapat digunakan untuk memperbaiki kualitas pembangunan dengan memperbaiki hal-hal yang mempengaruhi indikator IPM itu sendiri, agar tidak terjadi ketimpangan nilai IPM antar kabupaten/kota. 2. Indeks Pembangunan Manusia IPM
merupakan gambaran komprehensif
mengenai tingkat
pencapaian
pembangunan manusia di suatu daerah, sebagai dampak dari kegiatan pembangunan yang dilakukan di daerah tersebut. Perkembangan angka IPM, memberikan indikasi peningkatan atau penurunan kinerja pembangunan manusia pada suatu daerah. IPM dibangun melalui pendekatan tiga dimensi dasar, yang meliputi umur panjang dan sehat, pengetahuan dan kehidupan yang layak. Untuk mengukur dimensi kesehatan digunakan angka umur harapan hidup, sedangkan untuk mengukur dimensi pengetahuan digunakan gabungan indicator angka melek huruf dan rata-rata lama sekolah. Adapun untuk mengukur dimensi hidup layak digunakan indicator kemampuan daya beli ( Purchasing Power Parity). (BPS, 2008)
2
3. Regresi logistik ordinal Model logit yang menjadi fokus utama dalam bidang sosial adalah model logit kumulatif (cumulative logit models). Model logit kumulatif pertama kali diperkenalkan oleh Walker dan Duncan (1967) dan kemudian disebut model odds proporsional (proportional
x
odds
model)
oleh
McCullagh
(1980).
Jika
variabel
prediktor
T
x1 x2 ... xp , maka peluang kumulatif logit didefinisikan (Agresti, 2002) sebagai
P(Y j | x)
(x)
1
2
(x) ...
(x) ,
j
j 1,2,..., J
Kumulatif logit didefinisikan sebagai
logit[P(Y j | x) ln
P(Y j | x) 1 P(Y j | x)
ln ln
P(Y j | x) P(Y j | x) (x) j 1(x)
(x) ... j (x) , j 1,2,..., J 1 j 2 (x) ... J (x)
1
2
(1)
Anggap suatu peubah respon multinomial Y dengan keluaran kategori yang dinyatakan oleh 1,2,...,J dan misalkan
x
menyatakan suatu vektor kovariat berdimensi p.
x
Dependensi peluang kumulatif Y terhadap
untuk model proportional odds sering
dinyatakan dalam bentuk
ln
P(Y j | x) P(Y j | x)
T 0j
x ,
j 1,2,..., J 1
(2)
Persamaan (2.3) dapat diubah ke dalam bentuk
(x) j 1(x) 1
ln
(x) ... j (x) j 2 (x) ... J (x)
2
T 0j
x ,
j 1,2,..., J 1
Model yang secara simultan menggunakan semua kumulatif logit (Agresti, 2002) adalah
logit[P(Y j | x)] j
02
x ,
j 1,2,..., J 1
(3)
(x) P(Y j | x) merupakan peluang kumulatif dari kejadian (Y j) .
merupakan 01
T 0j
parameter
...
0,J 1
dan
intersep
yang
tidak
, 2,...,
1
tidak diketahui yang bersesuaian dengan
T p
x.
3
diketahui
yang
memenuhi
0j
kondisi
merupakan vektor koefisien regresi yang
Jika 2
(x)
j
(x)
1
2
(x)
(x)
1
(x) , dan
J
2
(x)
(x)
(x) ...
3
(x)
1
2
j
(x) .
(x) ...
J
(x)
Maka
1
(x) ,
1
(x) 1. Model regresi logistik
ordinal yang terbentuk jika terdapat J kategori respon adalah
logit 1(x) ln
(x) 1 1(x)
logit 2 (x) ln
(x) 1 2 (x)
1
x
01
2
x ...
1 1
2 2
x
02
1 1
x ...
2 2
x
p p
x
p p
logit
(x) ln
J 1
(x) 1 J 1(x) J 1
x
0,J 1
exp( 0 j di mana j (x) P(Y j | x) 1 exp( 0 j
T
1 1
x ...
2 2
x
p p
x) , j 1,2,...,J 1dan T x)
J
(x) 1
Model ini disebut model logistik kumulatif karena rasio odds dari suatu kejadian
(Y j)
adalah independen pada setiap indikator kategori. Jika dimisalkan terdapat 3 kategori respon, maka model regresi logistik ordinal yang terbentuk adalah
logit 1(x) ln
(x) 1 1(x)
01
logit 2 (x) ln
(x) 1 2 (x)
02
1
2
x
x ...
1 1
2 2
x
1 1
x ...
2 2
x
p p
x
p p
Pendugaan Parameter Metode pendugaan parameter regresi logistik ordinal dapat diperoleh dengan menggunakan metode pendugaan maximum likelihood estimation ( MLE) dengan syarat distribusi variabel respon Y diketahui. Selain itu, metode MLE dipilih karena mempunyai beberapa kelebihan dibandingkan dengan metode lain, diantaranya dapat digunakan untuk model tidak linier seperti regresi logistik, serta hasil penaksirannya unbiased (Hosmer dan Lemeshow, 2000). Pendugaan parameter regresi logistik ordinal didapatkan dengan menurunkan fungsi log likelihood terhadap parameter yang akan diestimasi dan disamakan dengan nol. Persamaan
4
L( )
0digunakan untuk menaksir intersep parameter βk dimana k=1, 2, ...p dan
k
L( )
0dipergunakan untuk menaksir intersep θj dimana j=1, 2, ..., J – 1.
j
L( )
Hasil dari persamaan
0dan
L( )
k
0 merupakan fungsi nonlinear
j
sehingga diperlukan metode iterasi untuk memperoleh estimasi parameternya. Metode iterasi yang dipergunakan adalah metode iterative Weighted Least Square (WLS) yaitu algoritma Newton-Raphson. Iterasi akan berhenti jika terpenuhi kondisi konvergen, yaitu t 1
selisih
(t )
, di mana
adalah bilangan yang sangat kecil.
Model logistik ordinal yang telah diperoleh perlu diuji kesesuaiannya. Pengujian yang dilakukan adalah sebagai berikut. Uji univariabel (parsial) : Hipotesa pengujian ini adalah :
H0 :
k
0 lawan H1 :
k
0 , k=1,2,…,p
Statistik uji yang digunakan adalah statistik Wald :
2 k
W
ˆk SE( ˆk )
2
Daerah penolakan: 2
H0 ditolak bila Wk2 >
,1
atau p-value kurang dari α.
Uji Multivariabel (Serentak) : Hipotesa pengujian ini adalah :
H0 :
1
2
...
p
0
H1 : Paling sedikit ada satu
k
0 , k=1,2,…,p
Statistik uji yang digunakan statistik uji G2 atau Likelihood Ratio Test :
G2
2 ln(0 1)
2(L0 L1)
di mana 0 = nilai yang dimaksimalkan dari fungsi likelihood di bawah H0
1 = nilai yang dimaksimalkan secara keseluruhan ( H0 H1 ) Daerah penolakan:
H0 ditolak bila G lebih dari
2 ( , p)
di mana p menunjukkan nilai variabel random pada
tabel distribusi chi-square pada derajat bebas p.
5
4. Metode penelitian Data yang digunakan pada Penelitian ini adalah data sekunder yang diperoleh dari BPS dan penelitian sebelumnya. Data yang diambil adalah data IPM 2007 Propinsi Jawa Tengah. Dengan unit observasi adalah kabupaten/kota di Jawa Tengah, yang terdiri dari 35 kabupaten/kota, Dengan variabel-variabel penelitian yang akan diteliti adalah : Tabel 1. Variabel Penelitian No.
Tipe Variabel (3) Diskrit
Nama Variabel (2) Indeks pembangunan manusia
Kategori
(1) 1
(4)
Y =
2
X1 =
Persentase penduduk yang tinggal di daerah perkotaan
Kontinu
-
3
X2 =
Persentase penduduk yang berpendidikan di atas SLTP
Kontinu
-
4
X3 =
Rata-rata Pendapatan per kapita
Kontinu
-
5
X4 =
Rasio ketergantungan penduduk
Kontinu
6
X5 =
Peranan sektor industri dalam PDRB
Kontinu
-
7
X6 =
Persentase penduduk miskin
Kontinu
-
1=Bawah 2=Menengah-bawah 3=Menengah-atas 4=Atas
Metode peneltian yang digunakan sebagai langkah-langkah untuk mencapai tujuan penelitian dijabarkan sebagai berikut. 1.
Mengetahui pengaruh indikator pendidikan terhadap IPM di Provinsi Jawa Tengah menggunakan regresi logistik ordinal dengan uraian langkah. a. Memodelkan variabel x (variabel bebas) terhadap Y (variabel tak bebas) dengan metode Regresi Logistik Ordinal b. Memilih variabel mana yang signifikan dengan melakukan uji sebagai berikut :
H0 :
k
0
H1 :
k
0 , k=1,2,…,9
c. Memodelkan variabel Y dengan beberapa variabel x yang signifikan dengan metode Regresi Logistik Ordinal, dengan pengujian hipotesis :
H0 :
1
2
...
9
0
H1 : Paling sedikit ada satu
k
0 , k=1,2,…,9
Dan d. Intepretasi model untuk mendapatkan faktor-faktor yang berpengaruh terhadap IPM di Provinsi Jawa Tengah. 6
5. Hasil dan pembahasan Pengkategorian IPM terbagi menjadi 4 kategori, yaitu : bawah, menengah – bawah, menengah - atas, dan atas. Namun, pada data IPM Jawa Tengah tidak seperti demikian, karena seluruh data berada pada kisaran menengah – atas, seperti pada tabel berikut : Persentase No.
Kategori
Jateng
1
(IPM<50)
0.00%
2
(50
0.00%
3
(66
100.00%
4
(IPM>80)
0.00%
Sehingga untuk pengolahan data dengan metode Regresi Logistik Ordinal, diperlukan pengkategorian variabel respon kembali, menjadi : Persentase Kategori
Jateng
1(IPM<70)
37.14%
2(70
51.43%
3(IPM>75)
11.43%
Karena variabel respon terdiri dari tiga kategori, maka akan didapatkan dua fungsi logit yaitu fungsi logit 1 dan fungsi logit 2. Sebelum dilakukan analisis regresi logistik ordinal, maka perlu dilakukan pemilihan variabel yang berpengaruh nyata secara individu terhadap IPM yaitu dengan cara meregresikan tiap-tiap variabel prediktor dengan variabel responnya. Dari sini akan diketahui variabel prediktor mana saja yang secara univariabel berpengaruh terhadap variabel responnya. Hipotesis yang digunakan adalah:
H0 :
k
0
H1 :
k
0 , k=1,2,…,9
Statistik uji yang digunakan adalah statistik Wald,
W
Pengujian dilakukan dengan membandingkan nilai dengan derajat bebas satu dan 2 1
2 k
ˆk SE( ˆk )
2
Wk2 dengan distribusi chi-square,
2
0,20. Hipotesis akan tolak H0 bila Wk2 lebih besar dari
(1.642) atau nilai p-value kurang dari nilai
7
.
Ordinal Logistic Regression
Variabel
COEF1
SECO1
Kesimpulan
Wald test
(X1)
-0,077
0,070
1,209
Gagal Tolak H0
(X2)
0,328
0,165
3,962
Tolak H0
(X3)
0,030
0,033
0,825
Gagal Tolak H0
(X4)
-43,592
21,631
4,061
Tolak H0
(X5)
0,041
0,041
1,014
Gagal Tolak H0
(X6)
0,106
0,144
0,547
Gagal Tolak H0
Berdasarkan tabel, dapat dilihat bahwa hanya variable X2, dan X4 yang memiliki pengaruh yang signifikan terhadap model secara univariabel, sebagai berikut : H0 :
2
4
0
H1 : Paling sedikit ada satu
k
0 , k=2,4
Berdasarkan output perhitungan dalam SPSS 15 diperoleh bahwa nilai Statistik G = 41.887 dengan p-value = 0.000 < α(0.05). Maka dapat disimpulkan, bahwa kedua variabel bebas X2, dan X4 berpengaruh secara serentak terhadap model. Kemudian, berikutnya adalah uji parsial dengan hipotesis sebagai berikut :
H0 : H1 :
k k
0 0 , k=2,4 Penduga Konstanta 1 Konstanta 2 X2 X4 Uji Serentak
Koefisien
p-value
-9,.32442 0,327 0,0655197 0,994 -0,290907 0,003 34,4076 0,045 G = 41,887 p-value = 0,000
Berdasar tabel di atas nampak bahwa variabel bebas yang signifikan mempengaruhi model adalah X2, dan X4, yaitu Persentase penduduk yang berpendidikan di atas SLTP, dan Rasio ketergantungan penduduk. Hal ini dapat dilihat dari nilai p-value-nya telah signifikan baik secara uji serentak maupun uji parsial. Sehingga diperoleh model terbaik sebagai berikut :
y1(x) 1 y1(x) y2 (x) logity2 (x) ln 1 y (x)
logity1(x) ln
9,32442 0,290907X2 34,4076X4 0,0655197 0,290907X2 34,4076X4
2
8
Setelah didapatkan model terbaik, maka peluang tiap-tiap kategori di tiap-tiap provinsi juga bisa dihitung, sebagai berikut :
(x) 1
exp( 9,32442 0,290907X2 34,4076X4 ) 1 exp( 9,32442 0,290907X2 34,4076X4 )
(x) 2
exp(0,0655197 0,290907X2 34,4076X4 ) (x) , dan 1 exp(0,0655197 0,290907X2 34,4076X4 ) 1 (x) 1 (x) (x) 3 1 2 Berdasarkan hitungan peluang di atas dapat diperoleh hasil prediksi, sehingga kebenaran model logit ini dapat dilihat berdasar hasil pengklasifikasian antara prediksi dan observasi Tabel Klasifikasi Hasil IPM antara Observasi dan Prediksi Observasi IPM Kategori 1 IPM Kategori 2 IPM Kategori 3 Berdasarkan
Prediksi IPM Kategori 2 4 15 0
Persentase IPM ketepatan Kategori 3 0 69.23% 0 83.33% 4 100.00% Total 84.19% pengklasifikasian IPM pada Tabel di atas dapat diketahui persentase IPM Kategori 1 9 3 0
ketepatan pengklasifikasian IPM Jawa Tengah sebesar 84,19%. Angka ini cukup baik karena ketepatannya sudah lebih dari 50 persen, sehingga dapat disimpulkan bahwa model dianggap baik. 6. Kesimpulan Hasil pemodelan IPM Jawa Tengah dengan tiga kategori diperoleh bahwa hanya Persentase penduduk yang berpendidikan di atas SLTP, dan Rasio ketergantungan penduduk yang signifikan berpengaruh, dengan model regresi logistik :
y1(x) 1 y1(x) y2 (x) logity2 (x) ln 1 y (x) logity1(x) ln
9,32442 0,290907 X2 34,4076X4 0,0655197 0,290907 X2 34,4076X4
2
Dengan ketepatan prediksi yang dihasilkan dari model tersebut yang cukup besar yaitu 84,19%. 7. Daftar Pustaka Abreau, M. N. S et al. (2008), “ Ordinal logistic regression models: application in quality
of life studies”, Cadernos de Saude Publica, Vol.24, suppl.4 Agresti, A. (2002), Categorical Data Analysis, 2nd edition, John Willey and Sons,Inc., Hoboken, New Jersey. 9
BPS (2008), Indeks Pembangunan Manusia 2006-2007. BPS, Jakarta. Cameron, A. Colin. and Trivedi, Pravin K. (1998). Regression Analysis of Count Data. Cambridge University Press, United Kingdom Diana, R. (2009). Uji Kesamaan Vektor Parameter Model Linier Multivariat : Studi Kasus Faktor-faktor yang mempengaruhi IPM tahun 2007. Jurusan Statistika-ITS Hosmer, D. W. dan Lemeshow, S. (2000). Applied Logistic Regression. John Wiley and Son, New York Mubyarto. (2002). “Penanggulangan Kemiskinan di Jawa Tengah dalam Era Otonomi Daerah”. Jurnal Ekonomi Rakyat. Artikel Tahun I. No. 9 Tirtosudarmo, R. (2009), “ Mobility and Human Development in Indonesia”, Human Development Reesearch Paper. http://www.depdagri.go.id/konten.php?nama=BeritaDaerah&op=detail_berita_daerah&id= 636. diakses pada tanggal 20 Oktober 2009. Pukul : 17.14
10