Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur dengan Pendekatan Multivariate Adaptive Regression Spline Bootstrap Aggregating (MARS Bagging) Dimas Arvian Pandu Pratama1 (1307100059), dan Bambang Widjanarko Otok2 1 Mahasiswa Jurusan Statistika, ITS, Surabaya 2 Dosen Pembimbing, Jurusan Statistika, ITS, Surabaya
[email protected];
[email protected]
Abstrak Kemiskinan telah menjadi permasalahan yang belum terselesaikan hingga saat ini, baik di Indonesia umumnya, maupun di Jawa Timur khususnya, dan hal ini berkaitan erat dengan kesejahteraan rumah tangga. Begitu banyak faktor yang mempengaruhi kesejahteraan rumah tangga, oleh karena itu perlu dilakukan identifikasi faktor yang paling berpengaruh agar nantinya dapat digunakan untuk perencanaan pembangunan sehingga pembangunan lebih terarah pada peningkatan kesejahteraan masyarakat. Untuk mencapai tujuan tersebut maka perlu dibuat suatu klasifikasi berdasarkan faktorfaktor yang mempengaruhinya. Dalam penelitian ini, dilakukan klasifikasi kesejahteraan rumah tangga di provinsi Jawa Timur dengan pendekatan MARS bagging. Didapatkan empat belas faktor yang mempengaruhi kesejahteraan rumah tangga di Jawa Timur, faktor-faktor tersebut adalah variabel-variabel yang berkontribusi pada fungsi klasifikasi. Lima variabel di antaranya yang memiliki tingkat kepentingan tertinggi adalah jumlah anggota rumah tangga (X5), adanya anggota rumah tangga yang menggunakan telepon selular (X16), bahan bakar utama untuk memasak (X13), pengalaman membeli beras raskin selama tiga bulan terakhir (X15) dan tingkat pendidikan kepala rumah tangga (X4) dengan tingkat kepentingan masing-masing 100%, 57.04%, 45.11%, 29.18%, dan 26.29%. Pendekatan bagging dengan tiga puluh replikasi dataset berhasil menunjukkan akurasi klasifikasi dari klasifikasi model MARS dengan dataset tunggal. Tingkat kesalahan dan ketepatan klasifikasi yang diberikan adalah sebesar 13.51% dan 86.49%. Kata kunci: Kesejahteraan rumah tangga, klasifikasi, MARS bagging
melakukan analisis data Survey Sosial Ekonomi Nasional (SUSENAS) tahun 1992. Hal tersebut menunjukkan bahwa banyak faktor yang mempengaruhi kesejahteraan rumah tangga sehingga perlu dilakukan identifikasi faktor yang paling berpengaruh supaya nantinya dapat digunakan untuk perencanaan pembangunan yang terarah pada peningkatan kesejahteraan masyarakat. Untuk mendeskripsikan karakteristik kesejahteraan rumah tangga dan melihat faktor yang paling berpengaruh, perlu dibuat suatu klasifikasi berdasarkan faktor-faktor yang mempengaruhinya. Propinsi Jawa Timur, sebagai propinsi dengan jumlah penduduk terbanyak kedua di Indonesia, dihuni sekitar 6.02 juta penduduk miskin. Jumlah tersebut merupakan angka terbesar dibandingkan dengan propinsi lainnya di Indonesia (Badan Pusat Statistik, 2009). Sebuah kontradiksi di mana seharusnya jumlah penduduk yang besar di Jawa Timur dapat menjadi potensi dalam pembangunan daerah, namun permasalahan kesejahteraan sosial, salah satunya kemiskinan, masih belum dapat teratasi sampai tuntas.
1. Pendahuluan Kesejahteraan masyarakat merupakan tanggung jawab pemerintah negara. Sejak berlakunya desentralisasi kebijakan pemerintahan, pemerintah daerah mendapatkan kesempatan besar untuk menangani secara langsung upaya penyejahteraan masyarakat, khususnya dalam upaya penanggulangan permasalahan kesejahteraan sosial. Salah satu permasalahan kesejahteraan sosial yang telah lama menjadi permasalahan yang belum dapat diatasi sepenuhnya oleh pemerintah Indonesia adalah kemiskinan (Sutaat, 2006). Jumlah penduduk miskin di Indonesia mengalami penurunan 2.43 juta pada tahun 2009 dari jumlah semula 34.96 juta jiwa pada tahun 2008 (Badan Pusat Statistik, 2009). Hal tersebut menunjukkan bahwa kemiskinan belum benar-benar terselesaikan walaupun telah banyak program pemerintah yang telah dilaksanakan. Telah banyak dilakukan kajian mengenai kesejahteraan dan kemiskinan, di antaranya Suryadarma dkk (2005), yang menentukan ukuran obyektif kesejahtraan rumah tangga untuk penargetan kemiskinan, dan juga Faturokhman dkk (1995), yang telah
1
Penelitian-penelitian mengenai klasifikasi kesejahteraan rumah tangga pernah dilakukan sebelumnya. Salah satunya pernah dilakukan Een (2009) tentang klasifikasi kesejahteraan rumah tangga di Propinsi Jawa Tengah dengan pendekatan CART Arcing, hasilnya merupakan gambaran karakteristik rumah tangga miskin di Jawa Tengah sebagai masukan perancanaan pembangunan daerah Jawa Tengah. Dalam penelitian ini, untuk mengklasifikasi kesejahteraan rumah tangga di Propinsi Jawa Timur, digunakan metode multivariate adaptive regression spline (MARS) yang dipadukan dengan salah satu pendekatan nonparametrik bootstrap aggegrating (bagging). Model MARS berguna untuk mengatasi permasalahan data berdimensi tinggi, sedangkan bagging yang dapat memperbaiki akurasi klsifikasi dari model MARS.
Tingkat kesejahteraan masyarakat antara lain dapat diukur melalui besarnya pendapatan/pengeluaran. Pengeluaran untuk kebutuhan konsumsi dapat mencerminkan tingkat kemampuan ekonomi masyarakat, dan kemampuan daya beli masyarakat dapat memberikan gambaran tentang tingkat kesejahteraan masyarakat. Semakin tinggi daya beli masyarakat menunjukkan meningkatnya kemampuan dalam memenuhi kebutuhan hidupnya dan selanjutnya akan berdampak meningkatnya kesejahteraan masyarakat (BPS, 2009). Dalam mengukur kesejahteraan rumah tangga diperlukan indikator moneter, indikator yang banyak digunakan adalah pendapatan dan pengeluaran (BPS, 2009, dan The World Bank, 2007). Indikator pengeluaran, dalam hal ini disebut juga konsumsi, dipilih karena sifatnya tetap dan relatif stabil terhadap berfluktuasinya pendapatan dari tahun ke tahun. Suryadarma (2005) mengungkapkan variabel-variabel yang menjadi ciri kesejahteraan suatu keluarga antara lain: kepemilikan asset, kepemilikan binatang ternak, status perkawinan kepala rumah tangga, jenis kelamin kepala rumah tangga, tingkat pendidikan kepala rumah tangga dan pasangannya, anggota rumah tangga yang bekerja, sektor pekerjaan, akses terhadap rumah tangga, konsumsi makanan dan indikator kesehatan, indikator kesejahteraan lainnya serta partisipasi politik dan akses kepada informasi. Jumlah anggota rumah tangga diduga mempunyai keterkaitan erat dengan kesejahteraan rumah tangga karena kemiskinan dihitung berdasar pengeluaran dan jumlah anggota rumah tangga. Makin besar jumlah anggota rumah tangga akan makin besar pula resiko untuk menjadi miskin apabila pendapatannya tidak meningkat (Faturochman dan Molo, 1995). Umur kepala rumah tangga juga berkaitan dengan kesejahteraan rumah tangga walaupun hubungannya tidak begitu jelas, akan tetapi ada kecenderungan bahwa kepala rumah tangga yang lebih sejahtera lebih tua dibandingkan kepala rumah tangga yang kurang sejahtera. Jenis karakteristik lain adalah karakteristik jenis pekerjaan. Kemampuan mayoritas rumah tangga untuk keluar dari
2. Kesejahteraan Berdasarkan Rancangan UndangUndang tentang Sistem Kesejahteraan Sosial Nasional (RUU SKSN), kesejahteraan sosial adalah kondisi sosial ekonomi yang memungkinkan bagi setiap warga negara untuk dapat memenuhi kebutuhan yang bersifat jasmani, rohani dan sosial sesuai dengan harkat dan martabat manusia. Kesejahteraan menurut Cahyat et al (2007) merupakan kondisi dapat memenuhi kebutuhan dasar baik material maupun non-material yang mencakup aspek gizi dan kesehatan, pengetahuan, dan kekayaan materi. Kemiskinan sendiri merupakan bentuk ketidakmampuan untuk meraih kesejahteraan dipandang dari sisi ekonomi dalam memenuhi kebutuhan dasar makanan dan bukan makanan- yang diukur dari sisi pengeluaran. Penduduk Miskin adalah penduduk yang memiliki rata-rata pengeluaran perkapita perbulan dibawah garis kemiskinan (GK) (BPS, 2009). Selain itu, kemiskinan juga dijelaskan sebagai suatu situasi dimana seseorang atau rumah tangga mengalami kesulitan untuk memenuhi kebutuhan dasar, sementara lingkungan pendukungnya kurang memberikan peluang untuk meningkatkan kesejahteraan secara berkesinambungan atau untuk keluar dari kerentanan (Cahyat et al, 2007).
2
MARS dapat menemukan letak dan jumlah knot yang diperlukan dalam suatu langkah forward/bacward stepwise (Otok, 2010). Forward stepwise dilakukan untuk mendapatkan fungsi dengan jumlah fungsi basis maksimum. Kriteria pemilihan fungsi basis pada forward stepwise adalah dengan meminimumkan Average Sum Of Square Residual (ASR). Sedangkan, untuk memenuhi konsep parsimoni (model yang sesederhana mungkin dengan variabel seminimal mungkin) dilakukan backward stepwise, bertujuan untuk memilih fungsi basis yang dihasilkan dari forward stepwise dengan meminimumkan nilai GCV (Friedman dan Silverman, 1989). Menentukan model MARS yang optimal di antara model-model yang lain adalah dengan memilih model yang memiliki nilai GCV terendah. Kriteria GCV diperkenalkan oleh Wahba pada tahun 1979 (Otok, 2010). Fungsi GCV minimum didefinisikan sebagai:
kemiskinan akan bergantung pada upah mereka dari pekerjaan yang dilakukan. Jadi penting untuk menguji hubungan antara kesejahteraan dengan jenis pekerjaan anggota rumah tangga yang berada dalam usia kerja. Dillon dan Hermanto dalam Faturochman dan Molo (1995) mengungkapkan bahwa kenyataannya, sebagian penduduk atau rumah tangga miskin di desa masih mengandalkan pertanian sebagai pekerjaan utamanya akan tetapi usaha-usaha di luar pertanian tetap menjadi sumber pendapatan komplementer dan alternatif bagi keluarga. Sedangkan rumah tangga miskin di kota lebih banyak mengandalkan penghasilan dari sektor-sektor jasa atau lebih dikenal dengan sektor informal. Sedangkan karakteristik umum penduduk miskin menurut Rusastra dan Togar, 2007 adalah sebagian besar tinggal di desa, bekerja di sektor pertanian, sifat pekerjaan adalah informal serta status pekerjaan sebagai pekerja keluarga yang tidak di bayar. Salah satu karakteristik umum penduduk miskin lainnya menurut The World Bank (2006) adalah sifat pekerjaan yang bersifat informal serta status pekerjaan sebagai pekerja keluarga yang tidak dibayar.
πΊπΆπ β (π) =
(2) dimana: K =jumlah basis fungsi (nonconstant basis fungsi) yang ditentukan pada tahap forward = variabel prediktor xi yi = variabel respon n = banyaknya pengamatan πΆ(πΎ)β = πΆ(πΎ) + ππΎ πΆ(πΎ) = Trace [B(BTB)-1BT]+1 π = nilai ketika setiap fungsi basis mencapai optimasi (2 β€ π β€ 4) Klasifikasi pada model MARS didasarkan pada pendekatan analisis regresi. Jika variabel respon terdiri dari dua nilai, maka dikatakan sebagai regresi dengan binary response (Cox dan Snell, 1989) sehingga dapat digunakan model probabilitas dengan
3. MARS MARS diperkenalkan pada tahun 1991 oleh Friedman. Model MARS berguna untuk mengatasi permasalahan data berdimensi tinggi dan menghasilkan prediksi variabel respon yang akurat, dan menghasilkan model yang kontinu dalam knot berdasarkan nilai GCV terkecil (Friedman, 1991). Model umum persamaan MARS dapat ditulis sebagai berikut (Friedman, 1991): π²
π π(π) = πΆπ + βπ΄ π=π πΆπ βπ=ποΏ½πππ . οΏ½ππ(π,π)β πππ οΏ½οΏ½ + + πΊπ
(1)
di mana, = fungsi basis induk (constant basis πΆπ function), = koefisien dari fungsi basis ke-m, πΆπ M = fungsi basis maksimum (nonconstant basis function), Km = derajat interaksi, πππ = bernilai 1 jika data berada di sebelah kanan titik knot, atau bernilai -1 jika data berada di sebelah kiri titik knot, ππ(π,π) = variabel prediktor, dan πππ = nilai knot dari variabel prediktor π₯π£(π,π) .
1 π Μ (π₯ )]2 β π΄ππ
π π=1[π¦π β ππΎ π = πΆ(π)β πΆ(π)β [1 β π ]2 [1 β π ]2
persamaan sebagai berikut : π (π₯) = 1
οΏ½
π π(π₯)
1+π ποΏ½(π₯)
dan {1 β π(π₯)} = dengan 1+π ποΏ½(π₯) πΜ(π₯) = πππππ‘ π(π₯) sehingga ππππ(π = 1) = π (π₯) dan ππππ(π = 2) = 1 β π (π₯). Variabel respon Y merupakan variabel respon biner (0 dan 1) dengan m banyaknya variabel prediktor, x = ( x1 ,..., xm ) , sehingga model MARS untuk klasifikasi dapat dinyatakan sebagai berikut (Otok, 2008):
3
ln οΏ½
π(π₯)
1βπ(π₯)
πΏ
π οΏ½ = πΌ0 + βπΎπ=1 πΌπ βπ=1 + ππ οΏ½π ππ οΏ½π₯π(π,π)β π₯ β π(π,π) οΏ½οΏ½ π +
maka bagging dapat meningkatkan akurasi. Ide dasar dari bagging adalah menggunakan bootstrap resampling untuk membangkitkan prediktor dengan banyak versi, dimana ketika dikombinasikan seharusnya hasilnya lebih baik dibandingkan dengan prediktor tunggal yang dibangun untuk menyelesaikan masalah yang sama. Sebuah data set Β£ terdiri dari ), {(π¦π , π₯π π = 1,2, β¦ , π}. Dilakukan replikasi bootstrap sehingga didapatkan Β£βπ = β β (π¦π , π₯π ), π = 1,2, β¦ , π. Replikasi bootstrap dilakukan sebanyak B kali, sehingga didapatkan {Β£(π΅) } dari Β£. {Β£(π΅) } adalah resampling dengan pengembalian. Penentuan besarnya jumlah replikasi B sangat variatif, karena besar kecilnya B dapat memberikan hasil yang berbeda pada setiap tahapan analisis. Sutton (2005) merekomendasikan replikasi sebanyak 25 atau lima puluh kali, namun Hastie dkk (2001) menyatakan bahwa peningkatan akurasi akan terjadi jika banyaknya replikasi ditingkatkan dari lima puluh ke seratus kali, sedangkan jika banyaknya ditingkatkan hingga lebih dari seratus kali akan menghasilkan akurasi yang tidak lebih besar dari akurasi replikasi seratus kali. Sementara itu, Efron dan Tibshirani (1993) merekomendasikan nilai B yang kecil, misalnya 25 kali. Algoritma bagging untuk MARS adalah sebagai berikut. 1. Mengambil sampel bootstrap sebanyak n dari data set Β£ dengan pengulangan sebanyak n. 2. Memodelkan MARS dari data set hasil sampel bootstrap Β£(π΅) . 3. Menghitung nilai misklasifikasi dari langkah 2. Nilai misklasifikasi pada langkah ini disebut misklasifikasi B 4. Mengulang langkah 1-4 sebanyak B kali (replikasi bootstrap). 5. Memperoleh misklasifikasi bagging dari rata-rata misklasifikasi pada setiap pengambilan sampel sampai B.
(3) Pada prinsipnya, klasifikasi dilakukan untuk melihat seberapa besar ketepatan pengelompokkan sekumpulan data untuk digolongkan dengan tepat pada kelompoknya. Metode klasifikasi yang baik akan menghasilkan sedikit kesalahan klasifikasi atau akan menghasilkan peluang kesalahan klasifikasi (alokasi) yang kecil (Agresti, 1990). Untuk menghitung ketepatan klasifikasi digunakan alat ukur apparent error rate (APER). Nilai APER menyatakan representasi proporsi sampel yang salah diklasifikasikan oleh fungsi klasifikasi (Johnson dan Wichern, 1992). Jika subjek hanya diklasifikasikan menjadi dua kelompok π¦1 dan π¦2 , maka penentuan kesalahan pengklasifikasian dapat diketahui melalui tabel klasifikasi berikut. Tabel 1 Tabel klasifikasi
hasil observasi π¦1 π¦2
di mana: π11 : Jumlah subjek fikasikan sebagai π¦1 π12 : Jumlah subjek fikasikan sebagai π¦2 π21 : Jumlah subjek fikasikan sebagai π¦1 π22 : Jumlah subjek fikasikan sebagai π¦2 π΄ππΈπ
(%) =
4.
π12 +π21
Taksiran π¦1 π¦2 π11 π12 π21 π22 dari π¦1 tepat diklasi-
dari π¦1 salah diklasi-
dari π¦2 salah diklasidari π¦2 tepat diklasi-
π11 +π12 +π21 +π22
(4)
Bagging Metode bagging pertama kali digunakan oleh Breiman (1994) sebagai alat untuk membentuk classifier yang lebih stabil. Bagging predictor adalah metode untuk membangkitkan multiple version dari prediktor dan menggunakannya untuk aggregate prediktor. Multiple versions dibentuk dengan replikasi bootstrap dari sebuah data set. Pada beberapa kasus bagging pada data set real dapat meningkatkan akurasi. Jika perubahan dalam data set menyebabkan perubahan yang signifikan
4
(SUSENAS) tahun 2009 Jawa Timur. Variabel respon dan variabel prediktor yang digunakan dalam penelitian ini adalah sebagai berikut.
5. Sumber Data dan Variabel Penelitian Data yang digunakan dalam penelitian ini merupakan data sekunder, diambil dari hasil Survey Sosial Ekonomi Nasional
Tabel 2 Variabel penelitian (1) variabel y
keterangan kelompok rumah tangga berdasarkan pengeluaran per kapita yang sudah dikonversikan berdasarkan garis kemiskinan
x1
jenis kelamin kepala rumah tangga
x2
umur kepala rumah tangga, dihitung berdasarkan ulang tahun terakhir
x3
status perkawinan kepala rumah tangga
x4
ijazah tertinggi yang dimiliki kepala rumah tangga
x5
jumlah anggota rumah tangga, merupakan semua orang yang biasanya bertempat tinggal di suatu rumah tangga, baik yang berada di rumah tangga maupun sementara tidak ada saat pendataan
x6
kegiatan utama kepala rumah tangga
x7
lapangan usaha utama kepala rumah tangga
x8
status pekerjaan utama kepala rumah tangga
x9
status penguasaan bangunan tempat tinggal
x10
sumber air minum
x11
cara memperoleh air minum
x12
sumber penerangan
kategori 1: rumah tangga miskin 2: rumah tangga tidak miskin 1: laki-laki 2: perempuan
nominal nominal
1: kawin 2: lainnya 1: tidak punya ijazah 2: tamat SD 3: tamat SLTP/Sederajat 4: tamat SLTA/Sederajat 5: tamat di atas SLTA 6: tidak pernah sekolah
-
1: bekerja 2: tidak bekerja 1: pertanian 2: non pertanian 3: tidak bekerja 1: buruh/karyawan 2: pengusaha 3: lainnya 1: milik sendiri 2: kontrak/sewa 3: bebas sewa 4: dinas 5: lainnya 1: air kemasan bermerek 2: air isi ulang 3: leding meteran/leding eceran 4: sumur bor/pompa/sumur terlindung/sumur tidak terlindung 5: mata air terlidung/mata air tidak terlindung 6: lainnya 1: membeli 2: tidak membeli 1: listrik PLN 2: listrik non PLN 3: lainnya
5
skala
interval nominal
ordinal
interval
nominal nominal
nominal
nominal
nominal
nominal nominal
Tabel 3 Variabel penelitian (2) variabel
x13
x14 x15 x16 x17
keterangan
kategori 1: listrik 2: gas/elpiji 3: minyak tanah 4: arang/briket/kayu bakar 5: lainnya 1: pernah 2: tidak pernah 1: pernah 2: tidak pernah 1: ya 2: tidak 1: ya 2: tidak
bahan bakar energi utama untuk memasak
pengalaman mendapatkan pelayanan kesehatan gratis selama enam bulan terakhir pengalaman membeli beras raskin selama tiga bulan terakhir ada anggota rumah tangga yang dapat menggunakan telepon selular ada anggota rumah tangga yang menguasai penggunaan komputer desktop
skala
nominal
nominal nominal nominal nominal
5. Melakukan pemodelan MARS pada setiap pengambilan sampel B replikasi bootstrap dengan jumlah BF, MI dan MO di antara knot sama dengan jumlah BF, MI dan MO di antara knot pada model MARS terbaik untuk data set tunggal. 6. Mendapatkan nilai tingkat misklasifikasi pada setiap pengambilan sampel B replikasi bootstrap. 7. Mendapatkan nilai tingkat misklasifikasi bagging dari rata-rata misklasifikasi pada setiap pengambilan sampel sampai B. Model MARS bagging yang didapatkan adalah model MARS terbaik untuk data set tunggal. Hal ini dikarenakan nilai knot yang berubah-ubah untuk setiap replikasi sehingga estimasi parameternya tidak bisa dirata-rata. Selanjutnya dilakukan perhitungan nilai APER berdasarkan informasi yang didapat dari tabel klasifikasi untuk memverifikasi tingkat misklasifikasi dan tingkat ketepatan klasifikasi.
6. Metode Analisis Data Langkah pertama, untuk mendapatkan deskripsi karaketeristik kesejahteraan rumah tangga, dilakukan analisis statistik deskriptif terhadap variabel-veriabel perdiktor. Untuk mengetahui faktor-faktor apa saja yang mempengaruhi kesejahteraan rumah tangga dengan kesejahteraan rumah tangga di Jawa Timur, bagaimana pola hubungannya, dan bagaimana ketepatan klasifikasinya, dilakukan prosedur berikut. 1. Pembentukan model MARS untuk data set awal: (1) menentukan BF; (2) menentukan MI; (3) menentukan MO di antara knot.. 2. Mendapatkan model MARS terbaik untuk dataset tunggal berdasarkan nilai GCV terkecil. 3. Mendapatkan variabel yang signifikan berpengaruh dari model MARS terbaik untuk dataset tunggal. 4. Melakukan bagging dari pasangan variabel respon dan variabel prediktor yang signifikan dari model MARS terbaik untuk data set tunggal dengan lima belas, dua puluh, 25, dan tiga puluh replikasi bootstrap.
7. Hasil dan Pembahasan Karakteristik kesejahteraan rumah tangga di Jawa Timur ditampilkan pada tabel berikut.
6
Tabel 4 Statistik deskriptif (1) aspek
RT miskin
karakterstik
mean
st.dev
4,33
1.6
3,44
50,42
14.39
49,40
n
p(%)
n
3815
86.27
21131
82.77
607
13.73
4399
17.23
total
4422
100
25530
100
kawin
3738
84.53
20337
79.66
lainnya
684
15.47
5193
20.34
4422
100
25530
100
kependudukan
jumlah anggota rumah tangga umur kepala rumah tangga
laki-laki jenis kelamin kepala rumah tangga
status perkawinan kepala rumah tangga
perempuan
total
pendidikan
tidak pernah sekolah
mean
total
st.dev 1.49 13.96 p(%)
n
p(%)
975
26.75
2670
73.25
3645
100
tidak mempunyai ijazah
1400
20.32
5490
79.68
6890
100
tamat SD
1461
16.4
7448
83.6
8909
100
tamat SLTP/Sederajat
483
7.24
6193
92.76
6676
100
tamat SLTA/Sederajat
92
4.25
2073
95.75
2165
100
tamat di atas SLTA
11
0.66
1656
99.34
1667
100
milik sendiri
4133
93.46
22269
87.23
kontrak/sewa
49
1.11
1361
5.33
bebas sewa
56
1.27
390
1.53
9
0.2
143
0.56
175
3.96
1367
5.35
4422
100
25530
100
air kemasan bermerek
10
0.62
1609
99.38
1619
100
air isi ulang
50
3.52
1371
96.48
1421
100
leding
312
6.85
4246
93.15
4558
100
sumur
3012
16.96
14749
83.04
17761
100
mata air
967
23.04
3230
76.96
4197
100
lainnya
71
17.93
325
82.07
396
100
582
6.51
8363
93.49
8945
100
tidak membeli**
3840
18.28
17167
81.72
21007
100
listrik PLN
4227
14.52
24893
85.48
29120
100
58
14.08
354
85.92
412
100
137
32.62
283
67.38
420
100
22
5.91
350
94.09
372
100
gas/elpiji
464
4.85
9094
95.15
9558
100
minyak tanah
280
6
4389
94
4669
100
3626
24
11480
76
15106
100
30
12.15
217
87.85
247
100
status penguasaan tempat tinggal
dinas lainnya total
perumahan
RT tidak miskin
sumber air minum
cara memperoleh air minum
sumber penerangan
membeli*
listrik non PLN lainnya listrik
bahan bakar memasak
arang/briket/kayu bakar lainnya
7
Tabel 5 Statistik deskriptif (2) aspek
RT miskin
karakterstik
teknologi informasi dan komunikasi
sosial ekonomi rumah tangga
ketenagakerjaan
bekerja*
RT tidak miskin
n
p(%)
3854
15.19
n
total
p(%)
n
p(%)
21515
84.81
25369
100
kegiatan utama KRT tidak bekerja**
lapangan usaha utama
568
12.39
4015
87.61
4583
100
pertanian*
2625
24
8521
76
11146
100
non pertanian**
1229
9
12994
91
14223
100
tidak bekerja
568
12
4015
88
4583
100
buruh/karyawan
596
8
6458
92
7054
100
2409
17
11943
83
14352
100
lainnya
849
21
3114
79
3963
100
tidak bekerja
568
12
4015
88
4583
100
pernah*
723
18.58
3169
81.42
3892
100
tidak pernah**
3699
14.19
22361
85.81
26060
100
pernah*
3848
20.71
14728
79.29
18576
100
574
5.05
10802
94.95
11376
100
ya*
1488
8.48
16061
91.52
17549
100
tidak**
2934
23.66
9469
76.34
12403
100
42
1.82
2269
98.18
2311
100
4380
15.85
23261
84.15
27641
100
pengusaha status pekerjaan
pengalaman mendapatkan pelayanan kesehatan gratis pengalaman membeli beras raskin kemampuan ART menggunakan telepon genggam penguasaan ART menggunakan komputer desktop
tidak pernah**
ya* tidak**
*) signifikan berbeda pada Ξ±=0.05; Ξ±=0.01; Ξ±=0.001 **) signifikan berbeda pada Ξ±=0.05; Ξ±=0.01; Ξ±=0.001
Karakteristik di atas merupakan deskripsi dari setiap variabel prediktor π₯π berdasarkan kelompok pada variabel respon π¦, yaitu rumah tangga miskin dan rumah tangga tidak miskin. Selanjutnya, dilakukan pemodelan dengan MARS terhadap y dan π₯π dengan cara trial and error, dengan mengombinasikan
beberapa kriteria model MARS, yaitu BF, MI, dan MO sampai diperoleh model terbaik dengan GCV minimum. Rincian kriteriakriteria model MARS tersebut adalah: BF yang nilainya -dua hingga empat kali jumlah variabel- 34, 51, dan 68; MI yang bernilai 1, 2, dan 3; dan MO yang bernilai 0, 10, 20, 50, dan 100.
Tabel 6 Trial and error penentuan model terbaik MARS no BF MI MO GCV R2 Misclassification rate 1 2 3* 4 5
68 68 68 68 68
3 3 3 3 3
0 10 20 50 100
0.219 0.219 0.219 0.219 0.219
0.225 0.225 0.225 0.225 0.225
0.1359 0.1353 0.1351 0.1351 0.1358
*) model terbaik
Lima model yang ditampilkan pada tabel 1 adalah lima model dengan GCV minimum dari 45 kombinasi model MARS yang lain. Cara menentukan model terbaik adalah dengan mempertimbangkan GCV terkecil,
bila bernilai sama, pertimbangan selanjutnya adalah memilih model dengan R2 terbesar, bila ternyata beberapa model tersebut memiliki R2 yang sama, pertimbangan beralih kepada ketepatan klasifikasi (total corect)
8
π΅πΉ20 = πππ₯(0, 57.000 β π2 ) β π΅πΉ7 ; π΅πΉ21 = (π7 = 1); π΅πΉ23 = πππ₯(0, π5 β 4.000) β π΅πΉ21 ; π΅πΉ24 = πππ₯(0, 4.000 β π5 ) β π΅πΉ21 ; π΅πΉ25 = (π4 = 1 ππ π4 = 6); π΅πΉ27 = πππ₯(0, π2 β 55.000) β π΅πΉ23 ; π΅πΉ28 = πππ₯(0,55.000 β π2 ) β π΅πΉ23 ; π΅πΉ29 = (π12 = 3); π΅πΉ31 = πππ₯(0, π5 β 3.000); π΅πΉ33 = (π16 = 1) β π΅πΉ31 ; π΅πΉ34 = (π16 = 2) β π΅πΉ31 ; π΅πΉ35 = (π10 = 5) β π΅πΉ1 ; π΅πΉ37 = πππ₯(0, π5 β 4.000) β π΅πΉ6 ; π΅πΉ38 = πππ₯(0, 4.000 β π5 ) β π΅πΉ6 ; π΅πΉ40 = πππ₯(0, 64.000 β π2 ) β π΅πΉ31 ; π΅πΉ41 = ( π4 = 3 ππ π4 = 4 ππ π4 = 5) β π΅πΉ31 ; π΅πΉ43 = (π1 = 1) β π΅πΉ20 ; π΅πΉ45 = ( π10 = 1 ππ π10 = 2 ππ π10 = 3 ππ π10 = 6) β π΅πΉ23 ; π΅πΉ48 = πππ₯(0, 39.000 β π2 ) β π΅πΉ4 ; π΅πΉ49 = (π17 = 1) β π΅πΉ1 ; π΅πΉ51 = (π14 = 1) β π΅πΉ10 ; π΅πΉ53 = ( π4 = 4 ππ π4 = 5) β π΅πΉ34 ; π΅πΉ55 = (π8 = 2) β π΅πΉ21 ; π΅πΉ57 = (π11 = 1) β π΅πΉ35 ; π΅πΉ60 = πππ₯(0, 68.000 β π2 ) β π΅πΉ6 ; π΅πΉ62 = πππ₯(0, 2.000 β π5 ) β π΅πΉ19 ; π΅πΉ63 = ( π4 = 2 ππ π4 = 3 ππ π4 = 5) β π΅πΉ19 ; π΅πΉ65 = ( π10 = 4 ππ π10 = 5) β π΅πΉ17 ; π΅πΉ67 = (π11 = 1) β π΅πΉ40
terbesar, bila masih belum dapat dipilih, pertimbangan beralih kepada kombinasi BF/MI/MO terkecil. Kelima model tersebut memiliki GCV dan R2 yang sama. Penyeleksian mengerucut kepada model nomor tiga dan empat yang memiliki tingkat kesalahan klasifikasi terkecil, yaitu 13.51%. Di antara model nomor tiga dan empat yang memiliki MO paling sedikit adalah model nomor tiga, sehingga model nomor tiga dengan kombinasi BF=68, MI=3, MO=20 dipilih sebagai model terbaik. Model terbaik MARS untuk memodelkan hubungan antara faktor-faktor yang mempengaruhi kesejahteraan dengan tingkat kesejahteraan di Jawa Timur dapat ditulis sebagai berikut: πΜ(π₯) = 2.001 β 0.295π΅πΉ1 + 0.039π΅πΉ4 + 0.158π΅πΉ5 β0.120π΅πΉ7 β 0.084π΅πΉ9 + 0.024π΅πΉ12 + 0.065π΅πΉ13 β0.016π΅πΉ15 + 0.043π΅πΉ17 β 0.004π΅πΉ19 β 0.004π΅πΉ20 β 0.073π΅πΉ21 + 0.027π΅πΉ24 β 0.022π΅πΉ25 β 0.001π΅πΉ27 β0.002π΅πΉ28 β 0.104π΅πΉ29 β 0.068π΅πΉ31 + 0.062π΅πΉ33 β0.047π΅πΉ35 + 0.045π΅πΉ37 + 0.039π΅πΉ38 β 0.001π΅πΉ40 +0.016π΅πΉ41 + 0.003π΅πΉ43 + 0.041π΅πΉ45 β 0.002π΅πΉ48 +0.094π΅πΉ49 β 0.037π΅πΉ51 + 0.054π΅πΉ53 + 0.030π΅πΉ55 +0.099π΅πΉ57 + 0.002π΅πΉ60 + 0.004π΅πΉ62 + 0.004π΅πΉ63 β0.054π΅πΉ65 + .686389πΈ β 03π΅πΉ67
Berkurang atau bertambahnya nilai πΜ(π₯) akibat bermaknanya kontribusi setiap BF terhadap model MARS (ditunjukkan oleh tanda negatif atau positif dari setipa koefisien BF) dapat diartikan pula sebagai berkurang atau bertambahnya kecenderungan suatu rumah tangga untuk diklasifikasikan ke dalam kelompok rumah tangga tidak miskin. Model MARS terbaik pada persamaan (4) dibentuk oleh empat belas variabel yang secara signifikan memberikan kontribusi pada model. Tingkat kepentingan dari masingmasing variabel tersebut terhadap model ditampilkan pada Tabel 7.
(4)
dengan:
π΅πΉ1 = (π13 = 4) π΅πΉ4 = πππ₯(0,6.000 β π5 ) β π΅πΉ1 ; π΅πΉ5 = (π16 = 1) β π΅πΉ1 ; π΅πΉ6 = (π16 = 2) β π΅πΉ1 ; π΅πΉ7 = (π15 = 1); π΅πΉ9 = (π4 = 6) β π΅πΉ1 ; π΅πΉ10 = ( π4 = 1 ππ π4 = 2 ππ π4 = 3 ππ π4 = 4 ππ π4 = 5) β π΅πΉ1 ; π΅πΉ12 = πππ₯(0, 5.000 β π5 ) β π΅πΉ7 ; π΅πΉ13 = (π16 = 1) β π΅πΉ7 ; π΅πΉ15 = πππ₯(0, π5 β 4.000) β π΅πΉ13 ; π΅πΉ17 = (π11 = 1) β π΅πΉ7 ; π΅πΉ19 = πππ₯(0, π2 β 57.000) β π΅πΉ7 ;
Tabel 7 tingkat kepentingan variabel Variable X5 X16 X13 X15 X4 X2 X7 X11 X10 X12 X1 X8 X17 X14 X3 X6 X9
Importance 100 57.04 45.109 29.179 26.293 23.075 18.114 15.068 12.599 9.534 7.341 5.884 5.679 5.448 0 0 0
9
- GCV 0.112 0.103 0.101 0.099 0.099 0.099 0.099 0.099 0.099 0.098 0.098 0.098 0.098 0.098 0.098 0.098 0.098
Tingkat kepentingan dari setiap variabel ditaksir oleh kenaikan nilai GCV. Nilai βGCVβ menunjukkan besarnya GCV yang berkurang apabila variabel tersebut dimasukkan dalam model. Berdasarkan tabel 2, dapat diketahui bahwa lima variabel dengan tingkat kepentingan tertinggi adalah X5, x16, x13, x15, dan X4, dengan tingkat kepentingan masing-masing 100%, 57.04%, 45.109%, 29.179%, dan 26.293%. Variabel selanjutnya adalah X2 dengan tingkat kepentingan 23.075%. Peringkat selanjutnya adalah variabel X7 dengan tingkat kepentingan 18.114%. Kemudian diikuti X11 dengan tingkat 15.068%. Selanjutnya variabel X10 dengan tingkat kepentingan 12.599%. Lima variabel terakhir yang memberikan kontribusi adalah X12, X1, X8, X17, dan X14
dengan tingkat kepentingan masing-masing 9.534%, 7.341%, 5.884%, 5.679%, dan 5.448%. Sedangkan variabel X3, X6 dan X9 tidak memberikan kontribusi pada model. Dengan diketahuinya variabel mana saja yang berkontibusi pada model MARS yang merupakan fungsi klasifikasi kesejahteraan rumah tangga- maka dapat didefinisikan faktor-faktor apa saja yang mempengaruhi klasifikasi kesejahteraan rumah tangga. Sehingga pemerintah Jawa Timur dapat menggunakan model ini untuk dijadikan pertimbangan dalam pembuatan kebijakan yang berkaitan dengan kesejahteraan rumah tangga. Evaluasi klasifikasi dengan menghitung nilai APER dimulai dengan membuat tabel klasifikasi.
Tabel 8 Klasifikasi kesejahteraan rumah tangga miskin dan tidak miskin kelas prediksi total kelas aktual aktual 1 2 1207 3215 4422 1 832 24698 25530 2 2039 27913 29952 total prediksi
sedangkan:
Dari tabel 8 dapat diketahui bahwa dari 4422 rumah tangga miskin, 1207 di antaranya tepat diklasifikasikan ke dalam kategori rumah tangga miskin, sedangkan 3215 rumah tangga lainnya salah diklasifikasikan ke dalam kategori rumah tangga tidak miskin. Begitu juga dari 25530 rumah tangga tidak miskin, 24698 di antaranya tepat dikalsifikasikan ke dalam kategori rumah tangga miskin, sedangkan 832 lainnya salah diklasifikasikan ke dalam kategori rumah tangga miskin. Berdasarkan informasi tersebut dapat dihitung tingkat ketepatan klasifikasi dan nilai APER sebagai berikut,
π΄ππΈπ
= 100% β πππ‘ππππ‘ππ ππππ ππππππ π π΄ππΈπ
= 100% β 86.49%
π΄ππΈπ
= 13.51%.
Sehingga dapat disimpulkan bahwa ketepatan klasifikasi dengan pendekatan MARS adalah sebesar 86.49% dengan tingkat kesalahan 13.51%. Selanjutnya dilakukan pendekatan bagging untuk mengetahui akurasi klasifikasi dari model MARS. Bagging dengan tiga puluh replikasi terbukti dapat menunjukkan akurasi klasifikasi model MARS dengan dataset tunggal, perbandingan hasil klasifikasi untuk setiap {Β£(π΅) } dengan hasil klasifikasi model MARS dataset tunggal beserta penurunan tingkat kesalahan klasifikasinya ditampilkan pada tabel 9.
πππ‘ππππ‘ππ ππππ ππππππ π 1207 + 24698 = π₯100% (4422 + 25530) πππ‘ππππ‘ππ ππππ ππππππ π = 86.49%
10
Tabel 9 Perbandingan tingat kesalahan klasifikasi dari bagging dan dataset tunggal dan pemurunan klasifikasinya {Β£(π©) }
misclassificationB
{Β£(15) } {Β£(20) } {Β£(25) } {Β£(30) }* {Β£(35) } *) replikasi terbaik
misclassification rate model MARS dataset tunggal
0.1363 0.1362 0.1425 0.1351 0.1366
0.1351 0.1351 0.1351 0.1351 0.1351
Tabel 9 menunjukkan bahwa {Β£(15) }, {Β£(20) }, {Β£(25) }, dan {Β£(35) } belum berhasil memberikan akurasi klasifikasi yang lebih baik daripada klasifikasi model MARS dengan dataset tunggal. Penurunan tingkat kesalahan klasifikasi yang benilai nagatif menunjukkan bahwa tingkat kesalahan klasifikasi bagging lebih besar daripada tingkat kesalahan klasifikasi dengan dataset tunggal. Namun {Β£(30) } dapat memberikan akurasi klasifikasi, dengan memberikan tingkat misklasifikasi yang konvergen. Sehingga dapat disimpulkan bahwa bagging dengan tiga puluh replikasi dataset berhasil menunjukkan akurasi klasifikasi dari MARS dengan dataset tunggal..
penurunan misclassification rate -0.009 -0.008 -0.055 0.000 -0.011
Jawa Timur dengan pendekatan MARS bagging dengan tiga puluh replikasi dataset terbukti dapat menunjukkan akurasi klasifikasi dari model MARS dengan dataset tunggal. Pendekatan tersebut memberikan nilai kesalahan klasifikasi yang konvergen, yaitu 13.51%, dengan tingkat ketepatan klasifikasi sebesar 86.49%. Daftar Pustaka Aeni, Een Q.. (2009). Pendekatan CART Arcing untuk Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Tengah [Thesis]. Institut Teknologi Sepuluh Nopember. Surabaya. Agresti, A.. (1990). Categorical Data Analysis. John Wiley and Sons. New York. Anonim. (2011). Scatter Plot. www.en.wikipedia.org (11 Pebruari 2011). ____. (2011). Matrix Plot. www.resample.com (11 Pebruari 2011). Badan Pusat Statistik. (2009). Berita Resmi Statistik: Profil Kemiskinan di Indonesia Maret 2009. BPS. Jakarta. ____. (2009). Hasil Survei Sosial Ekonomi Nasional Tahun 2008 Provinsi Jawa Timur. BPS Provinsi Jawa Timur. Surabaya. ____. (2009). Meta Data Subdit Statistik Kerawanan Sosial. www.bps.go.id (3 Maret 2011) ____. (2009). Hasil Survey Sosial Ekonomi Nasional Tahun 2008 Propinsi Jawa Timur. BPS Jawa Timur. Surabaya. ____ dan The World Bank Institute. (2002). Dasar-dasar Analisis Kemiskinan. Jakarta.
8. Kesimpulan dan Saran Hasil analisis statistik deskriptif terhadap variabel prediktor π₯π berdasarkan kelompok variabel respon y menunjukkan adanya perbedaan karakteristik kesejahteraan rumah tangga pada rumah tangga miskin dan tidak miskin berdasarkan beberapa aspek, di antaranya juga telah terbukti perbedaannya secara signifikan pada pada Ξ±=0.05; Ξ±=0.01; Ξ±=0.001. Dari ketujuh belas variabel prediktor, didapati hanya empat belas variabel prediktor yang memberikan kontribusi terhadap model yang menggambarkan hubungan kesejahteraan rumah tangga di Jawa Timur dengan faktor-faktor yang mempengaruhinya, yang ditulis pada persamaan (4). Lima variabel dengan tingkat kontribusi tertinggi adalah jumlah anggota rumah tangga (X5), adanya anggota rumah tangga yang menggunakan telepon selular (X16), bahan bakar utama untuk memasak (X13), pengalaman membeli beras raskin selama tiga bulan terakhir (X15) dan tingkat pendidikan kepala rumah tangga (X4) dengan tingkat kepentingan masing-masing 100%, 57.04%, 45.11%, 29.18%, dan 26.29%. Klasifikasi kesejahteraan rumah tangga di
11
Mandaku, Fentje. (2009). Pemodelan terhadap Kelulusan Siswa Masuk Kelas Akselerasi menggunakan Analisis Regresi Logistik dan Multivariate Adaptive Regression Spline [Thesis]. Institut Teknologi Sepuluh Nopember. Surabaya. Nash, M.S., Bradford, D.F.. (2001). Parametric and Non Parametric Logistic regression for Prediction of Precense/Absence of an Amphibian. Las Vegas, Nevada. Otok, B.W.. (2008). Multivariate Adaptive Regression Spline. Pelatihan MARS. Surabaya. ____. (2010). Multivariate Adaptive Regression Spline. FMIPA ITS: Surabaya. ____, Guritno, S., Subanar, Haryatmi, S.. (2006). Bootstrap dalam MARS untuk Klasifikasi Perbankan. Inferensi Jurnal Statistik, Volume 2, N0. 1, Januari 2006. FMIPA ITS Surabaya. Rahmawati, D.I.. (1999). Analisis Kesempatan Kerja Penduduk Miskin di Provinsi DKI Jakarta [Skripsi]. Sekolah Tinggi Ilmu Statistik. Jakarta. Rusastra, IW dan Togar AN 2007 βKarakteristik Wilayah dan Keluarga Miskin di Perdesaan: Basis Perumusan dan Intervensi Kebijakanβ. Pusat Analisis Sosial Ekonomi Pertanian, Bogor Suryadarma, D., Akhmad, H., dan Nina, T.. (2005). Ukuran Obyektif Kesejahteraan Keluarga untuk Penargetan Kemiskinan : Hasil Uji Coba Sistem Pemantauan Kesejahteraan oleh Masyarakat di Indonesia. SMERU. Jakarta. Sutaat. (2006). Hasil-hasil Penelitian Tahun 2006 Puslitbang Kesejahteraan Sosial. Pusat Penelitian dan Pengembangan Kesejahteraan Sosial, Badan Pendidikan dan Kesejahteraan Sosial, Departemen Sosial Republik Indonesia. Jakarta. Sutton, C.D.. (2005). Classification and Regression Trees, Bagging, and Boosting, Handbook of Statistics, Vol. 24. hal 303329.
Breiman, L. (1994). Bagging Predictor. Technical Report No. 421. Department of Statistics University of California. Budiantara, I.N., Suryadi, F., Otok, B.W., Guritno, S.. (2006). Pemodelan B-Spline dan MARS Pada Nilai Ujian Masuk terhadap IPK Mahasiswa Jurusan Disain Komunikasi Visual UK. Petra Surabaya. Jurnal Teknik Industri, Vol 8 No. 1, Surabaya. BΓΌhlman, P. dan Yu, B.. (2002). Analyzing Bagging, The Annals of Statistics, Vol. 30 no. 4, hal 927-961. Cahyat, A., Gonner, C., dan Haug, M.. (2007). Mengkaji Kemiskinan dan Kesejahteraan Rumah Tangga : Sebuah Panduan dengan Contoh dari Kutai Barat, Indonesia. CIFOR. Bogor. Cox, D.R. dan Snell, E.J.. (1989). Analysis of Binary Data. Second Edition. Chapman & Hall. London. Djumena, Erlangga. (2011). BPS: Angka Kemiskinan Turun Terus Sejak 2006. www.bisniskeuangan.kompas.com (22 Pebruari 2011). Efron, B. dan Tibshirani, R.J.. (1993). An Introduction to the Bootstrap. Chapman Hall, New York. Faturokhman, Molo dan Marcelinus. (1995). Kemiskinan dan Kependudukan di Pedesaan Jawa: Analisis data Susenas 1992. Yogyakarta : Pusat Penelitian Kependudukan Universitas Gadjah Mada. Friedman, J.H.. (1991). Multivariate Adaptive Regression Splines. The Annals of Statistics, Vol. 19 No. 1 (Maret 1991). ____. dan Silverman, B.W. (1989). Flexible Parsimony Smoothing and Additive Modelling. Technometrics, 31. Hastie, T., Tibshirani, R., Friedman, J.. (2001). The Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer-Verlag, New York. Johnson, R. A., Wichern, D. W.. (1992). Applied Multivariate Statistical Analysis. Prentice Hall. New Jersey.
12
Wahyuningrum, S., 2008. βPendekatan MARS untuk Ketepatan Klasifikasi Desa/Kelurahan Miskin di Kalimantan Timur Tahunβ. Tesis Institut Teknologi Sepuluh November, Surabaya. Walpole, R.E.. (1993). Pengantar StatistikaEdisi ke-3. Jakarta: PT. Garmedia Pustaka Utama.
Tanur, Erwin. (2009), Model Kesejahteraan Rumah Tangga Di Propinsi DKI Jakarta Dengan Metode MARS. Institut Teknologi Sepuluh Nopember. Surabaya. The World Bank. (2006). Making The New Indonesia Work For The Poor. The World Bank. Jakarta. ___. (2007). Understanding Poverty. The World Bank. Jakarta.
13