PENERAPAN ANALISIS POHON REGRESI PADA DATA PERLINDUNGAN SOSIAL
PUTRI DWI ANDINI
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2012
ABSTRAK PUTRI DWI ANDINI. Penerapan Analisis Pohon Regresi pada Data Perlindungan Sosial. Dibimbing oleh KUSMAN SADIK dan DIAN KUSUMANINGRUM . Kemiskinan merupakan suatu permasalahan yang dihadapi oleh negara-negara berkembang. Kemiskinan menyangkut suatu kondisi kekurangan dari sebuah tuntutan kehidupan yang paling mendasar, khususnya dari aspek konsumsi, pendapatan, dan kebutuhan sosial. Salah satu upaya yang dilakukan pemerintah dalam menanggulangi masalah kemiskinan adalah dengan mengadakan program perlindungan sosial. Namun, program perlindungan sosial yang ada tidaklah mencukupi dalam menurunkan tingkat resiko bagi keluarga miskin. Oleh karena itu, pemerintah perlu melakukan evaluasi untuk melakukan klasifikasi terhadap keluarga penerima bantuan perlindungan sosial agar program perlindungan sosial yang dilakukan tepat sasaran. CART merupakan metodologi statistik nonparametrik yang dikembangkan untuk topik analisis klasifikasi, baik untuk peubah respon kategorik maupun kontinu. Tujuan utama CART adalah untuk mendapatkan suatu kelompok data yang akurat sebagai penciri dari suatu pengklasifikasian. Dalam penelitian ini digunakan algoritma CART dengan menggunakan pendekatan analisis pohon regresi untuk menganalisis faktor-faktor penciri yang mempengaruhi pemberian bantuan Program Perlindungan Sosial (PLS) di Kabupaten Bogor. Hasil analisis pohon regresi menghasilkan pohon maksimal dengan jumlah simpul sebanyak 20 simpul yang terdiri dari 9 simpul dalam dan 11 simpul terminal. Setelah dilakukan pemangkasan dengan menggunakan 10-fold cross validation diperoleh pohon optimal dengan jumlah simpul sebanyak 8 simpul yang terdiri dari 3 simpul dalam dan 5 simpul terminal. Pada pohon optimal diperoleh tiga peubah penjelas yang efektif dalam memprediksi persentase keluarga yang menerima bantuan perlindungan sosial. Persentase keluarga yang anggotanya menjadi buruh tani muncul sebagai peubah yang paling efektif, diikuti oleh bahan bakar untuk memasak dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir. Hasil pengelompokan pohon regresi dapat digunakan sebagai referensi pemerintah dalam menentukan segmentasi penerima bantuan program perlindungan sosial bagi kelompok-kelompok desa yang berada di Kabupaten Bogor berdasarkan kombinasi peubah -peubah penjelas yang dihasilkan. Kata kunci : Program Perlindungan Sosial, CART, Pohon Regresi
PENERAPAN ANALISIS POHON REGRESI PADA DATA PERLINDUNGAN SOSIAL
PUTRI DWI ANDINI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2012
Judul : Penerapan Analisis Pohon Regresi pada Data Perlindungan Sosial Nama : Putri Dwi Andini NRP : G14070067
Disetujui :
Pembimbing I
Pembimbing II
Dr. Ir. Kusman Sadik, M.Si. NIP. 19690912 199702 1 001
Dian Kusumaningrum, M. Si.
Diketahui : Ketua Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto, M. Si. NIP. 196504211990021001
Tanggal Lulus :
PRAKATA Alhamdulillahi rabbil’alamin, Puji syukur penulis panjatkan kepada Allah SWT atas segala rahmat dan karunia -Nya sehingga penulis dapat menyelesaikan karya ilmiah dengan judul “Penerapan Analisis Pohon Regresi pada Data Perlindungan Sosial”. Karya ilmiah ini merupakan hasil penelitian dalan rangka memenuhi tugas akhir yang merupakan salah satu syarat untuk memperoleh gelar Sarjana Statistika di Fakultas Matematika dan Ilmu pengetahuan Alam Institut Pertanian Bogor. Terima kasih penulis ucapkan kepada berbagai pihak yang telah membantu penyelesaian karya ilmiah ini : 1. Bapak Dr. Ir. Kusman Sadik, M. Si. dan Ibu Dian Kusumaningrum, M. Si. selaku pembimbing yang telah meluangkan waktu, serta memberikan arahan dan masukan yang bermanfaat bagi penulis. 2. Ibu Dra. Itasia Dina Sulvianti M. Si. selaku dosen penguji. 3. Seluruh dosen Departemen Statistika IPB atas nasehat dan ilmu yang bermanfaat. 4. Bapak, Ibu, Mas Danis, dan Virgia yang telah memberikan cinta dan kasih sayang sepenuhnya, semangat, dan do’a yang tulus setiap waktu. 5. Seluruh staf Departemen Statistika yang telah banyak membantu penulis selama perkuliahan di Statistika. 6. Teman-teman Statistika 44 atas kebersamaan dan keceriaannya selama ini. Semoga tulisan ini dapat bermanfaat bagi semua pihak yang membutuhkan.
Bogor, Februari 2012
Putri Dwi Andini
RIWAYAT HIDUP Penulis dilahirkan di Gisting, Lampung pada tangal 11 Agustus 1989 sebagai anak kedua dari tiga bersaudara dari pasangan Bapak Fathulloh, S.P. dan Ibu Sunarsih. Penulis telah berhasil menyelesaikan pendidikannya di Sekolah Dasar Negeri (SDN) 4 Gisting Bawah pada tahun 2001. Jenjang pendidikan selanjutnya penulis tempuh di Sekolah Menengah Pertama Negeri (SMPN) 2 Talang Padang dan lulus pada tahun 2004. Penulis menamatkan pendidikannya di Sekolah Menengah Atas (SMA) AL-Kautsar Bandar Lampung pada tahun 2007 dan pada tahun yang sama penulis diterima sebagai mahasiswa Departemen Statistika, Institut Pertanian Bogor (IPB) melalui jalur Seleksi Penerimaan Mahasiswa Baru (SPMB). Selama mengikuti perkuliah penulis aktif menjadi pengurus Himpunan Profesi Gamma Sigma Beta (GSB) Departemen Statistika sebagai staff Beta Club pada periode kepengurusan 2010-2011. Penulis melaksanakan praktik lapang pada tanggal 07 Februari sampai 01 April 2011 di PT Mediatrac Fractal Collective Intelligence (MFCI), Jakarta Selatan.
DAFTAR ISI Halaman DAFTAR TABEL................................................................................................................................... vii DAFTAR GAMBAR.............................................................................................................................. vii DAFTAR LAMPIRAN .......................................................................................................................... vii PENDAHULUAN Latar Belakang .............................................................................................................................. 1 Tujuan ............................................................................................................................................ 1 TINJAUAN PUSTAKA Metode Pohon Regresi ................................................................................................................ 1 Aturan Penyekatan ................................................................................................................ 2 Proses Penyekatan................................................................................................................. 2 Aturan Penghentian .............................................................................................................. 2 Aturan Pemangkasan ............................................................................................................ 3 Validasi .................................................................................................................................. 3 Pemilihan Pohon Regresi Terbaik....................................................................................... 3 Aturan Penentuan Dugaan Respon .................................................................................... 3 METODOLOGI Data................................................................................................................................................. 4 Metode ........................................................................................................................................... 4 HASIL DAN PEMBAHASAN Deskripsi Data............................................................................................................................... 4 Pohon Regresi Program Perlindungan Sosial Kabupaten Bogor ......................................... 6 Pemangkasan (Prunning) Pohon Regresi Maksimal untuk Menghasilkan Pohon Regresi Optimal............................................................................................................................. 6 SIMPULAN DAN SARAN Simpulan ....................................................................................................................................... 8 Saran ............................................................................................................................................... 8 DAFTAR PUSTAKA .............................................................................................................................. 8 LAMPIRAN ............................................................................................................................................... 9
vii
DAFTAR TABEL Halaman 1
Matriks korelasi antara peubah Y dan peubah X2 , X8 , dan X5 ....................................................................... 6
DAFTAR GAMBAR Halaman 1 2 3 4 5 6 7 8
Struktur pohon regresi ................................................................................................................... 2 Persentase pengguna bahan bakar untuk memasak .................................................................. 4 Persentase tempat pembuangan sampah sebagian besar penduduk...................................... 5 Persentase sumber air yang digunakan untuk memasak atau minum..................................... 5 Persentase sertifikasi lahan tempat tinggal penduduk ............................................................. 5 Boxplot sebaran data peubah X2 , X8 , dan X9 ............................................................................ 5 Grafik banyaknya simpul terhadap kuadrat tengah galat ........................................................ 7 Struktur pohon optimal hasil pemangkasan ............................................................................... 7
DAFTAR LAMPIRAN 1 2 3 4 5 6 7 8 9
Halaman Diagram alir pembentukan pohon regresi .............................................................................. .10 Diagram alir pembentukan pohon regresi maksimal ............................................................. .11 Diagram alir pembentukan pohon regresi optimal ................................................................ .12 Tabel peubah bebas yang digunakan beserta kategorinya ................................................. .13 Deskripsi peubah-peubah numerik .......................................................................................... .14 Deskripsi peubah-peubah kategorik ........................................................................................ .14 Struktur pohon maksimal persentase keluarga penerima bantuan PLS............................. .15 Struktur pohon optimal persentase keluarga penerima bantuan PLS ................................ .16 Program R .................................................................................................................................... .17
1
PENDAHULUAN Latar Belakang Kemiskinan merupakan suatu permasalahan yang dihadapi oleh negaranegara berkembang. Kemiskinan menyangkut suatu kondisi kekurangan dari sebuah tuntutan kehidupan yang paling mendasar, khususnya dari aspek konsumsi, pendapatan, dan kebutuhan sosial (iridsindonesia.com). Mayoritas penduduk Indonesia rentan terhadap kemiskinan. Hampir 40% dari penduduk, hidup hanya sedikit di atas garis kemiskinan nasional dan mempunyai pendapatan kurang dari US$ 2 per hari. Perubahan sedikit saja dalam tingkat harga, pendapatan, dan kondisi kesehatan dapat menyebabkan mereka berada dalam kemiskinan, walaupun hanya untuk sementara waktu. Salah satu upaya yang dilakukan pemerintah dalam menanggulangi masalah kemiskinan adalah dengan mengadakan program perlindungan sosial. Namun, program perlindungan sosial yang ada tidaklah mencukupi dalam menurunkan tingkat resiko bagi keluarga miskin. Kondisi ini dapat diperbaiki dengan menyediakan program perlindungan sosial yang lebih bermanfaat bagi penduduk miskin serta masyarakat yang rentan terhadap kemiskinan (siteresources.worldbank.org). Oleh karena itu, pemerintah perlu melakukan evaluasi dalam melakukan klasifikasi terhadap keluarga penerima bantuan perlindungan sosial agar program perlindungan sosial yang dilakukan tepat sasaran. Penelitian ini menggunakan analisis pohon regresi untuk memprediksi faktor-faktor yang mempengaruhi pemberian bantuan perlindungan sosial. Pohon regresi bertujuan untuk menghasilkan segmentasi atau pengelompokan pengamatan menjadi beberapa kelompok, dimana pengamatan yang berada pada satu kelompok umumnya lebih homogen dibandingkan kelompok yang lain. Metode pohon regresi mampu mengeksplorasi struktur data yang kompleks baik dimensinya maupun jenis peubahnya, mampu mengidentifikasi peubah yang kontribusinya dominan terhadap peubah respon, serta hasil analisisnya relatif lebih mudah untuk diinterpretasikan terutama bagi pengguna yang bukan statistisi (Lewis 2000). Hasil penelitin ini diharapkan mampu memberian segmnentasi desa-desa penerima bantuan perlindungan sosial di Kabupaten Bogor.
Tujuan Menentukan peubah-peubah paling penting dalam memprediksi pemberian bantuan Program Perlindungan Sosial (PLS) di Kabupaten Bogor dengan menggunakan pendekatan pohon regresi. TINJAUAN PUSTAKA Metode Pohon Regresi Classification And Regression Tree (CART) merupakan metodologi statistik nonparametrik yang dikembangkan untuk topik analisis klasifikasi, baik untuk peubah respon kategorik maupun kontinu (Breiman et al. 1993). CART menghasilkan suatu pohon klasifikasi jika peubah responnya kategorik, dan menghasilkan pohon regresi jika peubah responnya kontinu. Tujuan utama CART adalah untuk mendapatkan suatu kelompok data yang akurat sebagai penciri dari suatu pengklasifikasian. Pohon regresi adalah salah satu metode atau algoritma dari salah satu teknik pohon keputusan (decision tree) yang dibentuk melalui suatu algoritma penyekatan (if-then logical) secara rekursif. Seperti halnya regresi biasa, metode ini juga digunakan untuk mengetehui pengaruh peubah penjelas terhadap peubah respon. Perbedaannya adalah pada pohon regresi, pendugaan respon dilakukan pada kelompok-kelompok pengamatan yang dibentuk berdasarkan peubah-peubah penjelasnya, bukan untuk keseluruhan data sehingga interpretasi hasil mudah dilakukan. Metode pohon regresi menghasilkan kelompok-kelompok pengamatan yang dicirikan oleh peubahpeubah yang memisahkan simpul. Peubahpeubah penjelas yang dianggap berpengaruh terhadap respon adalah peubah-peubah yang muncul sebagai pemisah (Breiman et al., 1993). Beberapa sifat yang dimiliki metode pohon ragresi antara lain: 1. Tidak memerlukan spesifikasi bentuk fungsional modelnya. 2. Kekar terhadap pengaruh pencilan. 3. Dapat menangani peubah bebas kategorik dan kontinu secara lebih baik. 4. Dapat menangani pengamatan data hilang pada satu atau beberapa peubah bebasnya. Metode pohon regresi secara teknis dikenal sebagai metode penyekatan rekursif biner. Proses penyekatannya adalah biner karena kumpulan data yang disebut simpul selalu disekat menjadi dua sekatan yang disebut simpul anak. Menurut Brieman et al.
2
(1993), aturan utama dari algoritma CART secara umum adalah: 1. Penyekatan setiap simpul 2. Penetapan simpul akhir 3. Penentuan nilai dugaan respon bagi setiap simpul akhir. Struktur pohon regresi memiliki satu simpul akar yang dinyatakan dengan t 1 yang mengandung semua gugus data (Gambar 1). Simpul dalam adalah simpul yang masih bisa disekat menjadi simpul anak atau simpul dalam. Simpul dalam dilambangkan dengan lingkaran (t 2 , t 3 , t7 ), sedangkan simpul akhir atau simpul terminal adalah simpul yang tidak bisa disekat lagi. Simpul akhir dilambangkan dengan kotak (t 4 , t5 , t6 , t 8 , t9 ).
t1
t3
t2
t4
t5
t6
t7
t8
t9
Gambar 1 Struktur pohon regresi Aturan Penyekatan Pohon regresi dibentuk melalui penyekatan gugus data dengan sederetan penyekatan biner sampai dihasilkan simpul akhir (Breimann et al. 1993). Untuk menyekat suatu simpul menjadi dua simpul anak dilakukan dengan aturan sebagai berikut: 1. Setiap penyekatan tergantung dari nilai yang berasal dari satu peubah penjelas. 2. Untuk peubah kontinu Xj , penyekatan yang diperbolehkan adalah Xj ≤ c, dimana c adalah nilai tengah antara dua nilai amatan peubah Xj secara berurutan. Jadi jika Xj memiliki nilai n yang berbeda maka akan ada n-1 penyekatan. 3. Untuk peubah penjelas kategorik, penyekatan yang terjadi berasal dari semua kemungkinan penyekatan berdasarkan terbentuknya dua anak gugus yang saling lepas (disjoint). Jika Xj adalah peubah kategorik nominal dengan L kategori, maka akan ada 2L-1 -1 penyekatan.
Sedangkan jika berupa kategorik ordinal maka aka nada L-1 penyekatan. Proses Penyekatan Menurut Breimann et al. (1993) proses penyekatan pada tiap simpul adalah dengan cara sebagai berikut: 1. Tentukan semua kemungkinan penyekatan pada tiap peubah penjelas. 2. Pilih penyekatan terbaik dari masingmasing peubah penjelas dan pilih penyekatan terbaik dari kumpulan penyakatan terbaik tersebut. Penyekatan terbaik dihitung berdasarkan selisih jumlah kuadrat deviasi dari masing-masing simpul anak dengan simpul induknya. Selisih terbesar akan dijadikan penyekat terbaik. Jumlah kuadrat galat (JKG) pada simpul ke-t dijadikan sebagai kriteria kehomogenan di dalam masing-masing simpul. Misalkan simpul t berisi anak contoh {(Xn , Yn )}, N(t) adalah banyaknya amatan dalam simpul t, dan rataan respon dalam simpul t diduga oleh rataan respon dalam simpul t tersebut, yang dihitung sebagai berikut: ∑ ̅(t) = Sedangkan jumlah kuadrat galat pada simpul t dinyatakan sebagai: JKG(t) = ∑ ̅(t)]2 Misalkan ada penyekatan s yang menyekat t menjadi simpul anak kiri dan simpul anak kanan , fungsi penyekat yang digunakan adalah: (s,t) = JKG(t) – {JKG( ) + JKG( )} dimana (s,t) adalah fungsi penyekat pada pohon regresi, JKG(t ) adalah jumlah kuadrat galat simpul induk, dan JKG( ) adalah jumlah kuadrat galat simpul anak kiri, dan JKG( )} adalah jumlah kuadrat galat simpul anak kanan. Penyekatan terbaik s* adalah: (s*,t) = (s,t) dengan S adalah gugus yang berisi semua kemungkinan penyekatan. Aturan Penghentian Jika penyekatan terbaik ditemukan, maka data disekat menjadi dua bagian. Dua bagian disebut simpul anak kiri dan simpul anak kanan. Proses penyekatan diulang lagi terhadap dua simpul anak. Sampai tak mungkin disekat lagi dan dihentikan. Breiman et al. (1993) menyatakan bahwa proses rekursif berakhir jika banyaknya amatan pada simpul akhir ≤ 5. Selain jumlah amatan minimum, kriteria penghentian pohon regresi adalah dengan memaksimumkan
3
kehomogenan ragam pada tiap simpul, serta dipengaruhi juga oleh peubah-peubah yang berpengaruh terhadap respon. Simpul yang tak bisa disekat lagi disebut simpul akhir. Aturan Pemangkasan Pohon yang dibentuk pada proses penyekatan berukuran sangat besar. Hal ini karena aturan pemberhentian berdasarkan banyaknya amatan pada simpul akhir atau besarnya peningkatan kehomogenan. Cara untuk mengatasi masalah ini adalah mencari pohon dengan ukuran yang layak. Pencarian pohon dengan ukuran yang layak dilakukan dengan kriteria sebagai berikut: 1. Penentuan pohon awal yang besar 2. Secara iteratif pohon tersebut di pangkas (pruning) menjadi deretan pohon yang makin kecil dan tersarang 3. Dipilih pohon yang terbaik dari deretan ini dengan menggunakan sample uji (test sample) atau sampel validasi silang (cross validation sample) Langkah awal pemangkasan dilakukan T1 , yaitu subpohon yang memenuhi kriteria R(T 1 ) = R(Tmax). Untuk mendapatkan T 1 dan Tmax ambil t L dan t R yang merupakan simpul anak kiri dan simpul anak kanan dari T max yang dihasilkan dari pemilihan pada setiap simpul induk t. Karena R(t) = R(t L ) + R(t R), maka pangkas simpul anak t L dan t R tersebut. Ulangi proses ini sampai tidak ada lagi pemangkasan yang mungkin (Breiman et al. 1993). Inti dari pemangkasan cost complexity minimum adalah pemotongan hubungan terlemah (weakest link ) pada pohon regresi. Untuk sembarang Tt yang merupakan cabang dari T1 , besar rataan kuadrat kesalahan didefinisikan R(Tt ) = ∑ dengan R(Tt ) adalah kuadrat tengah galat subpohon dan ∑ adalah jumlah kuadrat tengah simpul kiri dan simpul kanan hasil pemilahan subpohon. Validasi Validasi silang pada pohon regresi dilakukan sebelum proses pemangkasan. Aspek terpenting adalah kestabilan dari pendugaan pohon regresi yang diperoleh. Kestabilan pohon regresi dapat bernilai rendah jika pohon regresi mengandung terlalu banyak peubah penjelas atau jika dua atau lebih peubah penjelas memiliki korelasi tinggi (multikolinieritas). Cara terbaik untuk melakukan proses validasi dan pemangkasan yaitu dengan menggunakan kelompok data peubah bebas (penjelas) untuk proses
validasi. Data dibagi menjadi 10 kelompok. Sembilan kelompok data digunakan untuk membangun pohon regresi dan 10 kelompok data digunakan untuk proses validasi (Breiman et al. 1993). Proses ini diulang dalam 10 cara yang berbeda, sehingga setiap kelompok data digunakan untuk validasi silang. Menurut Dietterich (1998) dan Kuhnerta et al. (2000) dalam Mendes dan Akkartal (2009) proses validasi silang lipat 10 (10- fold cross validation) akan menghasilkan sebuah pohon akhir. Penduga kuadrat tengah galat validasi silang lipat 10 dirumuskan dengan Rcv (Tk) =
∑
̅
cv
dengan R (Tk) merupakan kuadrat tengah galat pohon optimal hasil pemangkasan, N adalah jumlah pengamatan dalam simpul k, adalah nilai dari peubah respon, dan ̅(k) adalah rataan dari simpul k. Pohon terbaik adalah Tk0 yaitu : Rcv (Tk0 ) = min Rcv (Tk) dengan R (Tk0 ) merupakan kuadrat tengah galat pohon regresi optimal terbaik (Breiman et al. 1993) cv
Pemilihan Pohon Regresi Terbaik Keragaman yang dapat dijelaskan dalam CART adalah sebagai berikut : =[
] x 100%
dengan adalah keragaman yang dapat dijelaskan oleh pohon regresi, adalah kuadrat tengah galat pohon regresi hasil pemangkasan, dan adalah kuadrat tengah galat dari peubah respon (kuadrat tengah galat dari simpul akar). = ∑
̅
dengan adalah nilai dari peubah respon dan ̅ adalah nilai rataan dari peubah respon (Breiman et al. 1993). Aturan Penentuan Nilai Dugaan Respon Setelah pohon regresi terbentuk, maka CART akan menghitung ringkasan statistik dari masing-masing simpul akhir. Apabila metode kuadrat terkecil dipilih sebagai aturan penyekatan, maka akan dihitung rataan dan standar deviasi dari peubah respon. Nilai rataan pada simpul akhir merupakan nilai dugaan dari peubah respon pada kasus simpul terakhir tersebut (Komalasari 2005).
4
METODOLOGI Data Data yang digunakan untuk analisis ini adalah data Potensi Desa/Kelurahan (PODES) dan data Pendataan Program Perlindungan Sosial (PPLS) tahun 2010 di Kabupaten Bogor, di mana kriteria keterangan rumah tangga yang digunakan adalah status penguasaan bangunan, luas dan jenis lantai, jenis dinding dan atap, sumber air minum, sumber penerangan, bahan bakar untuk memasak, fasilitas buang air besar, kepemilikan asset, dan kepesertaan dalam program perlindungan sosial. Peubah respon yang diamati berasal dari data PPLS dari setiap desa di Kabupaten Bogor, di mana peubah responnya berupa persentase keluarga yang menerima bantuan perlindungan sosial. Sedangkan peubah penjelas yang digunakan sebagai berikut: X1 = Bahan bakar untuk memasak X2 = Persentase keluarga yang menerima kartu ASKESKIN setahun terakhir X3 = Persentase surat miskin yang dikeluarkan desa setahun terakhir X4 = Tempat sebagian penduduk membuang sampah X5 = Tempat buang air besar X6 = Tempat penampungan sampah sementara X7 = Jenis permukaan jalan yang terluas X8 = Persentase pengguna PLN X9 = Persentase keluarga yang anggotanya menjadi buruh tani X10 = Sumber air untuk memasak atau minum pada umumnya X11 = Sertifikasi sebagian besar lahan tempat tinggal penduduk X12 = Jumlah TKI Metode Tahapan-tahapan yang dilakukan dalam penelitian ini adalah: 1. Tahap awal adalah proses persiapan data. 2. Pemilihan peubah-peubah penjelas yang akan dianalisis dari data podes. 3. Membangun pohon regresi dengan algoritma CART. a. Penyekatan pada setiap peubah penjelas. b. Pemilihan penyekat terbaik dengan kriteria jumlah kuadrat galat terkecil. c. Menentukan nilai dugaan respon pada setiap simpul. 4. Pemangkasan (pruning) pohon regresi untuk menghasilkan pohon regresi optimal.
5. Melakukan interpretasi hasil analisis. HASIL DAN PEMBAHASAN Deskripsi Data Jumlah desa yang digunakan sebanyak 428 desa yang terletak di Kabupaten Bogor. Peubah penjelas yang digunakan berjumlah 12 buah. Deskripsi untuk peubah penjelas numerik dapat dilihat pada Lampiran 5, sedangkan deskripsi peubah penjelas kategorik dapat dilihat pada Lampiran 6. Berdasarkan Lampiran 5 terlihat bahwa rata-rata persentase keluarga yang menerima kartu ASKESKIN setahun terakhir sebesar 24.03%, rata-rata persentase surat keterangan tidak mampu (SKTM) yang dikeluarkan desa setahun terakhir sebesar 4.554%, dan rata-rata persentase keluarga yang anggotanya menjadi buruh tani sebesar 22.57%. Rata-rata persentase ketiga peubah tersebut menunjukkan bahwa angka kemiskinan di Kabupaten Bogor cukup rendah. Mayoritas penduduk desa di Kabupaten Bogor sudah menggunakan listrik yang dikelola oleh PLN. Hal tersebut dapat dilihat dari tingginya ratarata persentase pengguna PLN yaitu sebesar 90.70%. Rata-rata jumlah TKI di desa yang berada di Kabupaten Bogor sebanyak 4 orang, dengan desa dengan jumlah TKI terbanyak yaitu Desa Tengah, Kecamatan Cibinong dengan jumlah TKI sebanyak 244 orang. LPG 1.17%
kayu bakar 23.83%
minyak tanah 75%
Gambar 2 Persentase pengguna bahan bakar untuk memasak Berdasarkan Gambar 2 terlihat bahwa sebagian besar masyarakat di Kabupaten Bogor masih menggunakan minyak tanah sebagai bahan bakar untuk memasak dengan persentase 75%, 23.83% menggunakan kayu bakar, dan sisanya sebesar 1.17% menggunakan gas LPG sebagai bahan bakar untuk memasak. Hal tersebut mengindikasikan bahwa minyak tanah dan kayu bakar masih diminati oleh sebagian besar penduduk di Kabupaten Bogor.
5
lainnya 21.73%
memasak dan minum masing-masing sebesar 1.87% dan 0.47%.
sungai 6.77%
tempat sampah 5.61%
SHGB akta 0.47% jual beli 5%
dalam lubang 65.98%
Persentase tempat pembuangan sampah sebagian besar penduduk
Berdasarkan Gambar 3 dapat terlihat bahwa sebagian besar masyarakat di Kabupaten Bogor membuang sampah di dalam lubang kemudian dibakar dengan persentase sebesar 65.98%, tempat sampah sebesar 5.61%, serta sungai dan lainnya masing-masing sebesar 6.77% dan 21.73%. Namun, sebagian besar desa yang berada di Kabupaten bogor belum memiliki tempat penampungan sampah sementara. Hal ini dapat dilihat pada Lampiran 6 dimana hanya 78 desa yang sudah memiliki tempat penampungan sampah sementara. Mayoritas penduduk di desa-desa yang berada di Kabupaten Bogor sudah mempunyai tempat buang air besar sendiri, terlihat dari besarnya persentase penduduk yang mempunyai jamban sendiri. Hal ini menunjukkan bahwa mayoritas penduduk di Kabupaten Bogor sudah memiliki sanitasi yang baik. pompa listrik PAM 12.38% 1.87%
mata air 17.52% sungai/ danau 0.47%
girik/let ter C 88%
Gambar 5 Persentase sertifikasi lahan tempat tinggal penduduk Pada Gambar 5 terlihat bahwa sebagian besar penduduk menggunakan girik/letter C sebagai bukti kepemilikan lahan tempat tinggal dengan persentase sebesar 88%, dan hanya 7% penduduk di Kabupaten Bogor yang sudah memiliki sertifikat hak milik sebagai bukti kepemilikan lahan tempat tinggal. Sisanya, persentase sertifikat hak guna bangunan dan akta jual beli masingmasing 0.47% dan 4.90%. Boxplot of X2, X3, X8, X9 100
80
Persentase
Gambar 3
sertifika si hak milik 7%
60
40
20
0 X2
X3
X8
X9
Gambar 6 Boxplot sebaran data peubah X2 , X3 , X8 , dan X9 sumur 67.76%
Gambar 4
Persentase sumber air yang digunakan untuk memasak atau minum pada umumnya
Sebagian besar masyarakat di Kabupaten Bogor menggunakan air sumur untuk keperluan memasak dan minum. Hal tersebut terlihat pada Gambar 4 dimana pesentase pengguna air sumur yaitu sebesar 67.76%, persentase pengguna mata air sebesar 17.52%, persentase pengguna pompa listrik sebesar 12.38%, serta persentase pengguna PAM/air kemasan dan sungai/danau untuk keperluan
Desa-desa di Kabupaten memiliki angka kemiskinan yang cukup rendah. Hal tersebut terlihat dari boxplot pada Gambar 6. Berdasarkan Gambar 6 terlihat bahwa 75% desa di Kabupaten Bogor memiliki persentase penerima kartu ASKESKIN setahun terakhir (X2 ) dibawah 40% dan seluruh desa di Kabupaten bogor memiliki persentase surat miskin yang dikeluarkan desa setahun terakhir (X3 ) dibawah 40%. Hal ini mengindikasikan bahwa desa-desa yang ada di Kabupaten Bogor dikategorikan sebagai desa tidak miskin. Hampir semua desa di Kabupaten Bogor menggunakan listrik yang dikelola oleh PLN. Hal ini terlihat dari persentase desa
6
pengguna PLN dimana lebih dari 75% desadesa di Kabupaten Bogor memiliki persentase pengguna PLN (X9 ) diatas 80%. Namun, ada satu desa di Kabupaten Bogor dengan persentase pengguna PLN masih dibawah 20% yaitu Desa Cisarua, Kecamatan Sukajaya. Gambar 6 juga menunjukkan bahwa sebagian besar desa di Kabupaten Bogor memiliki persentase keluarga yang anggotanya menjadi buruh tani (X9 ) dibawah 40%. Hal tersebut menunjukkan bahwa masih banyak masyarakat di desa-desa yang ada di Kabupaten Bogor yang bekerja di luar sektor pertanian. Nilai korelasi antara peubah X2 , X3 , X8 , X9 , dan X12 dilihat pada Tabel 1. Tabel 1 Matriks korelasi antara peubah X2 , X3 , X8 , X9 , dan X12 X2
X3
X8
X3
0.113
X8
-0.258
X9
0.169
0.096
-0.136
X12
-0.045
-0.000
-0.001
X9
0.070 -0.045
Berdasarkan Tabel 1 terlihat korelasi antara beberapa peubah penjelas cukup rendah. Hal tersebut menunjukkan tidak adanya multikolinieritas sehingga tidak mempengaruhi kestabilan dari pohon regresi yang akan dihasilkan. Pohon Regresi Program Perlindungan Sosial Kabupaten Bogor Pohon regresi Program Perlindungan Sosial (PLS) Kabupaten Bogor menghasilkan 20 simpul yang terdiri dari 9 simpul dalam (internal node) dan 11 simpul terminal (terminal node) dengan keragaman pada peubah respon yang dapat dijelaskan oleh model sebesar 46.77%. Hal ini menunjukkan bahwa sebesar 46.77% keragaman persentase penerima bantuan PLS dapat dijelaskan oleh peubah penjelas yang memberikan pengaruh signifikan dalam pembentukan pohon maksimal. Dari 11 simpul yang terbentuk pada pohon maksimal maka persentase keluarga penerima bantuan PLS dapat dikelompokkam menjadi 11 kelompok dengan berbagai karakteristik peubah penjelasnya. Simpul akhir merupakan kelompok desa dengan persentase perolehan bantuan PLS yang relatif homogen. Struktur pohon maksimal dapat dilihat pada Lampiran 7.
Berdasarkan pohon regresi maksimal yang terbentuk, ternyata tidak semua peubah penjelas yang digunakan untuk menduga persentese pemerima bantuan PLS masuk ke dalam model. Peubah X4 , X5 , X6 , X7 , dan X12 tidak muncul dalam pembentukan pohon maksimal artinya peubah-peubah tersebut bukan merupakan peubah yang efektif dalam memprediksi persentase keluarga penerima bantuan PLS. Peubah yang paling efektif dalam memprediksi persentase keluarga pemerima bantuan PLS adalah persentase keluarga yang anggotanya menjadi buruh tani (X9 ). Jadi, peubah persentase keluarga yang anggotanya menjadi buruh tani merupakan peubah yang mempunyai kontribusi utama dalam pembentukan pohon regresi maksimal. Peubah lain yang berpengaruh adalah X1 , X2 , X3 , X8 , X10 , dan X11 . Setelah diperoleh pohon maksimal, dilakukan proses pemangkasan untuk mendapatkan pohon optimal. Hal ini bertujuan untuk mendapatkan pohon regresi yang lebih sederhana dengan prediksi kesalahan yang cukup kecil. Berdasarkan penelitian sebelumnya yang dilakukan oleh Mendes dan Akkartal (2009), pohon regresi yang digunakan adalah pohon regresi optimal. Hal tersebut dikarenakan pohon optimal lebih efektif dalam memprediksi persentase penerima bantuan PLS dan memudahkan dalam interpretasi pohon regresi. Pemangkasan (Pruning) Pohon Regresi Maksimal untuk Menghasilkan Pohon Regresi Optimal Pohon regresi yang terbentuk melalui proses pemilahan secara rekursif akan berukuran sangat besar. Hal ini dikarenakan aturan penghentian (stopping rule) yang digunakan hanya berdasarkan banyaknya jumlah amatan pada simpul terminal minimal lima atau penurunan tingkat keragaman nilai persentase keluarga penerima bantuan perlindungan sosial dalam simpul anakan hasil pemilahan. Oleh kerena itu, perlu dilakukan pemangkasan untuk memperoleh pohon regresi optimal yang berukuan sederhana tetapi memberikan kesalahan prediksi yang cukup kecil. Pemangkasan dilakukan dengan proses validasi silang yaitu dengan menggunakan validasi silang lipat 10 (10fold cross validation) untuk menghasilkan pohon regresi terbaik. Hasil proses validasi silang terlihat pada Gambar 7. Berdasarkan Gambar 7 terlihat bahwa pohon regresi dengan lima buah simpul akhir memiliki kuadrat tengah galat terkecil,
7
3200
1200
740
-Inf
50000
55000
14000
45000
Kuadrat Tengah Galat deviance
60000
sehingga pohon regresi dengan lima buah simpul akhir dari total 8 simpul dipilih sebagai pohon regresi optimal terbaik hasil dari proses validasi silang lipat 10.
2
4
6
8
10
Banyaknya size Simpul Akhir
Gambar 7
Grafik kuadrat tengah galat terhadap banyaknya simpul akhir
Pohon regresi optimal persentase keluarga penerima bantuan PLS memiliki keragaman pada peubah respon yang dapat dijelaskan oleh model sebesar 38.31%. Hal ini menunjukkan bahwa sebesar 38.31% keragaman persentase keluarga penerima bantuan PLS dapat dijelaskan oleh peubahpeubah penjelas yang memberikan pengaruh signifikan dalam pembentukan pohon optimal. Dari lima simpul yang terbentuk maka persentase keluarga penerima bantuan PLS dapat dikelompokkan menjadi lima kelompok pendugaan dengan berbagai karakteristik peubah penjelasnya. Gambar 8 merupakan struktur pohon optimal persentase keluarga penerima PLS. Deskripsi struktur pohon optimal dapat dilihat pada Lampiran 8. X9 < 3.4
|
X1:ab 14.15
X2 < 15.2
X2 < 62.08
33.00 22.50
Gambar 8
47.50
29.96
Struktur pohon optimal hasil pemangkasan
Berdasarkan deskripsi pohon optimal pada Lampiran 8, persentase penerima bantuan PLS pada Node 0 atau simpul akar dibagi menjadi dua simpul berdasarkan persentase keluarga yang anggotanya menjadi buruh tani sebagai Simpul 1 (X9 ≤ 3.4%) dan Simpul 2 (X9 > 3.4%). Jadi, persentase keluarga yang anggotanya menjadi buruh tani adalah peubah yang paling efektif dalam memprediksi persentase keluarga penerima bantuan PLS. Nilai dugaan bagi persentase keluarga penerima bantuan PLS pada Simpul 1 dan Simpul 2 masing-masing adalah 14.15% dan 29.28%. Proporsi dari persentase keluarga penerima bantuan PLS pada Simpul 1 dan Simpul 2 adalah 17.52% dan 82.48% dari total keseluruhan data amatan. Simpul 2 yang dihasilkan oleh persentase keluarga yang anggotanya menjadi buruh tani dibagi menjadi simpul baru berdasarkan jenis bahan bakar yang digunakan untuk memasak. Namun, pada persentase keluarga yang anggotanya menjadi buruh tani ≤ 3.4% (Simpul 1) tidak terbentuk simpul baru. Hal ini dikarenakan pada Simpul 1 menunjukkan kehomogenan kelompok yang disebut simpul terminal. Oleh karena itu, Simpul 1 lebih efisien dibandingkan Simpul 2 dalam memprediksi persentase keluarga penerima bantuan PLS. Bahan bakar yang digunakan untuk memasak adalah peubah kedua yang memiliki pengaruh paling signifikan untuk memprediksi presentase keluarga penerima bantuan PLS. Berdasarkan jenis bahan bakar yang digunakan untuk memasak, sebanyak 353 amatan pada Simpul 2 dibagi menjadi dua simpul baru, yaitu Simpul 3 dengan jenis bahan bakar yang digunakan untuk memasak berupa gas LPG dan minyak tanah dan Simpul 4 dengan bahan bakar yang digunakan untuk memasak berupa kayu bakar. Persentase keluarga yang anggotanya menjadi buruh tani > 3.4% dan jenis bahan bakar yang digunakan untuk memasak berupa LPG dan minyak tanah memberikan nilai prediksi bagi persentase keluarga penerima bantuan PLS sebesar 27.32%. Persentase keluarga yang anggotanya menjadi buruh tani > 3.4% dan kayu bakar sebagai bahan bakar untuk memasak memberikan nilai prediksi sebesar 34.32% bagi persentase keluarga penerima bantuan PLS. Berdasarkan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir, persentase keluarga yang menerima bantuan perlindungan sosial pada Simpul 3 dan Simpul 4 dibagi menjadi simpul-simpul baru. Simpul
8
3 mempunyai simpul baru yaitu Simpul 5 (X2 ≤ 15.2 %) dan Simpul 6 (X2 > 15.2%), sedangkan Simpul 4 mempunya simpul baru yaitu Simpul 7 (X2 ≤ 62.08) dan Simpul 8 (X2 > 62.08). Hal ini menunjukkan bahwa disamping persentase keluarga yang anggotanya menjadi buruh tani dan bahan bakar yang digunakan untuk memasak, persentase keluarga yang menerima kartu ASKESKIN setahun terakhir juga dapat digunakan untuk memprediksi persentase keluarga penerima bantuan PLS. Persentase keluarga yang anggotanya menjadi buruh tani > 3.4%, jenis bahan bakar yang digunakan untuk memasak berupa LPG dan minyak tanah, dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir ≤ 15.2% memberikan nilai prediksi bagi persentase keluarga penerima bantuan PLS sebesar 22.50%, sedangkan persentase keluarga yang anggotanya menjadi buruh tani > 3.4%, jenis bahan bakar yang digunakan untuk memasak berupa LPG dan minyak tanah, dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir > 15.2% memberikan nilai prediksi bagi persentase keluarga penerima bantuan PLS sebesar 29.96%. Persentase keluarga yang anggotanya menjadi buruh tani > 3.4%, jenis bahan bakar yang digunakan untuk memasak berupa kayu bakar, dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir ≤ 62.08% memberikan nilai prediksi bagi persentase keluarga penerima bantuan PLS sebesar 33%, sedangkan persentase keluarga yang anggotanya menjadi buruh tani > 3.4%, jenis bahan bakar yang digunakan untuk memasak berupa kayu bakar, dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir > 62.08% memberikan nilai prediksi bagi persentase keluarga penerima bantuan PLS sebesar 47.50%.
SIMPULAN DAN SARAN Simpulan Pohon regresi persentase keluarga penerima bantuan PLS menghasilkan pohon optimal dengan 5 simpul terminal dari total 8 simpul yang dihasilkan. Berdasarkan pohon regresi optimal, dapat disimpulkan bahwa persentase keluarga yang anggotanya menjadi buruh tani, bahan bakar untuk memasak, dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir merupakan
peubah penting dalam memprediksi presentase keluarga penerima bantuan PLS. Ketiga peubah tersebut merupakan peubah yang paling efisien didandingkan sembilan peubah lainnya dalam memprediksi pres entase keluarga penerima bantuan PLS. Hasil pengelompokan pohon regresi dapat digunakan sebagai referensi pemerintah dalam menentukan segmentasi penerima bantuan program perlindungan sosial bagi kelompokkelompok desa yang berada di Kabupaten Bogor berdasarkan kombinasi peubah-peubah penjelas yang dihasilkan. Saran Perlu dilakukan penelitian lebih lanjut untuk mengetahui jumlah minimum simpul akhir pada pohon maksimal yang layak untuk pemangkasan.
DAFTAR PUSTAKA Anonim. 2012. Jumlah Penduduk Miskin Kabupaten Bogor Tertinggi di Jawa Barat. http://iridsindonesia.com/ page/5. [15 Januari 2012]. Anonim. 2012. Mengurangi Kemiskinan. https:// worldbank.org/INTINDONESIA. [15 Januari 2012]. Breiman et al. 1993.Classification and Regression Trees. Chapman and Hall: New York. Komalasari WB. 2005. Penentuan FaktorFaktor yang Mempengaruhi Pendapatan Usahatani dengan Menggunakan Metode Pohon Regresi CART dan CHAID. [Tesis]. Sekolah Pascasarjana IPB. Bogor. Lewis RJ. 2000. An Introduction to Classification and Regression Tree (CART) Analysis. California: Department of Emergency Medicine, Harbor-UCLA Medical Centre. Mendez M, Akkartal E. 2009. Regression Tree Analysis for Predicting Slaugther Weight in Broilers. Italia, Journal Animal Science 8 : 615-624. 8
9
LAMPIRAN
10
Lampiran 1. Diagram alir pembentukan pohon regresi
Mulai
Memilih peubah-peubah penjelas yang bersesuaian antara data Podes dan data PPLS
Membangun pohon maksimal dengan menggunakan algoritma CART
Pemangkasan untuk memperoleh pohon optimal
Pohon regresi optimal
Selesai
11
Lampiran 2. Diagram alir pembentukan pohon regresi maksimal
Mulai
Tentukan jumlah kemungkinan penyekatan pada tiap peubah penjelas
Kontinu
Kategorik
Jumlah penyekatan = n-1
Nominal Banyaknya peyekatan = 2L-1 -1 Ordinal Banyaknya penyekatan = L-1
Cari penyekatan terbaik dari tiap peubah penjelas ϕ (s,t)
Cari penyekatan terbaik dari tiap peubah penjelas ϕ (s,t)
Pilih penyekatan terbaik dari kumpulan penyekatan terbaik tersebut ϕ (s*,t) = 𝑚𝑎𝑥 𝑠𝜖𝑆 ϕ (s,t)
Penghentian jika amatan pada simpul akhir ≤ 5 (Breimann et al. 1993)
Ya selesai
Tidak
Proses rekursif
12
Lampiran 3. Diagram alir pembentukan pohon regresi optimal
Pohon regresi maksimal
10-fold cross validation
Kuadrat tengah galat (KTG) 𝑅 𝑐𝑣 𝑇𝑘 = ∑𝑁 𝑖 𝑁
𝑦𝑖
𝑦̅ 𝑘
Cari pohon optimal terbaik dengan kriteria kuadrat tengah galat (KTG) terkecil
𝑅 𝑐𝑣 𝑇𝑘0 = min 𝑅 𝑐𝑣 (𝑇𝑘
Pohon regresi optimal
selesai
13
Lampiran 4. Tabel peubah bebas yang digunakan beserta kategorinya Kode
Peubah
Jenis
Kategori
X1
Bahan bakar untuk memasak
X2
Persentase keluarga yang menerima kartu ASKESKIN setahun terakhir
Kontinu
-
X3
Jumlah surat miskin yang dikeluarkan desa setahun terakhir
Kontinu
-
X4
Tempat sebagian membuang sampah
X5
penduduk
Kategorik
Kategorik
1 = Kayu Bakar 2 = Minyak Tanah 3 = LPG
1 = Sungai 2 = Lubang 3 = Tempat Sampah 4 = Lainnya
Tempat buang air besar
Kategorik
1 = Bukan Jamban 2 = Jamban Bersama 3 = Jamban Umum 4 = Jamban Pribadi
X6
Tempat penampungan sementara
sampah
Kategorik
1 = Tidak ada 2 = Ada
X7
Jenis permukaan jalan yang terluas
Kategorik
1 = Tanah 2 = Diperkeras 3 = Aspal
X8
Persentase pengguna PLN
Kontinu
-
X9
Persentase keluarga yang anggotanya menjadi buruh tani
Kontinu
-
X10
Sumber air untuk memasak atau minum pada umumnya
Kategorik
1 = Mata Air 2 = Sungai/ Danau 3 = Sumur 4 = Pompa Listrik 5 = PAM/ Air Kemasan
X11
Sertifikasi sebagian besar lahan tempat tinggal penduduk
Kategorik
1 = Girik/ Letter C 2 = Akta Jual Beli 3 = Sertifikat Hak Guna Bangunan 4 = Sertifikat Hak Milik
X12
Jumlah TKI
Kontinu
-
14
Lampiran 5. Deskripsi peubah-peubah numerik Mean
Peubah Persentase keluarga yang menerima kartu ASKESKIN setahun terakhir
Simp. Baku
Median
Min
Max
24.031
19.206
20.15
0
98.36
4.554
4.738
3.015
0
33.33
Persentase pengguna PLN
90.702
19.95
97.94
18.52
100
Persentase keluarga yang anggotanya menjadi buruh tani
22.575
20.157
17.265
0
84.35
3.825
12.652
2
0
244
Persentase SKTM yang dikeluarkan desa setahun terakhir
Jumlah TKI
Lampiran 6. Deskripsi peubah-peubah kategorik Peubah
Kategori
Bahan bakar untuk memasak
Jumlah
Persentase
Kayu Bakar
102
23.83
Minyak Tanah LPG Sungai
321 5 29
75 1.17 6.77
Lubang Tempat Sampah Lainnya
282 24 93
65.89 5.61 21.73
Bukan Jamban Jamban Bersama Jamban Umum
98 8 21
22.9 1.87 4.90
Jamban Pribadi Tidak ada Ada
301 350 78
70.33 81.78 18.22
Jenis permukaan jalan yang terluas
Tanah Diperkeras Aspal
8 117 303
1.87 27.34 70.79
Sumber air untuk memasak atau minum pada umumnya
Mata Air Sungai/ Danau Sumur
75 2 290
17.52 0.47 67.76
Pompa Listrik PAM/Air Kemasan Girik/ Letter C
53 8 376
12.38 1.87 87.85
Akta Jual Beli Sertifikat Hak Guna Bangunan Sertifikat Hak Milik
21 2
4.90 0.47
29
6.78
Tempat sampah
sebagian
penduduk
membuang
Tempat buang air besar
Tempat penampungan sampah sementara
Sertifikasi sebagian besar lahan tempat tinggal penduduk
15
Lampiran 7.
Struktur pohon maksimal persentase keluarga penerima bantuan program perlindungan sosial
Y X9
X9 ≤ 3.4% X9 > 3.4%
14.15% 29.28% X1
X1 : LPG, Gasoline
X1 : kayu bakar
27.32%
34,32%
X2
X2
X2 ≤ 15.2%
X2 > 15.2%
X2 ≤ 62.08%
22.5%
29.96%
33.00%
X11
X10
X11 : SHGB, SHM
X11 : AJB, Girik
X10 : Pompa, PAM
19.23%
30.66%
30.91%
X9
X3
47.50%
X10 : MA, Sungai, Sumur 36.61%
X9 ≤ 13.225%
X9 > 13.225%
X3 ≤ 2.385%
X3 > 2.385%
26.75%
32.17%
27.13%
33.87%
X8
X2 > 62.08%
X8
X8 ≤ 96.25%
X2 > 96.25%
X8 ≤ 75.965%
X8 > 75.965%
34.69%
29.51%
22.67%
35.94%
16
Lampiran 8. Struktur pohon optimal persentase keluarga penerima bantuan program perlindungan sosial
Node 0 Mean N % Predicted
26.63% 428 100 26.63%
X9
X9 ≤ 3.4%
X9 > 3.4%
Node 1
Mean N % Predicted
Node 2 Mean N % Predicted
14.15% 75 17.52 14.15%
29.28% 353 82.48 29.28%
X1
X1 : LPG, Gasoline
X1 : Kayu Bakar
Node 3 Mean N % Predicted
Node 4 27.32% 254 59.35 27.32%
Mean N % Predicted
X2
X2 ≤ 15.2% Node 5
Mean N % Predicted
22.50% 90 21.03 22.50%
34.32% 99 23.13 34.32%
X2
X2 > 15.2% Node 6 Mean N % Predicted
29.96% 164 38.32 29.96%
X2 ≤ 62.08% Node 7 Mean N % Predicted
X2 > 62.08%
33% 90 21.03 33%
Node 8 Mean N % Predicted
47.5% 9 2.1 47.5%
17
Lampiran 9. Program R a. Program R untuk membangun pohon maksimal > tmp <-read.table("PUTRI.csv", header=T, sep=",") > tmp.tr <- tree(Y~ X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12, tmp) > tmp.tr > plot(tmp.tr); text(tmp.tr, cex=0.3) > summary(tmp.tr) b. Program R pemangkasan pohon maksimal dengan menggunakan kriteria kuadrat tengah galat > tmp.tr.cv<-cv.tree(tmp.tr,,prune.tree) > for(i in 2:5)tmp.tr.cv$dev<-tmp.tr.cv$dev+ + cv.tree(tmp.tr,,prune.tree)$dev > tmp.tr.cv$dev<-tmp.tr.cv$dev/5 > plot(tmp.tr.cv) c. Program R untuk penentuan pohon optimal hasil pemangkasan > opt.trees=which(tmp.tr.cv$dev==min(tmp.t r.cv$dev)) > best.leave=min(tmp.tr.cv$size[opt.trees]) > tmp.tr.pruned=prune.tree(tmp.tr, best=best.leave) > plot(tmp.tr.pruned) > plot(tmp.tr.pruned); text(tmp.tr.pruned, cex=0.7) > summary(tmp.tr.pruned)