“Technologia” Vol 7, No.1, Januari – Maret 2016
15
METODE POHON GABUNGAN PADA CART UNTUK ANALISA KESEJAHTERAAN RUMAH TANGGA DI BANJARMASIN Galih Mahalisa, S.Kom, M.Kom (
[email protected])
ABSTRAK Kemiskinan merupakan fenomena sosial yang menjadi atribut dari sebuah negara. Fenomena ini bisa dikatakan keadaan dimana terjadi ketidakmampuan untuk memenuhi kebutuhan dasar seperti makanan, pakaian , tempat berlindung, pendidikan, dan kesehatan. Pada penelitian ini menggunakan metode pohon gabungan atau cart dengan tujuan dapat dicari pola status kepala rumah tangga untuk dapat dijadikan bahan analisis pemerintah dalam menentukan status kepala rumah tangga di masa yang akan datang. Dalam penelitian ini di wilayah Banjarmasin (Kalsel) kecamatan Aluh-Aluh sebanyak 19.406 rumah tangga, 40 % dari data tersebut akan dijadikan sample untuk diklasifikasi. Metode yang diusulkan yaitu metode pohon gabungan adalah sebuah metode statistik nonparametrik yang digunakan untuk melakukan analisis klasifikasi. Pengklasifikasian dengan metode pohon klasifikasi terdiri dari 4 komponen, yaitu : variabel respon, variabel , data learning dan data testing. Dari hasil penelitian dari metode pohon gabungan atau Model Classification and Regression Trees (CART) dengan menggunakan proporsi data learning 70% dan data testing 30% karena menghasilkan ketepatan klasifikasi terbaik dibandingkan dengan proporsi data lainnya. Dimana diperoleh simpul terminal pada klasifikasi optimal sebanyak 47 simpul terminal dengan variabel pemilah utama yaitu jumlah anggota keluarga kepala rumah tangga. Metode klasifikasi pohon menghasilkan pohon optimal dengan ketepatan klasifikasi data learningdan testingyaitu sebesar 84,28% dan 84,00%. Kata Kunci : Kemiskinan, Pohon gabungan, cart, Model Regression Trees, Data learning, Data testing.
PENDAHULUAN Permasalahan kemiskinan merupakan permasalahan yang kompleks yang mencakup berbagai sektor. Dalam rangka mengimplementasikan berbagai program penanggulangan kemiskinan, informasi mengenai siapa yang miskin dan dimana mereka berada menjadi sangat penting dan akan menjadi modal dasar dalam target rumah tangga miskin. Dengan kata lain, agar program penanggulangan kemiskinan berhasil dan
Jurnal Ilmiah Fakultas Teknik “Technologia”
Classification and
tepat sasaran, maka ketersediaan data kemiskinan yang terpercaya merupakan suatu keharusan. Ada beberapa metode klasifikasi dengan pendekatan nonparametrik yang sering digunakan, salah satunya adalah metode klasifikasi berstruktur pohon yang diperkenalkan oleh Leo Breiman, et.al. yaitu Classification and Regression Trees (CART). Metode pohon gabungan atau CART memiliki banyak keunggulan dibandingkan dengan metode lain seperti, variabel-variabel dalam CART baik variabel dependen maupun independen tidak menggunakan asumsi
“Technologia” Vol 7, No.1, Januari – Maret 2016
distribusi tertentu, variabel independennya dapat bertipe kategorik (nominal atau ordinal) maupun kontinu, tidak berlaku adanya transformasi data dan interpretasinya mudah dipahami. Dalam penelitian ini di wilayah Banjarmasin (Kalsel) kecamatan Aluh-Aluh sebanyak 19.406 rumah tangga, 40 % dari data tersebut akan dijadikan sample untuk diklasifikasi RUMUSAN MASALAH Berdasarkan kondisi seperti yang telah diuraikan diatas, maka dapat dirumuskan permasalahan dalam penelitian ini yaitu “Menganalisa kesejahteraan rumah tangga di Kecamatan Aluh-Aluh yang akurat menggunakan metode pohon gabungan atau CART “
TUJUAN PENELITIAN Tujuan penelitian ini adalah : 1. Mengklasifikasi atau mengelompok data status kepala rumah tangga di kecamatan aluh-aluh dengan menggunakan algoritma CART . 2. Menentukan pola kepala rumah tangga yang dihasilkan untuk menentukan status di masa yang akan datang.
TARGET LUARAN DAN MANFAAT PENELITIAN Target luaran dalam pembuatan laporan penelitian ini adalah untuk memfasilitasi tercapainya tingkat akurasi data dari BPS atau data PPLS 2011 dengan menggunakan metode pohon gabungan sehingga didapatkan hasil yang akurat dalam pengelompokkan data.
Manfaat dari penelitian ini adalah: 1. Manfaat praktis dari hasil penelitian ini diharapkan dapat digunakan oleh staff Badan Pusat Statistik untuk klasifikasi status kesejahteraan rumah tangga. 2. Manfaat teoritis dari hasil penelitian ini diharapkan dapat memberikan sumbangan penelitian tentang analisa CART 3. Manfaat kebijakan dari hasil penelitian ini dapat dilakukan sebagai bahan pertimbangan bagi Badan Pusat Statistik khususnya PPLS untuk melakukan analisa status kesejahteraan guna mensukseskan program bantuan pemerintah. METODE PENELITIAN Data yang digunakan dalam penelitian ini adalah berasal dari hasil pendataan PPLS 2011 Provinsi Kalimantan Selatan Kecamatan Aluh – Aluh. Total data anggota rumah tangga di kecamatan Aluh – Aluh sebesar 19.406 rumah tangga, dari data. Namun dalam penelitian hanya digunakan sebanyak 40 % dari data dengan objek yang diteliti adalah status kesejahteraannya yang termasuk dalam kategori (1) miskin dan (2) paling miskin, yang usia kepala keluarganya antara 31 – 98 tahun, pengambilan sample penelitian ini dilakukan agar analisa bersifat independen antara satu dengan yang lain. Variabel dan kategori yang digunakan pada penelitian ini adalah :
VAR Y
X1
X2 X3
Jurnal Ilmiah Fakultas Teknik “Technologia”
16
Status Kesejahteraan Jenis Kelamin Kepala Rumah Tangga Umur Kepala Rumah Tangga Jumlah
KATEGORI
2 1
Kelompok 1 (Paling Miskin) Kelompok 2 (Miskin) Laki-laki
2
Perempuan
1
-
1
Satu Keluarga
“Technologia” Vol 7, No.1, Januari – Maret 2016
Keluarga
X4
Jumlah Anggota Keluarga
X5 Pendidikan Kepala Rumah Tangga
X6 Lapangan Usaha Kepala Rumah Tangga
2 3 1 2 3 4 5 0 1 2 3 4 1 2 3 4 5 6 7
1 2 3
Dua Keluarga Lebih dari Dua Keluarga 1 Orang 2 Orang 3 Orang 4 Orang Lebih dari 4 Orang Tidak Punya Ijazah SD/Sederajat SMP/Sederajat SMA/Sederajat Perguruan Tinggi Pertanian (Padi & Palawija) Hortikultura Perkebunan Perikanan Tangkap Perikanan Budidaya Peternakan Kehutanan & Pertanian Lain Pertambangan / Penggalian Industri Pengolahan Listrik & Gas Bangunan / Konstruksi Pedagang Hotel & Rumah Makan Transportasi & Pergudangan Informasi & Komunikasi Keuangan & Asuransi Jasa Pendidikan/ Jasa Kesehatan/ JasaKemasyarakatan, Pemerintahan dan Perorangan Lainnya Berusaha Sendiri Berusaha dibantu Buruh tidak tetap / tidak dibayar Berusaha dibantu Buruh tetap/dibayar Buruh/ Karyawan/ Pegawai Swasta Pekerja Bebas Pekerja Keluarga / Tidak dibayar Milik Sendiri Kontrak/ Sewa Lainnya
1 2 3 4 5 6 7 1 2 3 1 2 3 4 1 2 3
Beton Genteng Sirap Seng Asbes Ijuk/ Rumbia Lainnya Bagus/ Kualitas Tinggi Biasa/ Kualitas Sedang Jelek/ Kualitas Rendah Tembok Kayu Bambu Lainnya Bagus/ Kualitas Tinggi Biasa/ Kualitas Sedang Jelek/ Kualitas Rendah
8 9 10 11 12 13 14 15 16 17
X7
Status Kependudukan dalam Pekerjaan Kepala Rumah Tangga
18 1 2
3 4 5 6
X8
Status Penguasaan Bangunan Tempat Tinggal
X9
Jenis Atap Terluas
X10
Kualitas Atap
X11
Jenis Dinding Terluas
X12
Kualitas Dinding
Jurnal Ilmiah Fakultas Teknik “Technologia”
17
1 X13
X14
X15
X16
Jenis Lantai
Sumber Air Minum Sumber Penerangan Utama Bahan Bakar Utama Memasak
2 3 4 1 2 3 4 1 2 3 1 2 3 4
Bukan Tanah/ Bambu/ Kayu Tanah Bambu Kayu Air Kemasan Air Ledeng Air Terlindung Air Tidak Terlindung Listrik PLN Listrik Non-PLN Tidak ada Listrik Listrik/ Gas/ Elpiji Minyak Tanah Kayu Lainnya
Terlebih dahulu data penelitian dibagi menjadi dua kelompok yakni data learning dan data testing. Pada penelitian ini dicobakan kombinasi proposi data learning dan testing antara lain : proporsi data learning > data testing (70% : 30%), proporsi data learning = data testing (50% : 50%), dan proporsi data learning < data testing (40% : 60%). Data tersebut diolah dengan menggunakan paket software CART Pro ex 6.0 dari Salford System. Langkah-langkah penerapan Algoritma CART : 1. Pembentukan pohon klasifikasi a. Pemilihan Pemilah (Classifier) Untuk membentuk pohon klasifikasi digunakan sampel data Learning (L) yang masih bersifat heterogen. Sampel tersebut akan dipilah berdasarkan aturan pemilahan dan kriteria goodnessof-split. Pemilihan pemilah tergantung pada jenis pohon atau lebih tepatnya tergantung pada jenis variabel responnya. Untuk mengukur tingkat keheterogenan suatu kelas dari suatu simpul tertentu dalam pohon klasifikasi dikenal dengan istilah impurity measure i(t). Ukuran ini akan membantu kita menemukan fungsi pemilah yang optimal. Kualitas ukuran dari seberapa baik pemilah
“Technologia” Vol 7, No.1, Januari – Maret 2016
18
s dalam menyaring data menurut kelas merupakan ukuran penurunan keheterogenan dari suatu kelas dan didefinisikan sebagai :
c. Penandaan Label Kelas Penandaan label kelas pada simpul terminal dilakukan berdasarkan aturan jumlah terbanyak yaitu :
Pemilah yang menghasilkan nilai, Δi(s,t) lebih tinggi merupakan pemilah yang lebih baik karena hal ini memungkinkan untuk mereduksi keheterogenan secara lebih signifikan. Karena tL ∪ tR = t maka nilai Δi(s,t) merepresentasikan perubahan dari keheterogenan dalam simpul t yang semata-mata disebabkan oleh pemilah s. Jika simpul yang diperoleh merupakan kelas yang tidak homogen, prosedur yang sama diulangi sampai pohon klasifikasi menjadi suatu konfigurasi tertentu. Dan memenuhi
Dengan p(j│t) adalah proporsi kelas j pada simpul t, Nj(t) adalah jumlah pengamatan kelas j pada simpul t, dan N(t) adalah jumlah pengamatan pada simpul t. Label kelas simpul terminal t adalah jo yang memberi nilai dugaan kesalahan pengklasifikasian simpul t terbesar.
b. Penentuan Simpul Terminal. Suatu simpul t akan menjadi simpul terminal atau tidak akan dipilah kembali apabila pada simpul t tidak terdapat penurunan keheterogenan secara berarti atau adanya batasan minimum nseperti hanya terdapat satu pengamatan pada tiap simpul anak. Menurut Breiman (1984), umumnya jumlah kasus minimum dalam suatu terminal akhir adalah 5, dan apabila hal itu terpenuhi maka pengembangan pohon dihentikan. Sementara itu, menurut Steinberg dan Colla (1995) jumlah kasus yang terdapat dalam simpul terminal yang homogen adalah kurang dari 10 kasus.
Jurnal Ilmiah Fakultas Teknik “Technologia”
2. Pemangkasan pohon klasifikasi Pemangkasan dilakukan dengan jalan memangkas bagian pohon yang kurang penting sehingga didapatkan pohon optimal. Ukuran pemangkasan yang digunakan untuk memperoleh ukuran pohon yang layak adalah Cost complexity minimum (Breiman et. al., 1984). Sebagai ilustrasi, untuk sembarang pohon T yang merupakan sub pohon dari pohon terbesar Tmax (T < Tmax ) ukuran cost complexity yaitu :
Dimana R(T) = Resubtitusion Estimate (Proporsi kesalahan pada sub pohon) α = kompleksitas parameter (complexity parameter) |T| = ukuran banyaknya simpul terminal pohon T Rα (T) merupakan kombinasi linear biaya dan kompleksitas pohon yang dibentuk dengan menambahkan cost penalty bagi kompleksitas terhadap biaya kesalahan klasifikasi pohon. Cost complexity prunning menentukan suatu pohon bagian T(α)
“Technologia” Vol 7, No.1, Januari – Maret 2016
yang meminimumkan Rα (T) pada seluruh pohon bagian. Atau untuk setiap nilai α, dicari pohon bagian T(α) < Tmax yang meminimumkan Rα (T) yaitu:
Jika R (T) digunakan sebagai kriteria penentuan pohon optimal maka akan cenderung pohon terbesar adalah T1, sebab semakin besar pohon, maka semakin kecil nilai R(T) nya. 3. Penentuan Pohon Klasifikasi Optimal Pohon klasifikasi yang berukuran besar akan memberikan nilai penduga pengganti paling kecil, sehingga pohon ini cenderung dipilih untuk menduga nilai respon. Tetapi ukuran pohon yang besar akan menyebabkan nilai kompleksitas yang tinggi karena struktur data yang digambarkan cenderung kompleks, sehingga perlu dipilih pohon optimal yang berukuran sederhana tetapi memberikan nilai penduga pengganti cukup kecil. Ada dua jenis penduga pengganti, penduga sampel uji (test sample estimate) dan penduga validasi silang lipat V (cross validation V-fold estimate). Disarankan penggunaan penduga validasi silang lipat 10 untuk menghitung biaya pengganti relatif pada sampel yang jumlahnya kurang dari 3000, sedangkan penggunaan pendekatan penduga sampel uji digunakan untuk jumlah sampel yang lebih besar dari 3000.
Jurnal Ilmiah Fakultas Teknik “Technologia”
19
ANALISA HASIL DAN PEMBAHASAN Dari kombinasi antara data learning dan data testing yaitu data learning lebih dari data testing, data learning sama dengan data testing, dan data learning lebih kecil dari pada data testing. Maka dari itu ketepatan klasifikasi data testing tertinggi dicapai pada kombinasi data learning 70% sebesar 84,28% dan testing 30% sebesar 84,00% dengan jumlah terminal sebanyak 47 simpul, sehingga kombinasi inilah yang digunakan sebagai acuan analisis. Tabel 1 Hasil akurasi
No 1* 2 3
Kombinasi Data (%)
Ketepatan Klasifikasi (%)
L
T
L
T
70 50 40
30 50 60
84.28 84.19 84.17
84.00 83.88 80.09
Jumlah Node Terminal 47 46 23
Dari 47 simpul terminal yang terbentuk tersebut, maka dapat diketahui analisa klasifikasi kepala rumah tangga. Berikut ini merupakan penjelasan karekteristik dari simpul-simpul terminal yang terbentuk, yaitu : 1. Node 1 diprediksi status kesejahteraan miskin mempunyai karakteristik jumlah anggota keluarga 1 orang. 2. Node 2 diprediksi status kesejahteraan paling miskin mempunyai karakteristik lapangan usaha kepala rumah tangga adalah pekerja bangunan 3. Node 3 diprediksi status kesejahteraan paling miskin mempunyai karakteristik dinding terluas adalah berjenis kayu 4. Node 4 diprediksi status kesejahteraan miskin mempunyai karakteristik dinding terluas adalah berjenis bambu
“Technologia” Vol 7, No.1, Januari – Maret 2016
Node 5 diprediksi status kesejahteraan paling miskin mempunyai karakteristik jenis lantai bangunan adalah bambu dan tanah 6. Node 6 diprediksi status kesejahteraan miskin yang jenis lantai pada bangunan tempat tinggalnya bukan tanah/bambu/kayu mempunyai karakteristik lapangan usaha kepala rumah tangga adalah pekerja di rumah makan, pertanian, perikanan, dan peternakan 7. Node 7 diprediksi status kesejahteraan miskin yang jenis lapangan usaha kepala keluarganya adalah pekerja di rumah makan, pertanian, perikanan, dan peternakan mempunyai karakteristik bangunan tempat tinggal yang atapnya berjenis sirap 8. Node 8 diprediksi status kesejahteraan miskin yang bangunan atap terluas berjenis asbes mempunyai karakteristik jenis lapangan usaha kepala keluarganya adalah pekerja di rumah makan, pertanian, perikanan, dan peternakan 9. Node 9 diprediksi status kesejahteraan miskin mempunyai karakteristik jenis lapangan usaha kepala keluarganya adalah pekerja bangunan, pekerja di rumah makan, pertanian, perikanan, perkebunan dan peternakan 10. Node 10 diprediksi status kesejahteraan miskin yang jenis lapangan usaha kepala keluarganya adalah pekerja di rumah makan, pertanian, perikanan, dan peternakan mempunyai karakteristik usia kepala rumah tangga yaitu kurang dari sama dengan 53 tahun 11. Node 11 diprediksi status kesejahteraan miskin yang jenis lapangan usaha kepala keluarganya adalah pedagang mempunyai 5.
Jurnal Ilmiah Fakultas Teknik “Technologia”
12.
13.
14.
15.
16.
17.
18.
19.
20
karakteristik lantai bangunan terluas adalah bambu atau tanah. Node 12 diprediksi status kesejahteraan miskin yang bangunan atap terluas berjenis bukan tanah bukan bambu mempunyai karakteristik status bangunan adalah kontrak atau sewa Node 13 diprediksi status kesejahteraan miskin yang jumlah anggota keluarga 2 orang memputnyai karakteristik jenis lantai bangunan terluas adalah bambu atau tanah Node 14 diprediksi status kesejahteraan paling miskin yang bangunan lantai terluas berjenis bambu mempunyai karakteristik jenis dinding terluas adalah kayu Node 15 diprediksi status kesejahteraan paling miskin yang bangunan jenis dinding terluas adalah bambu mempunyai karakteristik jumlah anggota keluarga adalah 3 orang, 4 orang dan lebih dari 4 orang Node 16 diprediksi status kesejahteraan miskin dengan jumlah anggota keluarga 2 orang mempunyai karakteristik jenis kelamin kelapa rumah tangga adalah perempuan Node 17 diprediksi status kesejahteraan miskin yang bangunan jenis lantai terluas adalah bukan tanah atau bukan bambu mempunyai karakteristik status tempat tinggal bangunan adalah kotrak atau sewa Node 18 diprediksi status kesejahteraan miskin yang status bangunan tempat tinggal adalah kontrak atau sewa mempunyai karakteristik jumlah anggota keluarga 4 orang dan 4 orang labih Node 19 diprediksi status kesejahteraan miskin yang jumlah anggota keluarga 4 orang atau 4 orang lebih mempunyai karakteristik
“Technologia” Vol 7, No.1, Januari – Maret 2016
20.
21.
22.
23.
24.
25.
26.
sumber air utama adalah air kemasan, air terlindung, dan air tidak terlindung Node 20 diprediksi status kesejahteraan miskin yang sumber air utama adalah air kemasan, air terlindung, dan air tidak terlindung mempunyai karakteristik jenis lapangan usaha kepala keluarganya adalah pekerja di rumah makan, pertanian, perikanan, dan peternakan Node 21 diprediksi status kesejahteraan miskin yang jenis lapangan usaha kepala keluarganya adalah pekerja bangunan, pekerja di rumah makan, pertanian, perikanan, dan peternakan bangunan mempunyai karakteristik jumlah anggota keluarga lebih dari 4 orang Node 22 diprediksi status kesejahteraan paling miskin yang jumlah anggota keluarga lebih dari 4 orang mempunyai karakteristik bangunan atap terluas berjenis ijuk, rumbia, lainnya, sirap, dan seng Node 23 diprediksi status kesejahteraan miskin yang jumlah anggota keluarga 4 orang mempunyai karakteristik jenis kelamin kepala rumah tangga adalah perempuan Node 24 diprediksi status kesejahteraan miskin yang jenis kelamin kepala rumah tangga adalah laki – laki mempunyai karakteristik usia kepala rumah tangga kurang dari sama dengan 45 tahun Node 25 diprediksi status kesejahteraan miskin yang usia kepala rumah tangga kurang dari sama dengan 45 tahun mempunyai karakteristik status pekerjaan kepala rumah tangga adalah berusaha sendiri, pekerja bebas, pekerja keluarga/tidak dibayar Node 26 diprediksi status kesejahteraan miskin yang status pekerjaan kepala rumah tangga
Jurnal Ilmiah Fakultas Teknik “Technologia”
27.
28.
29.
30.
31.
32.
21
adalah berusaha sendiri, pekerja bebas, pekerja keluarga/tidak dibayar mempunyai karakteristik usia kepala rumah tangga kurang dari sama dengan 35 tahun Node 27 diprediksi status kesejahteraan miskin yang usia kepala rumah tangga kurang dari sama dengan 35 tahun mempunyai karakteristik kualitas atap bangunan tempat tinggal adalah kualitas bagus/kualitas tinggi Node 28 diprediksi status kesejahteraan miskin yang lapangan usahanya bekerja menjadi karyawan swasta mempunyai karakteristik jenis kelamin kepala rumah tangga adalah perempuan Node 29 diprediksi status kesejahteraan paling miskin yang jenis kelamin kepala rumah tangga adalah perempuan mempunyai karakteristik status pekerjaan adalah buruh/karyawan/pegawai swasta, pekerja bebas, pekerja keluarga / tidak dibayar Node 30 diprediksi status kesejahteraan miskin yang berusaha sendiri, pekerja bebas, pekerja keluarga/tidak dibayar mempunyai karakteristik jumlah anggota keluarga adalah lebih dari 4 orang Node 31 diprediksi status kesejahteraan miskin yang jenis kelamin kepala keluarga adalah laki – laki mempunyai karakteristik pendidikan terakhir kepala keluarga adalah perguruan tinggi, smp/sederajat, dan tidak punya ijazah Node 32 diprediksi status kesejahteraan miskin yang pendidikan terakhir kepala keluarga adalah perguruan tinggi, smp/sederajat, dan tidak punya ijazah mempunyai karakteristik usia kepala rumah tangga adalah kurang dari sama dengan 48 tahun
“Technologia” Vol 7, No.1, Januari – Maret 2016
33. Node 33 diprediksi status kesejahteraan miskin yang usia kepala rumah tangga kurang dari sama dengan 48 tahun mempunyai karakteristik jumlah anggota keluarga adalah lebih dari 4 orang 34. Node 34 diprediksi status kesejahteraan miskin yang jumlah anggota keluarga 4 orang mempunyai karakteristik jenis lapangan usaha kepala keluarganya adalah pekerja di hotel, pekerja di rumah makan, perkebunan, dan peternakan 35. Node 35 diprediksi status kesejahteraan miskin yang sumber air utama adalah air ledeng mempunyai karakteristik jumlah anggota keluarga adalah lebih dari 4 orang 36. Node 36 diprediksi status kesejahteraan miskin yang jumlah anggota keluarga lebih dari 4 orang mempunyai karakteristik jenis lapangan usaha kepala keluarganya adalah hortikultura, pekerja bangunan, pekerja di rumah makan, pertanian, perikanan, dan peternakan 37. Node 37 diprediksi status kesejahteraan miskin yang jenis lapangan usaha kepala keluarganya adalah hortikultura mempunyai karakteristik bangunan jenis atap terluas adalah genteng, ijuk/rumbia, lainnya, seng, dan sirap 38. Node 38 diprediksi status kesejahteraan miskin yang jenis lapangan usaha kepala keluarganya adalah pekerja bangunan, pekerja di rumah makan, pertanian, perikanan, dan peternakan mempunyai karakteristik pendidikan terakhir kepala rumah tangga adalah perguruan tinggi, SD/sederajat, tidak punya ijazah 39. Node 39 diprediksi status kesejahteraan miskin yang pendidikan terakhir kepala rumah
Jurnal Ilmiah Fakultas Teknik “Technologia”
40.
41.
42.
43.
44.
45.
22
tangga adalah perguruan tinggi mempunyai karakteristik jenis lapangan usaha kepala keluarganya adalah pekerja bangunan/konstruksi, jasa pendidikan/jasa kesehatan/jasa kemasyarakatan, pemerintahan dan perorangan, pertanian, dan peternakan Node 40 diprediksi status kesejahteraan miskin yang jenis lapangan usaha kepala keluarganya adalah pekerja bangunan/konstruksi, jasa pendidikan/jasa kesehatan/jasa kemasyarakatan, pemerintahan dan perorangan, pertanian, dan peternakan mempunyai karakteristik usia kepala rumah tangga adalah kurang dari sama dengan 43 tahun Node 41 diprediksi status kesejahteraan miskin yang status bangunan tempat tinggal adalah milik sendiri mempunyai karakteristik jenis kelamin kepala rumah tangga adalah perempuan Node 42 diprediksi status kesejahteraan miskin yang jenis kelamin kepala rumah tangga perempuan mempunyai karakteristik jumlah anggota keluarga 2 orang dan lebih dari 4 orang Node 43 diprediksi status kesejahteraan miskin yang jumla anggota keluarga 2 orang dan lebih dari 4 orang mempunyai karakteristik sumber air utama adalah air kemasan, air tidak terlindung Node 44 diprediksi status kesejahteraan miskin yang sumber air utama adalah air kemasan, air tidak terlindung mempunyai karakteristik jenis lapangan usaha kepala keluarganya adalah pekerja di rumah makan, pertanian, perikanan, dan peternakan Node 45 diprediksi status kesejahteraan miskin yang sumber air utama adalah air ledeng
“Technologia” Vol 7, No.1, Januari – Maret 2016
mempunyai karakteristik usia kepala keluarga kurang dari sama dengan 54 tahun 46. Node 46 diprediksi status kesejahteraan miskin yang usia kepala rumaht angga kurang dari sama dengan 55 tahun mempunyai karakteristik pendidikan terakhir kepala rumah tangga adalah perguruan tinggi, SD/sederajat, tidak punya ijazah 47. Node 47 diprediksi status kesejahteraan miskin yang jenis kelamin kepala rumah tangga adalah laki – laki PENUTUP 1.KESIMPULAN 1. Terdapat beberapa gambaran mengenai kependudukan di Provinsi Kalimantan Selatan Kecamatan Aluh - Aluh yaitu sekitar 70% sampel kepala rumah tangga dari pendataan PPLS tahun 2011 bahwa usia kepala rumah tangga berjenis kelamin lakilaki dan sebagian besar berusia produktif yaitu 36-55 tahun dengan rata-rata banyak anggota per-rumah tangga 3-4 orang. Dari aspek pendidikan kepala rumah tangga terlihat rata-rata penduduk bahwa kebanyakan lulusan dari SD dan SMP dengan proporsi terbesar berpendidikan SD. Terakhir dilihat dari aspek ketanagakerjaan terdapat 85% kepala rumah tangga memiliki pekerjaan dengan status pekerjaan sebagai buruh lepas sebesar 48% untuk lapangan usaha terbesar yaitu pertanian dan jasa-jasa. 2. Model Classification and Regression Trees (CART) dengan menggunakan proporsi data learning 70% dan data testing 30% karena menghasilkan ketepatan klasifikasi terbaik dibandingkan dengan proporsi data lainnya. Dimana diperoleh simpul
Jurnal Ilmiah Fakultas Teknik “Technologia”
23
terminal pada klasifikasi optimal sebanyak 47 simpul terminal dengan variabel pemilah utama yaitu jumlah anggota keluarga kepala rumah tangga. Metode klasifikasi pohon menghasilkan pohon optimal dengan ketepatan klasifikasi data learning dan testing yaitu sebesar 84,28% dan 84,00%. 2. Saran Sebagai tindak lanjut dari penelitian ini, maka saran yang dapat diberikan adalah Pengolahan dengan metode CART yang telah dilakukan didapatkan informasi bahwa untuk tingkat pendidikan kepala rumah tangga sangat berpengaruh terhadap model klasifikasi kesejahteraan rumah tangga di Kecamatan Aluh - Aluh. Dari gambaran deskriptif diketahui bahwa pendidikan yang paling banyak ditempuh masyarakat hanya sampai lulusan SD, sehingga perlu sosialisasi kepada masyarakat mengenai pentingnya pendidikan untuk kesejahteraan hidup
DAFTAR PUSTAKA
1] B. P. Statistik, Analisis Data Kemiskinan berdasarkan Data Pendatatan Program Perlindungan Sosial (PPLS) 2011, Jakarta: BPS, 2012. 2] F. J. O. R. d. S. Breiman L, Classification and Regression Trees, New York - London: Chapman Hall, 1984. 3] B. L, Arcing Classifiers ; The Annals of Statistics, New York - London: Chapman Hall, 1998
“Technologia” Vol 7, No.1, Januari – Maret 2016
4] B. W. J. D. Ibrahim W, Klasifikasi Kesejahteraan Rumah Tangga di Provinsi Jawa Timur dengan Pendekatan CART ARCING [ Thesis], Surabaya: Institute Teknik Surabaya, 2010, pp. 1-15. 5] A. G. d. H. Cahyat, Mengkaji Kemiskinan dan Kesejahteraan Rumah Tangga : Sebuah Panduan dengan Contoh dari Kutai Barat, Bogor: CIFOR, 2007.
24
13] Sutton, Classification and Regression Trees, Bagging, and Boosting, 2005. 14] B. RA, Statistical Learning from a Regression Perspective, New York: Springer Science + Business Media, 2008. 15] B. M, Principles of Data Mining, London: Spinger - Verlag, 2007. 16] B. L, Random Forests, 2001.
6] L. d. R. J, An Introduction to Classification And Regression Trees Anaysis, Presented, 2000 7] B. W. d. Sumarni, Bagging CART pada Klasifikasi Anak Putus Sekolah, Institut Teknologi Sepuluh November, 2009. 8] A. Agresti, Categorical Analysis, Canada, 2002.
17] S. R. Freund Y, Experimentswith a new boosting algorithm, San Francisco, 1996. 18] S. R. Freund Y, A decision theoretic generalization of on-line learning and an application to boosting, 1997.
DAta
9] B.Efron, An Introduction to the Bootstrap, New York: Chapman Hall, 1993 10] Eubank, Spline Smoothing and Nonparametric Regression, New York: Marcel Deker, 1988. 11] Komalasari, Pohon Regresi untuk Eksploratori Data dengan Peubah yang Banyak dan Kompleks, 2007. 12] Steinberg, CART : Tree Structured Nonparametric Data Analysis, San Diego: Salford System, 1995.
Jurnal Ilmiah Fakultas Teknik “Technologia”
19] T. R. F. J. Hasti TJ, The Elements of Statistical Learning, New York: Springer - Verlag, 2008. 20] R. L, Ensemble Methods For Classifiers in Data Mining and Knowledge Discovery Handbook, New York: Springer Science, 2008. 21] Z. M, Kernels and Ensembles : Prespectives on Statistical Learning, 2008.