BAB I PENDAHULUAN 1.1 Latar Belakang Kartu Perlindungan Sosial (KPS) adalah kartu yang diterbitkan oleh Pemerintah Indonesia dalam Percepatan dan Perluasan Perlindungan Sosial (P4S). Rumah tangga yang memiliki KPS berhak menerima program-program perlindungan sosial seperti Subsidi Beras untuk Masyarakat Berpenghasilan Rendah (Raskin) , Bantuan Siswa Miskin (BSM), dan Program Simpanan Keluarga Sejahtera (PSKS) sesuai dengan ketentuan yang berlaku. KPS membantu memastikan agar rumah tangga miskin dan rentan miskin dapat menerima manfaat dari semua program perlindungan sosial yang berhak diterimanya sehingga membantu upaya rumah tangga untuk keluar dari kemiskinan. Data Rumah Tangga Sasaran (RTS) bersumber dari Basis Data Terpadu (BDT) yang dikelola oleh Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K). Pendataan RTS telah dilakukan sebanyak tiga kali oleh Badan Pusat Statistik (BPS), yaitu: Pendataan Sosial Ekonomi (PSE) pada tahun 2005, Pendataan Program Perlindungan Sosial (PPLS) pada tahun 2008, dan yang terakhir PPLS pada tahun 2011 (www.psks.info). Pada masyarakat penyebaran penerima Kartu Perlindungan Sosial belum sepenuhnya tepat sasaran, walau sumber data penerima KPS dari Basis Data Terpadu Pemerintah. Seperti yang disebutkan dalam Booklet Penetapan Sasaran Solusi Kepesertaan dan Pemutakhiran Data Penerima KPS yang tersedia pada web resmi pemerintah untuk program penanggulangan kemiskinan www.tnp2k.go.id penetapan sasaran program bantuan sosial berbasis rumah tangga tidak pernah mencapai keakuratan seratus persen. Kemungkinan terjadinya rumah tangga yang luput maupun salah sasaran dapat terjadi pada setiap penyaluran program bantuan masih tetap ada. Hal ini dikarenakan terdapat rumah tangga yang pindah lokasi maupun rumah tangga yang keadaan ekonominya membaik. Permasalahan yang sama juga terjadi pada lingkungan di Kelurahan Pagesangan. Kelurahan Pagesangan merupakan salah satu dari 9 kelurahan yang 12
13
ada pada wilayah Kecamatan Kota Mataram, Nusa Tenggara Barat. Pada halaman web Program Nasional Pemberdayaan Masyarakat Mandiri www.pnpmperkotaan-org dituliskan tentang profil Kelurahan Pagesangan yang salah satunya mengenai informasi jumlah penduduk berdasarkan data per 30 April 2009, jumlah penduduk Kelurahan Pagesangan mencapai 26.436 orang yang terdiri dari 6.139 kepala keluarga. Dari keseluruhan jumlah kepala keluarga pada Kelurahan Pagesangan tidak dapat dipungkiri adanya rumah tangga yang luput dari sasaran maupun salah sasaran penyaluran program bantuan pemerintah. Masyarakat setempat mengeluhkan permasalahan mengenai penyaluran program perlindungan sosial pemerintah yang tidak merata. Terdapat rumah tangga yang luput dari sasaran dan terjadinya kesalahan sasaran dalam penyaluran program pemerintah ini. Klasifikasi adalah salah satu task dalam Data Mining yang banyak dilakukan dan telah diimplementasikan di bidang statistik, pengenalan pola, pengambilan keputusan, machine learning, neural network dan lain-lain. Klasifikasi merupakan metode pembelajaran yang terawasi (supervised). Salah satu metode klasifikasi yang paling populer adalah K-Nearest Neighbor. Metode KNN diperkenalkan oleh Fix dan Hog. KNN mengklasifikasikan suatu objek baru berdasarkan kedekatan jarak suatu data dengan data yang lain. (Yan : 2013) Algortima KNN memiliki kelemahan. Salah satunya yaitu kelas objek baru ditentukan berdasarkan voting mayoritas kelas pada K jarak terdekat. Untuk memperbaiki kinerja dari algoritma KNN dalam melakukan klasifikasi, telah dilakukan beberapa modifikasi pada algoritma KNN. Salah satu modifikasi algoritma KNN yang telah diperkenalkan adalah algoritma Modified K-Nearest Neighbor (MKNN). Algoritma ini diperkenalkan oleh Parvin dkk yang bertujuan untuk mengatasi masalah tingkat akurasi yang rendah pada algoritma KNN dan meningkatkan performa algoritma KNN. Berdasarkan pemaparan diatas, akan dilakukan proses klasifikasi pada rumah tangga yang berada pada Lingkungan Kelurahan Pagesangan menggunakan metode Modified K-Nearest Neighbor (MKNN). Dua lingkungan di Kelurahan Pagesangan akan diambil datanya untuk
14
dijadikan dataset penelitian dan disesuaikan variabel-variabel penentu penerima KPS. 1.2 Rumusan Masalah Masalah yang ditemukan pada penelitian ini adalah sebagai berikut: 1. Bagaimana proses klasifikasi rumah tangga menggunakan metode Modified K-Nearest Neighbor (MKNN)? 2. Bagaimana performa metode Modified K-Nearest Neighbor (MKNN) dan K-Nearest Neighbor (KNN) dalam klasifikasi rumah tangga untuk menentukan penerima KPS? 1.3 Tujuan Penelitian Tujuan dari penelitian ini adalah sebagai berikut: 1. Untuk mengetahui proses klasifikasi rumah tangga menggunakan metode Modified K-Nearest Neighbor (MKNN) 2. Untuk menganalisis performa metode Modified K-Nearest Neighbor (MKNN) dan K-Nearest Neighbor (KNN) dalam klasifikasi rumah tangga untuk menentukan penerima KPS. 1.4 Batasan Masalah Batasan masalah pada penelitian ini adalah : 1. Ruang lingkup penelitian dibatasi hanya untuk dua lingkungan pada Kelurahan Pagesangan Kecamatan Mataram Kota Mataram agar ruang lingkup penelitian tidak terlalu luas. 1.5 Manfaat Penelitian Manfaat dari penelitian ini adalah: 1. Dapat membantu pemerintah khususnya pemerintah daerah dalam menentukan daftar rumah tangga sasaran (RTS) baru untuk penerima program bantuan pada lingkungan Kelurahan Pagesangan. 2. Dapat membantu masyarakat yang tergolong miskin yang luput dari daftar RTS agar dapat masuk kedalam daftar RTS.
15
1.6 Metodelogi Penelitian Pada sub bab metode penelitian akan dijelaskan mengenai proses yang dilalui untuk melakukan klasifikasi rumah tangga. Adapun sub bab metode penelitian akan menjelaskan tentang studi literatur, penentuan fitur klasifikasi, pengumpulan data, pengolahan data, metode yang digunakan, dan pengujian yang dilakukan. 1.6.1
Studi Literatur Pada tahap ini akan dilakukan penggalian teori yang relevan dan
mendalam mengenai masalah yang diteliti. Studi literatur ini meliputi pemahaman metode Modified K-Nearest Neighbor untuk diterapkan dalam proses klasifikasi data rumah tangga. Sumber literatur yang digunakan berupa buku dan jurnaljurnal ilmiah tentang permasalahan terkait untuk mendapatkan gambaran menyeluruh mengenai tahapan klasifikasi menggunakan metode Modified KNearest Neighbor 1.6.2
Penentuan Fitur Fitur yang digunakan dalam proses klasifikasi diadaptasi berdasarkan
variabel kriteria dalam menentukan kondisi rumah tangga sasaran (RTS) sebagai calon penerima KPS yang diperoleh dari Booklet Penetapan Sasaran Solusi Kepesertaan dan Pemutakhiran Data Penerima KPS. Berikut ini kelompok variabel kriteria dalam menentukan kondisi RTS yang nantinya akan digunakan sebagai fitur dalam proses klasifikasi rumah tangga. Tabel 1. 1 Kelompok Variabel Kriteria Penentu Kondisi RTS Kelompok Kriteria
Detail Kriteria Status kepala rumah tangga
Jumlah anggota rumah Karakteristik tangga Rumah Jumlah anggota rumah Tangga tangga usia produktif (bekerja) Jumlah anak bersekolah Kondisi Tingkat pendidikan kepala
Deskripsi Kepala rumah tunggal/menikah
tangga
Lebih banyak / sedikit Lebih banyak / sedikit Lebih banyak / sedikit Pendidikan dasar, menengah,
16
Sosial Ekonomi
Keadaan Rumah Tinggal
rumah tangga tinggi Tingkat pendidikan anggota Pendidikan rumah tangga tinggi Status Pekerjaan utama Berusaha kepala rumah tangga karyawan
dasar, sendiri,
menengah, buruh,
Status kepemilikan rumah
Milik sendiri / keluarga / sewa
Dinding Atap Lantai Sumber penerangan/listrik
Bahan/kondisi Bahan/Kondisi Bahan/kondisi PLN/Non PLN ; daya terpasang Listrik / gas / minyak tanah / arang Air kemasan / isi ulang / leding / sumur Beli / tidak membeli
Bahan bakar untuk memasak Sumber air minum
Cara memperoleh air minum Pemakaian fasilitas tempat Bersama / milik sendiri buang air/toilet Tangki/lubang/tanah/kolam/sung Tempat Buang Air ai/lapangan Kulkas Memiliki / tidak memiliki Tabung gas 12 kg Memiliki / tidak memiliki Kepemilikan Telepon selular Memiliki / tidak memiliki Aset Sepeda/ perahu / sepeda motor / Kendaraan perahu motor / mobil / kapal bermotor
Berdasarkan variabel kriteria penentu kondisi rumah tangga RTS diatas, dapat ditentukan fitur-fitur yang dapat digunakan dalam proses klasifikasi rumah tangga untuk penentuan penerima KPS. Berikut ialah detail dari fitur yang akan digunakan untuk proses klasifikasi: Tabel 1. 2 Fitur Klasifikasi Rumah Tangga No
Fitur
Keterangan
Fitur 1
Status kepala rumah tangga
Tunggal / Menikah
Fitur 2
Jumlah anggota rumah tangga
Numerik
17
Fitur 3
Jumlah anggota rumah tangga usia produktif
Numerik
Fitur 4
Jumlah anak bersekolah
Numerik
Fitur 5
Tingkat pendidikan kepala rumah tangga
Dasar, menengah, tinggi
Fitur 6
Rata-rata tingkat pendidikan anggota rumah tangga
Kontinue. Rata-rata pendidikan anggota rumah tangga dihitung berdasarkan pendidikan masingmasing anggota keluarga yang telah diubah ke numerik kemudian dijumlahkan dan di rata-ratakan.
Fitur 7
Status pada pekerjaan utama
Berusaha sendiri, buruh, karyawan
Fitur 8
Status kepemilikan rumah
Milik sendiri, keluarga, sewa
Fitur 9
Kondisi Dinding
Sangat kurang, kurang, sedang, baik
Fitur 10 Bahan Dinding
Bambu, tanah, batako, bata, beton
Fitur 11 Kondisi atap
Sangat kurang, kurang, sedang, baik
Fitur 12 Bahan atap
Seng, genteng, beton
Fitur 13 Kondisi lantai
Sangat kurang, kurang, sedang, baik
Fitur 14 Bahan lantai
Tanah, semen, keramik
Fitur 15 Daya listrik
0 (Sumber penerangan bukan dari PLN), 450, 900, 1300
Fitur 16 Bahan bakar untuk memasak
Arang, minyak tanah, gas, listrik
Fitur 17 Sumber air minum
Air kemasan, isi ulang, sumur
Fitur 18 Cara memperoleh air minum
Beli, tidak beli
Fitur 19
Pemakaian fasilitas buang air/toilet
Bersama, milik sendiri
Fitur 20 Tempat buang air
Sungai, WC
Fitur 21 Kepemilikan aset kulkas
Punya, tidak punya
Fitur 22 Kepemilikan aset tabung gas 12
Punya, tidak punya
18
kg Fitur 23 Kepemilikan aset telpon selular
Punya, tidak punya
Fitur 24 Kepemilikan aset kendaraan
Tidak punya, Sepeda, sepeda motor, mobil.
Setiap data testing dengan 24 atribut diatas akan diklasifikasikan menjadi 2 kelas yakni rumah tangga sasaran (RTS) penerima KPS dan non rumah tangga sasaran (Non RTS). 1.6.3
Pengumpulan Data Data yang digunakan dalam penelitian bersumber dari data rumah tangga
dua lingkungan pada Kelurahan Pagesangan, yakni
Lingkungan Pagesangan
Barat dan Lingkungan Pagesangan Bebidas. Teknik pengumpulan data yang digunakan ialah menggunakan data primer dan data sekunder. Data sekunder yang digunakan berupa daftar penerima dan non penerima KPS di kedua lingkungan, serta data kartu keluarga (KK) yang diperoleh langsung dari pihak kedua lingkungan tersebut. Data primer yang akan dikumpulkan berupa data karakteristik rumah tangga berdasarkan fitur yang diadaptasi dari variabel kriteria penentu kondisi RTS. Proses pengumpulan data rumah tangga tersebut dilakukan dengan melakukan kerjasama dengan Kepala Lingkungan Pagesangan Barat dan Pagesangan Bebidas dengan menggunakan form isian pendataan rumah tangga pada rumah tangga yang berada pada lingkungannya. Berikut ialah form isian pendataan data rumah tangga yang disebarkan untuk mendapatkan data rumah yang diperlukan pada penelitian:
19
Gambar 1. 1 From Pendataan Rumah Tangga 1.6.4
Pengolahan Data Data yang telah dikumpulkan akan diolah terlebih dahulu sebelum
digunakan untuk proses klasifikasi. Seluruh data yang diperoleh diolah sedemikan rupa kedalam bentuk file dengan format xlsx. Pengolahan data pendidikan aggota keluarga juga akan diolah untuk mendapatkan nilai rata-rata pendidikan anggota keluarga. Nilai rata-rata pendidikan anggota rumah tangga diperoleh dengan cara
20
mengubah kategori pendidikan menjadi numerik, kemudian akan dilakukan perhitungan untuk mendapatkan nilai rata-rata pendidikan anggota keluarga. Adapun perubahan kategori pendidikan ke nilai numerik yang dilakukan ialah sebagai berikut: Tidak sekolah
= 1;
Pendidikan dasar
= 2;
Menengah
= 3;
Tinggi
= 4. Sebagai contoh satu data rumah tangga memiliki 2 anggota keluarga yang
telah berstatus tamat sekolah. Satu anggota keluarga tingkat
pendidikan
terakhirnya ialah pendidikan dasar, dan pendidikan terakhir satu anggota keluarga lainnya ialah menengah. Nilai numerik untuk pendidikan dasar ialah 2 dan nilai numerik untuk kategori pendidikan menengah adalah 3, maka dari itu rata-rata pendidikan anggota keluarga tersebut ialah 2,5. 1.6.5
Metode yang Digunakan Dalam penelitian ini, metode yang digunakan dalam proses klasifikasi
rumah tangga untuk penentuan penerima Kartu Perlindungan Sosial (KPS) ialah metode Modified K-Nearest Neighbor. Metode ini merupakan pengembangan dari metode klasifikasi K-Nearest Neighbor yang diusulkan oleh Parvin dkk yang bertujuan untuk mengatasi masalah tingkat akurasi yang rendah pada algoritma KNN. Metode MKNN menambahkan proses validasi pada setiap dataset. Selanjutnya proses klasifikasi dijalankan dengan melakukan pembobotan pada dataset dengan menggunakan nilai validasi sebagai faktor perkalian. MKNN memerlukan metode perhitungan jarak untuk mengukur jarak antara dataset dan data testing atau vektor inputan baru. Dataset dan data testing yang digunakan terdiri dari atribut yang heterogen yakni atribut kategorikal dan atribut numerik, maka dari itu metode perhitungan jarak yang digunakan ialah metode Heterogenous Value Difference Metric (HVDM). Metode perhitungan
21
jarak ini diperkenalkan oleh Wilson dan Martinez pada tahun 1997 untuk menghitung jarak data dengan atribut yang heterogen. 1.6.6
Pengujian dan Evaluasi Pengujian dilakukan dengan menghitung tingkat keakuratan dari hasil
klasifikasi menggunakan metode Modified K-Nearest Neighbor. Nilai akurasi diperoleh dari perbandingan antara label kelas yang diperoleh dari hasil klasifikasi dan label kelas asli dari data testing. Selanjutnya juga akan dilakukan pengujian pengaruh parameter K terhadap nilai akurasi yang diperoleh. Selain itu juga akan dilakukan pengujian performa algoritma Modified K-Nearest Neighbor dengan membandingkan nilai akurasi yang diperoleh dengan algoritma K-Nearest Neighbor. Pengujian juga akan dilakukan untuk mendapatkan nilai
(smoothing
regulator) yang optimum dalam proses pembobotan dataset. Nilai alfa yang akan diuji bernilai 0 hingga 1. Nilai akurasi dari proses klasifikasi dengan metode MKNN dihitung dengan persamaan berikut ini: ..........................................(1.1) Berikut ini ialah tabel untuk mencatat nilai akurasi yang didapat: Tabel 1. 3 Tabel Hasil Pengujian MKNN K
KNN
Alfa 0
1 2 3 4 5 . . . 50
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1