BAB 1 PENDAHULUAN
1.1 Latar belakang Metode klasifikasi merupakan salah satu metode statistika untuk mengelompok atau mengklasifikasi suatu data yang disusun secara sistematis ke dalam suatu kelompok sehingga dapat diketahui suatu individu berada pada kelompok tertentu. Masalah klasifikasi ini muncul ketika terdapat sejumlah ukuran yang terdiri dari satu atau beberapa kategori yang tidak dapat didefinisikan secara langsung tetapi harus menggunakan suatu ukuran (Johnson dan Dean, 2007).
Metode statistik yang sering digunakan untuk menyelesaikan masalah pengklasifikasian adalah analisis diskriminan dan regresi logistik. Kedua metode tersebut bersifat parametrik karena membutuhkan beberapa asumsi, seperti harus mengikuti suatu distribusi tertentu baik untuk variabel respon maupun variabel prediktor, kenormalan data dan matrik kovarian yang homogen. Kedua metode ini seringkali disebut sebagai metode tradisional. Sayangnya metode tersebut tidak praktis digunakan dan penggunaannya terbatas pada penyelesaian masalah pengklasifikasian. Menurut Lewis (2000) kesulitan penggunaan metode statistik tradisional tersebut adalah : (1) umumnya ada banyak variabel prediktor sehingga sulit menentukan variabel yang paling berpengaruh, sehingga metode ini kurang sesuai untuk perbandingan ganda (multiple comparison), (2) variabel prediktor jarang sekali yang berdistribusi normal dan kelompok yang berbeda mungkin mempunyai nilai varians yang berbeda pula, (3) interaksi dan pola yang kompleks mungkin muncul dalam data, (4) hasil metode statistik tradisional ini sulit digunakan.
Multivariate Adaptive Regression Splines (MARS) adalah pendekatan untuk regresi multivariat nonparametrik yang diperkenalkan oleh Friedman
Universitas Sumatera Utara
(1991). MARS merupakan metode yang tidak tergantung pada asumsi bentuk kurva tertentu, sehingga memberikan fleksibilitas yang lebih besar dalam penggunaannya. Kelebihan lain dari metode MARS adalah tidak dipengaruhi oleh volume data yang hilang. Hal ini dikarenakan MARS secara otomatis menciptakan suatu indikator nilai yang hilang untuk setiap variabel dengan nilai yang hilang. MARS juga dirancang untuk dapat menangkap order interaksi yang lebih tinggi atau untuk pemodelan data berdimensi tinggi (Friedman, 1991). Hidayat (2006) dalam penelitiannya menyimpulkan bahwa pengelompokkan dengan menggunakan metode MARS memiliki kesalahan pengelompokkan yang kecil, yaitu sebesar 5,1%.
Klasifikasi pada model MARS didasarkan pada pendekatan analisis regresi. Jika variable respon terdiri dari dua nilai, maka dikatakan sebagai regresi dengan binary response (Cox, dan Snell, 1989). Untuk menghitung ketepatan klasifikasi digunakan alat ukur apparent error rate (APER). Nilai APER menyatakan representasi proporsi sampel yang salah diklasifikasikan oleh fungsi klasifikasi (Johnson dan Wichern, 1992). Namun, nilai ketepatan klasifikasi tersebut dapat ditingkatkan dengan pendekatan bootstrap resampling (bagging). Metode bagging pertama kali digunakan oleh Breiman (1994) sebagai alat untuk membentuk klasifikasi yang lebih stabil.
Bagging predictor adalah metode untuk membangkitkan multiple version dari prediktor dan menggunakannya untuk aggregate predictor. Multiple version dibentuk dengan replikasi bootstrap dari sebuah data set. Data set real pada beberapa kasus bagging dapat meningkatkan akurasi. Ide dasar dari bagging adalah menggunakan bootstrap resampling untuk membangkitkan prediktor dengan banyak versi, dimana ketika dikombinasikan seharusnya hasilnya lebih baik dibandingkan dengan prediktor tunggal yang dibangun untuk menyelesaikan masalah yang sama.oleh karena itu, untuk memperoleh ketepatan klasifikasi yang lebih tinggi digunakan bagging MARS.
Universitas Sumatera Utara
Kesejahteraan masyarakat merupakan salah satu tanggung jawab pemerintah negara. Salah satu permasalahan kesejahteraan adalah kemiskinan. Banyak program dan strategi yang dilakukan pemerintah untuk mengentaskan masyarakat dari kemiskinan. Agar program-program tersebut tepat sasaran, harus ada suatu cara untuk mengidentifikasi apakah suatu rumah tangga tersebut miskin atau tidak miskin. Selama ini rumah tangga miskin dikelompokkan berdasarkan pendapatan atau pengeluaran. Namun pendapatan atau pengeluaran tersebut kadang belum menggambarkan kondisi sesungguhnya dari suatu rumah tangga. Untuk itu, perlu digunakan cara lain untuk mengidentifikasi tingkat kesejahteraan. Salah satunya dengan melihat faktor-faktor yang dapat menjadi penciri tingkat kesejahteraan suatu rumah tangga. Pada penelitian ini akan diidentifikasi faktorfaktor tersebut. Hasilnya dapat digunakan untuk perencanaan pembangunan, sehingga pembangunan lebih terarah pada peningkatan kesejahteraan rumah tangga. Untuk mendeskripsikan karakteristik kesejahteraan rumah tangga dan melihat faktor yang paling berpengaruh pada suatu kelompok maka perlu dibuat suatu klasifikasi berdasarkan faktor-faktor yang mempengaruhinya. Metode klasifikasi tersebut adalah bagging MARS.
Dari latar belakang tersebut peneliti mengangkat sebuah judul yaitu, “Pemodelan Klasifikasi Kesejahteraan Rumah Tangga dengan MARS, Suatu Studi Kasus di Kota Medan “.
1.2 Perumusan Masalah Dalam membuat perencanaan terhadap penuntasan kemiskinan di kota Medan, diperlukan suatu model untuk melihat faktor-faktor yang mempengaruhi tingkat kesejahateraan rumah tangga dan bagaimana model ini dibangun agar ketepatan klasifikasi rumah tangga miskin dan tidak miskin berdasarkan faktor-faktor yang mempengaruhinya cukup tinggi, merupakan permasalahan yang akan dibahas dalam penelitian ini.
1.3 Pembatasan Masalah
Universitas Sumatera Utara
Kesejahteraan meliputi banyak aspek kehidupan. Untuk membatasi ruang lingkup penelitian dan menyederhanakan permasalahan maka kesejahteraan dalam penelitian
ini
difokuskan
pada
bidang
kemiskinan
dengan
jumlah
konsumsi/pengeluaran rumah tangga per bulan sebagai indikatornya.
1.4 Tinjauan Pustaka Herlina Jusuf dalam tulisannya berjudul “pemodelan hibrid multivariate adaptive regression splines (MARS) arima untuk prediksi data series “ bahwa pada pemodelan MARS, pemilihan model digunakan metode stepwise.
Forward
stepwise dilakukan untuk mendapatkan fungsi dengan jumlah basis fungsi maksimum. Kriteria pemilihan basis fungsi pada forward adalah dengan meminimumkan Average Square Residual (ASR). Untuk memenuhi konsep parsemoni (model sederhana) dilakukan backward stepwise yaitu memilih basis fungsi yang dihasilkan dari forward stepwise dengan meminimumkan nilai Generalized Cross-Validation (GCV). Sumarno dalam tulisannya yang berjudul “model klasifikasi menggunakan metode regresi logistik dan multivariate adaptive regression splines (MARS) pada kasus data survey biaya hidup kota Kediri bahwa dalam ketepatan klasifikasi, metode MARS memiliki ketepatan yang lebih baik jika dibandingkan dengan analisis regresi logistik sehingga untuk kasus mengklasifikasikan tempat berbelanja barang kebutuhan sandang rumah tangga di kota Kediri lebih tepat menggunakan metode MARS. Een (2009) dalam tulisannya yang berjudul “klasifikasi kesejahteraan rumah tangga di Propinsi Jawa Tengah dengan pendekatan CART Arcing”, hasilnya merupakan gambaran karakteristik rumah tangga miskin di Jawa Tengah sebagai masukan perancanaan pembangunan daerah Jawa Tengah. Kajian mengenai kesejahteraan telah banyak dilakukan antara lain pada tahun 1995 oleh Faturokhman dan Molo yang meneliti karakteristik rumah tangga miskin di Yogyakarta, Cahyat dkk (2007) mengkaji kemiskinan dan kesejahteraan rumah tangga dengan contoh dari Kutai Barat yang hasilnya merupakan sebuah
Universitas Sumatera Utara
panduan pemantauan kemiskinan bagi pemerintah daerah, dan Suryadarma dkk (2005) mengkaji suatu obyektif kesejahteraan keluarga untuk penargetan kemiskinan dengan metode PCA (Principal Component Analysis)
1.5 Tujuan Penelitian Untuk membangun sebuah model guna melihat klasifikasi kesejahteraan rumah tangga di Medan berdasarkan faktor-faktor yang mempengaruhimya dengan menggunakan metode MARS dan menghitung ketepatan klasifikasi metode MARS dengan menggunakan bagging MARS.
1.6
Kontribusi Penelitian
Untuk memberikan kesejahteraan
rumah
informasi kepada pemerintah daerah Medan tangga
di
Medan
bedasarkan
terkait
faktor-faktor
yang
mempengaruhinya, sehingga dapat dijadikan bahan pertimbangan pemerintah daerah setempat dalam mengambil kebijakan untuk menyusun perencanaan pembangunan yang lebih terarah pada peningkatan kesejahteraan masyarakat.
Universitas Sumatera Utara