BAB I PENDAHULUAN
1.1 Latar Belakang Kesejahteraan umum merupakan salah satu tujuan dari pembangunan nasional Negara Indonesia. Hal ini disebutkan dengan jelas pada Pembukaan Undang-Undang dasar 1945 di alinea keempat. Kesejahteraan merupakan dambaan setiap menusia dalam hidupnya. Kesejahteraan dapat dikatakan sebagai suatu kondisi ketika seluruh kebutuhan manusia terpenuhi. Terpenuhinya kebutuhan manusia dari kebutuhan yang bersifat paling dasar seperti makan, minum dan pakaian hingga kebutuhan untuk diakui dalam kehidupan masyarakat. Kesejahteraan umum di Indonesia dapat digambarkan salah satunya berdasarkan tingkat kemiskinan penduduk di Indonesia. Terdapat hubungan negatif antara kesejahteraan umum dengan tingkat kemiskinan, semakin rendah tingkat kemiskinan di Indonesia menggambarkan semakin tinggi kesejahteraan penduduk di Indonesia. Kemiskinan menjadi salah satu penyakit dalam perekonomian di hampir setiap negara, terlebih lagi di negara berkembang seperti Indonesia yang masih memiliki tingkat kemiskinan cukup tinggi dibandingkan dengan beberapa negara di sekitarnya. Permasalahan kemiskinan merupakan permasalahan yang kompleks dan bersifat multidimensional. Oleh karena itu, upaya-upaya pengentasan kemiskinan harus dilakukan secara benar, mencakup berbagai aspek kehidupan masyarakat dan dilaksanakan secara terpadu. Kemiskinan merupakan masalah kompleks yang dipengaruhi oleh berbagai faktor yang saling berkaitan. Untuk menanggulangi kemiskinan khusus nya di Indonesia, terlebih dulu ditentukan faktor-faktor yang mempengaruhinya. Masalah kemiskinan yang dihadapi di setiap negara akan selalu dibarengi dengan masalah laju pertumbuhan penduduk yang kemudian menghasilkan pengangguran, tingkat pemenuhan kesehatan masyarakat yang berimbas pada rata-rata harapan hidup suatu
negara dan pendidikan yang menjadi modal utama untuk dapat bersaing di dunia kerja dewasa ini. Karena itu dalam makalah ini, penulis akan banyak membahas ketiga masalah tersebut sebagai beberapa faktor faktor pemicu kemiskinan yang terjadi di Indonesia. Untuk mengetahui pengaruh faktor faktor tersebut dalam mempengaruhi persentase kemiskinan di Indonesia diperlukan suatu metode atau model yang baik. Terdapat beberapa metode atau model yang dapat digunakan untuk mengestimasi persentase kemiskinan berdasarkan faktor faktor yang telah ditentukan oleh peneliti. Model yang sering digunakan adalah dengan menggunakan regresi konvensional. Namun, dewasa ini sering dijumpai beberapa kendala pada data penelitian yang bila digunakan dengan menggunakan metode regresi konvensional menjadi melanggar asumsi yang telah ada sehingga berimbas pada keakuratan hasil estimasinya. Apalagi untuk data regresi semiparametrik, metode yang selama ini ada untuk menyelesaikan kasus ini adalah dengan menggunakan teknik smoothing yang cenderung memiliki banyak aturan dan perhitungan yang rumit. Dengan melihat kondisi-kondisi di atas, maka penulis akan membahas cara mengestimasi
persentase
kemiskinan
dengan
menggunakan
metode
yang
menawarkan kemudahan dan fleksibilitas yaitu dengan menggunakan metode regresi random forest yang merupakan pengembangan dari teknik bootstrap pada pohon keputusan. Dari penelitian pengaruh faktor faktor tersebut terhadap persentase kemiskinan di Indonesia, maka akan didapatkan solusi penanggulangan yang lebih efisien dan tepat.
1.2 Pembatasan Masalah Dalam penulisan ini, pembatasan masalah sangat diperlukan untuk menjamin keabsahan dalam kesimpulan yang diperoleh. Pembatasan skripsi ini difokuskan pada penyelesaian regresi semiparametrik dengan menggunakan metode yang lebih mudah dan fleksibel yaitu regresi random forest. Data yang digunakan pada penelitian ini
adalah data sekunder yang memuat empat prediktor. Data pada penelitian ini merupakan data persentase kemiskinan yang terdapat pada kabupaten kabupaten yang terdapat pada berbagai provinsi di pulau Jawa tahun 2012. Dengan variabel yang mepengaruhi persentase kemiskinan yaitu rata-rata harapan hidup, rata-rata lama sekolah, angka melek huruf dan kepadatan penduduk.
1.3 Tujuan Penelitian Adapun tujuan yang ingin dicapai dalam penelitian ini adalah : 1. Sebagai langkah untuk penyusunan dan penulisan skripsi yang merupakan salah satu syarat untuk memperoleh gelar sarjana sains di Program Studi Statistika FMIPA UGM 2. Memperluas wawasan keilmuan terutama teknik penyelesaian regresi dengan cara yang berbeda dari biasanya yaitu dengan menggunakan regresi random forest. 3. Menjelaskan algoritma pengerjaannya secara runtut dan jelas serta membandingkan berbagai nilai m yang dicobakan untuk menghasilkan nilai MSE terkecil. 4. Mengaplikasikan analisis tersebut ke dalam suatu contoh kasus, yaitu untuk menduga pola hubungan dan seberapa besar pengaruh prediktor prediktor terrsebut terhadap persentase kemiskinan di kabupaten kabupaten yang ada di provinsi pada pulau Jawa. 1.4 Manfaat Penelitian 1. Mengaplikasikan ilmu statistika dalam metode regresi yang baru, dengan menggunakan regresi random forest. 2. Menambah ilmu pengetahuan
3. Memberikan pengembangan pertimbangan untuk analisa mengetahui faktor penyebab kemiskinan sehingga dapat lebih bijak dalam menentukan solusi untuk menanggulanginya.
1.5 Tinjauan Pustaka Decision tree atau pohon keputusan merupakan suatu metode klasifikasi yang menggunakan struktur pohon, dimana setiap simpulnya merepresentasikan atribut, cabangnya merepresentasikan nilai dari atribut dan daunnya digunakan untuk merepresentasikan kelas. Decision tree adalah metode klasifikasi yang paling populer dan sering digunakan untuk data yang berjumlah besar atau data dengan variabel independen yang sangat banyak. Metode decision tree ini mengubah fakta yang sangat besar menjadi suatu pohon keputusan yang merepresentasikan aturan. Aturan yang dibangun pun dapat dengan mudah dipahami oleh pengguna. Banyak algoritma yang dapat dipakai dalam pembentukan pohon keputusan, antara lain ID3, CART dan C4.5. CART merupakan metode eksplorasi data yang didasarkan pada teknik decision tree. Pohon klasifikasi dihasilkan saat respon berupa data kategorik, sedangkan pohon regresi dihasilkan saat respon berupa data numerik. Pohon terbentuk dari proses pemilahan rekursif biner pada suatu gugus data sehingga nilai peubah respon pada setiap gugus data hasil pemilahan akan lebih homogen (Breiman et al. 1984) Metode random forest mulai diperbincangkan sejak Breiman menerbitkan metode ini pada machine learning. Dalam tulisannya ini, Breiman berupaya untuk memperbaiki proses pendugaan yang sebelumnya dilakukan oleh decision tree dan CART. Random forest adalah teknik klasifikasi yang terdiri dari kumpulan pohon klasifikasi yang ditumbuhkan * (
)
+ dimana *
+ adalah vektor
random i.i.d dan masing – masing pohon yang ada digunakan untuk menguji kelas yang paling popular dari data x yang diinputkan (Breiman, 2001). Konferensi dunia untuk pembangunan sosial mendefinisikan kemiskinan sebagai rendahnya tingkat pendapatan dan sumber daya produktif yang menjamin kehidupan berkesinambungan, kelaparan dan kekurangan gizi, rendahnya tingkat kesehatan, keterbatasan dan kurangnya akses pada pendidikan dan layanan-layanan pokok lainnya, kondisi tak wajar akibat penyakit yang terus meningkat, kehidupan bergelandang dan tempat tinggal yang tidak memadai, lingkungan yang tidak aman, serta diskriminasi dan keterasingan sosial dan dicirikan juga oleh rendahnya tingkat partisipasi dalam proses pengambilan keputusan dan dalam kehidupan sipil, sosial dan budaya. (United Nations, 2006) World Bank mendefinisikan kemiskinan itu merupakan kondisi dimana seseorang tidak dapat menikmati segala macam pilihan dan kesempatan dalam pemenuhan kebutuhan dasarnya seperti tidak dapat memenuhi kesehatan, standar hidup layak, kebebasan, harga diri dan rasa dihormati seperti orang lain.
1.6 Metode Penulisan Metode yang digunakan dalam melakukan penulisan skripsi ini adalah studi literatur. Studi literatur adalah metode pengumpulan data dengan cara mengumpulkan bahan-bahan yang diperoleh dari mempelajari buku-buku literature yang menyangut hal-hal yang akan dibahas serta membandingkan dan menerapkan pada permasalahan yang ada. Sumber literatur yang diperoleh penulis adalah sumber-sumber resmi yang didapatkan dari perpustakaan, buku teori yang berkaitan, jurnal atau review dan informasi dari situs-situs yang mendukung yang diperoleh dari internet. Dalam menyelesaikan penelitian ini, penulis menggunakan bantuan dari beberapa software, yakni R 2.11.1, SPSS 17.0 dan Microsoft Excel 2010.
1.7 Sistematika Penulisan Skripsi ini disusun dengan sistematika penulisan sebagai berikut : BAB I
PENDAHULUAN Bab ini berisikan latar belakang masalah, pembatasan masalah, tujuan penulisan, manfaat penulisan, metode penulisan dan sistematika penulisan yang memberikan arahan terhadap penulisan skripsi ini.
BAB II
DASAR TEORI Bab ini membahas teori-teori penunjang yang akan digunakan dalam pembahasan estimasi persentase kemiskinan dengan menggunakan metode regresi random forest. Teori-teori penunjang tersebut diantaranya adalah variabel random, fungsi densitas, ekspektasi dan variansi variabel random, distribusi peluang bersama, distribusi bersyarat, ekspektasi dan variansi bersyarat, analisis regresi, pertidaksamaan chebychev, konvergensi pada probabilitas, decision tree dan kemiskinan dan factor penyebabnya.
BAB III
PEMBAHASAN Bab ini membahas secara jelas dan runtut tentang bagaimana algoritma dari random forest dapat menyelesaikan kasus regresi. Dimulai pada penjelasan algoritma CART sampai pada algoritma penggabungan pada random forest. Di bab ini juga dijelaskan bagaimana keakurasian pada regresi random forest.
BAB IV
STUDI KASUS Bab ini membahas tentang deskripsi data dan juga penerapan aplikasi metode yang digunakan untuk menganalisis faktor faktor yang menyebabkan kemiskinan dan mengestimasi persentase kemiskinan.
BAB V
KESIMPULAN DAN SARAN Bab ini berisikan kesimpulan dari hasil pembahasan bab-bab sebelumnya dan juga saran atas kekurangan atau kelebihan dari hasil yang telah dilakukan untuk digunakan sebagai bahan perbaikan penelitian selanjutnya.
DAFTAR PUSTAKA LAMPIRAN