BAB I PENDAHULUAN 1.1
Latar Belakang Analisis regresi merupakan metode analisis data yang telah diterapkan
secara luas pada berbagai bidang penelitian, sebagai contoh penelitian-penelitian dalam ilmu pengetahuan terapan seperti sosial, biologi, kesehatan, dan ekonomi. Metode analisis regresi mempelajari bagaimana menentukan bentuk sebuah model atau hubungan antara variabel-variabel dari sekumpulan data untuk menjelaskan hubungan sebab akibat atau keterkaitan antarkejadian. Dalam hal ini, analisis regresi digunakan untuk memodelkan atau mencari pola hubungan antara satu atau lebih variabel prediktor (independent variable) dengan satu atau lebih variabel respons (dependent variable). Informasi mengenai pola hubungan antar variabel dapat diketahui dengan melihat bentuk pola hubungan pada diagram pencar (scatter plot). Setelah mengetahui bentuk pola hubungan, dapat ditentukan suatu pendekatan yang sesuai untuk mengestimasi kurva regresi. Terdapat dua teknik pendekatan yang dapat digunakan dalam analisis regresi untuk mengestimasi kurva regresi yaitu pendekatan regresi parametrik dan regresi nonparametrik. Dalam model regresi parametrik terdapat asumsi yang harus terpenuhi yaitu bentuk kurva regresinya (pola hubungan antara variabel respons dan variabel prediktor) diketahui (Eubank, 1999, p. 2), misalnya diasumsikan membentuk pola linear, kuadratik, atau kubik. Selain itu sisaan harus berdistribusi normal dan variansi konstan. Dalam menerapkan regresi parametrik, 1
2
penyimpangan terhadap asumsi sering terjadi seperti sisaan tidak berdistribusi normal, hal ini tentu dapat diatasi dengan melakukan transformasi data, akan tetapi kesalahan dalam penggunaan transformasi bisa mengakibatkan model dari metode penduga menjadi lebih rumit (Sukarsa dan Srinadi, 2012). Oleh karena itu, dibutuhkan teknik-teknik statistika yang tidak terikat pada asumsi-asumsi yang ketat atau kaku dari regresi tertentu untuk menghindari penggunaan metode yang rumit. Dalam hal ini, teknik pendekatan regresi nonparametrik bisa menjadi alternatif karena penggunaannya tidak terikat pada asumsi-asumsi yang kaku seperti dalam regresi parametrik. Pendekatan nonparametrik digunakan ketika informasi mengenai bentuk kurva regresi terbatas atau tidak ada asumsi tentang bentuk kurva regresi (Eubank, 1999, p. 10). Salah satu metode estimasi regresi nonparametrik adalah spline. Spline merupakan potongan-potongan polinom yang memiliki sifat tersegmen (piecewise polynomial) yang terbentuk pada titik knot (Eubank, 1999, p.281). Titik knot merupakan titik perpaduan bersama yang menunjukkan terjadinya perubahan pola perilaku data. Titik knot dapat juga diartikan sebagai suatu titik fokus dalam fungsi spline, sehingga kurva yang dibentuk tersegmen pada titik-titik tersebut. Regresi spline adalah model regresi dengan kurva regresinya (fungsi regresinya) berupa fungsi spline. Pendekatan regresi spline ini tidak terikat akan asumsi bentuk kurva tertentu dan cenderung mencari sendiri estimasinya kemanapun pola data tersebut bergerak sehingga model yang diperoleh sesuai dengan bentuk data (Budiantara, 2011). Selain itu, metode spline ini sangat baik dalam memodelkan data yang polanya berubah-ubah pada sub
3
interval tertentu. Pendekatan spline juga mempunyai keunggulan dalam menangani pola data yang menunjukkan naik atau turun yang tajam dengan bantuan titik-titik knot, serta menghasilkan kurva yang relatif mulus (Hardle, 1990). Namun selain kelebihan yang dimiliki tersebut, regresi spline ini juga mempunyai kelemahan yaitu ketika menggunakan banyak knot dan knot yang terlalu berdekatan dalam perhitungan akan membentuk suatu matriks yang hampir singular, sehingga persamaan normal tidak dapat diselesaikan. Estimasi kurva regresi nonparametrik spline dapat dilakukan dengan mencari model spline yang optimal. Model yang optimal dapat diperoleh dengan memilih titik knot yang optimal. Titik knot dalam regresi spline sangat berperan penting. Selain itu, model spline yang optimal juga dapat diperoleh dengan cara memilih parameter penghalus . Salah satu metode yang digunakan untuk memperoleh titik knot yang optimal dan memilih parameter penghalus
adalah
metode Generalized Cross Validation (GCV) (Eubank, 1999). Namun dalam penelitian ini, penentuan model regresi terbaik pada estimator spline dilakukan dengan pemilihan titik knot yang optimal. Model regresi terbaik yang berkaitan dengan titik knot optimal diperoleh dari nilai GCV paling minimum. Pada penerapannya, regresi nonparametrik spline dapat digunakan untuk memodelkan persoalan kemiskinan. Kemiskinan adalah ketidakmampuan individu atau sekelompok individu (masyarakat) dalam memenuhi kebutuhan dasar makanan dan bukan makanan yang diukur dari sisi pengeluaran BPS (2014a). Kemiskinan merupakan salah satu indikator kesejahteraan rakyat yang menjadi isu global dan terungkap secara tegas dalam sasaran-sasaran pembangungan
4
Millennium
Indonesia
(Millenium
Development
Goals/MDGs).
Laporan
pencapaian Bappenas (2012), menyatakan bahwa masalah penurunan persentase penduduk yang hidup di bawah garis kemiskinan masih memerlukan perhatian khusus serta kerja keras untuk dapat diselesaikan. Persentase penduduk yang hidup di bawah garis kemiskinan yaitu 12,49% sedangkan target MDGs adalah 7,55%. Dalam mengukur kemiskinan, BPS (2014a) menggunakan indikator seperti persentase penduduk miskin, indeks kedalaman kemiskinan, dan indeks keparahan kemiskinan. Kemiskinan sendiri dipengaruhi oleh beberapa faktor seperti tingkat pendapatan, kesehatan, pendidikan, akses barang dan jasa, lokasi geografis dan kondisi lingkungan (Sa’diyah dan Arianti, 2012). Selain itu berdasarkan penelitian yang dilakukan oleh Yudha (2013) dan Rumahorbo (2014) ditemukan beberapa faktor yang memengaruhi tingkat kemiskinan di Indonesia, yaitu pertumbuhan ekonomi, pendapatan per kapita, inflasi, pengangguran, dan upah minimum. Dalam upaya mewujudkan kesejahteraan rakyat, faktor-faktor yang memengaruhi kemiskinan tersebut akan dianalisis sehingga bisa dikelola dengan baik. Berdasarkan uraian tersebut, peneliti tertarik untuk menganalisis indikatorindikator dari faktor pendidikan, pendapatan, dan tingkat pengangguran. Dari variabel pendidikan, pendapatan, dan tingkat pengangguran tersebut, akan dilihat hubungannya terhadap variabel indikator kemiskinan di Indonesia menggunakan regresi nonparametrik spline multivariat.
5
1.2
Rumusan Masalah Berdasarkan latar belakang di atas, maka rumusan masalah dalam
penelitian ini adalah sebagai berikut. 1. Bagaimana membentuk model dengan metode regresi nonparametrik spline multivariat untuk mengetahui hubungan antara variabel-variabel yang diduga berpengaruh terhadap indikator kemiskinan di Indonesia? 2. Bagaimana mengestimasi model regresi nonparametrik spline multivariat?
1.3
Tujuan Penelitian Berdasarakan rumusan masalah penelitian di atas, maka tujuan dari
penelitian ini adalah: 1. mendapatkan model hubungan antara variabel-variabel yang diduga berpengaruh terhadap indikator kemiskinan di Indonesia dengan menggunakan metode regresi nonparametrik spline multivariat; 2. memperoleh estimasi regresi nonparametrik spline multivariat.
1.4
Batasan Masalah Dalam penelitian ini faktor-faktor yang memengaruhi kemiskinan adalah
indikator-indikator faktor pendidikan, faktor pendapatan, dan faktor tingkat pengangguran. Kemiskinan dalam penelitian ini diukur dengan dua indikator yaitu: persentase penduduk miskin dan indeks kedalaman kemiskinan. Kedua indikator tersebut digunakan sebagai variabel respons dan akan dianalisis
6
menggunakan metode regresi nonparametrik spline multivariat. Orde yang akan digunakan yaitu orde linear, kuadratik, dan kubik serta titik knot yang digunakan dibatasi sampai 5 titik knot.
1.5
Manfaat Penelitian Manfaat yang diharapkan dari penelitian ini adalah: 1. Bagi peneliti, penelitian ini diharapkan dapat membuat peneliti lebih memahami tentang estimasi model regresi nonparametrik spline serta aplikasinya. 2. Dapat memberikan informasi mengenai faktor-faktor yang berpengaruh nyata terhadap kemiskinan di Indonesia beserta modelnya guna meningkatkan kesejahteraan rakyat.