BAB II TINJAUAN PUSTAKA 2.1
Analisis Regresi Dalam ilmu statistika, metode yang dapat digunakan untuk menganalisis
pola hubungan antara satu variabel atau lebih dengan satu variabel atau lebih lainnya adalah analisis regresi. Analisis regresi merupakan sebuah alat statistika yang digunakan untuk mencari hubungan fungsional atau melihat pengaruh antara variabel prediktor
terhadap variabel respons
. Hubungan fungsional
antarvariabel tersebut dijelaskan dalam sebuah kurva yang disebut dengan kurva regresi. Analisis regresi yang digunakan untuk melihat hubungan antarvariabel, apabila dilihat berdasarkan banyaknya variabel respons dan variabel prediktor yang digunakan dapat dibagi menjadi dua bagian yaitu, analisis regresi univariat dan analisis regresi multivariat. Banyak variabel respons dan variabel prediktor dalam analisis regresi univariat masing-masing adalah satu, sedangkan dalam analisis regresi multivariat terdapat lebih dari satu variabel respons dan lebih dari satu variabel prediktor. Pemodelan menggunakan analisis regresi akan menghasilkan suatu persamaan yang disebut dengan persamaan regresi. Misal diberikan data berpasangan (
)
dan pola hubungan antara
dengan
diasumsikan mengikuti model regresi sebagai berikut (Eubank, 1999, p. 1)
7
8
( ) dengan
(2.1)
menyatakan respons ke- , ( ) adalah fungsi
diketahui pada pengamatan
, dan
yang nilainya tidak
merupakan galat
diasumsikan saling bebas dengan rataan nol dan keragaman
yang
. Fungsi
merupakan fungsi regresi atau kurva regresi. Dalam regresi parametrik, bentuk fungsi
dalam persamaan (2.1)
diasumsikan diketahui dan asumsi kenormalan distribusi galat harus terpenuhi. Model persamaan regresi parametrik linear dengan
variabel prediktor secara
umum dapat dituliskan pada persamaan berikut ∑
(2.2)
atau (2.3) dengan
menyatakan nilai dari variabel prediktor ke- untuk pengamatan ke-
dengan
,
dan
adalah parameter-
parameter regresi. Model persamaan regresi parametrik juga dapat dituliskan dalam notasi matriks berikut (2.4) dengan
9
[ ],
, [
Pada model (2.4) ,
[
], dan
]
menyatakan vektor kolom untuk variabel respons berukuran
adalah matriks konstanta berukuran
parameter berukuran (
)
, dan
(
),
adalah vektor
adalah vektor kolom berukuran
yang diasumsikan saling bebas dengan rataan nol dan keragaman 2.2
[ ].
.
Analisis Regresi Nonparametrik Dalam kasus nonparametrik pemenuhan asumsi kenormalan galat tidak
diperlukan, karena penggunaan regresi nonparametrik tidak terikat akan asumsiasumsi seperti yang mendasari statistika parametrik. Statistika nonparametrik sering disebut statistika bebas distribusi. Menurut Eubank (1999, p. 3), dalam model regresi nonparametrik bentuk kurva regresi tidak diketahui dan pada umumnya diasumsikan termuat dalam suatu ruang fungsi berdimensi takhingga, dan merupakan fungsi yang mulus (smooth). Regresi nonparametrik merupakan regresi yang memiliki fleksibilitas yang tinggi dalam menaksir kurva regresi dan sangat objektif dalam memodelkan pola data. Dalam regresi nonparametrik data dapat mencari sendiri bentuk taksirannya tanpa dipengaruhi oleh faktor subjektivitas peneliti (Budiantara, 2011). Terdapat beberapa model regresi nonparametrik yang sering digunakan antara lain: spline, MARS, kernel, wavelet, dan deret Fourier. Diberikan sekumpulan data
10
berpasangan (
)
(
) yang mengikuti model regresi nonparametrik
sebagai berikut (Eubank, 1999, p. 71). ( )
(2.5)
(
dengan
) adalah sebuah vektor galat yang saling bebas dengan
rataan nol dan keragaman
dan
menyatakan fungsi regresi yang bentuknya
tidak diketahui. 2.3
Regresi Nonparametrik Spline Salah satu metode regresi nonparametrik adalah spline. Spline merupakan
model polinom yang memiliki sifat tersegmen atau terpotong-potong yang terbentuk pada setiap titik knot dan dapat menghasilkan fungsi regresi yang sesuai dengan data (Eubank, 1999, p. 281). Metode spline sangat baik
dalam
memodelkan data yang memiliki pola berubah-ubah pada sub-interval tertentu. Secara umum fungsi spline berorde
dengan titik knot
dapat
dinyatakan dengan persamaan berikut. ( )
∑
∑
(
)
(2.6)
dengan
(
)
{
(
)
(2.7)
merupakan fungsi potongan (truncated), menyatakan intersep; pada spline berorde m;
menyatakan parameter model;
merupakan slope pada peubah truncated knot keadalah variabel prediktor;
adalah knot ke- ;
adalah
11
banyaknya knot dalam variabel respons ke- ;
adalah konstanta real dan
adalah titik knot. Model regresi spline juga dapat dituliskan dalam notasi matriks berikut ( )
(2.8)
dengan
( )
[
( ) ( )
]
( )
[
[
(
)
(
)
(
)]
( (
) )
( (
) )
(
)
(
) ]
Regresi nonparametrik spline adalah suatu pendekatan dalam analisis regresi dengan pola hubungan (fungsi regresinya) yang diasumsuikan tidak diketahui dan didekati dengan fungsi spline. Model regresi nonparametrik spline orde ke-m adalah sebagai berikut. ∑
∑
(
)
;
12
( )
(
)
(
)
(2.9) Estimasi parameter regresi nonparametrik spline dapat diperoleh dengan menggunakan metode Maximum Likelihood Estimation (MLE) berdasarkan asumsi yaitu
dan
pada persamaan (2.5) merupakan variabel acak yang saling
(
bebas, dan
). Oleh karena itu
( ) dan keragaman
berdistribusi normal dengan mean Sehingga fungsi densitas peluang
(
( )
)
(Mubarak, 2012).
menjadi ( ))
(
[
√
pada persamaan (2.5) juga
]
( )
(2.10)
Selanjutnya fungsi likelihood dapat dituliskan sebagai berikut. (
)
∏
(
) ( )) /
(
.
∏
(
( )
√
)
.
∑
( )) /.
(
Selanjutnya dengan memaksimumkan fungsi likelihood
(2.11) (
) akan diperoleh
estimasi titik untuk fungsi , yaitu sebagai berikut.
* (
)+
{(
)
.
∑
(
∑
∑
( (2.12)
) )/ }
13
Kemudian dilakukan tansformasi logaritma sehingga menghasilkan persamaan sebagai berikut. (
)
(
)
∑
∑
(
∑
(
(
) -
) ) . Misalkan ( )
,
(
)
(
)
dan
[
]
maka: (
)
(
dengan
(
)
∑
(
)
(
(
( ) )
( ) ) (
( ) )
(2.13)
)
Selanjutnya persamaan (2.13) diturunkan secara parsial terhadap
dan
disamakan dengan nol di sisi kanannya, sehingga diperoleh hasil sebagai berikut. (
(
)
(
( ) ) (
( ) ))
14
(
(
))
(
(
(
(
( ) ) (
( ) ) (
( ) ))
( ) ))
(2.14)
Hasil estimasi parameter ̂ ( ) adalah sebagai berikut. ̂( )
( ( )
( ))
( )
(2.15)
dengan ( 2.4
) .
Regresi Nonparametrik Spline Multivariat Model regresi nonparametrik spline multivariat merupakan model regresi
yang memiliki lebih dari satu variabel respons yang saling berkorelasi dan lebih dari satu variabel prediktor dengan fungsi regresinya diasumsuikan tidak diketahui dan didekati dengan fungsi spline. Model regresi nonparametrik spline multivariat dapat ditulis sebagai berikut. ∑
( )
∑
( )
∑
( )
(2.16)
Menurut Wang (1998) dalam Wulandari (2014), bentuk kurva regresi ( )
( )
fungsi spline berikut.
( ) diasumsikan tidak diketahui dan dihampiri dengan
15
( )
∑
∑
(
)
( )
∑
∑
(
)
( )
∑
∑
(
)
(2.17)
Dalam regresi nonparametrik spline multivariat, estimasi parameter dapat dilakukan dengan pengoptimalan Weighted Least Square (WLS). Penentuan matriks pembobot W dilakukan dengan menghitung nilai varians kovarians dari variabel respons. Berikut tahapan dalam menyusun matriks W. 1. Menentukan variabel respons 2. Menghitung nilai varians variabel respons 3. Menghitung nilai kovarians antara variabel respons 4. Membentuk matriks varians kovarians dari data 5. Mendefinisikan matriks varians kovarians sebagai pembobot (W). Matriks
(varians kovarians
[
) adalah sebagai berikut.
]
Estimasi parameter dengan pengoptimalan Weighted Least Square (WLS) adalah sebagai berikut.
16
*
+
*(
)
(
)+ .
(2.18)
Selanjutnya dilakukan penurunan secara parsial untuk persamaan (2.18) dengan memisalkan fungsi ( ) ( )
(
)
(
(
)
(
)
(
)(
), maka
)
.
(2.19)
Selanjutnya persamaan (2.19) diturunkan terhadapat
dan disamakan dengan nol,
sehingga diperoleh hasil sebagai berikut. ( )
(
)
̂ ̂
(
)
(2.20)
Sehingga bentuk estimasi model spline dalam regresi nonparametrik multivariat menjadi sebagai berikut. ̂ dengan
̂ ( )
( (
) )
( )
(2.21)
adalah matriks yang digunakan untuk
perhitungan pada rumus GCV dalam pemilihan titik knot optimal.
17
2.5
Pemilihan Model Regresi Terbaik Model regresi spline terbaik diperoleh dengan pemilihan titik knot yang optimal. Pemilihan titik knot yang optimal ini sangat penting
untuk memperoleh estimator spline terbaik yang paling sesuai dengan data. Titik knot adalah titik perpaduan bersama yang menunjukan terjadinya perubahan pola perilaku data (Wulandari, 2014). Titik knot merupakan suatu titik fokus dalam fungsi spline, sehingga kurva yang dibentuk tersegmen pada titik-titik tersebut. Salah satu metode yang digunakan untuk memperoleh titik knot yang optimal adalah metode Generalized Cross Validation (GCV). Kelebihan dari GCV adalah sifatnya yang optimal asimtotik atau dengan sampel yang besar sifatnya tetap optimal. Model regresi terbaik yang berkaitan dengan titik knot optimal diperoleh dari nilai GCV paling minimum. Fungsi GCV didefinisikan sebagai berikut. ( )
dengan ( 2.6
( ) [
(
menyatakan jumlah data, ̂) (
(2.22)
( ))]
̂ ), dan ( )
merupakan matriks identitas, ( )(
( )
( ))
( )
( ) .
Korelasi antara Variabel-variabel Respons Korelasi menunjukan suatu hubungan timbal balik antara dua buah
kejadian. Berdasarkan pengertian regresi multivariat yaitu regresi dengan lebih dari satu variabel respons di mana variabel-variabel respons tersebut harus saling
18
berhubungan atau berkorelasi, maka korelasi antara variabel respons tersebut terlebih dahulu harus diketahui. Dua variabel dikatakan berhubungan jika terjadi perubahan pada salah satu variabel dan perubahan tersebut juga akan disertai oleh variabel lainnya, baik dalam arah yang sama ataupun arah yang sebaliknya. Nilai korelasi dapat dicari menggunakan koefisien korelasi Pearson yang secara umum untuk peubah respons
(
dan
dinyatakan dalam persamaan berikut.
(
) {
)
( )
(
(2.23) )}
atau dapat dituliskan dengan rumus sebagai berikut. (
(
∑
) √∑
̅ )(
̅ )
̅ ) √∑
(
(
∑
∑ √∑
.∑
/
∑ √ ∑
̅ )
∑
∑ (∑
.∑
√∑
) √ ∑
/
∑
(2.24) (∑
)
Koefisien korelasi menginformasikan seberapa besar atau kuat hubungan antara variabel yang digunakan. Berdasarkan perhitungan dengan menggunakan korelasi Pearson akan diperoleh nilai koefisien korelasi yaitu
.
19
2.7 Kemiskinan Kemiskinan menurut BPS (2014a) didefinisikan sebagai ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar seperti pangan, sandang, pendidikan, kesehatan, dan perumahan. Pada umumnya definisi kemiskinan dapat dilihat dari dua sisi, yaitu: a) Kemiskinan absolut Kemiskinan yang dikaitkan dengan tingkat pendapatan dan kebutuhan, kebutuhan tersebut hanya terbatas pada kebutuhan pokok atau kebutuhan dasar minimum seseorang. b) Kemiskinan relatif Kemiskinan yang tidak memiliki batas kemiskinan yang jelas. Kemiskinan relatif bisa dilihat dari aspek ketimpangan sosial, karena ada orang yang sebenarnya memiliki pendapatan yang sudah cukup untuk memenuhi kebutuhan minimumnya tetapi pendapatannya masih jauh lebih rendah dibanding masyarakat sekitarnya. Sehingga, apabila semakin besar ketimpangan antara tingkat penghidupan golongan atas dan golongan bawah maka jumlah penduduk yang dapat dikategorikan miskin juga akan semakin besar. 2.7.1
Indikator Kemiskinan Kemiskinan oleh BPS (2014a) diukur melalui indikator seperti:
1. Persentase Penduduk Miskin Yaitu persentase penduduk yang berada di bawah garis kemiskinan (P0). 2. Indeks Kedalaman Kemiskinan
20
Yaitu ukuran rata-rata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1). Garis kemiskinan sendiri merupakan nilai atau jumlah rupiah minimum yang dibutuhkan seseorang untuk memenuhi kebutuhan dasar minimum makanan yang setara dengan 2100 kilokalori per kapita per hari (paket komoditas kebutuhan dasar makanan diwakili oleh 52 jenis komoditas) ditambah dengan jumlah rupiah kebutuhan dasar minimum bukan makanan (paket komoditas kebutuhan dasar nonmakanan diwakili oleh 51 jenis komoditas di perkotaan dan 47 komoditas di pedesaan). 2.7.2
Faktor-faktor yang Memengaruhi Kemiskinan Mengacu pada strategi nasional penanggulangan kemiskinan, kemiskinan
dipengaruhi oleh beberapa faktor yaitu: tingkat pendapatan, kesehatan, pendidikan, akses barang dan jasa, lokasi geografis dan kondisi lingkungan (Sa’yidah dan Arianti, 2012). Selain itu berdasarkan penelitian terdahulu (Yudha, 2013; Rumahorbo, 2014), dalam penelitian ini kemiskinan dipengaruhi oleh beberapa faktor seperti: pertumbuhan ekonomi, upah minimum, pendapatan berupa pendapatan per kapita atau PDRB per kapita, tingkat pengangguran berupa tingkat pengangguran terbuka, dan inflasi.
1.
Pendidikan Pendidikan merupakan determinan penting dalam pembangunan modal
manusia untuk menurunkan jumlah penduduk miskin (Sa’yidah dan Arianti,
21
2012). Pendidikan yang dimiliki masyarakat akan memberikan kemampuan untuk berkembang lewat keterampilan dalam memperoleh penghasilan dan pekerjaan yang baik. Pendidikan dapat dilihat dengan indikator-indikator sebagai berikut (BPS, 2014b): a. Angka Melek Huruf b. Rata-rata Lama Sekolah c. Angka Partisipasi Sekolah 2.
Pendapatan Pendapatan nasional merupakan salah satu tolak ukur yang digunakan
untuk mengukur keberhasilan sebuah perekonomian, di mana semakin besar angka output pendapatan maka tingkat kemakmuran dianggap semakin tinggi pula (Rumahorbo, 2014). Pendapatan dalam penelitian ini dilihat berdasarkan Pendapatan Per Kapita atau PDRB per Kapita. PDRB menurut BPS (2015a) adalah jumlah balas jasa atau upah yang diterima oleh faktor-faktor produksi yang ikut serta dalam proses produksi di suatu negara dalam jangka waktu tertentu. Sementara PDRB Per Kapita adalah besarnya pendapatan rata-rata penduduk di suatu negara. Semakin tinggi PDRB per kapita semakin sejahtera penduduk di negara tersebut dan jumlah penduduk miskin juga semakin berkurang (Thamrin dalam Rumahorbo, 2014)
22
3.
Tingkat Pengangguran Pengangguran
Pengangguran
dapat
Terbuka.
diukur
dengan
Pengangguran
indikator
terbuka
menurut
seperti (BPS,
Tingkat 2014b)
didefinisikan sebagai seseorang yang tergolong dalam angkatan kerja yang sedang mencari pekerjaan, mempersiapkan usaha, ataupun yang tidak mencari pekerjaan karena merasa tidak mungkin mendapatkan pekerjaan, termasuk juga yang sudah memperoleh pekerjaan namun belum memulai bekerja. 2.8
Penelitian Sebelumnya Penelitian menggunakan metode regresi spline telah banyak dilakukan.
Salah satunya penelitian yang dilakukan oleh Oktaviana (2012) dalam memodelkan kadar gula darah penderita diabetes mellitus. Pada penelitian tersebut, diperoleh nilai GCV yang paling minimum adalah sebesar 0,000000002 dan model spline birespon terbaik yang menjelaskan kadar gula darah penderita DM tipe 2 adalah model spline linear dengan satu titik knot. Selain
itu,
Wulandari
(2014)
menganalisis
faktor-faktor
yang
memengaruhi persentase penduduk miskin dan pengeluaran per kapita makanan di Jawa Timur menggunakan regresi nonparametrik birespon spline. Variabel prediktor yang digunakan ada empat variabel dari segi ketenagakerjaan dan ekonomi. Pada penelitian tersebut, diperoleh model regresi nonparametrik birespon spline terbaik adalah model spline linear dengan satu titik knot. Nilai GCV dan MSE yang dihasilkan adalah sebesar 0,048652 dan 0,040296. Penelitian-penelitian tersebut menjadi acuan dalam penelitian ini. Pemodelan dua
23
indikator kemiskinan di Indonesia yaitu persentase penduduk miskin dan indeks kedalam kemiskinan menggunakan metode regresi nonparametrik spline multivariat ini dilakukan karena kedua variabel memiliki keterkaitan yang erat, di mana kedua indikator ini digunakan untuk mengukur kemiskinan di suatu daerah. Berdasarkan penelitian sebelumnya penulis tertarik untuk melakukan penelitian lebih lanjut dengan objek penelitian yang lebih luas yaitu mencangkup 33 Provinsi di Indonesia.