THESIS
PENGUJIAN HIPOTESIS PARAMETER KOMPONEN SPLINE DALAM MODEL REGRESI NONPARAMETRIK CAMPURAN SPLINE DAN KERNEL
FAULINA KHUSNIAWATI NRP. 1315201011
DOSEN PEMBIMBING Prof. Dr. I Nyoman Budiantara, MS Dr. Muhammad Mashuri, MT. rof. D rD Budiantara, PROGRAM MAGISTER JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2017
THESIS
SIMULTANEOUS HYPOTHESIS TESTING OF SPLINE TRUNCATED MODEL IN NONPARAMETRIC SPLINE AND KERNEL REGRESSION
FAULINA KHUSNIAWATI NRP. 1315201011
SUPERVISOR Prof. Dr. I NyomanBudiantara, MS Dr. Muhammad Mashuri, MT. rof. D rD Budiantara, MAGISTER PROGRAM STATISTICS DEPARTMENT FACULTY OF MATHEMATICS AND NATURAL SCIENCE SEPULUH NOPEMBER INSTITUTE OF TECHNOLOGY SURABAYA 2017
PENGUJIAN HIPOTESIS PARAMETER KOMPONEN SPLINE DALAM MODEL REGRESI NONPARAMETRIK CAMPURAN SPLINE DAN KERNEL (Studi Kasus: Angka Fertilitas Total) Tesis disusun untuk memenuhi salah satu syarat memperoleh gelar Magister Sains (M.Si)
di Institut Teknologi Sepuluh Nopember Oleh: FAULINA KHUSNIAWATI NRP. 1315201011
Tanggal Ujian : 17 Januari 2017 Periode Wisuda : Maret 20 17 DisetujtilOf'eh:
. / /ClrV 1. Prof Dr. I Nyoman Budiantara, MSi NIP. 19650603 198903 1 003
(Pembimbing I)
2. Dr. Muhammad Mashuri, MT
(Pembimbing II)
:IP 1~7~;:11001~
L
3. Dr. Zain.' M.Si NIP. 19600525 198803 2 001
~
4. Dr. Dra. Kruitika Fithriasari,M.Si NIP. 19691212 199303 2 002
(Penguji)
(Penguji)
I
Direktur Program Pasca Sarjana,
Prof Ir. Djauhar Manfaat M.Sc., Ph.D. NIP.19601202 1987011 001
PENGUJIAN HIPOTESIS PARAMETER KOMPONEN SPLINE DALAM MODEL REGRESI NONPARAMETRIK CAMPURAN SPLINE DAN KERNEL Nama Mahasiswa NRP Pembimbing 1 Pembimbing 2
: Faulina Khusniawati :1315201011 : Prof. Dr. I Nyoman Budiantara, MS : Dr. Muhammad Mashuri, MT.
ABSTRAK Analisis Regresi adalah sebuah teknik statistik untuk menyelidiki hubungan antara dua variabel atau lebih. Dalam model regresi memungkinkan variabel respon mengikuti kurva regresi nonparametrik karena fungsi regresi tidak diketahui bentuknya. Hubungan variabel respon dengan beberapa variabel prediktor pada regresi nonparametrik tidak selalu menggunakan satu jenis pendekatan seperti spline, kernel, atau deret fourier. Hal ini banyak ditemukan pada regresi nonparametrik antara satu variabel prediktor dengan variabel prediktor lainnya mempunyai pola yang berbeda dengan respon.Pada penelitian ini hubungan antar variabel prediktor dan variabel respon mengikuti model regresi nonparametrik aditif, di mana variabel prediktor didekati dengan fungsi spline truncated dan fungsi kernel. Estimasikurva regresi nonparametrikdiperoleh dariOrdinal Least Square (OLS) dan pemilihan titik knot menggunakan metode Generalized Cross Validation (GCV). Inferensi statistik khususnya pengujian hipotesis untuk kurva regresi dengan pendekatan spline dan kernel dapat dilakukan dengan metode Likelihood RatioTest (LRT). Estimator diperoleh dari membandingkan fungsi likelihood dibawah populasi dan fungsi likelihood di bawah 𝐻0 . Selanjutnya pengujian hipotesis yang diperoleh dengan campuran spline dan kernel diaplikasikan pada data Angka Fertilitas Total di Jawa Timur. Kata kunci : Regresi Nonparametrik, Spline, Kernel, Angka Fertilitas Total
iii
HYPOTHESIS TEST OF SPLINE COMPONENT PARAMETERS IN MIXED NONPARAMETRIC REGRESSION MODEL OF SPLINE AND KERNEL
Name NRP Supervisor 1 Supervisor 2
: Faulina Khusniawati : 1315201011 : Prof. Dr. I Nyoman Budiantara, MS : Dr. Muhammad Mashuri, MT.
ABSTRACT Regression analysis is a statistical technique to model and investigate the relationship between two or more variables. In the regression model allows a response variable follows the curve of the nonparametric regression curves as a function of unknown shape. The correlation of response variables with multiple predictor variables on nonparametric regression does not always use one type approaches such as spline, kernel, or fourier series. It is mostly found in the predictor variables that follow nonparametric regression curves is different between the predictor variable with other predictor variable. Given data pairs in which the correlation between the predictor variables and the response variable follows the additive nonparametric regression model with the predictor variable component approximated by spline function and the truncated kernel function. Estimated nonparametric regression curve was obtained from the Ordinal Least Square (OLS) and point selection knots using Generalized Cross Validation (GCV). Statistical inference particular hypothesis testing for regression curve with spline and kernel approach can be done using Likelihood Ratio Test (LRT). The estimator obtained from comparing the likelihood function under the population and the likelihood function under H0. Further, testing hypothesis obtained with a mixture of spline and kernel applied to the case of fertility in East Java. Keywords: Nonparametric Regression, Spline, Kernel, Total Fertility Rate
iv
KATA PENGANTAR
Dengan menyebut asma Allah Subhanahuwata’ala yang Maha Pengasih dan Maha
Penyayang.
Segala
puji
syukur
tercurahkan
kepada
Allah
Subhanahuwata’ala sumber inspirasi kehidupan yang telah melimpahkan rahmat dan karunia-Nya dalam penyelesaian tesis ini. Shalawat serta salam semoga senantiasa tercurahkan kepada junjungan kita, Nabi Besar Muhammad Sholallahualaihiwassalam, pemimpin sekaligus sebaik-baik suri tauladan bagi kehidupan umat manusia, sehingga peneliti dapat menyelesaikan skripsi dengan judul “Pengujian Hipotesis Parameter Komponen Spline dalam Model Regresi Nonparametrik Campuran Spline dan Kernel”. Dalam penyusunan skripsi ini, peneliti memperoleh banyak inspirasi serta bantuan dari berbagai pihak, karena itu peneliti mengucapkan terima kasih yang sebesar-besarnya kepada: 1. Prof. Dr. I Nyoman Budiantara, MS selaku pembimbing I dan Dr. Muhammad Mashuri, M.T. selaku pembimbing II yang dengan penuh kesabaran dan keikhlasan dalam membimbing penulis sehingga tesis ini dapat terselesaikan dengan tepat waktu. 2. Dr. Kartika Fithriasari dan Dr. Ismaini Zain selaku Dosen penguji yang telah memberikan nasihat, saran, arahan demi kebaikan penulis.
v
vi
3. Dr. Setiawan selaku dosen wali penulis yang telah membantu penulis selama menjadi mahasiswa di Institut Teknologi Sepuluh Nopember serta segenap dosen-dosen statistika yang telah memberikan ilmu pengetahuan selama perkuliahan. 4. Kedua orang tua dan mertua yang luar biasa, suamiku yang telah mendampingi selalu hari demi hari dan memberikan semangat dalam menyelesaikan tesis ini, sserta adikku dan adik iparku beserta seluruh keluarga besar peneliti yang menjadi motivasi dalam penelitian ini. 5. Teman-teman jurusan magister Statistika 2015 yang selalu memberi motivasi, inspirasi, dan semangat. Semoga tesis ini dapat bermanfaat bagi pemerintah maupun masyarakat. Saran dan kritik sangat penulis harapkan, agar dapat terpenuhinya kemanfaatan baik bagi penulis pribadi serta khalayak civitas akademika.
Surabaya, Januari 2017 Penyusun
Faulina Khusniawati
vi
DAFTAR ISI Halaman HALAMAN JUDUL
i
LEMBAR PENGESAHAN
ii
ABSTRAK
iii
ABSTRACT
iv
KATA PENGANTAR
v
DAFTAR ISI
vii
DAFTAR TABEL
Ix
DAFTAR GAMBAR
x
BAB 1. PENDAHULUAN
1
1.1 Latar Belakang
1
1.2 Perumusan Masalah
7
1.3 Tujuan Penelitian
7
1.4 Manfaat Penelitian
7
1.5 Batasan Penelitian
8
BAB 2. TINJAUAN PUSTAKA
9
2.1 Analisis Regresi Parametrik
9
2.2 Regresi Nonparametrik Spline Truncated
10
2.3.Regresi Nonparametrik Kernel
12
2.4 Estimator campuran Spline dan Kernel
13
2.5 Uji Hipotesis
16
2.6 Teorema Dasar Terkait Aljabar
17
2.7 Koefisien Determinasi
18
2.8 Angka Fertilitas Total
18
2.9 Faktor-faktor yang MempengaruhiAngkaFertilitas Total
19
BAB 3. METODE PENELITIAN
29
3.1 3.1 Sumber Data
29
3.2 3.2 Variabel Penelitian
29
3.3 3.3 Tahapan Penelitian
30
vii
BAB 4. HASIL DAN PEMBAHASAN
35
3.4 4.1 Bentuk Model regresi Campuran Kernel dan Spline
35
3.5 4.2 Estimasi Kurva Regresi Campuran Kernel dan Spline
36
3.6 4.3 Pengujian Hipotesis
42
3.7 4.4 Aplikasi Model Campuran Spline dan Kernel pada 3.8
Angka Fertilitas Total di Jawa Timur
3.9 4.5 Uji Asumsi Residual
55 80
BAB 5. KESIMPULAN DAN SARAN
85
5.1 Kesimpulan
85
5.2 Saran
95
DAFTAR PUSTAKA
97
LAMPIRAN
101
BIOGRAFI PENULIS
119
viii
DAFTAR TABEL Halaman Tabel 3.1.
Variabel Penelitian
29
Tabel 4.1
Statistik Deskriptif Variabel Respon dan Variabel Prediktor 55
Tabel 4.2
Nilai GCV dengan Satu Titik Knot
60
Tabel 4.3
Nilai GCV dengan DuaTitik Knot
61
Tabel 4.4
Nilai GCV dengan TigaTitik Knot
63
Tabel 4.5
Perbandingan Nilai GCV Minimum
65
Tabel 4.6
Estimasi Parameter
66
Tabel 4.7
Tabel Perbandingan nilai R-square dan MSE
79
Tabel 4.8
Analisis Varians model Spline Tiga Knot
80
Tabel 4.9
Uji Identik pada Residual
80
Tabel 4.10
Uji Statistik Durbin Watson
81
ix
DAFTAR GAMBAR Halaman Gambar 2.1
Spline truncated dengan tigatitik knot (Budiantara, 2011)
12
Gambar 4.1
Scatter Plot antara Angka Fertilitas Total (Y) dengan Persentase jumlah status kawin (X1)
56
Gambar 4.2
Scatter Plot antara Angka Fertilitas Total (Y) dengan Rata-rata usia kawin pertama (X2)
56
Gambar 4.3
Scatter Plot antaraAngka Fertilitas Total (Y) dengan Persentase CPR (X3)
57
Gambar 4.4
Scatter Plot antaraAngka Fertilitas Total (Y) dengan Persentase unmet need (X4).
57
Gambar 4.5
Scatter Plot antara Angka Fertilitas Total (Y) dengan Persentase penduduk berpendidikan tinggi (X5).
58
Gambar 4.6
Scatter Plot antara Angka Fertilitas Total (Y) dengan PDRB perkapita (X6).
58
Gambar 4.7
Perbandingan hasil estimasi antara Regresi Campuran Spline dan Kernel, Regresi Spline, Regresi Kernel dan Regresi Linier Berganda
77
Gambar 4.8
Perbandingan grafik scatter plot antara data variabel respon (y) dengan data hasil estimasi (y_hat) pada Regresi Campuran Spline dan Kernel
77
Gambar 4.9
Perbandingan grafik scatter plot antara data variabel respon (y) dengan data hasil estimasi (y_hat) pada regresi Linier Berganda
78
Gambar 4.10
Perbandingan grafik scatter plot antara data variabel respon (y) dengan data hasil estimasi (y_hat) pada Regresi Spline
78
Gambar 4.11
Perbandingan grafik scatter plot antara data variabel respon (y) dengan data hasil estimasi (y_hat) pada Regresi Kernel
79
x
Gambar 4.12
Probability Plot of Residual
xi
83
BAB I PENDAHULUAN
1.1 Latar Belakang Analisis Regresi merupakan salah satu analisis dalam Statistika yang dipergunakan untuk mengestimasi pola hubungan antara variabel prediktor dengan variabel respon. Analisis regresi dalam mengestimasi kurva regresi terdapat dua pendekatan, yaitu pendekatan regresi parametrik dan regresi nonparametrik. Pendekatan regresi parametrik diasumsikan bentuk kurva regresi diketahui. Identifikasi awal pola hubungan dapat dilakukan dengan memanfaatkan pengalaman masa lalu atau menggunakan diagram pencar (scatter plot). Jika pola hubungan data membentuk pola linear maka digunakan pendekatan regresi parametrik linear, jika pola hubungan data membentuk pola kuadrat maka digunakan pendekatan regresi parametrik kuadratik (Budiantara, 2005). Apabila tidak ada informasi apapun mengenai bentuk kurva regresi apakah berbentuk linier, kuadratik atau yang lainnya, maka pendekatan yang digunakan adalah regresi nonparametrik. Pendekatan regresi nonparametrik tidak tergantung pada asumsi bentuk kurva tertentu, sehingga memberikan fleksibilitas yang lebih tinggi, dimana data diharapkan menyesuaikan sesuai bentuk estimasi kurva regresi tanpa dipengaruhi oleh subyektifitas peneliti (Eubank, 1999). Dalam hal ini kurva regresi diasumsikan termuat dalam ruang fungsi tertentu (Eubank, 1999). Keterbatasan informasi, bentuk fungsi, dan tidak jelasnya pola hubungan antara variabel respon dengan variabel prediktor merupakan pertimbangan sehingga digunakan pendekatan regresi nonparametrik. Terdapat banyak jenis estimator dalam model regresi nonparametrik, diantaranya kernel, spline, histogram, deret orthogonal, polinomial lokal, wavelet dan deret fourier. Diantara metode-metode pendekatan tersebut, regresi nonparametrik dengan pendekatan spline dan kernel merupakan metode yang sering digunakan. Spline merupakan salah satu model yang mempunyai model interpretasi statistik dan interpretasi visual sangat khusus dan sangat baik
1
(Budiantara, 2012). Estimator spline memiliki fleksibilitas yang tinggi (Eubank, 1999). Spline juga memiliki kemampuan yang sangat baik dalam menangani data yang perilakunya berubah-ubah pada sub-sub interval tertentu (Eubank, 1999; Budiantara, 2012). Estimator kernel juga memiliki beberapa kelebihan, diantaranya estimator kernel memiliki kemampuan yang baik untuk memodelkan data yang tidak mempunyai pola tertentu, selain itu perhitungan matematisnya mudah (Hardle, 1990). Estimator kernel juga memiliki kecepatan kekonvergenan yang relatif lebih cepat dibandingkan dengan kurva regresi nonparamerik yang lain seperti polinomial lokal, deret fourier maupun spline (Hardle, 1990). Regresi kernel merupakan teknik statistik nonparametrik untuk menaksir nilai ekspektasi bersyarat suatu variabel random. Nilai ekspektasi ini lazim dinotasikan E(Y|X). Tujuan regresi kernel adalah mendapatkan hubungan nonlinier antara X dengan Y. Sementara itu, regresi spline adalah model polinomial yang tersegmen. Polinomial tersegmen memegang peranan penting dalam teori dan aplikasi statistika. Spline sangat tergantung pada titik knot. Titik knot merupakan titik perpaduan bersama dimana terjadi pola perubahan perilaku dari suatu fungsi pada selang yang berbeda. Beberapa penelitian mengenai estimator kernel telah dilakukan oleh banyak peneliti seperti oleh Nadaraya (1964), Watson (1964), Hadijati, (2004), Okumura dan Naito (2006), Yao (2007), Budiantara dan Mulianah, (2007) serta Kayri dan Zirhlioglu (2009), Du, Parmeter dan Racine (2012), Aljuhani dan Al Turk (2014). Penelitian mengenai estimator Spline telah dilakukan oleh peneliti lain seperti Craven dan Wahba (1979), Wahba (1990), Eubank (1999), Budiantara (2005); Otok (2006); Budiantara (2009); Budiantara, Lestari dan Islamiyati (2010); Darmawi dan Otok (2014), Budiantara, Ratna, Zain dan Wibowo (2015). Sementara itu, penelitian tentang regresi campuran Spline dan Kernel telah dilakukan oleh Budiantara, Ratnasari, Ratna dan Zain, (2015); Rory (2016); Rismal (2016); Purnomo (2016); Syisliawati (2016) dan Hesikumalasari (2016). Kernel merupakan estimator yang pada awalnya banyak digunakan dalam regresi nonparametrik. Kelompok peneliti pertama yang meneliti kernel diawali oleh Nadaraya (1964) dan Watson (1964). Kemudian diikuti penelitian
2
lain dalam perkembangan regresi kernel, seperti Hadijati (2004) meneliti tentang estimasi kernel dengan error berkorelasi, dan Okumura dan Naito (2006) yang meneliti Metode smoothing kernel untuk regresi multinomial. Yao (2007) yang dalam penelitiannya telah menurunkan distribusi asimtotik dari distribusi kernel dengan menggunakan rata-rata terbobot untuk data longitudinal. Selain itu, Budiantara dan Mulianah (2007) meneliti tentang pemilihan bandwith optimal dalam regresi Semiparametrik kernel, dan terdapat pula penelitian tentang estimator kernel untk melihat hubungan antara tingkat ketergantungan internet dengan lama-nya penggunaan internet setiap hari di sekolah menengah oleh Kayri dan Zirhlioglu (2009). Du dkk (2012) meneliti tentang regresi kernel multivariabel prediktor dan beberapa kendala bentuknya. Peneliti lain, Aljuhani dan Al Turk (2014) yang melakukan penelitian modifikasi estimasi regresi kernel adaptif Nadaraya-Watson. Spline pertama kali diperkenalkan oleh Whitaker pada tahun 1923 sebagai pendekatan pola data. Craven dan Wahba (1979) meneliti tentang data smoothing dengan fungsi Spline. Spline yang didasarkan pada suatu persoalan optimasi dikembangkan oleh Reinsc pada tahun 1967 (Wahba, 1990). Penelitian tentang fungsi Spline yang smooth diteliti oleh Eubank (1999). Sementara itu, Budiantara (2005) meneliti tentang penentuan titik-titik knots dalam regresi Spline. Pendekatan spline mempunyai suatu basis fungsi, yang biasa digunakan adalah spline truncated dan B-Spline. Spline truncated merupakan fungsi dimana terdapat perubahan pola perilaku kurva yang berbeda pada interval-interval yang berbeda. Kelebihan splinetruncated adalah dapat menggambarkan perubahan pola perilaku dari fungsi pada sub interval tertentu. Kelebihan lain dari spline truncated pada penelitian Otok (2006) menunjukkan kurva spline truncated lebih baik dari Multivariate Adaptive Regression Spline (MARS) pada fungsi yang melibatkan satu variabel prediktor. Penelitian tentang pemodelan Spline dalam regresi nonparametrik dan semiparametrik dilakukan oleh Budiantara (2009). Budiantara dkk (2010) meneliti tentang estimator spline terbobot dalam regresi nonparametrik dan semiparametrik heterokesdatik untuk data longitudinal. Darmawi dan Otok (2014) dalam penelitiannya menyimpulkan nilai MSE pada kurva Spline
3
truncated lebih kecil dibanding dengan regresi linier pada semua fungsi, hal ini berarti bahwa kurva spline truncated lebih baik dibanding dengan regresi linier. Budiantara dkk (2015) Memodelkan Persentase Penduduk Miskin di Indonesia dengan menggunakan Pendekatan Regresi Nonparametrik Spline. Penelitian mengenai regresi campuran nonparametrik spline dan kernel sebelumnya telah dilakukan oleh Budiatara dkk (2015). Selanjutnya Rory (2016) meneliti tentang estimator campuran spline dan multivariabel prediktor kernel menggunakan metode Maximum Likelihood Estimation (MLE). Rismal (2016) meneliti tentang estimator campuran multivariabel prediktor spline dan multivariabel prediktor kernel menggunakan metode Maximum Likelihood Estimation (MLE). Purnomo (2016) meneliti tentang estimator campuran spline dan kernel menggunakan metode Ordinary Least Square (OLS). Sementara itu, Hesikumalasari (2016) meneliti tentang estimator campuran spline dan kernel dalam regresi semiparametrik. Penelitian mengenai interval kepercayaan regresi nonparametrik campuran spline dan kernel telah dilakukan oleh Syisliawati (2016). Model-model pendekatan regresi nonparametrik yang dikembangkan oleh penelitian sebelumnya pada dasarnya terdapat dua asumsi yang mendasar pada modelnya, yaitu pola dari masing-masing prediktor dalam model regresi nonparametrik multivariabel dianggap mempunyai pola yang sama dan peneliti memaksakan menggunakan satu bentuk estimator model untuk setiap variabel prediktor. Dua asumsi yang digunakan dalam model regresi nonparametrik ini pada dasarnya hanya ada secara teoritis. Pada penelitian yang telah dilakukan, sering dijumpai kasus-kasus dimana terjadi pola data yang berbeda dari masingmasing variabel prediktor. Selain itu dengan hanya menggunakan satu bentuk estimator dalam mengestimasi kurva regresi nonparametrik multivariabel yang memiliki pola data variabel prediktor yang berbeda, berakibat estimator yang diperoleh tidak akan sesuai dan cenderung mempunyai error yang besar (Budiantara, Ratnasari, Ratna dan Zain, 2015). Berdasarkan hal tersebut, Budiantara dkk (2015) menyarankan penggunaan estimasi model kurva regresi yang sesuai dengan pola data. Dalam penelitian ini merujuk pada pengunaan
4
model regresi nonparametrik campuran spline truncated dan kernel untuk memodelkan Angka Fertilitas Total atau Total Fertility Rate (TFR) di Jawa Timur, karena berdasarkan karakteristik pola data, dihasilkan beberapa variabel prediktor tidak memiliki pola data dan sebagian lagi memiliki pola tertentu tetapi adanya perubahan perilaku pada sub-sub interval tertentu. Oleh karena itu, penggunaan regresi nonparametrik campuran spline dan kernel. Masalah kependudukan merupakan salah satu permasalahan yang dihadapi hampir semua negara berkembang di dunia. Fertilitas merupakan salah satu komponen utama kependudukan selain kematian dan migrasi yang menyebabkan terjadinya perubahan penduduk. Istilah fertilitas adalah sama dengan kelahiran hidup, yaitu terlepasnya bayi dari rahim sorang perempuan dengan ada tandatanda kehidupan, misalnya bernafas, jantung berdenyut, berteriak, dan sebagainya. Jumlah penduduk yang banyak atau berlebihan tentu saja menyebabkan tidak meratanya kesejahteraan hidup penduduk itu sendiri. Untuk mengurangi laju pertumbuhan penduduk tentunya harus dilakukan berbagai tindakan, salah satunya adalah penurunan tingkat fertilitas. Hal ini sangat berpengaruh terhadap kesejahteraan penduduk yang merupakan tujuan penting yang ingin dicapai oleh setiap negara. Untuk mencapai tujuan tersebut pemerintah harus membuat kebijakan-kebijakan penting dan berusaha memenuhi sarana dan fasilitas yang menunjang kesejahteraan penduduk. Disamping tujuan mencapai kesejahteraan masyarakat oleh pemerintah tersebut, tentu harus juga diikuti dengan peran serta masyarakat untuk mendukung dan ikut ambil bagian. Sehingga pengetahuan tentang kependudukan sangat penting diketahui oleh masyarakat luas untuk merangsang timbulnya tingkah laku yang bertanggung jawab terhadap masalah kependudukan. Dengan adanya kesadaran masyarakat dan perhatian untuk ikut serta dalam mewujudkan kesejahteraan penduduk maka pemerintah dan masyarakat secara bersama-sama berusaha menanggulangi masalah pertumbuhan penduduk misalnya dengan melaksanakan program Keluarga Berencana (KB). Angka Fertilitas Total didefenisikan sebagai jumlah anak yang akan dipunyai seorang wanita selama masa reproduksinya per 1000 wanita. Terdapat
5
beberapa faktor yang mempengaruhi tingkat kelahiran, diantaranya adalah pasangan usia subur dan pendapatan perkapita penduduk. Akibat tingkat Angka Fertilitas Total yang tinggi maka pertambahan penduduk yang besar akan mempunyai dampak terhadap berbagai aspek kehidupan. Banyaknya anak yang dilahirkan sangat erat kaitannya terhadap beban rumah tangga. Semakin banyak jumlah anak, berarti semakin besar tanggungan kepala rumah tangga dalam memenuhi kebutuhan anggota rumah tangganya. Masalah kependudukan yang dihadapi Indonesia telah mendorong terjadinya perubahan paradigma kebijakan kependudukan secara mendasar di Indonesia Berdasarkan data Badan Kependudukan dan Keluarga Berencana Nasional (BKKBN), Angka Fertilitas Total penduduk Indonesia pada tahun 2010 terjadi peningkatan dari tahun 2000 yakni dari angka 2,3 menjadi 2,4. Sementara itu, laju pertumbuhan penduduk di Indonesia dalam satu tahun mengalami lonjakan sebesar 1,49 persen. Pemerintah melalui BKKBN bertekad untuk menurunkan LPP nasional dari 1,49 persen per tahun menjadi 1,38 per tahun guna menekan pertumbuhan penduduk Indonesia yang semakin tinggi. Demikian juga dengan Provinsi terpadat kedua di Indonesia, yakni Jawa Timur. Jawa Timur yang mengalami kenaikan Angka Fertilitas Total dari tahun 2000 sebesar 1,713 menuju 2,002 pada tahun 2010 dan laju pertambahan penduduk di Provinsi Jawa Timur sebesar 0,61 persen dalam setahun. Data Angka Fertilitas Total dan masing-masing variabel prediktornya mempunyai pola yang tidak mengikuti pola tertentu (linier atau polinomial berderajat tertentu), sehingga pendekatan model regresi yang sesuai adalah model regresi nonparametrik. Karakteristik dari pola data yang sebagian tidak mempunyai pola data dan sebagian lagi memiliki pola tertentu tetapi adanya perubahan perilaku pada sub-sub interval tertentu, karena pada variabel Persentase jumlah status
kawin,
Rata-rata usia
kawin pertama,
Persentase
CPR
(Contraception Prevalence Rate), Persentase unmet need dan Persentase penduduk berpendidikan tinggi mempunyai perilaku yang berubah-ubah pada interval tertentu sehingga dapat dimodelkan dengan regresi spline dan pada variabel PDRB perkapita tidak mempunyai pola yang jelas sehingga dapat
6
dimodelkan dengan regresi kernel, oleh karena itu metode campuran spline dan kernel digunakan untuk memodelkan pola data. Salah satu bagian penting dari inferensi statistik adalah pengujian hipotesis. Dalam penelitian ini akan dilakukan pengujian hipotesis campuran regresi spline truncated dan kernel pada data Angka Fertilitas Total di Jawa Timur tahun 2015.
1.2 Rumusan Masalah Dari uraian latar belakang diperoleh rumusan masalah yang diangkat dalam penelitian ini adalah sebagai berikut: 1. Bagaimana cara mendapatkan estimasi model regresi nonparametrik campuran spline truncated dan kernel? 2. Bagaimana penurunan pengujian hipotesis untuk parameter komponen spline dalam model regresi nonparametrik campuran spline truncated dan kernel? 3. Bagaimana mengaplikasikan uji hipotesis model regresi nonparametrik campuran spline truncated dan kernel pada Angka Fertilitas Total di Jawa Timur?
1.3 Tujuan Penelitian Berdasarkan rumusan masalah yang telah diuraikan diatas, maka tujuan dari penelitian ini adalah sebagai berikut: 1. Memperoleh estimasi model regresi nonparametrik campuran spline truncated dan kernel. 2. Memperoleh penurunan pengujian hipotesis untuk parameter komponen spline dalam model regresi nonparametrik campuran spline truncated dan kernel. 3. Mengaplikasikan uji hipotesis model regresi nonparametrik campuran spline truncated dan kernel pada kasus Angka Fertilitas Total di Jawa Timur
1.4 Manfaat Penelitian 1. Mengembangkan wawasan keilmuan dan pengetahuan tentang regresi nonparametrik spline truncated.
7
2. Mengembangkan wawasan keilmuan dan pengetahuan tentang regresi nonparametrik kernel. 3. Mengembangkan
pengetahuan
tentang
pengujian
hipotesis
regresi
nonparametrik campuran kernel dan spline. 4. Hasil penelitian diharapkan menjadi bahan masukan dalam menentukan variabel-variabel yang mempengaruhi Angka Fertilitas Total di Jawa Timur.
1.5 Batasan Penelitian Mengacu perumusan masalah di atas, maka ruang lingkup dalam penelitian ini dibatasi pada beberapa hal, antara lain : 1. Model regresi nonparametrik yang digunakan adalah spline truncated. 2. Estimator kernel yang digunakan adalah estimator kernel Nadaraya dan Watson. 3. Pemilihan titik knot dan bandwith optimal menggunakan metode GCV. 4. Dalam aplikasi digunakan spline truncated linear dengan satu, dua, dan tiga kombinasi knot. 5. Penurunan statistik uji dalam penelitian ini menggunakan metode Likelihood Ratio Test (LRT).
8
BAB 2 TINJAUAN PUSTAKA
2.1 Analisis Regresi Parametrik Analisis regresi merupakan suatu analisis statistika yang digunakan untuk memodelkan pola hubungan antara variabel prediktor dan variabel respon. Jika variabel respon adalah 𝑦𝑖 dan variabel prediktor adalah 𝑥𝑖 , 𝑖 = 1,2, … , 𝑛, maka pasangan data 𝑥𝑖 , 𝑦𝑖 akan membentuk model hubungan fungsional 𝑦𝑖 = 𝑓 𝑥𝑖 + 𝜀𝑖 di mana 𝑓 𝑥𝑖 adalah kurva regresi dan 𝜀𝑖 adalah error random yang diasumsikan identik, independen dan berdistribusi normal dengan mean nol dan varian 𝜎 2 (Eubank, 1999). Terdapat dua pendekatan dalam model regresi, yaitu regresi parametrik dan regresi nonparametrik. Pemodelan regresi parametrikdigunakan apabila kurva regresi data membentuk pola tertentu, seperti linier, kuadratik ataupun kubik. Model regresi parametrik dalam penggunaanya memerlukan informasi dari masa lalu atau sumber informasi lain yang tersedia yang dapat menggambarkan secara detail tentang data tersebut. Model regresi parametrik juga mempunyai asumsibentuk kurva regresi harus diketahui. Sebaliknya, jika bentuk kurva regresi tidak
diketahui,
maka
dilakukan
pendekatan
menggunakan
regresi
nonparametrik.Metode untuk mengestimasi parameter adalah metode Least SquareatauMaximum Likelihood (Wahba, 1990). Pada umumnya, variabel respon y dapat dihubungkan dengan k variabel-variabel prediktor. Model regresi linear berganda dapat disajikan dalam bentuk (Montgomery & Hines, 1972) yi 0 1 x1i 2 x2i k xki i , i 1, 2,..., n
(2.1)
Dimana y variabel respon, x1 , x2 ,..., xk sebagai variabel prediktor, i merupakan error random independen berdistribusi normal dengan mean nol dan varians 2 dan parameter 1 , 2 ,..., k tidak diketahui. Estimasi regresi parametrik sangat efisien jika model yang diasumsikan benar, akantetapi jika tidak benar
9
akan menyebabkan interpretasi data yang tidak sesuai dan mempunyai error yang besar. Secara umum bentuk regresi parametrik linear berganda dengan k variabel prediktor pada persamaan (2.1) dapat ditulis dalam bentuk matriks sebagaimana persamaan (2.2)
y X
(2.2)
dimana y1 1 x11 1 x y 2 21 X y 1 xn1 yn
x12 x1k 0 1 x22 x2 k 1 dan 2 xn 2 xnk k n
Variabel respon 𝒚 adalah sebuah vektor (n x 1) dari observasi-observasi respon, X adalah sebuah matriks (nx(k+1)) dari variabel-variabel prediktor, adalah sebuah vektor ((k+1)x1) dari koefisien-koefisien regresi dan adalah sebuah vektor (nx1) dari error random. Parameter diestimasi dengan metode kuadrat terkecil yang meminimumkan T dimana :
T (y X )T (y X ) Dengan menurukan parsial ' terhadap dan menyamakan dengan nol, maka diperoleh estimator :
( T ) ((y X )T (y X )) ( ) ( ) ˆ (X'X)1 XT y
(2.3)
2.2Regresi Nonparametrik SplineTruncated Pendekatan regresi nonparametrik yang banyak digunakan adalah splinetruncated. Splinetruncated merupakan potongan-potongan polinomial yang memiliki sifat tersegmen dan kontinu. Salah satu kelebihan splinetruncated adalah mempunyai sifat fleksibilitas yang tinggidan cenderung mencari sendiri estimasi data kemanapun pola data tersebut bergerak. Kemampuan mengestimasi perilaku data ini ditunjukkan oleh fungsi truncated (potongan-potongan) yang melekat
10
pada estimator dan potongan-potongan tersebut yang disebut titik knot. Titik knot merupakan titik perpaduan bersama yang menunjukkan perubahan pola perilaku fungsi pada selang yang berbeda. Spline merupakan salah satu jenis piecewise polinomial, yaitu polinomial yang memiliki sifat tersegmen. Sifat tersegmen ini memberikan fleksibilitas yang lebih baik dari polinomial biasa, sehingga memungkinkan untuk
menyesuaikan diri secara
lebih efektif terhadap
karakteristik lokal suatu fungsi atau data.Secara umum, fungsi splinetruncated dengan derajad m dan titik-titik knot 1 , 2 ,..., r adalah suatu fungsi yang dapat ditulis dalam bentuk sebagaimana persamaan (2.4) yi = f(xi) + εi, i= 1, 2, …., n. m
r
j 0
k 1
(2.4)
j xij k m xi k i , i = 1, 2,….,n. m
dengan, m m xi k , xi k x i k , xi k 0
Error randomεi diasumsikan berdistribusi normal independen dengan mean nol dan variansi 2 . Sebagai salah satu ilustrasi sederhana diberikan spline linier truncated dengan tiga knot pada x1 1 x2 2 x3 3 (Budiantara, 2011) diberikan oleh : f3 ( x) 1 x 1 ( x 1 )1 2 ( x 2 )1 3 ( x 3 )1
Fungsi Spline f3 ( x) dapat disajikan dalam bentuk (lihat gambar 2.1) :
1 x , x 1 x ( x )1 , 1 x 2 1 1 f 3 ( x) 1 1 1 , 2 x 3 1 x 1 ( x 1 ) 2 ( x 2 ) 1 1 1 x 1 ( x 1 ) 2 ( x 2 ) 3 ( x 3 )1 , x 3
11
x Gambar 2.1 Spline truncated dengan tiga titik knot (Budiantara, 2011) Dalam regresi nonparametrik dengan pendekatan splinetruncated, hal penting yang berperan dalam mendapatkan estimator splinetruncated adalah pemilihan titik knot yang optimal. Salah satu metode yang sering digunakan dalam memilih titik knot optimal adalahGeneralized Cross Validation (GCV). Jika dibandingkan dengan metode lain, misalnya Cross Validation (CV) dan metode Unbiased Risk (UBR) ataupun Generalized Maximum Likelihood (GML), GCV secara teoritis memiliki sifat optimal asymtotik. Metode GCV juga memiliki kelebihan tidak memerlukan pengetahuan terhadap variansi populasi 2 serta metode GCV invarians terhadap transformasi. Metode GCV merupakan pengembangan dari CV (Wahba, 1990). Fungsi GCV untuk pemilihan titik knot optimal dapat ditunjukkan dalam persamaan (2.5) GCV 1 , 2 ,..., r
n
MSE 1 , 2 ,..., r trace I A 1 , 2 ,..., r
1
2
(2.5)
dengan n
MSE 1 , 2 ,..., r n1 yi fˆ xi i 1
2
2.3 Regresi Nonparametrik Kernel Estimator
kernel
mempunyai
kelebihan
yaitu
fleksibel,
bentuk
matematisnya mudah dan dapat mencapai tingkat kekonvergenan yang relative cepat. Kurva regresi g (ti ) yang dihampiri fungsi kernel, estimasi kurva regresi dapat disajikan dalam persamaan (2.6)
12
K t t n i 1 gˆ t n 1 y n W i t yi i n i 1 1 i 1 n K t t j j 1 n
(2.6)
dimana :
W i t
K t ti n
n 1 K t ti
; K t ti
t ti K 1
i 1
Dengan K merupakan fungsi kernel. Menurut Hardle (1990), fungsi kernel K dapat berupa Kernel Gaussian: K (u )
dimana ui
t ti
1 u2 exp( ) I[ , ] (u ) 2 2
, i 1, 2,..., n , adalah bandwidth, t adalah variabel prediktor
dan ti adalah nilai ke-i variabel prediktor.Pendekatan kernel tergantung pada bandwidth , yang berfungsi untuk mengontrol smoothness dari kurva estimasi. Pemilihan bandwitdh yang tepat merupakan hal yang sangat penting dalam regresi kernel (Hadijati, 2004). Bandwidth yang terlalu besar akan menghasilkan kurva estimasi yang sangat smooth dan menuju ke rata-rata dari variabel respon, sebaliknya bila bandwidth terlalu kecil akan menghasilkan kurva estimasi yang kurang smooth yaitu hasil estimasi akan menuju ke data. Estimator kurva regresi (2.6) sangat tergantung pada dua hal, yaitu parameter bandwidth dan fungsi kernelnya (Budiantara, 2015), tetapi dari dua hal tersebut ternyata bandwidth lebih signifikanpengaruhnya terhadap estimator kernel dibanding fungsi kernel. Dalam kaitannyapemilihanbandwidth optimal, digunakan metode Generalized Cross Validatian (GCV).
2.4 Estimator Campuran Spline dan Kernel Budiantara, Ratnasari, Ratna dan Zain (2015) meneliti tentang model regresi nonparametrik aditif yang memiliki dua komponen variabel prediktor. Komponen prediktor pertama kurva regresinya dihampiri menggunakan regresi spline, sedangkan komponen prediktor kedua kurva regresi dihampiri dengan 13
fungsi kernel. Diberikan data berpasangan ( xi , ti , yi ) data hubungan antar variabel prediktor xi , ti dan variabel respon yi mengikuti model regresi nonparametrik :
yi ( xi , ti ) i ,
i=1,2,…,n
Bentuk kurva regresi diasumsikan tidak diketahui dan hanya diasumsikan smooth dalam arti kontinu dan differensiabel. Error random i berdistribusi 2 2 normal dengan mean nol dan E ( i ) . Selanjutnya kurva regesi ( xi , ti ) dapat
ditulis dalam bentuk :
( xi , ti ) f ( xi ) g (ti ) dengan f ( xi ) dan g (ti ) merupakan fungsi-fungsi yang smooth. Persoalan utama dalam estimator campuran kurva regresi nonparametrik adalah mendapatkan bentuk estimasi kurva regresi ( xi , ti ) yaitu :
ˆ , ( xi , ti ) fˆ , ( xi ) gˆ (ti ) Parameter merupakan parameter bandwith dan merupakan titik knot. Estimator campuran regresi spline dan kernel bisa didapatkan dengan cara kurva regresi f ( xi ) dihampiri dengan fungsi splinetruncated derajat m dan titik knot (1 , 2 ,..., r )T , sedangkan kurva regresi g (ti ) dihampiri dengan fungsi kernel.Menurut Budiantara(2015), kurva regresi f ( xi ) yang diberikan persamaan (2.4) dapat ditulis menjadi : 𝑓 = 𝑋1 𝜃 + 𝑋2 𝜆 𝜙 Selanjutnya didapat: 𝑔𝛼 𝑡 = 𝐷 𝛼 𝑦 dengan demikian model regresi campuran spline dan kernel dapat disajikan menjadi : 𝑦 = 𝑋1 𝜃 + 𝑋2 𝜆 𝜙 + 𝐷 𝛼 𝑦 + 𝜀 = 𝑋1 𝑋2 𝜆
𝜃 +𝐷 𝛼 𝑦+𝜀 𝜙
=𝑍 𝜆 𝛽+𝐷 𝛼 𝑦+𝜀
14
Estimator parameter 𝛽 dapat diperoleh dengan menggunakan metode Ordinary Least Square (OLS) yang meminimumkan: 𝑛
𝜀𝑖2 =
2
I−D 𝛼 𝑦
− 2𝛽 𝑇 𝑍 𝜆
𝑇
I − D 𝛼 𝑦 + 𝛽𝑇 𝑍 𝜆 𝑇 𝑍 𝜆 𝛽
𝑖=1
Untuk
mendapatkan
untuk 𝛽 ,
estimator
dilakukan
derivatif
parsial
terhadap𝛽diperoleh : 𝛽 = (𝑍 𝜆 )𝑇 𝑍 𝜆
−1
(𝑍 𝜆 )𝑇 (𝐼 − 𝐷 𝛼 )𝑦
= 𝐶 𝜆, 𝛼 𝑦 dimana : 𝐶 𝑥, 𝜆 =
𝑍 𝜆
𝑇
−1
𝑍 𝜆
𝑇
𝑍 𝜆
𝐼−𝐷 𝛼
Estimator spline diberikan oleh: 𝑓𝛼 ,𝜆 𝑥, 𝑡 = 𝑍(𝜆)𝛽 (𝜆, 𝛼) 𝑇
= 𝑍(𝜆) 𝑍 𝜆
𝑍(𝜆)
−1
𝑇
𝑍 𝜆
𝐼−𝐷 𝛼 𝑦
= 𝐴 𝜆, 𝛼 𝑦𝛼 dengan matrik adalah : 𝐴 𝜆, 𝛼 = 𝑍 𝜆
𝑍 𝜆
𝑇
𝑍 𝜆
−1
𝑍 𝜆
𝑇
𝐼−𝐷 𝛼
Selanjutnya didapat estimator campuran regresi spline dan kernel: 𝜇𝛼,𝜆 𝑥, 𝑡 = 𝑓𝛼 ,𝜆 𝑥, 𝑡 + 𝑔𝛼 𝑡 = 𝐴 𝜆, 𝛼 𝑦 + 𝐷 𝛼 𝑦 = (𝐴 𝜆, 𝛼 + 𝐷 𝛼 )𝑦 = 𝐵 𝜆, 𝛼 𝑦 dimana matrik B 𝜆, 𝛼 adalah : 𝐵 𝜆, 𝛼 𝑦 = 𝐴 𝜆, 𝛼 + 𝐷 𝛼 Estimator campuran regresi Spline dan Kernel ˆ , x, t
sangat
bergantung kepada banyak dan letak titik knot (1 , 2 ,..., r )T dan parameter bandwitdh . Untuk memperoleh estimator campuran regresi spline dan kernel yang terbaik perlu dilakukan pemilihan titik knot dan parameter bandwidth yang
15
optimal. Metode digunakan adalah Generalized Cross Validation (GCV). Fungsi GCV yang diberikan oleh Wahba (1990): GCV ,
n
n1 || y ˆ , ( x, t ) ||2 trace I A , D( )
1
2
Titik knot optimal opt (1(opt ) , 2(opt ) ,..., r (opt ) )T dan parameter bandwidth optimal opt diperoleh dari optimasi : G(opt , opt ) Min{G( , )} ,
2.5 Uji Hipotesis Pengujian hipotesis merupakan suatu tata cara estimasi tentang parameter populasi melalui menguji kebenaran suatu hipotesa. Diberikan model regresi yi 0 1 x1i 2 x2i k xki i , i 1, 2,..., n . Untuk mengetahui apakah
variabel-variabel 𝑥1 , 𝑥2, … , 𝑥𝑘 berpengaruh terhadap model dapat digunakan uji hipotesis. Uji hipotesis dapat dilakukan dengan menggunakan metode Likelihood Ratio Test. Prosedur uji hipotesis parameter adalah : 𝐻0 : 𝛽0 = 𝛽1 = 𝛽2 = ⋯ 𝛽𝑘 = 0 𝐻1 : 𝑚𝑖𝑛𝑖𝑚𝑎𝑙 𝑡𝑒𝑟𝑑𝑎𝑝𝑎𝑡 𝑠𝑎𝑡𝑢 𝛽𝑖 ≠ 0 , i=1,2,...,p
(2.7)
Misalkan adalah ruang parameter populasi, maka diperoleh fungsi likelihood : 𝐿( ) Fungsi yang memaksimumkan 𝐿( ) adalah : ˆ) L (
Misalkan ωadalah himpunan parameter di bawah 𝐻0 , maka fungsi likelihoodnya adalah : 𝐿(ω) Fungsi yang memaksimumkan 𝐿(ω) adalah : 𝐿(𝜔) Statistik penguji untuk hipotesis 𝐻0 lawan 𝐻1 diperoleh dari menyelesaikan rasio: Lratio
L(ˆ ) ˆ) L (
16
Hipotesis 𝐻0 akan ditolak jika dan hanya jika 0 dengan 0 adalah suatu konstanta.
2.6 Teorema Dasar Terkait Aljabar Beberapa konsep dasar yang digunakan dalam proses mendapatkan estimator model regresi nonparametrik kernel dan splinetruncated linier multivariabel berikut ini. Teorema 2.6.1 (Rencher dan Schaalje, 2007) Pada matriks A dan B, maka berlaku sifat – sifat sebagai berikut : a. Jika matriks A simetris, maka AT =A. b. c.
A B AT BT T AB BT AT T
Teorema selanjutnya berkaitan dengan penurunan matriks dan vektor. Teorema 2.6.2 (Rencher dan Schaalje, 2007) Pada vektor a dan x , dimana aT x xT a , aT a1 , a2 ,..., a p memuat konstanta, dengan ini berlaku
x a a
aT x
T
x
x
Teorema 2.6.3 (Rencher dan Schaalje, 2007) Apabila vektor x dan merupakan suatu matriks simetri, maka
xT Ax x
2Ax
Teorema 2.6.4 (Rencher dan Schaalje 2007) Jika 𝒚 ~𝑁(𝝁, 𝜎 2 𝑰)
dan
Amatrik
simetris
dengan
rank
r,
maka
𝒚𝑨𝒚/𝜎 2 ~ 2 (𝑟, 𝝁𝑨𝝁/2𝜎 2 ) jika dan hanya jika jika Aadalah idempotent.
Teorema 2.6.5 (Rencher dan Schaalje, 2007) Jika𝒚 ~𝑁(𝝁, 𝜎 2 𝑰) maka yAy dan yBy adalah independent jika dan hanya jika
AB 0 (atau ekuivalen, BA 0 )
17
2.7 Koefisien Determinasi (R2) Koefisien determinasi (R2) merupakan ukuran ketelitian atau ketepatan model regresi, atau besarnya kontribusi x terhadap perubahan y. Semakin tinggi nilai R2 maka model akan semakin baik. Rumus koefisien determinasi diberikan oleh: 𝑅2 =
𝑆𝑆𝑅 (𝑌 − 𝑌)′(𝑌 − 𝑌 ) = 𝑆𝑆𝑇 (𝑌 − 𝑌)′(𝑌 − 𝑌 )
2.8Angka Fertilitas Total 2.8.1 Pengertian Angka Fertilitas Total Angka Fertilitas Total atau Total Fertility Rate (TFR) didefinisikan sebagai jumlah kelahiran hidup laki-laki dan perempuan tiap 1000 perempuan yang hidup hingga akhir masa reproduksinya (BKKBN, 2015). Angka Fertilitas Total didefenisikan sebagai jumlah kelahiran hidup laki-laki dan perempuan tiap 1.000 penduduk yang hidup hingga akhir masa reproduksinya dengan catatan : a. Tidak ada seorang perempuan yang meninggal sebelum mengakhiri masa reproduksinya. b. Tingkat TFR menurut usia tidak berubah pada periode waktu tertentu (Mantra, 2006). Menurut Mantra (2006), tingkat Angka Fertilitas Total menggambarkan riwayat
Angka
Fertilitas
Totaldari
sejumlah
perempuan
selama
masa
reproduksinya. Hal ini sesuai dengan riwayat kematian dari tabel kematian penampang lintang (cross sectional life table). Dalam praktek, tingkat Angka Fertilitas Total dikerjakan dengan menjumlahkan tingkat Angka Fertilitas Total perempuan menurut usia, apabila usia tersebut berjenjang lima tahunan, dengan asumsi bahwa Angka Fertilitas Totalmenurut usia tunggal sama dengan rata-rata tingkat Angka Fertilitas Total kelompok usia lima tahunan. Rumus Angka Fertilitas Total adalah sebagai berikut: 𝑇𝐹𝑅 = 5 𝑇𝐹𝑅
𝐴𝑆𝐹𝑅𝑖
= Total Fertility Rate
𝐴𝑆𝐹𝑅𝑖 = Tingkat TFR menurut usia ke-1 dari kelompok berjenjang 5 tahunan. 18
Dengan rumus : 𝐴𝑆𝐹𝑅𝑖 =
𝐵𝑖 𝑥𝑘 𝑃𝑓𝑖
𝐵𝒊 = Jumlah kelahiran bayi pada kelompok usiai 𝑃𝑓𝑖 = Jumlah perempuan kelompok usiai pada pertengahan tahun 𝑘
= Angka konstanta = 1.000
2.9 Faktor-faktor yang Mempengaruhi Angka Fertilitas Total 2.9.1 Persentase Jumlah Status Kawin Perkawinan merupakan salah satu variabel yang mempengaruhi tinggi rendahnya Angka Fertilitas Total, yang secara tidak langsung mempengaruhi pertumbuhan penduduk. Perkawinan merupakan perubahan dari status perkawinan lain menjadi status “kawin”, misalnya perubahan dari status “belum kawin” menjadi status “kawin”(Balitbang, 2010). Menurut Balitbang (2010) yang mengutip Undang-Undang (UU) Perkawinan No 1 Tahun 1974, perkawinan adalah ikatan batin antara seorang pria dengan seorang wanita sebagai suami istri dengan tujuan membentuk keluarga (rumah tangga) yang bahagia dan kekal berdasarkan Ketuhanan Yang Maha Esa”. Batasan untuk kawin yang ditetapkan oleh UU ini adalah minimal berusia 19 tahun bagi laki-laki boleh kawin sedangkan bagi perempuan adalah minimal usia 16 tahun. Perkawinan bukan merupakan komponen yang langsung mempengaruhi pertambahan penduduk akan tetapi mempunyai pengaruh cukup besar terhadap Angka Fertilitas Total yang merupakan salah satu unsur pertumbuhan penduduk. Faktor utama yang mempengaruhi kemungkinan seorang wanita untuk hamil selain penggunaan kontrasepsi adalah antara lain perkawinan. Perkawinan merupakan awal dari kemungkinan untuk hamil bagi seorang wanita. Dengan demikian, status kawin termasuk salah satu dari faktor-faktor yang mempengaruhi tinggi rendahnya Angka Fertilitas Total.
19
2.9.2 Rata-rata Usia Kawin Pertama Usia kawin memegang peranan yang penting dalamAngka Fertilitas Total, adalah bahwa peningkatan usia kawin wanita berarti memperpendek masa subur.Pada setiap kelompok masyarakat proses bereproduksi atau memiliki keturunan dilegalkan melalui institusi perkawinan walaupun tidak dipungkiri bahwa terdapat hubungan kelamin diluar pernikahan, baik yang menghasilkan kelahiran maupun tidak. Pada kelompok masyarakat yang tidak memilki program pencegahan kelahiran seperti program keluarga berencana, maka penundaan usia kawin pertama merupakan salah satu cara untuk menghambat kelahiran (Apriyanti, 2014). Usia kawin pertama adalah umur pada saat wanita melakukan perkawinan secara hukum dan biologis yang pertama kali. Usia perkawinan dalam suatu pernikahan berarti umur terjadinya hubungan kelamin antara individu pria dan wanita yang terkait dalam suatu lembaga perkawinan dengan berbagi ketentuan mengenai hak dan kewajiban dari masing-masing individu. Pada masyarakat yang sedang berkembang, usia perkawinan pertama cenderung muda sehingga mempunyai nilai Angka Fertilitas Totalyang tinggi. Dengan kata lain semakin cepat usia kawin pertama, semakin besar kemungkinan mempunyai anak (Singarimbun, 1996). Usia perkawinan pertama mempunyai pengaruh cukup besar terhadap Angka Fertilitas Totalyang merupakan salah satu komponen pertumbuhan penduduk. Pada dasarnya ada dua macam bentuk perkawinan. Pertama, menunjukkan perubahan status dari belum kawin menjadi berstatus kawin. Kedua, perubahan dari status cerai menjadi status kawin. Dalam kaitan dengan penelitian ini, defenisi yang digunakan adalah yang pertama, yaitu perubahan dari status belum kawin menjadi kawin(Apriyanti, 2014). Menurut BKKBN (2011) yang mengutip pendapat Mosley dan Chen (1984), usia kawin pertama merupakan salah satu indikator demografi yang penting. Umumnya wanita yang menikah pada usia muda mempunyai masa reproduksi yang lebih panjang, yang dapat berakibat pada angka kelahiran yang lebih tinggi dibanding wanita yang menikah pada usia lebih tua. Dengan
20
demikian, usia kawin pertama termasuk salah satu dari faktor-faktor yang mempengaruhi tinggi rendahnyaAngka Fertilitas Total
2.9.3 CPR (Contraception Prevalence Rate) Keberhasilan program Keluarga Berencana di suatu wilayah dapat diukur dengan melihat tingkat pemakaian kontrasepsi (prevalensi kontrasepsi). Dengan demikian dapat dipahami betapa pentingnya informasi tentang pemakaian kontrasepsi, yang dapat digunakan juga untuk memperkirakan penurunan angka Angka Fertilitas Totalakibat dari pemakaian kontrasepsi tersebut. CPR (Contraception Prevalence Rate) adalah angka yang menunjukkan banyaknya Pasangan Usia Subur (PUS) yang sedang memakai kontrasepsi pada saat pencacahan. CPR adalah persen cakupan peserta KB aktif dibandingkan dengan jumlah pasangan usia subur di suatu wilayah kerja pada kurun waktu tertentu. Persentase wanita usia reproduksi yang menggunakan metode kontrasepsi pada titik tertentu dalam waktu, hampir selalu dilaporkan bagi perempuan menikah atau dalam hubungan seksual. Umumnya, ukuran mencakup semua metode kontrasepsi (modern dan tradisional). Data SDKI 2012 menunjukkan tren CPR di Indonesia sejak 1991-2012 cenderung meningkat, sementara tren Angka Fertilitas Total cenderung menurun. Tren ini menggambarkan bahwa meningkatnya cakupan wanita usia 15-49 tahun yang melakukan KB sejalan dengan menurunnya Angka Fertilitas Total nasional. Bila dibandingkan dengan target RPJMN 2014, CPR telah melampaui target (60,1%) dengan capaian 61,9%, namun Angka Fertilitas Total belum mencapai target (2,36) dengan angka tahun 2012 sebesar 2,6 (Depkes, 2014). Kualitas
pelayanan
kontrasepsi
dapat
meningkatkan
cakupan
penggunakeluarga berencana, enam komponen tersebut yaitu: 1) pilihan metode; 2) informasi yang diberikan kepada klien; 3) kompetensi provider; 4) tempat konsultasi; 5) tindak lanjut dan keberlangsungan pelayanan; dan 6) pelayanan yang tepat. Bentuk layanan keluarga berencana yang diberikan oleh provider bukan sekedar menyediakan alat kontrasepsi, tetapi memperhatikan kebutuhan sosial dan kesehatan calon akseptor. Keberhasilan klien dalam mengambil
21
keputusan pemilihan kontrasepsi adalah mengerti tentang keefektifan metode, mengetahui kelebihan dan kelemahan metode, cara pencegahan terhadap penyakit menular seksual, mengerti pemakaian metode dan kapan untuk kembali, serta tanda dan cara mengatasi efek samping. Dengan demikian, CPR termasuk salah satu dari faktor-faktor yang mempengaruhi tinggi rendahnyaAngka Fertilitas Total.
2.9.4 Unmet need Menurut SDKI (2012) unmet need adalah kebutuhan Keluarga Berencana yang tidak terpenuhi. Kebutuhan keluarga berencana yang belum terpenuhi (unmet need) didefinisikan sebagai kesenjangan antara niat wanita usia reproduksi dengan perilaku penggunaan kontrasepsi. Beberapa wanita yang menikah dan tidak menikah ingin menghindari kehamilan tetapi tidak menggunakan kontrasepsi. Definisiunmet need menurut Demographic Health Survey (DHS) adalah proporsi wanita usia subur yang menikah atau hidup bersama (seksual aktif) yang tidak ingin punya anak lagi atau yang ingin menjarangkan kelahiran berikutnya dalam jangka waktu minimal 2 tahun tetapi tidak menggunakan alat atau cara kontrasepsi. Unmet need merupakan pelayanan layanan kontrasepsi/keluarga berencana yang berkaitan dengan demand keluarga berencana. DemandKB adalah niat atau motivasi individu atau pasangan untuk mengontrolTFR dimasa yang akan datang.DemandKB terbagi dalam 3 kategori yaitu keinginan untuk menunda kelahiran anak pertama, keinginan untuk menjarangkan kehamilan dan keinginan untuk mengakhiri kelahiran. Untuk menunda, mengatur jarak dan membatasi kelahiran ditentukan oleh penilaian ekonomi dan sosial yang memiliki kekuatan untuk motivasi pengendalian kesuburan. Menurut Westoff (2006) perempuan yang tidak terpenuhi pelayanan keluargaberencana dan tidak berniat untuk menggunakan kontrasepsi di masa depan adalah populasi yang menjadi perhatian khusus dari program keluarga berencana. Kelompok ini lebih membutuhkan motivasi dan lebih banyak ketersediaan kontrasepsi. BPS memberikan batasan bahwa unmet need merupakan persentase wanita
22
kawin yang tidak ingin mempunyai anak lagi atau ingin menjarangkan kelahiran anak berikutnya, akan tetapi tidak memakai alat atau cara kontrasepsi. Kelompok unmet need mencakup wanita hamil yang kehamilannya tidak diinginkan, dan wanita yang tidak hamil atau belum haid setelah melahirkan dan tidak memakai kontrasepsi tetapi ingin menunggu dua tahun atau lebih sebelum kelahiran berikutnya. Wanita yang belum memutuskan apakah ingin anak lagi tapi belum tahu kapan juga termasuk dalam kelompokunmet need. Wanita yang hamil akibat kegagalan metode kontrasepsi, wanita yang mengalami infecund yaitu mereka telah menikah lima tahun atau lebih tetapi tidak pernah melahirkan, menopause dan histerektomi bukan termasuk dalam kelompokunmet need. Usia pernikahan yang terlalu muda, pendidikan wanita yang rendah, jarak ke layanan dan diskriminasi gender terhadap pemilihan jenis kelamin anak adalahkarakteristik demografi yang menentukan tingginya kebutuhan KB yang tidak terpenuhi. Terdapat perbedaan karakteristik demografi dalamunmet needterkaitpelayanan keluarga berencana untuk pembatasan dan penjarangan kelahiran. Pembatasan kelahiran lebih tinggi pada wanita dengan usia lebih dari 35 tahun, tidak memiliki pendidikan formal dan paritas lebih dari empat, sedangkan untuk penjarangan kelahiran lebih tinggi pada wanita usia dibawah 25 tahun, pendidikan menengah atau tinggi dan paritas rendah. Dengan demikian, unmet need termasuk salah satu dari faktor-faktor yang mempengaruhi tinggi rendahnyaAngka Fertilitas Total.
2.9.5 Persentase Penduduk Berpendidikan Tinggi Dunia pendidikan di Indonesia masih menghadapi permasalahan, salah satunya adalah keluhan mengenai sarana dan prasarana pendidikan yang kurang memadai dan tenaga pengajar yang kurang berkualitas. Untuk itu berbagai cara dilakukan oleh pemerintah diantaranya dengan mengembangkan kurikulum, sehingga diharapkan dapat menciptakan lulusan yang berkualitas yang dapat meningkatkan mutu sumber daya manusia. Program atau kebijaksanaan pemerintah dalam bidang pendidikan pada hakekatnya bertujuan untuk memberi kesempatan seluas-luasnya kepada
23
masyarakat untuk dapat sekolah. Dengan demikian, tingkat pendidikan masyarakat diharapkan akan lebih baik terutama tingkat melek huruf khususnya pada penduduk usia sekolah (7-24 tahun). Masih rendahnya kemampuan pemerintah dan masyarakat selalu menjadi kendala dalam dunia pendidikan. Realita ini senantiasa banyak ditemui di sekeliling kita, dimana banyak sarana pendidikan yang sangat tidak layak dan juga banyak anak-anak usia sekolah seharusnya belajar, namun sudah harus bekerja untuk menambah penghasilan keluarga. Kebijaksanaan lain sebagai upaya untuk meningkatkan tingkat pendidukan masyarakat adalah melalui program diluar pendidikan formal, diantaranya melalui sekolah-sekolah program jarak jauh.Agar pendidikan dapat dimiliki oleh seluruh lapisan masyarakat sesuai dengan kemampuan masing-masing individu, maka pendidikan adalah tanggung jawab keluarga, masyarakat dan pemerintah. Pada program pembangunan pendidikan nasional yang dilakukan saat ini telah pula mempertimbangkan kesepakatan-kesepakatan internasional seperti Pendidikan Untuk Semua (Education For All), Konvensi Hak Anak (Convention on the Right of
Child) danMillenium Development
Goals(MDGs)
yang secara jelas
menekankan pentingnya pendidikan sebagai salah satu cara penanggulangan kemiskinan, peningkatan keadilan sosial dan lainnya. Pentingnya pendidikan tercermin dalam Undang-Undang Dasar 1945, yang mengamanatkan bahwa salah satu tujuan Negara Indonesia adalah mnencerdaskan kehidupan bangsa. Demikian pula dijelaskan dalam Batang tubuh UUD 1945 pasal 28 dan pasal 31 yang mengamanatkan bahwa setiap warga Negara berhak mendapat pendidikan. Oleh sebab itu peningkatan akses masyarakat terhadap pendidikan yang lebih berkualitas merupakan amanat yang harus dilaksanakan bangsa ini karena pendidikan merupakan sarana untuk membentuk manusia terampil dan produktif sehingga dapat mempercepat peningkatan kesejahteraan masyarakat. Menurut Apriyanti (2014), pendidikan merupakan salah satu faktor yang sangat penting dan mempunyai kaitan dengan pengetahuan dan pandangan dalam pembatasan jumlah anak. Dengan pendidikan yang semakin tinggi ditempuh
24
seseorang, berarti menunda perkawinan yang dapat mempengaruhi jumlahanak yang dilahirkan. Pendidikan menurunkan kegunaan ekonomi yang diharapkan dari anak dan menyebabkan jumlah anak yang diharapkan juga berkurang. Semakin tinggi pendidikan seseorang dengan sendirinya semakin luas pengetahuan dan pola
pikirnya
dan
diduga
semakin
besar
pula
kemungkinan
untuk
mempertimbangkan dalam pembatasan jumlah anggota keluarga atau jumlah anak.Orang berpendidikan atau pandai baca-tulis lebih terbuka pada pikiranpikiran baru dan lebih banyak mempuyai kesempatan untuk bertemu muka dengan “penyalur perubahan” seperti para perencana bidang kesehatan atau penasehat program keluarga berencana. Pendidikan yang makan waktu lama kemungkinan besar akan menyebabkan perkawinan tertunda dan membuka pilihan antara bekerja dan membesarkan anak. Pendidikan yang lebih tinggi mungkin pula berarti kehidupan ekonomi yang lebih terjamin, dan ini biasanya berarti keluarga yang lebih kecil. Penjelasan di atas menunjukkan bahwa terdapat kaitan yang sangat erat antara kaitan pendidikan wanita dan besar keluarga. Para orang tua akan tergerak untuk mementingkan kualitas dari pada kuantitas anak, atau memberi kesempatan kepada istri dan ibu untuk bekerja demi menunjang pemeliharaan anak. Dengan demikian, salah satu cara untuk mendorong para keluarga agar menginginkan sedikit anak adalah dengan memperbesar kesempatan di bidang pendidikan dan membuka lapangan-lapangan pekerjaan berpenghasilan tinggi kepada kaum wanita. Dengan demikian, persentase penduduk berpendidikan tinggi termasuk salah satu dari faktor-faktor yang mempengaruhi tinggi rendahnyaAngka Fertilitas Total Mantra (2009).
2.9.6 PDRB perkapita Penelitian mengenai teori dan model fertilitas sudah banyak dilakukan oleh para ahli terutama ahli bidang sosial dan kependudukan serta bidang ekonomi. Hal ini dikarenakan semakin kompleknya permasalahan sosial dan ekonomi yang timbul akibat pertambahan penduduk, terutama yang disebabkan oleh faktor kelahiran.
25
Pada sebagian negara maju, memperhitungkan faktor-faktor lain dalam memiliki anak antaranya adalah pengaruh memiliki anak terhadap pola pembelanjaan rumah tangga, alokasi waktu orang tua, jumlah pendapatan yang harus dibelanjakan untuk anak-anak mereka dan jumlah tambahan pendapatan suatu keluarga yang memiliki anak, jika dibandingkan dengan keluarga yang tidak memiliki anak (Koorman, 2001). Di seluruh wilayah Asia, Angka Fertilitas Total cenderung lebih tinggi pada penduduk kurang mampu. Pada negara berkembang yang mayoritas masyarakatnya kurang mampu, pendidikannya rendah, bekerja pada sektor tradisional serta tingkat kesehatan yang masih rendah, memandang anak dari sudut kepentingan sosial ekonomi, konsep anak dipandang sebagai suatu investasi ekonomi yang nanti diharapkan akan dapat membantu keluarga baik dalam bentuk tenaga kerja cuma-cuma keluarga dan keuangan orang tua dimasa lanjut usia (Michael, 2000). Dalam
analisis
ekonomiAngka
Fertilitas
Totaldibahas
mengapa
permintaan akan anak berkurang bila pendapatan meningkat. Jika pendapatan dan pendidikan meningkat maka semakin banyak waktu (khususnya waktu ibu) yang digunakan untuk merawat anak. Jadi, anak menjadi lebih berkualitas, sehingga hal ini dapat mengurangi angka kelahiran (Mundiharno, 1997). Dalam hal ini, anak dilihat dari 2 segi yaitu segi kegunannya (utility) dan biaya (cost). Kegunaannya ialah memberikan kepuasan, dapat memberikan balas jasa ekonomi atau membantu dalam kegiatan berproduksi serta merupakan sumber yang dapat menghidupi orang tua di masa depan. Sedangkan pengeluaran untuk membesarkan anak adalah biaya dari mempunyai anak tersebut. Produk Domestik Regional Bruto (PDRB) perkapita merupakan salah satu indikator
untuk
mengukur
tingkat
kesejahteraan
penduduk
di
suatu
wilayah.Meningkatkan PDRB perkapita tidak hanya dengan meningkatkan PDRB tetapi juga dengan menekan jumlah penduduk. Di sisi lain kelahiran merupakan salah satu faktor yang dapat menambah jumlah penduduk sehingga menekan jumlah
kelahiran
merupakan
salah
satu
langkah
untuk
meningkatkan
kesejahteraan penduduk(Azantaro, 2015). Dengan demikian PDRB perkapitapada
26
kabupaten/kota termasuk salah satu dari faktor-faktor yang mempengaruhi tinggi rendahnyaAngka Fertilitas Total.
27
“Halaman ini sengaja dikosongkan”
28
BAB 3 METODE PENELITIAN
3.1 Sumber Data Data yang digunakan dalam penelitian ini adalah data sekunder tentang Angka Fertilitas Total dengan unit observasi sebanyak 38 kabupaten/kota di provinsi Jawa Timur tahun 2015 yang diperoleh dari Badan Pusat Statistik Provinsi Jawa Timur dan Perwakilan Badan Kependudukan dan Keluarga Berencana Nasional Provinsi Jawa Timur.
1.2 Variabel Penelitian Variabel prediktor yang digunakan dalam penelitian ini adalah variabel yang diduga akan berpengaruh terhadap Angka Fertilitas Total. Adapun variabel respon dan variabel-variabel prediktor diberikan dalam Tabel 3.1. Tabel 3.1 Variabel Penelitian Variabel
Variabel
Skala Data
Y
Angka Fertilitas Total Persentase jumlah status kawin Rata-rata usia kawin pertama Persentase CPR (Contraception Prevalence Rate) Persentase Unmet need Persentase penduduk berpendidikan tinggi PDRB perkapita
Rasio
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6
Rasio Rasio Rasio Rasio Ordinal Rasio
Adapun definisi operasional dari variabel-variabel penelitian diatas menurut definisi istilah yang diterbitkan oleh BPS dan beberapa literatur adalah sebagai berikut :
29
1. Angka Fertilitas Total adalah jumlah kelahiran hidup laki-laki dan perempuan tiap 1000 perempuan yang hidup hingga akhir masa reproduksinya 2. Persentase jumlah status kawin adalah persentase dari jumlah ikatan perkawinan secara hukum yang dihitung pada suatu kabupaten/kota. 3. Rata-rata usia kawin pertama adalah rata-rata usia pada saat wanita melakukan perkawinan secara hukum dan biologis yang pertama kali pada suatu kabupaten/kota. 4. Persentase CPR (Contraception Prevalence Rate) adalah angka persentase yang menunjukkan banyaknya pasangan usia subur yang sedang memakai kontrasepsi pada saat pencacahan pada suatu kabupaten/kota 5. Persentase Unmet need adalah angka persentase yang menunjukkan kebutuhan keluarga berencana yang tidak terpenuhi atau proporsi wanita usia subur yang menikah atau hidup bersama (seksual aktif) yang tidak ingin mempunyai anak lagi atau yang ingin menjarangkan kelahiran berikutnya dalam jangka waktu minimal 2 tahun tetapi tidak menggunakan alat atau cara kontrasepsi pada suatu kabupaten/kota. 6. Persentase penduduk berpendidikan tinggi adalah persentase penduduk pada suatu kabupaten/kota mempunyai pendidikan D4/S1/S2/S3 yang ditamatkan oleh penduduk 10 tahun keatas. 7. PDRB perkapita adalah kondisi ekonomi penduduk yang diukur berdasarkan pendapatan perkapita perhari pada suatu kabupaten/kota.
3.3 Tahapan Penelitian Tujuan pertama dari penelitian ini adalah untuk menurunkan pengujian hipotesis komponen spline pada regresi nonparametrik campuran spline dan kernel. Untuk menyelesaikan tujuan pertama, dilakukan langkah-langkah sebagai berikut: 1. Mendapatkan pengembangan estimasi model regresi nonparametrik campuran spline truncated dan kernel dengan langkah-langkah: a. Diberikan data berpasangan (𝑥1𝑖 , 𝑥2𝑖 , … , 𝑥𝑞𝑖 , 𝑡𝑖 , 𝑦𝑖 )
30
b. Asumsikan variabel prediktor 𝑥1𝑖 , 𝑥2𝑖 , … , 𝑥𝑞𝑖 dan 𝑡𝑖 dan 𝑦𝑖 mengikuti model regresi nonparametrik multivariabel aditif : 𝑦𝑖 = 𝜇 𝑥1𝑖 , 𝑥2𝑖 , … , 𝑥𝑞𝑖 , 𝑡𝑖 + 𝜀𝑖 𝑞
=
𝑓𝑙 𝑥𝑙𝑖 + 𝑔 𝑡𝑖 + 𝜀𝑖 𝑙=1 q
dimana 𝑦𝑖
merupakan
variabel
respon,
f (x ) l 1
l
l
merupakan
komponen variabel prediktor yang didekati fungsi spline truncated,
g (t ) merupakan variabel prediktor yang didekati dengan fungsi kernel dan error 𝜀𝑖 dengan i = 1,2,…,n saling independen. c. Menyajikan
model
estimasi
campuran
regresi
spline
linier
multivariabel dan kernel pada regresi nonparametrik tersebut dalam bentuk matrik: y Ζ( ) D( )y
d. Mendapatkan estimasi campuran regresi spline truncated dan kernel pada regresi nonparametrik menggunakan metode Ordinary Least Square (OLS), dan diperoleh 𝑞
𝜇 𝑥𝑖 , 𝑡𝑖 =
𝒇𝑙 𝑥𝑙𝑖 + 𝒈 𝑡𝑖 𝑙=1
2. Merancang pengujian hipotesis parameter komponen spline pada model regresi nonparametrik, dengan langkah-langkah sebagai berikut: a. Menuliskan komponen spline : 𝑞
𝑓𝑙 𝑥𝑙 𝑙=1
dalam bentuk matriks : 𝑞
𝑓𝑙 𝑥𝑙 = 𝑿𝜷 𝑙=1
dengan 𝜷 merupakan parameter-parameter komponen spline. b. Merumuskan pengujian hipotesis untuk parameter 𝜷, dengan:
31
β {0 ,11 ,...,1q , 11 , 21 ,..., ( r m) q }
sebagai berikut : H 0 : 0 1 ... p 0
H1 : paling sedikit terdapat satu i 0, i 1, 2,..., p c. Menentukan ruang parameter di bawah populasi d. Menentukan fungsi likelihood di bawah ruang sebagai berikut : 𝐿 e. Memaksimumkan fungsi likelihood di bawah ruang , yaitu : L f. Menentukan ruang parameter di bawah H0 yaitu ω g. Mencari fungsi likelihood di bawah ruang ω, sebagai berikut : L(ω) h. Memaksimumkan fungsi likelihood di bawah ruang ω, yaitu : L(ω) i. Membuat rasio Likelihood : Lratio =
L(ω) L( )
j. Mendapatkan Statistik Test k. Menentukan daerah penolakan hipotesis H0 melalui c dengan c suatu konstanta Tujuan kedua dari penelitian ini adalah mengaplikasikan estimasi parameter dan pengujian hipotesis parameter pada model regresi nonparametrik campuran spline truncated dan kernel terhadap data Angka Fertilitas Total di Provinsi Jawa Timur. Untuk menyelesaikan tujuan kedua, dilakukan langkahlangkah sebagai berikut: 1. Membuat scatter plot antara variabel respon dengan masing-masing variabel prediktor. 2. Menentukan
variabel-variabel
komponen kernel.
32
prediktor
komponen spline
dan
3. Memodelkan data menggunakan estimasi campuran spline dan kernel dengan berbagai knot (satu knot, dua knot dan tiga knot). 4. Memilih titik knot dan bandwitdh optimal dengan metode GCV 5. Menetapkan model terbaik dari nilai GCV minimum. 6. Berdasarkan model yang diperoleh, langkah selanjutnya adalah menguji signifikansi parameter model 7. Melakukan pemeriksaan asumsi residual 8. Menghitung nilai koefisien determinasi (R2 ) dari data. 9. Membuat kesimpulan dari model yang terbentuk.
33
“Halaman ini sengaja dikosongkan”
34
BAB 4 HASIL DAN PEMBAHASAN
4.1. Bentuk Model Regresi Campuran Kernel dan Spline Berdasarkan tujuan penelitian pertama, pada bahasan ini akan dilakukan evaluasi hasil estimasi kurva regresi campuran kernel dan spline.Kajian mengenai regresi
nonparametrikcampuran
(𝑥1𝑖 , 𝑥2𝑖 , … , 𝑥𝑞𝑖 , 𝑡𝑖 , 𝑦𝑖 )
dengan
kerneldan
splinepada
databerpasangan
diasumsikan
hubungan
antar
variabel
prediktor 𝑥1𝑖 , 𝑥2𝑖 , … , 𝑥𝑞𝑖 , 𝑡𝑖 dan variabel respon yi mengikuti model regresi nonparametrik : 𝑦𝑖 = 𝜇 𝑥1𝑖 , 𝑥2𝑖 , … , 𝑥𝑞𝑖 , 𝑡𝑖 + 𝜀𝑖 =
𝑞 𝑙 =1 𝑓𝑙
Bentuk kurva regresi
𝑥𝑙𝑖 + 𝑔 𝑡𝑖 + 𝜀𝑖
(4.1)
(xi , ti ) pada persamaan (4.1) diasumsikan tidak diketahui
dan hanya diasumsikan bahwa kurva tersebut smooth dalam arti kontinyu dan differensiabel. Error random i berdistribusi normal dengan E ( i ) 0 dan
Var ( i ) 2 . Kurva regresi (xi , ti ) diasumsikan bersifat aditif, sehingga dapat ditulis dalam bentuk :
(xi , ti ) f ( x1i ) f ( x2i ) f ( xqi ) g (ti ) q
fl xli g xi
(4.2)
l 1
Bentuk pola hubungan variabel respon yi dengan masing-masing variabel prediktor xi diasumsikan berubah-ubah pada sub-sub interval tertentu, sedangkan bentuk pola hubungan variabel respon yi dengan variabel ti diasumsikan tidak diketahui.Dengan i = 1,2…,n secara teori
q
f x merupakan l 1
l
li
komponen
variabel prediktor yang didekati kurva regresi splinedengan jumlah variabel sebanyakl = 1,2,…,q. g ti merupakan komponen variabel prediktor dengan kurva regresi kernel.
35
Komponen kurva regresi spline f ( xi ) pada persamaan (4.2)didefinisikan oleh : f ( xi ) 0 1 xi m xim (1m) xi 1 m
r
j 0
k 1
m
( r m) xi r
m
j xij k m xi k , m
dengan m m xi k , xi k x i k , xi k 0
Parameter-parameter 0 ,1 ,...,q dan 1 , 2 ,..., r merupakan parameter-parameter yang tidak diketahui, sedangkan λ1, λ2,…λr merupakan titik-titik knot. Komponen kurva regresi kernel g (ti ) didefinisikan oleh : n
gˆ rr tri n 1 Wr i tr yi , i 1
dimana :
Wr i tr
K r tr tri n
n 1 K r tr tri
; K r tr tri
t t K r ri . r r 1
j 1
K merupakan fungsi kernel yang dalam studi ini menggunakan fungsi kernel Nadaraya dan Watson
4.2 Estimasi Kurva Regresi Campuran Kernel dan Spline Sejumlah qvariabel prediktor, kurva regresinya dihampiri dengan regresi spline truncated linier dengantitik knot λ1, λ2,…λrmaka persamaan ditunjukkan dengan model berikut : r m m f ( x1 , x2 ,..., xq ) jl xlj ( k m )l xl kl l 1 j 0 k 1 q
sehingga regresi splinelinier masing-masing variabel prediktor adalah : f1 x1 01 11 x1 ... m1 x1m (1 m)1 x1 11 m
36
(2m)1 x1 21 ... ( r m)1 x1 r1 m
m
f 2 x2 02 12 x2 ... m 2 x2 m (1 m)2 x2 12 m
(2m)2 x2 22 ... ( r m)2 x2 r 2 m
m
f q xq 0q 1q xq ... mq xq m (1m ) q xq 1q m
(2 m) q xq 2q ... ( r m ) q xq rq m
m
Persamaan Spline linier r knot dapat disajikan dalam bentuk matriks :
1 x11 f1 1 x f 12 2 f n nx1 1 x1n
xq1 01 xq 2 11 m xqn mq (1 q ) x1 nx (1 q )
m x11 11 x m 12 11 m x1n 11
x11 r1 (1m )1 m x12 r1 ( r m )1 rx1 m x1n r1 nxr m
x m 21 12 m x2 n 12
(1 m )2 m x2n r 2 nxr ( r m)2 rx1
x m q1 1q m xqn 1q
x
x21 r 2
rq
m
(1 m ) q m xqn rq nxr (r m)q rx1 q1
m
Model matriks di atas dapat disajikan dalam bentuk persamaan sebagai berikut:
f(x) X0 X1 1 1 X2 2 2 Xq q q , 37
(4.3)
Dapat dituliskan dalam bentuk matrik :
X1 1
f(x) X0
1 X q q q
Z(α)β
(4.4)
dimana :
Z X0
X1 1
1 X q q dan, . q
Selanjutnya, dari persamaan (4.2), untuk regresi kernel g (ti ) diberikan fungsi Kernel dengan bentuk : n
gˆ t n 1 W i t yi ,
(4.5)
i 1
dimana :
W i t
K t ti n
n 1 K t ti
; K t ti
t ti K . 1
i 1
Dari persamaan fungsi kernel diatas, berlaku untuk setiap t = t1, t =t2,…, t = tnmaka :
1 n n W i t1 yi i 1 n 1W 1 t1 y1 n 1W n t1 yn gˆ t1 n 1 1 ˆ 1 g t2 n W i t2 yi n W 1 t2 y1 n W n t2 yn i 1 1 1 gˆ tn nx1 n W 1 tn y1 n W n tn yn nx1 n n 1 W t y i n i i 1 nx1
38
n 1W 1 t1 n 1W 2 t1 1 n W 1 t2 n 1W 2 t2 1 1 n W 1 tn n W 2 tn
n 1W n t1 y1 n 1W n t2 y2 n 1W n tn nxn yn nx1
D y
(4.6)
Berdasarkan persamaan (4.4) dan (4.6) maka model regresi campuran spline dan kernel pada persamaan (4.2), diberikan sebagai berikut: q
y fl ( xl ) g t l 1
Z D y
(4.7)
Estimator parameter dapat diperoleh dengan menggunakan metode Ordinary Least Square (OLS) dari persamaan (4.7) diatas yang menghasilkan persamaan :
y Z D y y D y Z I D y Z
(4.8)
Selanjutnya jumlah kuadrat error dengan menggunakan teorema 2.6.1 bisa didapatkan sebagai berikut : n
i 1
2 i
T Q
I D y Z I D y Z T
I D y Z
yT I D 'Z T
T
I D y yT I D Z T Z I D y 2
T
T
T Z Z T
I D y T Z I D y T Z I D y 2
T
T
T Z Z T
I D y 2 T Z 2
T
39
I D y
T Z Z T
(4.9)
Untuk mendapatkan estimator dari parameter , berdasar pada penggunaan Teorema 2.6.2 dan 2.6.3 dilakukan derivatif parsial dari persamaan (4.9) Q terhadap sebagai berikut:
Q
I D y
2
2 T Z I D y T Z Z T
T
T T ˆ 2 Z I D y 2 Z Z
(4.10)
Apabila persamaan (4.10) disamakan dengan nol, maka akan diperoleh persamaan:
Z Z ˆ Z I D y 0, T
T
selanjutnya Persamaan dapat pula ditulis dalam bentuk:
Z Z ˆ Z I D y, T
T
sehingga estimator ˆ diberikan oleh:
ˆ Z Z '
1
Z I D y. '
(4.11)
Persamaan (4.11) dapat diringkas menjadi bentuk persamaan :
ˆ C , y,
(4.12)
dimana : ' C , Z Z
1
Ζ Ι D . T
q
Sehingga didapatkan estimator kurva splineuntuk
f (x ) Z l
l
diberikan
l 1
oleh persamaan : q
fˆ xl Z( )ˆ ( , )
(4.13)
l
l 1
' Z Z Z
1
40
Z I D y, T
Sehingga : q
f (x j
ji
) A , y,
(4.14)
j 1
dengan matrik A adalah : T A , Z Z Z
1
Z I D T
Kemudian dari persamaan (4.6) menunjukkan estimator persamaan kernel : gˆ t D y,
sehingga didapatkan estimator campuran regresi spline linier dan kernel : 𝑞
𝝁(𝒙𝒊 , 𝑡𝑖 ) =
𝒇𝒋 𝒙𝒋𝒊 + 𝑔 𝑡𝑖 𝑗 =1
A , y D y A , D y
B , y,
(4.15)
dimana matrik B adalah : B , A , D .
Estimator campuran regresi Spline dan Kernel ˆ xi , ti sangat bergantung kepada banyak dan letak titik knot (1 , 2 ,..., r )T dan parameter bandwitdh . Untuk memperoleh estimator campuran Kernel dan regresi Spline truncated linier multivariabel yang terbaik perlu dilakukan pemilihan titik knot dan parameter bandwith yang optimal. Metode yang biasa digunakan adalah Generalized Cross Validation (GCV). Fungsi GCV oleh Wahba (1990) adalah : GCV ,
n
n1 || y ˆ , (xi , ti ) ||2 trace I A , D( )
1
2
.
(4.16)
Titik knot optimal opt (1(opt ) , 2(opt ) ,..., r (opt ) )T dan parameter bandwdith optimal opt diperoleh dari optimasi :
G(opt , opt ) Min{G( , )}.
(4.17)
,
41
Titik knot dan parameter bandwith optimal diperoleh dari nilai GCV terkecil.
4.3 Pengujian Hipotesis Diberikan model regresi nonparametrik campuran spline dan kernel dalam bentuk matriks: q
p
j 1
r 1
yi f j ( x ji ) g r (tri ) i , N (0, 2 )
y Z(λ)β D α y ε
I - D α y Z(λ)β ε y I - D α Z(λ)β I - D α ε 1
1
Tβ ε*
4.18
Untuk mengetahui apakah parameter β berpengaruh terhadap model maka dapat dilakukan uji hipotesis dengan menggunakan metode Likelihood ratio Test (LRT) (Srivastava. 1994) Prosedur uji hipotesis untuk parameter β adalah: H 0 : 0 1 ... p 0
H1 : paling sedikit terdapat satu i 0 i 1, 2,..., p Untuk menurunkan uji hipotesis H 0 lawan H1 dapat menggunakan metode LRT. Perhatikan model regresi campuran spline dan kernel, dengan i berdistribusi independen identik N (0, 2 ). q
p
j 1
r 1
yi f j ( x ji ) g r (tri ) i , i 1, 2,..., n yi ( xi , ti ) i , i 1, 2,..., n dengan q
p
j 1
r 1
( xi , ti ) f j ( x ji ) g r (tri ) Karena i N (0, 2 ) maka yi N ( ( xi , ti ), 2 ) fungsi likelihood diberikan oleh:
42
1 1 2 2 L(β, ) (2 ) exp 2 ( yi - ( xi , ti ))2 i 1 2 c n
2
(2 2 ) (2 2 )
1 exp 2 2
n 2
n
( y - ( x , t )) i 1
i
i
2
i
1 exp 2 (y - Tβ)'(y - Tβ) 2
n 2
dengan y ( y1 , y2 ,..., yn ) ' dan β (0 ,11 ,...,1q , 11 , 21 ,..., ( r m) q ) ' Langkah selanjutnya adalah memperhatikan ruang-ruang parameter: Di bawah H ,yaitu ruang {β (0 ,11 ,...,1q , 11 , 21 ,..., ( r m) q ), 2 } Di bawah H 0 ,yaitu ruang {(β 0 ,11 ,...,1q , 11 , 21 ,...,( r m) q , 2 | β = 0)} Pertama diperhatikan ruang Fungsilikelihood diberikan oleh:
n 2
1 exp 2 (y - TβΩ )'(y - Tβ Ω 2
(2 2 )
n 2
1 exp 2 (y '- βΩ ' T ') (y - TβΩ ) 2
(2 )
n 2
1 exp 2 (y'y - y'TβΩ - βΩ'T'y) + βΩ'T ' TβΩ 2
(2 2 )
n 2
1 exp 2 (y'y - (βΩ'T'y)' - βΩ'T'y + βΩ'T'TβΩ 2
L(βΩ , 2 ) (2 2 )
2
n 1 Log L(βΩ , 2 ) log (2 2 ) 2 exp 2 (y'y - 2βΩ'T'y + βΩ'T'TβΩ 2
n 1 log(2 2 ) 2 (y'y - 2βΩ'T'y + βΩ'T'TβΩ ) 2 2
L(βΩ , 2 ) βΩ βΩ 0
n 1 2 log(2 ) 2 (y'y - 2βΩ'T'y + βΩ'T'TβΩ 2 2 1
2 2
(0 - 2T'y + 2T'TβΩ ) 0
43
2T'y + 2T'TβΩ 0
2T'TβΩ = 2T'y T'TβΩ = T'y βˆ Ω (T'T)-1 T'y
L(βΩ , 2 ) 2 2
4.19
n 1 2 log(2 ) 2 (y'y - 2βΩ'T'y + βΩ'T'TβΩ 2 2
n 2 1 4 (y - TβΩ )'(y - TβΩ ) 2 2 2 2
n 2
n
2
1
2
1 2 4
(y - TβΩ )'(y - TβΩ )
(y - TβΩ )'(y - TβΩ ) 0
n 2 (y - TβΩ )'(y - TβΩ ) 0
n 2 (y - TβΩ )'(y - TβΩ )
ˆ 2
(y - TβΩ )'(y - TβΩ ) n
Akibatnya
Max
L(βΩ , ) (2ˆ 2 ) 2
n 2
(2ˆ 2 )
n 2
(2ˆ 2 )
n 2
Selanjutnya diperhatikan ruang
1 exp 2 (y - Tβˆ Ω )'(y - Tβˆ Ω ) 2ˆ (y - Tβˆ )'(y - Tβˆ ) Ω Ω exp ˆ ˆ (y - TβΩ )'(y - Tβ Ω ) 2 n
e
n 2
Fungsilikelihood diberikan oleh:
44
n 2
1 exp 2 (y - Tβ )'(y - Tβ 2
(2 )
n 2
1 exp 2 (y '- β ' T ') (y - Tβ ) 2
(2 2 )
n 2
1 exp 2 (y'y - y'Tβ - β'T'y) + β'T ' Tβ 2
(2 2 )
n 2
1 exp 2 (y'y - (β'T'y)' - β'T'y + β'T'Tβ 2
L(β , 2 ) (2 2 )
2
n 1 Log L(β , 2 ) log (2 2 ) 2 exp 2 (y'y - 2β 'T'y + β'T'Tβ 2
n 1 log(2 2 ) 2 (y'y - 2β 'T'y + β 'T'Tβ ) 2 2
L(β , 2 ) 2 2
n 1 2 log(2 ) 2 (y'y - 2β 'T'y + β'T'Tβ 2 2
n 2 2 2 2
n 2
2
n
1
2
1 4 (y - Tβ )'(y - Tβ ) 2
1 2 4
(y - Tβ )'(y - Tβ )
(y - Tβ )'(y - Tβ ) 0
n 2 (y - Tβ )'(y - Tβ ) 0 n 2 (y - Tβ )'(y - Tβ )
ˆ2
(y - Tβ )'(y - Tβ ) n
Akibatnya
Max
L(β , ) (2ˆ2 ) 2
n 2
1 exp 2 (y - Tβˆ )'(y - Tβˆ ) 2ˆ
45
(y - Tβˆ )'(y - Tβˆ ) exp ˆ ˆ (y - Tβ )'(y - Tβ ) 2 n
n 2 2
(2ˆ )
(2ˆ2 )
n 2
e
n 2
Selanjutnya diperoleh Ratio Likelihood :
Lratio
ω
, 2 )
ω
, 2 )
L(β Max Max L(β
(2ˆ2 )
n 2
(2ˆ 2 )
n 2
(ˆ2 )
n 2
(ˆ )
n 2
ˆ 2 2 ˆ
2
e e
n 2
n 2
n 2
n
ˆ 2 2 2 ˆ n
(y - Tβˆ Ω )'(y - Tβˆ Ω ) 2 n (y - Tβˆ )'(y - Tβˆ ) n n
(y - Tβˆ Ω )'(y - Tβˆ Ω ) 2 (y - Tβˆ )'(y - Tβˆ ) n
Q 2 2 A
4.20
46
Sehingga diperoleh Ratio Likelihood pada persamaan (4.20). Selanjutnya persamaan (4.20) di atas akan dijabarkan seperti di bawah ini: Dengan memperhatikan hipotesis awal : H 0 : 0 1 ... p 0
H1 : paling sedikit terdapat satu i 0, i 1, 2,..., p Dengan
memperhatikan
multiplier
Lagrange
di
mana
β (0 ,11 ,...,1q , 11 , 21 ,..., ( r m) q ) ' , maka derivatif terhadap γ dan β ω diberikan
oleh :
S(βω , γ) A(βω ) 2γ'(βω )
4.21
A(βω ) (y - Tβω )'(y - Tβω )
4.22
Di mana
Dengan konstrain β ω dan 2γ' adalah vektor multiplier Lagrange. Sehingga persamaan (4.22) dapat dijabarkan sebagai berikut:
A(βω ) = y'y - y'Tβω - βω'T'y + βω'T'Tβω = y'y - 2βωT'y + β 'ω T'Tβω
4.23
Dengan mensubstitusikan persamaan (4.23) ke dalam persamaan (4.21), didapatkan persamaan sebagai berikut: S(βω , γ) y'y - 2βωT'y + β 'ω T'Tβω 2γ'(βω )
4.24
Jika persamaan (4.24) diturunkan terhadap β ω menghasilkan persamaan: S(βω , γ) 0 βω y'y - 2βωT'y + β 'ω T'Tβω 2γ'(βω ) 0 βω 2(T'T)-1 βω - 2T'y 2γ 0 βˆ (T'T)-1 T'y (T'T)-1 γ βˆ (T ' T)-1 γ
4.25
kemudian dilanjutkan penurunan terhadap γ menghasilkan
47
S(βω , γ) 0 γ
y'y - 2βωT'y + β 'ω T'Tβω 2γ'(βω ) 0 γ 2βω 0 4.26
βω 0
Dengan menstubstitusikan persamaan (4.26) ke dalam (4.25) akan mendapatkan nilai γ , yaitu
0 βω 0 βˆ (T ' T)-1 γ (T ' T)-1 γ βˆ
γ (T ' T)-1
1
βˆ
Sehingga persamaan (4.24) akan menjadi: βˆ βˆ (T'T)-1 γ
βˆ (T'T)-1 (T ' T)-1 βˆ βˆ (T'T)-1 (T ' T)-1
1
1
βˆ
4.27
βˆ
4.28
Selanjutnya persamaan (4.28) akan disubstitusikan pada persamaaan (4.22) dan diperoleh persamaan sebagai berikut: A (y - Tβˆ )'(y - Tβˆ ) (y - Tβˆ Tβˆ Tβˆ )'(y - Tβˆ Tβˆ Tβˆ ) (y - Tβˆ T(βˆ βˆ ))'(y - Tβˆ T(βˆ βˆ )) ((y - Tβˆ ) ' (βˆ βˆ )'T')(y - Tβˆ T(βˆ βˆ )) (y - Tβˆ ) '(y - Tβˆ ) (y - Tβˆ ) ' T(βˆ βˆ ) (βˆ βˆ )'T'(y - Tβˆ ) (βˆ βˆ )'T'T(βˆ βˆ ) (y - Tβˆ ) '(y - Tβˆ Ω ) (y - T[(T'T)-1 T'y]) ' T(βˆ βˆ ) (βˆ βˆ )'T'(y - T[(T'T)-1 T'y ]) (βˆ βˆ )'T'T(βˆ βˆ )
48
(y - Tβˆ ) '(y - Tβˆ Ω ) (y '- y'T[(T'T)-1 T'])T(βˆ βˆ ) (βˆ βˆ )'T'(y - T[(T'T)-1 T'y ]) (βˆ βˆ )'T'T(βˆ βˆ ) (y - Tβˆ ) '(y - Tβˆ Ω ) (y ' T - y'T[(T'T)-1 T'T])(βˆ βˆ ) (βˆ βˆ )'(T'y - T'T[(T'T)-1 T'y ]) (βˆ βˆ )'T'T(βˆ βˆ ) (y - Tβˆ ) '(y - Tβˆ Ω ) (y ' T - y'T)(βˆ βˆ ) (βˆ βˆ )'(T'y - T'y]) (βˆ βˆ )'T'T(βˆ βˆ )
(y - Tβˆ ) '(y - Tβˆ ) (βˆ βˆ )'T'T(βˆ βˆ )
4.29
Persamaan di atas dapat disederhanakan menjadi:
A= N M Selanjutnya akan dijabarkan persamaan M dengan menstubstitusikan persamaan (4.28) ke dalam (4.29)
M (βˆ βˆ )'T'T(βˆ βˆ )
(T'T)-1 (T ' T)-1
βˆ ' (T ' T)-1
βˆ ' (T ' T)-1
1
1
1
βˆ ' T'T (T'T)-1 (T ' T)-1
(T'T)-1 T'T (T'T)-1 (T ' T)-1
1
1
βˆ
βˆ
βˆ
Sehingga persamaan (4.29) menjadi
A = (y - Tβˆ Ω )'(y - Tβˆ Ω ) + βˆ ' (T ' T)-1
Q2 + Q1
1
βˆ
4.30
di mana:
Q1 = βˆ ' (T ' T)-1
1
βˆ
4.31
Q2 = (y - Tβˆ Ω )'(y - Tβˆ Ω )
4.32
sehingga dengan mensubstitusikan persamaan (4.30) ke dalam persamaan (4.20) maka dapat ditulis sebagai berikut:
49
n
Lratio
Q 2 2 A n
Q2 2 Q1 Q 2
Q 1 1 Q2 1 1 Q1 Q 2
n 2
n
2
4.33
Berdasarkan persamaan(4.33) maka dapat dinyatakan bahwa statistik uji yang dapat disimbolkan sebagai F dari hipotesis H 0 : β = 0 lawan H1 : β 0 adalah: 𝑄 /𝑑
𝐹 = 𝑄1 /𝑑 1 2
4.34
2
Mendapatkan Distribusi Statistik Uji Berdasarkan Teorema 2.6.4 pada Rencher
dan Schaalje (2007)
menyatakan bahwa Jika𝒚 ~𝑁(𝝁, 𝜎 2 𝑰)dan Amatriks simetris dengan rank r, maka 𝒚𝑨𝒚/𝜎 2 ~ 2 (𝑟, 𝝁𝑨𝝁/2𝜎 2 ) jika dan hanya jika jika Aadalah idempotent. Langkah pertama adalah menjabarkan Q1 pada persamaan (4.30) dengan mensubstitusikan βˆ pada persamaan (4.19) sebagai berikut:
Q1 = β'Ω (T'T)-1
-1
βΩ
= (T'T)-1 T'y ' (T ' T)-1
1
(T'T)-1 T'y
= y'T(T'T)-1 T ' T(T'T)-1 T'y 4.35
= y'T(T'T)-1 T'y Selanjutnya akan dibuktikan bahwa Aadalah idempoten, yaitu A2=A
A 2 = y'T(T'T)-1 T'y
2
50
= y'T(T'T)-1 T'y y'T(T'T)-1 T'y
= y'T(T'T)-1 T'y
=A Terbukti bahwa matriks A adalah idempotent. Sehingga berdasarkan Teorema 5.5 dapat dinyatakan bahwa 𝑸𝟏 /𝜎 2 ~ 2 (𝑟1 , 𝝁𝑨𝝁/2𝜎 2 ) di mana
rank (A) r1 1 (r m)q dan μAμ (Tβ)'T(T'T)-1 T'Tβ 2 2 2 2
4.36
Dengan mensubstitusikan persamaan (4.27) ke dalam persamaan (4.36) maka didapatkan:
μAμ 0 2 2 Sehingga 𝑸𝟏 /𝜎 2 ~ 2 (𝑟1 ) Langkah kedua yaitu menjabarkan Q 2 pada persamaan (4.32) sebagai berikut:
Q2 = (y - TβΩ )'(y - TβΩ )
= (y '- β'T')(y - TβΩ ) = y'y - y'TβΩ - β'ΩT'y + β'ΩT'TβΩ = y'y - 2β'ΩT'y + β'ΩT'TβΩ
4.37
Dengan mensubstitusikan βˆ pada persamaan (4.19) ke dalam persamaan (4.37) maka diperoleh:
Q2 = y'y - 2β'ΩT'y + β'ΩT'TβΩ
= y'y - 2 (T'T)-1 T'y ' T'y + (T'T)-1 T'y ' T'T (T'T)-1 T'y
51
= y'Iy - 2y'T(T'T)-1 T'y + y'T(T'T)-1 T'T (T'T)-1 T'y
= y'Iy - 2y'T(T'T)-1 T'y + y'T(T'T)-1 T'y = y'Iy y'T(T'T)-1 T'y
= y' I T(T'T)-1 T' y
4.38
= y'Ay
4.39
Dari persamaan (4.38) dan (4.39) dapat dinyatakan bahwa
A = I T(T'T)-1 T' Selanjutnya akan dibuktikan bahwa matriks A adalah idempotentsebagai berikut
A2 = I T(T'T)-1 T'
2
= I T(T'T)-1 T' I T(T'T)-1 T'
= I - 2T(T'T)-1 T' + T(T'T)-1 T'T(T'T)-1 T' = I - 2T(T'T)-1 T' + T(T'T)-1 T'
= I - T(T'T)-1 T' 4.40
=A
Dari persamaan (4.40) terbukti bahwa matriks A adalah matriks idempotent. Sehingga berdasarkan teorema 5.5 dapat dinyatakan bahwa 𝑸𝟐 /𝜎 2 ~ 2 (𝑟2 , 𝝁𝑨𝝁/2𝜎 2 ) di mana
rank (A) r2 n (1 (r m)q) 1 dan μAμ (Tβ)'[I - T(T'T)-1 T']Tβ 2 2 2 2
β'T'Tβ β ' T ' T(T'T)-1 T'Tβ 2 2
β'T'Tβ β ' T ' Tβ 2 2
0
52
Sehingga 𝑸𝟐 /𝜎 2 ~ 2 (𝑟2 ) Langkah selanjutnya adalah membuktikan bahwa Q1 dan Q 2 independent. Di mana berdasarkan Teorema 2.6.5 pada Rencher dan Schaalje (2007) menyatakan bahwa Jika 𝒚 ~𝑁(𝝁, 𝜎 2 𝑰) maka yAy dan yBy adalah independent jika dan hanya jika AB 0 (atau ekuivalen, BA 0 ) Sesuai dengan persamaan (4.34) dan (4.36) maka didapatkan
A = T(T'T)-1 T' dan
B I T(T'T)-1 T' Sehingga
AB = T(T'T)-1 T' I T(T'T)-1 T'
= T(T'T)-1 T' T(T'T)-1 T'T(T'T)-1 T' = T(T'T)-1 T' T(T'T)-1 T'
0 Karena AB 0 , maka dapat dikatakan bahwa Q1 dan Q 2 independen Dari penjabaran di atas didapatkan hasil sebagai berikut: 1. 𝑸𝟏 /𝜎 2 ~ 2 (1 + 𝑚 + 𝑟 𝑞) 2. 𝑸𝟐 /𝜎 2 ~ 2 𝑛 − (1 + 𝑚 + 𝑟 𝑞 ) 3. Q1 dan Q 2 independen Sehingga dapat dituliskan sebagai berikut:
Q1 / 2 1 (m r )q F Q2 / 2 n (1 (m r )q) =
𝑸𝟏 /(1 + 𝑚 + 𝑟 𝑞) ~𝑭 𝑸𝟐 / 𝑛 − (1 + 𝑚 + 𝑟 𝑞 )
53
1+ 𝑚 +𝑟 𝑞 , 𝑛 −(1+ 𝑚 +𝑟 𝑞 )
=
𝑸𝟏 ~𝑭 𝑸𝟐
𝑑 1 ,𝑑 2
Daerah penolakan Lratio k di mana Lratio k 1 dan k adalah konstanta tertentu sehingga
Lratio k L(ˆ ) k ˆ) L ( 1 1 Q1 Q2
n
2 k
Q1 1 Q2
n 2
k
2 Q1 n 1 k Q2 2 Q1 k n 1 Q2
2 Q1 / d1 k n 1 Q2 / d2
d 2 n2 F k 1 d1 d 2 n2 F k di mana k k 1 . d1 *
*
Daerah kritis untuk uji H 0 : β = 0 lawan H1 : β 0 adalah
c {( x1 , x2 ,..., xn ); F k *} Jika diberikan taraf signifikansi
maka
P menolak H 0 | H 0 benar Q1 / d1 F (d1 , d 2 ) Q2 / d2
P F k * | β = 0 dengan F
54
4.4 Aplikasi Model Campuran Spline dan Kernel pada Angka Fertilitas Total di Jawa Timur Unit observasi yang digunakan dalam penelitian ini adalah 38 kabuapten/kota yang ada di Provinsi Jawa Timur. Variabel respon yang digunakan adalah Angka Fertilitas Total (Y), sedangkan variabel prediktor adalah Persentase jumlah status kawin (X1), Rata-rata usia kawin pertama (X2), Persentase CPR (Contraception Prevalence Rate) (X3), Persentase unmet need (X4), Persentase penduduk berpendidikan tinggi (X5), dan PDRB perkapita(X6).
4.4.1 Analisis Deskriptif Sebelum proses permodelan Regresi Campuran Kernel dan Spline Truncated Multivariabel pada data Angka Fertilitas Total di Provinsi Jawa Timur, perlu dilihat statistik deskriptif dari data masing-masing variabel seperti ditunjukkan pada Tabel 4.1. Tabel 4.1 Statistik Deskriptif Variabel Respon dan Variabel Prediktor Variabel Jumlah Y X1 X2 X3 X4 X5 X6
38 38 38 38 38 38 38
Min
Max
Range
Mean
1,516 23,636 18,320 41,75 6,871 2,470 14565
2,447 32,987 21,560 73,92 31,767 14,200 348015
0,931 9,351 3,240 32,18 24,896 11,730 333450
2,060 27,574 19,884 63,33 16,006 5,573 43808
Standard Deviasi 0,212 1,914 0,825 7,03 5,012 3,369 56304
Statistik deskriptif yang ditampilakan pada Tabel 4.1 digunakan untuk inisiasi titik-titik knot dan bandwidth. Untuk melihat pola hubungan antara variabel respon dengan masing-masing variabel prediktor dapat dilihat dari grafik scatterplot. Hasil scatterplot untuk masing-masing variabel respon dan variabel prediktor adalah sebagai berikut :
55
Scatterplot of Y vs X1 2,50
Y
2,25
2,00
1,75
1,50 24
25
26
27
28
29
30
31
32
33
X1
Gambar 4.1Scatterplot antara Angka Fertilitas Total (Y) dengan Persentase jumlah status kawin (X1).
Dari gambar 4.1 tampak pola hubungan antara Angka Fertilitas Total (Y) dengan Persentase jumlah status kawin (X1) tidak ada kecenderungan membentuk pola tertentu. Angka Fertilitas Total(Y) yang tinggi tidak diperoleh dari persentase jumlah status kawin (X1) yang tinggi atau yang rendah. Pola hubungan yang berubah-
ubahpada sub-sub interval tertentu dapat didekati dengan regresi spline. Scatterplot of Y vs X2 2,50
Y
2,25
2,00
1,75
1,50 18
19
20
21
22
X2
Gambar 4.2 Scatterplot antara Angka Fertilitas Total (Y) dengan Rata-rata usia kawin pertama (X2).
Dari gambar 4.2 tampak pola hubungan antara Angka Fertilitas Total (Y) dengan Rata-rata usia kawin pertama (X2) tidak ada kecenderungan membentuk pola tertentu. Angka Fertilitas Total(Y) tertinggi ternyata tidak diperoleh dari Rata-rata usia kawin pertama (X2) tertinggi atau terendah. Pola hubungan yang berubah-ubahpada
sub-sub interval tertentu dapat didekati dengan regresi spline. 56
Scatterplot of Y vs X3 2,50
Y
2,25
2,00
1,75
1,50 40
45
50
55
60
65
70
75
X3
Gambar 4.3Scatterplot antara Angka Fertilitas Total (Y) dengan Persentase CPR (X3).
Dari gambar 4.3 tampak pola hubungan antara Angka Fertilitas Total (Y) dengan Persentase CPR (X3) tidak ada kecenderungan membentuk pola tertentu. Angka Fertilitas Total(Y) tertinggi ternyata tidak diperoleh dari Presentase CPR (X2) tertinggi atau terendah. Pola hubungan yang berubah-ubahpada sub-sub interval tertentu
dapat didekati dengan regresi spline. Scatterplot of Y vs X4 2,50
Y
2,25
2,00
1,75
1,50 10
15
20
25
30
35
X4
Gambar 4.4 Scatterplot antara Angka Fertilitas Total (Y) dengan Persentase unmet need (X4).
Dari gambar 4.4 tampak pola hubungan antara Angka Fertilitas Total (Y) dengan Persentase unmet need (X4) tidak ada kecenderungan membentuk pola tertentu. Angka Fertilitas Total (Y) tertinggi ternyata tidak diperoleh dari Presentase unmet need (X4) tertinggi atau terendah. Pola hubungan yang berubah-ubahpada sub-sub interval
tertentu dapat didekati dengan regresi spline.
57
Scatterplot of Y vs X5 2,50
Y
2,25
2,00
1,75
1,50 2
4
6
8
10
12
14
X5
Gambar 4.5 Scatterplot antara Angka Fertilitas Total (Y) dengan Persentase penduduk berpendidikan tinggi (X5).
Dari gambar 4.5 tampak pola hubungan antara Angka Fertilitas Total (Y) dengan Persentase penduduk berpendidikan tinggi (X5) tidak ada kecenderungan membentuk pola tertentu. Angka Fertilitas Total (Y) tertinggi ternyata tidak diperoleh dari Presentase penduduk berpendidikan tinggi (X5)
tertinggi atau terendah. Pola
hubungan yang berubah-ubahpada sub-sub interval tertentu dapat didekati dengan regresi spline. Scatterplot of Y vs X6 2,50
Y
2,25
2,00
1,75
1,50 0
50000
100000
150000
200000
250000
300000
350000
X6
Gambar 4.6 Scatterplot antara Angka Fertilitas Total (Y) dengan PDRB perkapita (X6).
Dari gambar 4.6 tampak hubungan antara Angka Fertilitas Total (Y) dengan PDRB perkapita (X6) tidak memiliki suatu pola yang jelas. Pola hubungan yang tidak jelas dapat didekati dengan regresi kernel.
58
Dilihat dari gambar scatter plot di atas maka Model Estimasi Campuran Kernel dan Spline merupakan salah satu metode yang tepat, karena terdapat pola hubungan variabel respon dan variabel prediktor yang tidak jelas dan juga ada pola hubungan variabel respon dan variabel prediktor yang cenderung berubah pada sub-sub interval tertentu. Variabel-variabel prediktor Persentase jumlah status kawin (X1), Rata-rata usia kawin pertama (X2), Persentase CPR (Contraception Prevalence Rate) (X3), Persentase unmet need (X4), Persentase penduduk berpendidikan tinggi (X5) akan didekati dengan regresi spline linier truncated, sedangkan variabel dan PDRB perkapita (X6) akan didekati dengan fungsi kernel yang notasi penulisan dirubah dari X 6 menjadi t.Model Estimasi Campuran Kernel dan Regresi Spline akan dipilih dengan melihat nilai GCV terkecil dari beberapa model yang menggunakan jumlah titik knot dan bandwidth yang berbeda. Penelitian ini mengunakan titik knot dengan jumlah yang sama pada setiap variabel prediktor antara satu sampai dengan tiga titik knot. Proses perbandingan akan ditampilkan sepuluh posisi titik knot yang berbeda pada masing-masing bagian yang mendekati titik knot dan bandwidthoptimum. Sehingga setelah pengolahan data akan didapatkan nilai GCV dan MSE yang terkecil, R-Square yang maksimal, titik knot dan bandwidth yang optimal serta nilai parameter dari model terbaik.
4.4.2 Model Regresi Campuran Nonparametrik Kernel dan Spline Pemilihan Model Regresi Campuran Kernel dan Spline terbaik diperoleh dari penentuan titik-titik knot dan bandwidth yang optimal. Penentuan titik knot dan dan bandwidth yang optimal didapatkan dari membandingkan nilai GCV beberapa titik knot dan bandwidth, dimulai dari satu titik knot, dua titik knot dan tiga titik knot. Titik knot dan bandwidth yang optimal ditunjukan dari nilai GCV yang terkecil.
4.4.2.1 Pemilihan Titik Knot dan Bandwidth Optimal dengan Satu Titik Knot Pemilihan titik knot dan bandwidth yang optimal diawali dengan menggunakan satu titik knot pada masing-masing variabel prediktor spline dan
59
bandwidth secara bersama-sama. Berikut ini adalah model Regresi Campuran Kernel dan Spline dengan satu titik knot. yˆ ˆ0* ˆ11 x1i ˆ12 x2i ˆ13 x3i ˆ14 x4i ˆ11 x1i 11
ˆ12 x2i 12 ˆ13 x3i 13 ˆ14 x4i 14 K t t i yi ˆ15 x5i 15 n 1 n 1 i 1 n K t t j j 1 n
Nilai GCV yang dihasilkan dengan menggunakan satu titik knot ditunjukkan pada Tabel 4.2.
Tabel 4.2 Nilai GCV dengan Satu Titik Knot Knot
No 1 2 3 4 5 6 7 8 9 10
x1
x2
x3
x4
x5
24,785 24,976 24,212 25,548 25,357 25,167 25,739 24,022 25,930 24,403
18,717 18,783 18,518 18,981 18,915 18,849 19,047 18,452 19,113 18,584
45,689 46,346 43,720 48,315 47,659 47,002 48,972 43,063 49,628 44,376
9,919 10,427 8,394 11,952 11,443 10,935 12,460 7,886 12,968 8,903
3,906 4,146 3,188 4,864 4,624 4,385 5,103 2,949 5,343 3,428
Bandwidth
GCV
0,021408 0,021751 0,023422 0,023413 0,023066 0,022281 0,023201 0,023824 0,0234 0,02419
0,047699 0,048224 0,048288 0,048298 0,048299 0,048437 0,048447 0,048447 0,04857 0,048588
Berdasarkan Tabel 4.2 dapat diketahui bahwa nilai GCV minimum yang diperoleh dengan satu titik knot yaitu sebesar 0,047699, dimana titik knot optimumnya pada masing-masing variabel prediktor yaitu sebagai berikut. x1=24,785; x2 =18,717; x3 = 45,689; x4 =9,919; x5=3,906; α= 0,021408
4.4.2.2Pemilihan Titik Knot dan Bandwitdth Optimal dengan Dua Titik Knot Setelah dilakukan pendekatan Regresi Campuran Kernel dan Spline dengan satu titik knot, selanjutnya dilakukan pendekatan dengan dua titik knot.Regresi Campuran Kernel dan Spline dengan dua titik knot adalah sebagai berikut.
60
yˆ ˆ0* ˆ11 x1i ˆ12 x2i ˆ13 x3i ˆ14 x4i ˆ15 x5i ˆ11 x1i 11
ˆ21 x1i 21 ˆ12 x2i 12 ˆ22 x2i 22 ˆ13 x3i 13 ˆ23 x3i 23 ˆ14 x4i 14 ˆ24 x4i 24 ˆ15 x5i 15 ˆ25 x5i 25 K t t i yi n 1 n i 1 1 n K t t j j 1 n
Nilai GCV dari pemodelan dengan menggunakan dua titik knot ditunjukkan oleh Tabel 4.3. Tabel 4.3 Nilai GCV dengan Dua Titik Knot Knot
No 1 2 3 4 5 6 7 8 9 10
x1
x2
x3
x4
x5
27,075 28,983 27,075 29,174 27,075 28,983 27,456 27,647 27,266 32,608 27,075 29,364 27,075 28,983 27,456 27,838 27,075 28,983 27,075 29,555
19,510 20,171 19,510 20,238 19,510 20,171 19,642 19,709 19,576 21,428 19,510 20,304 19,510 20,171 19,642 19,775 19,510 20,171 19,510 20,370
53,568 60,133 53,568 60,789 53,568 60,133 54,881 55,537 54,224 72,607 53,568 61,446 53,568 60,133 54,881 56,194 53,568 60,133 53,568 62,102
16,017 21,099 16,017 21,607 16,017 21,099 17,033 17,541 16,525 30,754 16,017 22,115 16,017 21,099 17,033 18,050 16,017 21,099 16,017 22,623
6,779 9,173 6,779 9,412 6,779 9,173 7,258 7,497 7,018 13,721 6,779 9,652 6,779 9,173 7,258 7,737 6,779 9,173 6,779 9,891
Bandwidth
GCV
0,015574
0,024329
0,015521
0,025333
0,015675
0,025431
0,017704
0,025563
0,020485
0,025629
0,015668
0,025766
0,015891
0,025851
0,016713
0,025932
0,016122
0,026046
0,016016
0,026058
Tabel 4.3memberikan beberapa alternatif nilai knot untuk masing-masing variabel prediktor. Nilai GCV minimum yang diperoleh dengan 2 titik knot yaitu
61
0,024329. Titik-titik knot pada tiap variabel prediktor yang menghasilkan nilai GCV minimum yaitu sebagai berikut. Pada variabel x11= 27,075 dan x12 = 28,983 Pada variabel x21= 19,510 dan x22 = 20,171 Pada variabel x31= 53,568 dan x32= 60,133 Pada variabel x41= 16,017dan x42 = 21,099 Pada variabel x51= 6,779dan x52 = 9,173 Bandwidth α=0,015574
4.4.2.3 Pemilihan Titik Knot dan Bandwitdth Optimal dengan Tiga Titik Knot Setelah dilakukan pendekatan Regresi Campuran Kernel dan Spline dengan satu titik knot dan dua knot, selanjutnya dilakukan pendekatan dengan tiga titik knot. Regresi Campuran Kernel dan Spline dengan tigatitik knot adalah sebagai berikut: yˆ ˆ0* ˆ11 x1i ˆ12 x2i ˆ13 x3i ˆ14 x4i ˆ15 x5i ˆ11 x1i 11
ˆ21 x1i 21 ˆ31 x1i 31 ˆ12 x2i 12 ˆ22 x2i 22 ˆ32 x2i 32 ˆ13 x3i 13 ˆ23 x3i 23 ˆ33 x3i 33 ˆ14 x4i 14 ˆ24 x4i 24 ˆ34 x4i 34 ˆ15 x5i 15 K t t i yi ˆ25 x5i 25 ˆ35 x5i 35 n 1 n 1 i 1 n K t t j j 1 n
Berikut ini merupakan nilai GCV yang didapatkan dengan pemodelan menggunakan tiga titik knot.
62
Tabel 4.4 Nilai GCV dengan Tiga Titik Knot Knot
No 1
2
3
4
5
6 7
8
9
10
x1
x2
x3
x4
x5
25,930 26,502 27,647 25,739 29,364 30,510 25,930 26,120 31,272 25,930 26,502 27,647 25,930 26,502 27,647 25,930 26,502 27,647 25,930 26,693 27,647 25,930 26,502 27,647 26,502 28,029 29,174 25,739 28,364 30,510
19,113 19,311 19,708 19,047 20,303 20,100 19,113 19,180 20,964 19,113 19,311 19,701 19,113 19,311 19,701 19,113 19,311 19,709 19,113 19,377 19,709 19,113 19,311 19,708 19,311 19,840 20,238 19,047 20,304 20,700
49,628 51,598 55,537 48,971 61,446 65,385 49,628 50,285 68,011 49,628 51,598 55,537 49,628 51,598 55,537 49,628 51,598 55,537 49,628 52,254 55,537 49,628 51,598 55,537 51,598 56,850 60,790 48,971 61,446 65,385
12,968 14,492 17,541 12,460 22,115 25,163 12,967 13,476 27,196 12,968 14,492 17,541 12,968 14,492 17,541 12,968 14,492 17,541 12,968 15,001 17,541 12,968 14,492 17,541 14,492 18,558 21,606 12,460 22,115 25,164
5,343 6,060 7,497 5,103 9,651 11,088 5,342 5,582 12,045 5,343 6,061 7,497 5,342 6,061 7,497 5,342 6,061 7,497 5,342 6,3002 7,497 5,342 6,061 7,497 6,061 7,976 9,412 5,103 9,652 11,088
Bandwidth
GCV
0.016065
0.014988
0.013001
0.015250
0.018799
0.015308
0.016967
0.015378
0.017296
0.015526
0.017521
0.015592
0.013971
0.015655
0.017826
0.015660
0.013173
0.015698
0.013572
0.015701
Tabel 4.4 menunjukkan bahwa nilai GCV minimum setiap kombinasi yang didapatkan
apabila
menggunakan
tiga
titik
knot
sama
besar
sebesar0.014988. Titik-titik knot optimal tersebut diberikan sebagai berikut. Pada variabel x11=25,930; x12=26,502dan x13 =27,647 Pada variabel x21= 19,113; x22 = 19,708 dan x23 = 19,708 Pada variabel x31= 49,628; x32= 51,598 dan x33 = 55,537 Pada variabel x41= 12,968; x42 = 14,492 dan x43 = 17,541
63
yaitu
Pada variabel x51= 5,343; x52 = 6,060 dan x53 = 7,497 Bandwidthα=0.016065
Perbandingan nilai GCV minimum yang diperoleh dengan menggunakan satu knot, dua knot dan tiga knot ditunjukkan oleh Tabel 4.5 Tabel 4.5 Perbandingan Nilai GCV Minimum Model 1 Knot 2 Knot 3 Knot
GCV 0,047699 0,024329 0.014988
Berdasarkan Tabel 4.5 terlihat bahwa model Regresi Campuran Kernel dan Spline yang memiliki GCV minimum yaitu model regresi dengan tiga titik knot dengan nilai GCV sebesar 0,014988. Hal ini menunjukkan bahwa model Regresi Campuran Kernel dan Spline terbaik yaitu model regresi dengan tiga titik knot sehingga nilai yang akan digunakan pada pemodelan Angka Fertilitas Total di Jawa Timur adalah nilai titik knot optimal dari GCV dengan tiga titik knot.
4.4.3 Penaksiran Parameter Model Regresi Campuran Kernel dan Spline Model Regresi Campuran Kernel dan Spline terbaik diperoleh dengan menggunakan titik knot yang optimal. Model Regresi Campuran Kernel dan Spline yang terbentuk yaitu: yˆ ˆ0* ˆ11 x1i ˆ12 x2i ˆ13 x3i ˆ14 x4i ˆ15 x5i ˆ11 x1i 11
ˆ21 x1i 21 ˆ31 x1i 31 ˆ12 x2i 12 ˆ22 x2i 22 ˆ32 x2i 32 ˆ13 x3i 13 ˆ23 x3i 23 ˆ33 x3i 33 ˆ14 x4i 14 ˆ24 x4i 24 ˆ34 x4i 34 ˆ15 x5i 15 K t t i yi ˆ25 x5i 25 ˆ35 x5i 35 n 1 n i 1 1 n K t t j j 1 n
64
Estimasi parameter regresi dapat dilihat pada Tabel 4.6
Tabel 4.6 Estimasi Parameter Variabel
x1
x2
x3
x4
x5
bandwidth
Parameter
Estimasi
0
0,034475
11
0,038198
11
-0,109970
21
0,031121
31
-0,005532
12
-0,033838
12
-0,186775
22
0,156403
32
-0,006857
13
0,572908
13
-0,312316
23
-0,084988
33
-0,168729
14
0,141142
14
-0,009075
24
-0,003382
34
0,012925
15
-0,011474
15
-0,057044
25
0,089060
35
-0,003103
α
0.016065
Hasil estimasi parameter pada Tabel 4.6membentuk persamaan model Regresi Campuran Kernel dan Spline dengan tiga titik knot sebagai berikut :
65
yˆ 0, 03475 0, 038198 x1 0,109970( x1 25,930) 0, 031121( x1 26,502) 0, 005532( x1 27, 647) 0, 033838 x2 0,186775( x2 19,113) 0,156403( x2 19,311) 0, 006857( x2 19, 708) 0,572908 x3 0,312316 ( x3 49, 628) 0, 084988( x3 51,598) 0,168729( x3 55,537) 0,141142 x4 0, 009075( x4 12,968) 0, 003382( x4 14, 492) 0, 012925( x4 17,541) 0, 011474 x5 0, 057044( x5 5,343) 1, 206009( x5 6, 060) 0, 089060( x5 7, 497) 1 t ti K 1 0.016065 0.016065 y 1 38 i 1 1 38 t ti 38 i 1 0.016065 0.016065 38
Nilai R2 dari model ini sebesar 92,54% dengan nilai MSEsebesar 0,007792609. Ini berarti bahwa 92,54% Angka Fertilitas Total mampu dijelaskan oleh variabel Persentase jumlah status kawin, Rata-rata usia kawin pertama, Persentase CPR (Contraception Prevalence Rate), Persentase unmet need, Persentase penduduk berpendidikan tinggi, dan PDRB perkapita dalam Model Regresi
Campuran
Kernel
dan
Spline
dengan
tiga
titik
knot
dan
bandwidthoptimum.
4.4.4 Interpretasi Model Regresi Campuran Spline dan Kernel Model untuk pola data yang mengikuti kurva spline dapat iinterpretasikan, sementara itu, untuk pola data yang mengikuti kurva kernel tidak dapat diinterpretasikan. Berikut ini adalah model masing-masing kelompok data dan interpretasinya: 1) Model untuk variabel Persentase jumlah status kawin Dengan mengasumsikan data selain persentase jumlah status kawin adalah 𝑐1 , maka diperoleh model umumnya :
66
yˆ 0, 038198 x1 0,109970( x1 25,930) 0, 031121( x1 26,502) 0, 005532( x1 27, 647) c1 di mana:
c1 0, 03475 0, 033838 x2 0,186775( x2 19,113) 0,156403( x2 19,311) 0, 006857( x2 19, 708) 0,572908 x3 0,312316 ( x3 49, 628) 0, 084988( x3 51,598) 0,168729( x3 55,537) 0,141142 x4 0, 009075( x4 12,968) 0, 003382( x4 14, 492) 0, 012925( x4 17,541) 0, 011474 x5 0, 057044( x5 5,343) 1, 206009( x5 6, 060) 0, 089060( x5 7, 497) 1 t ti K 1 0.016065 0.016065 y 1 38 i 1 1 38 t ti 38 i 1 0.016065 0.016065 38
Untuk interpretasi model ini digunakan fungsi seperti berikut :
0, 038198 x1 c1 , 2,851 0, 071772 x c , 1 1 yˆ 2, 026 0, 040651x1 c1 , 2,179 0, 046183 x1 c1 ,
x1 25,930 25,930 x1 26,502 26,502 x1 27, 647 x1 27, 647
a. Pada daerah Kab Bangkalan, Kab Gresik, Kota Pasuruan, Kota Probolinggo, Kab Lamongan, Kab Lumajang, Kab Pamekasan, dan Kab Sampang di mana mempunyai persentase jumlah status kawin kurang dari sama dengan 25,930, dapat dilihat bahwa hubungan antara persentase jumlah status kawin dengan Angka Fertilitas Total adalah positif. Jika jumlah status kawin naik 1% maka Angka Fertilitas Total naik sebesar 0,038198 b. Pada daerah Kota Batu, Kota Kediri, Kota Mojokerto di mana persentase jumlah status kawin berada di rentang nilai lebih dari 25,930 hingga kurang dari sama dengan 26,502, dapat dilihat bahwa hubungan antara persentase jumlah status kawin dengan Angka Fertilitas Total adalah negatif. Jika jumlah status kawin naik 1% maka Angka Fertilitas Total turun perlahan sebesar 0,071772. Pada data di atas, Kota Mojokerto mempunyai Angka
67
Fertilitas Total yang paling kecil di antara Kota Kediri dan Kota Batu yakni sebesar 1,87 di mana Kota Batu mempunyai Angka Fertilitas Total sebesar 1,96 dan Kota Kediri sebesar 1,94. Dalam hal ini, berdasarkan data publikasi Badan Pusat Statistik, Kota Mojokerto mempunyai penduduk dengan persentase KB yang paling besar di antara Kota Batu, Kota Kediri, yakni sebesar 64,12% di mana Kota Batu dan Kota Kediri masing-masing sebesar 61,12% dan 61,22% c. Pada daerah Kab Bojonegoro, Kab Jombang, Kab Kediri, Kota Blitar, Kota Malang, Kab Malang, Kab Mojokerto, Kab Pasuruan Kab Sidoarjo dan Kab Tuban di mana mempunyai persentase jumlah status kawin berada di rentang nilai lebih dari 26,502 hingga kurang dari sama dengan 27,647, dapat dilihat bahwa hubungan antara persentase jumlah status kawin dengan Angka Fertilitas Total adalah negatif. Jika jumlah status kawin naik 1% maka Angka Fertilitas Total turun perlahan sebesar 0,040651. Dalam hal ini, daerah dengan nilai Angka Fertilitas Total di atas nilai 2 (cukup tinggi) adalah Kab Jombang, Kab Kediri, Kota Blitar, Kab Malang, dan Kab Mojokerto cenderung mempunyai persentase penduduk yang menggunakan KB cukup kecil. Daerah dengan nilai Angka Fertilitas Total di kurang dari sama dengan 2 (cukup rendah) adalah Kab Bojonegoro, Kota Malang, Kab Pasuruan Kab Sidoarjo dan Kab Tuban cenderung mempunyai persentase penduduk yang menggunakan KB cukup besar. d. Pada daerah Kab Banyuwangi, Kab Blitar, Kab Bondowoso, Kab Jember, Kota Madiun, Kota Surabaya, Kab Lumajang, Kab Madiun, Kab Magetan, Kab Nganjuk, Kab Ngawi, Kab Pacitan, Kab Ponorogo, Kab Probolinggo, Kab Situbondo, Kab Sumenep, Kab Trenggalek, Kab Tulungagung di mana mempunyai persentase jumlah status kawin lebih dari 25,930, dapat dilihat bahwa hubungan antara persentase jumlah status kawin dengan Angka Fertilitas Total adalah negatif. Jika jumlah status kawin naik 1% maka Angka Fertilitas Total turun perlahan sebesar 0,046183. Dalam hal ini, daerah dengan nilai Angka Fertilitas Total di atas nilai 2 (cukup tinggi) adalah Kab Banyuwangi, Kab Blitar, Kab Bondowoso, Kab Jember, Kota
68
Madiun, Kota Surabaya, Kab Madiun, Kab Magetan, Kab Nganjuk, Kab Ngawi, Kab Pacitan, Kab Ponorogo, Kab Probolinggo dan Kab Tulungagung dikarenakan cenderung mempunyai persentase penduduk yang menggunakan KB cukup kecil. Kab Blitar merupakan daerah dengan nilai Angka Fertilitas tertinggi, yakni sebesar 2,42 dan mempunyai persentase penduduk yang menggunakan KB sebesar 60,25%. Daerah dengan nilai Angka Fertilitas di kurang dari sama dengan 2 (cukup rendah) adalah Kab Lumajang, Kab Situbondo, Kab Sumenep, Kab Trenggalek dikarenakan cenderung mempunyai persentase penduduk yang menggunakan KB cukup besar. Kota Sumenep merupakan daerah dengan nilai Angka Fertilitas terendah, yakni sebesar 1,52 dan mempunyai persentase penduduk yang menggunakan KB sebesar 68,91%.
2) Model untuk variabel Rata-rata usia kawin pertama Dengan mengasumsikan data selain rata-rata usia kawin pertama adalah 𝑐2 , maka diperoleh model umumnya :
yˆ 0, 033838 x2 0,186775( x2 19,113) 0,156403( x2 19,311) 0, 006857( x2 19, 708) c2 Untuk interpretasi model ini digunakan fungsi seperti berikut :
0, 033838 x2 c2 , 3,570 0, 220613 x c , 2 2 yˆ 0,550 0, 06421x2 c2 , 0, 415 0, 057353 x2 c2 ,
x2 19,113 19,113 x2 19,311 19,311 x2 19, 708 x2 19, 708
dengan
69
c2 0, 03475 0, 038198 x1 0,109970( x1 25,930) 0, 031121( x1 26,502) 0, 005532( x1 27, 647) 0,572908 x3 0,312316 ( x3 49, 628) 0, 084988( x3 51,598) 0,168729( x3 55, 537) 0,141142 x4 0, 009075( x4 12,968) 0, 003382( x4 14, 492) 0, 012925( x4 17,541) 0, 011474 x5 0, 057044( x5 5,343) 1, 206009( x5 6, 060) 0, 089060( x5 7, 497) 1 t ti K 1 0.016065 0.016065 y 1 38 i 1 1 38 t ti 38 i 1 0.016065 0.016065 38
Interpretasi dari model adalah sebagai berikut: a. Pada daerah Kab Probolinggo, Kab Bondowoso, Kab Jember, Kab Sampang, Kab Situbondo dan Kab Sumenep di mana mempunyai rata-rata usia kawin pertama kurang dari sama dengan 19,113, dapat dilihat bahwa hubungan antara rata-rata usia kawin pertama adalah negatif. Jika rata-rata usia kawin pertama naik 1 tahun, maka Angka Fertilitas Total turun perlahan sebesar 0,033838. b. Pada daerah Kab Banyuwangi, Kab Lumajang, Kab Pamekasan di mana mempunyai rata-ratausia kawin pertama berada di rentang nilai lebih dari 19,113 hingga kurang dari sama dengan 19,311,dapat dilihat bahwa hubungan antara rata-rata usia kawin pertama adalah negatif. Jika rata-rata usia kawin pertama naik 1 tahun, maka Angka Fertilitas Total turun perlahan sebesar 0,220613. c. Pada daerah Kab Bangkalan, Kab Bojonegoro, Kab Lamongan, Kab Madiun,
Kab Pasuruan,
Kab Trenggalek,
Kab Tuban di
mana
mempunyairata-rata usia kawin pertama berada di rentang nilai lebih dari 19,113 hingga kurang dari sama dengan 19,708, dapat dilihat bahwa hubungan antara rata-rata usia kawin pertama adalah negatif. Jika rata-rata usia kawin pertama naik 1 tahun, maka Angka Fertilitas Total turun perlahan sebesar 0,06421.
70
d. Pada daerah Kab Gresik, Kota Pasuruan, Kota Probolinggo, Kab Lumajang, Kota Batu, Kota Kediri, Kota Mojokerto, Kab Jombang, Kab Kediri, Kab Blitar, Kota Malang, Kab Malang, Kab Mojokerto, dan Kab Sidoarjo, Kota Blitar, Kota Madiun, Kota Surabaya, Kab Magetan, Kab Nganjuk, Kab Ngawi, Kab Pacitan, Kab Ponorogo, Kab Tulungagung di manamempunyai rata-rata usia kawin pertama lebih dari 19,708, dapat dilihat bahwa hubungan antara rata-rata usia kawin pertama adalah negatif. Jika rata-rata usia kawin pertama naik 1 tahun, maka Angka Fertilitas Total turun perlahan sebesar 0,057353.
3) Model untuk variabel Persentase CPR (Contraception Prevalence Rate) Dengan mengasumsikan data selain persentase CPR adalah 𝑐3 , maka diperoleh model umumnya :
yˆ 0,572908 x3 0,312316 ( x3 49, 628) 0, 084988( x3 51,598) 0,168729( x3 55,537) c3 di mana: c3 0, 03475 0, 038198 x1 0,109970( x1 25,930) 0, 031121( x1 26,502) 0, 005532( x1 27, 647) 0, 033838 x2 0,186775( x2 19,113) 0,156403( x2 19,311) 0, 006857( x2 19, 708) 0,141142 x4 0, 009075( x4 12,968) 0, 003382( x4 14, 492) 0, 012925( x4 17,541) 0, 011474 x5 0, 057044( x5 5,343) 1, 206009( x5 6, 060) 0, 089060( x5 7, 497) 1 t ti K 1 0.016065 0.016065 y 1 38 i 1 1 38 t ti 38 i 1 0.016065 0.016065 38
Untuk interpretasi model ini digunakan fungsi seperti berikut :
0,572908 x3 c3 , 15, 499 0, 260592 x c , 3 3 ˆy 19,884 0,34558 x3 c3 , 29, 254 0,514309 x3 c3 , 71
x3 49, 628 49, 628 x3 51,598 51, 598 x3 55,537 x3 55,537
a. Pada daerah Kab Bangkalan di mana mempunyai persentase CPR kurang dari sama dengan 49,628, dapat dilihat bahwa hubungan antara persentase CPR dengan Angka Fertilitas Total adalah positif. Jika persentase CPR naik 1%, maka Angka Fertilitas Total naik sebesar 0,572908. Berdasarkan data publikasi Badan Pusat Statistik, hal ini dikarenakan alat atau cara KB yang mayoritas digunakan penduduk Kab Bangkalan adalah cenderung memakai suntik KB dan pil KB yakni masing-masing sebesar 71,36% dan 21,35%. Alat atau cara KB dengan cara suntik KB dan pil KB rentan mempunyai peluang terjadinya kehamilan cukup besar dibandingkan dengan alat atau cara KB yang lain karena alat atau cara ini mempunyai beberapa kelemahan, di antaranya jika mengkonsumsi pil KB tidak secara tepat dan tidak sesuai aturan (tidak teratur), maka pil KB tersebut akan tidak efektif mencegah kehamilan, dengan kata lain beresiko tinggi terjadinya kehamilan, dan melakukan suntik KB di waktu yang tepat atau waktu yang sesuai untuk melakukan suntik KB, maka akan mencegah terjadinya kehamilan, akan tetapi jika melakukan di waktu yang tidak sesuai dengan aturan, maka suntik KB tidak secara efektif mencegah terjadinya kehamilan. b. Untuk persentase CPR berada di rentang nilai lebih dari 49,628 hingga kurang dari sama dengan 51,598, dapat dilihat bahwa hubungan antara persentase CPR dengan Angka Fertilitas Total adalah negatif. Jika persentase CPR naik 1%, maka Angka Fertilitas Total turun sebesar 0,260592. c. Pada daerah Kota Malang, Kab Pamekasan, Kab Ponorogo, Kab Sampang, Kab Sumenep di mana mempunyai persentase CPR berada di rentang nilai lebih dari 51,598 hingga kurang dari sama dengan 55,537,dapat dilihat bahwa hubungan antara persentase CPR dengan Angka Fertilitas Total adalah negatif. Jika persentase CPR naik 1%, maka Angka Fertilitas Total turun sebesar 0,34558. d. Pada daerah Kab Gresik, Kota Pasuruan, Kota Probolinggo, Kab Lamongan, Kab Lumajang, Kota Batu, Kota Kediri, Kota Mojokerto, Kab Bojonegoro, Kab Tuban, Kab Jombang, Kab Kediri, Kota Blitar, Kab Malang, Kab
72
Mojokerto, Kab Pasuruan dan Kab Sidoarjo, Kab Banyuwangi, Kab Blitar, Kab Bondowoso, Kab Jember, Kota Madiun, Kota Surabaya, Kab Lumajang, Kab Madiun, Kab Magetan, Kab Nganjuk, Kab Ngawi, Kab Pacitan, Kab Probolinggo, Kab Situbondo, Kab Trenggalek, Kab Tulungagung di mana mempunyai persentase CPR lebih dari 51,598, dapat dilihat bahwa hubungan antara persentase CPR dengan Angka Fertilitas Total adalah negatif. Jika persentase CPR naik 1%, maka Angka Fertilitas Total turun sebesar 0,514309.
4) Model untuk variabel Persentase Unmet Need Dengan mengasumsikan data selain persentase unmet need adalah 𝑐4 , maka diperoleh model umumnya : yˆ 0,141142 x4 0, 009075( x4 12,968) 0, 003382( x4 14, 492) 0, 012925( x4 17,541) c4
di mana:
c4 0, 03475 0, 038198 x1 0,109970( x1 25,930) 0, 031121( x1 26,502) 0, 005532( x1 27, 647) 0, 033838 x2 0,186775( x2 19,113) 0,156403( x2 19,311) 0, 006857( x2 19, 708) 0,572908 x3 0,312316 ( x3 49, 628) 0, 084988( x3 51,598) 0,168729( x3 55,537) 0, 011474 x5 0, 057044( x5 5,343) 1, 206009( x5 6, 060) 0, 089060( x5 7, 497) 1 t ti K 1 0.016065 0.016065 y 1 38 i 1 1 38 t ti 38 i 1 0.016065 0.016065 38
Untuk interpretasi model ini digunakan fungsi seperti berikut :
0,141142 x4 c4 , 0,117 0,132067 x c , 4 4 yˆ 0,166 0,135449 x4 c4 , 2,392 0,122524 x4 c4 ,
x4 12,968 12,968 x4 14, 492 14, 492 x4 17,541 x4 17,541
73
a. Pada daerah Kab Bojonegoro, Kab Bondowoso, Kab Jember, Kab Jombang, Kota Probolinggo, Kab Lamongan, Kab Lumajang, Kab Magetan, Kab Malang, Kab Probolinggo, Kab Tuban di mana mempunyai persentase unmet need kurang dari sama dengan 12,968, dapat dilihat bahwa hubungan antara persentaseunmet need dengan Angka Fertilitas Total adalah positif. Jika persentase unmet need naik 1%, maka Angka Fertilitas Total naik sebesar 0,141142. b. Pada daerah Kab Mojokerto, Kab Nganjuk, Kab Ngawi, Kab Sidoarjo, Kab Situbondo di mana mempunyai persentase unmet need berada di rentang nilai lebih dari 12,968 hingga kurang dari sama dengan 14,492, dapat dilihat bahwa hubungan antara persentase unmet need dengan Angka Fertilitas Total adalah negatif. Jika persentase unmet need naik 1%, maka Angka Fertilitas Total turun perlahan sebesar 0,132067. Dalam hal ini, dikarenakan daerah-daerah tersebut mempunyai persentase wanita usia subur cenderung kecil. c. Pada daerah Kab Banyuwangi, Kab Gresik, Kab Kediri, Kota Blitar, Kota Malang, Kota Mojokerto, Kota Pasuruan, Kab Pacitan, Kab Pamekasan, Kab Pasuruan, Kab Trenggalek di mana mempunyai persentase unmet need berada di rentang nilai lebih dari 14,492 hingga kurang dari sama dengan 17,541, dapat dilihat bahwa hubungan antara persentase unmet need dengan Angka Fertilitas Total adalah negatif. Jika persentase unmet need naik 1%, maka Angka Fertilitas Total turun perlahan sebesar 0,135449. Dalam hal ini, dikarenakan daerah-daerah tersebut mempunyai persentase wanita usia subur cenderung kecil. d. Pada daerah Kab Bangkalan, Kab Sampang, Kota Batu, Kota Kediri, Kab Blitar, Kota Madiun, Kota Surabaya, Kab Lumajang, Kab Madiun, Kab Ponorogo, Kab Sumenep, Kab Tulungagung di mana mempunyai persentase unmet need lebih dari 17,541, dapat dilihat bahwa hubungan antara persentase unmet need dengan Angka Fertilitas Total adalah negatif. Jika persentase unmet need naik 1%, maka Angka Fertilitas Total turun perlahan sebesar 0,122524. Dalam
74
hal ini, dikarenakan daerah-daerah tersebut mempunyai persentase wanita usia subur cenderung kecil.
5) Model untuk variabel Persentase penduduk berpendidikan tinggi Dengan mengasumsikan data selain persentase penduduk berpendidikan tinggi adalah 𝑐5 , maka diperoleh model umumnya : yˆ 0, 011474 x5 0, 057044( x5 5,343) 1, 206009( x5 6, 060) 0, 089060( x5 7, 497) c5
di mana:
c5 0, 03475 0, 038198 x1 0,109970( x1 25,930) 0, 031121( x1 26,502) 0, 005532( x1 27, 647) 0, 033838 x2 0,186775( x2 19,113) 0,156403( x2 19,311) 0, 006857( x2 19, 708) 0,572908 x3 0,312316 ( x3 49, 628) 0, 084988( x3 51,598) 0,168729( x3 55,537) 0,141142 x4 0, 009075( x4 12,968) 0, 003382( x4 14, 492) 0, 012925( x4 17,541) 1 t ti K 1 0.016065 0.016065 y 1 38 i 1 1 38 t ti 38 i 1 0.016065 0.016065 38
Untuk interpretasi model ini digunakan fungsi seperti berikut :
0, 011474 x5 c5 , 0,305 0, 068518 x c , 5 5 yˆ 7, 613 1,137491x5 c5 , 8, 280 1, 048431x5 c5 ,
x5 5,343 5,343 x5 6, 060 6, 060 x5 7, 497 x5 7, 497
a. Pada daerah Kab Bangkalan, Kota Pasuruan, Kab Lamongan, Kab Lumajang, Kab Pamekasan, Kab Sampang, Kota Batu, Kota Kediri, Kota Mojokerto, Kab Bojonegoro, Kab Jombang, Kab Blitar, Kota Malang, Kab Malang, Kab Mojokerto, Kab Pasuruan dan, Kab Banyuwangi, Kab Blitar,
75
Kab Bondowoso, Kab Jember, Kota Madiun, Kota Surabaya, Kab Lumajang, Kab Madiun, Kab Magetan, Kab Nganjuk, Kab Ngawi, Kab Pacitan, Kab Ponorogo, , Kab Situbondo, Kab Sumenep, Kab Trenggalek, Kab Tulungagung, Kab Tuban, Kab Kediri di mana mempunyai persentase penduduk berpendidikan tinggi kurang dari sama dengan 5,343,dapat dilihat bahwa hubungan antara persentase penduduk berpendidikan tinggi dengan Angka
Fertilitas
Total adalah
negatif.
Jika
persentase
penduduk
berpendidikan tinggi naik 1%, maka Angka Fertilitas Total turun sebesar 0,011474. b. Untuk persentase penduduk berpendidikan tinggi berada di rentang nilai lebih dari 5,343 hingga kurang dari sama dengan 6,060, dapat dilihat bahwa hubungan antara persentase penduduk berpendidikan tinggi dengan Angka Fertilitas Total adalah negatif. Jika persentase penduduk berpendidikan tinggi naik 1%, maka Angka Fertilitas Total turun sebesar 0,068518. c. pada daerah Kab Gresik,Kota Probolinggo di mana mempunyai persentase penduduk berpendidikan tinggi berada di rentang nilai lebih dari 6,060 hingga kurang dari sama dengan 7,497,dapat dilihat bahwa hubungan antara persentase penduduk berpendidikan tinggi dengan Angka Fertilitas Total adalah negatif. Jika persentase penduduk berpendidikan tinggi naik 1%, maka Angka Fertilitas Total turun sebesar 1,137491. d. Pada daerah Kab Sidoarjo di mana mempunyai persentase penduduk berpendidikan tinggi lebih dari 7,497,dapat dilihat bahwa hubungan antara persentase penduduk berpendidikan tinggi dengan Angka Fertilitas Total adalah negatif. Jika persentase penduduk berpendidikan tinggi naik 1%, maka Angka Fertilitas Total turun sebesar 1,048431.
4.3.4 Grafik Perbandingan Hasil Estimasi Beberapa Metode Regresi. Untuk melihat apakah metode regresi nonparametrik campuran spline dan kernel yang digunakan adalah metode terbaik, maka akan dibandingkan dengan beberapa metode lain, seperti regresi linier berganda, regresi spline, dan regresi kernel yang akan ditunjukkan pada gambar berikut.
76
Gambar 4.7 Perbandingan hasil estimasi antara Regresi Campuran Spline dan Kernel, Regresi Spline, Regresi Kernel dan Regresi Linier Berganda
Gambar 4.8 Perbandingan grafik scatter plot antara data variabel respon (y) dengan data hasil estimasi (y_hat) pada Regresi Campuran Spline dan Kernel
77
Gambar 4.9 Perbandingan grafik scatter plot antara data variabel respon (y) dengan data hasil estimasi (y_hat) pada Regresi Linier Berganda
Gambar 4.10 Perbandingan grafik scatter plot antara data variabel respon (y) dengan data hasil estimasi (y_hat) pada Regresi Spline
78
Gambar 4.11 Perbandingan grafik scatter plot antara data variabel respon (y) dengan data hasil estimasi (y_hat) pada Regresi Kernel Selanjutnya akan dilihat tabel perbandingan nilai R-square dan MSE dari masing-mesing metode yang digunakan dalam Tabel 4.7 Tabel 4.7 Tabel Perbandingan nilai R-square dan MSE No 1 2 3 4
Metode Regresi Campuran Spline dan Kernel Regresi Linier Berganda Regresi Spline Regresi Kernel
R2 92,54% 18% 59% 35%
MSE 0,007792609 0,043 0,05064144 0,03317577
Dapat dilihat pada Tabel 4.8 di mana hasil estimasi dengan menggunakan metode regresi campuran spline dan kernel mempunyai nilai R-square paling besar dan nilai MSE paling kecil, sehingga metode ini dapat dikatakan sebagai metode terbaik di antara metode regresi linier berganda, regresi spline dan regresi kernel.
4.4.5 Pengujian Hipotesis Selanjutnya akan dilakukan uji hipotesis untuk parameter-parameter komponen spline tiga knot.
79
Perhatikan uji hipotesis : H 0 : 0 1 ... p 0
H1 : paling sedikit terdapat satu i 0, i 1, 2,..., p Tabel Analisis Variansi untuk menguji hipotesis diberikan dalam Tabel 4.8 berikut: Tabel 4.8 Analisis Varians model Spline Tiga Knot Sumber Variasi Regresi Error Total
Derajat Bebas 21 16 37
Jumlah Kuadrat 1,5467167 0,1246818 1,6471053
Rata-rata Jumlah Kuadrat 0,073653177 0,007792609
F-hitung 10,0424
Dengan menggunakan tingkat signifikansi 5%, diperoleh nilai distribusi F dengan derajat bebas pembilang 21 dan derajat bebas penyebut 16 sebesar 2,264229. Berdasarkan tabel 4.7 diperoleh kesimpulan menolak H0 karena nilai Fhitung =10,0424 > Ftabel =2,264229 . Hal ini menunjukkan bahwa parameter β signifikan pada model.
4.5 Uji Asumsi Residual a. Uji Identik Pertama akan dilakukan uji ketaksamaan variansi menggunakan Uji Glejser dengan hipotesis sebagai berikut: H0 : i 2
2
H1 : min imal ada satu i 2 2 ; i 1, 2,..., n
Tabel Uji Identik akan disajikan pada Tabel 4.9 Tabel 4.9 Uji Identik pada Residual Variabel
t-hit
p-value
keputusan
X1
0,144
0,886
Terima H0
X2
0,324
0,748
Terima H0
X3
0,657
0,516
Terima H0
X4
0,163
0,871
Terima H0
80
kesimpulan Tidak terjadi heteroskedastisitas Tidak terjadi heteroskedastisitas Tidak terjadi heteroskedastisitas Tidak terjadi
X5
-0,893
0,379
Terima H0
X6
-0,098
0,922
Terima H0
heteroskedastisitas Tidak terjadi heteroskedastisitas Tidak terjadi heteroskedastisitas
Berdasarkan tabel di atas, pada tingkat signifikansi ∝= 0,05, diperoleh untuk setiap parameter maka dapat disimpulkan tidak terjadi masalah heteroskedastisitas pada model yang dihasilkan.
b. Uji Independen Selanjutnya
akan
dilakukan
uji
Independen
(uji
autokorelasi)
menggunakan kriteria Durbin Watson Test untuk mendeteksi adanya autokorelasi dalam model dengan hipotesis sebagai berikut:
H 0 : i 0 (residual tidak berkorelasi)
H1 : i 0 (residual berkorelasi)
Statistik Uji: 𝑑=
𝑛 2 𝑖=2 (𝜀𝑖 − 𝜀𝑖−1 ) 𝑛 2 𝑖=1 𝜀𝑖
Dengan kriteria Durbin Watson Test didapatkan nilai d = 2,046, dan melihat pada tabel Durbin-Watson dengan jumlah variabel prediktor 𝑘 = 6 dan jumlah observasi 𝑛 = 38 didapatkan nilai dL=1,1463 dan dU=1,8641 . Keputusan ada atau tidaknya autokorelasi dalam model didasarkan pada Tabel 4.10
Tabel 4.10 Uji Statistik Durbin Watson Nilai Statistik Durbin-Watson 0 < 𝑑 < 𝑑𝐿 𝑑𝐿 ≤ 𝑑 ≤ 𝑑𝑈 𝑑𝑈 ≤ 𝑑 ≤ 4 − 𝑑𝑈 4 − 𝑑𝑈 ≤ 𝑑 ≤ 4 − 𝑑𝐿
Keputusan Menolak hipotesis nol; ada autokorelasi positif Daerah keragu-raguan; tidak ada keputusan Menerima hipotesis nol; tidak ada autokorelasi positif/negatif Daerah keragu-raguan; tidak ada keputusan
81
4 − 𝑑𝐿 ≤ 𝑑 ≤ 4
Berdasarkan 𝑑𝑈 ≤ 𝑑 ≤ 4 − 𝑑𝑈
tabel yaitu
Menolak hipotesis nol; ada autokorelasi positif Widarjono (2007) di
atas
nilai
d
berada
1,8641 ≤ 2,046 ≤ (4 − 1,8641)
pada atau
rentang 1,8641 ≤
2,046 ≤ 2,1359. Dengan demikian dapat diputuskan terima H0 atau residual tidak berkorelasi.
c. Uji Normalitas Uji normalitas dapat dilakukan dengan Uji Kolmogornov Smirnov, dengan hipotesis sebagai berikut:
H 0 : residual berdistribusi normal H1 : residual tidak berdistribusi normal
Gambar 4.12 Probability Plot of Residual
Plot normalitas menunjukkan tidak ada penyimpangan terhadap distribusi normal. Hal ini diperkuat dengan menggunakan uji Kolmogorov-Smirnov yang memberikan nilai p-value = 0,150 > 0,05 sehingga gagal tolak H0 atau residual berdistribusi normal.
82
83
BAB 5 KESIMPULAN DAN SARAN
5.1
Kesimpulan Berdasarkan analisis dan pembahasan yang telah diuraikan pada bab
sebelumnya, maka dapat diperoleh kesimpulan: 1. Optimasi dengan metode Ordinary Least Square (OLS) menghasilkan estimator regresi campuran kernel dan spline truncated sebagai berikut: q
y fˆp ( x pi ) gˆ t p 1
Z D y Estimator parameter dapat diperoleh dengan menggunakan metode Ordinary Least Square (OLS) yang menghasilkan persamaan :
ˆ C , y dimana : ' C , Z Z
1
Ζ Ι D T
2. Uji hipotesis dalam komponen spline dapat dilakukan dengan menggunakan Likelihood Ratio Test dengan formulasi hipotesis sebagai berikut: 𝐻0 : 𝛽0 = 𝛽1 = 𝛽2 = ⋯ 𝛽𝑘 = 0 𝐻1 : 𝑚𝑖𝑛𝑖𝑚𝑎𝑙 𝑡𝑒𝑟𝑑𝑎𝑝𝑎𝑡 𝑠𝑎𝑡𝑢 𝛽𝑖 ≠ 0
, i=1,2,...,p
Diberikan model regresi nonparametrik campuran spline dan kernel dalam bentuk matriks:
y Tβ ε* Fungsi Likelihood di bawah ruang populasi diberikan oleh:
L(βΩ , 2 ) (2 2 )
n 2
1 exp 2 (y'y - (βΩ'T'y)' - βΩ'T'y + βΩ'T'TβΩ 2
Fungsi Likelihood di bawah ruang hipotesis diberikan oleh:
85
L(β , 2 ) (2 2 )
n 2
1 exp 2 (y'y - (β'T'y)' - β'T'y + β'T'Tβ 2
Kemudian diperoleh Ratio Likelihood : Lratio
ω
, 2 )
ω
, 2 )
L(β Max Max L(β
Dengan memperhatikan rumusan dari Multiplier Lagrange didapatkan persamaan:
Lratio
1 1 Q1 Q 2
n
2
dengan
Q1 = βˆ ' (T ' T)-1
1
βˆ
Q2 = (y - Tβˆ Ω )'(y - Tβˆ Ω ) Selanjutnya diperoleh Statistik Test untuk Uji Hipotesis: F
Q1 Q2
Berdasarkan pembuktian teorema Rencher dan Schaalje (2007) didapatkan: 𝑸𝟏 /𝜎 2 ~ 2 ( 1 (r m)q ) 𝑸𝟐 /𝜎 2 ~ 2 ( n (1 (r m)q) ) dan dibuktikan dengan Q1 dan Q 2 independen, maka diperoleh distribusi statistik uji: F
Q1 / d1 F( ;1( r m ) q;n (1( r m ) q )) Q2 / d 2
Hipotesis H 0 ditolak jika d 2 n2 F k di mana k k 1 d1 *
*
86
3. Model terbaik berdasarkan ukuran kebaikan model yaitu Nilai R2 sebesar 92,54% dengannilai MSE sebesar 0,007792609. Model regresi campuran kernel dan spline pada kasus data Angka Fertilitas Total di Provinsi Jawa Timur tahun 2015 adalah sebagai berikut:
yˆ 0, 03475 0, 038198 x1 0,109970( x1 25,930) 0, 031121( x1 26,502) 0, 005532( x1 27, 647) 0, 033838 x2 0,186775( x2 19,113) 0,156403( x2 19,311) 0, 006857( x2 19, 708) 0,572908 x3 0,312316 ( x3 49, 628) 0, 084988( x3 51,598) 0,168729( x3 55,537) 0,141142 x4 0, 009075( x4 12,968) 0, 003382( x4 14, 492) 0, 012925( x4 17,541) 0, 011474 x5 0, 057044( x5 5,343) 1, 206009( x5 6, 060) 0, 089060( x5 7, 497) 1 t ti K 1 0.016065 0.016065 yi 1 38 i 1 1 38 t ti 38 i 1 0.016065 0.016065 38
4. Interpretasi model untuk masing-masing variabel komponen spline diberikan oleh: Variabel Persentase Jumlah Status Kawin Pada daerah Kab Bangkalan, Kab Gresik, Kota Pasuruan, Kota Probolinggo, Kab Lamongan, Kab Lumajang, Kab Pamekasan, dan Kab Sampang di mana mempunyai persentase jumlah status kawin kurang dari sama dengan 25,930, dapat dilihat bahwa hubungan antara persentase jumlah status kawin dengan Angka Fertilitas Total adalah positif. Jika jumlah status kawin naik 1% maka Angka Fertilitas Total naik sebesar 0,038198 Pada daerah Kota Batu, Kota Kediri, Kota Mojokerto di mana persentase jumlah status kawin berada di rentang nilai lebih dari 25,930 hingga kurang dari sama dengan 26,502, dapat dilihat bahwa hubungan antara persentase jumlah status kawin dengan Angka
87
Fertilitas Total adalah negatif. Jika jumlah status kawin naik 1% maka Angka Fertilitas Total turun perlahan sebesar 0,071772. Pada data di atas, Kota Mojokerto mempunyai Angka Fertilitas Total yang paling kecil di antara Kota Kediri dan Kota Batu yakni sebesar 1,87 di mana Kota Batu mempunyai Angka Fertilitas Total sebesar 1,96 dan Kota Kediri sebesar 1,94. Dalam hal ini, berdasarkan data publikasi Badan Pusat Statistik, Kota Mojokerto mempunyai penduduk dengan persentase KB yang paling besar di antara Kota Batu, Kota Kediri, yakni sebesar 64,12% di mana Kota Batu dan Kota Kediri masing-masing sebesar 61,12% dan 61,22% Pada daerah Kab Bojonegoro, Kab Jombang, Kab Kediri, Kota Blitar, Kota Malang, Kab Malang, Kab Mojokerto, Kab Pasuruan Kab Sidoarjo dan Kab Tuban di mana mempunyai persentase jumlah status kawin berada di rentang nilai lebih dari 26,502 hingga kurang dari sama dengan 27,647, dapat dilihat bahwa hubungan antara persentase jumlah status kawin dengan Angka Fertilitas Total adalah negatif. Jika jumlah status kawin naik 1% maka Angka Fertilitas Total turun perlahan sebesar 0,040651. Dalam hal ini, daerah dengan nilai Angka Fertilitas Total di atas nilai 2 (cukup tinggi) adalah Kab Jombang, Kab Kediri, Kota Blitar, Kab Malang, dan Kab Mojokerto cenderung mempunyai persentase penduduk yang menggunakan KB cukup kecil, yakni berkisar 55% hingga 60%. Kab Kediri merupakan daerah dengan nilai Angka Fertilitas Total tertinggi, yakni sebesar 2,40 dan mempunyai persentase penduduk yang menggunakan KB sebesar 58,15%. Daerah dengan nilai Angka Fertilitas Total di kurang dari sama dengan 2 (cukup rendah) adalah Kab Bojonegoro, Kota Malang, Kab Pasuruan Kab Sidoarjo dan Kab Tuban cenderung mempunyai persentase penduduk yang menggunakan KB cukup besar, yakni berkisar 60% hingga 64%. Kota Malang merupakan daerah dengan nilai Angka Fertilitas Total terendah, yakni sebesar
88
1,78 dan mempunyai persentase penduduk yang menggunakan KB sebesar 63,74%. Pada daerah Kab Banyuwangi, Kab Blitar, Kab Bondowoso, Kab Jember, Kota Madiun, Kota Surabaya, Kab Lumajang, Kab Madiun, Kab Magetan, Kab Nganjuk, Kab Ngawi, Kab Pacitan, Kab Ponorogo, Kab Probolinggo, Kab Situbondo, Kab Sumenep, Kab Trenggalek, Kab Tulungagung di mana mempunyai persentase jumlah status kawin lebih dari 25,930, dapat dilihat bahwa hubungan antara persentase jumlah status kawin dengan Angka Fertilitas Total adalah negatif. Jika jumlah status kawin naik 1% maka Angka Fertilitas Total turun perlahan sebesar 0,046183. Dalam hal ini, daerah dengan nilai Angka Fertilitas Total di atas nilai 2 (cukup tinggi) adalah Kab Banyuwangi, Kab Blitar, Kab Bondowoso, Kab Jember, Kota Madiun, Kota Surabaya, Kab Madiun, Kab Magetan, Kab Nganjuk, Kab Ngawi, Kab Pacitan, Kab Ponorogo, Kab Probolinggo
dan
Kab
Tulungagung
dikarenakan
cenderung
mempunyai persentase penduduk yang menggunakan KB cukup kecil. Kab Blitar merupakan daerah dengan nilai Angka Fertilitas tertinggi, yakni sebesar 2,42 dan mempunyai persentase penduduk yang menggunakan KB sebesar 60,25%. Daerah dengan nilai Angka Fertilitas di kurang dari sama dengan 2 (cukup rendah) adalah Kab Lumajang, Kab Situbondo, Kab Sumenep,
Kab Trenggalek
dikarenakan cenderung mempunyai persentase penduduk yang menggunakan KB cukup besar. Kota Sumenep merupakan daerah dengan nilai Angka Fertilitas terendah, yakni sebesar 1,52 dan mempunyai persentase penduduk yang menggunakan KB sebesar 68,91%. Variabel Persentase Rata-rata Usia Kawin Pertama Pada daerah Kab Probolinggo, Kab Bondowoso, Kab Jember, Kab Sampang, Kab Situbondo dan Kab Sumenep di mana mempunyai
89
rata-rata usia kawin pertama kurang dari sama dengan 19,113, dapat dilihat bahwa hubungan antara rata-rata usia kawin pertama adalah negatif. Jika rata-rata usia kawin pertama naik 1 tahun, maka Angka Fertilitas Total turun sebesar 0,033838. Pada daerah Kab Banyuwangi, Kab Lumajang, Kab Pamekasan di mana mempunyai rata-rata usia kawin pertama berada di rentang nilai lebih dari 19,113 hingga kurang dari sama dengan 19,311, dapat dilihat bahwa hubungan antara rata-rata usia kawin pertama adalah negatif. Jika rata-rata usia kawin pertama naik 1 tahun, maka Angka Fertilitas Total turun sebesar 0,220613. Pada daerah Kab Bangkalan, Kab Bojonegoro, Kab Lamongan, Kab Madiun, Kab Pasuruan, Kab Trenggalek, Kab Tuban di mana mempunyai rata-rata usia kawin pertama berada di rentang nilai lebih dari 19,113 hingga kurang dari sama dengan 19,708, dapat dilihat bahwa hubungan antara rata-rata usia kawin pertama adalah negatif. Jika rata-rata usia kawin pertama naik 1 tahun, maka Angka Fertilitas Total turun sebesar 0,06421. Pada daerah Kab Gresik, Kota Pasuruan, Kota Probolinggo, Kab Lumajang, Kota Batu, Kota Kediri, Kota Mojokerto, Kab Jombang, Kab Kediri, Kab Blitar, Kota Malang, Kab Malang, Kab Mojokerto, dan Kab Sidoarjo, Kota Blitar, Kota Madiun, Kota Surabaya, Kab Magetan, Kab Nganjuk, Kab Ngawi, Kab Pacitan, Kab Ponorogo, Kab Tulungagung di mana mempunyai rata-rata usia kawin pertama lebih dari 19,708, dapat dilihat bahwa hubungan antara rata-rata usia kawin pertama adalah negatif. Jika rata-rata usia kawin pertama naik 1 tahun, maka Angka Fertilitas Total turun sebesar 0,057353. Variabel Persentase Contraception Prevalence Rate (CPR) Pada daerah Kab Bangkalan di mana mempunyai persentase CPR kurang dari sama dengan 49,628, dapat dilihat bahwa hubungan antara persentase CPR dengan Angka Fertilitas Total adalah positif.
90
Jika persentase CPR naik 1%, maka Angka Fertilitas Total naik sebesar 0,572908. Berdasarkan data publikasi Badan Pusat Statistik, hal ini dikarenakan alat atau cara KB yang mayoritas digunakan penduduk Kab Bangkalan adalah cenderung memakai suntik KB dan pil KB yakni masing-masing sebesar 71,36% dan 21,35%. Alat atau cara KB dengan cara suntik KB dan pil KB rentan mempunyai peluang terjadinya kehamilan cukup besar dibandingkan dengan alat atau cara KB yang lain karena alat atau cara ini mempunyai beberapa kelemahan, di antaranya jika mengkonsumsi pil KB tidak secara tepat dan tidak sesuai aturan (tidak teratur), maka pil KB tersebut akan tidak efektif mencegah kehamilan, dengan kata lain beresiko tinggi terjadinya kehamilan, dan melakukan suntik KB di waktu yang tepat atau waktu yang sesuai untuk melakukan suntik KB, maka akan mencegah terjadinya kehamilan, akan tetapi jika melakukan di waktu yang tidak sesuai dengan aturan, maka suntik KB tidak secara efektif mencegah terjadinya kehamilan. Untuk persentase CPR berada di rentang nilai lebih dari 49,628 hingga kurang dari sama dengan 51,598, dapat dilihat bahwa hubungan antara persentase CPR dengan Angka Fertilitas Total adalah negatif. Jika persentase CPR naik 1%, maka Angka Fertilitas Total turun sebesar 0,260592. Pada daerah Kota Malang, Kab Pamekasan, Kab Ponorogo, Kab Sampang, Kab Sumenep di mana mempunyai persentase CPR berada di rentang nilai lebih dari 51,598 hingga kurang dari sama dengan 55,537, dapat dilihat bahwa hubungan antara persentase CPR dengan Angka Fertilitas Total adalah negatif. Jika persentase CPR naik 1%, maka Angka Fertilitas Total turun sebesar 0,34558. Pada daerah Kab Gresik, Kota Pasuruan, Kota Probolinggo, Kab Lamongan, Kab Lumajang, Kota Batu, Kota Kediri, Kota Mojokerto, Kab Bojonegoro, Kab Tuban, Kab Jombang, Kab Kediri, Kota Blitar, Kab Malang, Kab Mojokerto, Kab Pasuruan dan Kab Sidoarjo, Kab
91
Banyuwangi, Kab Blitar, Kab Bondowoso, Kab Jember, Kota Madiun, Kota Surabaya, Kab Lumajang, Kab Madiun, Kab Magetan, Kab Nganjuk, Kab Ngawi, Kab Pacitan, Kab Probolinggo, Kab Situbondo, Kab Trenggalek, Kab Tulungagung di mana mempunyai persentase CPR lebih dari 51,598, dapat dilihat bahwa hubungan antara persentase CPR dengan Angka Fertilitas Total adalah negatif. Jika persentase CPR naik 1%, maka Angka Fertilitas Total turun sebesar 0,514309. Variabel Persentase Unmet Need Pada daerah Kab Bojonegoro, Kab Bondowoso, Kab Jember, Kab Jombang, Kota Probolinggo, Kab Lamongan, Kab Lumajang, Kab Magetan, Kab Malang, Kab Probolinggo, Kab Tuban di mana mempunyai persentase unmet need kurang dari sama dengan 12,968, dapat dilihat bahwa hubungan antara persentase unmet need dengan Angka Fertilitas Total adalah positif. Jika persentase unmet need naik 1%, maka Angka Fertilitas Total naik sebesar 0,141142. Pada daerah Kab Mojokerto, Kab Nganjuk, Kab Ngawi, Kab Sidoarjo, Kab Situbondo di mana mempunyai persentase unmet need berada di rentang nilai lebih dari 12,968 hingga kurang dari sama dengan 14,492, dapat dilihat bahwa hubungan antara persentase unmet need dengan Angka Fertilitas Total adalah negatif. Jika persentase unmet need naik 1%, maka Angka Fertilitas Total turun perlahan sebesar 0,132067. Dalam hal ini, dikarenakan daerah-daerah tersebut mempunyai persentase wanita usia subur cenderung kecil. Kab Situbondo merupakan daerah yang mempunyai nilai Angka Fertilitas Total paling kecil yaitu sebesar 1,78 dan mempunyai persentase wanita usia subur sebesar 30,75%, dan pada daerah Kab Nganjuk merupakan daerah yang mempunyai nilai Angka Fertilitas Total paling besar yaitu sebesar 2,28, mempunyai persentase wanita usia subur sebesar 38,47%.
92
Pada daerah Kab Banyuwangi, Kab Gresik, Kab Kediri, Kota Blitar, Kota Malang, Kota Mojokerto, Kota Pasuruan, Kab Pacitan, Kab Pamekasan, Kab Pasuruan, Kab Trenggalek di mana mempunyai persentase unmet need berada di rentang nilai lebih dari 14,492 hingga kurang dari sama dengan 17,541, dapat dilihat bahwa hubungan antara persentase unmet need dengan Angka Fertilitas Total adalah negatif. Jika persentase unmet need naik 1%, maka Angka Fertilitas Total turun perlahan sebesar 0,135449. Dalam hal ini, dikarenakan daerah-daerah tersebut mempunyai persentase wanita usia subur cenderung kecil. Kota Malang merupakan daerah yang mempunyai nilai Angka Fertilitas Total paling kecil yaitu sebesar 1,78 dan mempunyai persentase wanita usia subur sebesar 28,12%, dan pada daerah Kab Kediri merupakan daerah yang mempunyai nilai Angka Fertilitas Total paling besar yaitu sebesar 2,40, mempunyai persentase wanita usia subur sebesar 38,97%. Pada daerah Kab Bangkalan, Kab Sampang, Kota Batu, Kota Kediri, Kab Blitar, Kota Madiun, Kota Surabaya, Kab Lumajang, Kab Madiun, Kab Ponorogo, Kab Sumenep, Kab Tulungagung di mana mempunyai persentase unmet need lebih dari 17,541, dapat dilihat bahwa hubungan antara persentase unmet need dengan Angka Fertilitas Total adalah negatif. Jika persentase unmet need naik 1%, maka Angka Fertilitas Total turun perlahan sebesar 0,122524. Dalam hal ini, dikarenakan daerah-daerah tersebut mempunyai persentase wanita usia subur cenderung kecil. Kota Surabaya merupakan daerah yang mempunyai nilai Angka Fertilitas Total paling kecil yaitu sebesar 1,72 dan mempunyai persentase wanita usia subur sebesar 30,79%, dan pada daerah Kab Sampang merupakan daerah yang mempunyai nilai Angka Fertilitas Total yang paling besar yaitu sebesar 2,45, mempunyai persentase wanita usia subur sebesar 37,40%.
93
Variabel Persentase Penduduk Berpendidikan Tinggi Pada daerah Kab Bangkalan, Kota Pasuruan, Kab Lamongan, Kab Lumajang, Kab Pamekasan, Kab Sampang, Kota Batu, Kota Kediri, Kota Mojokerto, Kab Bojonegoro, Kab Jombang, Kab Blitar, Kota Malang, Kab Malang, Kab Mojokerto, Kab Pasuruan dan, Kab Banyuwangi, Kab Blitar, Kab Bondowoso, Kab Jember, Kota Madiun, Kota Surabaya, Kab Lumajang, Kab Madiun, Kab Magetan, Kab Nganjuk, Kab Ngawi, Kab Pacitan, Kab Ponorogo, , Kab Situbondo, Kab Sumenep, Kab Trenggalek, Kab Tulungagung, Kab Tuban, Kab Kediri di mana mempunyai persentase penduduk berpendidikan tinggi kurang dari sama dengan 5,343, dapat dilihat bahwa hubungan antara persentase penduduk berpendidikan tinggi dengan Angka Fertilitas Total adalah negatif. Jika persentase penduduk berpendidikan tinggi naik 1%, maka Angka Fertilitas Total turun sebesar 0,011474. Untuk persentase penduduk berpendidikan tinggi berada di rentang nilai lebih dari 5,343 hingga kurang dari sama dengan 6,060, dapat dilihat bahwa hubungan antara persentase penduduk berpendidikan tinggi dengan Angka Fertilitas Total adalah negatif. Jika persentase penduduk berpendidikan tinggi naik 1%, maka Angka Fertilitas Total turun sebesar 0,068518. pada daerah Kab Gresik, Kota Probolinggo di mana mempunyai persentase penduduk berpendidikan tinggi berada di rentang nilai lebih dari 6,060 hingga kurang dari sama dengan 7,497, dapat dilihat bahwa hubungan antara persentase penduduk berpendidikan tinggi dengan Angka Fertilitas Total adalah negatif. Jika persentase penduduk berpendidikan tinggi naik 1%, maka Angka Fertilitas Total turun sebesar 1,137491. Pada daerah Kab Sidoarjo di mana mempunyai persentase penduduk berpendidikan tinggi lebih dari 7,497, dapat dilihat bahwa hubungan antara persentase penduduk berpendidikan tinggi dengan Angka
94
Fertilitas
Total
adalah
negatif.
Jika
persentase
penduduk
berpendidikan tinggi naik 1%, maka Angka Fertilitas Total turun sebesar 1,048431.
3. Dengan menggunakan tingkat signifikansi 5%, diperoleh nilai distribusi F dengan derajat bebas pembilang 21 dan derajat bebas penyebut 16 sebesar 2,264229. Berdasarkan hasil yang diperoleh sebelumnya diketahui bahwa Fhitung=9,451671sehingga kesimpulan dari uji hipotesis adalah menolak H0 karena nilai F= 9,451671 > Ftabel = 2,264229 . Hal ini menunjukkan bahwa parameter β signifikan pada model. 5.2
Saran Tindak lanjut dari penelitian ini, maka saran yang dapat diberikan
berdasarkan penelitian yang telah dilakukan adalah sebagai berikut. 1. Badan Pusat Statistik diharapkan lebih memperhatikan daerah-daerah di mana mempunyai perilaku yang berbeda pada daerah dengan jumlah status kawin yang bertambah namun nilai Angka Fertilitas cenderung kecil, pada daerah dengan persentase CPR semakin bertambah namun nilai Angka Fertilitas cenderung besar, dan pada daerah dengan persentase unmet need semakin bertambah namun nilai Angka Fertilitas cenderung kecil. 2. Pemerintah Provinsi Jawa Timur diharapkan agar lebih memperhatikan variabel – variabel yang signifikan dan menggali kemungkinan variabel lain yang diperkirakan besar pengaruhnya terhadap Angka Fertilitas Total agar kebijakan yang akan digulirkan untuk peningkatan tingkat kesejahteraan masyarakat lebih tepat sasaran.
95
“Halaman ini sengaja dikosongkan”
96
DAFTAR PUSTAKA
Aljuhani, K. H.& Al T. L. I. (2014).Modification of the Adaptive NadarayaWatson Kernel Regression Estimator.AcademicJournal. Vol. 9(22), pp. 966-971. Apriyanti, 2014. Hubungan Tingkat Pendidikan dan Nilai Anak dengan TFR Pasangan
Perkawinan
Usia
Muda.
Diakses
pada
01
Agustus
2016;http://download.portalgaruda.org/article.php Azantaro,2015.AnalisisFaktor-faktor yang Mempengaruhi Tingkat TFR di Sumatera
Utara.Diaksespadatanggal
02
Agustus
2016;
http://repository.usu.ac.id Badan Kependudukan dan Keluarga Berencana Nasional, 2011. Analisa Pendataan Kualitas dan Kuantitas IMP Tahun 2010, Jakarta: BKKBN. Badan Kependudukan dan Keluarga Berencana Nasional, 2015. Angka Prevalensi Pemakaian
Kontrasepsi/CPR.
Diakses
pada
01
Agustus
2016;
http://sirusa.bps.go.id Badan Penelitian dan Pengembangan, 2010. Perkawinan dan Perceraian.Diakses pada 01 Agustus 2016; https://balatbangbengkulu.files.wordpress.com Budiantara,
I.N.,
2005.
Penentuan
Titik-Titik
Knotsdalam
Regresi
Spline.Surabaya: Jurnal Jurusan Statistika FMIPA-ITS. Budiantara, I.N., 2009. Splinedalam Regresi Nonparametrik dan Semiparametrik: Sebuah Pemodelan Statistika Masa Kini dan Masa Mendatang, ITS Press, Surabaya. Budiantara, I.N., 2011. Penelitian Bidang Regresi Spline Menuju Terwujudnya Penelitian Statistika yang Mandiri dan Berkarakter. Prosiding Seminar Nasional FMIPA Undiksha, 9-28. Budiantara,
I.N.,
Lestari,
B.,
Islamiyati,
2010.
Estimator
SplineTerbobotdalamRegresiNonparametrikdanSemiparametrikHeterokesd astikuntuk Data Longitudinal. LaporanPenelitianHibahKompetensi, DP2MDIKTI, Jakarta.
97
Budiantara,
I.N.,
Mulianah,
DalamRegresiSemiparametrik
2007. Kernel
PemilihanBanwidth
Optimal
danAplikasinya,
Journal
SainsdanTeknologi SIGMA, 10 : 159-166. Budiantara, I.N., Ratna, M., Zain, I., Wibowo, W., 2012.Modeling the Percentage of Poor People in Indonesia Using Spline Nonparametric Regression Approach.International Journal of Basic & Applied Sciences IJBASIJENS vol:12 No:06, 119-124. Budiantara, I.N., Ratnasari, Ratna and Zain, 2015. The Combination of Spline and Kernel estimator for Nonparametrik Regression and Its Properties, Applied Mathematical Science, 9, No 122, 6083-6094. Craven, P. &Wahba, G.(1979), Smoothing Noisy Data with Spline Functions, Numerische Mathematics, 31, 377-403. Darmawi, H. &Otok, B.W. (2014). Bootstrap PadaRegresi Linier dan Spline Truncated. Statistika: Forum TeoridanaplikasiStatistika. Depkes, 2014.Profil Kesehatan Indonesia 2014. Diakses pada 02 Agustus 2016; http://www.depkes.go.id/resources/download/pusdatin/profil-kesehatanindonesia/profil-kesehatan-indonesia-2014.pdf Du, P., Parmeter, C. F. and Racine, J.S. (2012).Nonparametric Kernel Regression with Multiple Predictors and Multiple Shape Constraints.Department Of Economics Working Paper Series.McMaster University. Canada. Eubank, R.L., 1999. Nonparametrik Regression and Spline Smoothing, MarcelDeker : New York. Guidoum, A. C., 2015. Kernel Estimator and Bandwidth selection for Density and its Derivatives.Working Paper.Faculty of Mathematics.University of Science and Technology HouariBoumadiene., Algeria. Gujarati, D. (1997). Ekonometrika Dasar (Terjemahan). Jakarta: PT. Gelora Aksara Pratama Hadijati,
M.,
2004.EstimasiKernel
dalamRegresiNonparametrikdengan
ErrorBerkorelasi, Tesis, ITS, Surabaya. Hardle, W., 1990.Applied Nonparametrik Regression, Cambridge University Press, Cambridge.
98
Hesikumalasari, 2016. Pemodelan Regresi Semiparametrik Menggunakan Estimator Campuran Spline Truncated dan Kernel, Tesis, ITS, Surabaya.
Hong, S.Y., 1999. Automatic Bandwith Choice in a Semiparametrik RegressionModel, StatisticaSinica, 9 : 775-794. Kayri, M. and Zirhlioglu, G. (2009).Kernel Smoothing Function and Choosing Bandwitdh for Nonparametric Regression Methods, Ozean Journal of Applied Sciences, 2, 49-54. Koorman, Peter, Wunderink, Sophia, 2001.The Economic of Household Behaviour.ST.Maritines Press Inc, New York Mantra, Ida B., 2006. Demografi Umum, Yogyakarta: Pustaka Pelajar. Michael P.T., 2000, Economic Development, Seventh Edition, Ney York University, Addison Mesley. Montgomery, C. D., & Hines, W. W., 1972.Probability and Statistics in Engineering and Management science (second edition). John Willey & Sons, New York. Mundiharno, 1997.
Beberapa Teori TFR. Diakses pada 02 agustus 2016;
http://www.akademika.or.id/arsip/FER-T-WD.PDF Nadaraya, E.A, (1964), On Estimating Regression. Theory of Probability and its Applications 9(1): 141+2. 141-142. Okumura, H. and Naito, K. (2006), Non-Parametrik Kernel Regression for Multinomial Data, Journal of Multivariate Analysis, 97, 2009-2022. Otok, B.W. (2006). Optimize Knot and Basic Function At Truncated Spline and MultivariateAdapative Regression Spline. Proceedings of the first international conference on mathematics and statistics ICOMS 1 june 1921 2006 Bandung West Java. Indonesia. Purnomo, A.A.S.I, 2016. Estimator Campuran Kernel dan Regresi Spline Truncated Linier Multivariabel dalam Regresi Nonparametrik, Tesis, ITS, Surabaya.
Rencher, Alvin dan Schaalje, G. (2007), Linear Models in Statistics, 2nd Edition, John Willey and Sons Inc., New Jersey. Rismal, 2016. Mixture Model of Spline Truncated and Kernel in Multivariable Nonparametric Regression, Tesis, ITS, Surabaya.
99
Rory, 2016. Regresi Campuran Nonparametrik Spline Linier Truncated dan Fungsi Kernel untuk Pemodelan Data Kemiskinan di Provinsi Papua, Tesis, ITS, Surabaya.
Singarimbun, M., 1996. Penduduk dan Perubahan. Yogyakarta : Pustaka Pelajar Sinuraya, Geser, 1990. Peranan Program Keluarga Berencana Pemerintah Republik Indonesia Terhadap Kependudukan dalam Ketahanan Nasional Indonesia. Medan: USU PRESS. Srivastava Muni, Ashish Sen, 1994. Regression Analysis, Theory, Method, and Application. Springer-Verlag. New York Survei Demografi dan Kesehatan Indonesia, 2012. Diakses pada 02 Agustus 2016; http://chnrl.org/pelatihan-demografi/SDKI-2012.pdf Syisliawati, 2016. Statistical Inference for Curve of Nonparametric Regression with Combination of Spline and Kernel estimator, Tesis, ITS, Surabaya. Wahba G., 1990, Spline Models for Observational Data, SIAM Pensylvania Watson. G.S. (1964), Smooth Regression Analysis.Sankhya: The Indian Journal of Statistic, series A 26 (4), 359-372. Westoff, C.F., 2006. New Estimates of Unmet Need and the Demand for Family Planning. Widarjono, A. (2005). Ekonometrika: Teori dan Aplikasi untuk Ekonomi dan Bisnis. Sleman: Ekonisia Yao, F.(2007), Asymptotic Distribution of Nonparametrik Regression Estimators for Longitudinal or Fuctional Data, Journal of Multivariate Analysis, 98, 40-56.
100
LAMPIRAN Lampiran 1.Data Regresi Campuran Kernel dan Spline Truncated Kota/Kabupaten
Bangkalan
y 1,89
X1 23,64
X2 19,55
X3 41,75
X4 31,77
X5 2,47
t 19960,2
Banyuwangi
2,22
30,00
19,3
65,62
15,05
3,52
37775,8
Blitar
2,42
28,76
20,25
60,25
19,77
3,92
23377,2
Bojonegoro
1,98
27,63
19,39
69,89
9,80
3,08
37723,7
Bondowoso
2,09
32,99
18,32
72,23
6,87
4,04
19029,1
Gresik
2,12
25,37
20,46
66,64
15,41
6,41
80194,7
Jember
2,05
28,63
18,94
67,34
11,60
3,29
23421,1
Jombang
2,14
26,64
19,97
64,96
11,91
4,23
23487,5
Kediri
2,40
26,98
20,25
65,55
16,46
3,31
19706,1
Kota Batu
1,96
26,26
20,15
61,12
20,32
8,25
57408,4
Kota Blitar
2,24
26,71
20,89
62,81
16,01
13,22
34946,3
Kota Kediri
1,94
26,13
20,98
61,22
18,46
9,38
348015,2
Kota Madiun
2,06
28,10
21,56
56,34
22,27
14,2
58237,5
Kota Malang
1,78
26,87
21,21
54,03
17,20
12,76
60881
Kota Mojokerto
1,87
26,34
20,96
64,12
15,13
8,9
38831,1
Kota Pasuruan
2,05
25,07
20,55
58,82
15,21
9,9
30541,2
Kota Probolinggo
2,42
25,59
19,96
69,44
10,05
7,49
35248,7
Kota Surabaya
1,72
27,37
21,02
57,59
21,50
12,95
142595,2
Lamongan
2,04
25,67
19,37
67,47
10,94
4,95
24272,9
Lumajang
1,85
27,87
19,26
69,91
12,50
2,62
23739,9
Madiun
2,03
29,64
20,43
65,32
20,01
3,75
20521,6
101
Magetan
2,22
27,94
20,21
66,86
12,52
4,59
22116,5
Malang
2,31
27,24
19,53
68,55
11,37
3,18
29023
Mojokerto
2,20
26,71
19,8
67,94
14,25
3,29
54442,7
Nganjuk
2,28
27,80
20,13
65,70
13,16
4,03
18359,3
Ngawi
2,10
30,33
19,88
73,92
13,26
3,08
18094,1
Pacitan
2,01
28,12
19,75
71,41
14,63
4,92
21035,6
Pamekasan
2,03
25,91
19,18
53,12
16,50
5,04
14564,8
Pasuruan
1,90
27,32
19,47
63,82
15,55
2,47
65928,8
Ponorogo
2,13
28,29
20,17
52,60
20,50
4,26
17192,6
Probolinggo
2,04
28,26
18,41
70,91
10,77
2,69
22514,9
Sampang
2,45
24,70
18,71
53,02
23,11
2,88
15688,8
Sidoarjo
2,00
26,59
21,11
61,83
13,06
8,91
69131,6
Situbondo
1,78
32,09
18,45
68,72
13,94
5,2
22093
Sumenep
1,52
30,24
18,72
51,78
22,95
2,85
25182,4
Trenggalek
1,94
28,67
19,55
67,42
15,65
3,97
19780
Tuban
1,82
27,16
19,54
69,57
12,90
3,4
41810,7
Tulungagung
2,34
28,20
20,2
56,97
25,88
4,38
27825,4
Keterangan : Y
: Angka Fertilitas Total
X1
: Persentase jumlah status kawin.
X2
: Rata-rata usia kawin pertama.
X3
: Persentase CPR (Contraception Prevalence Rate)
X4
: Persentase unmet need
X5
: Persentase penduduk berpendidikan tinggi
t
: PDRB perkapita
102
Lampiran 2. Program Regresi Campuran Kernel dan Spline Truncated1 Titik KnotMenggunakan Software R library(pracma) data=read.csv('d:/datafaulina.csv',sep=';',header=TRUE) y=data[,1] #variabel y x=as.matrix(data[,2:7]) xk=as.matrix(x[,c(6)]) #variabel kernel xs=as.matrix(x[,c(1,2,3,4,5)]) #variabel spline kn=1 #jumlah titik knot n=length(y) #jumlah pengamatan pk=ncol(xk) #jumlah variabel kernel ps=ncol(xs) #jumlah variabel spline int.kr=50 #jumlah pembagi titik bandwidth yang diinginkan int.sp=50 #jumlah pembagi titik knot yang diinginkan alpha=0.05 #matrix m1.nn=matrix(1, nrow=n, ncol=n) m1.n1=matrix(1, nrow=n) mi.nn=diag(1,n,n)
# matriks 1 nxn # matriks 1 nx1 # matriks identitas nxn
#penentuan titik knot knot=matrix(0,int.sp,ps) for (i in 1:ps) { knot[,i]=seq(min(xs[,i]),max(xs[,i]),length.out=int.sp) } knot=as.matrix(knot[2:(int.sp-1),]) nknot=nrow(knot) if (kn==1){ knot=as.matrix(knot) }else if (kn==2) { #knot2 nkomb=(nknot*(nknot-1)/2) knot2=matrix(0,nkomb,kn*ps) v=1 for (i in 1:(nknot-1)) { for (j in (i+1):nknot) { kk=0 for (l in 1:ps) { a=cbind(knot[i,l],knot[j,l]) kk=cbind(kk,a) } knot2[v,]=kk[1,2:ncol(kk)]
103
v=v+1 } } knot=as.matrix(knot2) nknot=nrow(knot) }else { #knot3 nkomb=(nknot*(nknot-1)*(nknot-2)/6) knot3=matrix(0,nkomb,kn*ps) v=1 for (i in 1:(nknot-2)) { for (j in (i+1):(nknot-1)) { for (k in (j+1):nknot) { kk=0 for (l in 1:ps) { a=cbind(knot[i,l],knot[j,l],knot[k,l]) kk=cbind(kk,a) } knot3[v,]=kk[1,2:ncol(kk)] v=v+1 } } } knot=as.matrix(knot3) nknot=nrow(knot) } #penentuan bandwidth bw=matrix(0,int.kr,pk) for (i in 1:pk) { bw[,i]=seq(0,(max(xk[,i])min(xk[,i])),length.out=int.kr) } bw=as.matrix(bw[2:(int.kr-1),]) nband=nrow(bw) #desain matriks X(k) pada spline MSE=matrix(0,nband*nknot) GCV=matrix(0,nband*nknot) code=matrix(0,nband*nknot,kn*ps+pk) o=1 for (i in 1:nknot) { for (j in 1:nband) {
104
#matrik spline Z=cbind(1,xs) a=1 for (k in 1:ps) { for (l in 1:kn) { Z=cbind(Z,(pmax(0,xs[,k]-knot[i,a]))) a=a+1 } } sum.v.phi=0 for (k in 1:pk) { v.diag=diag(xk[,k]) V=m1.nn %*%v.diag z=(t(V)-V)/bw[j,k] K=1/sqrt(2*pi)*exp(-1/2*z^2) #fungsi kernel gaussian K.Z=(1/bw[j,k])*K W.penyebut=diag(c(1/n*K.Z%*%m1.n1))%*%m1.nn V.phi=1/n*K.Z/W.penyebut #penimbang V(phi).1 sum.v.phi=sum.v.phi+V.phi #nilai kernel untuk setiap variabel } # penimbang kernel gabungan V.phi=sum.v.phi/pk #nilai kernel rata-rata #estimasi parameter beta=0 C=pinv(t(Z)%*%Z)%*%t(Z)%*%(mi.nn-V.phi) beta=C%*%y A=Z%*%C B=A+V.phi yhat=B%*%y error=y-yhat MSE[o]=n^-1*t(error)%*%error db=(n^-1*sum(diag(mi.nn-A-V.phi)^2)) GCV[o]=MSE[i]/(1-db) code[o,]=c(knot[i,],bw[j,]) o=o+1 } } optimum=cbind(code,MSE,GCV) GCVmin=optimum[order(optimum[,(kn*ps+pk+2)]),] #mengurutkan nilai GCV minimum knot.opt=GCVmin[1,1:(kn*ps)] band.opt=GCVmin[1,(kn+ps+1):(kn+ps+pk)] gcv.opt=GCVmin[1,ncol(GCVmin)]
105
#validasi nilai GCV terkecil #matrik spline Z=cbind(1,xs) a=1 for (k in 1:ps) { for (l in 1:kn) { Z=cbind(Z,(pmax(0,xs[,k]-knot.opt[a]))) a=a+1 } } sum.v.phi=0 for (k in 1:pk) { v.diag=diag(xk[,k]) V=m1.nn %*%v.diag z=(t(V)-V)/band.opt[k] K=1/sqrt(2*pi)*exp(-1/2*z^2) #fungsi kernel gaussian K.Z=(1/band.opt[k])*K W.penyebut=diag(c(1/n*K.Z%*%m1.n1))%*%m1.nn V.phi=1/n*K.Z/W.penyebut #penimbang V(phi).1 sum.v.phi=sum.v.phi+V.phi #nilai kernel untuk setiap variabel } # penimbang kernel gabungan V.phi=sum.v.phi/pk #nilai kernel rata-rata #estimasi parameter beta=0 C=pinv(t(Z)%*%Z)%*%t(Z)%*%(mi.nn-V.phi) beta=C%*%y A=Z%*%C B=A+V.phi yhat=B%*%y error=y-yhat db=matrix(NA,nrow=3) SS=matrix(NA,nrow=3) MS=matrix(NA,nrow=3) deci=matrix(0,nrow=(ps*(kn+1)+1)) Fhitung=matrix(NA,nrow=3) db[1]=11 db[2]=n-db[1]-1 db[3]=n-1 SS[1]=sum((yhat-mean(y))^2) SS[2]=sum((y-yhat)^2) SS[3]=sum((y-mean(y))^2) MS[1]=SS[1]/db[1]
106
MS[2]=SS[2]/db[2] R2=(SS[1]/(SS[1]+SS[2]))*100 #Uji F (Uji Serentak) Fhitung[1]=MS[1]/MS[2] ANOVA=cbind(db,SS,MS,Fhitung) colnames(ANOVA)=c("db","SS","MS","Fhitung") rownames(ANOVA)=c("Regresi","Error","Total") Ftabel=qf(0.95,db[1],db[2]) if (Fhitung[1]>Ftabel) {dec='H0 ditolak' }else dec='H0 gagal ditolak' write.csv(cbind(y,yhat,error),file="d:/y_yhat_error.csv") write.csv(Z,file="d:/Z.csv") write.csv(B,file="d:/estimasiparameter.csv") write.csv(GCVmin,file="d:/rangkuman GCV.csv") knot.opt band.opt gcv.opt ANOVA Ftabel dec
107
Lampiran 3. Program Regresi Campuran Kernel dan Spline Truncated2 Titik KnotMenggunakan Software R library(pracma) data=read.csv('d:/datafaulina.csv',sep=';',header=TRUE) y=data[,1] #variabel y x=as.matrix(data[,2:7]) xk=as.matrix(x[,c(6)]) #variabel kernel xs=as.matrix(x[,c(1,2,3,4,5)]) #variabel spline kn=2 #jumlah titik knot n=length(y) #jumlah pengamatan pk=ncol(xk) #jumlah variabel kernel ps=ncol(xs) #jumlah variabel spline int.kr=50 #jumlah pembagi titik bandwidth yang diinginkan int.sp=50 #jumlah pembagi titik knot yang diinginkan alpha=0.05 #matrix m1.nn=matrix(1, nrow=n, ncol=n) m1.n1=matrix(1, nrow=n) mi.nn=diag(1,n,n)
# matriks 1 nxn # matriks 1 nx1 # matriks identitas nxn
#penentuan titik knot knot=matrix(0,int.sp,ps) for (i in 1:ps) { knot[,i]=seq(min(xs[,i]),max(xs[,i]),length.out=int.sp) } knot=as.matrix(knot[2:(int.sp-1),]) nknot=nrow(knot) if (kn==1){ knot=as.matrix(knot) }else if (kn==2) { #knot2 nkomb=(nknot*(nknot-1)/2) knot2=matrix(0,nkomb,kn*ps) v=1 for (i in 1:(nknot-1)) { for (j in (i+1):nknot) { kk=0 for (l in 1:ps) { a=cbind(knot[i,l],knot[j,l]) kk=cbind(kk,a) } knot2[v,]=kk[1,2:ncol(kk)]
108
v=v+1 } } knot=as.matrix(knot2) nknot=nrow(knot) }else { #knot3 nkomb=(nknot*(nknot-1)*(nknot-2)/6) knot3=matrix(0,nkomb,kn*ps) v=1 for (i in 1:(nknot-2)) { for (j in (i+1):(nknot-1)) { for (k in (j+1):nknot) { kk=0 for (l in 1:ps) { a=cbind(knot[i,l],knot[j,l],knot[k,l]) kk=cbind(kk,a) } knot3[v,]=kk[1,2:ncol(kk)] v=v+1 } } } knot=as.matrix(knot3) nknot=nrow(knot) } #penentuan bandwidth bw=matrix(0,int.kr,pk) for (i in 1:pk) { bw[,i]=seq(0,(max(xk[,i])min(xk[,i])),length.out=int.kr) } bw=as.matrix(bw[2:(int.kr-1),]) nband=nrow(bw) #desain matriks X(k) pada spline MSE=matrix(0,nband*nknot) GCV=matrix(0,nband*nknot) code=matrix(0,nband*nknot,kn*ps+pk) o=1 for (i in 1:nknot) { for (j in 1:nband) {
109
#matrik spline Z=cbind(1,xs) a=1 for (k in 1:ps) { for (l in 1:kn) { Z=cbind(Z,(pmax(0,xs[,k]-knot[i,a]))) a=a+1 } } sum.v.phi=0 for (k in 1:pk) { v.diag=diag(xk[,k]) V=m1.nn %*%v.diag z=(t(V)-V)/bw[j,k] K=1/sqrt(2*pi)*exp(-1/2*z^2) #fungsi kernel gaussian K.Z=(1/bw[j,k])*K W.penyebut=diag(c(1/n*K.Z%*%m1.n1))%*%m1.nn V.phi=1/n*K.Z/W.penyebut #penimbang V(phi).1 sum.v.phi=sum.v.phi+V.phi #nilai kernel untuk setiap variabel } # penimbang kernel gabungan V.phi=sum.v.phi/pk #nilai kernel rata-rata #estimasi parameter beta=0 C=pinv(t(Z)%*%Z)%*%t(Z)%*%(mi.nn-V.phi) beta=C%*%y A=Z%*%C B=A+V.phi yhat=B%*%y error=y-yhat MSE[o]=n^-1*t(error)%*%error db=(n^-1*sum(diag(mi.nn-A-V.phi)^2)) GCV[o]=MSE[i]/(1-db) code[o,]=c(knot[i,],bw[j,]) o=o+1 } } optimum=cbind(code,MSE,GCV) GCVmin=optimum[order(optimum[,(kn*ps+pk+2)]),] #mengurutkan nilai GCV minimum knot.opt=GCVmin[1,1:(kn*ps)] band.opt=GCVmin[1,(kn+ps+1):(kn+ps+pk)] gcv.opt=GCVmin[1,ncol(GCVmin)]
110
#validasi nilai GCV terkecil #matrik spline Z=cbind(1,xs) a=1 for (k in 1:ps) { for (l in 1:kn) { Z=cbind(Z,(pmax(0,xs[,k]-knot.opt[a]))) a=a+1 } } sum.v.phi=0 for (k in 1:pk) { v.diag=diag(xk[,k]) V=m1.nn %*%v.diag z=(t(V)-V)/band.opt[k] K=1/sqrt(2*pi)*exp(-1/2*z^2) #fungsi kernel gaussian K.Z=(1/band.opt[k])*K W.penyebut=diag(c(1/n*K.Z%*%m1.n1))%*%m1.nn V.phi=1/n*K.Z/W.penyebut #penimbang V(phi).1 sum.v.phi=sum.v.phi+V.phi #nilai kernel untuk setiap variabel } # penimbang kernel gabungan V.phi=sum.v.phi/pk #nilai kernel rata-rata #estimasi parameter beta=0 C=pinv(t(Z)%*%Z)%*%t(Z)%*%(mi.nn-V.phi) beta=C%*%y A=Z%*%C B=A+V.phi yhat=B%*%y error=y-yhat db=matrix(NA,nrow=3) SS=matrix(NA,nrow=3) MS=matrix(NA,nrow=3) deci=matrix(0,nrow=(ps*(kn+1)+1)) Fhitung=matrix(NA,nrow=3) db[1]=16 db[2]=n-db[1]-1 db[3]=n-1 SS[1]=sum((yhat-mean(y))^2) SS[2]=sum((y-yhat)^2) SS[3]=sum((y-mean(y))^2) MS[1]=SS[1]/db[1]
111
MS[2]=SS[2]/db[2] R2=(SS[1]/(SS[1]+SS[2]))*100 #Uji F (Uji Serentak) Fhitung[1]=MS[1]/MS[2] ANOVA=cbind(db,SS,MS,Fhitung) colnames(ANOVA)=c("db","SS","MS","Fhitung") rownames(ANOVA)=c("Regresi","Error","Total") Ftabel=qf(0.95,db[1],db[2]) if (Fhitung[1]>Ftabel) {dec='H0 ditolak' }else dec='H0 gagal ditolak' write.csv(cbind(y,yhat,error),file="d:/y_yhat_error.csv") write.csv(Z,file="d:/Z.csv") write.csv(B,file="d:/estimasiparameter.csv") write.csv(GCVmin,file="d:/rangkuman GCV.csv") knot.opt band.opt gcv.opt ANOVA Ftabel dec
112
Lampiran 4. Program Regresi Campuran Kernel dan Spline Truncated3 Titik KnotMenggunakan Software R library(pracma) data=read.csv('d:/datafaulina.csv',sep=';',header=TRUE) y=data[,1] #variabel y x=as.matrix(data[,2:7]) xk=as.matrix(x[,c(6)]) #variabel kernel xs=as.matrix(x[,c(1,2,3,4,5)]) #variabel spline kn=3 #jumlah titik knot n=length(y) #jumlah pengamatan pk=ncol(xk) #jumlah variabel kernel ps=ncol(xs) #jumlah variabel spline int.kr=50 #jumlah pembagi titik bandwidth yang diinginkan int.sp=50 #jumlah pembagi titik knot yang diinginkan alpha=0.05 #matrix m1.nn=matrix(1, nrow=n, ncol=n) m1.n1=matrix(1, nrow=n) mi.nn=diag(1,n,n)
# matriks 1 nxn # matriks 1 nx1 # matriks identitas nxn
#penentuan titik knot knot=matrix(0,int.sp,ps) for (i in 1:ps) { knot[,i]=seq(min(xs[,i]),max(xs[,i]),length.out=int.sp) } knot=as.matrix(knot[2:(int.sp-1),]) nknot=nrow(knot) if (kn==1){ knot=as.matrix(knot) }else if (kn==2) { #knot2 nkomb=(nknot*(nknot-1)/2) knot2=matrix(0,nkomb,kn*ps) v=1 for (i in 1:(nknot-1)) { for (j in (i+1):nknot) { kk=0 for (l in 1:ps) { a=cbind(knot[i,l],knot[j,l]) kk=cbind(kk,a)
113
} knot2[v,]=kk[1,2:ncol(kk)] v=v+1 } } knot=as.matrix(knot2) nknot=nrow(knot) }else { #knot3 nkomb=(nknot*(nknot-1)*(nknot-2)/6) knot3=matrix(0,nkomb,kn*ps) v=1 for (i in 1:(nknot-2)) { for (j in (i+1):(nknot-1)) { for (k in (j+1):nknot) { kk=0 for (l in 1:ps) { a=cbind(knot[i,l],knot[j,l],knot[k,l]) kk=cbind(kk,a) } knot3[v,]=kk[1,2:ncol(kk)] v=v+1 } } } knot=as.matrix(knot3) nknot=nrow(knot) } #penentuan bandwidth bw=matrix(0,int.kr,pk) for (i in 1:pk) { bw[,i]=seq(0,(max(xk[,i])min(xk[,i])),length.out=int.kr) } bw=as.matrix(bw[2:(int.kr-1),]) nband=nrow(bw) #desain matriks X(k) pada spline MSE=matrix(0,nband*nknot) GCV=matrix(0,nband*nknot) code=matrix(0,nband*nknot,kn*ps+pk) o=1 for (i in 1:nknot) {
114
for (j in 1:nband) { #matrik spline Z=cbind(1,xs) a=1 for (k in 1:ps) { for (l in 1:kn) { Z=cbind(Z,(pmax(0,xs[,k]-knot[i,a]))) a=a+1 } } sum.v.phi=0 for (k in 1:pk) { v.diag=diag(xk[,k]) V=m1.nn %*%v.diag z=(t(V)-V)/bw[j,k] K=1/sqrt(2*pi)*exp(-1/2*z^2) #fungsi kernel gaussian K.Z=(1/bw[j,k])*K W.penyebut=diag(c(1/n*K.Z%*%m1.n1))%*%m1.nn V.phi=1/n*K.Z/W.penyebut #penimbang V(phi).1 sum.v.phi=sum.v.phi+V.phi #nilai kernel untuk setiap variabel } # penimbang kernel gabungan V.phi=sum.v.phi/pk #nilai kernel rata-rata #estimasi parameter beta=0 C=pinv(t(Z)%*%Z)%*%t(Z)%*%(mi.nn-V.phi) beta=C%*%y A=Z%*%C B=A+V.phi yhat=B%*%y error=y-yhat MSE[o]=n^-1*t(error)%*%error db=(n^-1*sum(diag(mi.nn-A-V.phi)^2)) GCV[o]=MSE[i]/(1-db) code[o,]=c(knot[i,],bw[j,]) o=o+1 } } optimum=cbind(code,MSE,GCV) GCVmin=optimum[order(optimum[,(kn*ps+pk+2)]),] #mengurutkan nilai GCV minimum knot.opt=GCVmin[1,1:(kn*ps)]
115
band.opt=GCVmin[1,(kn+ps+1):(kn+ps+pk)] gcv.opt=GCVmin[1,ncol(GCVmin)] #validasi nilai GCV terkecil #matrik spline Z=cbind(1,xs) a=1 for (k in 1:ps) { for (l in 1:kn) { Z=cbind(Z,(pmax(0,xs[,k]-knot.opt[a]))) a=a+1 } } sum.v.phi=0 for (k in 1:pk) { v.diag=diag(xk[,k]) V=m1.nn %*%v.diag z=(t(V)-V)/band.opt[k] K=1/sqrt(2*pi)*exp(-1/2*z^2) #fungsi kernel gaussian K.Z=(1/band.opt[k])*K W.penyebut=diag(c(1/n*K.Z%*%m1.n1))%*%m1.nn V.phi=1/n*K.Z/W.penyebut #penimbang V(phi).1 sum.v.phi=sum.v.phi+V.phi #nilai kernel untuk setiap variabel } # penimbang kernel gabungan V.phi=sum.v.phi/pk #nilai kernel rata-rata #estimasi parameter beta=0 C=pinv(t(Z)%*%Z)%*%t(Z)%*%(mi.nn-V.phi) beta=C%*%y A=Z%*%C B=A+V.phi yhat=B%*%y error=y-yhat db=matrix(NA,nrow=3) SS=matrix(NA,nrow=3) MS=matrix(NA,nrow=3) deci=matrix(0,nrow=(ps*(kn+1)+1)) Fhitung=matrix(NA,nrow=3) db[1]=21 db[2]=n-db[1]-1 db[3]=n-1 SS[1]=sum((yhat-mean(y))^2) SS[2]=sum((y-yhat)^2)
116
SS[3]=sum((y-mean(y))^2) MS[1]=SS[1]/db[1] MS[2]=SS[2]/db[2] R2=(SS[1]/(SS[1]+SS[2]))*100 #Uji F (Uji Serentak) Fhitung[1]=MS[1]/MS[2] ANOVA=cbind(db,SS,MS,Fhitung) colnames(ANOVA)=c("db","SS","MS","Fhitung") rownames(ANOVA)=c("Regresi","Error","Total") Ftabel=qf(0.95,db[1],db[2]) if (Fhitung[1]>Ftabel) {dec='H0 ditolak' }else dec='H0 gagal ditolak' write.csv(cbind(y,yhat,error),file="d:/y_yhat_error.csv" ) write.csv(Z,file="d:/Z.csv") write.csv(B,file="d:/estimasiparameter.csv") write.csv(GCVmin,file="d:/rangkuman GCV.csv") knot.opt band.opt gcv.opt ANOVA Ftabel dec
117
“Halaman ini sengaja dikosongkan”
118
BIOGRAFI PENULIS
Penulis bernama Faulina Khusniawati, dilahirkan di Kota Mojokerto, Provinsi Jawa Timur pada tanggal 08 Maret 1991. Penulis merupakan anak pertama dari dua bersaudara yakni penulis dan adik penulis bernama Rifqi Nur Fajari yang lahir dari pasangan suami-istri bapak H. Bukhori, BA dan Ibu Hj. Atik Salamah, S.Pd, M.Pd.I. Penulis merupakan istri dari H. Mochamad Hasan Bisri, drg juga menantu dari Bapak AKP H. Achmad Mudjiono, SH dan Ibu Hj. Choiridah, S.Pd., M.Si. Penulis menyelesaikan pendidikan formal sekolah dasar di Madrasah Ibtidaiyah (MI) Al-Mukhsinun pada tahun 2003, kemudian menyelesaikan pendidikan sekolah menengah tingkat pertama di SMP Islam Brawijaya Mojokerto tahun 2006. Selanjutnya menyelesaikan pendidikan sekolah menengah tingkat atas di SMA Darul Ulum 2 Jombang pada tahun 2009. Pada tahun 2009 tersebut, penulis melanjutkan pendidikan ke jenjang perguruan tinggi sarjana jurusan Matematika di Universitas Airlangga Surabaya. Pada Agustus 2015, penulis mendapatkan kesempatan untuk melanjutkan pendidikan pada Program Magister Jurusan Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) di Institut Teknologi Sepuluh Nopember
(ITS) Surabaya.
Penulis dapat
dihubungi di alamat
[email protected].
Penulis Surabaya, Januari 2017
119
email