TESIS – SS14 2501
PENGUJIAN HIPOTESIS SIMULTAN DALAM REGRESI SEMIPARAMETRIK SPLINE TRUNCATED (Studi Kasus: Angka Partisipasi Kasar SLTA Tahun 2015 di Provinsi Jawa Timur)
KIKI FERDIANA NRP.1315201707
DOSEN PEMBIMBING Prof. Dr. Drs. I Nyoman Budiantara, M.Si. R. Mohamad Atok, S.Si., M.Si., Ph.D.
PROGRAM MAGISTER JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2017
THESIS – SS14 2501
SIMULTANEOUS HYPOTHESIS TESTING IN TRUNCTED SPLINE SEMIPARAMETRIC REGRESSION (Case Study: Gross Enrolment Ratio at Upper Secondary School in East Java 2015)
KIKI FERDIANA NRP.1315201707
SUPERVISOR Prof. Dr. Drs. I Nyoman Budiantara, M.Si. R. Mohamad Atok, S.Si., M.Si., Ph.D.
MASTER PROGRAM DEPARTMENT OF STATISTICS FACULTY OF MATHEMATICS AND NATURAL SCIENCE INSTITUTE OF TECHNOLOGY SEPULUH NOPEMBER SURABAYA 2017
PENGUJIAN HIPOTESIS SIMULTAN DALAM REGRESI SEMIPARAMETRIK SPLINE TRUNCATED (Studi Kasus: Angka Partisipasi Kasar SLTA Tahun 2015 di Provinsi Jawa Timur) Nama Mahasiswa : Kiki Ferdiana NRP : 1315201707 Dosen Pembimbing I : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dosen Pembimbing II : R. Mohamad Atok, S.Si, M.Si, Ph.D
ABSTRAK Pengujian hipotesis dalam inferensi statistik sangat penting untuk dilakukan. Salah satu pendekatan dalam analisis regresi adalah regresi semiparametrik spline truncated. Kajian teoritis tentang pengujian hipotesis dilakukan untuk mendapatkan statistik uji dan distribusi statistik uji. Kajian teoritis tentang pengujian hipotesis pada regresi semiparametrik spline truncated belum pernah dilakukan. Oleh karena itu pada penelitian ini dilakukan kajian pengujian hipotesis secara simultan baik itu secara teori maupun terapan. Kajian terapan dilakukan pada data Angka Partisipasi Kasar (APK) SLTA di Provinsi Jawa Timur pada Tahun 2015. Karena APK SLTA di Provinsi Jawa Timur masih rendah, sedangkan Provinsi Jawa Timur merupakan provinsi yang maju baik dari segi perekonomian maupun infrastrukturnya. Dari kajian teori dihasilkan bahwa statistik uji pada pengujian hipotesis simultan adalah ̃ ̃ [
dan
(
̃) . (
̃) (
̃ )/
(
̃ ) ̃ ⁄,(
(
̃) . (
̃) (
̃ )/
(
̃ )] ̃ ,
distribusi
) (
) -
( )
(
) -
statistik
uji yang dihasilkan mengikuti distribusi Metode yang digunakan adalah metode (( ) ( ) ( ) ( ) ). Likelihood Ratio Test (LRT). Pada kajian terapan yang diaplikasikan pada data APK SLTA di Provinsi Jawa Timur Tahun 2015, model yang didapatkan adalah dengan menggunakan kombinasi knot (3,1,2,3) dengan koefisien determinasi ( ) sebesar 83,19 persen. Variabel yang signifikan adalah jumlah penduduk miskin, rasio jenis kelamin, rata-rata anggota rumah tangga (ART), tingkat pengangguran terbuka (TPT) dan Produk Domestik Regional Bruto (PDRB) perkapita. Dari hasil penelitian ini diharapkan dapat dijadikan masukan untuk mengambil kebijakan bagi Provinsi Jawa Timur dalam meningkatkan APK SLTA.
Kata kunci : Angka Partisipasi Kasar (APK), Likelihood Ratio Test (LRT), uji hipotesis simultan, semiparametrik, spline truncated
iii
”Halaman ini sengaja dikosongkan”
iv
SIMULTANEOUS HYPOTHESIS TESTING OF SPLINE TRUCATED SEMIPARAMETRIC REGRESSION (Case Study: Gross Enrolment Ratio at Upper Secondary School 2015 in East Java) By : Kiki Ferdiana Student Identity Number : 1315201707 Supervisor : Prof. Dr.Drs. I Nyoman Budiantara, M.Si Co Supervisor : R. Mohamad Atok, S.Si, M.Si, Ph.D
ABSTRACT Hypothesis testing in statistical inference is very important. An approach in the regression analysis is truncated spline semiparametric regression. Theoretical study of hypothesis testing was done to obtain test statistics and distributions of test statistical. Theoretical study of hypothesis testing in truncated spline semiparametric regression has not been done. Therefore, in this research was conducted both the theoretical and applied study on simultaneous hypothesis testing. Applied study conducted on upper secondary school gross enrollment rate (GER) data in East Jawa Province in 2015. The GER of upper secondary school in East Java is still low, while East Jawa Province is advanced in terms of both the economy and infrastucture. From the theoretical study resulted that test statistical of simultaneous hypothesis testing is ̃ ̃ [
(
̃) . (
̃) (
̃ )/
(
̃ ) ̃ ⁄,(
(
̃) . (
̃) (
̃ )/
(
̃ )] ̃ ,
) (
) -
( )
(
) -
and distribution of test statictics generated following the distribution (( ) ( ) ( ) ( ) ) . The method used is the Likelihood Ratio Test (LRT). In the applied study of APK upper secondary school in East Jawa Province in 2015, a model which is obtained by using a combination of knots (3,1,2,3) with the coefficient of determination (R2) is 83,19 percent. Significant variables are the number of poor people, sex ratio, the average members of the household, unemployment rate and Gross Domestic Product (GDP) per capita. This result is expected to be used as input for taking policy for East Java Province in improving APK upper secondary school.
Key words : Gross Enrolment Ratio (GER), Likelihood Ratio Test (LRT), simultaneous hypothesis testing, semiparametric, spline truncated
v
”Halaman ini sengaja dikosongkan”
vi
KATA PENGANTAR Puji dan syukur penulis panjatkan kehadirat Allah SWT karena atas berkat rahmat dan hidayah-Nya penulis diperkenankan menyelesaikan tesis yang berjudul “Pengujian Hipotesis Simultan dalam Regresi Semiparametrik Spline Truncated (Studi Kasus: Angka Partisipasi Kasar SLTA Tahun 2015 di Provinsi Jawa Timur” dengan baik dan tepat waktu. Dalam penyusunan tesis ini, penulis memperoleh banyak bantuan dari berbagai pihak baik secara langsung maupun tidak langsung. Untuk itu pada kesempatan ini penulis ingin menyampaikan penghargaan dan ucapan terima kasih yang sebesar-besarnya kepada: 1.
Badan Pusat Statistik (BPS) Republik Indonesia, Kepala BPS Provinsi Kalimantan Tengah dan Kepala BPS Kabupaten Kapuas yang telah memberikan kesempatan kepada penulis untuk melanjutkan studi program pascasarjana di ITS Surabaya.
2.
Bapak Prof. Dr. Drs. I Nyoman Budiantara, M.Si. dan Bapak R. Mohamad Atok, S.Si., M.Si., Ph.D. selaku dosen pembimbing yang ditengah segala kesibukannya dapat meluangkan waktu untuk memberikan bimbingan, saran, masukan serta motivasi selama penyusunan tesis ini.
3.
Ibu Dr. Vita Ratnasari, S,Si., M.Si., Bapak Dr. I Nyoman Latra, M.S. dan Bapak Dr. Heru Margono, M.Sc. selaku dosen penguji yang telah memberikan saran dan masukan untuk menjadikan tesis ini menjadi lebih baik.
4.
Bapak Dr. Suhartono, M.Sc. selaku Ketua Jurusan Statistika, Bapak Dr. rer. pol. Heri Kuswanto, S.Si., M.Si. selaku Ketua Program Studi Pascasarjana Jurusan Statistika, Ibu Dr. Kartika Fithriasari, M.Si. selaku dosen wali, dan seluruh Bapak/Ibu dosen pengajar yang telah memberikan ilmu, saran, masukan dan pengalaman yang bermanfaat bagi penulis, serta segenap karyawan keluarga besar Jurusan Statistika FMIPA ITS Surabaya atas segala dukungan dan bantuannya selama ini.
vii
5.
Alm. Bapak dan Ibu tersayang serta Bapak dan Ibu di Tangerang atas segala doa dan dukungannya dalam proses penulisan tesis ini.
6.
Suami tercinta, Papa Harisman, juga anak-anakku tercinta, Maila Riski Azzahra dan Khanza Riski Almaira, terima kasih atas segala doa, pengorbanan, pengertian, dukungan dan cinta yang tak pernah berhenti yang selalu menjadi semangat bagi penulis untuk menyelesaikan studi dengan baik.
7.
Teman-teman seperjuangan angkatan 9: Ervin (teman suka dan duka dalam menyelesaikan tesis ini), Tiara, Mbak Nunik, Mbak Ayu, Mbak Dewi, Mbak Ika, Risma, Irva, Mbak Lyla, Mbak Mety, Aty, Mas Agung, Mas Dinu, Mas Arif, Leman, Bayu, Bang Node, Mas Bambang dan Suko, kalian adalah teman yang sangat baik dan hebat. Terima kasih atas kebersamaan dan kekompakan selama menjalani studi di ITS, bersyukur bisa bertemu dan mengenal teman-teman semua, semoga dapat berjumpa lagi di lain kesempatan.
8.
Teman-teman reguler angkatan 2015, Mbak Mia, Dik Wawan sekeluarga, Rephy dan semua keluarga besar BPS Kabupaten Kapuas serta semua pihak yang tidak bisa disebutkan satu persatu. Penulis menyampaikan terima kasih atas semua dukungan dan bantuan yang diberikan selama menjalani studi. Penulis menyadari bahwa tesis ini masih jauh dari sempurna. Oleh karena
itu, kritik maupun saran yang bersifat membangun sangat penulis harapkan demi perbaikan tesis ini. Akhirnya, penulis berharap mudah-mudahan tesis ini bermanfaat untuk semua pihak yang memerlukan.
Surabaya,
Januari 2017
Penulis
viii
DAFTAR ISI LEMBAR PENGESAHAN......................................................................................i ABSTRAK ............................................................................................................. iii ABSTRACT ............................................................................................................ v KATA PENGANTAR .......................................................................................... vii DAFTAR ISI .......................................................................................................... ix DAFTAR TABEL ................................................................................................ xiii DAFTAR GAMBAR ............................................................................................ xv DAFTAR LAMPIRAN ....................................................................................... xvii BAB 1 PENDAHULUAN ...................................................................................... 1 1.1. Latar Belakang ..................................................................................... 1 1.2. Rumusan Permasalahan ....................................................................... 6 1.3. Tujuan Penelitian ................................................................................. 7 1.4. Manfaat Penelitian ............................................................................... 7 1.5. Batasan Permasalahan .......................................................................... 8 BAB 2 TINJAUAN PUSTAKA ............................................................................. 9 2.1. Analisis Regresi ................................................................................... 9 2.2. Regresi Parametrik ............................................................................... 9 2.3. Regresi Nonparametrik ...................................................................... 10 2.4. Regresi Semiparametrik ..................................................................... 11 2.5. Spline Truncated dalam Regresi Semiparametrik.............................. 12 2.6. Pemilihan Titik Knot Optimal............................................................ 16 2.7. Likelihood Ratio Test (LRT) .............................................................. 16 2.8. Pengujian Parameter Dalam Regresi Parametrik ............................... 17 2.8.1. Uji Simultan/Serentak ............................................................ 17 2.8.2. Uji Parsial/Individu ................................................................ 18 2.9. Uji dan Deteksi Asumsi Residual ...................................................... 19
ix
2.9.1. Uji Normalitas ........................................................................ 19 2.9.2. Deteksi Independen ................................................................ 20 2.9.3. Uji Identik ............................................................................... 20 2.10. Teorema Dasar Terkait dengan Aljabar Matriks .............................. 21 2.11. Tinjauan Non Statistik ...................................................................... 22 2.11.1. Penduduk Usia Sekolah ........................................................ 22 2.11.2. Angka Partisipasi Kasar (APK) ............................................ 22 2.11.3. Faktor-Faktor Yang Mempengaruhi Angka Partisipasi Kasar ...................................................................................... 24 BAB 3 METODOLOGI PENELITIAN ................................................................ 33 3.1. Sumber Data ....................................................................................... 33 3.2. Variabel Penelitian ............................................................................. 33 3.3. Tahapan Penelitian ............................................................................. 33 BAB 4 HASIL DAN PEMBAHASAN ................................................................. 37 4.1. Model Regresi Semiparametrik Spline Truncated ............................. 37 4.1.1. Estimasi Titik untuk Kurva Regresi Semiparametrik ............. 37 4.1.2. Perumusan Uji Hipotesis ........................................................ 41 4.1.3. Estimasi Parameter dibawah Ruang
( ) dan
( ) .......... 42
4.1.4. Menentukan Statistik Uji Hipotesis ........................................ 44 4.1.5. Mendapatkan Distribusi Statistik Uji Hipotesis ..................... 50 4.1.6. Menentukan Daerah Penolakan Uji Hipotesis
.................. 56
4.2. Aplikasi pada Data APK SLTA Tahun 2015 di Provinsi Jawa Timur58 4.2.1. Analisis Deskriptif .................................................................. 58 4.2.2. Memodelkan APK SLTA menggunakan Regresi Linier Berganda ................................................................................ 60 4.2.2.1. Pengujian Signifikan Parameter secara Simultan ... 60 4.2.2.2. Pengujian Signifikan Parameter secara Parsial ....... 61 4.2.2.3. Pengujian Asumsi Residual .................................... 61 4.2.2.3.1. Pengujian Asumsi Identik ..................... 62 x
4.2.2.3.2. Pemeriksaan Asumsi Independen ......... 62 4.2.2.3.3. Pengujian Asumsi Distribusi Normal ... 63 4.2.3. Memodelkan APK SLTA menggunakan Regresi Semiparametrik Spline Truncated ......................................... 64 4.2.3.1. Menentukan Variabel Komponen Parametrik dan Nonparametrik ........................................................ 64 4.2.3.2. Memodelkan APK SLTA Provinsi Jawa Timur Menggunakan Satu Titik Knot ............................... 69 4.2.3.3. Memodelkan APK SLTA Provinsi Jawa Timur Menggunakan Dua Titik Knot ................................ 70 4.2.3.4. Memodelkan APK SLTA Provinsi Jawa Timur Menggunakan Tiga Titik Knot ............................... 71 4.2.3.5. Memodelkan APK SLTA Provinsi Jawa Timur Menggunakan Kombinasi Titik Knot ..................... 72 4.2.3.6. Memilih Titik Knot Optimum dengan Menggunakan GCV ................................................ 73 4.2.3.7. Model Regresi Semiparametrik Spline Truncated dengan Titik Knot Optimum................................... 73 4.2.3.8. Pengujian Signifikansi Parameter secara Simultan 74 4.2.3.9. Pengujian Signifikansi Parameter secara Parsial .... 75 4.2.3.10. Pengujian Asumsi Residual .................................... 76 4.2.3.10.1. Pengujian Asumsi Identik ..................... 76 4.2.3.10.2. Pemeriksaan Asumsi Independen ......... 77
4.2.3.10.3. Pengujian Asumsi Distribusi Normal ... 77 4.2.4. Perbandingan Model .............................................................. 79 4.2.5. Interpretasi Model Regresi Semiparametrik Spline Truncated ............................................................................... 79
xi
BAB 5 KESIMPULAN DAN SARAN ................................................................. 87 5.1. Kesimpulan ......................................................................................... 87 5.2. Saran ................................................................................................... 88 DAFTAR PUSTAKA ............................................................................................ 89 LAMPIRAN .......................................................................................................... 95 BIOGRAFI PENULIS ......................................................................................... 117
xii
DAFTAR TABEL Tabel 2.1 Analisis Varians Model Regresi ......................................................... 18 Tabel 4.1 Statistik Deskriptif Variabel Respon dan Variabel Prediktor ............. 58 Tabel 4.2 ANOVA Hasil Regresi Linier Berganda ............................................ 60 Tabel 4.3 Hasil Uji Hipotesis secara Parsial ....................................................... 61 Tabel 4.4 Hasil Uji Glejser ................................................................................. 62 Tabel 4.5 Ringkasan Penentuan Komponen Parametrik dan Nonparametrik ..... 68 Tabel 4.6 Nilai GCV dengan Satu Titik Knot ..................................................... 69 Tabel 4.7 Nilai GCV dengan Dua Titik Knot ..................................................... 70 Tabel 4.8 Nilai GCV dengan Tiga Titik Knot..................................................... 71 Tabel 4.9 Nilai GCV dengan Kombinasi Titik Knot .......................................... 72 Tabel 4.10 Nilai GCV Minimum pada Tiap Model .............................................. 73 Tabel 4.11 ANOVA Hasil Regresi Semiparametrik Spline Truncated ................ 74 Tabel 4.12 Hasil Uji Hipotesis secara Parsial ....................................................... 75 Tabel 4.13 Hasil Uji Glejser ................................................................................. 76 Tabel 4.14 Nilai R2 dan R2 adjusted ..................................................................... 79
xiii
”Halaman ini sengaja dikosongkan”
xiv
DAFTAR GAMBAR Gambar 2.1 Kerangka Konseptual Determinan Pendidikan Menurut World Bank (World Bank, 2007) ............................................................... 25 Gambar 2.2 Kerangka Konseptual Determinan Pendidikan Menurut Bappenas (Bappenas, 2009) ............................................................................ 26 Gambar 4.1 Plot ACF Residual........................................................................... 63 Gambar 4.2 Probability Plot Residual ................................................................ 64 Gambar 4.3 Scatter Plot antara APK SLTA dengan Jumlah Penduduk Miskin . 65 Gambar 4.4 Scatter Plot antara APK SLTA dengan Rasio Jenis Kelamin ......... 66 Gambar 4.5 Scatter Plot antara APK SLTA dengan Rata-rata ART .................. 66 Gambar 4.6 Scatter Plot antara APK SLTA dengan TPT .................................. 67 Gambar 4.7 Scatter Plot antara APK SLTA dengan PDRB Perkapita ............... 68 Gambar 4.8 Plot ACF Residual........................................................................... 77 Gambar 4.9 Probability Plot Residual ................................................................ 78 Gambar 4.10 Peta APK SLTA terhadap Rasio Jenis Kelamin ............................. 81 Gambar 4.11 Peta APK SLTA terhadap rata-rata ART ........................................ 82 Gambar 4.12 Peta APK SLTA terhadap TPT ....................................................... 84 Gambar 4.13 Peta APK SLTA terhadap PDRB Perkapita .................................... 85
xv
”Halaman ini sengaja dikosongkan”
xvi
DAFTAR LAMPIRAN Lampiran 1. Data dan Struktur Data yang Digunakan .......................................... 95 Lampiran 2. Program Regresi Semiparametrik Spline Truncated Satu Titik Knot .................................................................................................. 97 Lampiran 3. Program Regresi Semiparametrik Spline Truncated Dua Titik Knot ................................................................................................ 100 Lampiran 4. Program Regresi Semiparametrik Spline Truncated Tiga Titik Knot ................................................................................................ 103 Lampiran 5. Program Regresi Semiparametrik Spline Truncated Kombinasi Titik Knot ....................................................................................... 106 Lampiran 6. Uji Signifikansi Parameter.............................................................. 112 Lampiran 7. Uji Glejser ...................................................................................... 115
xvii
“Halaman ini sengaja dikosongkan”
xviii
BAB 1 PENDAHULUAN 1.1. Latar Belakang Salah satu metode dalam statistika yang banyak digunakan untuk mengestimasi hubungan antara variabel respon dan variabel prediktor adalah analisis regresi. Analisis regresi parametrik adalah analisis yang paling banyak digunakan. Dalam regresi parametrik terdapat banyak asumsi yang harus dipenuhi, salah satunya adalah bentuk kurva regresi yang harus diketahui, bisa berbentuk linier, kuadratik, kubik dan lain-lain. Menurut Budiantara (2009) apabila bentuk kurva regresi tidak diketahui polanya, maka analisis regresi nonparametrik lebih disarankan untuk digunakan. Beberapa contoh model regresi nonparametrik yang banyak digunakan antara lain adalah histogram, kernel, spline, deret fourier, wavelets, MARS, dan lain sebagainya. Diantara beberapa model regresi nonparametrik tersebut, dalam beberapa dekade terakhir model spline lebih banyak diminati dan mendapatkan perhatian dari para peneliti regresi nonparametrik, karena model spline merupakan model yang mempunyai interpretasi statistik dan interpretasi visual sangat khusus dan sangat baik (Eubank, 1999; Budiantara, 2009). Menurut Budiantara (2009), data yang memiliki pola berubah-ubah pada sub-sub interval tertentu sebaiknya dimodelkan dengan menggunakan metode spline. Budiantara (2005) mengembangkan estimator spline dalam regresi nonparametrik dengan menggunakan basis fungsi keluarga spline truncated. Pendekatan dengan menggunakan basis fungsi spline truncated ini memberikan perhitungan matematik yang lebih mudah dan sederhana, dan optimasi yang digunakan tanpa melibatkan penalty yaitu optimasi least square (LS). Wahba (1990) memberikan metode untuk memilih parameter penghalus optimal dalam estimator spline yaitu dengan Generalized Cross Validation (GCV). Penelitian yang menggunakan regresi nonparametrik spline truncated antara lain Merdekawati (2013) melakukan pemodelan regresi spline truncated multivariabel pada faktor-faktor yang mempengaruhi kemiskinan di Provinsi Jawa
1
Tengah. Bintariningrum (2014) juga melakukan pemodelan regresi nonparametrik spline truncated pada angka kelahiran kasar di Surabaya. Purnomo (2016) melakukan pemodelan spline truncated campuran dengan kernel dalam regresi nonparametrik pada rata-rata lama sekolah di Provinsi Jawa Tengah. Begitu juga dengan Rory (2016) melakukan penelitian dengan menggunakan regresi campuran nonparametrik spline truncated dan kernel dalam data kemiskinan di Papua. Pada beberapa penelitian, variabel respon dapat memiliki hubungan linier dengan sebagian variabel prediktor, dan memiliki pola hubungan yang tidak diketahui bentuk kurva regresinya dengan sebagian variabel prediktor yang lain. Pada kasus seperti ini, lebih disarankan untuk menggunakan pendekatan regresi semiparametrik (Wahba, 1990; Eubank, 1999; Budiantara, 2005). Engle (1986) memperkenalkan regresi semiparametrik untuk mengestimasi hubungan antara cuaca dan penjualan listrik dengan pendekatan spline linier. Wei dan Wang (2016) mempertimbangkan estimasi untuk model semiparametrik dengan adanya multikolinieritas. Penelitian lain yang menggunakan regresi semiparametrik antara lain Sriliana (2012) yang melakukan penelitian dengan menggunakan regresi semiparametrik spline truncated dalam model linier parsial untuk data longitudinal. Solikhin (2014) mengkaji estimator spline truncated linier dalam regresi semiparametrik pada data persentase pengeluaran konsumsi padi-padian di Provinsi Jawa Tengah. Nuryanti (2016) melakukan pemodelan kemiskinan di Provinsi Jawa Barat dengan regresi semiparametrik. Inferensi statistik, khususnya pengujian terhadap parameter model untuk mengetahui apakah parameter tersebut signifikan terhadap model, sangat penting untuk dilakukan. Kajian tentang pengujian hipotesis khususnya pada regresi semiparametrik spline truncated belum pernah dilakukan. Kajian ini sangat penting karena dapat digunakan untuk mengetahui bentuk dari hipotesis, penurunan untuk mendapatkan statistik uji dan daerah penolakan dari pengujian hipotesis secara simultan khususnya pada regresi semiparametrik spline truncated. Zaki (2007) telah melakukan kajian tentang inferensi uji Generalized Maximum Likelihood (GML) untuk menguji hipotesis dalam model regresi nonparametrik spline dan menyelidiki perilaku uji GML yang dibandingkan dengan uji Locally Most Powerful (LMP) dengan menggunakan data simulasi. Tupen (2011) juga 2
telah melakukan kajian tentang uji hipotesis dalam regresi nonparametrik spline truncated. Ruliana,dkk (2016) melakukan kajian tentang pengujian hipotesis simultan pada model spline pada Structural Equation Modeling (SEM) Nonlinier. Dalam penelitian ini akan dikembangkan model spline truncated pada regresi semiparametrik, khususnya melakukan kajian tentang uji hipotesis secara simultan dalam regresi semiparametrik spline truncated. Pengujian hipotesis telah banyak dilakukan pada berbagai bidang keilmuan, salah satunya adalah pada bidang sosial. Penelitian bidang sosial, diantaranya penelitian indikator-indikator pendidikan merupakan bidang yang sesuai untuk penerapan regresi semiparametrik spline truncated. Hal ini disebabkan karena hubungan antara variabel respon dengan sebagian variabel prediktor cenderung tidak diketahui pola hubungannya, namun dengan sebagian variabel prediktor lainnya membentuk hubungan linier. Pada awal tahun 2016, tepatnya mulai 1 Januari 2016, Indonesia memasuki pasar bebas Asia Tenggara atau lebih dikenal dengan sebutan Masyarakat Ekonomi Asean (MEA). Sepuluh negara anggota ASEAN melakukan kesepakatan ini pada tahun 2007 yang akan menciptakan pasar tunggal di kawasan
Asia
Tenggara.
Persaingan
perekonomian,
terutama
masalah
perdagangan dan tenaga kerja akan semakin ketat menjelang pemberlakuan MEA. Persaingan di bidang tenaga kerja menjadi salah satu topik menarik untuk dibahas. MEA memberikan peluang untuk membuka pasar tenaga kerja profesional. Ada delapan profesi yang dibuka, yaitu insinyur, arsitek, perawat, tenaga survei, tenaga pariwisata, praktisi medis, dokter gigi, dan akuntan. Persaingan dibidang tenaga kerja ini memberikan dampak positif dan juga negatif bagi penduduk Indonesia. Kesiapan Sumber Daya Manusia (SDM) dalam menghadapi persaingan ini akan berdampak positif, namun jika SDM masih belum siap menghadapi persaingan ini maka akan berdampak negatif, dan bahkan bisa mendorong peningkatan pengangguran. Pendidikan dasar 9 (sembilan) tahun sudah tidak relevan lagi jika Indonesia ingin berpartisipasi dalam pasar tenaga kerja profesional. Dalam era MEA diharapkan penduduk Indonesia minimal berpendidikan SLTA. Hal ini sesuai dengan program yang telah digalakkan pemerintah yaitu wajib belajar 12 tahun. 3
Pendidikan merupakan elemen yang sangat penting untuk meningkatkan kualitas SDM. SDM yang berkualitas dapat mempercepat pembangunan suatu bangsa. Sehingga dapat dikatakan pendidikan merupakan salah satu investasi SDM jangka panjang (long-term human capital investment). Pendidikan juga merupakan
aspek
dasar
yang
digunakan
dalam
penghitungan
Indeks
Pembangunan Manusia (IPM), yang merupakan indeks yang dapat mengukur keberhasilan
dalam
upaya
membangun
kualitas
hidup
manusia
(masyarakat/penduduk). Dalam penghitungan IPM metode baru, ketiga aspek yaitu aspek standar hidup layak, aspek kesehatan dan aspek pendidikan harus menunjukkan kinerja yang bagus, karena ketiga aspek yang digunakan tidak bisa saling menutupi. Oleh karenanya aspek pendidikan juga harus terus ditingkatkan untuk mendapatkan kemajuan dan pemerataan pembangunan. Ada beberapa indikator pendidikan yang dapat dilihat untuk mengetahui kualitas SDM suatu wilayah di bidang pendidikan, diantaranya adalah Angka Partisipasi Sekolah (APS), Angka Partisipasi Kasar (APK) dan Angka Partisipasi Murni (APM). Indikator-indikator ini secara umum merupakan ukuran daya serap sistem pendidikan terhadap penduduk usia sekolah. Untuk mengukur daya serap sistem pendidikan terhadap penduduk usia sekolah di masing-masing jenjang pendidikan dapat dilihat pada nilai APK. Nilai APK tingkat SLTA di seluruh provinsi di Indonesia masih berada di bawah nilai APK SD dan SLTP. Pada tahun 2015 nilai APK tingkat SLTA Provinsi Jawa Timur menduduki urutan ke-21 dari 34 provinsi di Indonesia, hal ini menjadi menarik karena karakteristik Provinsi Jawa Timur yang merupakan provinsi yang sudah maju dari segi ekonomi, kesehatan dan infrastruktur. Dilihat dari segi ekonomi, distribusi PDRB Provinsi Jawa Timur menduduki urutan kedua setelah Provinsi DKI Jakarta yaitu sebesar 14,4 persen. Dari segi demografi, Provinsi Jawa Timur merupakan provinsi dengan jumlah penduduk terbesar kedua setelah Provinsi Jawa Barat yaitu sebesar 38,8 juta jiwa. Dari segi infrastruktur, Ibukota Provinsi Jawa Timur yaitu Surabaya merupakan ibukota terbesar kedua setelah Jakarta dan merupakan kota metropolitan, sehingga dapat dikatakan infrastruktur Provinsi Jawa Timur sudah cukup maju. Dari segi kesehatan, Angka Harapan Hidup (AHH) saat lahir Provinsi Jawa Timur menduduki peringkat ke-10 4
yaitu sebesar 70,45. Dari bidang pendidikan sendiri, Provinsi Jawa Timur merupakan provinsi dengan jumlah perguruan tinggi terbanyak di Indonesia. Berdasarkan fakta ini menjadikan suatu pertanyaan kenapa pendidikan khususnya di tingkat SLTA di Provinsi Jawa Timur masih rendah. Provinsi Jawa Timur merupakan salah satu provinsi yang memfokuskan pembangunan pada bidang pendidikan. Seperti tercantum dalam tujuan kedua dari misi pertama Rencana Pembangunan Jangka Menengah Daerah (RPJMD) Provinsi Jawa Timur Tahun 2014-2019 adalah “Meningkatkan Pemerataan dan Perluasan Akses Pendidikan”. Provinsi Jawa Timur telah berhasil mewujudkan wajib belajar 9 tahun yang telah dicanangkan pemerintah sejak tahun 1989, walaupun belum mencapai 100 persen. Hal ini dapat dilihat dari tingginya nilai APS, APK dan APM tingkat Sekolah Dasar (SD) dan Sekolah Lanjutan Tingkat Pertama (SLTP). Pencapaian APS pada kelompok umur 7-12 tahun Provinsi Jawa Timur Tahun 2015 mencapai 99,45 dan APS pada kelompok umur 13-15 tahun sebesar 96,53, sementara APK tingkat SD sebesar 108,64 dan APK tingkat SLTP sebesar 91,16, sedangkan untuk APM tingkat SD pada Tahun 2015 sebesar 97,38 dan APM tingkat SLTP sebesar 81,16. Provinsi Jawa Timur juga merupakan salah satu provinsi yang sudah mencanangkan wajib belajar 12 tahun sejak Tahun 2014, namun nilai APS, APK dan APM tingkat Sekolah Lanjutan Tingkat Atas (SLTA) masih belum menunjukkan nilai yang tinggi. Nilai APS, APK dan APM tingkat SLTA Provinsi Jawa Timur Tahun 2015 masih dibawah 90, dimana APS pada kelompok umur 16-18 tahun sebesar 70,44; APK tingkat SLTA sebesar 80,02 dan APM tingkat SLTA sebesar 60,31. Target RPJMD untuk nilai APK Provinsi Jawa Timur pada Tahun 2019 untuk tingkat SD sebesar 113,10; tingkat SLTP sebesar 103,11 sementara tingkat SLTA hanya sebesar 83,44. Dengan program wajib belajar 12 tahun, target APK tingkat SLTA sebesar 83,44 masih sangat kecil, karena hal ini mengindikasikan bahwa masih ada penduduk Provinsi Jawa Timur yang putus sekolah dan tidak mengenyam pendidikan SLTA. Hal ini tentu menjadi tugas berat bagi Provinsi Jawa Timur untuk bisa mewujudkan wajib belajar 12 tahun. Karenanya diperlukan suatu kajian untuk mengetahui faktor penyebab dari rendahnya nilai APK tingkat SLTA di Provinsi Jawa Timur.
5
Penelitian tentang indikator-indikator pendidikan telah banyak sekali dilakukan, terutama di negara-negara berkembang, termasuk di Indonesia. Choiriyah (2009) menyatakan bahwa dari hasil penelitiannya di wilayah Surabaya Utara, jenis kelamin merupakan salah satu faktor yang mempengaruhi tingginya angka putus sekolah. Citra (2008) melakukan penelitian tentang APK dimana variabel yang berpengaruh terhadap APK adalah pengeluaran pemerintah di sektor pendidikan, pendapatan per kapita dan angka kematian bayi (AKB) di Bengkulu dan Sumatra Utara dengan menggunakan regresi linier berganda. Setyawan (2011) melakukan pemodelan determinan tingkat pendidikan di Papua menggunakan regresi nonparametrik birespon spline, dimana dalam penelitiannya didapatkan variabel yang berpengaruh secara signifikan adalah angka harapan hidup, rata-rata pengeluaran rumah tangga perbulan, banyaknya anggota rumah tangga, rasio jenis kelamin, persentase ibu berpendidikan SLTA ke atas, rasio murid dengan sekolah, persentase penduduk perkotaan, persentase penduduk yang tinggal di pesisir dan persentase anggaran pendidikan di APBD. Sahat (2011) juga melakukan penelitian tentang APK, dimana pengeluaran pemerintah di sektor pendidikan, Produk Domestik Regional Bruto (PDRB) per kapita, dan tenaga pendidik mempunyai pengaruh terhadap APK tingkat SMA di Deli Serdang. Penelitian lainnya yang meneliti tentang indikator pendidikan adalah Sikhan (2013) menyebutkan bahwa di Amerika Serikat, anak usia sekolah dari keluarga berpenghasilan rendah memiliki kemungkinan untuk putus sekolah di tingkat sekolah menengah atas lima kali lebih tinggi daripada yang berasal dari keluarga berpenghasilan menengah dan enam kali lebih tinggi daripada anak usia sekolah yang berasal dari keluarga berpenghasilan tinggi.
1.2. Rumusan Permasalahan Berdasarkan latar belakang yang telah dijelaskan diatas maka terlihat ada rumusan permasalahan yang harus diselesaikan dalam penelitian ini. Yang pertama bahwa pengujian hipotesis sangat penting dalam inferensi statistik, namun masih ada permasalahan mengenai bagaimana bentuk dari hipotesis, bagaimana penurunan untuk mendapat statistik uji dan bagaimana daerah penolakan dari regresi semiparametrik spline truncated. Sehingga diperlukan 6
suatu kajian mengenai pengujian hipotesis secara simultan dalam regresi semiparametrik spline truncated. Yang kedua terdapat permasalahan pada APK tingkat SLTA di Provinsi Jawa Timur yang masih rendah sehingga diperlukan suatu kajian untuk mengetahui faktor-faktor yang mempengaruhinya. Karena diduga bentuk kurva regresi antara variabel respon dengan sebagian variabel prediktor tidak diketahui polanya, dan dengan sebagian lagi mempunyai pola linier, maka diperlukan pendekatan regresi semiparametrik spline truncated yang dapat digunakan untuk memodelkan APK tingkat SLTA di Provinsi Jawa Timur.
1.3. Tujuan Penelitian Berdasarkan permasalahan di atas, tujuan dari penelitian ini adalah sebagai berikut: 1. Mengkaji pengujian hipotesis secara simultan dalam model regresi semiparametrik spline truncated. 2. Mengaplikasikan regresi semiparametrik spline truncated pada data APK tingkat SLTA di Provinsi Jawa Timur Tahun 2015.
1.4. Manfaat Penelitian Manfaat yang ingin dicapai dari hasil penelitian ini adalah sebagai berikut: 1. Menghasilkan penurunan uji hipotesis regresi semiparametrik spline truncated sehingga bisa dijadikan tambahan referensi dalam melakukan analisis data. 2. Memberikan informasi yang lebih rinci mengenai APK tingkat SLTA sehingga dapat membantu pemerintah daerah Provinsi Jawa Timur dalam penentuan kebijakan di bidang pendidikan, seperti program Wajib Belajar 12 tahun. 3. Memberikan alternatif bagi Badan Pusat Statistik (BPS) mengenai metode analisis data khususnya untuk data yang sesuai dengan regresi semiparametrik spline truncated.
7
1.5. Batasan Permasalahan Beberapa batasan permasalahan pada penelitian ini antara lain: 1. Metode yang digunakan untuk menentukan banyaknya titik knot dan lokasi titik knot optimum adalah dengan menggunakan metode Generalized Cross Validation (GCV), karena GCV tidak memerlukan pengetahuan terhadap variansi populasi 2 serta metode GCV invarians terhadap transformasi. Pemilihan banyaknya titik knot dibatasi dengan menggunakan satu, dua, tiga dan kombinasi titik knot. 2. Dalam aplikasi model regresi semiparametrik spine truncated, fungsi spline yang digunakan adalah spline linier, karena sesuai dengan pola data yang digunakan.
8
BAB 2 TINJAUAN PUSTAKA 2.1. Analisis Regresi Analisis regresi merupakan studi ketergantungan dari variabel respon, pada satu atau lebih variabel prediktor. Tujuan analisis regresi adalah untuk memperkirakan atau meramalkan nilai dari variabel respon apabila nilai dari variabel prediktor sudah diketahui (Drapper dan Smith, 1992). Jika variabel respon adalah data
,
dan variabel prediktor adalah
, 𝑖 = 1, 2, ... , , maka pasangan
akan memiliki model hubungan fungsional:
( )
𝑖
( 2.1 )
dimana ( ) adalah kurva regresi dan
adalah error random yang diasumsikan
identik, independen dan berdistribusi normal dengan mean nol dan varian (Eubank, 1999). Jika pola hubungan variabel respon dan variabel prediktor diketahui, maka pendekatan analisis regresi tersebut dinamakan analisis regresi parametrik (Budiantara, 2009). Namun jika pola hubungan antara variabel prediktor dan respon yang tidak diketahui kurva regresinya atau tidak terdapat informasi masa lalu yang lengkap tentang bentuk pola data, salah satu pendekatan yang dapat digunakan adalah regresi nonparametrik (Eubank, 1999). Selain itu, apabila diasumsikan bahwa bentuk kurva regresi sebagian diketahui dan sebagian tidak diketahui, maka digunakan pendekatan regresi semiparametrik (Eubank, 1999; Budiantara, 2005).
2.2. Regresi Parametrik Regresi parametrik merupakan suatu metode yang sederhana (parsimoni) dalam kajian analisis regresi, namun disisi lain menuntut terpenuhinya berbagai asumsi yang sangat ketat, salah satunya adalah bentuk kurva regresi diketahui, misalnya linear, kuadratik, kubik, polinomial derajat-p, eksponen, dan lain-lain. Pengetahuan terhadap bentuk kurva regresi memudahkan dalam memilih salah satu bentuk keluarga kurva atau fungsi regresi yang memungkinkan dari beberapa
9
alternatif yang ada, kemudian menempatkan fungsi regresi tersebut dalam proses inferensi. Jika bentuk kurva atau fungsi regresi yang dipilih bisa tepat, maka analisis regresi parametrik akan lebih menguntungkan, khususnya metode inferensinya dan interpretasi parameternya akan lebih sederhana. Oleh karena itu analisis regresi parametrik lebih sering digunakan apabila terdapat informasi tentang bentuk kurva regresinya (Eubank, 1999). Pendekatan model
regresi
parametrik memiliki sifat yang sangat baik dari pandangan Statistika Inferensia seperti misalnya sederhana, mudah interpretasinya, parsimoni, tak bias, estimator linier, efisien, konsisten, dan Best Linier Unbiased Estimator (BLUE) yang tidak dimiliki oleh pendekatan model regresi nonparametrik (Budiantara, 2009). Secara matematis fungsi regresi parametrik bisa ditulis dengan persamaan sebagai berikut: ( )
𝑖
( 2.2 )
( ) seringkali disebut sebagai fungsi regresi parametrik atau kurva
fungsi
regresi parametrik yang memiliki error random
dan diasumsikan berdistribusi
normal independen dengan rata-rata nol dan variansi
(Eubank, 1999). Fungsi
( ) dapat dituliskan dalam bentuk: ̃ ̃ Dimana ̃
( 2.3 ) ,
-, 𝑖
sedangkan n adalah banyak
data dan p adalah banyak variabel, sementara ̃
[
]. Sehingga persamaannya
menjadi:
[
][
]
( 2.4 )
𝑖
( 2.5 )
2.3. Regresi Nonparametrik Regresi nonparametrik mulai dikenal sekitar abad ke-19, tepatnya pada tahun 1857 (Hardle, 1994). Menurut Eubank (1999), regresi nonparametrik
10
merupakan salah satu pendekatan yang digunakan untuk mengetahui pola hubungan antara variabel prediktor dan respon yang tidak diketahui kurva regresinya atau tidak terdapat informasi masa lalu yang lengkap tentang bentuk pola data. Berdasarkan kenyataan tersebut, maka secara visual pola yang diberikan oleh variabel prediktor z dan variabel respon y tidak mempunyai pola yang jelas. Pendekatan regresi nonparametrik memiliki fleksibilitas yang tinggi, karena data diharapkan mencari sendiri bentuk estimasi kurva regresinya tanpa dipengaruhi oleh faktor subyektifitas peneliti (Eubank, 1999). Secara umum model regresi nonparametrik memiliki bentuk fungsi sebagai berikut: ( ) dengan
𝑖
( 2.6 )
adalah variabel respon ke-i, sedangkan fungsi
kurva regresi, dengan
sebagai variabel prediktor dan
( ) merupakan
adalah error random
yang diasumsikan berdistribusi normal independen dengan mean nol dan variansi σ2 (Wahba, 1990). Regresi nonparametrik persamaan ( 2.6 ) disebut regresi nonparametrik univariabel karena terdiri dari satu variabel respon dan satu variabel prediktor. Jika dalam regresi nonparametrik terdapat satu variabel respon dan lebih dari satu variabel prediktor, maka disebut regresi nonparametrik multivariabel (Budiantara, 2004). Jika diberikan data ( dan
) hubungan antara (
)
dapat dituliskan sebagai berikut: ( ∑
dengan
( 2.7 )
) (
)
𝑖
adalah variabel respon dan
( 2.8 ) adalah kurva regresi yang tidak diketahui
bentuknya.
2.4. Regresi Semiparametrik Regresi semiparametrik adalah gabungan antara regresi parametrik dan regresi nonparametrik. Menurut Eubank (1999) dan Budiantara (2005), apabila diasumsikan bahwa bentuk kurva regresi sebagian diketahui dan sebagian tidak
11
diketahui, maka digunakan pendekatan regresi semiparametrik. Model regresi semiparametrik dapat ditulis sebagai berikut: ( )
( ) dimana
𝑖 ( ) merupakan fungsi komponen
adalah variabel respon ke-i,
parametrik, diketahui dan
( ) merupakan fungsi komponen nonparametrik yang tidak (
adalah error random, dimana
).
( ) didekati dengan menggunakan regresi
Jika fungsi komponen parametrik
linier berganda maka persamaan akan menjadi: ̃ ̃
( )
( 2.9 )
𝑖
adalah variabel respon ke-i , ̃
dimana
,
prediktor untuk komponen parametrik, komponen ̃
nonparametrik,
,
̃ ̃
-
- adalah variabel adalah variabel prediktor untuk
merupakan
parameter
komponen
yang
tidak
parametrik,
diketahui,
merupakan fungsi komponen nonparametrik yang tidak diketahui dan (
error random, dimana
( ) adalah
).
2.5. Spline Truncated dalam Regresi Semiparametrik Spline truncated merupakan pendekatan regresi nonparametrik dan semiparametrik yang banyak digunakan. Spline truncated merupakan potonganpotongan polinomial
yang memiliki sifat tersegmen dan kontinu. Salah satu
kelebihan spline truncated adalah model ini cenderung mencari sendiri estimasi data kemanapun pola data tersebut bergerak. Kelebihan ini terjadi karena dalam spline truncated terdapat titik-titik knot, yaitu titik perpaduan bersama yang menunjukkan terjadinya perubahan pola perilaku data (Eubank, 1999; Budiantara, 2009). Jika diberikan data berpasangan ( , adalah variabel respon sedangkan pola parametrik dan
), 𝑖 = 1,2, … , , dimana
adalah variabel prediktor yang mengikuti
adalah variabel prediktor yang mengikuti pola
nonparametrik. Pola hubungan
,
dan
dapat dinyatakan dalam model
regresi seperti persamaan ( 2.9 ), yaitu: ̃ ̃
( )
( 2.10 )
𝑖
12
Selanjutnya jika kurva regresi ( ) pada persamaan ( 2.10 ) dihampiri dengan kurva regresi spline truncated dengan knot K1, K2, ..., Kr maka: ( )
∑
(
∑
)
( 2.11 )
adalah parameter-parameter model dan fungsi truncated (
dengan
)
diberikan oleh: (
)
{
(
Kurva regresi
) ( ) merupakan kurva regresi nonparametrik spline truncated
derajat m dengan banyaknya titik knot r. Derajat m merupakan derajat pada persamaan polinomial. Kurva regresi polinomial derajat 1 biasa disebut dengan kurva regresi linier, kurva regresi polinomial derajat 2 biasa disebut dengan kurva regresi kuadratik, sedangkan kurva regresi polinomial derajat 3 biasa disebut dengan kurva regresi kubik. Titik-titik knot K1, K2, …, Kr adalah titik-titik knot yang menunjukkan perubahan pola perilaku dari kurva pada sub-sub interval yang berbeda, dimana K1 < K2 <
< Kr.
Salah satu ilustrasi sederhana diberikan spline linier truncated dengan m = 1, r = 3 atau tiga titik knots yaitu K1, K2 dan K3 dapat disajikan dalam bentuk: ( )
(
)
(
)
(
)
( 2.12 )
Fungsi Spline ( ) dapat disajikan dalam bentuk (Budiantara, 2005):
1 zi z ( z K ) 2 i 1 f ( zi ) 1 i 1 zi 2 ( zi K1 ) 3 ( zi K 2 ) 1 zi 2 ( zi K1 ) 3 ( zi K 2 ) 4 ( zi K3 )
, 𝑧𝑖
𝐾
, 𝐾 ≤ 𝑧𝑖
𝐾
, 𝐾 ≤ 𝑧𝑖
𝐾
, 𝑧𝑖
( 2.13 )
𝐾
Sehingga persamaan regresi semiparametrik spline truncated pada persamaan ( 2.10 ) menjadi: ̃ ̃
∑
∑
(
)
( 2.14 )
Regresi semiparametrik spline truncated diatas terdiri dari satu variabel respon dengan satu atau lebih variabel prediktor parametrik, dan hanya satu variabel prediktor nonparametrik. Jika dalam regresi semiparametrik terdiri dari
13
satu variabel respon dengan lebih dari satu variabel prediktor parametrik dan lebih dari satu variabel prediktor nonparametrik, dengan komposisi data seperti berikut (
) maka hubungan antara (
) dan
dapat dituliskan sebagai berikut: ̃ ̃
(
̃ ̃
( 2.15 )
)
∑ (
)
( 2.16 ) ; ̃ ̃ adalah fungsi regresi
adalah variabel respon, 𝑖
dengan
parametrik dan
(
) adalah kurva regresi yang tidak diketahui bentuknya,
dimana (
)
∑
∑
(
(
)
)
𝑖
( 2.17 )
Sehingga persamaan ( 2.16 ) menjadi: ̃ ̃
∑ .∑
∑
(
)
(
) /
𝑖
( 2.18 )
Persamaan ( 2.18 ) dapat ditulis dalam bentuk sebagai berikut: ( ̃) ̃
̃
Respon
( 2.19 ) ̃ , matriks ( ̃ )
merupakan vektor berukuran
(
),
adalah
matriks yang memuat prediktor komponen parametrik yang berukuran (
), (
adalah matriks yang memuat komponen nonparametrik berukuran ) yang tergantung pada titik knot yang diberikan yaitu ̃ adalah titik
knot dari dimana ̃
. Vektor parameter ̃ berukuran (( (
(
)
(
)
)
(
)) (
)
) dan
̃ merupakan vektor error. Estimasi
parameter
model
regresi
spline
truncated
diperoleh
dengan
menggunakan metode Ordinary Least Square (OLS). Berdasarkan model persamaan ( 2.19 ), diperoleh persamaan: ̃
̃
( ̃) ̃
( 2.20 )
Selanjutnya jumlah kuadrat error diberikan oleh:
14
∑
̃ ̃
∑
( 2.21 ) ( ̃ ) ̃) ( ̃
(̃
( ̃ ) ̃)
( 2.22 )
Dengan menggunakan sifat tranpose suatu matrik yaitu: ( ( ̃ ) ̃)
( ̃)
̃
( 2.23 )
Maka, ∑
(̃
( ̃ ) ̃) ( ̃
∑
̃ ̃
̃ ( ̃) ̃
∑
̃ ̃
∑
( ̃ ) ̃) ( ̃) ̃
̃
( ̃) ̃
̃
( 2.24 ) ̃
( ̃) ( ̃) ̃
( ̃) ( ̃) ̃
̃
( ̃)
( 2.25 ) ( 2.26 ) ( 2.27 )
Untuk mendapatkan estimator dari parameter ̃, dilakukan derivatif parsial
( ̃)
terhadap ̃: ( ̃) ̃
(̃ ̃
( )
̃
( ̃) ̃ ̃
( ̃) ̃
( ̃ ) ( ̃ ) ̃)
̃
( ̃) ( ̃) ̃
Jika derivatif parsial di atas disamakan dengan nol, diperoleh persamaan: ( ̃) ̃
( ̃ ) ( ̃ ) ̂̃
( 2.28 )
Persamaan ( 2.22 ) dapat pula ditulis dalam bentuk: ( ̃ ) ( ̃ ) ̂̃
( ̃) ̃
( 2.29 )
Sehingga diperoleh estimator ̂̃ adalah sebagai berikut: ̂̃
. ( ̃ ) ( ̃ )/
( 2.30 )
( ̃) ̃
Dan estimator kurva regresi semiparametrik adalah sebagai berikut: ̃̂(
)
( ̃ ) . ( ̃ ) ( ̃ )/
̂(
)
( ̃) ̃
( ̃) ̃
( 2.31 ) ( 2.32 )
15
2.6. Pemilihan Titik Knot Optimal Dalam regresi semiparametrik spline truncated, hal penting yang berperan dalam mendapatkan estimator spline truncated terbaik adalah pemilihan titik knot yang optimal. Salah satu metode yang sering digunakan dalam memilih titik knot optimal adalah Generalized Cross Validation (GCV). Menurut Wahba (1990) jika dibandingkan dengan metode lain, misalnya Cross Validation (CV) dan metode Unbiased Risk (UBR) ataupun Generalized Maximum Likelihood (GML), GCV secara teoritis memiliki sifat optimal asymtotik. Wahba (1990) juga menyatakan bahwa metode GCV juga memiliki kelebihan tidak memerlukan pengetahuan terhadap variansi populasi 2 serta metode GCV invarians terhadap transformasi. Metode GCV merupakan pengembangan dari CV (Wahba, 1990). Fungsi GCV untuk pemilihan titik knot optimal pada regresi semiparametrik dapat ditunjukkan dalam persamaan berikut: ∑
( ̃) 0
(
̂)
.
( ̃ )/1
( 2.33 ) (
Dalam mencari titik knot optimal
(
)
(
))
diperoleh melalui
optimasi: ( ̃ )}
{
∑
{ 0
(
̂)
.
( ̃ )/1
( 2.34 )
adalah variabel respon, ̂ adalah nilai estimasi variabel respon,
Dimana 𝑖
yang merupakan jumlah observasi, ̃
titik-titik
knot,
( ̃)
}
I
adalah
( ̃ ) . ( ̃ ) ( ̃ )/
matriks
( identitas,
( ̃ ) diperoleh dari persamaan ̂̃
) merupakan dan
matrik
( ̃ ) ̃.
2.7. Likelihood Ratio Test (LRT) Jika density
function
adalah sampel random dari populasi dengan probability (pdf)
atau
probability
mass
function
(pmf)
( | )
( mungkin suatu vektor), maka fungsi likelihood didefinisikan sebagai berikut (Casella, G dan Berger, R.L., 2001):
16
( 2.35 ) ( |
)
( | )
∏ ( | )
Selanjutnya likelihood ratio test statistic untuk pengujian dengan
melawan
adalah seluruh ruang parameter adalah:
( | ) ( )
( 2.36 )
( | )
LRT adalah uji yang mempunyai daerah penolakan dari bentuk * ≤
dimana c adalah konstanta yang memenuhi
( ) ≤ +,
≤ .
Jika dilakukan maksimalisasi baik itu pada seluruh ruang parameter (unrestricted maximization) maupun pada subset ruang parameter (restricted maximization), maka akan ada hubungan yang jelas antara LRT dan Maximum Likelihood Estimators (MLE). Anggap bahwa ̂ merupakan estimator dari
yang
diperoleh dari metode Maximum Likelihood Estimators (MLE), dengan unrestricted maximization dari ( | ). Dan juga anggap bahwa ̂ merupakan estimator dari
yang diperoleh dari metode MLE, dengan restricted maximization
pada ruang parameter
dimana ̂
̂ ( ) adalah nilai dari
yang
memaksimumkan ( | ). Sehingga formula LRT statistik adalah sebagai berikut: ( )
(̂ | ) ( ̂| )
( 2.37 )
2.8. Pengujian Parameter dalam Regresi Parametrik Untuk mengetahui apakah suatu variabel memberikan pengaruh yang signifikan dalam model regresi parametrik atau tidak maka dilakukanlah suatu uji parameter. Ada dua macam uji parameter, yaitu uji parameter simultan atau serentak dan uji parameter secara parsial atau individu.
2.8.1. Uji Simultan/Serentak Misalkan diberikan suatu model regresi sebagai berikut: 𝑖
17
( 2.38 )
Hipotesis yang digunakan untuk menguji model secara simultan atau serentak adalah sebagai berikut:
Statistik uji yang digunakan adalah uji F yaitu : ∑
(̂
̅)
∑
(
̂)
( 2.39 )
Banyaknya variabel prediktor adalah p, sedangkan observasi pengamatan sebanyak n. Dengan daerah penolakannya adalah : tolak (
)
apabila
apabila p-value < α yang mengindikasikan
atau tolak
bahwa paling sedikit ada satu parameter yang tidak sama dengan nol atau paling sedikit ada satu prediktor yang berpengaruh signifikan terhadap respon.
Tabel 2.1 Analisis Varians Model Regresi Sumber Variasi
Derajat Kebebasan
Regresi
p
Error Total
Jumlah Kuadrat ∑( ̂
̅)
n-p-1
∑(
̂)
n-1
∑(
̅)
Rata-rata Kuadrat ∑
(̂
̅)
∑
(
̂)
F Hitung
-
Sumber: Drapper dan Smith, 1992
2.8.2. Uji Parsial/Individu Uji parsial atau individu merupakan suatu uji untuk parameter kurva regresi secara individu dengan menggunakan uji t. Hipotesis yang digunakan untuk menguji model secara parsial atau individu adalah sebagai berikut :
18
Statistik uji yang digunakan adalah dengan menggunakan uji t yaitu : ̂ ( 2.40 )
(̂ ) Dimana
( ̂ ) adalah standart error dari ̂ , dan daerah penolakan pada uji t apabila |
yaitu tolak
|
(
)
atau tolak
apabila p-value < α.
2.9. Uji dan Deteksi Asumsi Residual Pada model regresi semiparametrik spline truncated diasumsikan bahwa error random berdistribusi normal independen dengan mean nol dan variansi σ2 (Wahba, 1990). Oleh karena itu sebelum melakukan analisis dan mengambil keputusan dari hasil pemodelan maka dilakukan uji asumsi residual terlebih dahulu. Uji dan deteksi asumsi residual yang dilakukan adalah uji normalitas, deteksi independen dan uji identik.
2.9.1. Uji Normalitas Pengujian hipotesis melibatkan distribusi tertentu, yaitu F dan t-Student, kedua distribusi tersebut digunakan untuk menguji signifikansi parameter baik secara simultan maupun parsial. Oleh karena itu diperlukan pengujian distribusi normal pada residualnya, sehingga jika residual tidak memenuhi asumsi normal maka pengujian parameter menjadi tidak akurat. Cara mendeteksi apakah residual berdistribusi normal dapat dilihat pada normal probability plot residual. Apabila plot yang dihasilkan membentuk garis lurus maka residual dari model regresi tersebut cenderung mengikuti distribusi normal. Pengujian distribusi normal dapat dilakukan dengan metode Uji Kolmogorov-Smirnov yang juga dikenal dengan uji kesesuaian model (Goodness of Fit test). Hipotesis yang digunakan adalah sebagai berikut: ( )
( ) (Residual berdistribusi Normal)
( )
( ) (Residual tidak berdistribusi Normal).
Statistik Uji : | ( )
( )|
( 2.41 )
19
( ) adalah ( )
fungsi
distribusi
frekuensi
kumulatif
teoritis sedangkan
merupakan fungsi peluang kumulatif yang diobservasi dari satu
sampel random dengan N observasi. atau kurang dari
adalah banyaknya observasi yang sama
. Kesimpulan untuk menolak
jika
(
)
dimana
adalah nilai berdasarkan tabel Kolmogorov-Smirnov.
2.9.2. Deteksi Independen Pendeteksian independensi residual bertujuan untuk mengetahui korelasi antar residual apakah sama dengan nol atau tidak. Korelasi antar residual yaitu korelasi antara residual pada pengamatan ke-i dengan pengamatan i – 1. Untuk melakukan pengujian independen ini dapat dilakukan dengan cara membuat plot fungsi autokorelasi (ACF) dari residual. Residual saling independen jika tidak ada nilai (
) melampaui batas
√ .
2.9.3. Uji Identik Uji identik dapat juga disebut uji homogenitas varians residual. Homogenitas varians residual didasarkan pada sifat
( )
dimana
( )
Pada kondisi ini, varians residual konstan. Pelanggaran terhadap asumsi ini disebut heteroskedastis yaitu keadaan dimana variansi residual tidak homogen. Hal ini menyebabkan estimasi koefisien kurang akurat/tidak efisien (Gujarati, 1992). Cara mendeteksi heteroskedastisitas dapat dideteksi dengan membuat scatter plot antara residual dan estimasi respon ( ̂). Apabila plot menunjukkan sebaran data yang tidak random atau membentuk tren/pola tertentu, maka terjadi kasus heteroskedastis residual, sehingga perlu diatasi antara lain
dengan
transformasi variabel menggunakan Weighted Least Square (WLS) (Gujarati, 1992). Cara
lain
yang
dapat
digunakan
dalam
mendeteksi
adanya
heteroskedastisitas adalah dengan menggunakan Uji Glejser. Pengujian ini dilakukan dengan cara meregresikan harga mutlak residual dengan variabel prediktor ( ). | |
( )
𝑖
( 2.42 )
20
Berdasarkan Persamaan ( 2.42 ) jika diketahui terdapat variabel prediktor yang signifikan dalam model maka
hal
ini
mengindikasikan
bahwa
residual
cenderung tidak homogen. Hipotesis yang digunakan dalam uji Glejser sebagai berikut:
𝑖 Statistik uji yang digunakan adalah sebagai berikut: ∑ (
(| ̂ |
| ̅ |)
∑ ) (
(| |
| ̂ |)
)
( 2.43 )
p adalah banyaknya parameter model glejser. Daerah penolakan ((
)) .
)(
jika nilai
Apabila pada kesimpulan dihasilkan penolakan
maka dapat dinyatakan bahwa artinya terdapat minimal satu
,
dan itu
berarti terdapat heteroskedastisitas.
2.10. Teorema Dasar Terkait dengan Aljabar Matriks Beberapa teorema dasar terkait dengan aljabar matriks yang digunakan untuk menyelesaikan estimasi parameter dan kajian pengujian hipotesis secara simultan berikut ini berdasarkan Rencher dan Scaalje (2007). 1. Inverse. dan (
)
.
2. Idempoten. Matrik A dikatakan idempoten jika 3. Teorema 2.11 Jika
adalah
dan
adalah
, maka
(
)
(
)
4. Teorema 2.13d Jika matrik ( )
mempunyai rank
serta simetris dan idempotent, maka
( )
5. Teorema 2.14a. Jika
̃ ̃
̃ ̃, dimana ̃
(
Maka ̃
( ̃ ̃) ̃
( ̃ ̃) ̃
̃
21
) adalah vektor konstan.
6. Teorema 2.14b. ̃
Jika
̃, dimana
(̃ ̃
̃) ̃
adalah matrik simetrik konstan. Maka
̃
7. Teorema 2.2a. Jika A dan B adalah matrik dengan ukuran
, maka (A + B) = A + B.
8. Teorema 2.2b. Jika A adalah matrik berukuran
dan B adalah matrik berukuran
maka (AB) = BA. 9. Theorema 5.5 Corollary 2 menyatakan bahwa jika ̃ dengan rank r, maka ̃
̃
adalah
(
(̃ ̃
) dan ̃
matrik simetris
) jika dan hanya jika
adalah idempotent. 10. Teorema 5.6b Corollary 1 menyatakan bahwa jika ̃ adalah independent jika dan hanya jika
(̃
) maka ̃
̃ dan ̃
(atau, ekuivalen,
̃
).
2.11. Tinjauan Non Statistik 2.11.1. Penduduk Usia Sekolah Penduduk usia sekolah menurut jenjangnya terbagi menjadi lima, antara lain sebagai berikut (BPS, 2013): a.
Usia 3-6 tahun, masuk dalam kelompok anak usia dini.
b.
Usia 7-12 tahun, masuk dalam kelompok usia sekolah dasar (SD).
c.
Usia 13-15 tahun, masuk dalam kelompok usia sekolah menengah pertama (SLTP).
d.
Usia 16-18 tahun, masuk dalam kelompok usia sekolah menengah atas (SLTA).
e.
Usia 19-24 tahun, masuk dalam kelompok usia sekolah di perguruan tinggi.
2.11.2. Angka Partisipasi Kasar (APK) Sumber utama untuk sektor pendidikan adalah Survei Sosial Ekonomi Nasional (Susenas), yang setiap tahun dikumpulkan melalui Susenas KOR, dan 22
setiap tiga tahun dikumpulkan melalui Susenas Modul. Dalam Kuesioner Susenas, partisipasi sekolah ditanyakan kepada responden dengan 3 pilihan jawaban, yaitu: 1. Tidak/belum pernah sekolah Konsep yang digunakan BPS untuk tidak/belum pernah sekolah adalah tidak pernah atau belum pernah terdaftar dan tidak/belum aktif mengikuti pendidikan baik di suatu jenjang pendidikan formal maupun non formal (Paket A/B/C), termasuk juga yang tamat/belum tamat taman kanak-kanak tetapi tidak melanjutkan ke sekolah dasar. 2. Sedang bersekolah Sedang bersekolah menurut konsep BPS adalah mereka yang terdaftar dan aktif mengikuti pendidikan baik di suatu jenjang pendidikan formal maupun non formal, yang berada di bawah pengawasan Kemdikbud, Kementerian Agama, Instansi Negeri lain maupun Instansi Swasta. 3. Tidak bersekolah lagi Tidak bersekolah lagi adalah pernah terdaftar dan aktif mengikuti pendidikan baik di suatu jenjang pendidikan formal maupun non formal, tetapi pada saat pencacahan tidak lagi terdaftar dana tidak lagi aktif. Berkaitan dengan partisipasi sekolah, BPS mengeluarkan tiga ukuran indikator pendidikan, yaitu : 1. Angka Partisipasi Sekolah (APS) APS adalah proporsi anak yang masih sekolah pada kelompok usia tertentu dalam penduduk kelompok usia tersebut yang sesuai dengan jenjang pendidikan. APS 7-12 tahun merupakan indikator untuk menunjukkan partisipasi penduduk usia sekolah dasar. Untuk partisipasi di SMP digunakan APS 13-15 tahun, dan untuk SMA digunakan APS 16-18 tahun. Penghitungan matematis untuk APS 16-18 tahun dapat ditulis sebagai berikut: 𝑖 𝑖
( 2.44 )
𝑖
23
2. Angka Partisipasi Kasar (APK) APK adalah proporsi anak sekolah pada suatu jenjang tertentu tanpa memandang usia dengan jumlah penduduk yang berusia sesuai dengan jenjang pendidikan tersebut. Penghitungan APK untuk pendidikan menengah atas, yaitu sekolah menengah atas, madrasah aliyah dan paket C dapat digunakan rumus berikut: 𝑖
𝑖 ( 2.45 )
𝑖 Untuk jenjang SD/MI/Paket A pada usia 7-12 tahun dan pada jenjang SMP/MTS/Paket B pada usia 13-15 tahun. Berdasarkan penghitungan tersebut maka APK menunjukkan tingkat partisipasi penduduk secara umum di suatu tingkat pendidikan. APK merupakan indikator yang paling sederhana untuk mengukur daya serap penduduk usia sekolah di masing-masing jenjang pendidikan. 3. Angka Partisipasi Murni (APM) APM adalah proporsi anak sekolah pada satu kelompok usia tertentu yang bersekolah pada jenjang yang sesuai dengan kelompok usianya. APM menunjukkan partisipasi sekolah penduduk usia sekolah di tingkat pendidikan tertentu, merupakan indikator daya serap penduduk usia sekolah
di
setiap
jejang
pendidikan.
Formulasi
APM
untuk
SMA/MA/Paket C seperti berikut: 𝑖
𝑖
𝑖 𝑖
( 2.46 )
2.11.3. Faktor-Faktor Yang Mempengaruhi Angka Partisipasi Kasar Penelitian tentang indikator-indikator pendidikan telah banyak dilakukan, baik di Indonesia maupun diluar negeri. Namun penelitian mengenai pendidikan khususnya tingkat SLTA masih sangat jarang dilakukan. Pada negara-negara berkembang sampai pada akhir tahun 2015 masih memfokuskan pada pendidikan dasar. Namun semakin ke depan tantangan dan persaingan semakin besar, mulai awal 2016 mulai dikembangkan untuk meningkatkan partisipasi tingkat
24
pendidikan masyarakat ke jenjang yang lebih tinggi. Sehingga dalam mengetahui faktor-faktor yang mempengaruhi APK tingkat SLTA di Provinsi Jawa Timur dapat didekati dengan menggunakan model yang telah digunakan untuk melihat faktor-faktor yang mempengaruhi indikator-indikator pendidikan yang telah dilakukan sebelumnya. World Bank (2007) melakukan kajian mengenai Investasi Pendidikan di Indonesia. Dalam kajiannya menggunakan satu model dasar yang meneliti sisi penawaran dan permintaan sebagai penentu dari outcomes pendidikan. Dari sisi permintaan faktor yang digunakan sebagai penentu outcomes pendidikan adalah kemiskinan, persentase penduduk usia sekolah (7-18 tahun) yang bekerja, akses jalan, jumlah sekolah dan bencana. Dari sisi penawaran faktor yang digunakan sebagai penentu outcomes pendidikan adalah total pengeluaran pendidikan per jumlah penduduk usia 7-18 tahun, rata-rata belanja pemerintah kabupaten/kota per penduduk usia sekolah, rasio belanja pegawai dengan total belanja pendidikan dan PDRB per kapita.
Sisi Penawaran Outcome pendidikan
Determinan pendidikan Sisi Permintaan
Gambar 2.1 Kerangka Konseptual Determinan Pendidikan Menurut World Bank (World Bank, 2007) Badan Perencanaan Pembangunan Nasional (Bappenas) juga melakukan evaluasi pelaksanaan program wajib belajar pendidikan dasar 9 tahun pada tahun 2009. Dalam melakukan evaluasi Bappenas juga mengadopsi dari kerangka konseptual yang dilakukan oleh World Bank. Outcomes yang digunakan Bappenas dalam melakukan evaluasi adalah APM dan APK tingkat SD dan SLTP. Faktor yang digunakan dalam mengevaluasi outcomes pendidikan wajib belajar dasar 9
25
tahun adalah faktor input dan output program serta faktor eksternal seperti karakteristik sosial ekonomi suatu wilayah.
Faktor input
Determinan pendidikan
Outcomes pendidikan
Faktor output Faktor sosial Faktor eksternal Faktor ekonomi
Gambar 2.2 Kerangka Konseptual Determinan Pendidikan Menurut Bappenas (Bappenas, 2009) Faktor input yang digunakan adalah alokasi Dana Alokasi Khusus (DAK) untuk pendidikan, rasio Dana Alokasi Umum (DAU) terhadap Anggaran Pendapatan Belanja Daerah (APBD), rasio DAK terhadap APBD dan dana Bantuan Operasional Sekolah (BOS). Faktor output yang digunakan adalah rasio murid dan guru dan rasio murid sekolah. Sedangkan faktor eksternal yang digunakan adalah angka melek huruf, tingkat kemiskinan, pendapatan masyarakat, jumlah angkatan kerja, serta akses terhadap fasilitas umum. Selain itu juga digunakan karakteristik wilayah seperti kabupaten/kota, daerah tertinggal dan keberadaan di Pulau Jawa/luar Pulau Jawa sebagai variabel dummy. Sementara penelitian tentang indikator pendidikan lebih banyak di lakukan di negara-negara berkembang. Seperti penelitian yang dilakukan oleh Lestari (2014) yang melakukan penelitian tentang APS dan APK tingkat SD dan SMP di Indonesia, dengan menerapkan regresi data panel dalam penelitiannya yang mengaitkan rasio guru murid, angka buta huruf, jumlah penduduk, panjang jalan, angka pengangguran terbuka, jumlah orang miskin dan pengeluaran pemerintah di bidang pedidikan dengan APS dan APK tingkat SD dan SMP. Astuti, dkk (2013) juga melakukan penelitian tentang pemodelan APM jenjang 26
pendidikan SMA di Jawa Tengah, penelitian dilakukan menggunakan Spatial Autoregressive Model (SAR) yang meneliti tentang APM dengan rata-rata jumlah anggota rumah tangga, kepadatan penduduk, rasio PDRB terhadap rata-rata nasional, rasio jenis kelamin dan tingkat kemiskinan. Rena (2007) melakukan penelitian di sebuah sekolah dasar di India, hasil penelitian menunjukkan bahwa salah satu penyebab anak-anak putus sekolah adalah agar dapat membantu dalam kegiatan rumah tangga dan kegiatan pertanian. Ia juga mengungkapkan bahwa tingkat putus sekolah anak perempuan lebih tinggi dari anak laki-laki. Penelitian ini merekomendasikan bahwa alokasi anggaran harus ditingkatkan sehingga dapat mendorong partisipasi sekolah dasar dan memberikan beberapa bentuk bantuan keuangan kepada siswa. Lloyd (1996) melakukan penelitian di wilayah Sub Saharan Africa menunjukkan bahwa berbagai ukuran tingkat pendidikan memiliki hubungan negatif dengan banyaknya saudara kandung yang dimiliki. Sementara pada peneilitian Brunello, dkk (2005) yang dilakukan pada pasar tenaga kerja Italia pada Tahun 1960-1980 menunjukkan bahwa semakin rendah rasio murid dan guru akan berkorelasi positif dengan pencapaian pendidikan yang lebih tinggi, namun semakin meningkat tingkat pendidikan orang tua akan berkorelasi positif dengan pencapaian pendidikan yang lebih tinggi. Berdasarkan dari kedua kerangka konseptual yang digunakan World Bank dan Bappenas serta beberapa penelitian dalam melakukan kajian tentang determinan pendidikan, maka pada penelitian ini akan digunakan kerangka konseptual yang ada yaitu melibatkan faktor sosial dan faktor ekonomi, namun dalam pemilihan variabel-variabel yang digunakan telah disesuaikan dengan kondisi di Provinsi Jawa Timur dengan tidak meninggalkan esensinya. Faktor sosial yang digunakan adalah jumlah penduduk miskin, rasio jenis kelamin, ratarata jumlah anggota rumah tangga (ART) dan tingkat pengangguran terbuka (TPT). Sedangkan untuk merepresentasikan faktor ekonomi variabel yang digunakan adalah PDRB per kapita. Berikut ini adalah konsep dan definisi operasional variabel prediktor yang digunakan:
27
1. Jumlah Penduduk Miskin Faktor sosial yang digunakan dalam penelitian ini yang pertama adalah jumlah penduduk miskin. Hipotesis antar jumlah penduduk miskin dengan nilai APK di Jawa Timur memiliki hubungan negatif. Semakin sedikit jumlah penduduk miskin maka diharapkan nilai APK tingkat SLTA di Jawa Timur semakin meningkat. Beberapa penelitian yang menggunakan variabel jumlah penduduk miskin dalam determinan pendidikan adalah Lestari (2014), Astuti, dkk (2013), Setyawan (2001), World Bank (2007) dan Bappenas (2009). BPS menggunakan konsep kemampuan memenuhi kebutuhan dasar (basic needs approach) dalam mengukur kemiskinan. Dengan pendekatan ini, kemiskinan dipandang sebagai ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan makanan yang diukur dari sisi pengeluaran (BPS, 2016). Penduduk yang dikategorikan sebagai penduduk miskin adalah penduduk yang memiliki rata-rata pengeluaran perkapita dibawah Garis Kemiskinan (GK). GK adalah merupakan penjumlahan dari Garis Kemiskinan Makanan (GKM) dan Garis Kemiskinan Non-Makanan (GKNM). Tahap pertama dalam penghitungan GK adalah dengan menentukan penduduk referensi yaitu 20 persen penduduk yang berada di atas GKS. GKS sendiri adalah GK periode sebelumnya yang di-inflate dengan inflasi umum (IHK). Dari penduduk referensi kemudian dihitung Garis Kemiskinan Makanan (GKM). GKM adalah jumlah nilai pengeluaran dari 52 komoditi dasar makanan yang riil dikonsumsi penduduk referensi yang kemudian disetarakan dengan 2100 kilokalori perkapita/hari. Penyetaraan nilai pengeluaran kebutuhan minimum makanan dilakukan dengan menghitung harga rata-rata kalori dari ke-52 komoditi tersebut. Selanjutnya GKM tersebut disetarakan dengan 2100 kilokalori dengan mengalikan 2100 terhadap harga implisit rata-rata kalori menurut daerah j dari penduduk referensi. Sementara GKNM merupakan penjumlahan nilai kebutuhan minimum dari komoditi-komoditi non-makanan terpilih yang meliputi perumahan, sandang, pendidikan dan kesehatan. Nilai kebutuhan minimum per komoditi/sub-kelompok non-makanan
dihitung
dengan
menggunakan
suatu
rasio
pengeluaran
komoditi/sub-kelompok tersebut terhadap total pengeluaran komoditi/subkelompok yang tercatat dalam data Susenas modul konsumsi. Rasio tersebut 28
dihitung dari hasil Survei Paket Komoditi Kebutuhan Dasar 2004, yang dilakukan untuk mengumpulkan data pengeluaran konsumsi rumah tangga per komoditi non-makanan yang lebih rinci dibandingkan data Susenas modul konsumsi. Data yang digunakan bersumber dari Susenas Konsumsi Pengeluaran Maret 2015 yang tercantum dalam Publikasi Data dan Informasi Kemiskinan Kabupaten/Kota Tahun 2015. 2. Rasio Jenis Kelamin Faktor sosial kedua yang digunakan dalam penelitian ini adalah rasio jenis kelamin. Kultur masyarakat seringkali berpengaruh dengan tingkat pendidikan, ada sebagian masyarakat yang beranggapan bahwa perempuan lebih cenderung untuk tidak bersekolah dan lebih fokus untuk mengurus rumah tangga. Hal ini tentu saja mengakibatkan rendahnya tingkat pendidikan bagi penduduk perempuan. Beberapa penelitian yang menggunakan rasio jenis kelamin dalam determinan pendidikan adalah Setyawan (2001), Rena (2007), Choiriyah (2009), dan Astuti, dkk (2013). Oleh karena itu dalam penelitian ini diduga bahwa rasio jenis kelamin mempengaruhi nilai APK tingkat SLTA di Provinsi Jawa Timur. Rasio Jenis Kelamin adalah perbandingan jumlah penduduk laki-laki dan perempuan pada suatu daerah dan pada suatu waktu tertentu. Angka rasio jenis kelamin digunakan untuk menggambarkan jumlah penduduk laki-laki terhadap 100 penduduk perempuan. Rumus untuk menghitung rasio jenis kelamin menurut BPS adalah sebagai berikut: 𝑖
𝑖 ( 2.47 )
dengan
adalah Rasio Jenis Kelamin,
𝑖
𝑖 adalah
jumlah penduduk laki-laki pada suatu daerah dan waktu tertentu dan adalah jumlah penduduk perempuan pada suatu daerah dan waktu tertentu. Rasio jenis kelamin lebih dari 100 berarti jumlah penduduk laki-laki lebih banyak dibandingkan dengan jumlah penduduk perempuan. Rasio jenis kelamin sama dengan 100 berarti jumlah penduduk laki-laki sama dengan jumlah penduduk perempuan. Sedangkan rasio jenis kelamin kurang dari 100
29
mengandung arti bahwa jumlah penduduk perempuan lebih banyak dibandingkan dengan jumlah penduduk laki-laki. Data yang digunakan adalah data proyeksi penduduk Indonesia 2010-2035 yang tercantum dalam Publikasi Provinsi Jawa Timur Dalam Angka 2016.
3. Rata-rata Anggota Rumah Tangga Faktor sosial ketiga yang digunakan adalah rata-rata anggota rumah tangga. Banyaknya anggota rumah tangga bagi sebagian kalangan masyarakat tertentu menjadi salah satu pertimbangan ketika harus memutuskan anggota rumah tangga mana yang harus melanjutkan ke suatu jenjang pendidikan yang lebih tinggi. Banyaknya jumlah anggota keluarga dengan kesejahteraan yang masih rendah memaksa mereka untuk menentukan pilihan. Sehingga tentu saja ada anggota keluarga yang akhirnya harus dikorbankan untuk tidak mendapatkan pendidikan yang seharusnya layak untuk diikutinya. Beberapa penelitian yang menggunakan variabel rata-rata anggota rumah tangga dalam determinan pendidikan adalah Lloyd, dkk (1996), Setyawan (2001) dan Astuti, dkk (2013). Untuk itu dalam penelitian ini akan digunakan variabel banyaknya anggota rumah tangga. Rumus untuk menghitung rata-rata banyaknya anggota rumah tangga menurut BPS adalah sebagai berikut: 𝑖 𝑖 dengan
( 2.48 )
adalah rata-rata anggota rumah tangga di suatu wilayah. Data yang
digunakan adalah data hasil proyeksi penduduk dan rumah tangga Indonesia 2010-2035 yang tercantum dalam Publikasi Statistik Kesejahteraan Rakyat Provinsi Jawa Timur Tahun 2015.
4. Tingkat Pengangguran Terbuka (TPT) TPT adalah persentase jumlah pengangguran terhadap jumlah angkatan kerja. Pengangguran terbuka terdiri dari: a.
mereka yang tak punya pekerjaan dan mencari pekerjaan,
b.
mereka yang tak punya pekerjaan dan mempersiapkan usaha,
30
c.
mereka yang tak punya pekerjaan dan tidak mencari pekerjaan karena merasa tidak mungkin mendapatkan pekerjaan, dan
d.
mereka yang sudah punya pekerjaan, tetapi belum mulai bekerja. Bekerja adalah kegiatan ekonomi yang dilakukan oleh seseorang
dengan maksud memperoleh atau membantu memperoleh pendapatan atau keuntungan, paling sedikit 1 jam (tidak terputus) dalam seminggu yang lalu. Kegiatan tersebut termasuk pola kegiatan pekerja tak dibayar yang membantu dalam suatu usaha/kegiatan ekonomi. Angkatan kerja adalah penduduk usia kerja (15 tahun ke atas) yang bekerja, atau punya pekerjaan namun sementara tidak bekerja dan pengangguran. Rumus untuk menghitung TPT menurut BPS adalah sebagai berikut: ( 2.49 ) TPT mengindikasikan besarnya persentase angkatan kerja yang termasuk dalam pengangguran. Variabel untuk menyusun indikator ini diperoleh dari Survei Angkatan Kerja Nasional (Sakernas) dan Sensus Penduduk. TPT yang tinggi menunjukkan bahwa terdapat banyak angkatan kerja yang tidak terserap pada pasar kerja. Misalkan terdapat TPT 5%, artinya dari 100 penduduk usia 15 tahun keatas yang tersedia untuk memproduksi barang dan jasa (angkatan kerja) sebanyak 5 orang merupakan pengangguran. Data yang digunakan diambil dari publikasi Laporan Eksekutif Keadaan Angkatan Kerja di Jawa Timur Tahun 2014-2015.
5. PDRB Perkapita PDRB merupkan nilai tambah bruto seluruh barang dan jasa yang tercipta atau dihasilkan di wilayah domestik suatu daerah yang timbul akibat berbagai aktivitas ekonomi dalam suatu periode tertentu tanpa memperhatikan apakah faktor produksi yang dimiliki residen atau non-residen. PDRB harga berlaku menunjukkan kemampuan sumber daya ekonomi yang dihasilkan oleh suatu wilayah. Nilai PDRB yang besar menunjukkan kemampuan sumber daya ekonomi yang besar, begitu juga sebaliknya. PDRB harga konstan dapat digunakan untuk menunjukkan laju pertumbuhan ekonomi secara keseluruhan atau setiap kategori
31
dari tahun ke tahun. PDRB per kapita atas dasar harga berlaku menunjukkan nilai PDRB dan PNRB per satu orang penduduk. PDRB per kapita atas dasar harga konstan berguna untuk mengetahui pertumbuhan nyata ekonomi per kapita penduduk suatu wilayah. Pada penelitian ini yang digunakan adalah PDRB per kapita atas dasar harga berlaku. Rumus untuk menghitung PDRB perkapita menurut BPS adalah sebagai berikut: 𝑖
( 2.50 )
Penelitian sebelumnya yang menggunakan variabel PDRB per kapita adalah Astuti, dkk (2013), World Bank (2007) dan Sahat (2011). Data yang digunakan berasal dari publikasi Produk Domestik Regional Bruto Provinsi Jawa Timur menurut Lapangan Usaha 2011-2015.
32
BAB 3 METODOLOGI PENELITIAN 3.1. Sumber Data Penelitian ini menggunakan data sekunder yang berasal dari publikasi yang diterbitkan oleh BPS Provinsi Jawa Timur. Unit observasi yang digunakan dalam penelitian ini adalah seluruh kabupaten/kota yang ada di Provinsi Jawa Timur, yaitu sebanyak 38 kabupaten/kota. Data selengkapnya dapat dilihat pada Lampiran 1.
3.2. Variabel Penelitian Dalam penelitian ini variabel respon dan variabel-variabel prediktor yang digunakan adalah sebagai berikut: I. Variabel Respon: : APK tingkat SLTA di Provinsi Jawa Timur Tahun 2015 II. Varibael Prediktor: i.
: Jumlah penduduk miskin
ii.
: Rasio Jenis Kelamin
iii.
: Rata-rata anggota rumah tangga
iv.
: TPT
v.
: PDRB perkapita
3.3. Tahapan Penelitian Tujuan pertama dalam penelitian ini adalah melakukan kajian tentang uji hipotesis dalam regresi semiparametrik spline truncated. Tahapan penelitian yang dilakukan untuk menyelesaikan tujuan pertama ini adalah sebagai berikut: 1. Diberikan data berpasangan: (
)
2. Asumsikan data berpasangan (1) mengikuti model regresi semiparametrik: (
)
33
(
)
3. Kurva regresi
(
) merupakan komponen parametrik, dihampiri
dengan fungsi linier: ( 4. Kurva
)
(
regresi
)
merupakan
komponen
nonparametrik,
dihampiri dengan fungsi spline truncated derajat m dan titik-titik knot : (
)
∑ .∑
∑
(
)
(
) /
5. Diberikan model regresi semiparametrik spline truncated: ∑ 6. Merumuskan
∑ .∑ uji
∑
hipotesis
untuk
(
)
(
) /
parameter
model
semiparametrik spline truncated sebagai berikut: (
(
)
) ( )
7. Menentukan ruang parameter dibawah {(
( (
)
)
}
)
8. Mencari fungsi likelihood dibawah ruang 9. Memaksimumkan fungsi likelihood dibawah 10. Menentukan ruang parameter dibawah
( ( ̂))
( )
11. Mencari fungsi likelihood dibawah ruang 12. Memaksimumkan fungsi likelihood dibawah
( ( ̂ ))
13. Membuat ratio likelihood: (
)
( ̂) (̂)
14. Mencari statistik uji berdasarkan langkah (13)
34
≤
≤
dalam
regresi
15. Mendapatkan distribusi statistik uji 16. Menentukan daerah penolakan hipotesis (
)
, melalui:
untuk suatu konstanta k.
Tujuan kedua dari penelitian ini adalah memodelkan dan melakukan uji hipotesis pada APK tingkat SLTA pada tahun 2015 di Provinsi Jawa Timur dengan menggunakan regresi semiparametrik spline truncated. Langkah-langkah yang dilakukan adalah: 1.
Membuat plot variabel respon ( ) dengan masing-masing variabel prediktor (
)(
)(
)(
)
(
)
2.
Menentukan variabel komponen parametrik dan komponen nonparametrik.
3.
Memodelkan hubungan antara variabel respon dan variabel prediktor menggunakan
estimator
semiparametrik
spline
truncated,
dengan
menggunakan 1 titik knot, 2 titik knot, 3 titik knot dan kombinasi titik knot. 4.
Memilih titik knot yang optimal berdasarkan metode GCV.
5.
Melakukan pengujian signifikansi parameter secara simultan atau serentak.
6.
Melakukan pengujian signifikansi parameter secara secara parsial atau individu.
7.
Melakukan pengujian terhadap asumsi independen, identik dan distribusi normal untuk residual.
8.
Membuat interpretasi model regresi semiparametrik spline truncated dalam memodelkan APK tingkat SLTA di Provinsi Jawa Timur Tahun 2015.
35
“Halaman ini sengaja dikosongkan”
36
BAB 4 HASIL DAN PEMBAHASAN Pada bab ini akan dilakukan kajian mengenai pengujian hipotesis secara simultan pada regresi semiparametrik spline truncated. Kemudian hasilnya akan diterapkan pada data APK SLTA Tahun 2015 di Provinsi Jawa Timur, sesuai dengan tujuan pada penelitian ini.
4.1. Model Regresi Semiparametrik Spline Truncated Diberikan data berpasangan (
) dan hubungan
data berpasangan tersebut mengikuti model regresi semiparametrik spline truncated sebagai berikut: (
)
dimana (
(
( 4.1 )
)
) merupakan komponen parametrik, dan dihampiri dengan
fungsi linier sebagai berikut: (
( 4.2 )
)
sedangkan
(
) merupakan komponen nonparametrik, dihampiri
dengan fungsi spline truncated derajat m dan titik-titik knot
sebagai
berikut: (
)
∑ .∑
∑
(
)
(
) /
( 4.3 )
Berdasarkan persamaan ( 4.2 ) dan persamaan ( 4.3 ) maka persamaan ( 4.1 ) akan menjadi: ∑
∑ .∑
∑
(
)
(
) /
4.1.1. Estimasi Titik untuk Kurva Regresi Semiparametrik Model persamaan ( 4.4 ) di atas dapat dijabarkan sebagai berikut:
37
( 4.4 )
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
(
)
) ( 4.5 )
(
(
)
)
Persamaan ( 4.5 ) dapat pula disajikan dalam bentuk matirks berikut:
̃
̃
̃
( 4.6 ) ̃
dengan
̃
[ ]
[
̃
] (
[
[ ](
)
[ ]
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
) ]
Dengan ukuran ̃
̃
(
,
(
) )
(
)
(
)
(
)
-
(
)
.
Estimator kurva regresi semiparametrik mengikuti tahapan penyelesaian optimasi menggunakan metode Ordinary Least Square (OLS) sebagai berikut: ̃
̃
̃
̃
( 4.7 )
Selanjutnya jumlah kuadrat error diberikan oleh: ̃ ̃
(̃
̃
(̃
̃
(̃ ̃ ̃
̃) ( ̃ ̃ ̃
̃
̃ ̃
)( ̃ ̃
̃)
̃
̃
̃
̃
̃) ̃
̃
̃
̃
̃
̃
̃
̃
̃
̃)
(̃ ̃
̃
̃
̃
̃
( ̃ ̃)
̃
̃
̃
̃) ( 4.8 )
Untuk mendapatkan estimasi dari parameter, dilakukan derivatif parsial. Derivatif parsial ( ̃ ̃) diberikan oleh:
38
( ( ̃ ̃)) ( ̃)
̃
(̃ ̃
̃
̃
̃
̃
̃
̃
̃
̃
̃)
( ̃) ̃
̃
̃
( 4.9 )
Jika derivatif parsial diatas disamakan dengan nol, diperoleh persamaan: ̃
̃
̃
Sehingga estimator parameter ̃ adalah berikut: ̃̂
(
) (
( 4.10 )
̃)
̃
Selanjutnya untuk mendapatkan estimator dari ̃, kita lakukan derivatif parsial ( ̃ ̃) sebagai berikut: ( ( ̃ ̃)) ( ̃)
̃
(̃ ̃
̃
̃
̃
̃
̃
̃
̃
̃
̃)
( ̃) ̃
̃
̃
( 4.11 )
Jika derivatif parsial diatas disamakan dengan nol, diperoleh persamaan: ̃
̃
̃
Sehingga estimator parameter ̃ adalah berikut: ̃̂
(
) (
( 4.12 )
̃)
̃
Karena estimator parameter ̃ masih mengandung ̃, dan estimator ̃ masih mengandung ̃ maka dilakukan substitusi antara persamaan (12) dan persamaan (15) sebagai berikut: ̃̂
(
)
(
̃
(
)
.
̃
((
(
) (
̃
(
(
)
(
̃
) (
.(
)
̃ )/*
̃ (
̃
)
(
̃
)
(
̃ )/
)
)
̃)
) (
̃
)
(
̃
)
Kemudian komponen yang mengandung ̃̂ dijadikan satu diruas kiri sebagai berikut: ̃̂ ̃̂(
(
) (
( )
̃
) (
)
( )
) (
(
̃ )
̃
) (
( )
Sehingga estimator ̃̂ diperoleh persamaan sebagai berikut:
39
) (
̃ )
̃
̃̂
,
(
)
(
)
- ,(
̃̂
,
(
)
(
)
- (
) ,
̃̂
,
(
)
(
)
- (
) ,
̂̃
)
(
̃
)
(
(
̃
)
(
)
̃-
̃-
)
-̃
( ̃) ̃
( 4.13 )
Dimana I adalah matrik identitas, ̃ adalah titik knot dari
dan matrik
( ̃ ) adalah sebagai berikut ( ̃)
,
(
)
(
)
- (
) ,
(
)
-
Begitu juga untuk estimator parameter ̃, setelah disubstitusikan akan diperoleh: ̃̂
(
) (
̃
̃)
̃̂
(
)
(
̃
.(
) (
̃̂
(
)
.
̃
((
)
̃̂
(
) (
̃
(
̃̂
(
)
(
̃
(
̃
)
)
̃)/*
̃
(
̃ (
)
̃)/
)
̃)
) (
̃
)
(
̃
)
komponen yang mengandung ̃̂ dijadikan satu diruas kiri sebagai berikut: ̃̂
(
̃̂(
) (
( )
̃
) (
)
( )
) (
(
̃ )
̃
) (
( )
) (
̃ )
̃
Sehingga estimator ̃̂ diperoleh persamaan sebagai berikut: ̃̂
,
(
)
(
)
- ,(
̃̂
,
(
)
(
)
- (
) ,
̃̂
,
(
)
(
)
- (
) ,
̃
)
̃
(
)
(
(
̃
)
(
)
̃-
̃-
)
-̃
( ̃) ̃
( 4.14 )
Dimana I adalah matrik identitas, ̃ adalah titik knot dari
dan matrik
( ̃ ) adalah sebagai berikut ( ̃)
,
(
Setelah
)
(
diperoleh
)
- (
estimator
) , untuk
( komponen
)
parametrik
dan
nonparametrik, selanjutnya menentukan estimator model regresi semiparametrik spline truncated.
40
̂̃
̂(
̂̃
̃̂
)
̂̃ ̂̃
(
̂̃
̃̂ ( ̃) ̃
( ̃) ̃
( ̃)
( ̃ )) ̃
̃) ̃
(
( 4.15 )
4.1.2. Perumusan Uji Hipotesis Persamaan ( 4.4 ) dalam bentuk matrik dapat pula dituliskan sebagai berikut: ̃
̃) ̃
(
̃
( 4.16 )
dengan ̃
,
[ ]
-
(
(
̃
) )
̃ [ ] ̃ ((
) (
) )
dimana
[
]
[
̃
[
̃
,
]
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
) ]
̃
[ ]
(
)
(
)
(
Respon ̃ merupakan vektor berukuran
)
, matriks
(
(
)
̃)
-
(
(
)
),
adalah matriks yang memuat prediktor komponen parametrik yang berukuran ( berukuran
) dan (
̃ adalah titik knot dari
adalah matriks yang memuat komponen nonparametrik ) yang tergantung pada titik knot ̃ yang diberikan yaitu . Vektor parameter
41
̃
(
(
)
dengan ukuran ((
)
Karena error ̃
) maka
̃
(
̃) ̃
( (
(
(
)
(
)
(
)
)
dan ̃ merupakan vektor error.
) )
( 4.17 )
)
dan ̃
̃) (
(̃ . (
̃ )/
( 4.18 )
*.
Perumusan hipotesis yang digunakan untuk menguji signifikansi parameter model regresi semiparametrik spline truncated secara simultan adalah sebagai berikut: ̃
( 4.19 ) ̃
Menentukan ruang parameter dibawah ,
(
(
(
( ) yaitu sebagai berikut:
)
)
(
)
(
(
(
)
)
( 4.20 )
-
( ) yaitu sebagai berikut:
Menentukan ruang parameter dibawah ,
)
(
)
)
|̃
( ) dan
4.1.3. Estimasi Parameter dibawah Ruang
( 4.21 )
-
( )
( ) dengan menggunakan
Mendapatkan estimasi parameter dibawah
metode OLS. Berdasarkan pada persamaan ( 4.16 ), maka model dibawah ruang ( ) adalah ̃
̃) ̃
(
( 4.22 ) ̃
Diperoleh persamaan: ̃
̃
̃) ̃
(
( 4.23 )
Selanjutnya jumlah kuadrat error diberikan oleh: ̃ ̃
(̃
(
.̃
̃
(̃ ̃
̃) ̃ ) ( ̃
̃
(
̃ )/ ( ̃
(
̃) ̃
̃) ̃ )
(
̃) ̃ )
( ̃
(
42
̃) ̃
̃
(
̃) (
̃) ̃ )
(̃ ̃
̃
̃) ̃
(
̃
̃) (
(
̃) ̃ )
( 4.24 )
(̃ )
( 4.25 )
Untuk mendapatkan estimasi dari parameter di bawah ruang
, dilakukan
derivatif parsial. Derivatif parsial ( ̃ ) diberikan oleh: ( ( ̃ )) (̃ )
(̃ ̃
̃
̃) ̃
(
̃
̃) (
(
̃) ̃ )
(̃ ) ̃) ̃
(
̃) (
(
̃) ̃
Jika derivatif parsial diatas disamakan dengan nol, diperoleh persamaan: ̃) (
(
̃) ̃
̃) ̃
(
sehingga akan diperoleh estimator parameter dibawah ruang ̂ ̃
̃) (
. (
̃ )/
adalah berikut: ( 4.26 )
̃) ̃
(
Mendapatkan estimasi parameter dibawah
( ) dengan menggunakan
metode Fungsi Multiplier Lagrange (LM), karena terdapat syarat (konstrain). Diberikan fungsi LM yaitu (̃
)
(̃ )
(̃ )
( 4.27 )
dimana (̃ )
(̃
̃) ̃ ) ( ̃
(
̃) ̃ )
(
( 4.28 )
dengan konstrain ( ̃ ). Sehingga persamaan ( 4.28 ) dapat dijabarkan sebagai berikut: (̃ )
̃ ̃ ̃
(
)
̃) ̃
(
̃) (
(
̃ ̃
̃
̃ ̃) ̃
̃) ̃
(
̃) ̃
(
̃
̃) (
(
̃) ̃
( 4.29 )
Dengan mensubstitusi persamaan ( 4.27 ) ke persamaan ( 4.29 ), akan menjadi sebagai berikut: (̃
)
̃ ̃
̃
(
̃) ̃
̃
(
̃) (
(̃ ) Jika persamaan ( 4.30 ) diturunkan terhadap ̃ persamaan:
43
̃) ̃
( 4.30 )
maka akan menghasilkan
)) ( (̃ (̃ )
̃) ̃
(
̃) (
(
̃) ̃
( 4.31 )
Jika persamaan ( 4.31 ) disamakan dengan 0, maka persamaan akan menjadi: ̃) ̃
(
̃) (
̃) ̃
̃) (
̃) ̃
(
̃) ̃
( (
Sehingga akan didapatkan ̃ sebagai berikut: ̂ ̃
. (
̃) (
̃ )/
( (
̂ ̃
. (
̃) (
̃ )/
(
̂ ̃
̃) (
. (
̃) ̃ ̃) ̃
) ̃) (
. (
̃ )/
̃ )/
( 4.32 )
Jika persamaan ( 4.30 ) diturunkan terhadap
maka akan menghasilkan
persamaan: )) ( (̃ ( )
̃
Jika persamaan di atas disamakan dengan 0, maka persamaan akan menjadi: ̃
( 4.33 )
Dengan menstubtitusi persamaan ( 4.32 ) dan ( 4.33 ) akan mendapatkan , yaitu ̂ ̃
. ( ̃) (
. (
(. (
̃) (
̃ )/
̃ )/
̂ ̃
̃) (
̃ )/ *
̂ ̃
(
̃) (
̃)̃ ̂
( 4.34 )
Sehingga persamaan ( 4.32 ) akan menjadi ̂ ̃
̂ ̃
. (
̃) (
̃ )/
̃) (
(
̃)̃ ̂
( 4.35 )
4.1.4. Menentukan Statistik Uji Hipotesis Selanjutnya untuk mendapatkan statistik uji dari hipotesis persamaan ( 4.19 ) diselesaikan dengan menggunakan LRT. LRT digunakan untuk mencari rasio fungsi likelihood dari nilai maksimum dibawah ruang parameter nilai maksimum dibawah ruang parameter
44
terhadap
. Berdasarkan ruang parameter pada
persamaan ( 4.20 ) dan ( 4.21 ) maka dapat dicari fungsi likelihood dibawah dibawah
dan
.
Karena regresi semiparametrik spline truncated seperti pada persamaan ) maka ̃
(
( 4.4 ) ̃
dibawah ruang (̃
)
̃) ̃
( (
) sehingga fungsi likelihood
adalah sebagai berikut:
∏.
(
√
(̃
̃ ) ̃ ) )/
(
(
)
(
[( ̃
(
(
)
.
[̃ ̃
̃
̃) ̃ ) ( ̃
(
̃ ) ̃ )])
̃) ̃
(
( 4.36 ) ̃ (̃
̃) (
(
)
(
̃ ) ̃ ]/ )
[̃ ̃
̃
̃) ̃
(
( 4.37 ) ̃
̃) (
(
̃) ̃ ]
dengan penurunan parsial dari persamaan ( 4.37 ) terhadap
maka didapat
persamaan berikut: .
(̃
)/
(
[̃ ̃
)
̃
̃
̃) (
(
̃) ̃
(
( 4.38 )
̃) ̃ ]
Jika persamaam ( 4.38 ) disamakan dengan 0, maka persamaan diberikan oleh: [̃ ̃ ̂ ̂
̂̃
̃ ̃ (̃
̃
̃) ̃
( ̃) ̃
(
̃ ) ̂̃ ) ( ̃
(
̃
̂̃
̃) (
(
̃) (
(
̃) ̃ ] ̃ ) ̂̃
̃ ) ̂̃ )
(
( 4.39 )
Sehingga nilai maksimum dari fungsi likelihood pada persamaan ( 4.36 ) diberikan oleh: (̃
)
(
̂ ) (
.
̂
̃ ) ̂̃ )]/
45
[( ̃
(
̃ ) ̂̃ ) ( ̃ ( 4.40 )
Dengan mensubstitusikan persamaan ( 4.39 ) ke persamaan ( 4.40 ) maka akan menjadi: (̃
)
̂ )
(
)
(
̂ )
(
)
(
̂ )
(
(
(̃
(
(̃
(
.
̃ ) ̂̃ ) ( ̃ ̃ ) ̂̃ ) ( ̃
( (
̃ ) ̃̂ ) ) ̃ ) ̂̃ )
/ ( 4.41 )
Selanjutnya fungsi likelihood dibawah ruang
dijabarkan sebagai berikut.
Karena regresi semiparametrik spline truncated seperti pada persamaan ( 4.4 ) ) maka ̃
( ̃
ruang
̃) ̃
( (
) sehingga fungsi likelihood dibawah
adalah sebagai berikut:
(̃
)
∏.
(
√
(̃
̃ ) ̃ ) */
(
(
)
.
[( ̃
(
(
)
.
[̃ ̃
̃
̃) ̃ ) ( ̃
(
̃ ) ̃ )]/
̃) ̃
(
( 4.42 ) ̃ (̃
̃) (
(
)
(
̃ ) ̃ ]/ )
[̃ ̃
̃
̃) ̃
(
( 4.43 ) ̃
̃) (
(
̃) ̃ ]
Dengan penurunan parsial dari persamaan ( 4.43 ) terhadap
maka didapat
persamaan berikut: .
(̃ (
)/
[̃ ̃
)
̃
̃
̃) (
(
̃) ̃
(
( 4.44 )
̃) ̃ ]
Jika persamaam ( 4.44 ) disamakan dengan 0, maka persamaan diberikan oleh: [̃ ̃ [̃ ̃ ̂
̃ ̃
̃ ̂̃
(
̃
( ̃) ̃
( ̃) ̃
̂̃
̃) ̃ ̃
̃ (
( ̃) (
̃) (
(
46
̃) ( ̃) ̃ ] ̃ ) ̂̃
̃) ̃ ]
̂
(̃
̃ ) ̂̃ ) ( ̃
(
̃ ) ̂̃ )
(
( 4.45 )
Sehingga nilai maksimum dari fungsi likelihood pada persamaan ( 4.42 ) diberikan oleh: (̃
(
)
̂ )
.
̂
0( ̃
(
̃ ) ̂̃ ) ( ̃ ( 4.46 )
̃ ) ̂̃ )1/
(
Dengan mensubstitusikan persamaan ( 4.45 ) ke persamaan ( 4.46 ) maka akan menjadi: (̃
)
(̃ (̃
)
(
̂ )
(
̂ )
(
̂ )
(
.
(̃
(
(̃
(
̃ ) ̂̃ ) ( ̃ ̃ ) ̃̂ ) ( ̃
( (
̃ ) ̂̃ ) ) ̃ ) ̃̂ )
/ ( 4.47 )
Kemudian menghitung ratio likelihood dengan membagi antara persamaan ( 4.41 ) dan persamaan ( 4.47 ) seperti berikut: ( ̂) (̂)
( )
(
̂ )
(
̂ )
(
̂ ) ̂
( 4.48 )
Dengan mensubitusikan persamaan ( 4.39 ) dan ( 4.45 ) maka persamaan ( 4.48 ) diberikan oleh:
( )
(
(
(̃
(
̃ ) ̂̃ ) ( ̃
(
̃ ) ̂̃ )
(̃
(
̃ ) ̂̃ ) ( ̃
(
̃ ) ̂̃ )
(̃
(
(̃
(
̃ ) ̂̃ ) ( ̃ ̃ ) ̂̃ ) ( ̃
)
̃ ) ̂̃ ) ) ̃ ) ̂̃ )
( (
( 4.49 )
Sebelum melanjutkan menghitung ratio, akan dijabarkan terlebih dahulu pembilangnya (misal diberi lambang ) sebagai berikut: (̃
(
̃ ) ̂̃ ) ( ̃
Dengan mensubtitusikan (
( (
̃ ) ̂̃ ) ̃) ̃
47
(
̃ ) ̃ ) maka akan menjadi
(̃
̃ ) ̂̃
( ̃ ) ̂̃
( .̃
̃ )( ̂̃
( .( ̃
̃ )( ̂̃
(
̃ ) ̂̃ )
̃ )( ̂̃
̂̃ )/ . ̃
( ̂̃
̂̃ )
̃ ) ̂̃
(
̃ )/ .( ̃
(
̃ ) ̂̃ )
(
̂̃ )/
(̃
(
̃ ) ̂̃ ) ( ̃
(
(̃
(
̃ ) ̂̃ ) (
̃ )( ̂̃
̂̃ )
( ̂̃
̂̃ )
(
̃ )( ̃
(
̃ ) ̂̃ )
( ̂̃
̂̃ )
(
̃) (
̃ )( ̂̃
(̃
(
( ̂̃
̂̃ )
̃ ) ̂̃ ) ( ̃ ( ̂̃
̃ ) ̂̃ )
̂̃ )
̃ ) ̂̃ )
( ̂̃ )
( ̂̃
̃) (
(
Akan dijabarkan ruas kedua dan ketiga yaitu (̃
Dimana
̃ ) ̂̃
(
̂̃ )/
(
(
̃ ) ̂̃ ) ( ̃
(
̃ ) ̂̃ )
( ̃ ) ̂̃
(
̃ ) ̂̃
(
̃ ) ̂̃ ) (
(
̂̃ )
̃ )( ̂̃ dan
̃)
( 4.50 )
̂̃ )
pada persamaan ( 4.50 ). ̃ )( ̃
(
dan
̃ ) ̂̃ ) dengan mensubstitusikan nilai ̂̃ sebagai berikut:
( (̃
(
̃) . (
̃) (
̃
(
̃)
̃ (
̃) . (
̃
(
̃)
̃
̃)
( ̃ )( ̃
(
Dan untuk
(
(
̃) ( ̃
(
̃) ̃
(
̃) (
(
̃) ̃
(
̃) ̃
(
̃) . (
̃ )/ ̃) (
̃ ) ̃*
(
̃ )/
( (
̃) ̃) (
̃)
̃ ) ̂̃ ) sebagai berikut: ̃) ( ̃) . (
Sehingga persamaan ( 4.50 ) akan menjadi:
48
̃ )/ ̃) (
( ̃ )/
̃ ) ̃* (
̃) ̃
(̃
̃ ) ̂̃ ) ( ̃
(
( ̂̃
̂̃ )
̃ ) ̂̃ )
(
̃) (
(
̃ )( ̂̃
̂̃ )
Persamaan di atas dapat disederhanakan menjadi:
Selanjutkan akan dijabarkan persamaan
dengan mensubtitusikan persamaan
( 4.35 ) sebagai berikut: ( ̂̃
̂̃ )
̃) (
(
̃ )( ̂̃
̂̃ )
dengan mensubtitusikan ( ̂̃
̂̃ )
̃) (
. (
̃ )/
̃) (
(. (
̃ )/ *
̂ ̃
maka akan diperoleh persamaan sebagai berikut: ̂ ̃
̂ ̃
dengan ̃) (
(( (
̃) (
(
̃)*
)
̃) . (
̃) (
( ( ̃) (
̃ )/
̃)*
(. (
dan ̃) (
̃ )/ *
̃) (
̃ )/ *
Sehingga akan dihasilkan persamaan sebagai berikut:
̃) (
̂ (. ( ̃
Sehingga persamaan (̃
̃ )/ *
akan menjadi
̂ ) (̃ ̃)̃
(
̂ ̃
Selanjutnya persamaan
̂ ) ̃)̃
(
̂ (. ( ̃
̂ ̃
akan disubtitusikan ke ratio likelihood yang sudah
diperoleh sebelumnya yaitu pada persamaan ( 4.49 ) sebagai berikut: (̃
(
̂ ) (̃ ̃) ̃
(
̂ ) ̃) ̃
(̃
(
̂ ) (̃ ̃) ̃
( )
̂ ̃ (. (
̃) (
̃ )/ *
̂ ̃
̂ ) ̃) ̃
(
(
)
̂̃ [. ( ( )
(̃
(
̃) (
̃ )/ ]
̃ ) ̂̃ ) ( ̃
(
(
̂̃ ̃ ) ̂̃ ) )
49
( ) ̃) (
̂̃ [. ( (̃
(
( )
(
̃ )/ ]
̃ ) ̂̃ ) ( ̃
(
̂̃ ̃ ) ̂̃ ))
(
)
( 4.51 )
Berdasarkan persamaan ( 4.51 ) maka dapat dinyatakan bahwa statistik uji yang dapat
disimbolkan
sebagai ̃
̃) (
̃ )/ ]
̃ ) ̂̃ ) ( ̃
(
̃
hipotesis
melawan
adalah:
̂̃ [. ( (̃
dari
̂̃
( 4.52 )
̃ ) ̂̃ )
(
4.1.5. Mendapatkan Distribusi Statistik Uji Hipotesis Untuk mendapatkan distribusi statistik uji maka akan dilakukan penjabaran pada persamaan
dan
. Langkah pertama adalah menjabarkan
sebagai berikut: ̃) (
̂̃ [. (
̃ )/ ]
Dengan mensubtitusikan ̂̃ pada ̃) (
(. ( . (
̃) . (
̃ (
̃
̃) (
. (
̃) (
(
̃) . (
̃ )/ ̃ )/
maka persamaan ( 4.53 ) akan menjadi ̃ ) ̃* [. (
(
̃ )/
(
̃) (
̃ )/
(
̃) ̃
Dari persamaan ( 4.54 ) dapat dinyatakan bahwa (
̃) . (
̃) (
̃ )/ ]
̃)
̃) ̃
(
̃) (
̃) (
̃) ̃
(
̃) ( ̃ )/
( 4.53 )
̂̃
̃ )/
( 50
̃)
( 4.54 )
Selanjutnya akan dibuktikan bahwa simetris jika
adalah simetris dan idempotent. Matrik
, berikut penjabarannya ̃) . (
( (
̃) (
̃) . (
(
̃ )/
̃) (
̃ )/
̃ ))
(
̃)
(
Dari penjabaran diatas terlihat bahwa terbukti bahwa matrik matrik
sehingga
adalah simetris. Selanjutnya akan dibuktikan bahwa
adalah idempotent. Berikut penjabarannya ̃) . (
( (
̃) . (
(
̃ )/
̃) (
̃) . (
(
̃ )/
̃) ( ̃) (
terbukti bahwa matrik Karena
̃) (
̃) . (
(
(
̃)
(
̃ )/ ̃ )/
̃ ))
̃)
( ̃)
(
adalah idempotent.
adalah simetris dan idempotent maka dapat dinyatakan bahwa (
̃
( 4.55 )
)
̃
dan ̃
Selanjutnya akan didapatkan nilai Karena matrik ( )
̃) . ( ̃) . (
(
( )
(
( )
( (
( )
. (
̃ ( )
adalah simetris dan idempotent maka
( (
Jika
( )
dengan ukuran
)
((
)
(
̃) ( ̃) (
̃ )/ ̃ )/
dan
(
̃ )) (
) sehingga
̃) (
̃) . (
) (
) )/
(
)
̃) (
51
̃ )/ *
̃ ) maka
( )
( )
Sehingga
( )
(
) ̃
Selanjutnya akan didapatkan nilai dari ̃
̃
̃ ) ̃) (
( (
̃
̃) . (
(
)
sebagai berikut:
̃) (
̃ )/
̃) (
(
̃) ̃
Akan dilakukan penjabaran pada pembilang sebagai berikut: ̃
̃
̃)̃ ̂) (
( (
̃)̃ ̂
̂ ̃
̃) (
(
̃)̃ ̂
Jika ̃ kita substitusi dengan ̃ maka persamaannya akan menjadi ̃
̃
. ̂̃
( ( ̃) (
( ̂ *̃
̃
̂̃
̃) (
̃
̂̃
(
̃ )/ *
(. (
̃) (
(
̃) ̂̃
̃) ( ̃) (
̃) (
̂ ̃
̃ )/ *
̃ )/
̃) (
̃̂
̃ )/ *
̃) (
̂ ̃ (. (
̃
̃) ̂̃
̃) (
̂ ̃ (. (
̃ )/
̃ )/ *
̃) (
(. ( ̃) (
. (
̃ )/ *
̃ )/
̃ )/
(
̃) (
̃) (
̃) (
̃ )/ *
̂ ) ̃
̃) (
̃ )+
̂ + ̃
̃)( (
̂ (. ( ̃
. (
̃̂
̃)) / ̂̃ /
̃) (
̃) (
. (
̂ (. ( ̃
̃) (
(. (
̃
̃)
. (
(
̃)) .( (
̃) (̃ ̂
̃) (
(
̂ *̃
̃
̃) (
̃ )/ *
̃)) ̂ ̃ ̃) (
(. (
̃ )/ *
̂ ̃
̃) ̂̃
(
̃) (
̂ ̃
̂ ̃ (. (
̃) (
̃ )/ *
̂ ̃
̃
Sehingga dapat dinyatakan bahwa )
((
(
( 4.56 )
))
Langkah kedua yaitu menjabarkan (̃
(
.̃
̂ ̃
̃ ̃
̃
̃ ̃
̃)̂ ̃ ) (̃
̃)̂ ̃
( ̂ ̃
(
̃) ̃
̃)̂ ̃ )
(
̃ )/ ( ̃
(
̃)̂ ̃ )
( ̂ ̃ ̂ ̃
sebagai berikut:
̃) ̃
(
̂ ̃
̃) (
(
̃) (
( ̃)̃ ̂
Dengan mensubtitusikan ̂ ̃ maka akan diperolah: ̃ ̃
(. (
̃) (
̃ )/
(
52
̃ ) ̃*
(
̃) ̃
̃)̂ ̃
̃) (
(. (
̃) (
. ( ̃ ̃ ̃
̃
̃ ̃
̃) ( ̃
̃ ̃
̃ (
̃ [
(
(
̃) ̃
̃) (
̃)
(
̃) ̃
̃ )/
̃ )/
̃) . ( ̃) . (
(
̃) (
̃) (
̃)
̃) ̃
(
̃) . (
(
̃ )/
̃ )/
̃ )/
̃) . (
̃ (
̃) (
̃) (
̃) (
(
̃) ̃
(
̃) . (
(
̃ ) ̃*
(
̃ )/
̃) . (
( . (
̃
̃ )/
̃) ( ̃) (
(
̃) ̃
̃ )/
(
̃ )/
̃) ̃ ̃ )] ̃
(
̃
( 4.57 ) ( 4.58 )
Dari persamaan ( 4.57 ) dapat dinyatakan bahwa ̃) . (
(
̃) (
̃ )/
Selanjutnya akan dibuktikan bahwa simetris jika (
adalah simetris dan idempotent. Matrik
, berikut penjabarannya (
̃) . ( ̃) . (
(
̃) ( ̃) (
̃ )/
terbukti bahwa matrik
̃ ))
(
̃ )/
̃)
(
Dari penjabaran diatas terlihat bahwa
matrik
̃)
(
dengan ukuran
adalah simetris. Selanjutnya akan dibuktikan bahwa
adalah idempotent. Berikut penjabarannya
[
(
(
̃) . (
̃) (
̃ )/
(
̃ )]
(
̃) . (
̃) (
̃ )/
(
̃)
̃) . (
sehingga
̃) (
̃ )/
( 53
̃) (
̃)
̃) (
. (
̃ )/
̃) . (
(
̃) . (
(
̃) (
terbukti bahwa matrik Karena
̃) (
̃) . (
(
̃)
(
̃ )/
̃ )/
̃)
(
̃) (
̃ )/
̃)
(
̃)
(
adalah matrik idempotent.
adalah simetris dan idempotent maka dapat dinyatakan bahwa (
̃
( 4.59 )
)
̃
dan ̃
Selanjutnya akan didapatkan nilai Karena matrik
̃ ( )
adalah simetris dan idempotent maka
( )
(
( )
()
( )
( )
( )
,(
̃) . (
(
̃) . (
( ( ,(
) )
̃) (
̃ )/
̃) (
(
̃ ))
( ̃ )/
( )
̃ ))
(
) -
(
) -
Sehingga didapatkan ( )
( )
,(
)
Selanjutnya akan didapatkan nilai ̃ ̃
̃
̃
̃
( (
̃) ̃ ) [
̃) (
(
(
̃) (
̃
̃) ̃
̃) (
̃) (
(
̃
(
) -
sebagai berikut:
̃) . (
(
̃) ̃
̃
(
̃ )/
̃) . (
̃) (
(
̃) (
̃ )] (
̃ )/
̃) ̃
(
̃) (
̃) ̃
Sehingga dapat dinyatakan bahwa .
((
)
(
))/
( 4.60 )
54
̃) ̃
Langkah selanjutnya adalah membuktikan bahwa
dan
independent.
Pembuktian ini menggunakan Teorema 5.6b Corollary 1 pada Rencher, dkk (2007) yang sudah dituliskan pada Bab 2. Sesuai dengan persamaan ( 4.54 ) dan persamaan ( 4.57 ) maka didapatkan ̃) . (
(
̃) (
̃ )/
̃)
(
dan ̃) . (
(
̃) (
̃ )/
̃)
(
Sehingga ̃) . (
( [
̃) ( ̃) . (
( ̃) . (
(
̃)
(
̃) (
(
̃ )]
(
̃)
(
̃) . (
̃) (
̃ )/
̃)
(
̃) . (
(
̃ )/
̃ )/
̃ )/
̃)
(
̃) (
̃) (
̃) (
. (
̃ )/
̃) (
̃) . (
(
Karena
̃ )/
̃) (
̃)
(
̃ )/
maka dapat dikatakan bahwa
̃)
(
dan
independent.
Dari penjabaran di atas didapatkan hasil sebagai berikut: 1.
((
)
(
2.
.
((
)
3.
dan
)) (
))/
independent.
Sehingga berdasarkan Rencher (2007) yang menyatakan bahwa jika u adalah ( ) , v adalah ⁄ ⁄
(
( ), dan u dan v adalah independent, maka )
Sehingga dari ketiga kriteria yang diperoleh, maka dapat dituliskan
55
(
(
⁄
⁄
)⁄.
((
)
⁄(
)
(
⁄.
)⁄(
)
(
)
((
) (
) ( (
((
))/
).
((
)
(
))/*
(
))/*
) (
) ( (
((
))/
).
((
)
Sehingga distribusi statistik uji yang dihasilkan adalah ⁄( ⁄.
)
( )
((
)
( 4.61 )
(
))/
((
) ( (
).
)
((
(
))/*
Dimana ̃
̃) . (
(
̃ [
̃) (
̃) . (
(
̃ )/ ̃) (
( ̃ )/
̃) ̃ (
̃ )] ̃
4.1.6. Menentukan Daerah Penolakan Uji Hipotesis Daerah penolakan
dimana
, dan k adalah konstanta
sehingga ( ̂) (̂) Selanjutnya dengan mensubtitusikan ratio likelihood yang sudah dihasilkan sebelumnya yaitu persamaan ( 4.51 ) maka akan didapatkan
(
)
.
/ (
*
Jika kedua ruas dikalikan dengan pangkat menjadi ( *
(
*
56
⁄
maka persamaan diatas akan
( *
( * Jika kedua ruas dikalikan dengan .
)
((
(
))/⁄(
)
(
) maka persamaan akan
menjadi ( .
)
(
)
)
((
(
.( *
))/
/
.
)
(( (
(
)
(
))/ )
Berdasarkan persamaan ( 4.61 ) maka dapat dituliskan .( *
/
. (
(. /
dimana
)
((
(
)
)
(
)
((
.
))/
(
)
)
(
))/
(
)
̃
Daerah kritik untuk uji {(
̃ )
adalah ( 4.62 )
)}
Jika diberikan taraf signifikansi maka (
)
|
(
)
|̃
( 4.63 )
dengan ⁄( ⁄.
)
( )
((
) (
((
))/
) ( (
).
((
)
(
))/*
Dimana ̃ ̃ [
̃) . (
( (
̃) (
̃) . (
Sehingga daerah kritik penolakan besar dari
̃ )/ ̃) (
( ̃ )/
̃) ̃ (
̃ )] ̃
diberikan jika statistik uji
(F tabel).
57
(F hitung) lebih
4.2. Aplikasi pada Data APK SLTA Tahun 2015 di Provinsi Jawa Timur Model dan pengujian hipotesis regresi semiparametrik spline truncated yang telah dibahas pada sub bab 4.1 akan diaplikasikan pada data APK SLTA Tahun 2015 di Provinsi Jawa Timur. Variabel respon yang digunakan adalah APK SLTA ( ), sedangkan variabel prediktor yang digunakan sebanyak lima variabel yaitu jumlah penduduk miskin ( ), rasio jenis kelamin ( ), rata-rata ART ( ), TPT ( ) dan PDRB Perkapita ( ). Unit observasi yang digunakan sebanyak 38 kabupaten/kota. Sebelum mengaplikasikan ke regresi semiparametrik spline truncated, akan dilakukan analisis dengan menggunakan regresi linier berganda. Selanjutnya akan dilakukan perbandingan hasil dari kedua analisis regresi tersebut.
4.2.1. Analisis Deskriptif Sebelum melakukan pemodelan dan pengujian hipotesis, akan dilakukan analisis deskriptif terlebih dahulu. Hasil dari statistik deskriptif dapat digunakan untuk inisiasi titik-titik knot pada tahap selanjutnya.
Tabel 4.1 Statistik Deskriptif Variabel Respon dan Variabel Prediktor Variabel
Minimum
Maksimum
Range
Mean
54,63
122,09
67,46
84,52
Standar Deviasi 15,13
7,70
292,90
285,10
126,00
77,50
90,66
101,32
10,66
97,13
2,57
3,03
4,23
1,20
3,64
0,25
0,97
8,46
7,49
4,36
1,73
14,56
348,02
333,46
43,78
56,32
Sumber: hasil penghitungan Dari tabel statistik dekstriptif di atas dapat dilihat karakteristik masingmasing variabel, baik variabel respon maupun variabel prediktor. Berdasarkan Tabel 4.1 variabel respon ( ) yaitu APK SLTA Provinsi Jawa Timur memiliki nilai rata-rata APK SLTA pada Tahun 2015 sebesar 84,52 persen dengan standar
58
deviasi sebesar 15,13. Nilai APK SLTA tertinggi sebesar 122,09 persen terdapat pada Kabupaten Madiun. Sedangkan nilai APK SLTA terendah dengan nilai 54,63 persen terdapat pada Kabupaten Sampang. Dimana range nilai APK SLTA Provinsi Jawa Timur dengan 38 kabupaten/kota sebesar 67,46. Berikut adalah gambaran karakteristik untuk masing-masing variabel prediktor, yaitu jumlah penduduk miskin ( ), rasio jenis kelamin ( ), rata-rata ART ( ), TPT ( ) dan PDRB Perkapita ( ). a. Jumlah penduduk miskin di Provinsi Jawa Timur pada Tahun 2015 yang terbanyak ada di Kabupaten Malang dan yang paling sedikit ada di Kota Mojokerto, dengan range jumlah penduduk miskin adalah sebesar 285,1 ribu. Rata-rata jumlah penduduk miskin di Provinsi Jawa Timur pada Tahun 2015 ada sebanyak 126 ribu dengan standar deviasi sebesar 77.50. b. Rasio jenis kelamin terendah di Provinsi Jawa Timur Tahun 2015 adalah Kabupaten Sumenep dengan nilai sebesar 90,66 dan yang tertinggi adalah Kota Batu dengan nilai 101,32. Sehingga range rasio jenis kelamin di Provinsi Jawa Timur sebesar 10,66. Rata-rata rasio jenis kelamin Provinsi Jawa Timur sebesar 97,13 dengan standar deviasi sebesar 2,57. Hal ini menunjukkan bahwa jumlah penduduk perempuan lebih banyak daripada jumlah penduduk laki-laki. c. Rata-rata ART di Provinsi Jawa Timur yang paling sedikit adalah 3 ART dan yang tertinggi adalah 4 ART. Sehingga selisih rata-rata ART hanya sebesar 1 ART. Rata-rata dari rata-rata ART secara keseluruhan adalah sebesar 4 ART dengan standar deviasi sebesar 0,25. d. TPT terendah ada pada angka 0,97 persen yaitu di Kabupaten Pacitan dan TPT tertinggi ada pada angka 8,46 persen yaitu di Kota Kediri. Range angka TPT di Provinsi Jawa Timur sebesar 7,49. Rata-rata TPT adalah sebesar 4,36 dengan standar deviasi sebesar 1,73. e. PDRB Perkapita terendah ada pada angka 14,56 juta rupiah yaitu di Kabupaten Pamekasan, sedangkan PDRB Perkapita tertinggi ada pada angka 348,02 juta rupiah yaitu di Kota Kediri. Range angka PDRB Perkapita di Provinsi Jawa Timur sebesar 333,46 juta rupiah. Rata-rata PDRB Perkapita adalah 43,78 juta rupiah dengan standar deviasi sebesar 56,32. 59
4.2.2. Memodelkan APK SLTA menggunakan Regresi Linier Berganda Model regresi parametrik yang dalam hal ini didekati dengan regresi linier berganda seperti pada persamaan ( 2.5 ) dengan
adalah variabel respon,
adalah parameter yang tidak diketahui, variabel prediktor dan
adalah
adalah error random yang identik, independen,
berdistribusi normal dengan mean nol dan variansi
. Maka estimasi kurva
regresi linier berganda untuk APK SLTA Tahun 2015 di Provinsi Jawa Timur diberikan oleh: ̂ dimana ̂ adalah APK SLTA, rasio jenis kelamin,
adalah jumlah penduduk miskin,
adalah rata-rata ART,
adalah TPT dan
adalah adalah
PDRB per kapita.
4.2.2.1. Pengujian Signifikan Parameter secara Simultan Pengujian hipotesis untuk menguji signifikansi parameter secara simultan menggunakan hipotesis sebagai berikut:
dimana Hasil ANOVA pada pengujian hipotesis secara simultan tersaji pada Tabel 4.2.
Tabel 4.2 ANOVA Hasil Regresi Linier Berganda Sumber Derajat Jumlah Variasi Kebebasan Kuadrat Regresi 5 4157,07 Error 32 4309,07 Total 37 8466,14 Sumber: Hasil penghitungan
Rata-rata Kuadrat 831,41 134,66
Fhitung
p-value
6,17
0,000
Berdasarkan Tabel 4.2 terlihat bahwa nilai p-value sebesar 0,00 lebih kecil dari nilai
(
), sehingga diperoleh keputusan tolak
. Maka dapat
disimpulkan bahwa paling sedikit terdapat satu variabel prediktor yang signifikan dalam model. Model regresi linier berganda ini memiliki koefisien determinasi
60
(R2) sebesar 49,10 persen. Hal ini berarti bahwa variasi dari variabel respon dapat dijelaskan oleh kelima variabel prediktor sebesar 49,10 persen, sedangkan sisanya 50,90 persen dijelaskan oleh faktor lain.
4.2.2.2. Pengujian Signifikan Parameter secara Parsial Untuk mengetahui parameter mana saja yang berpengaruh secara signifikan terhadap model maka dilakukan pengujian hipotesis secara parsial. Pengujian signifikansi parameter secara parsial menggunakan hipotesis sebagai berikut:
Hasil pengujian signifikansi parameter secara parsial tersaji pada Tabel 4.3.
Tabel 4.3 Hasil Uji Hipotesis secara Parsial Variabel Konstan
Parameter
Estimator 114,10 -0,12 0,03 -8,33 3,59 -0,07
thitung 1,43 -4,60 0,04 -1,00 2,53 -1,62
P-value 0,16 0,00 0,97 0,33 0,02 0,11
Sumber: hasil penghitungan
Berdasarkan Tabel 4.3 terlihat bahwa dari 6 parameter terdapat 2 parameter yang signifikan dan terdapat 4 parameter yang tidak signifikan. Sehingga dari 5 variabel prediktor yang digunakan hanya 2 variabel yang signifikan. Kedua variabel yang signifikan tersebut adalah jumlah penduduk miskin dan TPT.
4.2.2.3. Pengujian Asumsi Residual Residual pada regresi linier berganda harus memenuhi identik, independen dan berdistribusi normal (IIDN). Pemeriksaan asumsi residual ini dilakukan untuk mengetahui apakah residual yang terbentuk telah memenuhi asumsi IIDN. Pengujian asumsi residual identik menggunakan uji glejser. Pendeteksian asumsi
61
independen menggunakan plot Autocorrellation Function (ACF). Dan pengujian asumsi normal menggunakan Kolmogorov-Smirnov.
4.2.2.3.1. Pengujian Asumsi Identik Pengujian asumsi identik dimaksudkan untuk mendeteksi apakah varians dari residualnya memiliki varians yang homogen atau tidak. Pemeriksaan menggunakan uji glejser. Hipotesis yang digunakan adalah:
𝑖 Hasil pengujian glejser tersaji pada Tabel 4.4.
Tabel 4.4 Hasil Uji Glejser Sumber Derajat Jumlah Variasi Kebebasan Kuadrat Regresi 5 364,05 Error 32 1182,22 Total 37 1546,27 Sumber: hasil penghitungan
Rata-rata Kuadrat 72,81 36,94
Fhitung
p-value
1,97
0,110
Dari Tabel 4.4 terlihat bahwa nilai p-value sebesar 0,11 lebih besar dari nilai
yang ditetapkan yaitu 0,05 sehingga keputusan yang diambil adalah gagal
tolak
. Hal ini memberikan kesimpulan bahwa varians dari residual adalah
homogen, sehingga asumsi identik pada model regresi linier berganda yang terbentuk telah terpenuhi.
4.2.2.3.2. Pemeriksaan Asumsi Independen Pemeriksaan asumsi independen dimaksudkan untuk mendeteksi apakah terjadi korelasi antar residual. Pemeriksaan dilakukan dengan menggunakan plot ACF. Hasil dari plot ACF tersaji pada Gambar 4.1.
62
1.0 0.8
Autocorrelation
0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1
2
3
4
5
6
7
8
9
10
Lag
Gambar 4.1 Plot Autocorrelation Function (ACF) Residual Dari Gambar 4.1 terlihat bahwa tidak ada lag yang keluar dari batas toleransi, hal ini menandakan bahwa tidak ada korelasi antar residual. Berdasarkan hasil pemeriksaan plot ACF residual, maka asumsi independen pada model regresi linier berganda yang terbentuk telah terpenuhi.
4.2.2.3.3. Pengujian Asumsi Distribusi Normal Residual regresi linier berganda harus memenuhi asumsi distribusi normal. Oleh karenanya dilakukan pemeriksaan asumsi distribusi normal pada residual yang diperoleh. Pemeriksaan dilakukan dengan menggunakan uji KolmogorovSmirnov. Hipotesis yang digunakan adalah sebagai berikut: ( )
( ) (Residual berdistribusi Normal)
( )
( ) (Residual tidak berdistribusi Normal).
Hasil uji Kolmogorov-Smirnov disajikan dalam bentuk plot seperti terlihat pada Gambar 4.2.
63
Gambar 4.2 Probability Plot Residual Plot residual seperti yang terlihat pada Gambar 4.2 menghasilkan p-value sebesar 0,150 yang lebih besar dari nilai
yang ditentukan yaitu 0,05, sehingga
keputusan yang diambil adalah gagal tolak
. Oleh karenanya dapat disimpulkan
bahwa residual berdistribusi normal. Dari hasil uji ini maka regresi linier berganda yang dihasilkan memenuhi asumsi berdistribusi normal.
4.2.3. Memodelkan APK SLTA menggunakan Regresi Semiparametrik Spline Truncated Selanjutnya dilakukan analisis data dengan melakukan eksplorasi data terlebih dahulu. Langkah pertama yang dilakukan adalah dengan membuat scatter plot untuk mengidentifikasi bentuk pola hubungan antara variabel respon dengan masing-masing variabel prediktor.
4.2.3.1. Menentukan Variabel Komponen Parametrik dan Nonparametrik Tahap awal yang dilakukan untuk melakukan proses pemodelan regresi semiparametrik spline truncated adalah dengan membuat scatter plot antara variabel respon dengan masing-masing variabel prediktor. Dari hasil scatter plot 64
ini dapat dilihat bentuk pola hubungan antara variabel respon dengan masingmasing variabel prediktor. Dari informasi bentuk pola hubungan tersebut dapat digunakan untuk menentukan variabel prediktor mana yang digunakan sebagai komponen parametrik dan variabel sebagai komponen nonparametrik. Berikut adalah hasil scatter plot antara variabel respon dengan masing-masing variabel prediktor:
130 120
APK SLTA (persen)
110 100 90 80 70 60 50 0
50
100
150
200
250
300
Jumlah Penduduk Miskin (jiwa)
Gambar 4.3 Scatter Plot antara APK SLTA dengan Jumlah Penduduk Miskin Gambar 4.3 menunjukkan bentuk pola hubungan antara variabel APK SLTA dengan jumlah penduduk miskin yang cenderung membentuk pola tertentu. Pola hubungan yang terlihat cenderung mengikuti garis lurus atau linier. Dari hasil scatter plot tersebut maka variabel jumlah penduduk miskin didekati sebagai komponen parametrik.
65
130 120
APK SLTA (persen)
110 100 90 80 70 60 50 90
92
94
96
98
100
102
Rasio Jenis Kelamin (persen)
Gambar 4.4 Scatter Plot antara APK SLTA dengan Rasio Jenis Kelamin Gambar 4.4 menunjukkan bentuk pola hubungan antara variabel APK SLTA dengan rasio jenis kelamin yang cenderung tidak membentuk pola tertentu. Pola hubungan yang terlihat cenderung mengalami perubahan perilaku pada sub interval tertentu. Dari hasil scatter plot di atas, maka variabel rasio jenis kelamin dapat didekati sebagai komponen nonparametrik.
130 120
APK SLTA (persen)
110 100 90 80 70 60 50 3.0
3.2
3.4
3.6
3.8
4.0
Rata-rata ART (jiwa)
Gambar 4.5 Scatter Plot antara APK SLTA dengan Rata-rata ART
66
4.2
Gambar 4.5 menunjukkan bentuk pola hubungan antara variabel APK SLTA dengan rata-rata ART yang cenderung tidak membentuk pola tertentu. Pola hubungan yang terlihat cenderung mengalami perubahan perilaku pada sub interval tertentu. Dari hasil scatter plot diatas variabel rata-rata ART didekati sebagai komponen nonparametrik.
130 120
APK SLTA (persen)
110 100 90 80 70 60 50 0
1
2
3
4
5
6
7
8
9
TPT (persen)
Gambar 4.6 Scatter Plot antara APK SLTA dengan TPT Gambar 4.6 menunjukkan bentuk pola hubungan antara variabel APK SLTA dengan TPT yang cenderung tidak membentuk pola tertentu. Pola hubungan yang terlihat cenderung mengalami perubahan perilaku pada sub interval tertentu. Dari hasil kombinasi scatter plot dapat disimpulkan bahwa variabel TPT didekati sebagai komponen nonparametrik.
67
130 120
APK SLTA (persen)
110 100 90 80 70 60 50 0
50
100
150
200
250
300
350
PDRB perkapita (juta rupiah)
Gambar 4.7 Scatter Plot antara APK SLTA dengan PDRB Perkapita Gambar 4.7 menunjukkan bentuk pola hubungan antara variabel APK SLTA dengan PDRB Perkapita yang cenderung tidak membentuk pola tertentu. Pola hubungan yang terlihat cenderung mengalami perubahan perilaku pada sub interval tertentu. Daerah yang memiliki titik PDRB perkapita terjauh adalah Kota Kediri dengan nilai PDRB perkapita sebesar 348, 02 juta rupiah dan Kota Surabaya dengan nilai PDRB perkapita sebesar 142,6 juta rupiah. Sama seperti penjelasan sebelumnya, maka dari hasil scatter plot dapat disimpulkan bahwa variabel PDRB Perkapita didekati sebagai komponen nonparametrik. Ringkasan hasil penentuan komponen parametrik dan komponen nonparametrik dapat dituliskan pada Tabel 4.5.
Tabel 4.5 Ringkasan Penentuan Komponen Parametrik dan Nonparametrik Notasi
Nama Variabel
Jumlah Penduduk Miskin Rasio jenis kelamin Rata-rata ART TPT PDRB Perkapita Sumber: hasil penghitungan
68
Komponen Parametrik Nonparametrik Nonparametrik Nonparametrik Nonparametrik
4.2.3.2. Memodelkan APK SLTA Provinsi Jawa Timur Menggunakan Satu Titik Knot Model regresi semiparametrik spline truncated dengan menggunakan satu titik knot dengan prediktor satu komponen parametrik dan empat komponen nonparametrik adalah sebagai berikut: ( (
)
)
(
(
)
)
Nilai GCV yang dihasilkan dengan menggunakan regresi semiparametrik spline truncated dengan satu knot disajikan dalam Tabel 4.6. Syntax program R untuk mengolah dengan satu titik knot dapat dilihat pada Lampiran 2.
Tabel 4.6 Nilai GCV dengan Satu Titik Knot Knot z1 z2 98,27 3,89 98,49 3,91 98,71 3,94 98,93 3,96 99,14 3,99 99,36 4,01 99,58 4,03 99,80 4,06 100,01 4,08 100,23 4,11 100,45 4,13 Sumber: hasil penghitungan
z3 6,32 6,47 6,63 6,78 6,93 7,08 7,24 7,39 7,54 7,70 7,85
z4 252,75 259,55 266,36 273,16 279,97 286,77 293,58 300,38 307,19 313,99 320,80
GCV 189,32 186,50 182,40 178,15 167,15 160,21 162,69 178,57 178,44 178,18 177,85
Berdasarkan Tabel 4.6 nilai GCV minimum yang dihasilkan adalah sebesar 160,21. Lokasi titik knot pada variabel rasio jenis kelamin ( ) yaitu 99,36 (
),
variabel rata-rata ART ( ) yaitu 4,01 (
)
), variabel TPT ( ) yaitu 7,08 (
dan variabel PDRB Perkapita ( ) yaitu 286,77 (
69
)
4.2.3.3. Memodelkan APK SLTA Provinsi Jawa Timur Menggunakan Dua Titik Knot Model regresi semiparametrik spline truncated dengan menggunakan dua titik knot dengan prediktor satu komponen parametrik dan empat komponen nonparametrik adalah sebagai berikut: ( (
)
(
)
)
(
(
) (
)
) (
)
(
)
Nilai GCV yang dihasilkan dengan menggunakan regresi semiparametrik spline truncated dengan dua knot disajikan dalam Tabel 4.7. Syntax program R untuk mengolah dengan dua titik knot dapat dilihat pada Lampiran 3.
Tabel 4.7 Nilai GCV dengan Dua Titik Knot Knot z1 z2 98,27 3,89 100,45 4,13 98,27 3,89 100,67 4,16 98,27 3,89 100,88 4,18 98,27 3,89 101,10 4,21 98,49 3,91 98,71 3,94 98,49 3,91 98,93 3,96 98,49 3,91 99,14 3,99 98,49 3,91 99,36 4,01 98,49 3,91 99,58 4,03 Sumber: hasil penghitungan
z3 6,32 7,85 6,32 8,00 6,32 8,15 6,32 8,31 6,47 6,63 6,47 6,78 6,47 6,93 6,47 7,08 6,47 7,24
z4 252,75 320,80 252,75 327,60 252,75 334,41 252,75 341,21 259,55 266,36 259,55 273,16 259,55 279,97 259,99 286,77 259,55 293,58
GCV 216,75 216,78 216,73 216,51 158,34 159,73 163,91 171,99 175,87
Berdasarkan Tabel 4.7 nilai GCV minimum yang dihasilkan adalah sebesar 158,34. Lokasi titik knot pada variabel rasio jenis kelamin ( ) yaitu 98,49 (
) dan 98,71 (
), variabel rata-rata ART ( ) yaitu 3,91 ( 70
) dan
3,94 (
), variabel TPT ( ) yaitu 6,47 (
PDRB Perkapita ( ) yaitu 259,55 (
) dan 6,63 (
) dan 266,36 (
) serta variabel
).
4.2.3.4. Memodelkan APK SLTA Provinsi Jawa Timur Menggunakan Tiga Titik Knot Model regresi semiparametrik spline truncated dengan menggunakan tiga titik knot dengan prediktor satu komponen parametrik dan empat komponen nonparametrik adalah sebagai berikut: ( (
)
) (
( )
) (
(
)
)
(
)
(
)
(
)
(
)
(
)
(
)
Nilai GCV yang dihasilkan dengan menggunakan regresi semiparametrik spline truncated dengan tiga knot disajikan dalam Tabel 4.8. Syntax program R untuk mengolah dengan tiga titik knot dapat dilihat pada Lampiran 4.
Tabel 4.8 Nilai GCV dengan Tiga Titik Knot Knot z1 z2 91,75 3,15 100,67 4,16 101,10 4,21 91,75 3,15 100,88 4,18 101,10 4,21 91,97 3,18 92,18 3,20 92,40 3,23 91,97 3,18 92,18 3,20 92,62 3,25 91,97 3,18 92,18 3,20 92,84 3,27 Sumber: hasil penghitungan
z3 1,73 8,00 8,31 1,73 8,15 8,31 1,89 2,04 2,19 1,89 2,04 2,35 1,89 2,04 2,50
71
z4 48,59 327,60 334,41 48,59 334,41 341,21 55,39 62,20 69,00 55,39 62,20 75,81 55,39 62,20 82,61
GCV 233,72
233,77
110,79
132,68
148,65
Berdasarkan Tabel 4.8 nilai GCV minimum yang dihasilkan adalah sebesar 110.79. Lokasi titik knot pada variabel rasio jenis kelamin ( ) yaitu 91,97 ( (
), 92,18 (
), 3,20 (
dan 2,19 ( (
) dan 92,40 (
) dan 3,23 (
), variabel rata-rata ART ( ) yaitu 3,18
), variabel TPT ( ) yaitu 1,89 (
), 2,04 (
) serta variabel PDRB Perkapita ( ) yaitu 55,39 (
) dan 69,00 (
)
), 62,20
).
4.2.3.5. Memodelkan APK SLTA Provinsi Jawa Timur Menggunakan Kombinasi Titik Knot Model regresi semiparametrik spline truncated dengan menggunakan kombinasi titik knot dengan prediktor satu komponen parametrik dan empat komponen nonparametrik tergantung dari kombinasi titik knot yang terbentuk. Nilai GCV yang dihasilkan dengan menggunakan regresi semiparametrik spline truncated dengan kombinasi titik knot disajikan dalam Tabel 4.9. Syntax program R untuk mengolah dengan dua titik knot dapat dilihat pada Lampiran 4.
Tabel 4.9 Nilai GCV dengan Kombinasi Titik Knot Knot z1 z2 91,97 4,01 92,18 92,40 91,97 4,01 92,18 92,40 91,97 4,01 92,18 92,40 91,97 4,01 92,18 92,40 91,97 4,01 92,18 92,40 91,97 4,01 92,18 92,40 Sumber: hasil penghitungan
z3 7,08
6,47 6,63
z4 55,39 62,20 69,00 286,77
259,55 266,36
6,47 6,63
55,39 62,20 69,00 286,77
72
100,79
132,06
6,47 6,63
1,89 2,04 2,19 1,89 2,04 2,19
GCV
132,06
86,51
194,10 259,55 266,36
194,10
Berdasarkan Tabel 4.9 nilai GCV minimum yang dihasilkan adalah sebesar 86,51. Lokasi titik knot pada variabel rasio jenis kelamin ( ) yaitu 91,97 (
), 92,18 (
) dan 92,40 (
), variabel rata-rata ART ( ) yaitu 4,01 (
variabel TPT ( ) yaitu 6,47 (
) dan 6,63 (
( ) yaitu 55,39 (
) dan 69,00 (
), 62,20 (
),
) serta variabel PDRB Perkapita ).
4.2.3.6. Memilih Titik Knot Optimum dengan Menggunakan GCV Setelah di dapatkan model regresi semiparametrik spline truncated dengan satu titik knot, dua titik knot, tiga titik knot dan kombinasi titik knot, maka langkah selanjutnya adalah memilih model terbaik dengan membandingkan nilai GCV pada masing-masing model. Nilai GCV minimum pada masing-masing model disajikan pada tabel.
Tabel 4.10 Nilai GCV Minimum pada Tiap Model Banyaknya Knot Satu titik knot Dua titik knot Tiga titik knot Kombinasi titik knot
GCV 160,21 158,34 110,79 86,51
Dari Tabel 4.10 terlihat bahwa GCV minimum terdapat pada kombinasi titik knot dengan nilai GCV sebesar 86,51. Model regresi semiparametrik spline truncated terbaik yaitu dengan tiga titik knot pada variabel rasio jenis kelamin, satu titik knot pada variabel rata-rata ART, dua titik knot pada variabel TPT dan tiga titik knot pada variabel PDRB Perkapita. Sehingga dapat dituliskan bahwa model terbaik adalah dengan menggunakan titik knot optimum (3,1,2,3).
4.2.3.7. Model Regresi Semiparametrik Spline Truncated dengan Titik Knot Optimum Titik knot optimum yang terbaik yang terpilih adalah kombinasi titik knot dengan titik knot optimum (3,1,2,3). Maka model regresi semiparametrik spline truncated yang terbentuk adalah sebagai berikut:
73
̂
̂
̂
̂
̂ (
̂ (
)
̂
̂ (
)
̂
̂
̂ (
)
̂ (
̂ (
)
̂ (
̂ (
) ̂ (
)
) )
)
Dari hasil estimasi parameter dan titik knot optimum yang diperoleh maka model yang terbentuk adalah: (
̂ (
)
)
(
)
(
( (
)
( )
) (
)
(
)
)
4.2.3.8. Pengujian Signifikansi Parameter secara Simultan Pengujian hipotesis untuk menguji signifikansi parameter secara simultan menggunakan hipotesis sebagai berikut: (
) (
)
Dimana Hasil ANOVA pada pengujian hipotesis secara simultan tersaji pada Tabel 4.11. Syntax program R untuk pengujian signifikansi parameter secara simultan dapat dilihat pada Lampiran 6.
Tabel 4.11 ANOVA Hasil Regresi Semiparametrik Spline Truncated Sumber Derajat Variasi Kebebasan Regresi 15 Error 23 Total 38 Sumber: Hasil penghitungan
Jumlah Kuadrat 7042,949 1422,885 8465,834
Rata-rata Kuadrat 469,5299 61,8646
Fhitung
p-value
7,589643
0,000
Berdasarkan Tabel 4.11 terlihat bahwa nilai Fhitung sebesar 7,59 lebih besar dari nilai F(0.05,15,23) yaitu 2,13 dan nilai p-value sebesar 0,00 lebih kecil dari nilai (
), sehingga diperoleh keputusan tolak
. Maka dapat disimpulkan bahwa
paling sedikit terdapat satu variabel prediktor yang signifikan dalam model. Model regresi semiparametrik spline truncated dengan kombinasi titik knot 74
(3,1,2,3) ini memiliki koefisien determinasi (R2) sebesar 83,19 persen. Hal ini berarti bahwa variasi dari variabel respon dapat dijelaskan oleh kelima variabel prediktor sebesar 83,19 persen, sedangkan sisanya 16,81 persen dijelaskan oleh faktor lain.
4.2.3.9. Pengujian Signifikansi Parameter secara Parsial Untuk mengetahui parameter mana saja yang berpengaruh secara signifikan terhadap model maka dilakukan pengujian hipotesis secara parsial. Pengujian signifikansi parameter secara parsial menggunakan hipotesis sebagai berikut:
(
)
(
)
Hasil pengujian signifikansi parameter secara parsial tersaji pada Tabel 4.12. Syntax program R untuk pengujian signifikansi parameter secara parsial dapat dilihat pada Lampiran 6.
Tabel 4.12 Hasil Uji Hipotesis secara Parsial Variabel Konstan
Parameter
Estimator 10,57 -0,13 0,90 -46,17 -0,60 44,97 1,57 -193,22 4,20 37,97 -9,16 0,38 -11,34 21,30 -10.68
Sumber: hasil penghitungan
75
thitung 3,16 -6,34 3,35 -2,26 -2,52 2,19 0,22 -3,27 3,49 0,58 -0,11 2,18 -5,03 4,95 -4,43
P-value 0,00 0,00 0,00 0,03 0,02 0,04 0,83 0,00 0,00 0,57 0,92 0,04 0,00 0,00 0,00
Berdasarkan Tabel 4.12 terlihat bahwa dari 15 parameter terdapat 12 parameter yang signifikan dan terdapat 3 parameter yang tidak signifikan. Sementara dari 5 variabel prediktor semua variabel signifikan. Kelima variabel yang signifikan adalah jumlah penduduk miskin, rasio jenis kelamin, rata-rata ART, TPT dan PDRB Perkapita.
4.2.3.10. Pengujian Asumsi Residual Residual pada regresi semiparametrik spline truncated harus memenuhi identik, independen dan berdistribusi normal (IIDN). Pemeriksaan asumsi residual ini dilakukan untuk mengetahui apakah residual yang terbentuk telah memenuhi asumsi IIDN. Pengujian asumsi residual identik menggunakan uji glejser. Pendeteksian asumsi independen menggunakan plot Autocorrellation Function (ACF). Dan pengujian asumsi normal menggunakan Kolmogorov-Smirnov.
4.2.3.10.1. Pengujian Asumsi Identik Pengujian asumsi identik dimaksudkan untuk mendeteksi apakah varians dari residualnya memiliki varians yang homogen atau tidak. Pemeriksaan menggunakan uji glejser. Hipotesis yang digunakan adalah:
𝑖 Hasil pengujian glejser tersaji pada Tabel 4.13. Syntax program R untuk Uji Glejser dapat dilihat pada Lampiran 7.
Tabel 4.13 Hasil Uji Glejser Sumber Derajat Variasi Kebebasan Regresi 15 Error 23 Total 38 Sumber: hasil penghitungan
Jumlah Kuadrat 144,0271 447,2622 591,2893
Rata-rata Kuadrat 9,60181 19,44618
Fhitung
p-value
0,4937631
0,919518
Dari Tabel 4.13 terlihat bahwa nilai p-value sebesar 0,92 lebih besar dari nilai
yang ditetapkan yaitu 0,05 sehingga keputusan yang diambil adalah gagal
76
tolak
. Hal ini memberikan kesimpulan bahwa varians dari residual adalah
homogen, sehingga asumsi identik pada model regresi semiparametrik spline truncated yang terbentuk telah terpenuhi.
4.2.3.10.2. Pemeriksaan Asumsi Independen Pemeriksaan asumsi independen dimaksudkan untuk mendeteksi apakah terjadi korelasi antar residual. Pemeriksaan dilakukan dengan menggunakan plot ACF. Hasil dari plot ACF tersaji pada Gambar 4.8.
1.0 0.8
Autocorrelation
0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1
2
3
4
5
6
7
8
9
10
Lag
Gambar 4.8 Plot Autocorrelation Function (ACF) Residual Dari Gambar 4.8 terlihat bahwa tidak ada lag yang keluar dari batas toleransi, hal ini menandakan bahwa tidak ada korelasi antar residual. Berdasarkan hasil pemeriksaan plot ACF residual, maka asumsi independen pada model regresi semiparametrik spline truncated yang terbentuk telah terpenuhi.
4.2.3.10.3. Pengujian Asumsi Distribusi Normal Residual regresi semiparametrik spline truncated harus memenuhi asumsi distribusi normal. Oleh karenanya dilakukan pemeriksaan asumsi distribusi
77
normal
pada
residual
yang
diperoleh.
Pemeriksaan
dilakukan
dengan
menggunakan uji Kolmogorov-Smirnov. Hipotesis yang digunakan adalah sebagai berikut: ( )
( ) (Residual berdistribusi Normal)
( )
( ) (Residual tidak berdistribusi Normal).
Hasil uji Kolmogorov-Smirnov disajikan dalam bentuk plot seperti terlihat pada Gambar 4.9.
Gambar 4.9 Probability Plot Residual Plot residual seperti yang terlihat pada Gambar 4.9 menghasilkan p-value sebesar 0,150 yang lebih besar dari nilai
yang ditentukan yaitu 0,05, sehingga
keputusan yang diambil adalah gagal tolak
. Oleh karenanya dapat disimpulkan
bahwa residual berdistribusi normal. Dari hasil uji ini maka regresi semiparametrik spline truncated yang dihasilkan memenuhi asumsi berdistribusi normal.
78
4.2.4. Perbandingan Model Setelah dilakukan analisis menggunakan metode analisis regresi linier berganda dan regresi semiparametrik spline truncated, selanjutnya dilakukan perbandingan. Kriteria dalam pemilihan model terbaik menggunakan koefisien determinasi (R2) dan menggunakan koefisien determinasi yang disesuaikan (R2 adjusted). Penggunaan R2 adjusted karena antara regresi linier berganda dengan regresi semiparametrik spline truncated memiliki jumlah parameter yang berbeda. Berikut ini adalah nilai R2 dan R2 adjusted pada masing-masing model: Tabel 4.14 Nilai R2 dan R2 adjusted Model Regresi Linier Berganda Regresi Semiparametrik Spline Truncated Sumber: hasil pengolahan
R2 (%) 49,10
R2 adjusted (%) 41,15
83,19
72,96
Pada Tabel 4.14 terlihat bahwa nilai R2 maupun R2 adjusted pada model regresi semiparametrik spline truncated menghasilkan nilai yang lebih besar yaitu berturut-turut adalah 83,19 persen dan 72,96 persen. Oleh karena itu model terbaik yang dipilih dan interpretasi yang dilakukan selanjutnya adalah dengan menggunakan regresi semiparametrik spline truncated.
4.2.5. Interpretasi Model Regresi Semiparametrik Spline Truncated Model regresi semiparametrik spline truncated dengan kombinasi titik knot (3,1,2,3) telah memenuhi asumsi residual IIDN, maka model yang dihasilkan dapat diinterpretasikan lebih lanjut. Model regresi semiparametrik spline truncated terbaik yang dihasilkan adalah sebagai berikut: (
̂ ( ( (
)
) )
( (
)
( )
79
)
)
) (
(
)
Interpretasi model terhadap variabel-variabel yang berpengaruh secara signifikan adalah sebagai berikut: 1. Interpretasi terhadap jumlah penduduk miskin ( ) dengan asumsi variabel lain konstan adalah sebagai berikut: ̂ Jika terjadi kenaikan jumlah penduduk miskin sebanyak satu penduduk maka nilai APK SLTA akan turun sebesar 0,13 persen. Untuk itu perlu dilakukan penekanan terhadap jumlah penduduk miskin. 2. Interpretasi terhadap rasio jenis kelamin ( ) dengan asumsi variabel lain konstan adalah sebagai berikut:
, z 1 < 91,97 0,90z 1 -45,27z 1 +4246,25 ,91,97 z 1 < 92,18 yˆ = -45,87z +4301,56 ,92,18 z < 92,40 1 -0,90z 1+146,33 , z 92,40 1 1 Dengan regresi semiparametrik spline truncated maka variabel yang mempunyai pola spline truncated dapat diinterpretasikan sesuai dengan pola perubahan datanya atau pada tiap-tiap titik knotnya. Pada variabel rasio jenis kelamin terdapat empat sub interval yang mempunyai perubahan perilaku. Untuk nilai rasio jenis kelamin kurang dari 91,97 maka setiap kenaikan satu persen maka APK SLTA akan mengalami kenaikan 0,90. Daerah yang mempunyai perilaku seperti ini adalah Kabupaten Bangkalan dan Kabupaten Sumenep. Untuk nilai rasio antara 92,18 sampai 92,40 maka setiap kenaikan satu persen maka APK SLTA akan mengalami penurunan sebesar 45,87. Sedangkan untuk nilai rasio jenis kelamin lebih dari 92,40 maka setiap kenaikan satu persen nilai rasio jenis kelamin maka nilai APK SLTA akan mengalami penurunan sebesar 0,90. Daerah yang mempunyai pola perilaku seperti ini adalah hampir di semua kabupaten/kota kecuali Kabupaten Bangkalan dan Kabupaten Sumenep.
80
Keterangan: :𝑧 : : :𝑧
≤𝑧 ≤𝑧
Gambar 4.10 Peta APK SLTA terhadap Rasio Jenis Kelamin Hipotesis awal tentang rasio jenis kelamin terhadap APK SLTA adalah masih ada di beberapa wilayah yang beranggapan bahwa perempuan cenderung tidak bersekolah dan lebih fokus untuk mengurus rumah tangga. Dengan indikasi bahwa arah hubungan antara rasio jenis kelamin dengan APK SLTA adalah positif, yaitu jika rasio jenis kelamin naik maka APK SLTA juga naik. Dari hasil pemodelan menunjukkan bahwa yang mempunyai pola seperti ini adalah di Kabupaten Bangkalan dan Kabupaten Sumenep, sehingga di kedua kabupaten tersebut masih beranggapan bahwa perempuan cenderung untuk tidak melanjutkan pendidikan ke jenjang SLTA. Rasio jenis kelamin di Kabupaten Bangkalan dan Kabupaten Sumenep adalah yang paling kecil dari seluruh kabupaten/kota di Provinsi Jawa Timur, yaitu 91,4 dan 90,66. Dari nilai rasio jenis kelamin tersebut terlihat bahwa selain jumlah penduduk perempuan yang lebih banyak, selisih jumlah penduduk laki-laki dan perempuan di kedua kabupaten tersebut adalah yang paling besar. Sehingga perlu dilakukan penyuluhan khususnya di daerah tersebut tentang pentingnya pendidikan baik bagi laki-laki maupun perempuan. 3. Interpretasi terhadap rata-rata ART ( ) dengan asumsi variabel lain konstan adalah sebagai berikut:
81
̂
,
Pada variabel rata-rata ART terdapat dua sub interval perubahan perilaku. Dimana untuk rata-rata ART kurang dari empat maka jika rata-rata ART naik satu, nilai APK SLTA akan naik 1,57 persen. Berdasarkan Gambar 4.11 daerah yang mempunyai perilaku seperti ini hampir ada di semua Kabupaten/Kota kecuali Kabupaten Bangkalan dan Kabupaten Sampang. Untuk rata-rata ART lebih dari empat maka jika rata-rata ART naik satu, nilai APK SLTA turun 191,72 persen. Daerah yang mempunyai perilaku seperti ini ada di Kabupaten Bangkalan dan Kabupaten Sampang.
Keterangan :𝑧 :𝑧
Gambar 4.11 Peta APK SLTA terhadap rata-rata ART Hipotesis awal tentang rata-rata ART terhadap APK SLTA adalah masih ada masyarakat yang beranggapan bahwa semakin banyak ART, cenderung beberapa ART dikorbankan untuk tidak mendapatkan pendidikan/tidak melanjutkan pendidikan ke jenjang lebih tinggi. Dengan indikasi bahwa arah hubungan antara rata-rata ART dengan APK SLTA adalah negatif, dimana jika rata-rata ART naik maka APK SLTA turun. Daerah yang mempunyai
82
pola seperti ini adalah Kabupaten Bangkalan dan Kabupaten Sampang. Sehingga di kedua kabupaten ini dengan semakin banyak ART cenderung untuk melakukan pilihan, ART yang mana yang akan melanjutkan ke jenjang pendidikan yang lebih tinggi. Dari data rata-rata ART Kabupaten Bangkalan dan Kabupaten Sampang mempunyai nilai rata-rata ART yang paling tinggi diantara semua kabupaten/kota di Provinsi Jawa Timur dimana berturut-turut adalah 4,23 dan 4,05. Dari hasil ini, untuk menaikan nilai APK SLTA perlu dilakukan penyuluhan, khususnya di kedua kabupaten tersebut, tentang pentingnya pendidikan bagi semua ART. 4. Interpretasi terhadap TPT dengan asumsi variabel yang lain konstan adalah sebagai berikut:
, z3 6, 47 4, 20 z3 ˆy 42,17 z3 245,67 ,6, 47 z3 6,63 33,01z3 184,94 , z3 6,63 Pada variabel TPT terdapat tiga sub interval perubahan perilaku. Dimana untuk nilai TPT kurang dari 6,47 maka jika terjadi kenaikan nilai TPT sebesar satu persen, nilai APK SLTA akan naik 4,2 persen. Berdasarkan Gambar 4.12 daerah yang mempunyai perilaku seperti ini ada hampir di semua kabupaten/kota kecuali Kabupaten Madiun, Kota Surabaya, Kota Kediri dan Kota Malang. Untuk nilai TPT diantara 6,47 sampai 6,63 maka jika terjadi kenaikan TPT sebesar satu persen, nilai APK SLTA naik 42,17 persen. Daerah yang mempunyai perilaku seperti ini tidak terlihat. Dan untuk nilai TPT di atas 6,63, jika terjadi kenaikan TPT satu persen maka nilai APK SLTA akan naik 33,01 persen. Daerah yang mempunyai perilaku seperti ini ada di Kabupaten Madiun, Kota Surabaya, Kota Kediri dan Kota Malang.
83
Keterangan: :𝑧 :
≤𝑧
:𝑧
Gambar 4.12 Peta APK SLTA terhadap TPT Hipotesis awal mengenai TPT terhadap APK SLTA adalah semakin kecil TPT maka akan menaikkan APK SLTA. Dengan indikasi arah hubungan antara TPT dan APK SLTA adalah negatif. Namun dari hasil pemodelan menunjukkan bahwa jika variabel yang lain konstan, arah hubungan TPT dengan APK SLTA adalah positif. Hal ini terjadi karena di Provinsi Jawa Timur pengangguran justru banyak terjadi pada penduduk yang perdendidikan tinggi (SLTA ke atas). Umumnya penduduk yang berpendidikan tinggi (SLTA ke atas), berasal dari keluarga mampu. Untuk memenuhi kebutuhan seharihari masih bisa bergantung dengan keluarga, sehingga cenderung selektif untuk memilih jenis pekerjaan yang sesuai dengan pendidikan yang ditamatkan. Sementara penduduk yang berpendidikan rendah umumnya berasal dari keluarga tidak mampu, sehingga untuk memenuhi kebutuhan sehari-hari harus melakukan pekerjaan. Walaupun jenis pekerjaan yang dilakukan merupakan pekerjaan tidak tetap atau merupakan kegiatan informal. Dari hasil ini maka nilai TPT harus ditargetkan di suatu nilai tertentu dan diperlukan variabel lain untuk melakukan kebijakan agar APK SLTA stabil atau bahkan bisa naik.
84
5. Interpretasi terhadap PDRB perkapita dengan asumsi variabel yang lain konstan adalah sebagai berikut: 𝑧 ≤𝑧
̂
≤𝑧 {
𝑧
Keterangan: :𝑧 :
≤𝑧
:
≤𝑧
:𝑧
Gambar 4.13 Peta APK SLTA terhadap PDRB Perkapita Variabel PDRB Perkapita mempunyai empat sub interval perilaku. Untuk nilai PDRB Perkapita dibawah 55,39 juta rupiah maka perilakukanya adalah jika nilai PDRB Perkapita naik satu juta rupiah, APK SLTA naik 0,38 persen. Untuk nilai PDRB Perkapita di antara 55,30 sampai 62,20 juta rupiah, maka jika terjadi kenaikan PDRB Perkapita satu juta rupiah maka APK SLTA turun 10,98 persen. Daerah yang mempunyai perilaku seperti ini ada di Kota Batu, Kota Malang dan Kota Madiun. Untuk nilai PDRB Perkapita antara 62,20 sampai 69,00 juta rupiah, maka jika terjadi kenaikan satu juta rupiah PDRB Perkapita maka nilai APK SLTA naik 10,32 persen. Daerah yang mempunyai perilaku seperti ini ada di Kabupaten Pasuruan. Sementara untuk PDRB
85
Perkapita di atas 69,00 juta rupiah, maka jika terjadi kenaikan nilai PDRB Perkapita satu juta rupiah, nilai APK SLTA turun 0,36 persen. Daerah dengan perilaku ini adalah Kota Surabaya, Kota Kediri, Kabupaten Sidoarjo dan Kabupaten Gresik. Hipotesis awal tentang PDRB perkapita terhadap APK SLTA adalah semakin tinggi PDRB perkapita maka APK SLTA juga akan naik. Dengan indikasi arah hubungan antara PDRB perkapita dengan APK SLTA adalah positif. Namun untuk nilai PDRB perkapita di atas 69,00 juta rupiah, yaitu Kota Surabaya, Kota Kediri, Kabupaten Sidoarjo dan Kabupaten Gresik mempunyai arah hubungan yang negatif. Juga untuk nilai PDRB perkapita antara 55,39 dan 62,20 juta rupiah yaitu Kota Batu, Kota Malang dan Kota Madiun. Hal ini disebabkan dengan nilai PDRB per kapita yang cukup tinggi, nilai APK SLTA di tujuh kabupaten/kota tersebut relatif cenderung lebih rendah jika dibandingkan dengan kabupaten/kota lain yang mempunyai PDRB perkapita yang rendah, dimana berturut-turut masing-masing sebesar 88,65; 86,35; 97,66; 93,45; 95,4; 83,15 dan 90,83. Kemungkinan lain dari arah hubungan PDRB perkapita dengan APK SLTA negatif di ketujuh kabupaten/kota tersebut adalah ada sebagian masyarakat yang cenderung memiliki perilaku untuk melanjutkan pendidikan SLTA tidak di sekolahsekolah seperti SLTA, SMK, MAN maupun paket C. Namun sebagian masyarakat di keempat kabupaten/kota tersebut cenderung untuk melanjutkan pendidikan ke sekolah asrama, pondok pesantren dan home schooling. Karena dengan kemampuan ekonomi yang tinggi cenderung lebih bisa memilih jenis sekolah sesuai dengan masing-masing kriteria yang diinginkan. Dimana jenis sekolah ini belum dicakup dalam APK sehingga menyebabkan APK SLTA di keempat kabupaten/kota tersebut rendah. Dari hasil ini, pemerintah masih perlu terus meningkatkan PDRB perkapita untuk bisa menaikkan nilai APK SLTA Provinsi Jawa Timur. Namun untuk Kota Surabaya, Kota Kediri, Kabupaten Sidoarjo, Kabupaten Gresik, Kota Batu, Kota Malang dan Kota Madiun tinggal diupayakan untuk menjaga nilai PDRB perkapita yang sudah tinggi untuk bisa menstabilkan atau bahkan menaikkan nilai APK SLTA Provinsi Jawa Timur. 86
BAB 5 KESIMPULAN DAN SARAN 5.1. Kesimpulan Berikut ini adalah kesimpulan yang didapatkan berdasarkan dari hasil pembahasan pada Bab 4. 1. Pengujian hipotesis secara simultan pada regresi semiparametrik spline ̃
truncated dengan hipotesis adalah
minimal ada satu ̃
dan
maka dapat disimpulkan: a. Estimasi parameter pada regresi semiparametrik spline truncated pada adalah ̂̃
ruang parameter dan
estimasi
̂ ̃
̂ ̃
parameter ̃) (
. (
̃) (
. ( pada
̃ )/
ruang
̃) ̃
(
parameter
̃) (
(
̃ )/
adalah
̃)̃ ̂
b. Statistik uji yang diperoleh adalah ̃ ̃ [
(
̃) . (
̃) (
̃ )/
(
̃ ) ̃ ⁄,(
(
̃) . (
̃) (
̃ )/
(
̃ )] ̃ ,
c. Distribusi dari statistik uji ((
) (
)
(
) (
d. Daerah penolakan (
dengan besar dari
(
) -
( )
(
) -
yang diperoleh mengikuti distribusi
) ).
{(
adalah |̃
)
) atau
) ditolak jika
)}
(F hitung) lebih
(F tabel).
2. Aplikasi pada data APK SLTA di Provinsi Jawa Timur Tahun 2015 mendapatkan hasil sebagai berikut: a. Model terbaik yang diperoleh adalah dengan menggunakan kombinasi titik knot (3,1,2,3). b. Dari kelima variabel yang digunakan semua variabel memberikan pengaruh yang signifikan terhadap model. c. Koefisien determinasi (
) yang diperoleh adalah sebesar 83,19 persen,
sehingga model tersebut sudah layak untuk digunakan.
87
3. Kebijakan di bidang pendidikan berdasarkan model yang diperoleh sebagai masukan terhadap Pemerintah Daerah Provinsi Jawa Timur adalah: a. Diperlukan program-program pengentasan kemiskininan khususnya dibidang pendidikan, seperti pemberian beasiswa bagi penduduk miskin. b. Diperlukan
penyuluhan-penyuluhan
tentang
kesadaran
pentingnya
pendidikan bagi seluruh anggota rumah tangga, khususnya di Kabupaten Bangkalan dan Kabupaten Sampang. Dan juga penyuluhan tentang pentingnya pendidikan bagi kaum perempuan, khususnya di Kabupaten Bangkalan dan Kabupaten Sumenep. c. Diperlukan penentuan batas tertinggi angka TPT Provinsi Jawa Timur untuk mempertahankan APK tingkat SLTA, yaitu jumlah penduduk miskin, rasio jenis kelamin, rata-rata ART, TPT dan PDRB perkapita. d. Diperlukan peningkatan PDRB perkapita agar bisa meningkatkan jumlah masyarakat yang melanjutkan sekolah ke jenjang SLTA.
5.2. Saran Dari hasil analisis dan pembahasan yang dilakukan pada Bab 4 selain kesimpulan terdapat beberapa saran yang dapat digunakan untuk penelitian selanjutnya yaitu: 1. Melakukan analisis dengan statistik inferensia mengenai variabel yang dalam penelitian ini ditemukan mempunyai arah hubungan yang berbeda antar kabupaten/kota dalam mempengaruhi APK SLTA di Provinsi Jawa Timur. 2. Mengembangkan regresi semiparametrik spline truncated kuadratik, untuk mengantisipasi bentuk pola hubungan antara variabel respon dan variabel prediktor yang mengikuti pola kuadratik. 3. Mengembangkan regresi semiparametrik spline truncated dengan spatial, untuk mengetahui pengaruh perbedaan antar wilayah.
88
DAFTAR PUSTAKA Anisah, L. dan Budiantara, I.N. (2014), "Estimasi Kurva Regresi Semiparametrik dengan Komponen Parametrik Berpola Polinomial", Seminar Nasional Matematika Unnes, Universitas Negeri Semarang, Semarang, hal. 1-7. Astuti, R.D.K., Yasin, H. dan Sugito. (2013), "Aplikasi Model Spatial Autoregressive untuk Pemodelan Angka Partisipasi Murni Jenjang PEndidikan SMA SEderajat di Provinsi Jawa Tengah Tahun 2011", Prosiding Seminar Nasional Statistika ke-10, Universitas Diponegoro, Semarang, hal. 547-560. Badan Pusat Statistik. (2016), Data dan Informasi Kemiskinan Kabupaten/Kota Tahun 2015, Badan Pusat Statistik, Jakarta. Badan Pusat Statistik Provinsi Jawa Timur. (2016a), Laporan Eksekutif Keadaan Angkatan Kerja di Jawa Timur 2014-2015, BPS Provinsi Jawa Timur, Surabaya. _____________. (2016b), Laporan Eksekutif Statistik Pendidikan Provinsi Jawa Timur 2015, BPS Provinsi Jawa Timur, Surabaya. _____________. (2016c), Provinsi Jawa Timur Dalam Angka 2016, BPS Provinsi Jawa Timur, Surabaya. _____________. (2016d), Statistik Kesejahteraan Rakyat Provinsi Jawa Timur 2015, BPS Provinsi Jawa Timur, Surabaya. _____________. (2016e), Produk Domestik Regional Bruto Kabupaten/Kota Jawa Timur menurut Lapangan Usaha 2011-2015, BPS Provinsi Jawa Timur, Surabaya. Badan Pusat Statistik Provinsi Papua. (2013), Indikator Pendidikan Provinsi Papua 2013, BPS Provinsi Papua, Papua. Badan Perencanaan Pembangunan Nasional. (2009), Evaluasi Pelaksanaan Program Wajib Belajar Pendidikan Dasar 9 Tahun, Bappenas, Jakarta. Bintariningrum, M.F. (2014), "Pemodelan Regresi Nonparametrik Spline Truncated dan Aplikasinya pada Angka Kelahiran Kasar di Surabaya", Jurnal Sains dan Seni Promits, Vol. 3, hal. D7-D12.
89
Budiantara, I.N. (2004), "Spline: Historis, Motivasi dan Perannya Dalam Regresi Nonparametrik", Makalah Pembicara Utama pada Konferensi Nasional Matematika XII, Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Udayana, Denpasar. _____________. (2005), "Regresi Spline Linier", Makalah Pembicara Utama pada Seminar Nasional Matematika, FMIPA Universitas Diponegoro, Semarang. _____________. (2007), "Model Keluarga Spline Polinomial Truncated Dalam Regresi Semiparametrik", Jurnal Matematika, Pengetahuan Alam dan Pengajarannya, Vol. 36, hal. 1-16. _____________.
(2009),
"Spline
Dalam
Regresi
Nonparametrik
dan
Semiparametrik: Sebuah Pemodelan Statistika Masa Kini dan Masa Mendatang", Pidato Pengukuhan untuk Jabatan Guru Besar, Institut Teknologi Sepuluh Nopember, ITS Press, Surabaya. Budiantara, I.N. dan Purnomo, J.T. (2011), "Infants' Weight Growth Model in Surabaya
(Indonesia)
by
Using
Weighted
Spline
Regression",
International Journal of Basic & Applied Sciences IJBAS-IJENS, Vol. 11, hal. 119-123. Budiantara, I.N., Sugiantari, A., Ratnasari, V., Ratna, M. dan Zain, I. (2014), "Analysis of Factors that Influence Life Expectancy in East Java (Indonesia)
Using
Semiparametric
Spline
Regression
Approach",
International Journal of Basic & Applied Sciences IJBAS-IJENS, Vol. 14, hal. 22-25. Brunello, G. dan Checchi, D. (2005), "School Quality and Family Background in Italy", Economics of Education Reviews, Vol. 24, hal. 563-577. Casella, G dan Berger R.L. (2001), Statistical Inference, 2nd edition, Duxbury Press, California. Choiriyah, N.I. (2009), Karakteristik Siswa Putus Sekolah Tingkat SD dan SMP di Kawasan Surabaya Utara, Skripsi, Institut Teknologi Sepuluh Nopember, Surabaya. Citra, S. (2008), Analisis Faktor-Faktor yang Mempengaruhi Angka Partisipasi Kasar di Sumatera Utara, Skripsi. Universitas Bengkulu. Bengkulu. 90
Drapper, N.R dan Smith, H. (1992), Applied Regression Analysis, 2nd edition, John Wiley & Sons, Chapman and Hall, New York. Engle, R.F., Granger, C.W.J., Rice, J, dan Weiss, A. (1986), "Semiparametric Estimates of the Relation Between Weather and Electricity", Journal of the American Statistical Association, Vol. 81, hal. 310-320. Eubank, R. (1999), Nonparametric Regression and Spline Smoothing, Marcel Dekker, New York. Gujarati, D.N. (2003), Basic Econometrics, 4th edititon, McGraw-Hill, New York. Hardle, W. (1994), Applied Nonparametric Regression, Springer-Verlag, Berlin. Lestari, Hera. (2009), "Perkawinan Dibawah Umur", Makalah Pembicara Utama pada Seminar Nasional Penelantaran dan Perlakuan Salah Terhadap Anak, Universitas Indonesia, Jakarta. Lestari, N.A. (2014), Analisis Faktor-Faktor yang Mempengaruhi Angka Partisipasi Sekolah serta Angka Putus Sekolah Tingkat Sekolah Dasar dan Sekolah Menengah Pertama di Indonesia Tahun 2006-2011, Tesis, Universitas Gadjah Mada, Yogjakarta. Lloyd, C.B. dan Blanc, A.N. (1996), "Children's Schooling in Sub-Saharan African : The Role of Fathers, Mothers and Others", Population and Development Reviews, Vol. 22, hal. 265-298. Merdekawati, I.P. (2013), "Pemodelan Regresi Spline Truncated Multivariabel pada Faktor-Faktor yang mempengaruhi Kemiskinan di Kabupaten/Kota Provinsi Jawa Tengah", Jurnal Sains dan Seni Pomits, Vol. 2, hal. D19D24. Nuryanti, D.A., (2016), Pemodelan Kemiskinan di Provinsi Jawa Barat menggunakan Semiparametrik Spline, Skripsi, Institut Teknoloti Sepuluh Nopember, Surabaya. Pratiwi, L.P.S., Budiantara, I.N. dan Wibowo, W. (2015), "Pengujian Hipotesis Model Spline Truncated Dalam Regresi Nonparametrik Multivariabel", Prosiding Seminar Nasional Matematika dan Pendidikan Matematika, Universitas Negeri Surabaya, Surabaya, hal. 219-228.
91
Purnomo, A.A.S.I. (2016), Estimator Campuran Kernel dan Spline Truncated Linier Multivariabel dalam Regresi Nonparametrik, Tesis, Institut Teknologi Sepuluh Nopember, Surabaya. Rena, R. (2007), "Factors Affecting The Enrollment and The Retention of Students of Primary Education in Andhra Pradesh", Essays in Education, Vol. 22, hal. 102-112. Rencher, A.C. dan Scaalje, G.B., (2007), Linear Models in Statistics. 2nd Edition, John Wiley & Sons, New Jersey. Rory. (2016), Regresi Campuran Nonparametrik Spline Linier Truncated dan Fungsi Kernel untuk Pemodelan Data Kemiskinan di Provinsi Papua, Tesis, Institut Teknologi Sepuluh Nopember, Surabaya. Ruliana, Budiantara, I.N., Otok, B.W. dan Wibowo, W. (2016), "Simultaneous Hypothesis Testing of Spline Truncated Model in Nonlinear Structural Equation Modeling (SEM)", Journal of Theoretical and Applied Information Technology, Vol. 89, Hal. 371-380. Sahat, H. (2011), Analisis Faktor-Faktor yang Mempengaruhi Angka Partisipasi Kasar Pada Jenjang Pendidikan Sekolah Menengah Atas Sederajat, Skripsi, Universitas Sumatera Utara, Medan. Setyawan, N.A.D. (2011), Pendekatan Regresi Nonparametrik Birespon Spline untuk Pemodelan Determinan Tingkat Pendidikan di Pulau Papua, Tesis, Institut Teknologi Sepuluh Nopember, Surabaya. Sikhan, K. (2013), Low-Income Students Six Times More Likely to Drop Out of High School, diakses dari https://www.wsws.org/en/articles/2013/04/10/ hsdo-a10.html Solikhin.
(2014),
Estimator
Spline
Truncated
Linier
dalam
Regresi
Semiparametrik Pada Data Persentase Pengeluaran Konsumsi PadiPadian di Propinsi Jawa Tengah, Tesis, Institut Teknologi Sepuluh Nopember, Surabaya. Sriliana, I. (2012), Regresi Spline Truncated Dalam Model Linear Parsial untuk Data Longitudinal, Tesis, Institut Teknologi Sepuluh Nopember, Surabaya.
92
Tupen, S.N. dan Budiantara, I.N. (2011), "Uji Hipotesis dalam Regresi Nonparametrik Spline". Prosiding Seminar Nasional Statistika ke-8, Universistas Diponegoro, Semarang, hal. 184-199. Wahba, G. (1990), Spline Models for Observational Data, SIAM, Pensylvania. Wei, C. dan Wang, X. (2016), "Principal Component Regression Estimation in Semiparametric Partially Linear Additive Models", International Journal of Statistics Probability, Vol. 5, hal. 46-50. World Bank. (2007), Investing in Indonesia's Education: Allocation, Equtiy and Efficiency of Public Expenditure, World Bank, Jakarta. Zaki, A. (2007), Pengujian Hipotesis dalam Model Spline pada Regresi Nonparametrik, Tesis, Institut Teknologi Sepuluh Nopember, Surabaya.
93
“Halaman ini sengaja dikosongkan”
94
LAMPIRAN Lampiran 1. Data dan Struktur Data yang Digunakan
79,62 81,91 73,68 89,10 72,56 71,17 68,29 65,08 55,96 81,51 79,95 80,75 75,11 61,55 97,66 99,13 97,10 78,47 122,09 106,04 95,86 81,20 77,18 93,62 93,45 58,30 54,63 81,12 87,94 86,35 103,66 83,15 95,47 105,26 103,11
92,08 103,22 92,17 87,37 114,12 199,38 292,87 118,51 269,54 146,00 113,72 91,17 236,96 169,19 136,13 113,86 133,75 132,04 84,74 71,16 129,32 193,99 196,59 182,64 170,76 216,23 240,35 146,92 216,84 23,77 10,04 39,10 18,66 14,52 7,72
95,32 99,91 98,73 95,07 100,35 100,72 101,00 95,38 96,61 99,00 94,87 95,13 95,23 98,13 100,95 99,78 98,94 98,80 97,36 94,89 95,62 97,76 97,56 94,41 98,32 91,40 95,00 94,54 90,66 99,28 98,41 97,25 96,88 98,35 96,75
3,56 3,53 3,49 3,55 3,48 3,71 3,67 3,59 3,49 3,33 3,03 3,12 3,54 3,66 3,76 3,74 3,75 3,60 3,37 3,58 3,30 3,62 3,68 3,90 3,94 4,23 4,05 3,86 3,31 3,83 3,74 3,72 3,91 3,99 3,80
95
0,97 3,68 2,46 3,95 2,79 5,02 4,95 2,60 4,77 2,55 1,75 3,57 2,51 6,41 6,30 4,05 6,11 2,10 6,99 6,05 3,99 5,01 3,03 4,10 5,67 5,00 2,51 4,26 2,07 8,46 3,80 7,28 4,01 5,57 4,88
21,04 17,19 19,78 27,83 23,38 18,71 29,02 23,74 23,42 37,78 19,03 22,09 22,51 65,93 69,13 54,44 23,49 18,36 20,52 22,12 18,09 37,72 41,81 24,27 80,19 19,96 15,69 14,56 25,18 348,02 34,95 60,88 35,25 30,54 38,83
Lampiran 1. Data dan Struktur Data (Lanjutan)
90,83 88,65 95,40
8,55 165,72 9,43
93,60 97,56 101,32
3,56 3,65 3,81
Keterangan: : APK SLTA (persen) : Jumlah penduduk miskin (jiwa) : Rasio jenis kelamin (persen) : Rata-rata ART (jiwa) : TPT (persen) : PDRB perkapita (juta rupiah)
96
5,10 7,01 4,29
58,24 142,6 57,41
Lampiran 2. Program Regresi Semiparametrik Spline Truncated Satu Titik Knot GCV1=function(para) { data=read.csv("e:/olah/olah.csv",header=T) data=as.matrix(data) p=length(data[,1]) q=length(data[1,]) m=ncol(data)-para-1 dataA=data[,(para+2):q] F=matrix(0,nrow=p,ncol=p) diag(F)=1 nk= length(seq(min(data[,2]),max(data[,2]),length.out=50)) knot1=matrix(ncol=m,nrow=nk) for (i in (1:m)) { for (j in (1:nk)) { a=seq(min(dataA[,i]),max(dataA[,i]),length.out=50) knot1[j,i]=a[j] } } a1=length(knot1[,1]) knot1=knot1[2:(a1-1),] aa=rep(1,p) data1=matrix(ncol=m,nrow=p) data2=data[,2:q] a2=nrow(knot1) GCV=rep(NA,a2) Rsq=rep(NA,a2) for (i in 1:a2) { for (j in 1:m) { for (k in 1:p) { if (data[k,(j+para+1)]
97
Lampiran 2. Program Regresi Semiparametrik Spline Truncated Satu Titik Knot (Lanjutan) C=pinv(t(mx)%*%mx) B=C%*%(t(mx)%*%data[,1]) yhat=mx%*%B SSE=0 SSR=0 for (r in (1:p)) { sum=(data[r,1]-yhat[r,])^2 sum1=(yhat[r,]-mean(data[,1]))^2 SSE=SSE+sum SSR=SSR+sum1 } Rsq[i]=(SSR/(SSE+SSR))*100 MSE=SSE/p A=mx%*%C%*%t(mx) A1=(F-A) A2=(sum(diag(A1))/p)^2 GCV[i]=MSE/A2 } GCV=as.matrix(GCV) Rsq=as.matrix(Rsq) cat("======================================","\n") cat("Nilai Knot dengan Spline linear 1 knot","\n") cat("======================================","\n") print (knot1) cat("=======================================","\n") cat("Rsq dengan Spline linear 1 knot","\n") cat("=======================================","\n") print (Rsq) cat("=======================================","\n") cat("HASIL GCV dengan Spline linear 1 knot","\n") cat("=======================================","\n") print (GCV) s1=min(GCV) print(max(Rsq)) cat("======================================","\n") cat("HASIL GCV terkecil dengan Spline linear 1 knot","\n") cat("======================================","\n") cat(" GCV =",s1,"\n") write.csv(GCV,file="e:/olah/output GCV1.csv") write.csv(Rsq,file="e:/olah/output Rsq1.csv")
98
Lampiran 2. Program Regresi Semiparametrik Spline Truncated Satu Titik Knot (Lanjutan) write.csv(knot1,file="e:/olah/output knot1.csv") knota1=cbind(knot1,GCV) knotorder1=knota1[order(knota1[,ncol(knota1)]),] write.csv(knota1,file="e:/olah/output knota1.csv") write.csv(knotorder1,file="e:/olah/output knota1 order.csv") }
99
Lampiran 3. Program Regresi Semiparametrik Spline Truncated Dua Titik Knot GCV2=function(para) { data=read.csv("e:/olah/olah.csv") data=as.matrix(data) p=length(data[,1]) q=length(data[1,]) m=ncol(data)-para-1 dataA=data[,(para+2):q] F=matrix(0,nrow=p,ncol=p) diag(F)=1 nk= length(seq(min(data[,2]),max(data[,2]),length.out=50)) knot=matrix(ncol=m,nrow=nk) for (i in (1:m)) { for (j in (1:nk)) { a=seq(min(dataA[,i]),max(dataA[,i]),length.out=50) knot[j,i]=a[j] } } a1=nrow(knot) knot=knot[2:(a1-1),] a2=nrow(knot) z=(a2*(a2-1)/2) knot2=cbind(rep(NA,(z+1))) for (i in (1:m)) { knot1=rbind(rep(NA,2)) for ( j in 1:(a2-1)) { for (k in (j+1):a2) { xx=cbind(knot[j,i],knot[k,i]) knot1=rbind(knot1,xx) } } knot2=cbind(knot2,knot1) } knot2=knot2[2:(z+1),2:(2*m+1)] aa=rep(1,p)
100
Lampiran 3. Program Regresi Semiparametrik Spline Truncated Dua Titik Knot (Lanjutan) data2=matrix(ncol=(2*m),nrow=p) data1=data[,(para+2):q] data3=data[,2:q] a3=length(knot2[,1]) GCV=rep(NA,a3) Rsq=rep(NA,a3) for (i in 1:a3) { for (j in 1:(2*m)) { if (mod(j,2)==1) b=floor(j/2)+1 else b=j/2 for (k in 1:p) { if (data1[k,b]
101
Lampiran 3. Program Regresi Semiparametrik Spline Truncated Dua Titik Knot (Lanjutan) GCV[i]=MSE/A2 } GCV=as.matrix(GCV) Rsq=as.matrix(Rsq) cat("======================================","\n") cat("Nilai Knot dengan Spline linear 2 knot","\n") cat("======================================","\n") print(knot1) print (knot2) cat("======================================","\n") cat("Rsq dengan Spline linear 2 knot","\n") cat("======================================","\n") print (Rsq) cat("======================================","\n") cat("HASIL GCV dengan Spline linear 2 knot","\n") cat("======================================","\n") print (GCV) s1=min(GCV) print(max(Rsq)) cat("======================================","\n") cat("HASIL GCV terkecil dengan Spline linear 2 knot","\n") cat("======================================","\n") cat(" GCV =",s1,"\n") write.csv(GCV,file="e:/olah/output GCV2.csv") write.csv(Rsq,file="e:/olah/output Rsq2.csv") write.csv(knot2,file="e:/olah/output knot2.csv") knota2=cbind(knot2,GCV) knotorder2=knota2[order(knota2[,ncol(knota2)]),] write.csv(knota2,file="e:/olah/output knota2.csv") write.csv(knotorder2,file="e:/olah/output knota2 order.csv") }
102
Lampiran 4. Program Regresi Semiparametrik Spline Truncated Tiga Titik Knot GCV3=function(para) { data=read.csv("e:/olah/olah.csv",header=T) data=as.matrix(data) p=length(data[,1]) q=length(data[1,]) m=ncol(data)-para-1 F=matrix(0,nrow=p,ncol=p) dataA=data[,(para+2):q] diag(F)=1 nk= length(seq(min(data[,2]),max(data[,2]),length.out=50)) knot=matrix(ncol=m,nrow=nk) for (i in (1:m)) { for (j in (1:nk)) { a=seq(min(dataA[,i]),max(dataA[,i]),length.out=50) knot[j,i]=a[j] } } knot=knot[2:(nk-1),] a2=nrow(knot) z=(a2*(a2-1)*(a2-2)/6) knot1=cbind(rep(NA,(z+1))) for (i in (1:m)) { knot2=rbind(rep(NA,3)) for ( j in 1:(a2-2)) { for (k in (j+1):(a2-1)) { for (g in (k+1):a2) { xx=cbind(knot[j,i],knot[k,i],knot[g,i]) knot2=rbind(knot2,xx) } } } knot1=cbind(knot1,knot2) }
103
Lampiran 4. Program Regresi Semiparametrik Spline Truncated Tiga Titik Knot (Lanjutan) knot1=knot1[2:(z+1),2:(3*m+1)] aa=rep(1,p) data1=matrix(ncol=(3*m),nrow=p) data2=data[,(para+2):q] a1=length(knot1[,1]) GCV=rep(NA,a1) Rsq=rep(NA,a1) for (i in 1:a1) { for (j in 1:ncol(knot1)) { b=ceiling(j/3) for (k in 1:p) { if (data2[k,b]
104
Lampiran 4. Program Regresi Semiparametrik Spline Truncated Tiga Titik Knot (Lanjutan) GCV=as.matrix(GCV) Rsq=as.matrix(Rsq) cat("======================================","\n") cat("Nilai Knot dengan Spline linear 3 knot","\n") cat("======================================","\n") print (knot1) cat("======================================","\n") cat("Rsq dengan Spline linear 3 knot","\n") cat("======================================","\n") print (Rsq) r=max(Rsq) print (r) cat("======================================","\n") cat("HASIL GCV dengan Spline linear 3 knot","\n") cat("======================================","\n") print (GCV) s1=min(GCV) print (r) cat("======================================","\n") cat("HASIL GCV terkecil dengan Spline linear 3 knot","\n") cat("======================================","\n") cat(" GCV =",s1,"\n") write.csv(GCV,file="e:/olah/output GCV3.csv") write.csv(Rsq,file="e:/olah/output Rsq3.csv") write.csv(knot1,file="e:/olah/output knot3.csv") knota3=cbind(knot1,GCV) knotorder3=knota3[order(knota3[,ncol(knota3)]),] write.csv(knota3,file="e:/olah/output knota3.csv") write.csv(knotorder3,file="e:/olah/output knota3 order.csv") }
105
Lampiran 5. Program Regresi Semiparametrik Spline Truncated Kombinasi Titik Knot GCVKK=function(para) { data=read.csv("e:/olah/olah.csv",header=T) data=as.matrix(data) p1=length(data[,1]) q1=length(data[1,]) v=para+2 F=matrix(0,nrow=p1,ncol=p1) diag(F)=1 x1=read.table("e:/olah/x1.txt") x2=read.table("e:/olah/x2.txt") x3=read.table("e:/olah/x3.txt") x4=read.table("e:/olah/x4.txt") n2=nrow(x1) a=matrix(nrow=4,ncol=3^4) m=0 for (i in 1:3) for (j in 1:3) for (k in 1:3) for (l in 1:3) { m=m+1 a[,m]=c(i,j,k,l) } a=t(a) GCV=matrix(nrow=nrow(x1),ncol=3^4) for (i in 1:3^4) { for (h in 1:nrow(x1)) { if (a[i,1]==1) { gab=as.matrix(x1[,1]) gen=as.matrix(data[,v]) aa=matrix(nrow=nrow(x1)*nrow(data),ncol=1) for (j in 1:1) for (w in 1:nrow(data)) { if (gen[w,j]
106
Lampiran 5. Program Regresi Semiparametrik Spline Truncated Kombinasi Titik Knot (Lanjutan) aa[w,j]=gen[w,j]-gab[h,j] } } else if (a[i,1]==2) { gab=as.matrix(x1[,2:3]) gen=as.matrix(cbind(data[,v],data[,v])) aa=matrix(nrow=nrow(x1)*nrow(data),ncol=2) for (j in 1:2) for (w in 1:nrow(data)) { if (gen[w,j]
107
Lampiran 5. Program Regresi Semiparametrik Spline Truncated Kombinasi Titik Knot (Lanjutan) else bb[w,j]=gen[w,j]-gab[h,j] } } else if (a[i,2]==2) { gab=as.matrix(x2[,2:3] ) gen=as.matrix(cbind(data[,(v+1)],data[,(v+1)])) bb=matrix(nrow=nrow(x1)*nrow(data),ncol=2) for (j in 1:2) for (w in 1:nrow(data)) { if (gen[w,j]
108
Lampiran 5. Program Regresi Semiparametrik Spline Truncated Kombinasi Titik Knot (Lanjutan) cc[w,j]=0 else cc[w,j]=gen[w,j]-gab[h,j] } } else if (a[i,3]==2) { gab=as.matrix(x3[,2:3] ) gen=as.matrix(cbind(data[,(v+2)],data[,(v+2)])) cc=matrix(nrow=nrow(x1)*nrow(data),ncol=2) for (j in 1:2) for (w in 1:nrow(data)) { if (gen[w,j]
109
Lampiran 5. Program Regresi Semiparametrik Spline Truncated Kombinasi Titik Knot (Lanjutan)
dd[w,j]=0 else dd[w,j]=gen[w,j]-gab[h,j] } } else if (a[i,4]==2) { gab=as.matrix(x4[,2:3] ) gen=as.matrix(cbind(data[,(v+3)],data[,(v+3)])) dd=matrix(nrow=nrow(x1)*nrow(data),ncol=2) for (j in 1:2) for (w in 1:nrow(data)) { if (gen[w,j]
110
Lampiran 5. Program Regresi Semiparametrik Spline Truncated Kombinasi Titik Knot (Lanjutan)
for (r in 1:nrow(data)) { sum=(data[r,1]-yhat[r,])^2 sum1=(yhat[r,]-mean(data[,1]))^2 SSE=SSE+sum SSR=SSR+sum1 } Rsq=(SSR/(SSE+SSR))*100 MSE=SSE/p1 A=mx%*%C%*%t(mx) A1=(F-A) A2=(sum(diag(A1))/p1)^2 GCV[h,i]=MSE/A2 } if (a[i,1]==1) sp=x1[,1] else if (a[i,1]==2) sp=x1[,2:3] else sp=x1[,4:6] if (a[i,2]==1) spl=x2[,1] else if (a[i,2]==2) spl=x2[,2:3] else spl=x2[,4:6] if (a[i,3]==1) splin=x3[,1] else if (a[i,3]==2) splin=x3[,2:3] else splin=x3[,4:6] if (a[i,4]==1) spline=x4[,1] else if (a[i,4]==2) spline=x4[,2:3] else spline=x4[,4:6] kkk=cbind(sp,spl,splin,spline) cat("=====================","\n") print(i) print(kkk) print(Rsq) } GCVt=t(GCV) GCVmin=min(GCVt) print (GCVmin) GCVorder=order(GCVt) write.csv(GCV,file="e:/olah/output GCV kombinasi.csv") write.csv(GCVt,file="e:/olah/output GCV t kombinasi.csv") write.csv(GCVorder,file="e:/olah/output GCV t order kombinasi.csv") write.csv(Rsq,file="e:/olah/output Rsq kombinasi.csv") }
111
Lampiran 6. Uji Signifikansi Parameter uji=function(alpha,para) { data=read.csv("e:/olah/olah.csv") knot=read.table("e:/olah/knot.txt") data=as.matrix(data) knot=as.matrix(knot) ybar=mean(data[,1]) m=para+2 p=nrow(data) q=ncol(data) dataA=cbind(data[,m],data[,m],data[,m],data[,m+1],data[,m+2],data[,m+2], data[,m+3],data[,m+3],data[,m+3]) dataA=as.matrix(dataA) satu=rep(1,p) n1=ncol(knot) data.knot=matrix(ncol=n1,nrow=p) for (i in 1:n1) { for(j in 1:p) { if(dataA[j,i]
112
Lampiran 6. Uji Signifikansi Parameter (Lanjutan) res=data[,1]-yhat SSE=sum((data[,1]-yhat)^2) SSR=sum((yhat-ybar)^2) SST=SSR+SSE MSE=SSE/(p-n1) MSR=SSR/(n1) Rsq=(SSR/(SSR+SSE))*100 #uji F (uji serentak) Fhit=MSR/MSE pvalue=pf(Fhit,(n1-1),(p-n1),lower.tail=FALSE) if (pvalue<=alpha) { cat("------------------------------------","\n") cat("Kesimpulan hasil uji serentak","\n") cat("------------------------------------","\n") cat("Tolak Ho yakni minimal terdapat 1 prediktor yang signifikan","\n") cat("","\n") } else { cat("------------------------------------","\n") cat("Kesimpulan hasil uji serentak","\n") cat("------------------------------------","\n") cat("Gagal Tolak Ho yakni semua prediktor tidak berpengaruh signifikan","\n") cat("","\n") } #uji t (uji individu) thit=rep(NA,n1) pval=rep(NA,n1) SE=sqrt(diag(MSE*(pinv(t(mx)%*%mx)))) cat("------------------------------------","\n") cat("Kesimpulan hasil uji individu","\n") cat("------------------------------------","\n") thit=rep(NA,n1) pval=rep(NA,n1) for (i in 1:n1)
113
Lampiran 6. Uji Signifikansi Parameter (Lanjutan) { thit[i]=B[i,1]/SE[i] pval[i]=2*(pt(abs(thit[i]),(p-n1),lower.tail=FALSE)) if (pval[i]<=alpha) cat("Tolak Ho yakni prediktor signifikan dengan pvalue",pval[i],"\n") else cat("Gagal tolak Ho yakni prediktor tidak signifikan dengan pvalue",pval[i],"\n") } thit=as.matrix(thit) cat("=======================================","\n") cat("nilai t hitung","\n") cat("=======================================","\n") print (thit) cat("Analysis of Variance","\n") cat("======================================","\n") cat("Sumber df SS MS Fhit","\n") cat("Regresi ",(n1)," ",SSR," ",MSR,"",Fhit,"\n") cat("Error ",p-n1," ",SSE,"",MSE,"\n") cat("Total ",p," ",SST,"\n") cat("======================================","\n") cat("s=",sqrt(MSE)," Rsq=",Rsq,"\n") cat("pvalue(F)=",pvalue,"\n") Rsqadj=(1-((SSE/SST)*((p)/(p-n1))))*100 cat("Rsqadj=",Rsqadj,"\n") write.csv(res,file="e:/olah/output uji residual knot.csv") write.csv(pval,file="e:/olah/output uji pvalue knot.csv") write.csv(mx,file="e:/olah/output uji mx knot.csv") write.csv(yhat,file="e:/olah/output uji yhat knot.csv") }
114
Lampiran 7. Uji Glejser glejser=function(data,knot,res,alpha,para) { data=read.csv("e:/olah/olah.csv") knot=read.table("e:/olah/knot.txt") res=read.table("e:/olah/residual.txt") data=as.matrix(data) knot=as.matrix(knot) res=abs(res) res=as.matrix(res) rbar=mean(res) m=para+2 p=nrow(data) q=ncol(data) dataA=cbind(data[,m],data[,m],data[,m+1],data[,m+2],data[,m+2],data[,m+2], data[,m+3]) dataA=as.matrix(dataA) satu=rep(1,p) n1=ncol(knot) data.knot=matrix(ncol=n1,nrow=p) for (i in 1:n1) { for(j in 1:p) { if (dataA[j,i]
115
Lampiran 7. Uji Glejser (Lanjutan) SSE=sum((res-yhat)^2) SSR=sum((yhat-rbar)^2) SST=SSR+SSE MSE=SSE/(p-n1) MSR=SSR/(n1) Rsq=(SSR/SST)*100 #uji F (uji serentak) Fhit=MSR/MSE pvalue=pf(Fhit,(n1-1),(p-n1),lower.tail=FALSE) if (pvalue<=alpha) { cat("------------------------------------","\n") cat("Kesimpulan hasil uji serentak","\n") cat("------------------------------------","\n") cat("Tolak Ho yakni minimal terdapat 1 prediktor yang signifikan atau terjadi heteroskedastisitas","\n") cat("","\n") } else { cat("------------------------------------","\n") cat("Kesimpulan hasil uji serentak","\n") cat("------------------------------------","\n") cat("Gagal Tolak Ho yakni semua prediktor tidak berpengaruh signifikan atau tidak terjadi heteroskedastisitas","\n") cat("","\n") } cat("Analysis of Variance","\n") cat("======================================","\n") cat("Sumber df SS MS Fhit","\n") cat("Regresi ",(n1)," ",SSR," ",MSR,"",Fhit,"\n") cat("Error ",p-n1," ",SSE,"",MSE,"\n") cat("Total ",p," ",SST,"\n") cat("======================================","\n") cat("s=",sqrt(MSE)," Rsq=",Rsq,"\n") cat("pvalue(F)=",pvalue,"\n") }
116
BIOGRAFI PENULIS
Penulis dilahirkan di Desa Sumberejo, Kecamatan Geger, Kabupaten Madiun, Provinsi Jawa Timur pada tanggal 7 Agustus 1981, putri keempat dari empat bersaudara buah cinta dari pasangan Alm. Ayahanda Soeharman dan Ibunda Pipit Hendarwati. Saat ini penulis sudah berkeluarga dengan suami bernama Harisman dengan dua anak perempuan Maila Riski Azzahra dan Khanza Riski Almaira. Riwayat pendidikan penulis diawali dari SDN Purworejo 1 (1988-1994), SMPN 1 Geger (1994-1997), SMUN 1 Geger (1997-2000), Sekolah Tinggi Ilmu Statistik (STIS) Jakarta (2000-2004) Jurusan Komputasi Statistika. Setelah menamatkan pendidikan DIV STIS, penulis ditugaskan bekerja pada BPS Kabupaten Kapuas, Provisi Kalimantan Tengah sebagai staf IPDS. Tahun 2009 penulis dipercaya untuk menduduki eselon IV sebagai Kasie IPDS dan Tahun 2012 dirotasi sebagai Kasie Tata Usaha. Pada tahun 2015 penulis memperoleh beasiswa dari BPS untuk melanjutkan studi S2 di Jurusan Statistika FMIPA ITS Surabaya. Pembaca yang ingin memberikan kritik, saran dan pertanyaan mengenai
penelitian
ini,
dapat
menghubungi
penulis
melalui
email
[email protected].
Surabaya, Januari 2017 Kiki Ferdiana
117