TESIS – ST 2309
PENGUJIAN HIPOTESIS DALAM MODEL SPLINE PADA REGRESI NONPARAMETRIK AHMAD ZAKI NRP. 1305 201 015 DOSEN PEMBIMBING Dr. Drs. I Nyoman Budiantara, M.S. Ir. Mutiah Salamah Chamid, M.Kes. PROGRAM STUDI MAGISTER JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2007
TESIS – ST 2309
PENGUJIAN HIPOTESIS DALAM MODEL SPLINE PADA REGRESI NONPARAMETRIK AHMAD ZAKI NRP. 1305 201 015 DOSEN PEMBIMBING Dr. Drs. I Nyoman Budiantara, M.S. Ir. Mutiah Salamah Chamid, M.Kes. PROGRAM STUDI MAGISTER JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2007
PENGUJIAN HIPOTESIS DALAM MODEL SPLINE PADA REGRESI NONPARAMETRIK T E S I S Tesis ini disusun untuk memenuhi salah satu syarat memperoleh gelar Magister Sains (M.Si.) di Institut Teknologi Sepuluh Nopember Surabaya
Oleh: AHMAD ZAKI NRP. 1305 201 015 Tanggal Ujian : 1 Februari 2007 Periode Wisuda : Maret 2007 Disetujui oleh Tim Penguji Tesis:
1. Dr. Drs. I Nyoman Budiantara, M.S. NIP. 131 843 382
(Pembimbing I)
2. Ir. Mutiah Salamah Chamid, M. Kes. NIP. 131 283 368
(Pembimbing II)
3. Prof. Dra. Susanti Linuwih, M. Stats., Ph.D. NIP. 130 368 808
(Penguji)
4. Dr. Muhammad Mashuri, M.T. NIP. 131 651 449
(Penguji)
5. Dr. Purhadi, M.Sc. NIP. 131 652 051
(Penguji)
6. Dr. Sony Sunaryo, M.Si. NIP. 131 843 380
(Penguji) Direktur Program Pascasarjana,
Prof. Ir. Happy Ratna S., M.Sc., Ph.D. NIP. 130 541 829
PENGUJIAN HIPOTESIS DALAM MODEL SPLINE PADA REGRESI NONPARAMETRIK Oleh Dosen Pembimbing
: Ahmad Zaki : 1. Dr. Drs. I Nyoman Budiantara, M.S. 2. Ir. Mutiah Salamah Chamid, M.Kes. ABSTRAK
Salah satu metode dalam regresi nonparametrik untuk mengestimasi kurva regresi yang diasumsikan tidak diketahui bentuknya dapat dilakukan dengan pendekatan spline. Penelitian ini mengkaji estimator spline dengan pendekatan bayesian, mengkaji inferensi uji Generalized Maximum Likelihood (GML) untuk menguji hipotesis dalam model spline, dan menyelidiki perilaku uji Generalized Maximum Likelihood (GML) yang dibandingkan dengan uji Locally Most Powerful (LMP) dengan menggunakan data simulasi. Pengujian hipotesis dalam model spline pada regresi nonparametrik bertujuan untuk mengidentifikasi apakah pola data dapat dimodelkan dengan pendekatan polinomial atau pendekatan spline. Hasil penelitian diperoleh bahwa estimasi spline dengan pendekatan bayesian identik dengan estimasi spline yang meminimumkan Penalized Least Square (PLS) pada regresi nonparametrik klasik, hasil kajian statistik uji GML yang diperoleh berdistribusi asimtotik Chi-Square, dan hasil simulasi diperoleh bahwa statistik uji GML cenderung lebih sesuai untuk menguji hipotesis dalam model spline pada fungsifungsi sinusoidal, sedangkan statistik uji LMP cenderung lebih sesuai digunakan untuk menguji hipotesis dalam model spline pada fungsi-fungsi polinomial. Kata-kata kunci : Regresi Nonparametrik, Model Spline, Pendekatan Bayesian, Uji Generalized Maximum Likelihood (GML).
ii
HYPOTHESIS TESTING SPLINE MODELS IN NONPARAMETRIC REGRESSION By : Ahmad Zaki Under the Supervision : 1. Dr. Drs. I Nyoman Budiantara, M.S. 2. Ir. Mutiah Salamah Chamid, M.Kes. ABSTRACT One of method in nonparametric regression to estimate curve of regression assumed unknown can be conducted with spline approach. This research studies spline estimator with bayesian approach, the Generalized Maximum Likelihood (GML) test for hypothesis testing in spline models, and study behavior of the Generalized Maximum Likelihood test (GML) compared to the Locally Most Powerful (LMP) test using simulation data. Hypothesis testing for spline models in nonparametric regression is used to identify that data pattern can be modeled with polynomial or spline approach. The result shows that spline estimation with bayesian approach is identic with the one that minimaze Penalized Least Square in classic nonparametric regression, the GML test obtained is asymptotically Chi-Square distributed, and the simulation study shows that GML test gives better performance for testing hypothesis in sinusoidal functions spline models, while LMP test gives better performance in polynomial functions. Key words
: Nonparametric Regression, Spline Models, Bayesian Approach, Generalized Maximum Likelihood (GML) test.
iii
KATA PENGANTAR
Alhamdullillahi Rabbil Alamin, segala puji bagi Allah SWT yang telah memberikan rahmat, hidayah, petunjuk, kekuatan, kesabaran, dan ilmu pengetahuan sehingga dapat menyelesaikan tesis dengan judul: Pengujian Hipotesis dalam Model Spline pada Regresi Nonparametrik. Salawat dan salam penulis haturkan kepada junjungan Nabi besar Muhammad SAW yang telah membawa manusia dari masa jahiliah ke masa modern yang penuh dengan ilmu pengetahuan. Tesis ini merupakan hasil penelitian sebagai salah satu syarat untuk memperoleh gelar Magister Sains (M.Si.) pada Program Studi Magister Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember Surabaya. Penulis menyadari bahwa tesis ini dapat diselesaikan dengan tidak lepas dari bimbingan, arahan, petunjuk, dorongan moral maupun bantuan materil dari berbagai pihak. Untuk itu pada kesempatan ini penulis mengucapkan terima kasih dan penghargaan yang sebesar-besarnya kepada yang kami hormati: 1. Bapak Dr. Drs. I Nyoman Budiantara, M.S., sebagai dosen pembimbing utama dan Koordinator Program Studi Magister Jurusan Statistika F-MIPA ITS Surabaya yang telah memberikan bimbingan, petunjuk, motivasi, dan dorongan moril kepada penulis. 2. Ibu Ir. Mutiah Salamah Chamid, M.Kes., sebagai dosen pembimbing dan Ketua Jurusan Statistika F-MIPA ITS Surabaya, yang telah memberikan bimbingan, petunjuk, motivasi, dan dorongan moril kepada penulis. 3. Bapak dan Ibu dosen pengajar Jurusan Statistika F-MIPA ITS Surabaya yang telah memberikan dan mengajarkan ilmunya.
iv
4. Staf administrasi akademik, staf laboratorium komputasi, dan staf ruang baca Jurusan Statistika F-MIPA ITS Surabaya yang telah memberikan pelayanan dan bantuan. 5. Ketua STIE Nobel Indonesia dan Ketua Yayasan Pendidikan Nobel Indonesia yang telah memberikan bantuan dan kesempatan kepada penulis untuk melanjutkan studi di Program Studi Magister Jurusan Statistika F-MIPA ITS Surabaya. 6. Dirjen Dikti yang telah memberikan bantuan beasiswa BPPS kepada penulis selama masa studi di Program Studi Magister Jurusan Statistika F-MIPA ITS Surabaya. 7. Bapak dan Ibu dosen pengajar Jurusan Matematika FMIPA UNM Makassar yang telah memberikan motivasi dan bantuan kepada penulis untuk melanjutkan studi. 8. Kedua orang tuaku yang tercinta A’ba Muchdar Ady Rahardjo dan Amma Hj. Masbena Sulo yang telah membesarkan dan mendidik penulis, serta memberikan motivasi kepada penulis dalam menyelesaikan studi. 9. Saudara-saudaraku Kartika Sari, Ratna Sari, Ahmad Gunawan dan adikku Nuryetty Indra Sari, serta ponaanku tersayang yang telah memberikan dukungan moril baik lahir dan batin. 10. Mahasiswa Program Studi Magister Jurusan Statistika FMIPA ITS Surabaya angkatan 2005 yang telah banyak membantu dan bekerja sama dengan penulis dalam proses penyelesaian studi. 11. Saudara-saudara seperjuangan dalam pendidikan Magister ITS: Sifriyani Ishaq, Arisamdy, Nursalam, Guntur Gau, Rudi, Muhammad Kasim Aidid, dan Jasmir yang telah banyak memberi masukan, bantuan, motivasi, dan pengertian kepada penulis selama proses penyelesaian studi.
v
12. Semua pihak yang telah banyak membantu yang tidak tersebut namanya. Akhirnya penulis berharap dan memohon semoga bantuan semua pihak mendapat ridho dan bernilai amal ibadah yang saleh serta mendapat balasan yang setimpal dari Allah SWT, dan sebagai suatu karya ilmiah yang dapat memberikan manfaat untuk menambah wawasan keilmuan dan mendapat ridho dari Allah SWT.
Surabaya, Pebruari 2007 Penulis
vi
DAFTAR ISI LEMBAR PERSETUJUAN
i
ABSTRAK
ii
ABSTRACT
iii
KATA PENGANTAR
iv
DAFTAR ISI
vii
DAFTAR GAMBAR
ix
DAFTAR TABEL
x
DAFTAR LAMPIRAN
xi
BAB I
1
PENDAHULUAN 1.1. Latar Belakang
1
1.2. Rumusan Masalah
3
1.3. Tujuan Penelitian
4
1.4. Manfaat Penelitian
4
1.5. Batasan Masalah Penelitian
5 6
BAB II TINJAUAN PUSTAKA 2.1. Regresi Nonparametrik
6
2.2. Model Spline
7
2.3. Pendekatan Bayesian untuk Estimasi Model Spline
7
2.3.1. Distribusi Prior Gaussian Improper
7
2.3.2.Fungsi Kerugian/Loss Function
8
2.3.3. Estimasi Bayes
9
2.3.4. Mean Posterior
10
2.4. Pengujian Hipotesis
15
2.4.1. Uji Generalized Maximum Likelihood (GML)
16
2.4.2. Uji Locally Most Powerful (LMP)
16
vii
2.5. Proses Gaussian dan Wiener
17
2.6. Distribusi Asimtotik LRT
18
BAB III METODOLOGI PENELITIAN
19
3.1. Bahan dan Alat
19
3.2. Metode Penelitian
19
BAB IV HASIL DAN PEMBAHASAN
22
4.1. Estimasi Model Spline dengan Menggunakan 22
Pendekatan Bayesian 4.2. Inferensi Statistik Uji Generalized Maximum Likelihood (GML)
BAB V
32
4.3. Simulasi
45
KESIMPULAN DAN SARAN
52
5.1. Kesimpulan
52
5.2. Saran
53
DAFTAR PUSTAKA
54
LAMPIRAN
56
viii
DAFTAR GAMBAR
Nomor 4.1
Judul
Halaman
Plot fungsi f ( t ) = 1 + t + 2 a cos ( 6π t ) ,
46
dengan n = 100 , koefisien a = 3 , dan σ = 1 2
4.2
Plot fungsi f ( t ) = 1 + t + 3 a ( t − 0.5 ) , 3
46
dengan n = 100 , koefisien a = 3 , dan σ = 0.4 2
4.3
Data hasil bangkitan fungsi f ( t ) = 1 + t + 2 a cos ( 6π t ) ,
47
dengan n = 100 , koefisien a = 3 , dan σ = 1 2
4.4
Data hasil bangkitan fungsi f ( t ) = 1 + t + 3 a ( t − 0.5 ) , 3
47
dengan n = 100 , koefisien a = 3 , dan σ = 0.4 2
4.5
Kurva regresi sebenarnya, spline, dan data bangkitan
48
4.6
Grafik proporsi penolakan hipotesis untuk Fungsi f ( t ) = 1 + t + 2 a cos ( 6π t )
49
4.7
Grafik proporsi penolakan hipotesis untuk 3 Fungsi f ( t ) = 1 + t + 3 a ( t − 0.5 )
51
ix
DAFTAR TABEL
Nomor 4.1
Judul Rekapitulasi proporsi penolakan hipotesis untuk
Halaman 49
Fungsi f ( t ) = 1 + t + 2 a cos ( 6π t ) 4.2
Rekapitulasi proporsi penolakan hipotesis untuk Fungsi f ( t ) = 1 + t + 3 a ( t − 0.5 )
x
3
50
DAFTAR LAMPIRAN
Lampiran
Teks
Halaman
Lampiran 1
Langkah-Langkah Program Simulasi Data
56
Lampiran 2
Macro Program Simulasi Data
58
Lampiran 3
Plot Kurva Regresi
71
Lampiran 4
Plot Bangkitan Data Simulasi
72
Lampiran 5
Plot Normalitas Residual Data Simulasi
75
Lampiran 6
Hasil Pengujian Hipotesis Data Simulasi
78
xi