ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
ESTIMASI MODEL REGRESI SEMIPARAMETRIK BIRESPON MULTIPREDIKTOR BERDASARKAN ESTIMATOR PENALIZED SPLINE
SKRIPSI
DODIK ANDRIANTO
PROGRAM STUDI S-1 STATISTIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA 2017
SKRIPSI
ii ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
ESTIMASI MODEL REGRESI SEMIPARAMETRIK BIRESPON MULTIPREDIKTOR BERDASARKAN ESTIMATOR PENALIZED SPLINE
SKRIPSI
DODIK ANDRIANTO
PROGRAM STUDI S-1 STATISTIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA 2017
SKRIPSI
iii ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
PEDOMAN PENGGUNAAN SKRIPSI Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi kepustakaan, tetapi pengutipan harus seizin penyusun dan harus menyebutkan sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan hak milik Universitas Airlangga.
SKRIPSI
iv ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
KATA PENGANTAR
Alhamdulillahirabbil ’alamin puji syukur penulis panjatkan kepada Allah SWT yang telah melimpahkan rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan skripsi dengan judul ”Estimasi Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline”. Penulis menyadari bahwa skripsi ini tidak terlepas dari bantuan berbagai pihak, oleh karena itu sepantasnya penulis mengucapkan terima kasih kepada: 1. Kedua orang tua tersayang: Ibu Sumarni dan Bapak Subekan, serta keluarga besar penulis yang mendoakan dan telah memberikan semangat, kepercayaan, dan dukungan baik secara materiil maupun moril. 2. Dr. Nur Chamidah, M.Si. dan Dr. Ardi Kurniawan, M.Si. selaku dosen pembimbing yang telah memberikan penjelasan, pengarahan, bimbingan, masukan, saran, dan motivasi kepada penulis untuk terus belajar. 3. Drs. Suliyanto, M.Si. selaku dosen wali selama menjadi mahasiswa yang telah selalu memberikan nasehat, arahan, dukungan, saran, dan motivasi kepada penulis untuk menyelesaikan studi dengan baik serta seluruh dosen statistika yang telah memberikan ilmu pengetahuan selama perkuliahan. 4. Serta pihak yang telah berjasa dalam membantu penulis menyelesaikan skripsi ini, namun tidak dapat disebutkan satu per satu oleh penulis. Penulis menyadari skripsi ini jauh dari sempurna, baik dari segi penyusunan, bahasa atau penulisan. Oleh karena itu penulis mengharapkan kritik dan saran yang bersifat membangun guna menyempurnakan skripsi ini. Penulis berharap semoga skripsi ini dapat bermanfaat bagi perkembangan ilmu pengetahuan di masa yang akan datang. Surabaya, 25 Januari 2017 Penulis,
Dodik Andrianto
SKRIPSI
vi ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Dodik Andrianto, 2017. Estimasi Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline. Skripsi dibawah bimbingan Dr. Nur Chamidah, M.Si. dan Dr. Ardi Kurniawan, M.Si., Program Studi S-1 Statistika, Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya.
ABSTRAK Metode dalam ilmu statistika yang menganalisis pola hubungan secara fungsional antara variabel respon dan variabel prediktor dengan komponen parametrik dan nonparametrik didalamnya yaitu analisis regresi semiparametrik. Estimator dalam regresi noparametrik yang belum banyak dikembangkan salah satunya adalah estimator penalized spline, estimator tersebut dapat digunakan terhadap data yang mengalami peningkatan tajam dengan membebankan penalty pada komponen potongan polinomial (piece wise polinomial) yang memiliki sifat tersegmen yang kontinu. Persoalan dalam kehidupan sehari-hari sering kali memerlukan pemodelan yang melibatkan dua variabel respon dan diantara keduanya terdapat korelasi yang kuat dengan melibatkan lebih dari satu variabel prediktor. Sehingga secara teori menarik untuk megembangkan pengestimasian berdasarkan estimator penalized spline pada model regresi semiparametrik birespon multiprediktor. Tujuan dari penelitian ini adalah mendapatkan bentuk model regresi semiparametrik birespon multiprediktor dengan menggunakan estimator penalized spline dalam mengestimasi kurva regresi nonparametriknya serta mengembangkan pula algoritma dan pemrogramannya untuk implementasi pada data. Data yang digunakan pada pengimplementasian adalah data pasien di RSU Haji Surabaya dengan tekanan darah sistolik dan diastolik sebagai variabel respon, LDL sebagai variabel prediktor komponen parametrik, serta variabel prediktor komponen nonparametriknya adalah berat badan, usia, dan HDL. Hasil estimasi data tekanan darah menggunakan software OSS-R diperoleh nilai MSE dan R-square untuk pemodelan yaitu masing-masing sebesar 136,5604 dan 91,23%. Kata Kunci : Regresi, Semiparametrik, Birespon, Multiprediktor, Penalized Spline, Tekanan Darah
SKRIPSI
vii ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Dodik Andrianto, 2017. Estimation of Bi-response Multipredictor Semiparametric Regression Model Based on Penalized Spline Estimator. This skripsi is under supervised by Dr. Nur Chamidah, M.Si. and Dr. Ardi Kurniawan, M.Si., S-1 Statistics Courses, Mathematics Department, Faculty of Science and Technology, Universitas Airlangga, Surabaya.
ABSTRACT The methods in statistical science that analyzes the pattern of a functional relationship between the response and the predictor variables with parametric and nonparametric components therein are semiparametric regression analysis. Estimator in nonparametric regression who have developed one of which is the Penalized spline estimator, the estimator can use the data it has increased sharply by imposing a penalty on the component pieces of polynomial (piece wise polynomial) which has the property of segmented continuous. Problems in everyday life often require modeling involving two response variables and between them there is a strong correlation with the involvement of more than one predictor variable. So in theory needs to be developed Penalized spline estimator estimating base on semiparametric regression model bi-response multipredictor. The purpose of this research is to form semiparametric regression model biresponse multipredictor using Penalized spline estimator to estimate the nonparametric regression curve and also develop algorithms and programming to the implementation of the data. Data used in the implementation is data in RSU Haji Surabaya patients with systolic and diastolic blood pressure as the response variable, LDL as a predictor variable component of parametric and nonparametric predictor variable component is the weight, age, and HDL. The estimation results of the blood pressure data using OSS software-R obtained by MSE and R-square for modeling are 136.5604 respectively and 91.23%. Keywords : Regression, Bi-response, Multipredictor, Semiparametric, Penalized Spline, Blood Pressure
SKRIPSI
viii ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
DAFTAR ISI
Halaman LEMBAR JUDUL .............................................................................................. i LEMBAR PERNYATAAN ................................................................................ ii LEMBAR PENGESAHAN ................................................................................ iii LEMBAR PEDOMAN PENGGUNAAN SKRIPSI .......................................... iv SURAT PERNYATAAN TENTANG ORISIALITAS ...................................... v KATA PENGANTAR ....................................................................................... vi ABSTRAK .......................................................................................................... vii ABSTRACT ........................................................................................................ viii DAFTAR ISI ....................................................................................................... ix DAFTAR TABEL ............................................................................................... xii DAFTAR GAMBAR .......................................................................................... xiii DAFTAR LAMPIRAN ....................................................................................... xiv BAB I PENDAHULUAN ................................................................................... 1 1.1 Latar Belakang .................................................................................. 1 1.2 Rumusan Masalah ............................................................................. 5 1.3 Tujuan ............................................................................................... 5 1.4 Manfaat ............................................................................................. 5 1.5 Batasan Masalah................................................................................ 6 BAB II TINJAUAN PUSTAKA ........................................................................ 7 2.1 Aljabar Matrik ................................................................................... 7 2.2 Pendekatan Regresi ........................................................................... 12 2.2.1 Regresi Parametrik ................................................................... 12 2.2.2 Regresi Nonparametrik ............................................................ 12 2.2.3 Regresi Semiparametrik ........................................................... 13 2.3 Regresi Birespon ............................................................................... 13 2.4 Regresi Multiprediktor ...................................................................... 14 2.5 Estimator Penalized Spline pada Regresi Nonparametrik................. 14 2.6 Kuantil ............................................................................................... 18
SKRIPSI
ix ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
2.7 Pemilihan Titik Knot Optimal ........................................................... 19 2.8 Pemilihan Jumlah Titik Knot Optimal .............................................. 19 2.9 Model Semiparametrik Berdasarkan Estimator Penalized Spline dengan Satu Variabel Respon ........................................................ 20 2.10
Model
Semiparametrik
Birespon
Berdasarkan
Estimator
Penalized Spline dengan Satu Variabel Prediktor.......................... 21 2.11 Kasus Homoskedastisitas dan Heteroskedastisitas ......................... 22 2.12 Estimasi Parameter Weighted Least Square (WLS) ........................ 23 2.13 Uji Glesjer ....................................................................................... 23 2.14 Uji Korelasi Pearson ....................................................................... 24 2.15 Open Source Software R (OSS-R) .................................................. 25 2.16 Tekanan Darah ................................................................................ 28 BAB III METODE PENELITIAN ..................................................................... 29 3.1
Mengestimasi
Model
Regresi
Semiparametrik
Birespon
Multiprediktor Berdasarkan Estimator Penalized Spline ............. 29 3.2 Membuat Algoritma dan Program Untuk Mengestimasi Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline yang Diterapkan Pada Data Riil atau Data Bangkitan ......................................................................................... 31 3.2.1 Algoritma dan Program untuk Mengestimasi Model Regresi Semiparametrik
Birespon
Multiprediktor
Berdasarkan
Estimator Penalized Spline ................................................... 31 3.2.2 Penerapan Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline pada Data Riil ....................................................................... 36 BAB IV HASIL DAN PEMBAHASAN ............................................................ 37 4.1 Estimasi Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline ...................................... 37 4.2
Algoritma
dan
Program
Untuk
Mengestimasi
Regresi
Semiparametrik Birespon Multiprediktor Berdasarkan Estimator
SKRIPSI
x ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Penalized Spline yang Diterapkan Pada Data Riil atau Data Bangkitan ......................................................................................... 47 4.2.1 Algoritma dan Program untuk Mengestimasi Model Regresi Semiparametrik
Birespon
Multiprediktor
Berdasarkan
Estimator Penalized Spline ................................................... 47 4.2.2 Penerapan Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline pada Data Riil ....................................................................... 54 BAB V KESIMPULAN DAN SARAN ............................................................. 71 5.1 Kesimpulan ....................................................................................... 71 5.2 Saran .................................................................................................. 72 DAFTAR PUSTAKA ......................................................................................... 73 LAMPIRAN
SKRIPSI
xi ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
DAFTAR TABEL
Nomor
Judul Tabel
Halaman
3.1
Variabel-variabel Penelitian ........................................................ 36
4.1
Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, dan Nilai Lambda Optimal, serta GCV Minimum Prediktor Ke-1 ............................................................................. 57
4.2
Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, dan Nilai Lambda Optimal, serta GCV Minimum Prediktor Ke-2 ............................................................................. 59
4.3
Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, dan Nilai Lambda Optimal, serta GCV Minimum Prediktor Ke-3 ............................................................................. 60
4.4
Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, serta Nilai Lambda Optimal Setiap ................................... 61
SKRIPSI
xii ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
DAFTAR GAMBAR
Nomor
Judul Gambar
Halaman
3.1
Diagram Alir Algoritma dan Program ........................................ 35
4.1
Scatterplot antara Tekanan Darah Sistolik dan Diastolik dengan Berat Badan .................................................................... 55
4.2
Scatterplot antara Tekanan Darah Sistolik dan Diastolik dengan Usia ................................................................................. 56
4.3
Scatterplot antara Tekanan Darah Sistolik dan Diastolik dengan HDL ................................................................................ 56
4.4
Plot Observasi dan Estimasi pada Tekanan Darah Sistolik Data Insample ................................................................ 68
4.5
Plot Observasi dan Estimasi pada Tekanan Darah Diastolik Data Insample .............................................................. 68
4.6
Plot Observasi dan Estimasi pada Tekanan Darah Sistolik Data Outsample ............................................................. 69
4.7
Plot Observasi dan Estimasi pada Tekanan Darah Diastolik Data Outsample ........................................................... 70
SKRIPSI
xiii ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
DAFTAR LAMPIRAN
Nomor 1
Judul Data Insample Tekanan Darah Pasien dan Variabel Prediktor RSU Haji Surabaya
2
Data Outsample Tekanan Darah Pasien dan Variabel Prediktor RSU Haji Surabaya
3
Program Uji Korelasi Pearson
4
Program Identifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Setiap Prediktor
5
Program Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (Tanpa Pembobot)
6
Program Uji Glesjer dan Penentuan Matrik Pembobot
7
Program Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (dengan Pembobot)
8
Program Estimasi Outsample Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline
9
Output Uji Korelasi Pearson
10
Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Prediktor Ke-1
11
Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Prediktor Ke-2
12
Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Prediktor Ke-3
13
Output
Estimasi
Model
Regresi
Semiparametrik
Birespon
Berdasarkan Estimator Penalized Spline (Tanpa Pembobot) 14
Output Uji Glesjer dan Penentuan Matrik Pembobot
15
Output
Estimasi
Model
Regresi
Semiparametrik
Birespon
Berdasarkan Estimator Penalized Spline (dengan Pembobot)
SKRIPSI
xiv ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
16
Output Estimasi Outsample Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline
SKRIPSI
xv ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
BAB I PENDAHULUAN
1.1
Latar Belakang Analisis regresi merupakan suatu metode dalam ilmu statistika yang
menganalisis pola hubungan secara fungsional antara variabel respon dan variabel prediktor melalui estimasi kurva. Terdapat tiga macam pendekatan dalam mengestimasi fungsi regresi, yaitu pendekatan parametrik, nonparametrik, dan semiparametrik. Pendekatan parametrik digunakan apabila sudah mengasumsikan bentuk tertentu dari pola hubungan antara variabel respon dan variabel prediktor serta terdapat informasi, pengetahuan maupun teori masa lalu tentang karakteristik data yang diteliti, sedangkan pendekatan nonparametrik digunakan karena tidak adanya informasi sebelumnya tentang hubungan antara variabel respon dan variabel prediktor (Ricky, 2014) dan data diharapkan mencari sendiri bentuk estimasinya sehingga dapat dikatakan regresi nonparametrik memiliki fleksibilitas yang lebih besar terhadap data yang diteliti. Dalam beberapa kasus di kehidupan nyata sering diketahui pola kurva antara variabel respon dengan beberapa variabel prediktor karena terdapat informasi sebelumnya tentang hubungan antara keduanya, namun tidak dengan variabel prediktor yang lainnya yang belum diketahui pola hubungannya. Solusi untuk mengetahui model fungsi tersebut adalah dengan mengestimasi fungsi regresi menggunakan pendekatan regresi semiparametrik. Pendekatan regresi semiparametrik digunakan jika pola hubungan antara sekumpulan variabel prediktor terhadap variabel respon ada pola yang diketahui dan ada pula yang pola hubungannya tidak diketahui (Budiantara, 2012). Masalah estimasi pada regresi semiparametrik muncul karena adanya komponen nonparametrik berupa fungsi yang tidak diketahui bentuknya. Oleh karena itu, hampiran terhadap bentuk fungsi tersebut dapat dilakukan dengan lebih dari satu bentuk fungsi. Beberapa diantaranya adalah spline, kernel, fourier, wavelet, dan polinomial lokal. Secara aplikasi, hampiran-hampiran ini memiliki
SKRIPSI
1 ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 2
kelebihan yang berbeda (Wibowo, dkk., 2013). Pendekatan regresi nonparametrik yang cukup populer adalah adalah spline (Andriani, et al., 2015), karena memberikan fleksibilitas yang lebih baik terhadap karakteristik suatu fungsi atau data dengan mulus (smooth) (Ricky, 2014). Keuntugan lain yang dimiliki oleh spline adalah mampu menjelaskan perubahan pola perilaku fungsi dalam subinterval tertentu dan dapat digunakan untuk mengatasi atau mengurangi pola data yang mengalami peningkatan tajam dengan bantuan titik knot. Griggs (2013) meyatakan bahwa penalized spline lebih cocok digunakan terhadap data yang mengalami peningkatan tajam karena penalized spline membebankan penalty pada komponen potongan polinomial (piece wise polinomial) yang memiliki sifat tersegmen yang kontinu sehingga lebih cocok digunakan untuk lebih mengoptimalkan. Penalized spline adalah salah satu bentuk estimator spline yang diperoleh dengan meminimumkan Penalized Least Square (PLS). Untuk itu ada beberapa hal yang perlu dipertimbangkan, yaitu titik dan jumlah knot, fungsi dasar spline, serta derajat bebas dan matrik penalty (Montoya, et al., 2014). Beberapa penelitian terkait regresi berdasarkan estimator penalized spline antara lain adalah Andriani, et al. (2015) dan Pütz (2016), kedua penelitian tersebut menggunakan pendekatan nonparametrik dalam mengestimasi model, namun pada kehidupan nyata sering kali ditemukan kasus dengan adanya pola hubungan yang diketahui antara sekumpulan variabel prediktor terhadap variabel respon dan ada pula pola yang tidak dapat diketahui sehingga diperlukan pengembangan penelitian yaitu dengan pendekatan regresi semiparametrik. Penelitian terkait model regresi semiparametrik berdasarkan estimator penalized spline salah satunya adalah Salam (2013), yang mengestimasi model regresi semiparametrik berdasarkan estimator penalized spline dengan menggunakan metode likelihood maximum penalized, namun hanya menggunakan satu variabel respon. Persoalan dalam kehidupan sehari-hari sering dijumpai pemodelan regresi dengan multirespon salah satu contohnya pengukuran tekanan darah yaitu sistolik dan diastolik. Salah satu analisis regresi yang dapat digunakan untuk memodelkan kasus tersebut adalah model regresi birespon. Penelitian mengenai model regresi
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 3
multirespon berdasarkan estimator spline truncated telah banyak dilakukan, antara lain adalah Oktaviana (2011), Setyawan (2011), Juliandari (2014) dan Wulandari (2014), namun penelitian yang menyangkut estimator penalized spline dengan respon lebih dari satu belum banyak dikembangkan. Tujuan pemodelan regresi multirespon adalah untuk mendapatkan model yang lebih baik dari pemodelan respon tunggal, dengan model regresi yang tidak hanya mempertimbangkan pengaruh prediktor terhadap respon, akan tetapi juga hubungan antar respon (Fernandes, 2014). Penelitian dengan menggunakan regresi birespon berdasarkan estimator penalized spline antara lain adalah Yolandika (2011) yaitu dengan menggunakan pendekatan noparametrik, namun seperti halnya permasalahan pada regresi dengan respon tunggal maka diperlukan pengembangan penelitian yaitu dengan pendekatan regresi semiparametrik. Selain itu, terdapat penelitian dari Chamidah dan Eridani (2015) mengenai regresi semiparametrik birespon berdasarkan estimator penalized spline, penelitian tersebut menggunakan satu variabel prediktor pada komponen parametrik dan satu variabel prediktor pula pada komponen nonparametrik sedangkan pada sebagian besar kasus dalam kehidupan nyata variabel respon tidak hanya dipengaruhi oleh satu variabel prediktor saja, jika hanya menggunakan satu variabel saja maka kemungkinan variabel prediktor tersebut belum dapat mewakili faktor yang mempengaruhi variabel respon yang diteliti. Skripsi
ini
membahas
mengenai
pengembangan
pengestimasian
berdasarkan estimator penalized spline dalam model regresi semiparametrik birespon multiprediktor karena dari berbagai penelitian yang sudah dilakukan saat ini, belum dapat menjawab persoalan atas kasus data yang memerlukan variabel respon lebih dari satu dan beberapa variabel prediktor pada komponen parametrik dan nonparametrik dalam mengestimasi model regresi. Selain itu utuk implementasi
pada
data
maka
dikembangkan
pula
algoritma
dan
pemrogramannya. Penerapan dari algoritma penelitian akan lebih mudah apabila menggunakan bantuan software statistika dibanding secara manual karena penerapan secara manual akan membutuhkan waktu yang lama. Software
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 4
statistika yang digunakan dalam penelitian adalah Open Source Software R (OSSR). Teori yang dibahas mengenai estimasi model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline diterapkan pada data tekanan darah dengan variabel respon pertama yaitu tekanan darah sistolik dan variabel respon kedua yaitu tekanan darah diastolik. Tekanan darah sangatlah penting karena merupakan kekuatan pendorong bagi darah agar dapat beredar ke seluruh tubuh untuk memberikan darah segar yang mengandung oksigen dan nutrisi ke organ-organ tubuh. Tekanan darah bervariasi untuk berbagai alasan, seperti usia, berat badan, kandungan lemak darah, dan lain sebagainya. Faktor resiko tekanan darah yang tinggi diantaranya adalah hipertensi, stroke, dan jantung koroner. Penyakit-penyakit tersebut termasuk dalam penyakit tidak menular yang saat ini sangat mengkhawatirkan dan telah menjadi masalah utama dalam kesehatan masyarakat yang ada di Indonesia maupun di beberapa negara yang ada di dunia. Sehingga perlu adanya pengawasan yang lebih dalam dunia kesehatan terhadap tingkat tekanan darah. Penelitian yang membahas mengenai tekanan darah sistolik dan diastolik salah satunya adalah Mersi dan Andrianto (2016) menganalisis pengaruh LDL terhadap tekanan darah dengan pendekatan regresi nonparametrik berdasarkan estimator penalized spline, namun penelitian yang dilakukan masih menggunakan analisis unirespon yaitu dengan memodelkan masing-masing tekanan darah sistolik dan diastolik terhadap LDL dan hanya melibatkan satu variabel prediktor kompoen nonparametrik. Persoalan tersebut melibatkan dua variabel respon dan diantara keduanya terdapat korelasi yang kuat sehingga untuk selanjutya membutuhkan pemodelan dengan analisis regresi semiparameterik birespon multiprediktor. Berdasarkan uraian yang telah dijelaskan, penulis tertarik untuk membahas secara
lebih
lanjut
mengenai
model
regresi
semiparametrik
birespon
multiprediktor berdasarkan estimator penalized spline dengan membuat algoritma dan program dalam OSS-R serta menerapkan hasilnya pada data riil yaitu data tekanan darah sistolik dan tekanan darah diastolik.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 5
1.2
Rumusan Masalah Berdasarkan latar belakang, maka pemasalahan yang dibahas dalam
skripsi ini adalah : 1. Bagaimana
mengestimasi
model
regresi
semiparametrik
birespon
multiprediktor berdasarkan estimator penalized spline? 2. Bagaimana membuat algoritma dan program untuk mengestimasi regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline menggunakan software OSS-R yang diterapkan pada data riil atau data bangkitan?
1.3
Tujuan Penelitian Berdasarkan rumusan masalah, maka tujuan penelitian dalam skripsi ini
adalah : 1. Mengestimasi model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline. 2. Membuat
algoritma
dan
program
untuk
mengestimasi
regresi
semiparametrik birespon multiprediktor berdasarkan estimator penalized spline menggunakan software OSS-R yang diterapkan pada data riil atau data bangkitan.
1.4
Manfaat Penelitian Berdasarkan latar belakang, maka manfaat penelitian dalam skripsi ini
adalah : 1. Menambah wawasan dan pengetahuan tentang estimasi model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline. 2. Mengetahui
algoritma
dan
program untuk
mengestimasi
regresi
semiparametrik birespon multiprediktor berdasarkan estimator penalized
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 6
spline menggunakan software OSS-R dan penerapan pada data riil atau data bangkitan.
1.5
Batasan Masalah Estimasi
model
regresi
semiparametrik
birespon
multiprediktor
berdasarkan estimator penalized spline dalam penulisan skripsi ini dibatasi pada pemilihan parameter penghalus dengan menggunakan metode Generalized Cross Validation (GCV).
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
BAB II TINJAUAN PUSTAKA
Pada bab ini akan dibahas mengenai beberapa tinjauan pustaka yang akan digunakan untuk pembahasan pada bab-bab berikutnya. Pada BAB I sebelumnya telah diuraikan tentang tujuan dari penulisan skripsi ini. Berdasarkan tujuan tersebut maka akan dibahas mengenai matrik, regresi semiparametrik, regresi birespon, regresi multiprediktor, estimator penalized spline, kuantil, pemilihan titik knot optimal, pemilihan jumlah titik knot optimal, model semiparametrik berdasarkan estimator penalized spline dengan satu variabel respon, model semiparametrik birespon berdasarkan estimator penalized spline dengan satu variabel prediktor, kasus heteroskedastisitas dan homoskedastisitas, estimasi parameter Weighted Least Square (WLS), uji glesjer, uji korelasi pearson, OSSR.
2.1
Aljabar Matrik Matrik adalah susunan bilangan atau variabel dalam bentuk persegi
panjang atau persegi. Bilangan-bilangan dalam susunan tersebut dinamakan entri matrik. Ukuran matrik dijelaskan dengan menyatakan banyaknya baris dan banyaknya kolom yang terdapat dalam matrik tersebut, sehingga suatu matrik dengan m baris dan n kolom dikatakan sebagai matrik dengan ukuran (ordo) m x n. Bentuk umum matrik yang berukuran m x n adalah sebagai berikut:
A mn
a11 a = 21 am1
a12 a22 am1
a1n a2 n amn
Tiap-tiap bilangan aij yang berada didalam matrik A disebut elemen. Indeks i dan j masing-masing menyatakan baris dan kolom tempat beradanya
SKRIPSI
7 ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 8
sebuah elemen dari matrik A. Beberapa operasi pada matrik adalah sebagai berikut: a. Matrik Partisi Partisi matrik A menjadi empat submatrik (persegi atau persegi panjang) sebagai berikut: A A = 11 A 21
A12 A 22
Apabila dua matrik A dan B adalah conformal untuk perkalian, dan jika A dan B dipartisi sehingga submatrik conformal, maka perkalian AB dapat dinyatakan sebagai berikut: A AB = 11 A 21
A12 B11 B12 A 22 B 21 B 22
A B + A12 B 21 = 11 11 A 21B11 + A 22 B 21
A11B12 + A12 B 22 A 21B12 + A 22 B 22
Apabila B diganti oleh vektor b yang dipartisi menjadi dua himpunan dari elemen-elemen, jika A dipartisi menjadi dua himpunan dari kolom-kolom, maka menjadi = Ab
( A1
b1 A2 ) = A1b1 + A 2b 2 b2
b. Perkalian Jika A adalah matrik berordo m x n dan B adalah matrik berordo n x p. Hasil n
perkalian AB adalah matrik C berukuran m x p dengan cij = ∑ A ik B kj . Perkalian k =1
dua buah matrik dapat terjadi jika dan hanya jika banyaknya kolom dari matrik A sama dengan banyaknya baris dari matrik B. Perkalian yang melibatkan vektor mengikuti aturan yang sama untuk matrik. Misalkan A adalah matrik berordo mxn,vektor b berdimensi px1, vektor c berdimensi px1. Kemudian Ab adalah vektor kolom berdimensi nx1, bT c adalah jumlah perkalian berukuran (1 x 1),
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 9
bcT adalah matrik berukuran pxp. karena bT c adalah jumlah perkalian berukuran
(1 x 1), maka sama dengan cT b , yaitu:
bT c= b1c1 + b2 c2 + ... + bp c p cT b= c1b1 + c2b2 + ... + c p bp bT c = cT b
Jika j adalah vektor berdimensi nx1 yang semua elemennya 1, maka
∑ j a1 j ∑ j a2 j T j A= ( ∑i ai1 , ∑i ai 2 ,..., ∑i aip ) ∑ j anj
c. Transpose
A = ( aij ) , maka transpose dari A didefinisikan sebagai
Jika matrik
= AT
a ) ( a ) . Notasi ini menunjukkan bahwa elemen pada baris ke-i dan (= T
ij
ji
kolom ke-j dari matrik A merupakan baris j dan kolom i dari matrik AT . Jika
( )
T matrik A berordo mxn. Jika A adalah sembarang matrik, maka A
T
= A . Salah
satu sifat transpose yang digunakan adalah ( AB ) = BT AT dengan syarat matrik T
A dan B masing-masing merupakan matrik yang memenuhi sifat perkalian. Jika A adalah
matrik
AT AT = T11 A 21
partisi
A A = 11 A 21
A12 , A 22
maka
transpose
matrik
partisi
T A12 , jika B adalah vektor partisi b = ( b1 b 2 ) , maka transpose AT22
bT vektor partisi bT = 1T . b2
d. Invers Misalkan A adalah matrik berukuran nxn (A adalah matrik persegi). Sebuah matrik B berukuran nxn sedemikian hingga BA = I disebut invers kiri dari A dan
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 10
sebuah matrik B berukuran nxn sedemikian hingga AB = I disebut invers kanan dari A dengan I merupakan matrik identitas. Jika AB = BA = I maka matrik B disebut invers kanan dan invers kiri dari matrik A dan matrik A dikatakan invertibel. Jika matrik A dan B masing-masing merupakan matrik yang invertibel dan AB terdefinisi maka
( AB )
−1
= B −1A −1 . Jika A adalah matrik simetri dan
A nonsingular dan dipartisi menjadi A = 11 A 21
A12 −1 B A 22 − A 21A11 A12 , dan jika= A 22
−1 dan B −1 ada, sehingga invers dari A adalah : sedemikian hingga, maka A11 −1 −1 A −1 + A11 A12 B −1A 21A11 A −1 = 11 −1 −B −1A 21A11
−1 − A11 A12 B −1 B −1
e. Trace
( )
Trace A = aij berukuran nxn adalah fungsi skalar yang didefinisikan sebagai n
jumlah dari elemen-elemen diagonal dari A, yaitu tr(A) = ∑ aii i =1
f. Turunan Fungsi Vektor dan Matrik Misalkan
u = f ( x)
fungsi dari variabel-variabel
x1 , x2 ,..., x p
dengan
x = ( x1 , x2 ,..., x p ) , dan misalkan T
∂u ∂x 1 ∂u ∂u = ∂x2 ∂x ∂u ∂x p
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 11
(
T Misalkan= u a= x xT a , dengan aT = a1 , a2 ,..., a p
)
adalah vektor konstanta,
T T ∂u ∂ ( a x ) ∂ ( x a ) = = = a . Jika u = xT Ax , dengan A adalah matrik simetri maka ∂x ∂x ∂x
dari
suatu
konstanta,
x1 x = x2 x 3
dan
a11 A = a21 a 31
a12 a22 a32
a13 a23 a33
maka
∂ ( aT Ax ) ∂x1 a1T x T T ∂u ∂ ( a Ax ) ∂ ( a Ax ) T 2= = = = a 2 x 2Ax ∂x ∂x ∂x2 aT3 x T ∂ ( a Ax ) ∂x3
g. Matrik Kovariansi Variansi σ 12 , σ 22 ,..., σ p2 dari y1 , y2 ,..., y p dan kovariansi σ ij untuk semua i ≠ j merupakan elemen-elemen dari matrik kovariansi yang dinotasikan dengan Σ yaitu
σ 11 σ 12 ... σ 1 p σ 21 σ 22 ... σ 2 p = ∑ cov = (y) σ p1 σ p 2 ... σ pp Baris ke-i dari Σ mengandung variansi yi dan kovariansi yi dengan tiap variabel y yang lain. Supaya konsisten dengan notasi σ ij digunakan σ ii = σ i2 , i = 1, 2,..., p untuk varians. Varians terdapat pada diagonal Σ, dan kovariansi berada diselain diagonal tersebut. (Rencher and Schaalje, 2008)
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 12
2.2
Pendekatan Regresi
2.2.1 Regresi Parametrik Regresi parametrik digunakan untuk mengetahui pola hubungan antara variabel respon dengan variabel prediktor yang diasumsikan telah diketahui bentuk fungsinya. Salah satu bentuk regresi parametrik dapat dinyatakan sebagai model regresi linier berganda yang secara umum dapat dituliskan dalam notasi matrik sebagai berikut : yi X i β + ε i =
(2.1)
dengan y merupakan vektor dari variabel respon yang berukuran nx1, X merupakan matriks dari variabel prediktor yang diasumsikan tetap berukuran nxp, β merupakan vektor parameter yang berukuran px1, dan ε adalah residual acak,
dengan ε ~ IIDN (0, σ 2 ) . (Ruppert, et al., 2003)
2.2.2 Regresi Nonparametrik Regresi nonparametrik merupakan salah satu pendekatan dalam analisis regresi yang digunakan apabila kurva regresinya tidak diasumsikan memiliki bentuk tertentu. Dalam regresi nonparametrik, kurva regresi hanya diasumsikan halus (smooth), sehingga pendekatan regresi nonparametrik memiliki fleksibilitas yang tinggi karena data diharapkan mencari sendiri bentuk estimasi kurva regresi tanpa dipengaruhi oleh faktor subyektivitas peneliti. Jika diberikan pasangan data ( ti , yi ) dengan i = 1, 2,..., n dan pola hubungan antara variabel response dengan variabel prediktor tidak diketahui bentuknya, maka dapat digunakan pendekatan regresi nonparametrik. Secara umum, model regresi nonparametrik adalah
= yi
f ( ti ) + εi , i = 1, 2,..., n
(2.2)
dengan yi merupakan variabel response, f ( ti ) adalah persamaan kurva regresi yang tidak diasumsikan mengikuti bentuk tertentu dengan ti sebagai variabel prediktor, sedangkan εi adalah error berdistribusi normal independen dengan
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 13
mean 0 dan variansi σ 2 (Eubank, 1999). Terdapat beberapa teknik untuk mengestimasi kurva regresi dalam regresi nonparametrik, diantaranya yaitu regresi spline, kernel, deret fourir dan lain-lain.
2.2.3 Pendekatan Regresi Semiparametrik Pendekatan regresi tidak hanya parametrik dan nonparametrik, terdapat pula
golongan
statistikawan,
yang
memandang
kurva
regresi
dapat
diklasifikasikan kedalam dua komponen, yaitu komponen parametrik (bentuk fungsinya diketahui) dan komponen nonparametrik (bentuk fungsinya tidak diketahui). Pandangan ini memberikan pendekatan regresi semiparametrik, (Budiantara, 2012). Analisis regresi semiparametrik merupakan gabungan dari regresi parametrik dan regresi nonparametrik, sehingga estimasi model semiparametrik ekuivalen dengan estimasi parameter-parameter pada komponen parametrik dan estimasi kurva pada komponen nonparametrik. Misalkan terdapat data berpasangan ( yi , xi , ti ) , dan hubungan antara yi , xi , dan ti
diasumsikan
mengikuti model regresi semiparametrik sebagai berikut : Yi = X i β + f (ti ) + ε i dengan i = 1, 2,..., n
(2.3)
dengan Yi adalah variabel respon pada pengamatan ke −i , X i adalah komponen parametrik, f (ti ) adalah fungsi regresi nonparametrik dan ε
adalah residual
acak, dengan ε ~ IIDN (0, σ 2 ) . (Ruppert, et al., 2003)
2.3
Regresi Birepson Regresi birespon merupakan suatu analisis model regresi yang melibatkan
dua variabel respon dalam estimasi data. Secara umum model regresi birespon dapat dinyatakan dalam persamaan (2.4) sebagai berikut: = Yi f (ti ) + ε i , dengan i = 1, 2,..., n
SKRIPSI
ESTIMASI MODEL REGRESI...
(2.4)
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 14
dengan Yij = (Yi(1) , Yi(2) )T
adalah dua respon yang saling berkorelasi dan
f (ti ) = ( f (1) (ti ), f (1) (ti ))T adalah fungsi regresi dalam model, dan ε i = (ε i(1) , ε i(2) )T adalah residual pengukuran dengan mean 0 dan variansi ∑ i , dengan matrik variansi-covariansi sebagai berikut : ε i(1) = = (ε1 ) Var (2) ∑ i Var ε i Var (ε i(1) ) Cov(ε i(1) , ε i(2) ) = (1) (2) Var (ε i(2) ) Cov(ε i , ε i )
σ 12i = σ 1iσ 2i ρi
σ 1iσ 2i ρi σ 22i
dengan σ 12 dan σ 22 adalah 2 komponen variansi dan ρ merupakan koefisien korelasi. (Welsh and Yee, 2006)
2.4
Regresi Multiprediktor Model aditif mempunyai variabel respon y yang bergantung pada
penjumlahan beberapa fungsi dari variabel prediktor x, sehingga model regresi multiprediktor dapat dituliskan sebagai berikut :
= yi
d
∑f j =1
j
( x ji ) + ε i
(2.5)
dengan ε i adalah residual acak yang diasumsikan berdistribusi identik dan independen dengan mean nol dan variansi σ 2 . (Wood and Agustin, 2002)
2.5
Estimator Penalized Spline Pada Regresi Nonparametrik Estimator penalized spline merupakan salah satu estimator f yang smooth
dan dapat digunakan untuk menghasilkan fungsi regresi yang sesuai dengan data.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 15
Estimator penalized spline dengan multiprediktor menggunakan model aditif dengan variabel respon y yang bergantung pada penjumlahan beberapa variabel prediktor x, dengan mengikuti bentuk model sebagai berikut :
yi =∑ f j ( x ji ) + ε i ; i =1, 2, …, n q
j =1
dengan f j adalah fungsi regresi prada prediktor ke-j yang belum diketahui bentuknya, y i adalah variabel respon pengamatan ke −i , x ji adalah variabel prediktor ke-j pada pengamatan ke −i , dan ε i adalah error random dengan mean 0 dan variansi σ 2 I .
Menurut Ruppert (2003), estimator penalized spline adalah suatu fungsi f
yang dinyatakan sebagai berikut : f j ( x ji ) =
p j +k j
∑β h =0
φ ( x ji ), i = 1, 2,..., n; j = 1, 2,..., q
(2.6)
jh h
(
dengan β j = β j 0 , β j1 ,..., β j ( p j + k j )
)
T
menunjukkan vektor parameter dan
φh ( x ji )
merupakan suatu fungsi yang didefinisikan sebagai berikut : x ji h , untuk 0 ≤ h ≤ p j φh ( x ji ) = pj x ji − ξ j ( h − p j ) + , untuk p j + 1 ≤ h ≤ p j + 1
(
(2.7)
)
p j adalah orde polinomial, k j adalah banyaknya knot untuk prediktor ke-j, dan h adalah indeks fungsi basis berupa bilangan bulat positif, dan
(x
ji
− ξ j (h− p j )
)
pj +
(
)
x ji − ξ j ( h − p ) , x > ξ j ( h − p ) j j = x ≤ ξ j (h− p j ) 0,
(2.8)
Penalized spline merupakan potongan-potongan polinomial dengan segmen-segmen yang berbeda digabungkan bersama menjadi titik knot
ξ1 , ξ 2 ,…, ξ k . Pada penalized spline, titik knot ditentukan berdasarkan sampel kuantil dari nilai unique (tunggal) suatu variabel indepeden { xi }i =1 . Fungsi regresi n
nonparametrik degan orde p dan titik-titik knots ξ1 , ξ 2 , …, ξ k dinyatakan dalam persamaan (2.6) sebagai berikut :
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 16
Kj
f j ( x ji )= β j 0 + β j1 x ji + ... + β jp x ji j + ∑ β j ( p j + k j ) ( x ji − ξ jk j ) + j p
p
(2.9)
k j =1
dari fungsi pada persamaan (2.9) dapat dirubah menjadi bentuk matrik seperti persamaan (2.10) sehingga didapatkan model linier campuran
f j ( xj ) = X jβ j
(2.10)
dengan
1 x j1 1 x j 2 X= 1 x jn
x 2j1 … x j1j
( x j1 − ξ j1 ) + j
x 2j 2 … x j 2j p
( x j 2 − ξ j1 ) + j
p
… x jnj p
x 2jn
… ( x j1 − ξ j k j ) + j β j0 β pj … ( x j 2 − ξ j k j )+ j1 ; βj = β j ( p j + k j ) pj … ( x jn − ξ jk j ) +
p
p
p
( x jn − ξ j1 ) + j p
dan estimator penalized spline dapat dituliskan sebagai
yˆ = Xβˆ
(2.11)
Estimator penalized spline diperoleh dengan meminimumkan fungsi Penalized Least Square (PLS) yang merupakan ukuran standart dari kesesuaian terhadap data yang terdiri dari least square n −1 ∑( yi − f j ( x ji )) 2 dan ukuran kemulusan n
i =1
Kj
alami
∑β
k j =1
2 j ( p j +k j )
, yang dituliskan dalam persamaan (2.12) sebagai berikut :
n
−1
∑( y − f ( x )) n
2
+λ
Kj
∑β
i j ji j =i 1 = kj 1
2 j ( p j +k j )
,λ ≥ 0
(2.12)
dengan λ j adalah suatu parameter penghalus dari variabel prediktor ke-j, k adalah jumlah knot, dan p adalah orde polinomial. Langkah-langkah selanjutnya untuk meminimumkan fungsi PLS adalah sebagai berikut : n
1. Mengubah n −1 ∑ ( yi − f j ( x ji )) 2 kedalam bentuk matrik i =1
(
n −1 ∑( yi − f j ( x ji )) 2 = n −1 yT y − 2 β Tj XTj y + β Tj XTj X j β j i =1 n
SKRIPSI
ESTIMASI MODEL REGRESI...
)
(2.13)
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 17
Kj
2. Mengubah
∑β
k j =1
2 j ( p j +k j )
kedalam bentuk matrik
Kj
∑β =
k j =1
2 j (m j +k j )
β j2( p +1) + β j2( p + 2) +…+ β j2( p + K j
j
j
(2.14)
j)
Jika diasumsikan terdapat matrik D j yang merupakan suatu matrik diagonal, didefinisikan sebagai berikut :
a11 0 Dj = 0 0
0 a22
... ...
0
a( p j +1)( p j +1) ...
0
0 ... a( p j + K j +1)( p j + K j +1) 0
dengan a11 = a22 = … = a p j p j = a( p +1)( p +1) = 0, j j
a( p + 2)( p + 2) = a( p +3)( p +3) = … = a( p + K +1)( p + K +1) = 1 j j j j j j j j Kj
sehingga fungsi penalized
∑β
k j =1
2 j ( p j +k j )
dituliskan dalam bentuk matrik, sebagai
berikut : Kj
∑β
k j =1
2 j ( p j +k j )
= β j0
a11 0 … β j( pj +K j ) 0
β j1
0 a22 0
0 β j0 β 0 j1 a( p j + K j +1)( p j + K j +1) β j ( p j + K j )
= β Tj Dβ j
(2.15)
Matrik fungsi PLS yang diperoleh dari menggabungkan fungsi persamaan dapat ditulis sebagai berikut :
(
)
L j = n −1 yT y − 2 β Tj XTj y + β Tj XTj X j β j + λ j β Tj D j β Tj
SKRIPSI
ESTIMASI MODEL REGRESI...
(2.16)
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 18
� dapat diperoleh dengan meminimumkan persamaan L. Syarat perlu agar Nilai 𝜷𝜷 persamaan L minimum adalah turunan pertama sama dengan nol,
∂L = 0, ∂β
sehingga diperoleh persamaan (2.17) sebagai berikut : = βˆ j ( XTj X j + nλ j D j ) −1 XTj y (2.17) Subtitusi persamaan pada yˆ = Cβˆ menghasilkan bentuk estimator penalized spline f j ( x j ) dari variabel prediktor ke-j menjadi persamaan (2.18) sebagai
berikut : = yˆ X j ( XTj X j + nλ j D j ) −1 XTj y
yˆ = H ( λ j ) y
(2.18) (Ruppert, et al., 2003)
2.6
Kuantil Ukuran lokasi yang menjelaskan atau menunjukkan lokasi sebagian data
relatif terhadap keseluruhan data disebut fraktil atau kuantil. Menurut Walpole (1997), kuantil adalah nilai-nilai yang dibawahnya terdapat sejumlah pecahan atau persentase tertentu dari seluruh pengamatan. Beberapa kuantil yang sering dibahas diantaranya adalah persentil, desil, dan kuartil. Nilai-nilai yang membagi segugus pengamatan menjadi 100 bagian yang sama disebut persentil dan umumnya dinotasikan dengan P1 , P2 , , P99 . Notasi P1 berarti bahwa 1% dari seluruh data terletak di bawah P1 , 2% terletak di bawah P2 dan seterusnya sampai P99 yang menyatakan bahwa 99% terletak di bawah P99 . Nilai-nilai yang membagi jajaran data menjadi 10 bagian yang sama dinamakan desil. Nilai-nilai tersebut dinotasikan dengan D1 , D2 , , D9 yang berarti bahwa 10% data terletak di bawah D1 , 20% terletak di bawah D2 , dan seterusnya sampai
D9 yang berarti bahwa 90% data terletak di bawah D9 . Nilai-nilai yang membagi data menjadi 4 bagian yang sama disebut kuartil dan dinotasikan dengan
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 19
𝑄𝑄1 , 𝑄𝑄2 , 𝑄𝑄3 . Notasi 𝑄𝑄1 berarti bahwa 25% data terletak di bawah 𝑄𝑄1 , 50% data terletak di bawah 𝑄𝑄2 , dan 75% data terletak di bawah 𝑄𝑄3 . Persentil ke-50, desil kelima, dan kuartil kedua dari suatu data dapat pula disebut median karena median merupakan nilai-nilai yang membagi data menjadi 2 bagian yang sama. (Walpole, et al., 2012). 2.7
Pemilihan Titik Knot Optimal Parameter λ merupakan pengontrol keseimbangan antara kemulusan
fungsi terhadap data. Jika λ besar maka estimasi fungsi yang diperoleh akan semakin halus, dan sebaiknya jika λ kecil maka estimasi fungsi yang diperoleh akan semakin kasar. Salah satu metode yang digunakan sebagai kriteria untuk menentukan parameter penghalus λ optimum adalah dengan menentukan nilai Generalized Cross Validation (GCV) yang minimum. Metode GCV dapat didefinisikan sebagai berikut :
GCV (λ ) =
(
RSS (λ ) (1 − n −1df fit (λ )) 2
(2.19)
)
dengan RSS (λ ) = n −1 y T y − 2y T fˆλ + fˆλ T fˆλ = n −1 (Y − Aω )T (Y − Aω ) −1 T T H(λ ) X ( X X + nλ D) X df fit (λ ) = tr(H(λ ));= (Ruppert, et al., 2003)
2.8
Pemilihan Jumlah Titik Knot Optimal Pemilihan jumlah dan titik knot optimal perlu dilakukan untuk
mengestimasi fungsi spline. Jumlah knot ( K ) merupakan banyaknya titik knot atau banyaknya titik perubahan perilaku fungsi pada interval yang berlainan. Ruppert (2002) menyatakan bahwa titik knot terletak pada sampel kuantil dari nilai-nilai unique (tunggal) variabel prediktor
{ti }i =1 . n
Salah satu metode yang
dapat digunakan untuk menentukan jumlah dan lokasi titik knot optimal adalah metode full-search. Algoritma dari metode full-search yang didasarkan pada kriteria Generalized Cross Validation (GCV) adalah:
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 20
a. Membandingkan nilai GCV ( λ ) pada K = 1 dan K = 2 . i.
Apabila nilai GCV ( λ ) pada K = 1 lebih kecil dari nilai GCV ( λ ) pada K = 2 , maka algoritma berhenti dengan memilih jumlah knot optimal
yaitu K = 1 . ii. Apabila nilai GCV ( λ ) pada K = 1 lebih besar dari nilai GCV ( λ ) pada K = 2 , maka algoritma ini akan dilanjutkan dengan membandingkan
nilai GCV ( λ ) untuk K = 2 dan K = 3 . b. Membandingkan nilai GCV ( λ ) pada K = 2 dan K = 3 . i. Apabila nilai GCV ( λ ) pada K = 2 lebih kecil dari nilai GCV ( λ ) pada
K = 3 , maka algoritma berhenti dengan memilih jumlah knot optimal yaitu K = 2 . ii. Apabila nilai GCV ( λ ) pada K = 2 lebih besar dari nilai GCV ( λ ) pada
K = 3 , maka algoritma ini akan dilanjutkan dengan membandingkan nilai GCV ( λ ) untuk K = 3 dan K = 4 . Membandingkan nilai GCV ( λ ) pada K = 3 dan K = 4 yang dilakukan dengan cara yang sama seperti di atas, demikian seterusnya hingga diperoleh nilai GCV ( λ ) yang minimum. (Ruppert, et al., 2003)
2.9
Model Semiparametrik Berdasarkan Estimator Penalized Spline dengan Satu Variabel Respon Model regresi semiparametrik berdasarkan estimator penalized spline,
diberikan dalam bentuk model sebagai berikut :
y = XT β + f ( Z ) + ε dengan y adalah vektor dari variabel respon yang berukuran n×1, XT adalah matrik transpose variabel prediktor untuk komponen parametrik dengan ukuran n×p dengan p=(k+1) dan Z variabel prediktor untuk komponen nonparametrik,
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 21
β = ( β 0 , β1 , β 2 ,..., β k ) merupakan vektor (k+1)×1 untuk parameter yang tidak T
diketahui, f adalah vektor dari fungsi regresi yang bentuk kurvanya tidak diketahui atau merupakan fungsi yang mulus atau dengan kata lain f atau f ( zi ) K
licin (smooth) yaitu f (zi ) = β 0 + β1 z + ... + β p z + ∑ β pk ( z − xk ) +p , p = 1, 2,...,n dan p
k =1
ε adalah vektor dari error random independen dengan mean nol dan varians σ 2 .
(Salam, 2013)
2.10
Model Semiparametrik Birespon Berdasarkan Estimator Penalized Spline dengan Satu Variabel Prediktor Model regresi semiparametrik birespon berdasarkan estimator penalized
spline, diberikan n data observasi ( yi1 , yi 2 , xi , ti ) dengan yij menunjukkan observasi ke −i pada respon ke − j memeuhi model regresi semiparametrik multirespon sebagai berikut : Yi = XTi a + g (ti ) + ε i , i = 1, 2,..., n
(2.20)
dengan Yi = ( yi1 , yi 2 )T dan ε i berturut-turut adalah respon dan error untuk observasi ke −i . g (ti ) merupakan fungsi dari rata-rata populasi yang diasumsikan T smooth. Xi = (1 xi1 ... xiq )T adalah komponen parametrik dari fungsi yang
(
)
T
diasumsikan diketahui untuk observasi ke −i dan a = a0 , a1 ,..., aq yang merupakan koefisien dari variabel prediktor parametrik. Persamaan (2.20)
XTi a sebagai komponen parametrik dan g (ti ) merupakan komponen nonparametik. Berdasarkan persamaan (2.20), fungsi g (ti ) diestimasi menggunakan estimator penalized spline. Fungsi penalized spline dengan p orde mengandung
dan beberapa knot (τ 1 ,τ 2 ,...,τ k ) dapat ditulis sebagai berikut : p
K
g (t ) =∑ β r t r + ∑ β p +1 (t − τ l ) +p
(2.21)
=r 1 =l 1
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 22
Estimasi α dan β dengan meminimumkan kriteria Penalized Least Square
(PLS) sebagai berikut :
2
n
K
( yij − xijT α + tijT β ) 2 + λ ∑ β p2+1 ∑∑ =j 1 =i 1 =i 1
(2.22)
dengan λ adalah parameter penghalus, dan K adalah titik knot dan p merupakan orde polinomial. (Chamidah and Eridani, 2015)
2.11
Kasus Homoskedastisitas dan Heteroskedastisitas Salah satu asumsi dalam analisis regresi adalah homoskedastisitas yang
berarti bahwa variansi dari setiap ε i tidak tergantung pada variabel pedictor. Variansi dari setiap ε i bernilai sama untuk semua variabel pedictor, sehingga nilai dari variansi residual bersifat
(ε i ) E( var= = ε i2 ) σ 2 ,
konstan atau
i = 1, 2,3,..., n . Pelanggaran terhadap asumsi ini disebut heteroskedastisitas yang
berarti bahwa variansi dari setiap error bersifat tidak konstan. Dalam analisis regresi, heteroskedastisitas dinyatakan sebagai berikut: var εi xi = σi2 , i = 1, 2, , n
(2.23)
Persamaan (2.18) juga dapat dinotasikan dalam model di bawah ini.
ω1 0 E εε ' X = σ 2 Ω = σ 2 0
ω2
0
0
0
0 0 = ωn
σ12 0 0
σ 22
0
0
0
0 0 σ n2
sehingga σi2 = σ2 ωi . Dalam kasus homoskedastisitas, nilai ωi =1 untuk i = 1, 2, , n .
(Greene, 2003)
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 23
2.12
Estimasi Parameter Weighted Least Square (WLS) Untuk mengilustrasikan metode Weighted Least Square (WLS), digunakan
model dua variabel. Metode kuadrat terkecil tanpa pembobot yaitu Ordinary Least Square (OLS) mengasumsikan bahwa terdapat variansi konstan dalam error yang pada umumnya disebut keadaan homoskedastisitas. Untuk mengestimasi parameter fungsi yang diminimumkan yakni : εT ε =
( y − Xβ ) ( y − Xβ ) T
(2.24)
sedangkan metode WLS meminimumkan jumlah kuadrat error terboboti dapat digunakan ketika asumsi variansi konstan dalam error dilanggar atau dalam kata lain disebut heteroskedastisitas (Greene, 2003) yang dirumuskan sebagai berikut : εT Wε =
( y − Xβ )
T
(
W y − Xβ
)
(2.25)
dengan β merupakan estimator WLS dan pembobot W merupakan invers dari
matrik variansi-kovariansi dari ε atau y dengan syarat X , yang dinotasikan
( )
∑ diag (σ12 , σ22 ,..., σ2n ). var ( ε X ) = var y X = ∑, dengan= Persamaan (2.18) selanjutnya diturunkan terhadap β sedemikian sehingga
diperoleh estimator WLS sebagai berikut: β =( XT WX) −1 XT Wy Pada metode OLS, pembobot W merupakan matrik identitas.
(2.26)
(Maziyya dkk.,2015)
2.13
Uji Glesjer Untuk mendeteksi terjadinya heteroskedastisitas bisa dilakukan dengan
beberapa uji diantaranya Uji korelasi Rank-Spearmen, Uji Park, Uji Glesjer, Uji Goldfeld-Quandt (Gujarati, 2004). Uji glesjer merupakan pengujian yang sangat popular untuk melihat terjadinya gejala heteroskedastisitas. Uji glesjer dilakukan dengan cara meregresikan harga mutlak residual dengan variabel prediktornya.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 24
= ε i g ( xi ) + ε i Hipotesis untuk uji glesjer adalah sebagai berikut : 2 2 2 ... σ= H 0 : σ= σ= = σ2 n 1 2
H1 : minimal ada satu σ i2 ≠ σ 2 , dengan i = 1, 2,..., n
Statistik uji :
Fhitung
n ∑ ( εˆi − ε = in=1 ∑ ( ε i − εˆi i =1
/ ( j − 1) 2 ) / ( n − j )
)
2
(2.27)
dengan j = 1, 2,..., n dan i ≠ j , n merupakan bayaknya variabel prediktor . daerah
F(α , p −1,n − p ) , sehingga penolakan hipotesis adalah tolak H 0 jika Fhitung < Ftabel = akan terjadi kasus heteroskedastisitas jika H 0 ditolak yakni terdapat minimal satu
σ i2 ≠ σ 2 .
2.14
Uji Korelasi Pearson Koefisien korelasi merupakan suatu nilai yang mengukur keeratan
hubungan antara dua variabel. Koefisien korelasi yang dihitung untuk data populasi dinotasikan dengan ρ sedangkan koefisien korelasi yang dihitung untuk data sampel dinotasikan dengan r. Nilai koefisien korelasi dapat dihitung dengan menggunakan Pearson Product Moment pada persamaan (2.28) sebagai berikut:
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 25
n
r=
∑(X i =1
i
− X )(Yi − Y )
n n 2 2 ∑ ( X i − X ) ∑ (Yi − Y ) = i 1= i 1 n
r=
∑ X Y − nXY i i
i =1
n n 2 2 2 2 − X nX ∑ ∑ i Yi − nY = i 1= i 1
(2.28)
nilai r selalu berada diantara -1 sampai 1 ( −1 ≤ r ≤ 1 ). Apabila nilai r = 1 maka disebut dengan korelasi linier positif sempurna. Apabila nilai r = −1 maka dinamakan korelasi linier negatif sempurna, sedangkan apabila nilai r = 0 menunjukkan bahwa tidak terdapat korelasi diantara kedua variabel tersebut. Pengujian koefisien korelasi dilakukan dengan menggunakan hipotesis nol yaitu kedua variabel tidak memiliki hubungan linier ( ρ =0 ) dan hipotesis alternatif (H 1 ) adalah ρ > 0 , ρ < 0 atau ρ ≠ 0 . Konversi nilai koefisien korelasi menjadi distribusi t adalah t=
r n−2 1− r
(2.29)
2
dengan derajat bebas n − 2 , n merupakan banyaknya pasangan data dari variabelvariabel yang diduga berkorelasi dan r merupakan nilai koefisien korelasi yang diperoleh berdasarkan persamaan (2.28). Nilai statistik uji t yang telah diperoleh berdasarkan persamaan (2.29) selanjutnya dibandingkan dengan nilai t tabel. Apabila nilai t hitung kurang dari t tabel maka H 0 diterima dan dapat disimpulkan bahwa tidak terdapat korelasi linier diantara kedua variabel, demikian sebaliknya. (Rasmussen, 2006)
2.15
Open Source Software R (OSS-R) R merupakan salah satu software yang sering digunakan dalam statistika
dan termasuk dalam kategori Open Source Software (OSS) untuk memanipulasi data, simulasi, kalkulasi, dan peragaan graphic. Bahasa R berbasis bahasa S yang
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 26
dibangun di Bell Laboratories di tahun 80-an sehingga syntax R memiliki perbedaan yang tidak terlalu banyak atau hampir identik jika dibandingkan dengan syntax pada software S-plus (Sawitzki, 2009). R mempunyai beberapa kelebihan dan fitur-fitur yang canggih dan berguna, diantaranya : a. Efektif dalam pengolahan data dan fasilitas penyimpanan. Ukuran file yang disimpan jauh lebih kecil dibanding software lainnya. b. Lengkap dalam perhitungan array. c. Lengkap dan terdiri dari koleksi tools statistik yang terintegrasi untuk analisis data, diantaranya, mulai statistik deskriptif, fungsi probabilitas, berbagai macam uji statistik, hingga time series. d. Tampilan grafik yang menarik dan fleksibel ataupun costumized. e. Dapat dikembangkan sesuai keperluan dan kebutuhan dan sifatnya yang terbuka, setiap orang dapat menambahkan fitur-fitur tambahan dalam bentuk paket ke dalam software R. Software R sangat cocok digunakan untuk riset, baik statistik, ekonomi, komputasi numerik, dan pemrograman komputer (Didi, 2014). Beberapa perintah internal yang digunakan dalam OSS-R adalah sebagai berikut: 1. function( ), merupakan perintah untuk menunjukkan kumpulan dari beberapa fungsi yang digunakan dalam program. Fungsi dipanggil dengan format nama fungsi( daftar argumen ). 2.
length( ), merupakan perintah yang digunakan untuk menghitung banyaknya data. Misalkan terdapat perintah length(vector), maka akan diperoleh hasil yaitu panjang dari vector tersebut.
3.
plot( ), digunakan untuk membuat plot data. Beberapa penggunaan perintah ini diantaranya: a.
plot(X,Y) berarti bahwa akan dibuat plot data berupa titik dengan sumbu datar X dan sumbu tegak Y.
4.
b.
plot(X,Y,type=”l”) memberikan hasil plot bertipe garis.
c.
plot(X,Y,type=”b”) memberikan hasil plot bertipe garis dan titik.
rep(a,b), merupakan perintah yang digunakan untuk membentuk suatu vektor dengan anggota a sebanyak b.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 27
5.
matrix(a,b,c), merupakan perintah yang digunakan untuk membentuk suatu matrik berukuran b × c dengan elemen a.
6.
print( ), digunakan untuk menampilkan hasil atau output dari program.
7.
cat(“…”), merupakan perintah untuk menuliskan kemudian menampilkan argumen dalam bentuk karakter.
8.
for( ), merupakan perintah yang digunakan untuk mengulang satu blok pernyataan berulang kali hingga memenuhi kondisi yang telah ditentukan. Format penulisan perintah ini adalah for( kondisi ) { pernyataan }.
9.
repeat( ), hampir mirip dengan for( ), apabila kondisi sudah terpenuhi maka proses pengulangan akan dihentikan. Struktur penulisan statement repeat dalam R yaitu repeat{ command if( kondisi ) break}
10. if-else, merupakan perintah yang digunakan untuk seleksi kondisi. Apabila suatu kondisi bernilai benar, maka pernyataan pertama akan dijalankan, sedangkan apabila kondisi bernilai salah maka pernyataan kedua yang akan dijalankan. Struktur penulisan perintah ini adalah sebagai berikut: if( kondisi ) { pernyataan pertama } else { pernyataan kedua } 11. solve( A ), digunakan untuk menghitung invers dari suatu matrik A. 12. sum( ), digunakan untuk menghitung jumlah dari keseluruhan data. 13. rbind( ), digunakan untuk menggabungkan suatu matrik atau vektor berdasarkan baris. 14. cbind( ), digunakan untuk menggabungkan suatu matrik atau vektor berdasarkan kolom. 15. diag( a ), merupakan perintah yang digunakan untuk membentuk suatu vektor a menjadi suatu matrik diagonal dengan elemen diagonal utamanya adalah elemen dari a dan elemen yang lain bernilai nol. 16. sort( ), merupakan perintah yang digunakna untuk mengurutkan sekumpulan data. 17. unique( ), digunakan untuk menentukan nilai tunggal dari suatu data. 18. quantile(…, …), merupakan perintah untuk menentukan sampel kuantil.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 28
19. order( ), merupakan perintah untuk menunjukkan vektor posisi data apabila data tersebut diurutkan. 20. var( ), merupakan perintah untuk menghitung nilai varians dari suatu vektor atau matrik variansi-kovariansi dari suatu matrik.
2.16
Tekanan Darah Tekanan darah adalah tekanan yang ditimbulkan pada dinding arteri atau
dengan kata lain kekuatan yang diperlukan agar darah dapat mengalir di dalam pembuluh darah dan beredar mencapai semua jaringan tubuh manusia. Tekanan yang diukur pada nadi, yang dinyatakan dalam millimeter (mm) air raksa (Hg) dan terdiri dari 2 nilai : yang atas adalah tekanan sistolik, dan yang bawah adalah tekanan diastolik. Tekanan darah sistolik dicapai bila titik bilik jantung menguncup, pada saat itu tekanan yang dicapai adalah tekanan yang tertinggi yaitu terjadi saat ventrikel berkontraksi. Tekanan darah diastolik dicapai bila bilik jantung merenggang pada saat itu tekanan yang dicapai adalah tekanan yang terendah yaitu terjadi saat ventrikel beristirahat dan mengisi ruangannya. Pada pengukuran tekanan darah kita akan mengukur dua tekanan : tekanan tertinggi dan tekanan terendah atau juga disebut tekanan sistolik dan diastolik. Menurut kriteria the seventh report of high blood pressure (JNC VII), tekanan darah normal yaitu 120/80 mmHg, angka 120 menunjukkan tigkat tekanan darah sistolik dan angka 80 menunjukkan tingkat tekanan darah diastolik. Beberapa faktor yang mempengaruhi tekaan darah diantaranya adalah faktor psikologis seperti usia dan jenis kelamin, faktor fisiologis seperti volume darah, kekuatan gerak jantung, viscositas darah, dan kapasitas pembuluh darah, serta faktor eksternal seperti stress, pola makan, ataupun kebiasaan merokok.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
BAB III METODOLOGI PENELITIAN
Pada bab ini akan dibahas mengenai langkah-langkah untuk menjawab rumusan masalah yang telah dirumuskan pada BAB I sebelumnya dengan landasan beberapa tinjauan pustaka pada BAB II.
3.1
Mengestimasi
Model
Regresi
Semiparametrik
Birespon
Multiprediktor Berdasarkan Estimator Penalized Spline Langkah-langkah mengestimasi model regresi semiparametrik birespon multiprediktor berdasarkan pendekatan penalized spline adalah sebagai berikut : 1. Mengasumsikan data berpasangan
( y ( ), x ,t ) r
i
vi
wi
dengan i = 1, 2,..., n
menyatakan indeks untuk subyek yang diamati, v = 1, 2,..., p menyatakan indeks variabel prediktor untuk komponen parametrik, w = 1, 2,..., q menyatakan indeks variabel prediktor untuk komponen nonparametrik, dan
r = 1, 2 menyatakan indeks variabel respon yang memenuhi
persamaan model regresi semiparametrik birespon multiprediktor sebagai berikut : p
q
y = θ r 0 + ∑ θ rv xvi + ∑ f rw (twi ) + ε i( r ) , (r ) i
(3.1)
= v 1= w 1
dengan εi( r ) merupakan error random dengan mean 0 dan variansi Σi ,
i = 1, 2,..., n . 2. Menggunakan pendekatan berdasarkan estimator spline pada f rw (twi ) yang merupakan kurva regresi untuk respon ke- r berderajat j dengan titik knot
ξ , dan k merupakan banyaknya titik knot sebagai berikut :
SKRIPSI
29 ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 30
kw p q drw = yi( r ) θ r 0 + ∑ θ rv xvi + ∑ ∑ α rwj t j wi + ∑ β rwh (twi − ξ wh ) d+w + ε i( r ) (3.2) = v 1 w 1= h 1 = = j1 3. Menguraikan persamaan regresi semiparametrik birespon multiprediktor,
kemudian menyatakan dalam suatu matrik sehingga menjadi persamaan (3.3) sebagai berikut :
dengan
(
ε = ε(1) pada
y= ( 2) T . ε
)
( y ( ) 1
y= Xθ + ZΦ + ε (3.3) T T y ( r ) = ( y1( r ) y2( r ) yn( r ) ) dan y ( 2) ; T = θ v(0r ) θ1( r ) θ 2( r ) ... θ p( r ) merupakan parameter
)
(
)
komponen
parametrik
θ (r )
( (
dan
)
T
Φ(r ) = θ w( r0) α1( r ) β1( r ) α 2( r ) β 2( r ) ... α q( r ) β q( r ) ; T (r ) (r ) (r ) (r ) T (r ) (r ) (r ) α w = α w1 α w 2 ... α wd dan β w = β w1 β w( r2) ... β wk yang merupakan parameter pada komponen nonparametrik. X(1) 0 4. Menyatakan dalam suatu matrik X X= (2) 0 X X( r ) = ( x1
x2
5. Menyatakan
(
Z( r ) = Z1(r) = zw( r ) twi
(
)
x3 xn ) dan xi = 1 x1i T
Z
Z (2r )
dalam
suatu
Z3( r ) Z (nr )
twi2 twid w
matrik
)
T
)
x2i x pi . Z (1) Z= 0
; Zi(r) = 1 z1( r )
(twi − ξ w1 ) d w
(twi − ξ w 2 ) d w
0 Z (2)
dengan
z2( r ) zq( r ) ;
(twi − ξ wk ) d w
6. Menyatakan persamaan (3.3) sehingga menjadi persamaan (3.4) sebagai berikut : (3.4) y − Xθ = ZΦ dengan mengasumsikan parameter θ diketahui nilainya dan memisalkan ZΦ sebagai y* adalah sebagai berikut : y*= ZΦ (3.5) 7. Menyatakan estimator penalized spline yang meminimukan fungsi Penalized Least Square (PLS) untuk variabel respon y* .
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 31
8. Mengestimasi model dengan meminimumkan kriteria Penalized Weighted Least Square (PWLS) sebagai berikut :
(
= L n −1 y* − ZΦ
)
T
(
)
W y* − ZΦ + λΦT DΦ
dengan W adalah matrik pembobot yang merupakan invers dari matrik variansi kovariansi error untuk respon 1 dan respon 2. Pengestimasian Φ dengan mendefferensiasi L terhadap Φ ∂L ˆ = Φ = 0 ∂Φ 9. Mengestimasi nilai dugaan θ melalui pendefferensiasikan fungsi K dengan menggunakan metode WLS yang meminimumkan fungsi berikut :
(
(
)) (
))
(
T
K = y − Xθ − A y − Xθ y − Xθ − A y − Xθ mengestimasi θ dengan mendefferensiasi K terhadap θ ∂K ˆ = θ = 0 ∂θ 10. Mendapatkan matrik hat untuk komponen parametrik ( A parametrik )
dan
untuk komponen nonparametrik ( A nonparametrik ) . 11. Menyatakan
matrik
A semipar A parametrik + A nonparametrik untuk hat =
dapat
menghitung nilai Generalized Cross Validation (GCV).
3.2
Membuat Algoritma dan Program Untuk Mengestimasi Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline yang Diterapkan Pada Data Riil atau Data Bangkitan
3.2.1 Algoritma
dan
Program
untuk
Mengestimasi
Model
Regresi
Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline Penerapan
model
regresi
semiparametrik
birespon
multiprediktor
berdasarkan pendekatan penalized spline tidak dapat dilakukan secara manual sehingga
SKRIPSI
diperlukan
bantuan
software
statistika
ESTIMASI MODEL REGRESI...
untuk
memperoleh
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 32
penyelesaiannya. Langkah-langkah membuat algoritma untuk mengestimasi model adalah sebagai berikut : 1. Menginputkan data berpasangan
( y ( ), x ,t ); r
i
vi
wi
i = 1, 2,..., n;
r = 1, 2;
v = 1, 2,..., p w = 1, 2,..., q .
2. Menguji korelasi antara variabel respon 1 dan respon 2 dengan menggunakan uji korelasi pearson berdasarkan persamaan (2.22). 3. Mengestimasi tanpa matrik pembobot variansi kovariansi ( W ) dengan langkah-langkah sebagai berikut : a. Mendefinisikan sampel kuantil dari nilai twi yang diurutkan dari nilai terkecil ke nilai yang terbesar untuk pemilihan titik knot. b. Menentukan kombinasi orde nonparametrik respon 1 dan respon 2, menggerakkan kombinasi vektor knot dan banyak knot dengan menggunakan metode full search serta menggerakkan nilai lambda untuk mendapatkan nilai lambda optimal kemudian dihitung GCV minimum berdasarkan subbab (2.8) c. Membuat matrik X untuk regresi parametrik dan matrik Z untuk regresi nonparametrik. d. Membuat
matrik
D
(matrik
diagonal)
yang
elemen-elemen
diagonalnya adalah D( r ) . Matrik D( r ) merupakan matrik diagonal pada respon ke-r dengan elemen diagonalnya adalah D1 , D2 ,..., Dq dan Dw merupakan
matrik
diagonal
pada
prediktor
pada
komponen
nonparametrik ke-w yang elemen-elemen diagonalnya elemen-elemen diagonalnya
elemen-elemen
diagonalnya
a11 , a22 ,..., adw +1,dw +1 , b11 , b22 ,..., bkwkw ; dengan a11 , a22 ,..., adw +1,dw +1 = 0 dan b11 , b22 ,..., bkwkw = 1 . e. Menentukan matrik penghalus A dengan menggunakan parameter smoothing optimum yang telah diperoleh pada langkah a.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 33
f. Melakukan estimasi model tanpa pembobot W dengan menggunakan parameter smoothing optimum yang telah diperoleh pada langkah b sesuai dengan subbab 2.9. g. Memperoleh nilai ε untuk respon 1 dan respon 2 dari hasil estimasi. 4. Melakukan uji heteroskedastisitas terhadap matrik variansi kovariansi residual yang telah diperoleh dengan menggunakan uji glesjer pada subbab 2.13. 5. Mendefinisikan matrik pembobot
W
berdasarkan hasil pengujian
heteroskedastisitas sesuai hasil pada langkah 4. 6. Mengestimasi dengan menggunakan matrik pembobot variansi kovariansi ( W ) dengan langkah-langkah sebagai berikut :
a. Menentukan kombinasi orde nonparametrik respon 1 dan respon 2, menggerakkan kombinasi vektor knot dan banyak knot dengan menggunakan metode full search serta menggerakkan nilai lambda untuk mendapatkan nilai lambda optimal kemudian dihitung GCV minimum berdasarkan subbab (2.8) b. Membuat matrik X untuk regresi parametrik dan matrik Z untuk regresi nonparametrik. c. Membuat
matrik
D
(matrik
diagonal)
yang
elemen-elemen
diagonalnya adalah D( r ) . Matrik D( r ) merupakan matrik diagonal pada respon ke-r dengan elemen diagonalnya adalah D1 , D2 ,..., Dq dan Dw merupakan
matrik
diagonal
pada
prediktor
pada
komponen
nonparametrik ke-w yang elemen-elemen diagonalnya elemen-elemen diagonalnya
elemen-elemen
diagonalnya
a11 , a22 ,..., adw +1,dw +1 , b11 , b22 ,..., bkwkw ; dengan a11 , a22 ,..., adw +1,dw +1 = 0 dan b11 , b22 ,..., bkwkw = 1 . d. Menentukan matrik penghalus A dengan menggunakan parameter smoothing optimum yang telah diperoleh pada langkah a. e. Melakukan estimasi model yang telah didefinisikan pada langkah a. f. Menghitung estimasi y .
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 34
g. Membuat plot data observasi dan hasil estimasi variabel respon terhadap variabel prediktor. h. Menghitung nilai Mean Square Error (MSE) dengan menggunakan persamaan (3.6) sebagai berikut:
i.
(
)(
)
y − y T y − y (3.6) Menghitung nilai R-square dengan menggunakan persamaan (3.7) MSE =
( 2n )
−1
sebagai berikut: R2 = 1 −
JKG JKT
(
y yˆ dengan Jumlah Kuadrat Galat (JKG) =−
(
(3.7)
) ( y − yˆ )
y y Jumlah Kuadrat Total (JKT) =−
SKRIPSI
T
) ( y − y ) . T
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 35
Langkah-langkah dalam merancang agoritma program untuk mengestimasi model regresi semiparametrik birespon multiprediktor berdasarkan pendekatan penalized spline dapat digambarkan dalam diagram alir sebagai berikut:
(
)
Input data yi ( r ) , xvi , twi yang memenuhi persamaan (3.1)
Uji korelasi antara y (1) dan y ( 2) Memperoleh parameter smoothing optimum dengan menggunakan metode full-search berdasarkan kriteria GCV minimum
Melakukan estimasi tanpa melibatkan pembobot W dengan menggunakan parameter smoothing optimal yang telah diperoleh
Memperoleh nilai εˆ ( r ) Melakukan uji heteroskedastisitas pada nilai ε
Mendefinisikan pembobot W berdasarkan uji heteroskedastisitas pada nilai ε
Menentukan parameter smoothing dengan melibatkan pembobot W berdasarkan kriteria GCV minimum
Menghitung nilai parameter dan estimasi y Membuat plot data observasi dan hasil estimasi y Menghitung MSE dan R 2 Gambar 3.1 Diagram Alir Algoritma dan Program
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 36
3.2.2 Penerapan Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline pada Data Riil a.
Data dan Sumber Data Data yang digunakan dalam skripsi ini adalah data sekunder yang
berasal dari rekam medis pasien yang menjalani rawat inap di Rumah Sakit Umum (RSU) Haji Surabaya pada Tahun 2014-2015 sebanyak 65 data. Data tersebut dibagi menjadi 2, 50 data digunakan untuk pemoelan insampel (Lampiran 1) dan 15 data digunakan untuk pemodelan outsample (Lampiran 2).
b.
Variabel Penelitian Variabel-variabel penelitian yang digunakan pada penelitian ini
disajikan pada Tabel 3.1 sebagai berikut : Tabel 3.1 Variabel-variabel Penelitian
SKRIPSI
No.
Variabel
Keterangan Variabel
Satuan
1
yi(1)
Tekanan darah sistolik
mmHg
2
yi(2)
Tekanan darah diastolik
mmHg
3
x1i
LDL
mg/dL
4
t1i
Berat Badan
Kg
5
t2i
Usia
Tahun
6
t3i
HDL
mg/dL
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
BAB IV HASIL DAN PEMBAHASAN
4.1
Estimasi Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Penalized Spline Estimasi penalized spline dalam regresi semiparametrik birespon
multiprediktor disajikan dengan menggunakan optimasi Weighted Least Square (WLS). Data berpasangan yang meliputi dua variabel respon diasumsikan memiliki korelasi antar respon dengan
(y
(1) i
, yi(2) ) yang
p variabel prediktor
x1i , x2i ,..., x pi yang diketahui pola hubungannya serta q variabel prediktor t1i , t2i ,..., tqi yang tidak diketahui bentuk pola hubungannya. Hubungan antara
variabel yi( r ) , x pi , dan twi mengikuti model regresi semiparametrik birespon multiprediktor sebagai berikut : p q (r ) (r ) (r ) 0 i v vi = v 1= w 1
y= θ
+ ∑θ
x + ∑ f w( r ) (twi ) + ε i( r ) ,
(4.1)
dengan i = 1, 2,..., n menyatakan indeks untuk subyek yang diamati, v = 1, 2,..., p menyatakan indeks variabel prediktor untuk komponen parametrik, w = 1, 2,..., q menyatakan indeks variabel prediktor untuk komponen nonparametrik, dan r = 1, 2 menyatakan indeks variabel respon. yi( r ) adalah variabel respon ke- r
observasi ke- i , xvi merupakan variabel prediktor untuk komponen parametrik kev
observasi ke- i ,
twi
merupakan variabel prediktor untuk komponen
nonparametrik ke- w observasi ke- i , dan ε ( r ) sebagai error random. ε ( r ) di asumsikan saling independen yang memiliki mean nol dan variansinya σ r2 , sedangkan ε (1) dan ε (2) saling berkorelasi ( ρ12 ) . Pada umumnya f w( r ) (twi ) adalah fungsi regresi yang tidak diketahui bentuknya dan diasumsikan smooth dalam arti termuat di dalam ruang fungsi tertentu.
SKRIPSI
37 ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 38
Model regresi semiparametrik birespon multiprediktor pada persaman (4.1) dapat dijelaskan sebagai berikut :
= yi( r ) θ 0( r ) + θ1( r ) x1i + θ 2( r ) x2i + ... + θ p( r ) x pi +f
(r ) 1
(t1i ) + f
(r ) 2
(t2i ) + ... + f
(r ) q
(4.2)
(tqi ) + ε
(r ) i
Apabila fungsi nonparametrik ( f rw (twi ) ) didekati dengan fungsi spline dengan orde d rw dan kw titik knot maka fungsi tersebut dapat ditulis sebagai berikut : d rw
kw
∑ α wj( r )t j wi + ∑ β w( rh) (twi − ξ wh )d+
f w( r ) (twi ) =
rw
=j 0= h 1
(4.3)
( r ) d rw = α w( r0) + α w( r1)t1wi + α w( r2)t 2 wi + ... + α wd t wi w (r ) + β w( r1) (twi − ξ w1 ) +drw + β w( r2) (twi − ξ w 2 ) +drw + ... + β wk (twi − ξ wkw ) +drw w
dengan α rwj adalah koefisien polinomial bernilai riil, β rwh adalah koefisien truncated bernilai riil, dan
ξ w1 , ξ w 2 ,..., ξ wk
w
adalah titik-titik knot yang
memperlihatkan perubahan perilaku dari fungsi pada sub-sub interval yang berbeda tergantung pada data. Model regresi semiparametrik
birespon
multiprediktor setelah dilakukan pendekatan fungsi spline dengan orde d rw dan kw titik knot maka persamaan (4.1) dapat ditulis menjadi persamaan sebagai berikut : kw drw ( r ) j (r ) = y θ + ∑ θ x + ∑ ∑ α wj t wi + ∑ β wh (twi − ξ wh ) +drw + ε i( r ) = =v 1 = w 1= h 1 j 0 (r ) (r ) (r ) (r ) (r ) (r ) 1 (r ) 2 yi = θ 0 + θ1 x1i + ... + θ p x pi + α10 + α11 t1i + α12 t1i + ... + α1(dr )t1di p
(r ) i
(r ) 0
q
(r ) vi v
(4.4)
r1
1
+ β11( r ) (t1i − ξ11 ) d+r 1 + β12( r ) (t1i − ξ12 ) d+r 1 + ... + β1(kr1) (t1i − ξ1k1 ) d+r 1 + ... +α
(r ) q0
+ α t + α t + ... + α (r ) 1 q1 qi
(r ) 2 q 2 qi
(4.5)
( r ) d rq qd q qi
t
+ β q(1r ) (tqi − ξ q1 ) +rq + β q( r2) (tqi − ξ q 2 ) +rq + ... + β q(krq) (tqi − ξ qkq ) +rq + ε i( r ) d
d
d
Model regresi semiparametrik birespon pada persamaan (4.5) adalah bentuk ringkas untuk dua respon dengan n unit observasi, persamaan (4.5) untuk
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 39
respon 1 dapat dijelaskan dengan persamaan berikut : 1 y1(1) = θ 0(1) + θ1(1) x11 + ... + θ p(1) x p1 + α10(1) + α11(1)t11 + α12(1)t112 + ... + α1(1)d1 t11d11 d11 + β11(1) (t11 − ξ11 ) d+11 + β12(1) (t11 − ξ12 ) d+11 + ... + β1(1) k1 (t11 − ξ1k1 ) + + ... (1) 1 q + α q(1)0 + α q(1)1 tq11 + α q(1)2 tq21 + ... + α qd t q q1 d
+ β (tq1 − ξ )
d1 q q1 +
(1) q1
+ β (tq1 − ξ ) (1) q2
d1 q q2 +
(4.6)
+ ... + β
(1) qkq
(tq1 − ξ qkq )
+ε
d1 q +
(1) 1
1 y2(1) = θ 0(1) + θ1(1) x12 + ... + θ p(1) x p 2 + α10(1) + α11(1)t12 + α12(1)t122 + ... + α1(1)d1 t12d11 d11 d11 d11 (1) (1) + β1(1) 1 (t12 − ξ11 ) + + β12 (t12 − ξ12 ) + + ... + β1k1 (t12 − ξ1k1 ) + + ... (1) 1 q + α q(1)0 + α q(1)1 tq1 2 + α q(1)2 tq22 + ... + α qd t q q2 d
(4.7)
+ β q(1)1 (tq 2 − ξ q1 ) +1q + β q(1)2 (tq 2 − ξ q 2 ) +1q + ... + β q(1)kq (tq 2 − ξ qkq ) +1q + ε 2(1) d
d
y = θ (1) n
d
+ θ x + ... + θ p(1) x pn + α10(1) + α1(1)1 t11n + α12(1)t12n + ... + α1(1)d1 t1dn11
(1) 0
(1) 1 1n
d11 + β11(1) (t1n − ξ11 ) d+11 + β12(1) (t1n − ξ12 ) d+11 + ... + β1(1) k1 (t1n − ξ1k1 ) + + ... (1) 1 q 1 2 + α q(1)0 + α q(1)1 tqn + α q(1)2 tqn + ... + α qd t q qn d
+ β (tqn − ξ )
d1 q q1 +
(1) q1
+ β (tqn − ξ ) (1) q2
d1 q q2 +
(4.8)
+ ... + β
(1) qk q
(tq − ξ qkq )
d1 q +
+ε
(1) n
untuk respon 2 dapat dijelaskan dengan persamaan berikut : d 21 1 + α12(2)t112 + ... + α1(2) y1(2)= θ 0(2) + θ1(2) x11 + ... + θ p(2) x p1 + α10(2) + α11(2)t11 d1 t11 d 21 + β11(2) (t11 − ξ11 ) d+21 + β12(2) (t11 − ξ12 ) d+21 + ... + β1(2) k1 (t11 − ξ1k1 ) + + ...
+α
(2) q0
(4.9)
+ α t + α t + ... + α t (2) 1 q1 q1
(2) 2 q 2 q1
(2 ) d 2 q qd q q1
(2) (2) (2) 2q 2q 2q + β q(2) 1 (t q1 − ξ q1 ) + + β q 2 (t q1 − ξ q 2 ) + + ... + β qkq (t q1 − ξ qkq ) + + ε 1 d
d
d
d 21 1 + α12(2)t122 + ... + α1(2) y2(2)= θ 0(2 ) + θ1(2) x12 + ... + θ p(2) x p 2 + α10(2) + α11(2)t12 d1 t12 d 21 d 21 d 21 (2 ) (2) + β1(2) 1 (t12 − ξ11 ) + + β12 (t12 − ξ12 ) + + ... + β1k1 (t12 − ξ1k1 ) + + ...
(4.10)
(2) 2 (2) 2 q 1 + α q(2)0 + α q(2) 1 t q 2 + α q 2 t q 2 + ... + α qd q t q 2 d
(2) (2) (2) 2q 2q 2q + β q(2) 1 (t q 2 − ξ q1 ) + + β q 2 (t q 2 − ξ q 2 ) + + ... + β qkq (t q 2 − ξ qkq ) + + ε 2 d
d
d
y = θ (2) n
(2) 0
+θ
1 (2) d 21 (2) 2 x + ... + θ p(2) x pn + α10(2) + α1(2) 1 t1n + α12 t1n + ... + α1d1 t1n
(2) 1n 1
d 21 + β11(2) (t1n − ξ11 ) d+21 + β12(2) (t1n − ξ12 ) d+21 + ... + β1(2) k1 (t1n − ξ1k1 ) + + ...
+α
(2) q0
(4.11)
+ α t + α t + ... + α t ( 2) 1 q1 qn
(2) 2 q 2 qn
(2) d 2 q qd q qn
(2) (2 ) (2 ) 2q 2q 2q + β q(2) 1 (t qn − ξ q1 ) + + β q 2 (t qn − ξ q 2 ) + + ... + β qkq (t q − ξ qkq ) + + ε n d
SKRIPSI
d
ESTIMASI MODEL REGRESI...
d
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 40
Persamaan diatas dapat pula ditulis dalam bentuk matriks sebagai berikut :
y (1) X(1) (2) = y 0
0 θ (1) Z (1) + X( 2) θ (2) 0
0 Φ (1) ε ( r ) + Z (2) Φ (2 ) ε ( r )
(4.12)
Masing-masing elemen pada persamaan (4.12) dapat dijelaskan sebagai berikut : y ( r ) = ( y1( r ) , y 2( r ) ,..., y n( r ) )T
merupakan
θ ( r ) = (θ v(0r ) θ1( r ) θ 2( r ) ... θ p( r ) ) parametrik respon ke −r ;
T
variabel
merupakan
vektor
(
ke −r
r = (1, 2) ;
parameter
komponen
respon
)
T
(r ) + ... + α q( r0) θ w( r0) α1( r ) β1( r ) α 2( r ) β 2( r ) ... α q( r ) β q( r ) ; θ w( r0)= α10( r ) + α 20 Φ(r ) = adalah penjumlahan dari sekumpulan intersep komponen nonparametrik respon ke
−r ; (r ) α w( r ) = (α w( r1) α w( r2) ... α wd )
T
β w( r ) = ( β w( r1)
dan
(r ) β w( r2) ... β wk )
T
vektor parameter komponen nonparametrik respon ke −r ;
merupakan
ε ( r ) = (ε1( r ) , ε 2( r ) ,..., ε n( r ) )T merupakan vektor error respon ke −r ;
X( r ) = ( x1
(
Z( r ) = Z1(r) = τ(wr ) twi
x2
x3 xn ) ; xi = 1 x1i
Z (2r )
T
Z3( r ) Z (nr )
twi2 twid w
)
T
x2i x pi ;
; Zi(r) = 1 τ1( r )
(twi − ξ w1 ) d w
(twi − ξ w 2 ) d w
τ(2r ) τ(qr ) ; (twi − ξ wk ) d w
Sehingga matriks pada persamaan (4.12) dapat ditulis secara sederhana sebagai : y= Xθ + ZΦ + ε
(4.13)
y merupakan vektor variabel respon berukuran 2n ×1 , matrik X = diag ( X(1) , X(2) ) adalah matrik diagonal berukuran 2n × 2( p + 1) , θ merupakan parameter pada komponen parametrik dengan ukuran 2( p + 1) × 1 ,
dengan
matrik
SKRIPSI
Z = diag (Z (1) , Z (2) )
adalah
matrik
diagonal
ESTIMASI MODEL REGRESI...
berukuran
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 41
2 q 2n × ∑ ∑ d rw + kw + 1 yang tergantung pada orde dan titik knot optimal, dan = w 1 r 1= Φ merupakan parameter pada komponen nonparametrik berukuran 2 q ∑ ∑ d rw + kw + 1 ×1 , serta ε merupakan vektor error berukuran 2n ×1 . = w 1 r 1=
Penduga Parameter Komponen Nonparametrik Pendugaan parameter pada model regresi semiparametrik birespon tidak dapat dilakukan keseluruhan secara simultas sehingga dengan mengasumsikan θ diketahui pada persamaan (4.13), maka model regresi semiparametrik birespon dapat dinyatakan sebagai : y − Xθ = ZΦ
(4.14)
Misalkan y*= g (t )= ZΦ , maka y* = y − Xθ
(
(
)
T
dengan y* = y*(1) y*(2) ; y*( r ) = y1*( r ) y2*( r ) ... yn*( r ) r) yi*(= yi( r ) − ( θ0( rv) + θ1( r ) x1i + θ(2r ) x2i + ... + θ(pr ) x pi )
)
T
;
Hasil estimasi fungsi regresi g (t ) dapat dinyatakan sebagai : ˆ yˆ *= gˆ (t )= ZΦ
(4.15)
ˆ didapatkan dengan meminimumkan fungsi Penalized Weighted Least Nilai Φ
Square (PWLS) sebagai berikut : L = ( 2n )
−1
( y
*
− ZΦ
)
T
(
)
W y* − ZΦ + λΦT DΦ
(4.16)
Matrik W adalah matrik pembobot yang merupakan invers dari matrik variansi kovariansi error untuk respon 1 dan respon 2 yang didefiisikan sebagai berikut :
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 42
−1
W =Σ [ ]
−1
Σ12 Σ = 11 ; Σ 21 Σ 22
dengan Σ11 = diag (σ 11 ) , Σ12 =Σ 21 =diag (σ 1σ 2 ρ ) , dan Σ 22 = diag (σ 22 ) , serta diketahui matriks D adalah suatu matrik diagonal yang didefinisikan sebagai berikut :
D( r ) D= 0
0 0T (r ) 0 D1 = 0 0 0 0
0 ; D( r ) (r ) D
dengan D(wr )
a11 0 0 = 0
0 a22
... ...
0T ... 0T 0 0 ... (r ) D2 0 ... 0 ... D(qr )
0
...
... adw dw b11 0 ... 0 b22 ... 0
...
a11= a22= ...= ad w ,d w= 0 ,
0
; 0 bkw kw 0 0
0
...
b11= b22= ...= bkw kw= 1 ,
0 = [ 0 0 ... 0] , dan 0 T
merupakan matrik nol. Pengestimasian Φ dilakukan dengan mendefferensiasi L terhadap Φ ˆ untuk mendapatkan Φ
( ( ( (
)
T
(
)
L = 2n −1 y* − ZΦ W y * − ZΦ + λΦT DΦ = 2n −1 y*T − ΦT ZT W y* − ZΦ + λΦT DΦ *T * *T * −1 T T = 2n y Wy − y WZΦ − Φ Z Wy + ΦT ZT WZΦ + λΦT DΦ *T * * −1 T T T T T = 2n y Wy − 2Φ Z Wy + Φ Z WZΦ + λΦ DΦ
SKRIPSI
) (
)
)
)
ESTIMASI MODEL REGRESI...
(4.17)
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 43
Nilai minimum L pada persamaan (4.17) dicapai saat
∂L = 0 , sehingga ∂Φ
diperoleh : ∂L = 2n −1 0 − 2ZT Wy* + 2ZT WZΦ + 2λ = DΦ 0 ∂Φ −2ZT Wy* + 2ZT WZΦ + 2nλ DΦ =0
(
)
(
)
2 −ZT Wy* + ZT WZΦ + nλ DΦ =0 − ZT Wy* + ZT WZΦ + nλ DΦ =0 ZT WZΦ + nλ DΦ = ZT Wy* T T ( Z WZ + nλ D ) Φ =Z Wy* T ˆ ( Z WZ + nλ D )−1 ZT Wy* = Φ
(4.18)
ˆ telah minimum maka dilakukan Untuk menjamin bahwa penduga parameter Φ
pendeferensiasian kedua pada L terhadap Φ sebagai berikut : ∂ 2L = 0 + 2ZT WZ + 2λ D 2 ∂Φ
= 2 ( ZT WZ + λ D )
Berdasarkan persamaan (4.12) dapat diketahui elemen dari matrik Z dan ZT WZ merupakan bentuk kuadratik, serta λ merupakan suatu nilai yang positif maka diperoleh : ∂ 2L = 2 ( ZT WZ + λ D ) > 0 2 ∂Φ ˆ minimum, sehingga bentuk estimasi dan terbukti bahwa penduga parameter Φ
dari g (t ) adalah
ˆ gˆ (t )= ZΦ
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 44
ˆ = Φ dengan
( Z WZ + nλ D ) T
−1
Z T Wy *
atau bentuk estimasi dari g (t ) dapat dinyatakan sebagai berikut :
(
= gˆ (t ) Z Z WZ + nλD T
)
−1
Z T Wy *
(4.19)
Berdasarkan persamaan (4.15) diperoleh gˆ (t ) pada persamaan (4.19) yang
merupakan fungsi regresi nonparametrik birespon. Estimator penalized spline untuk fungsi regresi birespon gˆ (t ) diberikan sebagai :
gˆ (t ) = Ay* atau yˆ * = Ay*
(4.20)
Sehingga matrik hat A nonparametrik yang didapatkan dari persamaan (4.19) untuk estimasi fungsi regresi adalah
(
A = Z ZT WZ + nλD
)
−1
ZT W
Penduga Parameter Komponen Parametrik Berdasarkan persamaan (4.13), nilai dugaan θ adalah θˆ yang diperoleh melalui pendefferensiasian fungsi K terhadap θ
( (
)( ) )( ( )) ( )( )( T
g (t ) gˆ (t ) g (t ) − gˆ (t ) K =− T * y − Xθ − Ay* = y − Xθ − Ay T y − Xθ − A y − Xθ = y − Xθ − A y − Xθ T y − Ay − Xθ + AXθ = y − Ay − Xθ + AXθ T = ( I − A ) y − ( I − A ) Xθ ( I − A ) y − ( I − A ) Xθ T T T T T = y ( I − A ) − θ X ( I − A ) ( I − A ) y − ( I − A ) Xθ T T T T =y ( I − A ) ( I − A ) y − y ( I − A ) ( I − A ) Xθ T T T T T T − θ X ( I − A ) ( I − A ) y + θ X ( I − A ) ( I − A ) Xθ
(
( (
(
SKRIPSI
)
(
)(
)) )
)
)
ESTIMASI MODEL REGRESI...
(4.21)
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 45
Nilai minimum K
pada persamaan (4.21) dicapai saat
∂K = 0 , sehingga ∂θ
diperoleh : ∂K T T T = 0 − yT ( I − A ) ( I − A ) X − XT ( I − A ) ( I − A ) y + 2 XT ( I − A ) ( I − A ) Xθ = 0 ∂θ T T T
− XT ( I − A ) ( I − A ) y − XT ( I − A ) ( I − A ) y + 2XT ( I − A ) ( I − A ) Xθ = 0 T T −2XT ( I − A ) ( I − A ) y + 2XT ( I − A ) ( I − A ) Xθ = 0 T T 2 − XT ( I − A ) ( I − A ) y + XT ( I − A ) ( I − A ) Xθ = 0
(
)
− XT ( I − A ) ( I − A ) y + XT ( I − A ) ( I − A ) Xθ = 0 T T XT ( I − A ) ( I − A ) Xθ =XT ( I − A ) ( I − A ) y T
T
Kemudian didapatkan
(
T θˆ = XT ( I − A ) ( I − A ) X
)
−1
XT ( I − A ) ( I − A ) y T
(4.22)
Untuk menjamin bahwa penduga parameter θˆ telah minimum maka dilakukan
pendeferensiasian kedua pada K terhadap θ sebagai berikut : ∂ 2K T = 0 + 2 XT ( I − A ) ( I − A ) X 2 ∂θ
= 2 XT ( I − A )
T
(I − A) X
Berdasarkan persamaan (4.12) dapat diketahui elemen dari matrik X dan matrik hat A yang telah didefinisikan sebelumnya, serta 2 XT ( I − A ) ( I − A ) X T
merupakan bentuk kuadratik maka diperoleh : ∂ 2K T = 2 XT ( I − A ) ( I − A ) X > 0 2 ∂θ dan terbukti bahwa penduga parameter θˆ minimum.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 46
ˆ yang teah didapatkan pada persamaan (4.18) Penduga parameter θˆ dan Φ
dan persamaan (4.22) disubtitusikan dalam persamaan (4.13), sehingga diperoleh : ˆ yˆ = Xθˆ + ZΦ T = X XT ( I − A ) ( I − A ) X
( X(X X(X
) (I − A) X) (I − A) X)
−1
(
)
(
)
−1
XT ( I − A ) ( I − A ) y + ZT WZ + nλD ZT Wy* −1 −1 T T T T T T X ( I − A ) ( I − A ) y + Z WZ + nλD Z W y − Xθ = (I − A) −1 T T T T X (I − A) (I − A) y = (I − A) −1 −1 T T T T T + Z Z WZ + nλD Z W y − X X ( I − A ) ( I − A ) X XT ( I − A ) ( I − A ) y …(4.23)
(
T
(
)
(
(
)
)
dengan memisalkan C= X XT ( I − A ) ( I − A ) X T
)
−1
XT ( I − A ) ( I − A ) , maka T
persamaan (4.23) dapat dinyatakan sebagai berikut :
( (
Cy + Z ZT WZ + nλD yˆ = Cy + Z ZT WZ + nλD
) )
(
−1
)
ZT W y − Cy −1 ZT W ( I − C ) y
(4.24)
Persamaan (4.24) dapat ditulis sebagai berikut : = yˆ A par y + A nonpar y = ( A par + A nonpar ) y = A semipar y
(4.25) (4.26)
dengan A par = C , A nonpar = A ( I − C ) , dan A semipar merupakan matriks penghalus yang sesuai untuk variabel respon disetiap pengamatan. Nilai Generalized Cross Validation (GCV) diperoleh berdasakan subbab 2.7 untuk estimasi model regresi semiparametrik birespon berdasarkan estimator penalized spine sebagai berikut : GCV (λ ) =
(
dengan RSS (λ ) = n −1 y − yˆ
SKRIPSI
RSS (λ ) (1 − ( 2n ) df fit (λ )) 2 −1
(4.27)
) ( y − yˆ ) T
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 47
= ( 2n )
−1
semipar
= ( 2n )
−1
=
4.2
( 2n )
( y − A ((I − A
−1
semipar
( y ( I − A
) ( y − A y ) ) y ) ((I − A ) y )
y
T
semipar
T
semipar
) (I − A T
T
semipar
semipar
) y)
(4.28)
Algoritma dan Program untuk Mengestimasi Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline yang Diterapkan pada Data Riil atau Data Bangkitan
4.2.1 Algoritma
dan
Program
untuk
Mengestimasi
Model
Regresi
Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline Algoritma untuk mengestimasi model regresi semiparametrik birespon multiprediktor melalui pendekatan estimator penalized spline dalam software R adalah sebagai berikut : 1. Menginputkan data berpasangan
( y ( ), x ,t ); r
i
vi
wi
i = 1, 2,..., n;
r = 1, 2;
v = 1, 2,..., p w = 1, 2,..., q .
2. Menguji korelasi antara variabel respon 1 dan respon 2 dengan menggunakan uji korelasi pearson berdasarkan persamaan (2.22). 3. Mengestimasi tanpa matriks pembobot variansi kovariansi ( W ) dengan langkah-langkah sebagai berikut : a. Mendefinisikan sampel kuantil dari nilai twi yang diurutkan dari nilai terkecil ke nilai yang terbesar untuk pemilihan titik knot pada setiap prediktor. b. Menentukan kombinasi orde nonparametrik respon 1 dan respon 2, banyak knot dengan menggunakan metode full search serta menggerakkan nilai lambda untuk mendapatkan nilai lambda optimal kemudian dihitung GCV minimum berdasarkan subbab (2.8) c. Membuat matrik X untuk regresi parametrik dan matrik Z untuk regresi nonparametrik.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 48
d. Membuat
matrik
D
(matrik
diagonal)
yang
elemen-elemen
diagonalnya adalah D( r ) . Matrik D( r ) merupakan matrik diagonal pada respon ke-r dengan elemen diagonalnya adalah 0, D1 , D2 ,..., Dq dan Dw merupakan
matrik
diagonal
pada
prediktor
pada
komponen
nonparametrik ke-w yang elemen-elemen diagonalnya elemen-elemen diagonalnya
elemen-elemen
a11 , a22 ,..., adwdw , b11 , b22 ,..., bkwkw ;
diagonalnya
a11 , a22 ,..., adwdw = 0
dengan
dan
b11 , b22 ,..., bkwkw = 1 . e. Menentukan matrik penghalus A dengan menggunakan parameter smoothing optimum yang telah diperoleh pada langkah a. f. Melakukan estimasi model tanpa pembobot W dengan menggunakan parameter smoothing optimum yang telah diperoleh pada langkah b sesuai dengan subbab 2.9. g. Memperoleh nilai ε untuk respon 1 dan respon 2 dari hasil estimasi. 4. Melakukan uji heteroskedastisitas terhadap matrik variansi kovariansi residual yang telah diperoleh dengan menggunakan uji glesjer pada subbab 2.13. Apabila Fhitung < Ftabel maka terjadi kasus heteroskedastisitas yakni terdapat minimal satu σ i2 ≠ σ 2
sedangkan jika sebaliknya
Fhitung > Ftabel maka tidak terjadi kasus heteroskedastisitas atau dapat dikatakan terjadi homoskedastisitas. 5. Mendefinisikan matrik pembobot
W
berdasarkan hasil pengujian
heteroskedastisitas sesuai hasil pada langkah 4. Jika terjadi kasus homoskedastisitas maka langkah-langkah untuk mendapatkan pembobot W adalah sebagai berikut : a.
Menghitung matriks variansi kovariansi dari error pada respon 1 dan error pada respon 2, sehingga didapatkan σ 11 ,
σ 22 , σ 12 , dan σ 21
dengan σ 12 = σ 21 .
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 49
b. Membentuk matriks diagonal dari masing-masing σ 11 , σ 22 , σ 12 , dan
σ 21 . c. Menggabungkan matriks diagonal dari matriks variansi kovariansi sehingga didapatkan matrik pembobot W . Jika terjadi kasus heteroskedastisitas maka langkah-langkah untuk mendapatkan pembobot W adalah sebagai berikut : a. Menghitung matriks variansi kovariansi dari error pada masing-masing subjek ke-i; i = 1, 2,...n respon 1 dan error pada respon 2, sehingga didapatkan σ 11(i ) , σ 12(i ) , σ 21(i ) , dan σ 22(i ) dengan σ 12(i ) = σ 21(i ) . b. Membentuk matriks diagonal dari masing-masing σ 11(i ) , σ 12(i ) , σ 21(i ) , dan σ 22(i ) . c. Menggabungkan matriks diagonal dari matriks variansi kovariansi sehingga didapatkan matrik pembobot W . 6. Mengestimasi dengan menggunakan matriks pembobot variansi kovariansi ( W ) dengan langkah-langkah sebagai berikut :
a. Menentukan kombinasi orde nonparametrik respon 1 dan respon 2, banyak knot dengan menggunakan metode full search serta menggerakkan nilai lambda untuk mendapatkan nilai lambda optimal kemudian dihitung GCV minimum berdasarkan subbab (2.8) a. Membuat matrik X untuk regresi parametrik dan matrik Z untuk regresi nonparametrik. b. Membuat
matrik
D
(matrik
diagonal)
yang
elemen-elemen
diagonalnya adalah D( r ) . Matrik D( r ) merupakan matrik diagonal pada respon ke-r dengan elemen diagonalnya adalah 0, D1 , D2 ,..., Dq dan Dw merupakan
matrik
diagonal
pada
prediktor
pada
komponen
nonparametrik ke-w yang elemen-elemen diagonalnya elemen-elemen diagonalnya
SKRIPSI
elemen-elemen
ESTIMASI MODEL REGRESI...
diagonalnya
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 50
a11 , a22 ,..., adwdw , b11 , b22 ,..., bkwkw ;
a11 , a22 ,..., adwdw = 0
dengan
dan
b11 , b22 ,..., bkwkw = 1 . c. Menentukan matrik penghalus A dengan menggunakan parameter smoothing optimum yang telah diperoleh pada langkah a. d. Melakukan estimasi model yang telah didefinisikan pada langkah a. e. Menghitung estimasi y . f. Membuat plot data observasi dan hasil estimasi variabel respon terhadap variabel prediktor. g. Menghitung nilai Mean Square Error (MSE) dengan menggunakan persamaan (3.6) sebagai berikut:
(
)(
)
y − yˆ T y − yˆ (4.29) h. Menghitung nilai R-square dengan menggunakan persamaan (3.7) MSE =
( 2n )
−1
sebagai berikut:
R2 = 1 −
JKG JKT
(
(4.30)
dengan Jumlah Kuadrat Galat (JKG) =− y yˆ
(
Jumlah Kuadrat Total (JKT) =− y y
SKRIPSI
) ( y − yˆ ) T
) ( y − y ) . T
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 51
Algoritma program pengestimasian model regresi semiparametrik birespon multiprediktor dapat digambarkan dalam flowchart sebagai berikut: Mulai
((
))
Input Inputdata data yijt(ij1),,yyijij(1()2,) ,yxijij( 2,)tij
Input alfa Uji korelasi antara y (1) dan y ( 2) p − value ≤ alfa
Tidak
Data tidak dapat digunakan
Ya Input banyak prediktor Input batas bawah lambda Input batas atas lambda Input increament (h)
•
Matriks p
•
y = y (1)
(
y ( 2)
Selesai
)
T
tbaru
q = 1, 2,..., w
A
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 52
A
k =1
c =1
Vektor MSE; vektor GCV
lambda= batas bawah
Estimasi Model
lambda= batas bawah + h
MSE [ a ] dan GCV [ a ]
Lambda optimal saat GCV minimum
Lambda Optimal [p], MSE [p], dan GCV minimum [p] pada orde p [ c,]
c= c + 1
Tidak
c = total semua kombinasi Ya B
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 53
k= k + 1
B
GCV [ k + 1] > GCV [ k ]
Tidak
Ya Membandingkan GCV untuk kombinasi orde
Melakukan estimasi dengan menggunakan parameter smoothing optimal yang telah diperoleh
Uji heteroskedastisitas pada nilai ε
Tidak
Ya
p − value ≤ alfa
Kasus
Kasus
Homoskedastisitas
Heteroskedastisitas Menghitung variansi-
Menghitung variansikovariansi dari ε
(1)
dan ε
kovariansi dari εi(1) dan ε(i 2)
( 2)
Mendefinisikan vektor variansi covariansi sebagai matriks diagonal
C
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 54
C
Menggabungkan keempat matriks diagonal, dan menghitung inversnya
Melakukan estimasi dengan menggunakan parameter smoothing optimal yang telah diperoleh beserta W
Menghitung nilai penduga parameter
Menghitung nilai estimasi y
Membuat plot data observasi dan hasil estimasi y Menghitung MSE dan R 2
Selesai
4.2.2 Penerapan Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline pada Data Riil Data yang diguakan untuk penerapan model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline adalah data tekanan darah pada pasien di Rumah Sakit Umum (RSU) Haji Surabaya. Pasien yang menjadi objek penelitian sebanyak 65 pasien. Data yang digunakan dalam pemodelan insampel sebayak 50 data dan 15 data untuk pemodelan outsampel. Variabel yang digunakan dalam pengestimasian diantaranya variabel respon pertama ( yi(1) ) yaitu tekanan darah sistolik dan variabel respon kedua ( yi(2) ) yaitu
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 55
tekanan darah diastolik. Penentuan variabel prediktor komponen parametrik menggunakan uji korelasi pearson, karena pada teori yang dikembangkan variabel prediktor komponen parametrik diasumsikan linier sehingga uji korelasi pearson tepat digunakan untuk mengidentifikasi variabel prediktor yang termasuk dalam komponen parametrik. Berdasarkan hasil output uji Korelasi Pearson pada Lampiran 9, diperoleh nilai yang berkorelasi dengan kedua variabel respon adalah Low Density Lipoprotein (LDL) sehingga disimpulkan bahwa variabel LDL sebagai hubungan parametrik. Scatterplot dibuat untuk menunjukkan hubungan antara tekanan darah sistolik dan diastolik dengan masing-masing variabel prediktor yang digunakan. Scatterplot ini digunakan untuk menunjukkan bahwa pola hubungan yang terbentuk untuk setiap variabel prediktor tidak diketahui yang merupakan pola nonparametrik. Scatterplot antara tekanan darah sistolik dan diastolik dengan berat badan, usia, dan High Density Lipoprotein (HDL) ditampilkan secara berturut-turut pada Gambar 4.1, Gambar 4.2, dan Gambar 4.3 sebagai berikut :
Gambar 4.1 Scatterplot antara Tekanan Darah Sistolik dan Diastolik dengan Berat Badan
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 56
Gambar 4.2 Scatterplot antara Tekanan Darah Sistolik dan Diastolik dengan Usia
Gambar 4.3 Scatterplot antara Tekanan Darah Sistolik dan Diastolik dengan HDL
Berdasarkan Gambar 4.1, Gambar 4.2, dan Gambar 4.3 dapat diketahui pola hubungan kedua variabel respon yaitu tekanan darah sistolik dan diastolik dengan variabel prediktor berat badan, usia, ataupun HDL titik-titik pada scatterplot terlihat menyebar tidak mengikuti pola apapun sehingga disimpulkan sebagai hubungan nonparametrik. Berdasarkan hasil identifikasi variabel prediktor yang dilakukan dapat diketahui prediktor pada komponen parametrik adalah LDL
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 57
( x1i ) , serta variabel prediktor komponen nonparametrik diantaranya adalah berat badan (t1i ) , usia (t2i ) , dan HDL (t3i ) . Langkah awal sebelum melakukan analisis data adalah melakukan uji untuk mengetahui korelasi antara variabel respon pertama (tekanan darah sistolik) dan variabel respon kedua (tekanan darah diastolik) dengan program pada Lampiran 3 menggunakan hipotesis yang dirumuskan sebagai berikut : H 0 : Tidak terdapat korelasi antara tekanan darah sistolik dan diastolik H 1 : Terdapat korelasi antara tekanan darah sistolik dan diastolik Berdasarkan hasil output uji Korelasi Pearson pada Lampiran 9, diperoleh nilai korelasi (r) sebesar 0,631 serta nilai p-value 0,000 < α (=0,05), maka dapat
diambil keputusan untuk menolak H 0 sehingga dapat disimpulkan bahwa ada korelasi antara variabel respon pertama (tekanan darah sistolik) dan variabel respon kedua (tekanan darah diastolik). Langkah selanjutya untuk analisis data adalah menentukan kombinasi orde polinomial optimal pada respon pertama dan respon kedua serta jumlah titik knot optimal dengan mendapatkan nilai lambda optimal pada masing-masing variabel prediktor komponen nonparametrik menggunakan program yang telah dibuat pada lampiran 3 berdasarkan kriteria Generalized Cross Validation (GCV) minimum. Kombinasi orde polinomial pada respon pertama dan respon kedua, jumlah knot dan titik knot, serta nilai lambda optimal berdasarkan kriteria GCV minimum pada prediktor komponen nonparametrik pertama yaitu berat badan (Lampiran 10) ditampilkan pada Tabel 4.1 sebagai berikut : Tabel 4.1 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, dan Nilai Lambda Optimal, serta GCV Minimum Prediktor Ke-1 Jumlah Knot 1
SKRIPSI
Titik Knot 60
Kombinasi Orde
GCV
Respon 1 Respon 2
Minimum
1
1
693.4911
ESTIMASI MODEL REGRESI...
Lambda 100
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 58
Jumlah Knot
1
2
3
4
Titik Knot
Kombinasi Orde
GCV
Respon 1 Respon 2
Minimum
Lambda
1
2
738.7294
1000
2
1
721.8352
1000
2
2
769.9759
1000
1
1
689.9469
76
1
2
745.6781
1000
2
1
707.6577
73
2
2
772.0771
84
1
1
687.0901
95
1
2
749.1611
1000
2
1
701.1939
179
2
2
769.1391
284
1
1
688.3006
158
50; 57,6;
1
2
752.1939
1000
63,8; 73,4
2
1
695.1142
343
2
2
763.7129
608
60
55,33; 65
50,5; 60; 70
Berdasarkan Tabel 4.1 nilai GCV minimum yang paling kecil dari beberapa kombinasi orde respon pertama dan respon kedua pada jumlah titik knot 4 bertambah besar daripada di jumlah titik knot 3 maka penambahan jumlah knot dihentikan. Sehingga nilai GCV minimum yang lebih kecil yaitu 687.0901 terletak pada jumlah titik knot sebanyak 3 di titik knot 50,5; 60; 70 dengan nilai lambda optimal 95 yang terdapat pada kombinasi orde respon pertama yaitu orde 1 dan orde respon kedua yaitu orde 1. Kombinasi orde polinomial pada respon pertama dan respon kedua, jumlah knot dan titik knot, serta nilai lambda optimal berdasarkan kriteria GCV minimum pada prediktor komponen nonparametrik kedua yaitu usia (Lampiran 11) ditampilkan pada Tabel 4.2 sebagai berikut :
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 59
Tabel 4.2 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, dan Nilai Lambda Optimal, serta GCV Minimum Prediktor Ke-2 Jumlah Knot
1
2
3
4
5
6
SKRIPSI
Titik Knot
Kombinasi Orde
GCV
Respon 1 Respon 2
Minimum
Lambda
1
1
566.9609
2
1
2
590.4973
1
2
1
569.2413
8
2
2
582.3961
1000
1
1
5
1
2
569.1749 607.8141
2
1
566.9604
25
2
2
586.7442
1000
1
1
557.4237
8
53; 60,5;
1
2
621.3194
6
70,75
2
1
574.6779
125
2
2
592.9409
1000
1
1
552.4698
9
49; 57,6;
1
2
635.4309
10
65,2; 72,2
2
1
577.1338
490
2
2
597.1745
1000
1
1
552.1594
11
1
2
633.7329
13
2
1
577.0646
547
2
2
599.2182
1000
1
1
552.1427
14
47; 53; 59;
1
2
638.7481
18
64; 70; 74
2
1
577.3606
757
2
2
601.9875
1000
60,5
55,33; 69
48.167; 55.33; 60.5; 69; 73
ESTIMASI MODEL REGRESI...
3
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 60
Jumlah Knot
7
Titik Knot
Kombinasi Orde
GCV
Respon 1 Respon 2
Minimum
Lambda
46,125; 53;
1
1
555.7744
17
57; 60,5;
1
2
641.0961
20
68,25; 70,75;
2
1
576.7996
827
74
2
2
603.0142
1000
Berdasarkan Tabel 4.2 nilai GCV minimum yang paling kecil dari beberapa kombinasi orde respon pertama dan respon kedua pada jumlah titik knot 7 bertambah besar daripada di jumlah titik knot 6 maka penambahan jumlah knot dihentikan. Sehingga nilai GCV minimum yang lebih kecil yaitu 552.1427 terletak pada jumlah titik knot sebanyak 6 di titik knot 47; 53; 59; 64; 70; 74 dengan nilai lambda optimal 14 yang terdapat pada kombinasi orde respon pertama yaitu orde 1 dan orde respon kedua yaitu orde 1. Kombinasi orde polinomial pada respon pertama dan respon kedua, jumlah knot dan titik knot, serta nilai lambda optimal berdasarkan kriteria GCV minimum pada prediktor komponen nonparametrik ketiga yaitu LDL (Lampiran 12) ditampilkan pada Tabel 4.3 sebagai berikut : Tabel 4.3 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, dan Nilai Lambda Optimal, serta GCV Minimum Prediktor Ke-3 Jumlah Knot
1
2
SKRIPSI
Titik Knot
41
35,33; 45,67
Kombinasi Orde
GCV
Respon 1 Respon 2
Minimum
Lambda
1
1
676.2053
21
1
2
721.1062
7
2
1
687.5927
1000
2
2
734.7972
1000
1
1
682.3386
1000
1
2
735.0219
1000
2
1
695.548
1000
2
2
751.5255
1000
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 61
Berdasarkan Tabel 4.3 nilai GCV minimum yang paling kecil dari beberapa kombinasi orde respon pertama dan respon kedua pada jumlah titik knot 2 bertambah besar daripada di jumlah titik knot 1 maka penambahan jumlah knot dihentikan. Sehingga nilai GCV minimum yang lebih kecil yaitu 676.2053 terletak pada jumlah titik knot sebanyak 1 di titik knot 41 dengan nilai lambda optimal 21 yang terdapat pada kombinasi orde respon pertama yaitu orde 1 dan orde respon kedua yaitu orde 1. Kombinasi orde polinomial pada respon pertama dan respon kedua, jumlah knot dan titik knot, serta nilai lambda optimal berdasarkan kriteria GCV minimum pada masing-masing prediktor ditampilkan secara keseluruhan pada Tabel 4.4 sebagai berikut : Tabel 4.4 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik Knot, serta Nilai Lambda Optimal Setiap Prediktor Variabel
Kombinasi Orde
Jumlah
Prediktor
Respon 1 Respon 2
Knot
Berat Badan (t1 )
1
1
3
Usia (t2 )
1
1
6
HDL (t3 )
1
1
1
Titik Knot 50,5; 60;
95
70 47; 53; 59; 64; 70; 74 41
Lambda
14 21
Berdasarkan Tabel 4.4 untuk prediktor pada komponen nonparametrik pertama yaitu berat badan (t1 ) bahwa GCV minimum terletak pada jumlah titik knot sebanyak 3 di titik knot 50,5; 60; 70 dengan nilai lambda optimal 95 yang terdapat pada kombinasi orde respon pertama yaitu orde 1 dan orde respon kedua yaitu orde 1. Pada prediktor komponen nonparametrik kedua yaitu usia (t2 ) bahwa GCV minimum terletak pada jumlah titik knot sebanyak 6 di titik knot 47; 53; 59; 64; 70; 74 dengan nilai lambda optimal 14 yang terdapat pada kombinasi orde respon pertama yaitu orde 1 dan orde respon kedua yaitu orde 1. Sedangkan
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 62
prediktor komponen nonparametrik ketiga yaitu LDL (t3 ) bahwa GCV minimum terletak pada jumlah titik knot sebanyak 1 di titik knot 41 dengan nilai lambda optimal 21 yang terdapat pada kombinasi orde respon pertama yaitu orde 1 dan orde respon kedua yaitu orde 1. Setelah didapatkan kombinasi orde polinomial respon 1 dan respon 2 serta jumlah titik knot, dan titik knot optimal pada masingmasing variabel prediktor maka dilakukan pemodelan berdasarkan kombinasi orde polinomial respon 1 dan respon 2 serta jumlah titik knot, dan titik knot optimal dengan nilai lambda optimal 59,13 sehingga didapatkan nilai residual dari respon pertama dan respon kedua seperti pada Lampiran 13 yang selanjutnya akan dilakukan uji heteroskedastisitas/homoskedastisitas diantara kedua residual tersebut. Analsis uji yang digunakan untuk menguji adanyan heteroskedastisitas pada matriks variansi kovariansi dilakuakan uji glesjer (Lampiran 6) dengan hipotesis sebagai berikut : 2 2 2 σ= = σ2 H 0 : σ= ... σ= n 1 2
H1 : minimal ada satu σ i2 ≠ σ 2 , dengan i = 1, 2,...,50
Berdasarkan hasil uji glesjer pada Lampiran 14 untuk matriks variansi kovariansi diperoleh nilai Fhitung sebesar 0,453 serta nilai p-value sebesar 0,997 maka dapat diambil keputusan untuk menerima H 0 sehingga dapat disimpulkan 2 2 2 bahwa terjadi kasus homoskedastisitas ( σ= σ= = ... σ= σ 2 ). n 1 2
Langkah berikutnya setelah dilakukan uji homoskedastisitas adalah mengestimasi model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline menggunakan pembobot W berdasarkan subbab 4.2.1 dengan program yang telah dibuat pada Lampiran 7. Estimasi model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline menggunakan pembobot W dilakuakan dengan menggnuakan kombinasi orde polinomial respon 1 dan respon 2 serta jumlah titik knot, dan titik knot optimal yang telah didapatkan sebelumnya yaitu untuk prediktor berat badan (t1i ) dengan
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 63
jumlah titik knot sebanyak 3 pada titik knot 50,5; 60; 70 serta kombinasi orde respon pertama yaitu orde 1 dan orde respon kedua yaitu orde 1, pada prediktor usia (t2i ) bahwa dengan jumlah titik knot sebanyak 6 pada titik knot 47; 53; 59; 64; 70; 74 serta kombinasi orde respon pertama yaitu orde 1 dan orde respon kedua yaitu orde 1, dan prediktor LDL (t3i ) dengan jumlah titik knot sebanyak 1 pada titik knot 41 serta kombinasi orde respon pertama yaitu orde 1 dan orde respon kedua yaitu orde 1. Estimasi model tekanan darah sistolik yang didapatkan dengan model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline dengan nilai lambda optimal 0.01 adalah sebagai berikut : yˆ (1) = (4,8266e − 15) + 98, 4014 + 0,1859 x1 − 0,3489t1 + 0,3149(t1 − 50,5) + + 0, 0646(t1 − 60) + − 0, 4170(t1 − 70) + + 1,5876t2 − 0, 7330(t2 − 47) +
(4.31) − 0, 6876(t2 − 53) + − 0, 4915(t2 − 59) + − 0,5155(t2 − 64) + − 0,1333(t2 − 70) + + 0,3975(t2 − 74) + − 0, 2753t3 − 0,1952(t3 − 41) + Berdasarkan persamaan (4.31) didapatakan masing-masing fungsi nonparametrik berdasarkan estimator spline pada setiap prediktor serta dapat diinterpretasikan secara lebih mudah dalam bentuk fungsi potongan. Fungsi potongan untuk prediktor pertama yaitu berat badan dinyatakan pada persamaan (4.32) dan persamaan (4.33) sebagai berikut : f (1) (t1 ) = −0, 3489t1 + 0, 3149(t1 − 50, 5) + + 0, 0646(t1 − 60) + − 0, 4170(t1 − 70) + (4.32)
−0,3489t1 −15,9025 − 0, 0340t1 (1) f (t1 ) = −19, 7785 + 0, 0306t1 9, 4115 − 0.3864t1
;
0 ≤ t1 < 50,5
; 50,5 ≤ t1 < 60 ;
60 ≤ t1 < 70
;
t1 ≥ 70
(4.33)
Fungsi potongan untuk prediktor kedua yaitu usia dinyatakan pada persamaan (4.34) dan persamaan (4.35) sebagai berikut : f (1) (t2 ) =1,5876t2 − 0, 7330(t2 − 47) + − 0, 6876(t2 − 53) + − 0, 4915(t2 − 59) + − 0,5155(t2 − 64) + − 0,1333(t2 − 70) + + 0,3975(t2 − 74) +
SKRIPSI
ESTIMASI MODEL REGRESI...
(4.34)
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 64
1,5876t2 34, 4510 + 0,8546t 2 70,8938 + 0,1670t2 (1) f (t2 ) 99,8923 − 0,3245t2 = 132,8843 − 0,8400t 2 142, 2153 − 0,9733t2 112,8003 − 0,5758t2
;
t2 < 47
; 47 ≤ t2 < 53 ; 53 ≤ t2 < 59 ; 59 ≤ t2 < 64
(4.35)
;64 ≤ t2 < 70 ;70 ≤ t2 < 74 ;
t2 ≥ 74
Fungsi potongan untuk prediktor ketiga yaitu HDL dinyatakan pada persamaan (4.36) dan persamaan (4.37) sebagai berikut : f (1) (t3 ) = −0, 2753t3 − 0,1952(t3 − 41) +
(4.36)
; t3 < 41 −0, 2753t3 f (1) (t3 ) = 8, 0032 − 0, 4705t3 ; t3 ≥ 41
(4.37)
Berdasarkan persamaan (4.31) dengan menggunakan potongan polinomial persamaan (4.33), persamaan (4.35), dan persamaan (4.37), diketahui bahwa setiap kenaikan kadar LDL sebesar 1 satuan mg/dL akan meningkatkan tekanan darah sistolik sebesar 0,1859 mmHg. Tekanan darah sistolik pada pasien dengan berat badan 60 kg sampai kurang dari 70 kg setiap kenaikan berat badan 1 kg mengakibatkan kenaikan sebesar 0,0306 mmHg. Pada pasien berusia kurang dari 47 tahun setiap pertambahan usia 1 tahun mengakibatkan kenaikan sebesar 1,5876 mmHg, pada pasien berusia 47 tahun sampai kurang dari 53 tahun setiap pertambahan usia 1 tahun mengakibatkan kenaikan sebesar 0,8546 mmHg, pada pasien berusia 53 tahun sampai kurang dari 59 tahun setiap pertambahan usia 1 tahun mengakibatkan kenaikan sebesar 0,1670 mmHg. Sedangkan pada pasien dengan kadar HDL kurang dari 41 mg/dL setiap kenaikan kadar HDL 1 satuan mg/dL megalami penurunan sebesar 0,2753 mmHg, pada pasien dengan kadar HDL lebih dari sama dengan 41 mg/dL setiap kenaikan kadar HDL 1 satuan mg/dL mengakibatkan megalami penurunan sebesar 0,4705 mmHg. Untuk menduga tekanan darah sistolik gambarannya yaitu jika ingin mengetahui tekanan darah sistolik pasien berusia 58 tahun dengan berat badan 55
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 65
kg, serta LDL 113 mg/dL dan HDL 35 mg/dL maka perhitungannya dilakukan dengan cara melihat interval 50,5 ≤ t1 < 60 pada f (1) (t1 ) , interval 53 ≤ t2 < 59 pada f (1) (t2 ) , dan interval t3 < 41 pada f (1) (t3 ) sehingga nilai estimasi tekanan darah
sistolik
pasien
tersebut
yˆ = (4,8266e − 15) + 98, 4014 + 0,1859 (113)
+ {−15,9025 − 0, 0340 ( 55 )} + {70,8938 + 0,1670 ( 58 )} + {−0, 2753 ( 35 )}
adalah
172,5799 ≈ 173 mmHg. Sedangkan estimasi model tekanan darah diastolik yang didapatkan dengan model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline dengan nilai lambda optimal 0.01 adalah sebagai berikut : yˆ (2) = −(1, 0826e − 14) + 70,1469 + 0,1129 x1 − 0,5043t1 + 0,3804(t1 − 50,5) + + 0, 6259(t1 − 60) + − 0, 6036(t1 − 70) + + 0, 6729t2 − 0,5412(t2 − 47) +
(4.38) − 0, 0042(t2 − 53) + − 0, 0717(t2 − 59) + − 0, 6859(t2 − 64) + + 0, 2915(t2 − 70) + − 0, 0483(t2 − 74) + + 0, 0875t3 − 0, 2237(t3 − 41) + Berdasarkan persamaan (4.38) didapatakan masing-masing
fungsi
nonparametrik berdasarkan estimator spline pada setiap prediktor serta dapat diinterpretasikan secara lebih mudah dalam bentuk fungsi potongan. Fungsi potongan untuk prediktor pertama yaitu berat badan dinyatakan pada persamaan (4.39) dan persamaan (4.40) sebagai berikut : f (2) (t1 ) = −0, 5043t1 + 0, 3804(t1 − 50, 5) + + 0, 6259(t1 − 60) + − 0, 6036(t1 − 70) + (4.39)
−0,5043t1 −19, 2102 − 0,1239t 1 f (2) (t1 ) = −56, 7642 + 0,5020t1 −14,5122 − 0.1016t1
;
0 ≤ t1 < 50,5
; 50,5 ≤ t1 < 60 ;
60 ≤ t1 < 70
;
t1 ≥ 70
(4.40)
Fungsi potongan untuk prediktor kedua yaitu usia dinyatakan pada persamaan (4.41) dan persamaan (4.42) sebagai berikut : f (2) (= t2 ) 0, 6729t2 − 0,5412(t2 − 47) + − 0, 0042(t2 − 53) + − 0, 0717(t2 − 59) + − 0, 6859(t2 − 64) + + 0, 2915(t2 − 70) + − 0, 0483(t2 − 74) +
SKRIPSI
ESTIMASI MODEL REGRESI...
(4.41)
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 66
0, 6729t2 25, 4364 + 0,1317t2 25, 6590 + 0,1257t2 (2) = f (t2 ) 29,8892 + 0, 0558t2 73, 7869 − 0, 6301t 2 53,3819 − 0,3386t2 56,9561 − 0,3869t2
;
t2 < 47
; 47 ≤ t2 < 53 ; 53 ≤ t2 < 59 ;59 ≤ t2 < 64
(4.42)
;64 ≤ t2 < 70 ;70 ≤ t2 < 74 ;
t2 ≥ 74
Fungsi potongan untuk prediktor ketiga yaitu HDL dinyatakan pada persamaan (4.43) dan persamaan (4.44) sebagai berikut : f (2) (t3 ) =0, 0875t3 − 0, 2237(t3 − 41) +
(4.43)
; t3 < 41 0, 0875t3 f (2) (t3 ) = 9,1717 − 0,1326t3 ; t3 ≥ 41
(4.44)
Berdasarkan persamaan (4.38) dengan menggunakan potongan polinomial persamaan (4.40), persamaan (4.42), dan persamaan (4.44), setiap kenaikan kadar LDL sebesar 1 satuan mg/dL akan meningkatkan tekanan darah diastolik sebesar 0,1129 mmHg. Tekanan darah diastolik pada pasien dengan berat badan 60 kg sampai kurang dari 70 kg setiap kenaikan berat badan 1 kg mengakibatkan kenaikan sebesar 0,5020 mmHg. Pada pasien berusia kurang dari 47 tahun setiap pertambahan usia 1 tahun mengakibatkan kenaikan sebesar 0,6729 mmHg, pada pasien berusia 47 tahun sampai kurang dari 53 tahun setiap pertambahan usia 1 tahun mengakibatkan kenaikan sebesar 0,1317 mmHg, pada pasien berusia 53 tahun sampai kurang dari 59 tahun setiap pertambahan usia 1 tahun mengakibatkan kenaikan sebesar 0,1257 mmHg, pada pasien berusia 59 tahun sampai kurang dari 64 tahun setiap pertambahan usia 1 tahun mengakibatkan kenaikan sebesar 0,0558 mmHg. Sebaliknya pada pasien dengan kadar HDL lebih dari sama dengan 41 mg/dL setiap kenaikan kadar HDL 1 satuan mg/dL mengakibatkan megalami penurunan sebesar 0,1326 mmHg. Penelitian oleh Dasha Braverman dkk, (2014) menjelaskan bahwa semakin tinggi kadar kolesterol LDL dalam tubuh, semakin besar risiko mengidap penyakit
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 67
Hipertensi dan Jantung koroner, berbagai penyakit tersebut merupakan faktor resiko tekanan darah yang tinggi, dan sebaliknya semakin tinggi kadar kolesterol HDL dalam tubuh, semakin kecil resiko tekanan darah yang tinggi. Penelitian lain terkait faktor tekanan darah antara lain Anggara (2013) yang menyimpulkan bahwa berat badan berpengaruh terhadap tekanan darah seseorang, hal ini karena kegemukan (obesitas) merupakan ciri khas dari populasi hipertensi, dan dibuktikan bahwa faktor ini memiliki kaitan erat dengan terjadinya hipertensi di kemudian hari, serta tekanan darah dewasa cenderung meningkat seiring dengan pertambahan usia, hal ini mendukung hasil yang didapatkan. Untuk menduga tekanan darah diastolik gambarannya yaitu jika ingin mengetahui tekanan darah sistolik pasien berusia 58 tahun dengan berat badan 55 kg, serta LDL 113 mg/dL dan HDL 35 mg/dL maka perhitungannya dilakukan dengan cara melihat interval 50,5 ≤ t1 < 60 pada f (2) (t1 ) , interval 53 ≤ t2 < 59 pada f (2) (t2 ) , dan interval t3 < 41 pada f (2) (t3 ) sehingga nilai estimasi tekanan darah diasitolik pasien tersebut
yˆ = −(1, 0826e − 14) + 70,1469 + 0,1129 (113)
+ {−19, 2102 − 0,1239 ( 55 )} + {25, 6590 + 0,1257 ( 58 )} + {0, 0875 ( 35 )}
adalah
86,7670 ≈ 87 mmHg. Setelah didapatkan model terbaik pada persamaan (4.31) dan (4.38), diperoleh nilai MSE sebesar 136,5604 dan diperoleh nilai R-square sebesar 0,9123 dan dapat diartikan bahwa pengaruh variabel prediktor yang diamati terhadap variabel respon adalah sebesar 91,23% sehingga dari hasil tersebut menunjukkan model yang diperoleh sudah baik untuk menghitung tekanan darah pada data insample. Model estimasi yang diperoleh tidak dapat digambarkan secara keseluruhan karena membutuhkan ruang dimensi lebih dari tiga. Namun dari model estimasi yang diperoleh, selanjutnya dapat diplotkan hasil pengamatan (observasi) serta nilai estimasi tekanan darah sistolik untuk mengetahui seberapa jauh jarak antara hasil data observasi serta nilai estimasi dapat dilihat pada Gambar 4.4 sebagai berikut :
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 68
Gambar 4.4 Plot Observasi dan Estimasi pada Tekanan Darah Sistolik Data Insample
Plot hasil pengamatan (observasi) serta nilai estimasi tekanan darah diastolik dapat dilihat pada Gambar 4.5 sebagai berikut :
Gambar 4.5 Plot Observasi dan Estimasi pada Tekanan Darah Diastolik Data Insample
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 69
Estimasi pada data outsample dilakukan dengan menggunakan model yang telah diperoleh berdasarkan estimasi pada data insample. Langkah awal untuk estimasi pada data outsample adalah merumuskan data variabel prediktor komponen parametrik pada matrik X dan
data setiap variabel prediktor
komponen nonparametrik pada matrik Z yang kemudian mendapatkan nilai ˆ , θˆ dan Φ ˆ merupakan nilai dugaan parameter yang telah didapatkan yˆ = Xθˆ + ZΦ dari estimasi data insample. Estimasi dilakukan dengan menggunakan program
yang telah dibuat pada Lampiran 8. Berdasarkan hasil analisis 15 data outsample pada Lampiran 16, didapat nilai dugaan masing-masing yi yang kemudian diperoleh nilai MSE sebesar 254,2364 dan diperoleh nilai R-square sebesar 76,71% sehingga dari hasil tersebut menunjukkan model yang diperoleh sudah baik untuk menghitung tekanan darah pada data outsample. Plot hasil pengamatan (observasi) serta nilai estimasi tekanan darah sistolik pada data outsample dapat dilihat pada Gambar 4.6 sebagai berikut :
Gambar 4.6 Plot Observasi dan Estimasi pada Tekanan Darah Sistolik Data Outsample
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 70
Sedangkan plot hasil pengamatan (observasi) serta nilai estimasi tekanan darah diastolik pada data outsample dapat dilihat pada Gambar 4.7 sebagai berikut :
Gambar 4.7 Plot Observasi dan Estimasi pada Tekanan Darah Sistolik Data Outsample
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
BAB V KESIMPULAN DAN SARAN
5.1
Kesimpulan Berdasarkan hasil dan pembahasan yang telah diuraikan pada BAB 4 dapat
diperoleh kesimpulan sebagai berikut : 1. Model regrsi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline yaitu y= Xθ + ZΦ + ε dengan = y
y y ) ; y (= (1)
X(1) X= 0
(r )
(2) T
(r )
Z (1) 0 (r ) ; Z = Z = ( 2) 0 Z Zi(r) = 1 τ1( r ) = τ(wr ) twi
x3 xn ) ; T
x2
x2i x pi ,
θ ) ; θ (θ= (θ (1)
( y1( r ) , y 2( r ) ,..., y n( r ) )T ,
0 (r ) ; X = ( x1 X(2)
xi = 1 x1i
= θ
T
(2)
(r ) v0
θ1( r ) θ 2( r ) ... θ p( r ) ) , T
(Z
(r) 1
Z (2r )
Z3( r ) Z (nr ) ) ; T
τ(2r ) τ(qr ) ;
twi2 twid w
(twi − ξ w1 ) d w
(twi − ξ w 2 ) d w
(
(twi − ξ wk ) d w ,
Φ = ( Φ (1) Φ (2) ) ; Φ ( r ) = θ w( r0) α1( r ) β1( r ) α 2( r ) β 2( r ) (r ) (r ) (r ) (r ) (r ) (r ) (r ) (r ) θ= α10 + α 20 + ... + α q 0 ; α w = α w1 α w 2 ... α wd w0 T (r ) (r ) (r ) (r ) β w = β w1 β w 2 ... β wk , dan T
(
(
= ε
)
β q( r ) ) ; T
)
ε ε ) ; ε (= (1)
... α q( r ) T ;
(2) T
i = 1, 2,..., n ,
(r )
(ε1( r ) , ε 2( r ) ,..., ε n( r ) )T
v = 1, 2,..., p ,
w = 1, 2,..., q ,
serta
r = 1, 2 .
Proses
pengestimasian dilakukan dengan menggunakan matrik pembobot variansi kovariansi untuk meminimumkan jumlah kuadrat residual
SKRIPSI
71 ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 72
sedemikian sehingga diperoleh estimasi model regresi semiparametrik birepson multiprediktor berdasaarkan estimator penalized spline adalah
(
yˆ = Cy + Z ZT WZ + nλD dengan
(
)
−1
C= X XT ( I − A ) ( I − A ) X T
(
= A Z ZT WZ + nλD
)
−1
ZT W ( I − C ) y
)
−1
XT ( I − A ) ( I − A ) ; T
ZT W .
2. Penerapan algoritma dan program pengestimasian model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline pada data tekanan darah pasien di RSU Haji Surabaya memberikan hasil bahwa titik dimana terjadi pola perubahan perilaku tekanan darah pasien berada pada berat badan 50,5 kg; 60 kg; 70 kg, usia 47 tahun; 53 tahun; 59 tahun; 64 tahun; 70 tahun; 74 tahun, dan HDL 41 mg/dL dengan diperoleh MSE sebesar 136,5604 dan diperoleh nilai R-square sebesar 91,23% untuk data.
5.2
Saran Berdasarkan hasil yang diperoleh dalam skripsi ini, saran yang diberikan
untuk penelitian selanjutnya sebagai berikut : 1. Secara teori perlu dikembangkan estimasi model regresi seiparametrik birespon multiprediktor berdasarkan estimator penalized spline pada data longitudinal. 2. Secara terapan disarankan menambahkan variabel prediktor lain yang yaitu faktor fisiologis diantaranya adalah volume darah, kekuatan gerak jantung, viscositas darah, ataupun kapasitas pembuluh darah serta faktor eksternal seperti stress, pola makan, ataupun kebiasaan merokok.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 73
DAFTAR PUSTAKA
Andriani, H., Wibowo, W., and Rahayu, S. P., 2015, Penalized Spline Estimator In Nonparametrik Regression, Proceedings of the IConSSE FSM SWCU (2015), pp. MA.1–4 , ISBN: 978-602-1047-21-7. Budiantara, I. N., 2012, Penelitian Bidang Regresi Spline Menuju Terwujudnya Penelitian Statistika Yang Mandiri Dan Berkarakter, Denpasar: Seminar Nasional FMIPA Undiksha Denpasar. Chamidah, N., and Eridani, 2015, Designing of Growth Reference Chart by Using Birespon Semiparametrik Regression Approach Based on P-Spline Estimator, International Journal of Applied Mathematics and Statistics, Int. J. Appl. Math. Stat.; 53 (3); 2015, ISSN 0973-1377. Didi. 2014. http//:didi.staff.gunadarma.ac.id/Downloads/files/13706/BabII .pdf. (Diakses pada 10 Oktober 2016). Fernandes, A., 2014, Spline Estimator for Bi-responses Nonparametrik Regression Model for Longitudinal Data, Surabaya : Applied Mathematical Sciences; 8 (114); 2014. ISBN : 5653-5665. Greene, W., 2003, Econometric Analysis Fifth Edition, NewYork : Prentice Hall. Griggs, W., 2013, Penalized Spline Regression and its Applications, Wangshington D. C. : Whitman College. Hintze, J. L., 2007, User’s Guide IV:Multivariate Analysis, Clustering, Meta Analysis, Forecasting / Time Series, Operations Research, Mass Appraisal, Utah : NCSS Statistical System. Juliandari, N. dan Budiantara, I. N. , 2014, Pemodelan Angka Harapan Hidup dan Angka Kematian Bayi di Jawa Timur dengan Pendekatan Regresi Nonparametrik Spline Birespon, http://digilib.its.ac.id/public/ITS-paper34916-1309100048-Paper.pdf. (Diakses pada 23 September 2016). Maziyya, P. A., Sukarsa, I. K. G., dan Asih, N. M., 2015, Mengatasi Heteroskedastisitas Pada Regresi Dengan Menggunakan Weighted Least Square, Jurnal Matematika; 4 (1); 2015, ISSN:2303-1751. Mersi, C., dan Andrianto, D., 2016, Analisis Pengaruh LDL terhadap Tekanan Darah pada Penderita Hipertensi dengan Pendekatan Regresi Nonparametrik Berdasarkan Estimator Penalized Spline, dalam PKM-AI yang didanai DIKTI tahun 2016.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 74
Montoya, E. L., N. Ulloa, and V. Miller, 2014, A Simulation Study Comparing Knot Selection Methods With Equally Spaced Knots in a Penalized Regression Spline, International Journal of Statistics and Probability; 3 (3); 2014, ISSN 1927-7032, E-ISSN 1927-7040. Oktaviana, D., dan Budiantara, I N., 2011, Regresi Spline Birespon Untuk Memodelkan Kadar Gula Darah Penderita Diabetes Melitus, http://digilib.its.ac.id/public/ITS-paper-19523-1307100068-Paper.pdf. (Diakses pada 23 September 2016). Palmer. A., 2007, Tekanan Darah Tinggi, Jakarta: Erlangga. Pütz, P., and T. Kneib, 2016, A Penalized Spline Estimator for Fixed Effects Panel Data Models, Germany : German Socio-Economic Panel (SOEP). Rasmussen, S., 2006, An Introduction to Statistics with Data Analysis. Belmont : Brooks/Cole. Ricky, N. A., 2014, Estimasi Model Regresi Nonparametrik Menggunakan Radial Smoothing Berdasarkan Estimator Penalized Spline, Surabaya : Skripsi Fakultas Sains dan Teknologi Universitas Airlangga. Ruhana, U. T., 2016, Estimasi Model Regresi Semiparametrik Birespon Pada Data Longitudinal Berdasarkan Estimator Spline Truncated, Surabaya : Skripsi Fakultas Sains dan Teknologi Universitas Airlangga. Ruppert, D., Wand, M. P., and Carrol, R. J., 2003. Cambridge Series in Statistical and Probabilistic Mathematics: Semiparametrik Regression. New York: Cambridge University Press. Salam, N., 2013, Estimasi Likelihood Maximum Penalized dari Model Regresi Semiparametrik, Prosiding Seminar Nasional Statistika Universitas Diponegoro 2013, ISBN : 978-602-14387-0-1. Sari, R. P., 2016, Estimasi Model Regresi Nonparametrik Bi-Response Pada Data Longitudinal Berdasarkan Estimator Weighted Spline Truncated, Surabaya : Skripsi Fakultas Sains dan Teknologi Universitas Airlangga. Sawitzki, G., 2009, Computational Statistics: An Introduction to R, Journal of Statistical Software; 32 (2); 2009. ISBN : 978-1-4200-8678-2. Setyawan, N. dan I N. Budiantara., 2011, Nonparametrik Biresponse Spline Regression Approach on Modeling Determinants of Education Outcome in Papua Island. http://digilib.its.ac.id/public/ITS-Master-18993-Paper3221676.pdf. (Diakses pada 23 September 2016).
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA 75
Walpole, R. E, Raymond H. M., Sharon, L. M., and Keying Y., 2012, Probability and Statistics for Engineers and Scientists Ninth Edition, United States of America : Pearson Education Publisher. Welsh, A. H. and Yee, T. W., 2006, Local Regression for Vector Responses, Journal of Statistical Planning and Inference 136; 2006, 3007 – 3031. WHO, 1995, Clinical’s Manual Hypertension and the Elderly, London: Science Press. Wibowo, W., S. Haryatmi, dan I. N. Budiantara, 2013, Kajian Metode Estimasi Parameter dalam Regresi Semiparametrik Spline, Jurnal Berkala MIPA, 23(1), Januari 2013. Wood, S. N., and Augustin, N. H., 2002, GAMs with Integrated Model Selection Using Penalized Regression Spline and Applications to Environmental Modelling, Jurnal of Ecological Modelling 157; 2002, 157-177. Wulandari I. dan I N. Budiantara., 2014, Analisis Faktor-Faktor yang Mempengaruhi Persentase Penduduk Miskin dan Pengeluaran Perkapita Makanan di Jawa Timur menggunakan Regresi Nonparametrik Birespon Spline, Surabaya : Jurnal Sains dan Seni POMITS; 3 (1); 2014. ISBN : 2337-3520. Yolandika, B., 2011, Estimasi Model Regresi Nonparametrik Birespon Berdasarkan Estimator Penalized Spline, Surabaya : Skripsi Fakultas Sains dan Teknologi Universitas Airlangga.
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 1. Data Insample Tekanan Darah Pasien dan Variabel Prediktor RSU Haji Surabaya No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
SKRIPSI
Y1 170 200 160 168 160 200 180 160 160 140 110 170 140 140 140 150 160 160 150 180 190 160 150 184 170 150 190 170 180 150 180 200 160 160 140
Y2 110 90 110 81 90 110 90 90 100 90 80 90 80 90 80 90 90 80 80 110 100 90 90 87 110 80 100 100 110 90 100 130 90 90 90
x1
t1
t2
t3
150 123 147 101 109 187 114 211 179 137 157 117 130 154 132 137 112 150 58 141 120 111 130 95 146 128 166 122 138 95 165 145 162 94 76
70 60 58 58 50 65 66 57 70 165 149 65 45 90 63 65 50 57 60 65 72 76 60 70 90 85 75 73 80 75 45 47 55 50 54
54 60 57 70 70 62 71 71 57 64 73 74 84 40 73 69 50 55 62 48 53 39 69 53 69 72 49 59 60 78 56 64 58 53 74
42 38 62 43 51 44 39 41 33 35 98 24 49 54 52 63 36 35 30 40 35 37 46 32 33 34 36 31 33 32 32 44 42 59 45
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
No. 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
Y1 190 90 145 180 150 140 180 160 170 170 150 150 200 200 160
Y2 100 60 80 80 100 80 100 90 100 90 90 100 100 90 90
x1
t1
t2
t3
121 57 121 131 182 45 138 120 157 126 103 122 217 173 148
45 50 52 49 56 48 60 45 60 62 90 50 58 50 55
80 15 42 82 75 37 46 61 47 67 39 82 69 59 49
41 59 46 50 55 25 48 46 40 45 22 34 74 34 64
Sumber : Rekam Medis Pasien Rawat Inap RSU Haji Surabaya 2015 Keteragan : Y 1 , merupakan tekanan darah sistolik
(mmHg)
Y 1 , merupakan tekanan darah diastolik (mmHg)
x 1, merupakan kadar lemak jahat atau Low Density Lipoprotein (LDL) (mg/dL) t 1 , merupakan berat badan (Kg) t 2 , merupakan usia (Tahun) t 3 , merupakan kadar lemak baik atau High Density Lipoprotein (HDL) (mg/dL)
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 2. Data Outsample Tekanan Darah Pasien dan Variabel Prediktor RSU Haji Surabaya No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Y1 180 133 110 150 140 140 140 184 130 170 140 160 140 150 140
Y2 110 83 80 80 90 90 90 87 70 100 80 90 90 90 90
x1
t1
t2
t3
141 80 157 58 137 171 165 95 131 157 45 94 139 176 110
65 63 149 60 165 60 68 70 45 60 48 50 70 50 63
48 65 73 62 64 73 69 53 75 47 37 53 69 68 64
40 27 98 30 35 55 56 32 60 40 25 59 35 33 32
Sumber : Rekam Medis Pasien Rawat Inap RSU Haji Surabaya 2015 Keteragan : Y 1 , merupakan tekanan darah sistolik
(mmHg)
Y 1 , merupakan tekanan darah diastolik (mmHg)
x 1, merupakan kadar lemak jahat atau Low Density Lipoprotein (LDL) (mg/dL) t 1 , merupakan berat badan (Kg) t 2 , merupakan usia (Tahun) t 3 , merupakan kadar lemak baik atau High Density Lipoprotein (HDL) (mg/dL)
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 3. Program Uji Korelasi Pearson korelasi<-function(data) { cat("\nUJI KORELASI PEARSON\n") cat("==============================================") alfa<-as.numeric(readline("\n\nInput nilai alfa : ")) y1<-data[,1] y2<-data[,2] M<-length(y1) n<-M sy1y2<-sum(y1*y2)-(M*mean(y1)*mean(y2)) sy1<-sqrt(sum(y1^2)-(M*(mean(y1))^2)) sy2<-sqrt(sum(y2^2)-(M*(mean(y2))^2)) korelasi<-sy1y2/(sy1*sy2) cat("\nkoefisien korelasi:",korelasi,"\n") t<-(korelasi*sqrt(M-2))/sqrt(1-(korelasi^2)) v<-M-2 ttabel<-qt(1-(alfa/2),v) cat("hipotesis:\n") cat("H0 : rho = 0\n") cat("H1 : rho != 0\n") p_value=round(2*pt(abs(t),v,lower.tail=FALSE),4) cat("\n========================================","\n") cat("nilai P-value = ",p_value,"\n") cat("==========================================","\n") cat("\nkesimpulan:\n") if(p_value
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 4. Program Identifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Setiap Prediktor mp<-function(x,eps=1e-006) { x<-as.matrix(x) xsvd<-svd(x) diago<-xsvd$d[xsvd$d>eps] if(length(diago)==1) { xplus
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
k=k+1 prediktor=data[,3] vl<-seq(bb,ba,h) nvl<-length(vl) GCV<-rep(0,nvl) MSE<-rep(0,nvl) n<-nrow(data) dataurut<-data[order(prediktor),1:3] x<-dataurut[,3] y<-c(dataurut[,1],dataurut[,2]) z<-k+1 r<-quantile(x,seq(0,1,by=1/z)) lr<-length(r) R<-r[-lr] RR<-R[-1] cat("Jumlah Knot = ",k,"\n") for(i in 1:k) { cat("titik knots[",i,"] = ",RR[i],"\n") } p<-matrix(0,(P*P),2) p[,2]<-rep((1:P),P) for(i in 1:P) { c<-rep(i,P) p[((P*(i-1)+1):(P*i)),1]=c } pmax<-rep(0,2) gm<-rep(0,(n+1)) GCVmin<-rep(0,(P*P)) bopt<-rep(0,(P*P)) for(m in 1:(P*P)) { cat("\nORDE respon 1 :",p[m,1],"; ORDE respon :",p[m,2],"\n") for (r in 1:nvl) { Z1<-matrix(0,M,(p[m,1]+k)) v11<-matrix(0,M,(p[m,1])) v21<-matrix(0,M,k) for(s in 1:(p[m,1])) { v11[,s]<-x^(s) v11[,(p[m,1])]<-x^(p[m,1]) } for(j in 1:k) { v21[,j]<-trun(x,RR[j],p[m,1]) } Z1[,1:(p[m,1]+k)]<-cbind(v11,v21) Z2<-matrix(0,M,(p[m,2]+k)) v12<-matrix(0,M,(p[m,2])) v22<-matrix(0,M,k) for(s in 1:(p[m,2])) { v12[,s]<-x^(s)
SKRIPSI
ESTIMASI MODEL REGRESI...
2
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
v12[,(p[m,2])]<-x^(p[m,2]) } for(j in 1:k) { v22[,j]<-trun(x,RR[j],p[m,2]) } Z2[,1:(p[m,2]+k)]<-cbind(v12,v22) ZZ<-rep(1,M) ZA<-cbind(ZZ,Z1) ZB<-cbind(ZZ,Z2) ZC<-matrix(0,M,((p[m,2]+k)+1)) ZD<-matrix(0,M,((p[m,1]+k)+1)) A<-cbind(ZA,ZC) B<-cbind(ZD,ZB) Z<-rbind(A,B) d1<-rep(0,(p[m,1]+1)) d2<-rep(0,(p[m,2]+1)) d3<-rep(1,k) D1<-c(d1,d3) D2<-c(d2,d3) d0<-c(D1,D2) D<-diag(d0) betatopi<-mp(t(Z)%*%Z+(M*vl[r]*D))%*%t(Z)%*%y ytopi<-Z%*%betatopi H<-Z%*%mp(t(Z)%*%Z+(n*vl[r]*D))%*%t(Z) MSE[r]<-(t(y-ytopi)%*%(y-ytopi))/M GCV[r]<-MSE[r]/(1-((1/M)*sum(diag(H))))^2 }#tutup lambda mlamda<-cbind(vl,GCV,MSE) GCVmin[m]<-min(GCV) win.graph() plot(vl,GCV,type="l",xlim=c(min(vl),max(vl)),ylim=c(min(GCV),max(G CV)),xlab="Lambda",ylab="GCV") title("Plot Lambda Terhadap GCV",sub=paste("\n*untuk orde respon : ",p[m,1]," dan ",p[m,2]," ; jumlah knot = ",k),cex.sub = 0.75, font.sub = 3, col.sub = "red") bopt[m]<-mlamda[mlamda[,2]==GCVmin[m],1] MSEE<-mlamda[mlamda[,2]==GCVmin[m],3] cat(" Nilai MSE = ",MSEE,"\n") cat(" Nilai GCV minimum = ",GCVmin[m],"\n") cat("Nilai Lambda Optimal saat GCV Minimum = ",bopt[m],"\n") betatopii<-mp(t(Z)%*%Z+(M*bopt[m]*D))%*%t(Z)%*%y ytopii<-Z%*%betatopii error<-y-ytopii ee<-cbind(ytopii,error) MSE<-(t(y-ytopii)%*%(y-ytopii))/length(y) JKT<-t(y-(mean(y)))%*%(y-(mean(y))) JKG<-t(y-ytopii)%*%(y-ytopii) RK<-1-(JKG/JKT) ER<-matrix(0,M,2) ER[,1]<-error[1:M] ER[,2]<-error[(M+1):(2*M)] }#tutup orde for(a in 1:(P*P)) { if(GCVmin[a]==min(GCVmin))
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
{ kecilGCV[k+1]<-GCVmin[a] boptmaxx[k]<-bopt[a] pmaxx[k]<-a } } if(kecilGCV[k+1]>kecilGCV[k]) { kmax<-k-1 boptmax<-boptmaxx[k-1] pmax<-pmaxx[k] cat("\n\nOptimal") cat("\nNilai GCV minimum adalah",kecilGCV[k]) cat("\npada nilai lambda optimal = ",boptmax) cat("\nsaat orde respon 1 :",p[pmax,1],"\n") cat("dan orde respon 2 :",p[pmax,2],"\n") lr<-kmax+2 z<-kmax+1 r<-quantile(x,seq(0,1,by=1/z)) lr<-length(r) R<-r[-lr] RR<-R[-1] k<-kmax cat("Jumlah Knot = ",kmax,"\ndengan ") for(i in 1:k) { cat("titik knots[",i,"] = ",RR[i],"\n") } Z1<-matrix(0,M,(p[m,1]+k)) v11<-matrix(0,M,(p[m,1])) v21<-matrix(0,M,k) for(s in 1:(p[m,1])) { v11[,s]<-x^(s) v11[,(p[m,1])]<-x^(p[m,1]) } for(j in 1:k) { v21[,j]<-trun(x,RR[j],p[m,1]) } Z1[,1:(p[m,1]+k)]<-cbind(v11,v21) Z2<-matrix(0,M,(p[m,2]+k)) v12<-matrix(0,M,(p[m,2])) v22<-matrix(0,M,k) for(s in 1:(p[m,2])) { v12[,s]<-x^(s) v12[,(p[m,2])]<-x^(p[m,2]) } for(j in 1:k) { v22[,j]<-trun(x,RR[j],p[m,2]) } Z2[,1:(p[m,2]+k)]<-cbind(v12,v22) ZZ<-rep(1,M) ZA<-cbind(ZZ,Z1)
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
ZB<-cbind(ZZ,Z2) ZC<-matrix(0,M,((p[m,2]+k)+1)) ZD<-matrix(0,M,((p[m,1]+k)+1)) A<-cbind(ZA,ZC) B<-cbind(ZD,ZB) Z<-rbind(A,B) d1<-rep(0,(p[m,1]+1)) d2<-rep(0,(p[m,2]+1)) d3<-rep(1,k) D1<-c(d1,d3) D2<-c(d2,d3) d0<-c(D1,D2) D<-diag(d0) betatopiii<-mp(t(Z)%*%Z+(M*boptmax*D))%*%t(Z)%*%y ytopiii<-Z%*%betatopiii errorfix<-y-ytopiii ee<-cbind(ytopiii,errorfix) cat("\nPenduga Parameter : ") cat("\n") for(m in 1:((p[pmax,1]+kmax)+1)) { cat("\nNilai Phi-topi [",m,"] Model 1= ",format(betatopiii[m])) } for(m in ((p[pmax,1]+kmax)+2):(((p[pmax,1]+kmax)+1)+ ((p[pmax,2]+kmax)+1))) { cat("\nNilai Phi-topi [",m-((p[pmax,1]+kmax)+1),"] Model 2= ",format(betatopiii[m])) } cat("\n\n\tHasil Estimasi:\n\tytopi\t\terror\n") print(ee) cat("\n") MSE<-(t(y-ytopiii)%*%(y-ytopiii))/length(y) cat("MSE=",MSE,"\n") JKT<-t(y-(mean(y)))%*%(y-(mean(y))) JKG<-t(y-ytopiii)%*%(y-ytopiii) RK<-1-(JKG/JKT) cat("R-square=",RK,"\n") ERfix<-matrix(0,M,2) ERfix[,1]<-errorfix[1:M] ERfix[,2]<-errorfix[(M+1):(2*M)] break } else { cat("lanjut tambah jumlah knot\n\n") } }#tutup repeat k } spline(data)
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 5. Program Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (Tanpa Pembobot) mp<-function(x,eps=1e-006) { x<-as.matrix(x) xsvd<-svd(x) diago<-xsvd$d[xsvd$d>eps] if(length(diago)==1) { xplus
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
dataurut<-matrix(0,M,q) t<-matrix(0,M,q) RR<-matrix(0,max(k),q) prediktor=data[,(para+3):kolom] dataA=as.matrix(prediktor) p<-cbind(orde1,orde2) r<-matrix(0,max(lr),q) R<-matrix(0,(max(lr)-1),q) for(i in 1:q) { dataurut[,i]<-sort(dataA[,i]) t[,i]<-dataurut[,i] if(lr[i]<max(lr)) { r[1:lr[i],i]<-quantile(t[,i],seq(0,1,by=1/z[i])) r[(lr[i]+1):max(lr),i]<-0 } else { r[,i]<-quantile(t[,i],seq(0,1,by=1/z[i])) } R[,i]<-r[-lr[i],i] RR[,i]<-R[-1,i] } for (i in 1:q) { cat("\nPrediktor ke-",i) cat("\nORDE respon 1 :",p[i,1],"; ORDE respon 2 :",p[i,2],"\n") for(j in 1:k[i]) { cat("titik knot [",j,"] = ",RR[j,i],"\n") } } y<-c(data[,1],data[,2]) vl<-seq(bb,ba,h) nvl<-length(vl) GCV<-rep(0,nvl) MSE<-rep(0,nvl) for (r in 1:nvl) { Z1<-matrix(0,M,(sum(p[,1])+sum(k))) for(u in 1:q) { v11<-matrix(0,M,(p[u,1])) v21<-matrix(0,M,(k[u])) for(s in 1:p[u,1]) { v11[,s]<-dataA[,u]^(s) v11[,(p[u,1])]<-dataA[,u]^(p[u,1]) } for(j in 1:k[u]) { v21[,j]<-trun(dataA[,u],RR[j,u],p[u,1])
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
} if(u==1) { Z1[,1:(p[u,1]+k[u])]<-cbind(v11,v21) } else { Z1[,((sum(p[1:(u-1),1])+sum(k[1:(u1)])+1):(sum(p[1:(u),1])+sum(k[1:(u)])))]<-cbind(v11,v21) } } Z2<-matrix(0,M,(sum(p[,2])+sum(k))) for(u in 1:q) { v12<-matrix(0,M,(p[u,2])) v22<-matrix(0,M,(k[u])) for(s in 1:p[u,2]) { v12[,s]<-dataA[,u]^(s) v12[,(p[u,2])]<-dataA[,u]^(p[u,2]) } for(j in 1:k[u]) { v22[,j]<-trun(dataA[,u],RR[j,u],p[u,2]) } if(u==1) { Z2[,1:(p[u,2]+k[u])]<-cbind(v12,v22) } else { Z2[,((sum(p[1:(u-1),2])+sum(k[1:(u1)])+1):(sum(p[1:(u),2])+sum(k[1:(u)])))]<-cbind(v12,v22) } } ZZ<-rep(1,M) ZA<-cbind(ZZ,Z1) ZB<-cbind(ZZ,Z2) ZC<-matrix(0,M,((sum(p[,2])+sum(k))+1)) ZD<-matrix(0,M,((sum(p[,1])+sum(k))+1)) A<-cbind(ZA,ZC) B<-cbind(ZD,ZB) Z<-rbind(A,B) D1<-rep(0,(sum(p[,1])+sum(k))) D2<-rep(0,(sum(p[,2])+sum(k))) for(i in 1:q) { d1<-rep(0,(p[i,1])) for(j in 1:(p[i,1])) { d1[j]<-0 } d2<-rep(0,(p[i,2])) for(j in 1:(p[i,2])) { d2[j]<-0
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
} d3<-rep(0,(k[i])) for(j in 1:k[i]) { d3[j]<-1 } if(i==1) { D1[1:((p[i,1])+(k[i]))]<-c(d1,d3) D2[1:((p[i,2])+(k[i]))]<-c(d2,d3) } else { D1[(sum(p[1:(i-1),1])+sum(k[1:i1])+1):(sum(p[1:i,1])+sum(k[1:i]))]<-c(d1,d3) D2[(sum(p[1:(i-1),2])+sum(k[1:i1])+1):(sum(p[1:i,2])+sum(k[1:i]))]<-c(d2,d3) } } DD1<-c(0,D1) DD2<-c(0,D2) d0<-c(DD1,DD2) D<-diag(d0) c1<-matrix(0,M,1+para) for(i in 1:(para+1)) { c1[,i]<-1 c1[,1+para]<-data[,2+para] } c2<-matrix(0,M,1+para) for(i in 1:(para+1)) { c2[,i]<-1 c2[,1+para]<-data[,2+para] } c3<-matrix(0,M,1+para) c4<-matrix(0,M,1+para) X1<-cbind(c1,c3) X2<-cbind(c4,c2) X<-rbind(X1,X2) I<-diag(1,M+M) A<-matrix(0,M+M,M+M) A<-Z%*%mp(t(Z)%*%Z+(n*vl[r]*D))%*%t(Z) Apar<-X%*%mp(t(X)%*%t(I-A)%*%(I-A)%*%X)%*%t(X)%*%t(IA)%*%(I-A) Anon<-A%*%(I-Apar) Asemi<-Apar+Anon ytopi<-Asemi%*%y MSE[r]<-(t(y-ytopi)%*%(y-ytopi))/n GCV[r]<-MSE[r]/(1-((1/n)*sum(diag(1-A))))^2 } mlamda<-cbind(vl,GCV,MSE) GCVmin<-min(GCV) win.graph() plot(vl,GCV,type="l",xlim=c(min(vl),max(vl)),ylim=c(min(GCV),max(G CV)),xlab="Lambda",ylab="GCV")
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
title("Plot Lambda Terhadap GCV") bopt<-mlamda[mlamda[,2]==GCVmin,1] MSEE<-mlamda[mlamda[,2]==GCVmin,3] cat("\nNilai MSE = ",MSEE,"\n") cat("Nilai GCV minimum = ",GCVmin,"\n") cat("Nilai Lambda Optimal saat GCV Minimum = ",bopt,"\n") I<-diag(1,M+M) AA<-matrix(0,M+M,M+M) AA<-Z%*%mp(t(Z)%*%Z+(n*bopt*D))%*%t(Z) AApar<-X%*%mp(t(X)%*%t(I-AA)%*%(I-AA)%*%X)%*%t(X)%*%t(I-AA)%*%(IAA) AAnon<-AA%*%(I-AApar) AAsemi<-AApar+AAnon teta<-mp(X)%*%AApar%*%y ystar<-y-(X%*%teta) phi<-mp(t(Z)%*%Z+(n*bopt*D))%*%t(Z)%*%ystar cat("\nPenduga Parameter : ") for(m in 1:(para+1)) { cat("\nNilai Teta-topi[",m-1,"] Model Respon 1= ",format(teta[m])) } for(m in (para+2):(2*(para+1))) { cat("\nNilai Teta-topi[",m-1-(para+1),"] Model Respon 2= ",format(teta[m])) } cat("\n") for(m in 1:((sum(p[,1])+sum(k))+1)) { cat("\nNilai Phi-topi [",m-1,"] Model Respon 1= ",format(phi[m])) } for(m in ((sum(p[,1])+sum(k))+2):(sum(p)+(2*sum(k))+2)) { cat("\nNilai Phi-topi [",m-1-((sum(p[,1])+sum(k))+1),"] Model Respon 2= ",format(phi[m])) } cat("\n\n\tHasil Estimasi:\n\tytopi\t\terror\n") ytopii<-AAsemi%*%y error<-y-ytopii ee<-cbind(ytopii,error) print(ee) cat("\n") MSE<-(t(y-ytopii)%*%(y-ytopii))/length(y) cat("MSE=",MSE,"\n") JKT<-t(y-(mean(y)))%*%(y-(mean(y))) JKG<-t(y-ytopii)%*%(y-ytopii) RK<-1-(JKG/JKT) cat("R-square=",RK,"\n") ER<-matrix(0,M,2) ER[,1]<-error[1:M] ER[,2]<-error[(M+1):(2*M)] cat("\nNilai error untuk respon 1 dan 2 adalah \n\n") print(ER) }
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 6. Program Uji Glesjer dan Penentuan Matrik Pembobot glesjer<-function(ERfix) { cat("\n\nUJI GLESJER\n") cat("==============================================") alfa<-as.numeric(readline("\n\nInput nilai alfa : ")) Asemi=as.matrix(Asemi) error=abs(error) error=as.matrix(error) errorbar=mean(error) n=nrow(error) yhat=Asemi%*%error j=nrow(data)-2 error1=error-yhat SSE=sum((error-yhat)^2) SSR=sum((yhat-errorbar)^2) SST=SSR+SSE MSE=SSE/(n-j) MSR=SSR/(j-1) cat("hipotesis:\n") cat("H0 : var(1)=var(2)=...=var(n)= Homoskedastisitas\n") cat("H1 : minimal ada satu var(i)!= Heteroskedastisitas\n")
var\nKasus var\nKasus
Fhit=MSR/MSE pvalue=pf(Fhit,(j-1),(n-j),lower.tail=FALSE) cat("\nAnalysis of Variance","\n") cat("============================================================= =","\n") cat("Sumber df SS MS Fhit pvalue","\n") cat("Regresi ",j-1," ",SSR," ",MSR,"",Fhit,"",pvalue,"\n") cat("Error ",n-j," ",SSE,"",MSE,"\n") cat("Total ",n-1," ",SST,"\n") cat("============================================================= =","\n") cat("\nkesimpulan:") if (pvalue<=alfa) { cat("\nTolak Ho\nKasus Heteroskedastisitas","\n") cat("","\n") c<-rep(0,(M+1)) vr1<-rep(0,M) vr2<-rep(0,M) cv<-rep(0,M) vr<-var(ER) vr1<-rep(vr[1,1],M) vr2<-rep(vr[2,2],M) cv<-rep(vr[1,2],M) A<-diag(vr1,M) B<-diag(cv,M) C<-B D<-diag(vr2,M) AA<-cbind(A,B)
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
BB<-cbind(C,D) U<-rbind(AA,BB) W<-solve(U) } else { cat("\nTerima Ho\nKasus Homoskedastisitas","\n") cat("","\n") vr1<-rep(0,M) vr2<-rep(0,M) cv<-rep(0,M) vr<-var(ER) vr1<-rep(vr[1,1],M) vr2<-rep(vr[2,2],M) cv<-rep(vr[1,2],M) A<-diag(vr1,M) B<-diag(cv,M) C<-B D<-diag(vr2,M) AA<-cbind(A,B) BB<-cbind(C,D) U<-rbind(AA,BB) W<-solve(U) } print(W) }
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 7. Program Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (dengan Pembobot) mp<-function(x,eps=1e-006) { x<-as.matrix(x) xsvd<-svd(x) diago<-xsvd$d[xsvd$d>eps] if(length(diago)==1) { xplus
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
dataurut<-matrix(0,M,q) t<-matrix(0,M,q) RR<-matrix(0,max(k),q) prediktor=data[,(para+3):kolom] dataA=as.matrix(prediktor) p<-cbind(orde1,orde2) r<-matrix(0,max(lr),q) R<-matrix(0,(max(lr)-1),q) for(i in 1:q) { dataurut[,i]<-sort(dataA[,i]) t[,i]<-dataurut[,i] if(lr[i]<max(lr)) { r[1:lr[i],i]<-quantile(t[,i],seq(0,1,by=1/z[i])) r[(lr[i]+1):max(lr),i]<-0 } else { r[,i]<-quantile(t[,i],seq(0,1,by=1/z[i])) } R[,i]<-r[-lr[i],i] RR[,i]<-R[-1,i] } for (i in 1:q) { cat("\nPrediktor ke-",i) cat("\nORDE respon 1 :",p[i,1],"; ORDE respon 2 :",p[i,2],"\n") for(j in 1:k[i]) { cat("titik knot [",j,"] = ",RR[j,i],"\n") } } y<-c(data[,1],data[,2]) vl<-seq(bb,ba,h) nvl<-length(vl) GCV<-rep(0,nvl) MSE<-rep(0,nvl) for (r in 1:nvl) { Z1<-matrix(0,M,(sum(p[,1])+sum(k))) for(u in 1:q) { v11<-matrix(0,M,(p[u,1])) v21<-matrix(0,M,(k[u])) for(s in 1:p[u,1]) { v11[,s]<-dataA[,u]^(s) v11[,(p[u,1])]<-dataA[,u]^(p[u,1]) } for(j in 1:k[u]) { v21[,j]<-trun(dataA[,u],RR[j,u],p[u,1])
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
} if(u==1) { Z1[,1:(p[u,1]+k[u])]<-cbind(v11,v21) } else { Z1[,((sum(p[1:(u-1),1])+sum(k[1:(u1)])+1):(sum(p[1:(u),1])+sum(k[1:(u)])))]<-cbind(v11,v21) } } Z2<-matrix(0,M,(sum(p[,2])+sum(k))) for(u in 1:q) { v12<-matrix(0,M,(p[u,2])) v22<-matrix(0,M,(k[u])) for(s in 1:p[u,2]) { v12[,s]<-dataA[,u]^(s) v12[,(p[u,2])]<-dataA[,u]^(p[u,2]) } for(j in 1:k[u]) { v22[,j]<-trun(dataA[,u],RR[j,u],p[u,2]) } if(u==1) { Z2[,1:(p[u,2]+k[u])]<-cbind(v12,v22) } else { Z2[,((sum(p[1:(u-1),2])+sum(k[1:(u1)])+1):(sum(p[1:(u),2])+sum(k[1:(u)])))]<-cbind(v12,v22) } } ZZ<-rep(1,M) ZA<-cbind(ZZ,Z1) ZB<-cbind(ZZ,Z2) ZC<-matrix(0,M,((sum(p[,2])+sum(k))+1)) ZD<-matrix(0,M,((sum(p[,1])+sum(k))+1)) A<-cbind(ZA,ZC) B<-cbind(ZD,ZB) Z<-rbind(A,B) D1<-rep(0,(sum(p[,1])+sum(k))) D2<-rep(0,(sum(p[,2])+sum(k))) for(i in 1:q) { d1<-rep(0,(p[i,1])) for(j in 1:(p[i,1])) { d1[j]<-0 } d2<-rep(0,(p[i,2])) for(j in 1:(p[i,2])) { d2[j]<-0
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
} d3<-rep(0,(k[i])) for(j in 1:k[i]) { d3[j]<-1 } if(i==1) { D1[1:((p[i,1])+(k[i]))]<-c(d1,d3) D2[1:((p[i,2])+(k[i]))]<-c(d2,d3) } else { D1[(sum(p[1:(i-1),1])+sum(k[1:i1])+1):(sum(p[1:i,1])+sum(k[1:i]))]<-c(d1,d3) D2[(sum(p[1:(i-1),2])+sum(k[1:i1])+1):(sum(p[1:i,2])+sum(k[1:i]))]<-c(d2,d3) } } DD1<-c(0,D1) DD2<-c(0,D2) d0<-c(DD1,DD2) D<-diag(d0) c1<-matrix(0,M,1+para) for(i in 1:(para+1)) { c1[,i]<-1 c1[,1+para]<-data[,2+para] } c2<-matrix(0,M,1+para) for(i in 1:(para+1)) { c2[,i]<-1 c2[,1+para]<-data[,2+para] } c3<-matrix(0,M,1+para) c4<-matrix(0,M,1+para) X1<-cbind(c1,c3) X2<-cbind(c4,c2) X<-rbind(X1,X2) I<-diag(1,M+M) A<-matrix(0,M+M,M+M) A<-Z%*%mp(t(Z)%*%W%*%Z+(n*vl[r]*D))%*%t(Z)%*%W Apar<-X%*%mp(t(X)%*%t(I-A)%*%(I-A)%*%X)%*%t(X)%*%t(IA)%*%(I-A) Anon<-A%*%(I-Apar) Asemi<-Apar+Anon ytopi<-Asemi%*%y MSE[r]<-(t(y-ytopi)%*%(y-ytopi))/n GCV[r]<-MSE[r]/(1-((1/n)*sum(diag(1-A))))^2 } mlamda<-cbind(vl,GCV,MSE) GCVmin<-min(GCV) win.graph() plot(vl,GCV,type="l",xlim=c(min(vl),max(vl)),ylim=c(min(GCV),max(G CV)),xlab="Lambda",ylab="GCV")
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
title("Plot Lambda Terhadap GCV") bopt<-mlamda[mlamda[,2]==GCVmin,1] MSEE<-mlamda[mlamda[,2]==GCVmin,3] cat("\nNilai MSE = ",MSEE,"\n") cat("Nilai GCV minimum = ",GCVmin,"\n") cat("Nilai Lambda Optimal saat GCV Minimum = ",bopt,"\n") I<-diag(1,M+M) AA<-matrix(0,M+M,M+M) AA<-Z%*%mp(t(Z)%*%W%*%Z+(n*bopt*D))%*%t(Z)%*%W AApar<-X%*%mp(t(X)%*%t(I-AA)%*%(I-AA)%*%X)%*%t(X)%*%t(I-AA)%*%(IAA) AAnon<-AA%*%(I-AApar) AAsemi<-AApar+AAnon teta<-mp(X)%*%AApar%*%y ystar<-y-(X%*%teta) phi<-mp(t(Z)%*%W%*%Z+(n*bopt*D))%*%t(Z)%*%W%*%ystar cat("\nPenduga Parameter : ") for(m in 1:(para+1)) { cat("\nNilai Teta-topi[",m-1,"] Model Respon 1= ",format(teta[m])) } for(m in (para+2):(2*(para+1))) { cat("\nNilai Teta-topi[",m-1-(para+1),"] Model Respon 2= ",format(teta[m])) } cat("\n") for(m in 1:((sum(p[,1])+sum(k))+1)) { cat("\nNilai Phi-topi [",m-1,"] Model Respon 1= ",format(phi[m])) } for(m in ((sum(p[,1])+sum(k))+2):(sum(p)+(2*sum(k))+2)) { cat("\nNilai Phi-topi [",m-1-((sum(p[,1])+sum(k))+1),"] Model Respon 2= ",format(phi[m])) } cat("\n\n\tHasil Estimasi:\n\tytopi\t\terror\n") ytopii<-AAsemi%*%y error<-y-ytopii ee<-cbind(ytopii,error) print(ee) cat("\n") MSE<-(t(y-ytopii)%*%(y-ytopii))/length(y) cat("MSE=",MSE,"\n") JKT<-t(y-(mean(y)))%*%(y-(mean(y))) JKG<-t(y-ytopii)%*%(y-ytopii) RK<-1-(JKG/JKT) cat("R-square=",RK,"\n") Yt<-matrix(0,M,2) Yt[,1]<-ytopii[1:M] Yt[,2]<-ytopii[(M+1):(2*M)] ER<-matrix(0,M,2) ER[,1]<-error[1:M] ER[,2]<-error[(M+1):(2*M)]
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
urut<-c(1:M) datagab<-cbind(Yt,data) for(r in 1:2) { win.graph() plot(urut,data[,r],xlim=c(min(urut),max(urut)),ylim=c(min(c(data[, r],Yt[,r])),max(c(data[,r],Yt[,r]))),xlab="Unit Observasi",ylab="Respon") par(new=T) plot(urut,Yt[,r],type="l",xlim=c(min(urut),max(urut)),ylim=c(min(c (data[,r],Yt[,r])),max(c(data[,r],Yt[,r]))),xlab="Unit Observasi",ylab="Respon") title("Plot Estimasi",sub=paste("\n*Plot Estimasi untuk Respon ke",r),cex.sub = 0.75, font.sub = 4, col.sub = "red") } }
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 8. Program Estimasi Outsample Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline prediksi<-function() { prediktorr<-dataset[,(3+para):length(dataset[1,])] dataA=as.matrix(prediktorr) M<-length(dataset[,1]) Z1<-matrix(0,M,(sum(p[,1])+sum(k))) for(u in 1:q) { v11<-matrix(0,M,(p[u,1])) v21<-matrix(0,M,(k[u])) for(s in 1:p[u,1]) { v11[,s]<-dataA[,u]^(s) v11[,(p[u,1])]<-dataA[,u]^(p[u,1]) } for(j in 1:k[u]) { v21[,j]<-trun(dataA[,u],RR[j,u],p[u,1]) } if(u==1) { Z1[,1:(p[u,1]+k[u])]<-cbind(v11,v21) } else { Z1[,((sum(p[1:(u-1),1])+sum(k[1:(u1)])+1):(sum(p[1:(u),1])+sum(k[1:(u)])))]<-cbind(v11,v21) } } Z2<-matrix(0,M,(sum(p[,2])+sum(k))) for(u in 1:q) { v12<-matrix(0,M,(p[u,2])) v22<-matrix(0,M,(k[u])) for(s in 1:p[u,2]) { v12[,s]<-dataA[,u]^(s) v12[,(p[u,2])]<-dataA[,u]^(p[u,2]) } for(j in 1:k[u]) { v22[,j]<-trun(dataA[,u],RR[j,u],p[u,2]) } if(u==1) { Z2[,1:(p[u,2]+k[u])]<-cbind(v12,v22) } else { Z2[,((sum(p[1:(u-1),2])+sum(k[1:(u1)])+1):(sum(p[1:(u),2])+sum(k[1:(u)])))]<-cbind(v12,v22) } }
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
ZZ<-rep(1,M) ZA<-cbind(ZZ,Z1) ZB<-cbind(ZZ,Z2) ZC<-matrix(0,M,((sum(p[,2])+sum(k))+1)) ZD<-matrix(0,M,((sum(p[,1])+sum(k))+1)) A<-cbind(ZA,ZC) B<-cbind(ZD,ZB) Z<-rbind(A,B) c1<-matrix(0,M,1+para) for(i in 1:(para+1)) { c1[,i]<-1 c1[,1+para]<-dataset[,2+para] } c2<-matrix(0,M,1+para) for(i in 1:(para+1)) { c2[,i]<-1 c2[,1+para]<-dataset[,2+para] } c3<-matrix(0,M,1+para) c4<-matrix(0,M,1+para) X1<-cbind(c1,c3) X2<-cbind(c4,c2) X<-rbind(X1,X2) ypred<-(X%*%teta)+(Z%*%phi) cat("\n") y<-c(dataset[,1],dataset[,2]) cat("\tHasil Estimasi:\n\tytopi\t\terror\n") error<-y-ypred ee<-cbind(ypred,error) print(ee) cat("\n") MSE<-(t(y-ypred)%*%(y-ypred))/length(y) cat("\nMSE=",MSE,"\n") JKT<-t(y-(mean(y)))%*%(y-(mean(y))) JKG<-t(y-ypred)%*%(y-ypred) RK<-1-(JKG/JKT) cat("R-square=",RK,"\n") y1<-ypred[1:M] y2<-ypred[(M+1):(2*M)] Yt<-cbind(y1,y2) urut<-c(1:M) datagab<-cbind(Yt,dataset) for(r in 1:2) { win.graph() plot(urut,dataset[,r],xlim=c(min(urut),max(urut)),ylim=c(min(c(dat aset[,r],Yt[,r])),max(c(dataset[,r],Yt[,r]))),xlab="Unit Observasi",ylab="Respon") par(new=T) plot(urut,Yt[,r],type="l",xlim=c(min(urut),max(urut)),ylim=c(min(c (dataset[,r],Yt[,r])),max(c(dataset[,r],Yt[,r]))),xlab="Unit Observasi",ylab="Respon")
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
title("Plot Estimasi",sub=paste("\n*Plot Estimasi untuk Respon ke",r),cex.sub = 0.75, font.sub = 4, col.sub = "red") } } tanya<-as.numeric(readline("\nData Outsample (1=Ya/2=Tidak)? ")) if(tanya==1) { prediksi() } else if(tanya==2) { cat("Thank You") } else { cat("Inputan Salah") } }
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 9. Output Uji Korelasi Pearson >korelasi(data) UJI KORELASI PEARSON Y1 dan Y2 ============================================== Input nilai alfa : 0.05 koefisien korelasi: 0.6308517 hipotesis: H0 : rho = 0 H1 : rho != 0 =================================================== nilai P-value = 0 =================================================== kesimpulan: Tolak Ho ada korelasi
>korelasi(data) UJI KORELASI PEARSON Y1 dan LDL ============================================== Input nilai alfa : 0.05 koefisien korelasi: 0.3925691 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.0048 ========================================== kesimpulan: Tolak Ho ada korelasi
>korelasi(data) UJI KORELASI PEARSON Y2 dan LDL ============================================== Input nilai alfa : 0.05 koefisien korelasi: 0.4633581 hipotesis: H0 : rho = 0 H1 : rho != 0
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
======================================== nilai P-value = 7e-04 ========================================== kesimpulan: Tolak Ho ada korelasi
>korelasi(data) UJI KORELASI PEARSON Y1 dan Berat Badan ============================================== Input nilai alfa : 0.05 koefisien korelasi: -0.2725271 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.0555 ========================================== kesimpulan: Terima Ho tidak ada korelasi
>korelasi(data) UJI KORELASI PEARSON Y2 dan Berat Badan ============================================== Input nilai alfa : 0.05 koefisien korelasi: -0.01898711 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.8959 ========================================== kesimpulan: Terima Ho tidak ada korelasi
>korelasi(data) UJI KORELASI PEARSON Y1 dan Umur ==============================================
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Input nilai alfa : 0.05 koefisien korelasi: 0.1634208 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.2568 ========================================== kesimpulan: Terima Ho tidak ada korelasi
>korelasi(data) UJI KORELASI PEARSON Y2 dan Umur ============================================== Input nilai alfa : 0.05 koefisien korelasi: 0.1157343 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.4235 ========================================== kesimpulan: Terima Ho tidak ada korelasi
>korelasi(data) UJI KORELASI PEARSON Y1 dan HDL ============================================== Input nilai alfa : 0.05 koefisien korelasi: -0.3013103 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.0335 ========================================== kesimpulan: Tolak Ho
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
ada korelasi
>korelasi(data) UJI KORELASI PEARSON Y2 dan HDL ============================================== Input nilai alfa : 0.05 koefisien korelasi: -0.1274857 hipotesis: H0 : rho = 0 H1 : rho != 0 ======================================== nilai P-value = 0.3776 ========================================== kesimpulan: Terima Ho tidak ada korelasi
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 10. Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Prediktor Ke-1 >spline(data1) Input Orde Maksimum : 2 Input Batas Bawah Lamda : 1 Input Batas Atas Lamda : 1000 Input Increment : 1 Jumlah Knot = 1 titik knots[ 1 ] = 60 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 578.7937 Nilai GCV minimum = 693.4911 Nilai Lambda Optimal saat GCV Minimum =
100
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 580.5636 Nilai GCV minimum = 738.7294 Nilai Lambda Optimal saat GCV Minimum =
1000
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 567.2865 Nilai GCV minimum = 721.8352 Nilai Lambda Optimal saat GCV Minimum =
1000
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 561.2481 Nilai GCV minimum = 769.9759 Nilai Lambda Optimal saat GCV Minimum = lanjut tambah jumlah knot Jumlah Knot = 2 titik knots[ 1 ] = titik knots[ 2 ] =
1000
55.33333 65
ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 566.2247 Nilai GCV minimum = 689.9469 Nilai Lambda Optimal saat GCV Minimum =
76
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 578.8064 Nilai GCV minimum = 745.6781 Nilai Lambda Optimal saat GCV Minimum =
1000
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 526.2484 Nilai GCV minimum = 707.6577 Nilai Lambda Optimal saat GCV Minimum =
73
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 519.9925 Nilai GCV minimum = 772.0771
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Nilai Lambda Optimal saat GCV Minimum = lanjut tambah jumlah knot Jumlah Knot = titik knots[ 1 titik knots[ 2 titik knots[ 3
3 ] = ] = ] =
50.5 60 70
ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 560.6594 Nilai GCV minimum = 687.0901 Nilai Lambda Optimal saat GCV Minimum =
95
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 576.2664 Nilai GCV minimum = 749.1611 Nilai Lambda Optimal saat GCV Minimum =
1000
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 522.3729 Nilai GCV minimum = 701.1939 Nilai Lambda Optimal saat GCV Minimum =
179
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 520.5138 Nilai GCV minimum = 769.1391 Nilai Lambda Optimal saat GCV Minimum = lanjut tambah jumlah knot Jumlah Knot = titik knots[ 1 titik knots[ 2 titik knots[ 3 titik knots[ 4
SKRIPSI
84
4 ] ] ] ]
= = = =
284
50 57.6 63.8 73.4
ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 563.5096 Nilai GCV minimum = 688.3006 Nilai Lambda Optimal saat GCV Minimum =
158
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 573.1 Nilai GCV minimum = 752.1939 Nilai Lambda Optimal saat GCV Minimum =
1000
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 517.9076 Nilai GCV minimum = 695.1142 Nilai Lambda Optimal saat GCV Minimum =
343
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 516.8079 Nilai GCV minimum = 763.7129 Nilai Lambda Optimal saat GCV Minimum =
608
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Optimal Nilai GCV minimum adalah 687.0901 pada nilai lambda optimal = 95 saat orde respon 1 : 1 dan orde respon 2 : 1 Jumlah Knot = 3 dengan titik knots[ 1 ] = 50.5 titik knots[ 2 ] = 60 titik knots[ 3 ] = 70
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 11. Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Prediktor Ke-2 > spline(data2) Input Orde Maksimum : 2 Input Batas Bawah Lamda : 1 Input Batas Atas Lamda : 1000 Input Increment : 1 Jumlah Knot = 1 titik knots[ 1 ] = 60.5 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 443.5291 Nilai GCV minimum = 566.9609 Nilai Lambda Optimal saat GCV Minimum =
2
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 437.9426 Nilai GCV minimum = 590.4973 Nilai Lambda Optimal saat GCV Minimum =
1
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 427.6487 Nilai GCV minimum = 569.2413 Nilai Lambda Optimal saat GCV Minimum =
8
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 420.9496 Nilai GCV minimum = 582.3961 Nilai Lambda Optimal saat GCV Minimum = lanjut tambah jumlah knot Jumlah Knot = 2 titik knots[ 1 ] = titik knots[ 2 ] =
SKRIPSI
1000
55.33333 69
ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 432.179 Nilai GCV minimum = 569.1749 Nilai Lambda Optimal saat GCV Minimum =
5
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 420.8886 Nilai GCV minimum = 607.8141 Nilai Lambda Optimal saat GCV Minimum =
3
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 409.8595 Nilai GCV minimum = 566.9604 Nilai Lambda Optimal saat GCV Minimum =
25
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 413.6152 Nilai GCV minimum = 586.7442 Nilai Lambda Optimal saat GCV Minimum =
1000
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
lanjut tambah jumlah knot Jumlah Knot = titik knots[ 1 titik knots[ 2 titik knots[ 3
3 ] = ] = ] =
53 60.5 70.75
ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 422.3764 Nilai GCV minimum = 557.4237 Nilai Lambda Optimal saat GCV Minimum =
8
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 413.9058 Nilai GCV minimum = 621.3194 Nilai Lambda Optimal saat GCV Minimum =
6
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 422.0043 Nilai GCV minimum = 574.6779 Nilai Lambda Optimal saat GCV Minimum =
125
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 412.4846 Nilai GCV minimum = 592.9409 Nilai Lambda Optimal saat GCV Minimum = lanjut tambah jumlah knot Jumlah Knot = titik knots[ 1 titik knots[ 2 titik knots[ 3 titik knots[ 4
4 ] ] ] ]
= = = =
49 57.6 65.2 72.2
ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 413.686 Nilai GCV minimum = 552.4698 Nilai Lambda Optimal saat GCV Minimum =
9
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 413.5971 Nilai GCV minimum = 635.4309 Nilai Lambda Optimal saat GCV Minimum =
10
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 432.596 Nilai GCV minimum = 577.1338 Nilai Lambda Optimal saat GCV Minimum =
490
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 408.0583 Nilai GCV minimum = 597.1745 Nilai Lambda Optimal saat GCV Minimum = lanjut tambah jumlah knot Jumlah Knot =
SKRIPSI
1000
1000
5
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
titik titik titik titik titik
knots[ knots[ knots[ knots[ knots[
1 2 3 4 5
] ] ] ] ]
= = = = =
48.16667 55.33333 60.5 69 73
ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 411.8717 Nilai GCV minimum = 552.1594 Nilai Lambda Optimal saat GCV Minimum =
11
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 410.5413 Nilai GCV minimum = 633.7329 Nilai Lambda Optimal saat GCV Minimum =
13
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 431.7147 Nilai GCV minimum = 577.0646 Nilai Lambda Optimal saat GCV Minimum =
547
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 406.8293 Nilai GCV minimum = 599.2182 Nilai Lambda Optimal saat GCV Minimum = lanjut tambah jumlah knot Jumlah Knot = titik knots[ 1 titik knots[ 2 titik knots[ 3 titik knots[ 4 titik knots[ 5 titik knots[ 6
6 ] ] ] ] ] ]
= = = = = =
47 53 59 64 70 74
ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 413.0288 Nilai GCV minimum = 552.1427 Nilai Lambda Optimal saat GCV Minimum =
14
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 413.2826 Nilai GCV minimum = 638.7481 Nilai Lambda Optimal saat GCV Minimum =
18
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 433.0366 Nilai GCV minimum = 577.3606 Nilai Lambda Optimal saat GCV Minimum =
757
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 405.0305 Nilai GCV minimum = 601.9875 Nilai Lambda Optimal saat GCV Minimum = lanjut tambah jumlah knot
SKRIPSI
1000
1000
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Jumlah Knot = titik knots[ 1 titik knots[ 2 titik knots[ 3 titik knots[ 4 titik knots[ 5 titik knots[ 6 titik knots[ 7
7 ] ] ] ] ] ] ]
= = = = = = =
46.125 53 57 60.5 68.25 70.75 74
ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 416.7134 Nilai GCV minimum = 555.7744 Nilai Lambda Optimal saat GCV Minimum =
17
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 413.8341 Nilai GCV minimum = 641.0961 Nilai Lambda Optimal saat GCV Minimum =
20
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 432.0171 Nilai GCV minimum = 576.7996 Nilai Lambda Optimal saat GCV Minimum =
827
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 403.4229 Nilai GCV minimum = 603.0142 Nilai Lambda Optimal saat GCV Minimum =
1000
Optimal Nilai GCV minimum adalah 552.1427 pada nilai lambda optimal = 14 saat orde respon 1 : 1 dan orde respon 2 : 1 Jumlah Knot = 6 dengan titik knots[ 1 ] = 47 titik knots[ 2 ] = 53 titik knots[ 3 ] = 59 titik knots[ 4 ] = 64 titik knots[ 5 ] = 70 titik knots[ 6 ] = 74
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 12. Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik Knot, dan Lambda Optimal Prediktor Ke-3 > spline(data3) Input Orde Maksimum : 2 Input Batas Bawah Lamda : 1 Input Batas Atas Lamda : 1000 Input Increment : 1 Jumlah Knot = 1 titik knots[ 1 ] = 41 ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 553.9097 Nilai GCV minimum = 676.2053 Nilai Lambda Optimal saat GCV Minimum =
21
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 542.3584 Nilai GCV minimum = 721.1062 Nilai Lambda Optimal saat GCV Minimum =
7
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 540.5427 Nilai GCV minimum = 687.5927 Nilai Lambda Optimal saat GCV Minimum =
1000
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 535.6266 Nilai GCV minimum = 734.7972 Nilai Lambda Optimal saat GCV Minimum = lanjut tambah jumlah knot Jumlah Knot = 2 titik knots[ 1 ] = titik knots[ 2 ] =
SKRIPSI
1000
35.33333 45.66667
ORDE respon 1 : 1 ; ORDE respon 2 : 1 Nilai MSE = 576.3939 Nilai GCV minimum = 682.3386 Nilai Lambda Optimal saat GCV Minimum =
1000
ORDE respon 1 : 1 ; ORDE respon 2 : 2 Nilai MSE = 571.0874 Nilai GCV minimum = 735.0219 Nilai Lambda Optimal saat GCV Minimum =
1000
ORDE respon 1 : 2 ; ORDE respon 2 : 1 Nilai MSE = 540.4175 Nilai GCV minimum = 695.548 Nilai Lambda Optimal saat GCV Minimum =
1000
ORDE respon 1 : 2 ; ORDE respon 2 : 2 Nilai MSE = 535.1111 Nilai GCV minimum = 751.5255 Nilai Lambda Optimal saat GCV Minimum =
1000
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Optimal Nilai GCV minimum adalah 676.2053 pada nilai lambda optimal = 21 saat orde respon 1 : 1 dan orde respon 2 : 1 Jumlah Knot = 1 dengan titik knots[ 1 ] = 41
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 13. Output Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (Tanpa Pembobot) >spline(data) Input Input Input Input
Banyak Prediktor Parametrik : 1 Batas Bawah Lamda : 58 Batas Atas Lamda : 60 Increment : 0.01
Input Orde Respon 1 Prediktor ke- 1 = 1 Input Orde Respon 2 Prediktor ke- 1 = 1 Input Banyak Knot Prediktor ke- 1 = 3 Input Orde Respon 1 Prediktor ke- 2 = 1 Input Orde Respon 2 Prediktor ke- 2 = 1 Input Banyak Knot Prediktor ke- 2 = 6 Input Orde Respon 1 Prediktor ke- 3 = 1 Input Orde Respon 2 Prediktor ke- 3 = 1 Input Banyak Knot Prediktor ke- 3 = 1 Prediktor ke- 1 ORDE respon 1 : 1 ; titik knot [ 1 ] = titik knot [ 2 ] = titik knot [ 3 ] =
ORDE respon 2 : 1 50.5 60 70
Prediktor ke- 2 ORDE respon 1 : 1 ; titik knot [ 1 ] = titik knot [ 2 ] = titik knot [ 3 ] = titik knot [ 4 ] = titik knot [ 5 ] = titik knot [ 6 ] =
ORDE respon 2 : 1 47 53 59 64 70 74
Prediktor ke- 3 ORDE respon 1 : 1 ; ORDE respon 2 : 1 titik knot [ 1 ] = 41 Nilai MSE = 314.327 Nilai GCV minimum = 507.0568 Nilai Lambda Optimal saat GCV Minimum =
SKRIPSI
59.13
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Penduga Parameter : Nilai Teta-topi[ 0 ] Nilai Teta-topi[ 1 ] Nilai Teta-topi[ 0 ] Nilai Teta-topi[ 1 ] Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai
SKRIPSI
Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi
[ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [
Model Model Model Model
Respon Respon Respon Respon
1= 1= 2= 2=
0 ] Model Respon 1= 1 ] Model Respon 1= 2 ] Model Respon 1= 3 ] Model Respon 1= 4 ] Model Respon 1= 5 ] Model Respon 1= 6 ] Model Respon 1= 7 ] Model Respon 1= 8 ] Model Respon 1= 9 ] Model Respon 1= 10 ] Model Respon 1= 11 ] Model Respon 1= 12 ] Model Respon 1= 13 ] Model Respon 1= 0 ] Model Respon 2= 1 ] Model Respon 2= 2 ] Model Respon 2=
4.077194e-14 0.2335038 1.722404e-14 0.1382942 123.6454 -0.1333675 0.02374892 -0.06426027 -0.1659545 0.8451164 -0.2896941 -0.3155978 -0.2792371 -0.2383332 -0.1062202 -0.02320073 -0.4998152 -0.06122403 66.95633 -0.00604936 0.02940036
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai
Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi
[1,] [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [10,] [11,] [12,] [13,] [14,] [15,] [16,] [17,] [18,] [19,] [20,] [21,] [22,] [23,] [24,] [25,] [26,] [27,] [28,] [29,] [30,] [31,] [32,] [33,] [34,]
SKRIPSI
[ [ [ [ [ [ [ [ [ [ [
3 ] Model Respon 2= 4 ] Model Respon 2= 5 ] Model Respon 2= 6 ] Model Respon 2= 7 ] Model Respon 2= 8 ] Model Respon 2= 9 ] Model Respon 2= 10 ] Model Respon 2= 11 ] Model Respon 2= 12 ] Model Respon 2= 13 ] Model Respon 2=
0.01383378 -0.08325971 0.3050303 -0.1245372 -0.1256992 -0.1118268 -0.1055777 -0.02953651 -0.009095719 -0.1401241 -0.04409283
Hasil Estimasi: ytopi error [,1] [,2] 171.39510 -1.3950973 170.04948 29.9505209 162.15130 -2.1513015 160.68598 7.3140150 158.95452 1.0454754 180.86294 19.1370625 164.19677 15.8032336 187.21913 -27.2191296 183.44574 -23.4457405 140.63738 -0.6373761 112.94829 -2.9482871 171.41649 -1.4164858 160.03949 -20.0394880 149.31180 -9.3118029 160.98248 -20.9824773 157.06045 -7.0604512 166.52283 -6.5228262 177.26250 -17.2624960 158.79143 -8.7914308 168.20688 11.7931242 167.03042 22.9695765 152.47646 7.5235392 165.83299 -15.8329851 163.37194 20.6280585 167.83731 2.1626917 163.78791 -13.7879141 174.03059 15.9694079 170.59581 -0.5958057 170.91399 9.0860100 158.08365 -8.0836543 183.95036 -3.9503643 173.35451 26.6454888 177.44332 -17.4433219 151.38824 8.6117555
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
[35,] [36,] [37,] [38,] [39,] [40,] [41,] [42,] [43,] [44,] [45,] [46,] [47,] [48,] [49,] [50,] [51,] [52,] [53,] [54,] [55,] [56,] [57,] [58,] [59,] [60,] [61,] [62,] [63,] [64,] [65,] [66,] [67,] [68,] [69,] [70,] [71,] [72,] [73,] [74,] [75,] [76,] [77,] [78,] [79,] [80,] [81,] [82,] [83,]
SKRIPSI
152.62892 164.05493 112.37235 157.19713 159.99282 171.14353 146.52534 162.54813 166.77981 172.25691 165.66774 153.34799 166.30597 170.65795 184.87140 158.41060 97.53352 94.24926 93.18013 89.16748 88.62799 102.19892 91.69165 104.53278 103.01364 92.37234 82.98221 93.59477 89.14983 91.68163 91.37846 90.85697 91.97625 98.17138 86.26706 95.47003 94.26271 89.03032 92.83467 91.31788 96.53981 93.59386 99.62392 95.38249 96.93539 88.58188 100.60244 95.88991 98.92362
-12.6289228 25.9450655 -22.3723461 -12.1971277 20.0071839 -21.1435258 -6.5253448 17.4518695 -6.7798114 -2.2569078 4.3322569 -3.3479920 -16.3059735 29.3420477 15.1285997 1.5894050 12.4664792 -4.2492552 16.8198685 -8.1674791 1.3720105 7.8010805 -1.6916494 -14.5327776 -3.0136443 -2.3723445 -2.9822130 -3.5947674 -9.1498315 -1.6816313 -11.3784622 -0.8569686 -1.9762473 -18.1713754 -6.2670587 14.5299695 5.7372877 0.9696845 -2.8346730 -4.3178793 13.4601930 -13.5938569 0.3760755 4.6175143 13.0646126 1.4181201 -0.6024446 34.1100888 -8.9236241
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
[84,] 86.01191 3.9880942 [85,] 84.47970 5.5203025 [86,] 90.18389 9.8161095 [87,] 70.05109 -10.0510922 [88,] 89.56456 -9.5645611 [89,] 89.48220 -9.4821971 [90,] 97.14217 2.8578266 [91,] 80.67222 -0.6722170 [92,] 92.95406 7.0459420 [93,] 92.24732 -2.2473197 [94,] 97.31632 2.6836792 [95,] 92.86530 -2.8653039 [96,] 89.38077 0.6192256 [97,] 90.87032 9.1296791 [98,] 99.66149 0.3385070 [99,] 101.56269 -11.5626851 [100,] 91.93879 -1.9387907 MSE= 157.1635 R-square= 0.8990955 Nilai error untuk respon 1 dan 2 adalah
[1,] [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [10,] [11,] [12,] [13,] [14,] [15,] [16,] [17,] [18,] [19,] [20,] [21,] [22,] [23,] [24,] [25,]
SKRIPSI
[,1] [,2] -1.3950973 12.4664792 29.9505209 -4.2492552 -2.1513015 16.8198685 7.3140150 -8.1674791 1.0454754 1.3720105 19.1370625 7.8010805 15.8032336 -1.6916494 -27.2191296 -14.5327776 -23.4457405 -3.0136443 -0.6373761 -2.3723445 -2.9482871 -2.9822130 -1.4164858 -3.5947674 -20.0394880 -9.1498315 -9.3118029 -1.6816313 -20.9824773 -11.3784622 -7.0604512 -0.8569686 -6.5228262 -1.9762473 -17.2624960 -18.1713754 -8.7914308 -6.2670587 11.7931242 14.5299695 22.9695765 5.7372877 7.5235392 0.9696845 -15.8329851 -2.8346730 20.6280585 -4.3178793 2.1626917 13.4601930
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
[26,] [27,] [28,] [29,] [30,] [31,] [32,] [33,] [34,] [35,] [36,] [37,] [38,] [39,] [40,] [41,] [42,] [43,] [44,] [45,] [46,] [47,] [48,] [49,] [50,]
SKRIPSI
-13.7879141 -13.5938569 15.9694079 0.3760755 -0.5958057 4.6175143 9.0860100 13.0646126 -8.0836543 1.4181201 -3.9503643 -0.6024446 26.6454888 34.1100888 -17.4433219 -8.9236241 8.6117555 3.9880942 -12.6289228 5.5203025 25.9450655 9.8161095 -22.3723461 -10.0510922 -12.1971277 -9.5645611 20.0071839 -9.4821971 -21.1435258 2.8578266 -6.5253448 -0.6722170 17.4518695 7.0459420 -6.7798114 -2.2473197 -2.2569078 2.6836792 4.3322569 -2.8653039 -3.3479920 0.6192256 -16.3059735 9.1296791 29.3420477 0.3385070 15.1285997 -11.5626851 1.5894050 -1.9387907
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 14. Output Uji Glesjer dan Penentuan Matrik Pembobot >glesjer(ERfix) UJI GLESJER ============================================== Input nilai alfa : 0.05 hipotesis: H0 : var(1)=var(2)=...=var(n)= var Kasus Homoskedastisitas H1 : minimal ada satu var(i)!= var Kasus Heteroskedastisitas Analysis of Variance ============================================================== Sumber df SS MS Fhit pvalue Regresi 47 1824.077 38.81015 0.4530344 0.9966446 Error 52 4454.691 85.66713 Total 99 6278.768 ============================================================== kesimpulan: Terima Ho Kasus Homoskedastisitas
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 15. Output Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (dengan Pembobot) >spline(data) Input Input Input Input
Banyak Prediktor Parametrik : 1 Batas Bawah Lamda : 0.01 Batas Atas Lamda : 1 Increment : 0.01
Input Orde Respon 1 Prediktor ke- 1 = 1 Input Orde Respon 2 Prediktor ke- 1 = 1 Input Banyak Knot Prediktor ke- 1 = 3 Input Orde Respon 1 Prediktor ke- 2 = 1 Input Orde Respon 2 Prediktor ke- 2 = 1 Input Banyak Knot Prediktor ke- 2 = 6 Input Orde Respon 1 Prediktor ke- 3 = 1 Input Orde Respon 2 Prediktor ke- 3 = 1 Input Banyak Knot Prediktor ke- 3 = 1 Prediktor ke- 1 ORDE respon 1 : 1 ; titik knot [ 1 ] = titik knot [ 2 ] = titik knot [ 3 ] =
ORDE respon 2 : 1 50.5 60 70
Prediktor ke- 2 ORDE respon 1 : 1 ; titik knot [ 1 ] = titik knot [ 2 ] = titik knot [ 3 ] = titik knot [ 4 ] = titik knot [ 5 ] = titik knot [ 6 ] =
ORDE respon 2 : 1 47 53 59 64 70 74
Prediktor ke- 3 ORDE respon 1 : 1 ; ORDE respon 2 : 1 titik knot [ 1 ] = 41 Nilai MSE = 136.5604 Nilai GCV minimum = 4395.396 Nilai Lambda Optimal saat GCV Minimum =
SKRIPSI
0.01
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Penduga Parameter : Nilai Teta-topi[ 0 ] Nilai Teta-topi[ 1 ] Nilai Teta-topi[ 0 ] Nilai Teta-topi[ 1 ] Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai Nilai
SKRIPSI
Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi
[ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [
Model Model Model Model
Respon Respon Respon Respon
1= 1= 2= 2=
0 ] Model Respon 1= 1 ] Model Respon 1= 2 ] Model Respon 1= 3 ] Model Respon 1= 4 ] Model Respon 1= 5 ] Model Respon 1= 6 ] Model Respon 1= 7 ] Model Respon 1= 8 ] Model Respon 1= 9 ] Model Respon 1= 10 ] Model Respon 1= 11 ] Model Respon 1= 12 ] Model Respon 1= 13 ] Model Respon 1= 0 ] Model Respon 2= 1 ] Model Respon 2= 2 ] Model Respon 2= 3 ] Model Respon 2= 4 ] Model Respon 2= 5 ] Model Respon 2= 6 ] Model Respon 2=
4.826632e-15 0.1859222 -1.082576e-14 0.1128686 98.40135 -0.3488794 0.3148969 0.06459672 -0.4170322 1.587642 -0.7329713 -0.6876009 -0.4914828 -0.5154928 -0.1333981 0.3975025 -0.2753206 -0.1951951 70.14687 -0.5042986 0.3804148 0.6258566 -0.6035625 0.6728882 -0.5412132
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Nilai Nilai Nilai Nilai Nilai Nilai Nilai
Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi Phi-topi
[1,] [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [10,] [11,] [12,] [13,] [14,] [15,] [16,] [17,] [18,] [19,] [20,] [21,] [22,] [23,] [24,] [25,] [26,] [27,] [28,] [29,] [30,] [31,] [32,] [33,] [34,] [35,] [36,] [37,] [38,] [39,] [40,] [41,] [42,] [43,] [44,] [45,]
SKRIPSI
[ [ [ [ [ [ [
7 ] Model Respon 2= -0.004191537 8 ] Model Respon 2= -0.07171556 9 ] Model Respon 2= -0.6858784 10 ] Model Respon 2= 0.2914969 11 ] Model Respon 2= -0.04826601 12 ] Model Respon 2= 0.08744745 13 ] Model Respon 2= -0.2236642
Hasil Estimasi: ytopi error [,1] [,2] 176.81019 -6.81019071 173.29156 26.70843946 167.10514 -7.10514262 161.16516 6.83484462 159.31772 0.68228359 182.45732 17.54267931 164.21623 15.78376644 181.61831 -21.61831236 185.37623 -25.37622528 139.01922 0.98078050 112.48969 -2.48968852 165.95328 4.04671714 156.25628 -16.25628109 147.77075 -7.77074614 159.79807 -19.79807002 159.37306 -9.37305532 169.05231 -9.05231321 178.89550 -18.89550461 162.76035 -12.76035299 171.28923 8.71076722 172.41506 17.58494316 150.81628 9.18371544 165.91729 -15.91729452 169.36580 14.63420172 166.02498 3.97502308 161.54863 -11.54863179 176.11422 13.88577664 174.50418 -4.50418397 173.89896 6.10103989 155.57820 -5.57820432 184.81709 -4.81709250 175.39060 24.60939960 179.57331 -19.57330654 158.42384 1.57616006 151.81878 -11.81878197 160.65031 29.34968794 95.61215 -5.61215121 156.26880 -11.26879735 155.72777 24.27222688 166.17762 -16.17761716 141.88138 -1.88137662 164.56715 15.43284784 171.47251 -11.47251090 173.25625 -3.25624694 167.38516 2.61483856
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
[46,] [47,] [48,] [49,] [50,] [51,] [52,] [53,] [54,] [55,] [56,] [57,] [58,] [59,] [60,] [61,] [62,] [63,] [64,] [65,] [66,] [67,] [68,] [69,] [70,] [71,] [72,] [73,] [74,] [75,] [76,] [77,] [78,] [79,] [80,] [81,] [82,] [83,] [84,] [85,] [86,] [87,] [88,] [89,] [90,] [91,] [92,] [93,] [94,] [95,] [96,] [97,] [98,] [99,] [100,]
SKRIPSI
148.04886 159.86748 168.98606 184.51064 162.36502 101.44532 93.94520 93.99287 88.14218 89.13667 103.64388 92.13246 100.61543 104.53760 90.85479 82.70143 89.64154 89.07759 92.60265 90.65746 92.37332 92.74211 96.53626 86.02070 97.18255 97.34013 89.91970 91.38906 94.45926 96.16439 93.42082 101.78807 97.87939 99.20482 88.31241 101.67332 99.44702 98.90937 89.09083 84.18911 90.69902 62.59222 89.31664 87.81080 94.15637 78.10268 92.66345 97.19416 96.34691 93.33797 86.28278 86.90450 97.64233 100.61212 93.16833
1.95113590 -9.86747844 31.01394334 15.48935849 -2.36501972 8.55467661 -3.94520223 16.00712702 -7.14217695 0.86333031 6.35611506 -2.13246281 -10.61542762 -4.53760034 -0.85479278 -2.70142768 0.35845693 -9.07758502 -2.60265212 -10.65746299 -2.37331928 -2.74210509 -16.53626242 -6.02069860 12.81744661 2.65986576 0.08030206 -1.38905949 -7.45925615 13.83560604 -13.42081720 -1.78806886 2.12060786 10.79517566 1.68759050 -1.67331937 30.55298397 -8.90937139 0.90916900 5.81089141 9.30097985 -2.59222201 -9.31663573 -7.81080201 5.84363326 1.89732284 7.33654900 -7.19416104 3.65308762 -3.33796851 3.71721922 13.09549566 2.35767219 -10.61212038 -3.16832637
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
MSE= 136.5604 R-square= 0.9123234
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
Lampiran 16. Output Estimasi Outsample Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline Data Outsample (1=Ya/2=Tidak)? 1
[1,] [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [10,] [11,] [12,] [13,] [14,] [15,] [16,] [17,] [18,] [19,] [20,] [21,] [22,] [23,] [24,] [25,] [26,] [27,] [28,] [29,] [30,]
Hasil Estimasi: ytopi error [,1] [,2] 171.28923 8.7107672 166.27971 -33.2797148 112.48969 -2.4896885 162.76035 -12.7603530 139.01922 0.9807805 165.54565 -25.5456480 167.96433 -27.9643305 169.36580 14.6342017 156.44874 -26.4487446 173.25625 -3.2562469 141.88138 -1.8813766 158.42384 1.5761601 171.90124 -31.9012388 180.36204 -30.3620399 171.32069 -31.3206852 97.18255 12.8174466 89.22881 -6.2288090 82.70143 -2.7014277 86.02070 -6.0206986 90.85479 -0.8547928 93.14477 -3.1447703 97.99308 -7.9930758 94.45926 -7.4592561 91.17399 -21.1739870 96.34691 3.6530876 78.10268 1.8973228 89.09083 0.9091690 97.58100 -7.5810037 98.62168 -8.6216754 93.68222 -3.6822152
MSE= 254.2364 R-square= 0.7670787
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO
ADLN-PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI
ESTIMASI MODEL REGRESI...
DODIK ANDRIANTO