2/7/2011
Seminar Hasil Tesis
ESTIMATOR SPLINE DALAM REGRESI NONPARAMETRIK MULTIRESPON NONPARAMETRIK MULTIRESPON (STUDI KASUS TINGKAT KESEJAHTERAAN DI INDONESIA TAHUN 2009) Oleh:
I Gde Adnyana Pembimbing: Prof. Dr. Drs. I Nyoman Budiantara, MS PROGRAM MAGISTER JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2010
OUTLINE • • • • • •
PENDAHULUAN TINJAUAN PUSTAKA METODOLOGI PENELITIAN HASIL DAN PEMBAHASAN KESIMPULAN DAN SARAN KESIMPULAN DAN SARAN DAFTAR PUSTAKA
1
2/7/2011
Pendahuluan
Latar Belakang
2
2/7/2011
lanjutan Spline ( Eubank) ‐ potongan polinomial sifat tersegmen & kontinu ‐ Minimumkan PLS yaitu gabung antara goodnes of fit dan kemulusan kurva ‐ Kelebihan: cenderung Kelebihan cenderung mencari sendiri estimasi data kemanapun pola data bergerak ‐ Akibat dari adanya titik knot
lanjutan Regresi menurut jumlah jumlah variabel (R h ) (Rencher): • Regresi linier sederhana ‐‐‐> 1 Var. Respon & 1 Var. prediktor • Regresi berganda ‐‐‐> 1 Var. Respon & >1 Var. prediktor • Regresi multirespon ‐‐‐> >1 Var. Respon& >= 1 Var. prediktor
3
2/7/2011
lanjutan • Masalah dunia nyata, kadangkala dihadapkan pada d dua d var. dependen d d atau t lebih l bih dengan d beberapa var. Independen dengan pola data tidak diketahui. • Regresi nonparametrik multirespon sebagai alat untuk memodelkan fungsi g yg berkaitan dengan masalah tsb. • Spline sebagai estimator
lanjutan Ukuran Kesejahteraan • Pada P d umumnya model regresi d l i dengan d satu t respon, misalnya pendapatan (Todaro, 2003), pengeluaran (Harianto, 1994; Junaedi, 2005; Berg, 1986), pertumbuhan ekonomi , kemiskinan, IPM dll • lebih l bih tepat t t jika jik diukur di k dengan d regresii nonparametrik multirespon dengan menggunakan spline
4
2/7/2011
Permasalahan • Bagaimana estimasi fungsi regresi nonparametrik t ik multirespon lti d dengan pendekatan spline • Bagaimana memilih titik knot optimal dalam estimator spline estimator spline • Bagaimana merancang suatu algoritma dan program komputer untuk menyelesaikan tujuan (1) dan (2)
Permasalahan (2) • Bagaimana aplikasi algoritma dan program k komputer t yang dirancang di pada d tujuan t j (3) (3) untuk estimator spline dalam regresi nonparametrik multirespon, untuk memodelkan tingkat kesejahteraan di indonesia tahun 2009
5
2/7/2011
Tujuan • Mendapatkan estimasi fungsi regresi nonparametrik t ik multirespon lti d dengan pendekatan spline • memilih titik knot optimal dalam estimator spline • merancang suatu algoritma dan program komputer untuk menyelesaikan tujuan (1) dan (2)
Tujuan (2) • Bagaimana aplikasi algoritma dan program k komputer t yang dirancang di pada d tujuan t j (3) (3) untuk estimator spline dalam regresi nonparametrik multirespon, untuk memodelkan tingkat kesejahteraan di indonesia
6
2/7/2011
Manfaat Penelitian • Memberikan wawasan keilmuan yang lebih k d penulis kepada li dan d masyarakat k t tentang t t penggunaan spline pada regresi nonparametrik multirespon • Memberi kontribusi dalam pengembangan komputasi p statistik terutama regresi g nonparametrik multirespon dalam bentuk macro
Batasan Masalah • Dikaji model regresi nonparametrik multirespon lti d dengan menggunakan k model d l spline truncated linier dan pemilihan titik knot dengan metode GCV dengan aplikasi pada data tingkat kesejahteraan di Indonesia tahun 2009
7
2/7/2011
Tinjauan Pustaka
Analisis Regresi • Mengetahui pola hubungan antara variabel prediktor dikt dengan d var. respon • Ada tiga pendekatan yaitu regresi parametrik, non parametrik dan semiparametrik • Dilihat dari pola hubungan variabelnya
8
2/7/2011
Regresi Nonparametrik • Menurut Eubank (1999) model regresi nonparametrik yaitu:
y j f (t j ) j : j 1....n y j : V ar respon
Dimanaf ( t:i ) : fu n g si yg tid ak d ik etah u i d iasu m sik an sm o o th d alam su atu ru an g t i : V a r .p r e d i k t o r
i : error diasumsikan ~ N(0, 2)
Model Nonparametrik Spline • Model spline suatu ruang Sobolev b
W2m [a, b] {g ; ( g ( m ) (t )) 2 dt } a
Uk. Kemulusan Fs
• SplineMin Optimasi PLS {R f J (f ) } f W2m [ a ,b ]
Goodness of fit
p
r
i0
j 1
Parameter Penghalus
s (t ) i t i p j (t k j ) p
9
2/7/2011
Model nonparametrik spline(2) • Wahba (1990), Craven dan Wahba (1979), dan Kimeldorf dan Wahba (1971) mengambil R(f) dan J(f) dalam bentuk kuadrat spline Natural • Cox dan O’Sullivan (1996) dan Cox (1983) memperoleh estimator spline tipe‐M memperoleh estimator spline tipe M • Oehlert (1992) memberikan estimator spline relaxed • Koenker, et. al. (1994) memberikan estimator spline quantile
Model nonparametrik spline(3) • Budiantara (2006b) telah mengembangkan estimator spline dalam regresi nonparametrik ti t li d l i t ik dengan menggunakan basis fungsi keluarga f t 0 1t 2t 2 ... m t m 1 (t K1 ) m I (t K1 ) ... spline truncated m r (t K r ) I (t K r )
m
k
c 0
d 1
f (t ) ct c m k (t k ) m
(t k )m, t k (t ) t k 0 m k
10
2/7/2011
Regresi Multirespon Model regresi multirespon
y 1 f ( t1 j ) 1 j y 2 f (t2 j ) 2 j y l f ( t lj ) lj
Pemilihan Titik Knot Menurut Wahba (1990) dan Eubank (1988): • Jika parameter penghalus kecil kurva kasar • Jika parameter penghalus besar kurva halus • Perlu memilih parameter penghalus optimal salah satu metode yaitu Generalized Cross Validation (GCV)
11
2/7/2011
Pemilihan Titik Knot (2) MSE ( K ) GCV ( K ) 2 n 1tr ( I H ( K ))
Dimana
n
MSE n 1 ( y j fˆ (t j )) 2 j 1
H ( ) X ( X 'WX )1 X 'W
Menurut Eubank(1999) memilih parameter penghalus optimal ekuivalen dengan memilih titik knot optimal.
Teori Kesejahteraan Sosial dan Ekonomi • Kesejahteraan merupakan aspek yg penting • Perlu peran pemerintah dalam menentukan kebijakan perekonomian • Pertumbuhan ekonomi abaikan kesejahteraan • Perlu kebijakan untuk peningkatan pertumbuhan ekonomi dan kesempatan kerja • Dampak sosial pertumbuhan ketimpangan pendapatan, kemiskinan dll
12
2/7/2011
Teori Kesejahteraan Sosial dan Ekonomi (2) • Pembangunan manusia merupakan paradigma pembangunan yang menempatkan yang menempatkan manusia sebagai fokus dan sasaran akhir dari seluruh kegiatan pembangunanIPM • Kesejahteraan suatu negara (Thomas dalam Sugiarto, 2007) diukur melalui indikator kemiskinan angka buta huruf, angka kemiskinan, angka huruf angka melek huruf, emisi karbon, perusakan alam &lingkungan, polusi, PDB • Todaro (2003) menyatakan kesejahteraan merupakan fungsi dari pendapatan perkapita, ketimpangan dan kemiskinan absolut
Metodologi Penelitian
13
2/7/2011
Sumber Data Bahan dan alat • Jurnal dan buku referensi yang terkait • Software yang digunakan Matlab Sumber data & unit observasi • Publikasi BPS yaitu Statistik Indonesia 2009 dan publikasi Perkembangan Beberapa Indikator Sosial Ekonomi Indonesia • Unit Observasi adalah Propinsi yang ada di Indonesia (33 Propinsi)
Variabel Penelitian • • • • • •
Variabel Respon Y1= Persentase penduduk miskin; Y2= IPM; Variabel prediktor X1 = TPT X2= Laju PDRB
14
2/7/2011
Langkah‐Langkah Penelitian 1. Langkah untuk mendapatkan tujuan 1 • Buat model multirespon • Kurva regresi didekati dengan fungsi spline truncated • Buat model dalam bentuk matriks • Tentukan matriks bobot varian‐kovarian W • Selesaikan optimasi denganWLS • Gunakan derivatif parsial untuk selesaikan optimasi diatas
2. Langkah untuk mendapatkan tujuan 2 • Definisikan MSE • Dapatkan matriks H(λ) dari langkah tujuan 1 • Mencari titik knot yang minimumkan nilai GCV
15
2/7/2011
3. Langkah mendapatkan tujuan 3 Rancang algoritma dan prokom untuk estimator • untuk pendefinisian dan pengubahan variabel ke matriks • Untuk mendapatkan matriks bobot varian ‐kovarian w • untuk membuat visualisasi untuk estimator spline optimal • untuk menghitung nilai MSE Rancang algoritma dan prokom untuk titik knot optimal • untuk menentukan banyak titik awal knot dari fungsi regresi • untuk menentukan nilai titik awal knot. • untuk menghitung nilai GCV awal. • untuk melakukan iterasi untuk mendapatkan titik knot optimal.
Langkah untuk mendapatkan tujuan 4 • Membuat plot antara variabel respon dan prediktor dikt • Memodelkan masing‐masing prediktor dengan respon menggunakan spline truncated • Mendapatkan estimator spline dengan kendala GCV minimum GCV minimum • Interpretasi output
16
2/7/2011
HASIL DAN PEMBAHASAN
Estimator Spline Dalam Regresi Nonparametrik Multirespon • Bentuk Umum model Multiresponse Y1 j f1 (t11 j ) f1 (t2 1 j ) ... f1 (tm 1 j ) 1 j Y2 j f 2 (t12 j ) f 2 (t22 j ) ... f 2 (tm 2 j ) 2 j Yl j f l (t1l j ) f l (t2l j ) ... f l (tml j ) l j
• Dalam bentuk matriks
Y1 j f1 (t11 j ) f1 (t2 1 j ) ... f1 (tm 1 j ) 1 j Y2 j f 2 (t12 j ) f 2 (t22 j ) ... f 2 (tm 2 j ) 2 j Yl j fl (t1l j ) f l (t2l j ) ... f l (tml j ) l j
17
2/7/2011
Estimator Spline Dalam Regresi Nonparametrik Multirespon
• Misalkan diberikan suatu fungsi spline truncated linier s(t) dengan titik knot sebanyak k, yaitu: s (t ) 0 1t 1 (t 1 ) 2 (t 2 ) ... k (t k )
) s (t ) ... s (t ) p fungsi s (t model multirespon • Jika Ydalam g f diganti g Y s ( t ) s ( t ) ... s ( t ) dengan s fungsi spline 1j
1
11 j
1
21j
1
2j
2
12 j
2
22 j
2
m1j
m2 j
1j
2j
Yl j sl (t1l j ) sl (t2l j ) ... sl (tml j ) l j
• uraikan fungsi s dan memisahkan antara parameter dengan variable y X
• Dimana
, i 1, 2...l : saling korelasi ij
, j 1, 2,..., n : Independent ij
[W ( 2 )]1 diag W1 ( 12 ) Wl ( l2 )
18
2/7/2011
optimasi dengan WLS
min 'W min Y X 'W Y X R nlm ( 2k ) R nlm ( 2k )
• Estimasi parameter beta 1 ˆ X 'WX X 'WY
1 Yˆ X Xy hat 'hat WX X 'WY y • Estimasi
atau
Yˆ H ( K )Y
H ( K ) X X 'WX X 'W 1
Dengan
Pemilihan Titik Knot • Salah satu metode pemilihan titik knot adalah d l h meminimumkan i i k nilai il i generalized li d cross validation (GCV) MSE ( K ) GCV ( K ) min N 1tr ( I H ( K )) 2
• Menurut Eubank(1999) dan Budiantara(2006b) memilih parameter penghalus optimal ekuivalen dengan memilih titik knot optimal.
19
2/7/2011
Algoritma Program MATLAB Untuk Regresi Nonparametrik Multirespon
• Mendefinisikan variable dan matriks bobot • Membuat macro program untuk macro program untuk memilih titik knot optimal secara otomatis • Membuat output nilai GCV, MSE, titik knot dan koefisien regresi untuk masing‐masing model kedalam file output. p
Tabel 4.1 Statistik Deskriptif Variabel Respon dan Variabel Prediktor
Model Tingkat Kesejahteraan di Indonesia Variabe observa Minim
Maksi
Range
Mean
Varians
l
si
um m
m m mum
Y1
33
3.62
37.53
33.91
15.13
71.30
Y2
33
64.00
77.03
13.03
70.88
9.30
t1
33
3.13
14.97
11.84
7.24
7.07
t2
33
-1.49
8.68
10.17
5.92
4.02
20
2/7/2011
Scatter Plot antara TPT dengan Persentase Penduduk Miskin dan IPM
Scatter Plot antara Laju Pertumbuhan PDRB dengan Persentase Penduduk Miskin dan IPM
21
2/7/2011
Nilai GCV dari masing masing model Model
Nilai GCV
Nilai MSE
Spline Linier 1 Titik Knot 625.99872
539.53681
1069.24091
911.28054
944.64342
804.74401
2740 46494 2740.46494
2303 09708 2303.09708
193.70690
172.61988
198.23155
159.07228
Spline Linier 2 Titik Knot
Spline Kuadrat 1 Titik Knot
Spline Kuadrat 2 Titik Knot
Spline Kubik 1 Titik Knot
Spline Kubik 2 Titik Knot
Model Yang Optimum Yˆ1 -62.33800-27.51674t1 -1.81028t12 0.27339t13 11.70603(t1 -11.13)3 20.04841t2 -0.14317t22 0.08694t23 -0.22199(t2 -0.51)3 Yˆ2 -16.28458 3.29673t1 +0.78923 t12 -0.07632t13 +9.97793(t1 -5.13)3 +10.07060t2 +2.94362t22 -0.19535t23 -1.05199(t2 -2.51 )3
22
2/7/2011
Interpretasi model • Model yang terbaik yang menjelaskan tingkat k j ht kesejahteraan di Indonesia adalah I d i d l h model d l spline kubik dengan 1 titik knot. • Pada respon persentase penduduk miskin, perubahan pola pada variabel TPT terjadi pada titik 11.13 dan variabel laju p j pertumbuhan PDRB terjadi pada titik 0.51. • Pada respon IPM, perubahan pola pada variabel TPT terjadi pada titik 5.13 dan variabel laju pertumbuhan PDRB terjadi pada i ik 2 51
Kesimpulan dan saran
23
2/7/2011
Kesimpulan • Estimasi kurva regresi nonparametrik multirespon lti d dengan estimator spline ti t li truncated diberikan oleh: Yˆ H ( K )Y
• Metode untuk memilih titik knot optimal knot optimal MSE ( K ) GCV ( Kdengan ) adalah meminimumkan nilai GCV N tr ( I H ( K ))
1
2
• Model yang terbaik yang dapat menggambarkan b k tingkat ti k t kesejahteraan k j ht di Indonesia adalah model spline truncated kubik 1 titik knot dengan Nilai GCV : 193.70690 dan nilai MSE sebesar: 172.61988 • Titik knot pada p respon p p persentase p penduduk miskin yaitu 11.13 untuk variabel TPT dan 0.51 untuk variabel laju pertumbuhan PDRB, titik knot pada respon IPM yaitu 5.13 untuk variabel TPT dan 2.51 untuk variabel laju pertumbuhan PDRB
24
2/7/2011
DAFTAR PUSTAKA • Badan Pusat Statistik (2010), Booklet Agustus 2010, BPS, Jakarta. BPS, Jakarta. • Badan Pusat Statistik (2010), Data Strategis BPS , BPS, Jakarta. • Badan Pusat Statistik (2008), Indeks Pembangunan Manusia 2006‐2007, Badan Pusat Statistik, Jakarta. • Badan Pusat Statistik (2005), Analisis dan P hit Penghitungan Ti k t K i ki Tingkat Kemiskinan 2005 BPS J k t 2005, BPS, Jakarta. • Badan Pusat Statistik, Bappenas dan UNDP (2004), “The Economics of Democracy: Financing of Human Development in Indonesia”, Indonesia Human Development Report (IHDR), Badan Pusat Statistik, Jakarta.
• Budiantara, I N. (2009). “Spline Dalam Regresi Nonparametrik Dan Semiparametrik: Sebuah Pemodelan Statistika Masa Kini dan Masa Mendatang”, Pidato Mendatang Pidato Pengukuhan Untuk Jabatan Guru Besar Guru Besar Dalam Bidang Ilmu Matematika Statistika dan Probabilitas, Pada Jurusan Statistika, Fakultas MIPA, Institut Teknologi Sepuluh Nopember, ITS Press, Surabaya. • Budiantara, I. N. (2006a), “Regresi Nonparametrik Dalam Statistika”, Makalah Pembicara Utama pada Seminar Nasional Matematika, Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Makasar (UNM), Makasar. • Budiantara, I. N., Suryadi, F., Otok, B. dan Budiantara I N Suryadi F Otok B dan Guritno, S. (2006), Guritno S (2006) “Pemodelan B‐Spline dan MARS pada Nilai Ujian Masuk Terhadap IPK Mahasiswa Jurusan Disain Komunikasi UK Petra, Surabaya”, Jurnal Teknik Industri, 8, 1‐13. • Budiantara, I. N. (2005), “Model Keluarga Spline Polinomial Truncated Dalam Regresi Semiparametrik”, Makalah Seminar Nasional Matematika, Jurusan Matematika Universitas Diponegoro, Semarang.
25
2/7/2011
.
• Budiantara, I. N., (2001a),” Regresi Nonparametrik dan Semiparametrik Serta Perkembangannya”, Makalah Pembicara Utama pada Seminar Nasional Seminar Nasional Alumni Alumni Pasca Sarjana Matematika Universitas Gadjah Mada, Yogyakarta. • Budiantara, I. N., (2001b), “Estimasi Parametrik dan Nonparametrik untuk Pendekatan Kurva Regresi”, Makalah Pembicara Utama pada Seminar Nasional Statistika V, Jurusan Statistika, Fakultas Matematika d Ilmu dan Il P Pengetahuan h Al Alam, Institut I i Teknologi T k l i Sepuluh S l h Nopember (ITS), Surabaya. • Budiantara, I. N. (2000a), “Metode U, GML, CV dan GCV Dalam Regresi Nonparametrik Spline”, Majalah Ilmiah Himpunan Matematika Indonesia (MIHMI), 6, 41‐45. • Budiantara I N (2000b) ” Optimasi dan Proyeksi
• Cox, D. D. and O’Sullivan, F.,(1996), Penalized Type Estimator for Generalized Nonparametric Regression, 1983, Journal of Multivariate Analysis, 56, 185‐206. • Enggle, R.F., Grangger, C.W.J., Rice, J. and Weiss, A., (1986), Semiparametric Estimates of Relation Between Weather and Electric Sales, Journal of the American Statistical Association., 81, 310‐320.Eubank, R.L. (1999), Nonparametric Regression and Spline Smoothing Second Edition, Marcel Deker, New York. Smoothing Second Edition, Marcel Deker, New York. • Green, P.J. and Silverman, B.W. 1994, Nonparametric Regression and Generalized Linear Model, Chapman & Hall, London. • Hardle, W. (1990), Applied Nonparametric Regression, Cambrige Univercity Press, New York. • Harianto (1994), “An Empirical Analysis of Food
26
2/7/2011
• • • • • •
•
• • • • • • • • • •
He, X. and Shi, 1996, Bivariate Tensor Product B‐Spline in a Partly Linear Model Linear, Journal of Multivariate Analysis, 58, 162‐181. Junaedi (2005), “Dinamika Pola Konsumsi Telur di Indonesia: Suatu Analisis Data Susenas”, Tesis, Institut Pertanian Bogor, Bogor. Khattree, R dan Naik, D.N. (1999),Applied Multivariate Statistics with SAS Software,Second Edition, SAS Institute Cary, NC: SAS Institute Inc. Koenker, R., Ng., P. and Portnoy, S.,1994, Quantile Smoothing Spline, Biometrika, 81, 673‐680. Lestari, B., 2008a. Spline estimator of biresponse nonparametric regression model with unequal variances of errors. J. Penelitian Math., 15: 85‐93. Lestari, B., 2008b. Penalized weighted least‐squares estimator for bivariate nonparametric regression model with correlated errors. Proceeding of the National Seminar on Mathematics and Statistics, (MS’08), Airlangga University, Surabaya, pp: 83‐95. L t i B I N B di t Lestari, B., I.N. Budiantara, S. Sunaryo S S and M. Mashuri, 2010a. Spline d M M h i 2010 S li estimator in ti t i homoscedastic Multiresponse nonparametric regression model. Proceeding of the Indo MS International Conference on Mathematics and Its Application, Oct. 12‐13, Yogyakarta, Indonesia, pp: 845‐854.
Oehlert, G.W.,1992, Relaxed Boundary Smoothing Spline, The Annals of Statistics, 20, 1146‐1160. Rencher, A, C. (2002), Methods of Multivariate Analysis.Second Edition, John Wiley & Sons, Inc.New York. Sunaryo, Sony., dan Purwahyuningsih, W. (2010), “Pendekatan Regresi Semiparametrik Spline (Pada data nilai Ujian Nasional siswa SMKN 1 Nguling Pasuruan”), Surabaya, Seminar Nasional Pascasarjana j X. Soo,Yuh‐Wen dan Bates, D. M. (1996), “Multirespon Spline Regression”, Computational Statistics & Data Analysis. 22, Elsevier Science B.V.p 619‐631. Speckman, P., 1988, Kernel Smoothing in Partial Linear Model, Journal of the Royal Statistical Sociaty, Seies B, 50, 413‐436. Sugiarto, Eddy (2007), “Teori Kesejahteraan Sosial dan Pegukurannya”, Jurnal Eksekutif, Vol. 4, No. 2 p. 263‐269. Todaro, MP., dan Stephen C. Smith. (2003), Pembangunan Ekonomi di Dunia Ketiga. Jilid I. Edisi Kedelapan. Erlangga, Jakarta. Wahba.G. (1990). Spline Models For Observational Data. University Of Winsconsin at Madison. Wang, Y. (1998), “Spline Smoothing Models With Correlated Errors”, Journal of the American S i i l Statistical Association., i i 93 3 3 8 93, 341‐348. Tripena, A. and Budiantara, I N., (2006), Fourier Estimator in Nonparametric Regression, International Conference On Natural Sciences and Applied Natural Scienes, Ahmad Dahlan University, Yogyakarta
27
2/7/2011
TERIMA KASIH….
28