JURUSAN STATISTIKA Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi 10 November Surabaya Surabaya 2010
SEMINAR TESIS
REGRESI NONPARAMETRIK DERET FOURIER BIRESPON Oleh : Ri i Semiati Rini S i ti 1308 201 009 Pembimbing : Prof. Dr.Drs. I Nyoman Budiantara,M.Si.
PENDAHULUAN
Regresi nonparametrik merupakan pendekatan regresi yg sesuai untuk pola data yang tidak diketahui bentuk kurva regresinya. Model regresi nonparametrik - Deret Fourier (Tripena dan Budiantara,2007, Antoniadis, et al, 1994, dan Bilodeau,1992) - Kernel (Speckman, 1998 dan Hardle, 1990) - Spline (Green dan Silverman Silverman, 1994; Wahba Wahba, 1990; Craven dan Wahba, 1979; Budiantara, 2002; dan Budiantara, et al, 1997)
Bentuk estimator nonparametrik diperoleh dari Optimasi Penalized, yang menggabungkan goodness of fit dan penalty
Min {R ( f ) + λ J ( f ) } f ∈H
(Wahba, 1990;Wang, 1998;Budiantara, 2002)
Yang sering menggunakan Penalized Spline D t Fourier Deret F i Bilodeau (1992; Tripena dan Budiantara, 2006
Estimator Deret Fourier dalam regresi nonparametrik satu respon
generalisasi
regresi nonparametrik Deret Fourier Birespon
Aplikasi data
kadar gula darah penderita Diabetes Mellitus
•
PERMASALAHAN 1. Bagaimana bentuk estimator Deret Fourier dalam regresi nonparametrik birespon 2. Bagaimana sifat-sifat estimator Deret Fourier dalam regresi nonparametrik birespon 3. Bagaimana menerapkan model yang diperoleh pada data kadar gula darah penderita Diabetes Mellitus • TUJUAN 1. Mendapatkan bentuk estimator Deret Fourier dalam regresi nonparametrik birespon 2. Mengkaji g j sifat-sifat estimator Deret Fourier dalam regresi g nonparametrik birespon 3. Mengaplikasikan model regresi nonparametrik birespon Deret Fourier pada data kadar gula darah penderita Diabetes Mellitus
•
•
MANFAAT PENELITIAN 1. Memberikan wawasan baru mengenai pemodelan, khususnya model regresi nonparametrik birespon g p penggunaan gg model regresi g 2. Mengetahui nonparametrik birespon Deret Fourier pada kadar gula darah penderita Diabetes Mellitus BATASAN MASALAH 1. Mengkaji estimator kurva regresi nonparametrik birespon dengan estimator Deret Fourier 2 Mengkaji 2. M k ji sifat-sifat if t if t estimator ti t Deret D t Fourier F i dalam d l regresi nonparametrk birespon g digunakan g adalah data yyang g diambil dari 3. Data yyang penderita DM yang melakukan cek kesehatan di Laboratorium Klinijk Utama Populer
TINJAUAN PUSTAKA
• REGRESI NONPARAMETRIK merupakan regresi yang pola hubungan antara variabel respon dan variabel prediktor tidak diketahui
y i = g( x i ) + ε i • REGRESI NONPARAMETRIK BIRESPON
y1j = f1(t1j ) + ε1j y2 j = f2 (t2 j ) + ε2 j kurva regresi dihampiri oleh fungsi kontinu dan diferensiabel K 1 d1 (t1 j ) = γ1t1 j + α01 + ∑α1k cos kt1 j 2 k=1 1 K 1 d 2 (t 2 j ) = γ 2 t 2 j + α02 + ∑α2k cos kt 2 j 2 k =1
• Pemilihan p parameter penghalus p g dalam Deret Fourier Bilodeau (1992) : jika (λ →0) maka estimator deret Fourier sangat k kasar, jik jika ((λ k estimator ti t d derett F Fourier i λ →∞) maka sangat mulus. Craven dan Wahba : CV Wang (1998) : UBR Wahba (1990) : GCV Tripena dan Budiantara (2007) : perbandingan CV, UBR dan GCV
• DIABETES MELLITUS (DM) ( ) DM merupakan suatu keadaan yang ditandai oleh kadar gula darah yang melebihi nilai normal akibat tubuh kekurangan insulin. Seseorang dikatakan menderita DM jika hasil pemeriksaan ik kadar k d glukosa l k puasanya 126 mg/dl dan glukosa 2 jam pp 180 mg/dl Penderita Dm yg berusia 35-55 thn memiliki kemungkinan meninggal 3 kali lebih besar diban dingkan g dengan g mereka bukan p penderita DM
METODELOGI PENELITIAN •
DATA : penderita DM dengan y1 j= kadar gula darah puasa y 2 j = kadar gula darah 2 jam setelah puasa t = usia STRUKTUR DATA
No
t
y1
y2
1 2 3 . . n
t1 t2 t3 . . tn
y11 y12 y13 . . y1n
y21 y22 y23 . . y2n
• METODE PENELITIAN 1. estimator Deret Fourier diperoleh dgn a. membangun model regresi birespon y1j =f1(t1j)+ε1j, j=1,2,...,n
y2j =f2(t2j)+ε2j, j =1,2,...,n
b. menentukan matriks Variance-Coveriance C dari error random W −1 (ρ, σ12 , σ22 ) c menghampiri kurva regresi dgn c. K 1 d1(t j ) = γ1t1j + α01 +∑α1k coskt1j 2 k=K1
1 d2 (t j ) = γ2t 2j + α02 + ∑α2k coskt2j 2 k=1
d. mencari ukuran goodness of fit untuk PLST ⎛ y − f ⎞' W (ρ, σ 2 , σ 2 ⎛ y− f ⎞ ⎜ ~⎟ ⎟ 1 2⎜ ⎝~ ⎠ ⎝~ ~⎠
e menentukan penalty untuk PLST e. π
π
∫[f (t )] dt + ∫[f (t " 1
0
2
1
" 2
1
2
)]2 dt2
0
f. menyelesaikan optimasi PLST π π ⎧⎛ ⎞ ⎫ ⎞ 2 2⎛ " 2 " 2 Mi ⎨⎜y−f ' W(ρ,σ1 ,σ2⎜y−f +λ1∫[f1 (t1)] dt Min d 1 +λ2 ∫[f2(t2)] dt d 2⎬ fk∈C(0,π),k=1,2 ⎝ ~ ~ ⎠ ~ ⎝~ ⎠ 0 0 ⎩ ⎭
2
Menyelidiki sifat-sifat estimator Deret Fourier dalam regresii nonparametrik t ik bi birespon d dengan llangkahk h langkah sebagai berikut – Diperlihatkan sifat estimator linier dari estimator D tF Deret Fourier i dalam d l regresii nonparametrik t ik birespon. – Diperlihatkan sifat bias dari estimator Deret Fourier dalam regresi nonparametrik birespon birespon. – Diperlihatkan distribusi dari estimator Deret Fourier dalam regresi nonparametrik birespon.
3
Menerapkan estimator Deret Fourier dalam regresi nonparametrik t ik birespon bi pada d penderita d it Di Diabetes b t Mellitus dengan variabel respon y1 adalah kadar gula darah puasa, y2 adalah kadar gula darah 2 jam setelah puasa dan t adalah usia , dengan langkahlangkah langkah sebagai berikut : – – – – –
Membuat plot data (t,y1) dan (t,y2) Memodelkan data dengan menggunakan deret Fourier dalam regresi nonparametrik birespon Memilih optimal estimator deret Fourier dalam regresi nonparametrik birespon M d Mendapatkan tk estimasi ti i untuk t k estimator ti t d derett F Fourier i d dalam l regresi nonparametrik birespon Menghitung MSE model yang diperoleh
HASIL S DAN PEMBAHASAN S
(t1j, y2j ) dan (t2j,y2j) diasumsikan 1a. Data berpasangan p g mengikuti model regresi nonparametrik birespon y1j =f1(t1j)+ε1j, j=1,2,L,n
y2j =f2(t2j)+ε2j,j=1,2,L,n
b. Matriks variance-covariance −1
W (ρ,σ ,σ ) = 2 1
2 2
⎡ θr ⎢0 ⎢ ⎢M ⎢ ⎢0 ⎢θρ θ ⎢ ⎢ ⎢θρ ⎢ ⎢M ⎢θρ θ ⎢⎣
0
L
θr L M 0
0 0
O M L θr
θ L θρ θρ θ θρ L θρ M
O
M
θ L θρ θρ θ
θρ θρ L θρ⎤ θρ θρ L θρ⎥⎥ M M O M⎥ ⎥ θρ θρ L θρ⎥ θ 0 L 0⎥ ⎥ r ⎥ θ L 0⎥ 0 r ⎥ M M O M⎥ θ⎥ 0 0 L r ⎥⎦
(4.1.1)
(4.1.1) dpt dibentuk menjadi ⎛ y 11 ⎜ ⎜ y 12 ⎜ M ⎜ ⎜ y 1n ⎜ L ⎜ ⎜ y 21 ⎜ ⎜ y 22 ⎜ M ⎜⎜ ⎝ y 2n
⎛ f 1 ( t 11 ) ⎞ ⎛ ε 11 ⎟ ⎜ ⎜ ⎜ f 1 ( t 12 ) ⎟ ⎜ ε 12 ⎟ ⎜ M ⎜ M ⎟ ⎜ ⎜ ⎜ f 1 ( t 1n ) ⎜ ε 1n ⎜ ⎜ ⎟ = ⎜ L ⎟+⎜ L ⎟ ⎜ f 2 ( t 21 ) ⎟ ⎜ ε 21 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ f 2 ( t 22 ) ⎟ ⎜ ε 22 ⎟ ⎜ ⎟ ⎜ M ⎜⎜ ⎜⎜ f ( t ) ⎠ ⎝ 1 2n ⎠ ⎝ ε 2n ⎞ ⎟ ⎟ ⎟ ⎟
c. (4.1.2) dapat ditulis menjadi
⎞ ⎟ ⎟ ⎟ ⎟
(4 1 2) (4.1.2) ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
K 1 ⎡ ⎤ γ + α + α 1k cos kt 11 ⎥ t ∑ 1 11 01 ⎢ 2 k =1 ⎢ ⎥ K ⎡ε ⎤ ⎛ y11 ⎞ ⎢ 1 ⎟ ⎜ γ 1 t 12 + α 01 + ∑ α 1k cos kt 12 ⎥ ⎢ 11 ⎥ ⎥ ε12 2 ⎜ y12 ⎟ ⎢ k =1 ⎢ ⎥ ⎢ ⎥ M ⎜ M K ⎥ ⎢ M ⎥ ⎜ ⎟ ⎢ 1 ⎢ ⎥ ⎜ y1n ⎟ ⎢ γ 1 t 1n + 2 α 01 + ∑ α 1k cos kt 1n ⎥ ⎢ ε1n ⎥ k =1 ⎥ ⎜L⎟=⎢ L L L L L L L L L L L L L ⎢ ⎥ + ⎢L⎥ ⎜ ⎟ K ⎢ ⎥ ⎜ y 21 ⎟ ⎢ γ t + 1 α + α cos kt ⎥ ⎢ ε 21 ⎥ ∑ 2 21 01 1k 11 ⎥ ⎢ ⎜ ⎟ 2 k =1 ⎢ ⎥ ⎢ ε 22 ⎥ K ⎜ y 22 ⎢ ⎥ 1 ⎜ M ⎟ ⎢ γ 2 t 22 + α 01 + ∑ α 1k cos kt 11 ⎥ ⎢ M ⎥ ⎥ 2 ⎜⎜ ⎟⎟ ⎢ k =1 ⎢ ⎥ ⎣⎢ε 2 n ⎥⎦ y M ⎝ n⎠ K ⎢ ⎥ 1 ⎢ γ 2 t 2 n + α 01 + ∑ α1k cos kt 11 ⎥ 2 k =1 ⎣ ⎦
1⎛ ⎞' W(ρ, σ2 , σ2 )⎛ y−B(t , t )β⎞ R ( β ) = − β y B ( t , t ) ⎟ ⎟ d. Goodness of fit : 1 2 1 2 ⎜ 1 2 2n⎜⎝ ~ ~ ~⎠ ~⎠ ⎝~
e. Penalty J(f) = β1 ~
λ*D*β
f. Dengan menyelesaikan optimasi PLST, di diperoleh l h
Min
{R (f ) + J (f )}
f k ∈C ( 0 , π ), k =1, 2
estimator ti t −1
⎛1 ⎞ βˆ = ⎜ B' (t1, t 2 )W(ρ, σ12 , σ22 )B(t1, t 2 ) + λ*D*⎟ 1 B' (t1, t 2 )W(ρ, σ12 , σ22 ) y (4.1.9) ~ ⎝N ⎠ N ~ ~
dan
fˆ λ= H(λ1,λ2)y ~
~
2. Sifat-sifat : a. Estimator (4.1.9) merupakan kelas estimator linier, karena dapat dinyatakan sebagai
fˆλ(t1,t2) ~
⎛ y1 ⎞ ⎜ ~ H ( λ , λ ) 1 2 = ⎜ y2 ⎟ ⎝ ~ ⎠
b. merupakan estimator yang bias karena
⎡^ ⎤ E⎢fλ (t1 , t 2 )⎥ ⎣~ ⎦ c. distribusi dari normal
βˆ λ ~
≠ ⎛⎜ f
( t1 ) ⎞ ⎟ ⎜ f 2(t 2 ) ⎟ ⎝~ ⎠ 1 ~
adalah normal karena error random adalah
4. APLIKASI Plot data
Plot Data Aktual Respon 2
yk[[, i] 250
20 00
200 2
150
yk[[, i]
300
250
350 3
Plot Data Aktual Respon 1
50
55
60
65 tk[, i]
70
75
50
55
60
65 tk[, i]
70
75
Nilai fungsi
No 1 2 3 4 5 6 7 8 9 10 11
G(λ1,λ2
λ1 0,0002241661 0,0002689993 0,0003138325 0,0003586657 0,0004034990 0,0004483322 0 0004931654 0,0004931654 0,0005379986 0,0005828318 0,0006276651 0,0006724983
) untuk nilai-nilai
λ1 , λ 2
λ2 0,00004429235 0,00005315082 0,00006200928 0,00007086775 0,00007972622 0,00008858469 0 00009744316 0,00009744316 0,00010630163 0,00011516010 0,00012401857 0,00013287704
G(λ1,λ2 8727,855 8720,917 8716,759 8714,407 8713,264 8712,944 8713 195 8713,195 8713,841 8714,761 8715,869 8717,105
)
Terlihat dari tabel
λ ~
opt
Nilai
= (λ1(opt) = 0,0004483322, λ 2(opt) = 0,00008858469) G(λ1 , λ 2)
B d Berdasarkan k
λ ~
= 872,944 yang sesuai dengan
λ
optimal
~
optimal ti l di diperoleh l h
ˆ 01,α ˆ11,α ˆ12,α ˆ13,α ˆ14) = (1,490375; 79,380917; 2,397902; βˆ1=(γˆ1,α ~
- 0,28218385; 0,0003539463; 0,07487596) ˆ 02,α ˆ 21,α ˆ 22,α ˆ 23,α ˆ 24) = (2,566980; 86,447412; 6,652173; βˆ 2=(γˆ2,α ~ - 0,2812492; 0 2812492; 0 0,6188612; 6188612; 0 0,4202362) 4202362)
Plot fungsi taksiran untuk
λ
optimal
~
Plot Fungsi Taksiran Lamda Optimal Respon 2
o
350 3
Plot Fungsi Taksiran Lamda Optimal Respon 1 o
Data aktual Fungsi taksiran
ft[, i] 250
200
200
150
fft[, i]
300
250
Data aktual Fungsi taksiran
50
55
60
65 t
70
75
50
55
60
65 t
70
75
Estimator Deret Fourier untuk respon 1 :
fˆλ1(opt)(t) =
79,381 +1,490t +2,398cos t -0,282cos 2t + 0,004cos 3t+ 0 075 cos 4t 0,075
Estimator Deret Fourier untuk respon 2 :
fˆλ2(opt) (t) =
86,447 2,567t +6,652cos 86,447+ 6,652cos t – 0,281cos 2t + 0,619cos 3t + 0,420cos 4t
Nilai MSE untuk estimator Deret Fourier respon 1 dan respon 2 : MSE ( f λ1 (opt) (t)) =
4,611184e+004
MSE( fλ2 (opt) (t)) =
1,206822e005
ˆ
ˆ
KESIMPULAN dan SARAN
KESIMPULAN 1. Untuk model regresi yaitu
y=B(t1,t2)β+ε ~
~ −1
⎛1 ⎞ βˆ = ⎜ B' (t1, t 2 )W(ρ, σ12 , σ22 )B(t1, t 2 ) + λ*D* ~ ⎝N ⎠
diperoleh estimator dari
~
β ~
1 N
B' (t1, t 2 )W(ρ, σ12 , σ22 ) y ~
~
dan fˆ λ= H(λ1,λ2 ) y ~
2 Sif 2. Sifat-sifat t if t estimator ti t ~ Deret D t Fourier F i fˆ λ dalam d l regresii nonparametric ti ~ birespon adalah a. merupakan kelas estimator linear b. merupakan estimator yang bias untuk kurva f ~
c. apabila error random berdistribusi normal, maka distribusi dari adalah normal
3.
estimator Deret Fourier dalam regresi nonparametrik birespon, berkaitan dengan λ opt = (λ1(opt) , λ 2(opt) ) diberikan oleh ~
λ ~
4.
opt
= ( λ 1( opt ) = 0,0004483322 ,
λ 2 ( opt ) = 0,0000885846 9 )
Estimator Deret Fourier untuk respon 1 :
fˆλ1(opt)(t) =
79,381 +1,490t + 2,398cos t - 0,282cos 2t +
0,004cos 3t + 0,075 cos 4t Estimator Deret Fourier untuk respon 2 :
fˆλ2(opt)(t)=
86,447 + 2,567t + 6,652cos t – 0,281cos 2t + 0,619cos 3 + 0,420cos 4t
SARAN
•
•
Dalam model Deret Fourier perlu dilakukan penelitian lebih lanjut p j tentang gp pemilihan nilai K optimal secara bersama-sama dengan pemilihan optimal Perlu dilakukan penelitian lebih lanjut untuk estimator Deret Fourier dalam regresi nonparametrik t ik multirespon. lti
DAFTAR PUSTAKA Antoniadis, A., Bigot, J., dan Spatinas, T., (2001), Wavelets Estimator in Nonparemetric Regression : A Comparative Simulation Study, Journal of Statistical Software, 6, 1-83. Bilodeau, M., (1992), Fourier Smoother and Additive Models, The Canadian Journal of Statistics, 3, 257 – 259. Budiantara, I.N.,(1999), Estimator Spline Terbobot Dalam Regresi Semiparametrik, Majalah Ilmu Pengetahuan dan Teknologi (IPTEKS), (IPTEKS) 10 10, 103-109 103-109. Budiantara, I.N., (2000), Optimasi dan Proyeksi Dalam Regresi Nonpara metrik Spline, Majalah Berkala Matematika dan Ilmu Pengetahuan Alam (BMIPA), Universitas Gajah Mada, 10, 35-44. Budiantara, I.N.,(2001), Regresi Nonparametrik dan Semipara metrik S SertaPerkembangannya, P k b M k l h Pembicara Makalah P bi Ut Utama pada d S Seminar i N Nasional i l Alumni Pasca Sarjana Matematika Universitas Gajah Mada, Yogjakarta. Budiantara, I.N., (2002), Estimator Tipe Penalized Likelihood, Jurnal Natural FMIPA Unibraw, Edisi Khusus, 231-235. Budiantara II.N.,(2005), Budiantara, N (2005) Model Keluarga Spline Polinomial Truncated Dalam Regresi Semiparametrik, Makalah Seminar Nasional Matematika, Jurusan Matematika Universitas Diponegoro, Semarang. Budiantara, I.N.,(2006), Model Spline Dengan Knots Optimal, Jurnal Ilmu Dasar, FMIPA Universitas Jember,, 7,, 77-85 Dalimarta, S, (2004), Diabetes Mellitus, Edisi IX, Jakarta Penebar, Swadaya Diabetic Medicine, (2006), Umur Panjang dengan Diabetic yang Terkontrol, Diabetic Sweetner, Infotech.
Draper, N., dan Smith, H., (1996), Applied Regression Analysis, John Wiley &Sons New York Eubank, R.L., (1988), Spline Smoothing and Nonparametric Regression, Marcel Dekker, New York Lehman, R., (1983), Theory of Point Estimation, John Wiley & Sons, New York Perkeni, (1998), Konsesus Pengelolaan Diabetes Indonesia S l S Searle, S.R., R (1982) (1982), Linear Li M Models, d l Second S d Editi Edition, John J h Wil Wiley & S Sons, IInc., New Jersey, Canada Soegondo, S., (1999), Diagnosis dan Klasifikasi Diabetes MellitusTerkini, Dalam rangkuman, AB. Slamet Suyono, Sutrisno Waspadji(dkk), Jakarta, Pusat Diabetes, Dr. Tjiptomangunkusumo, FKUI. Tj k Tjokroprawiro, i A., A (2007), (2007) Hidup Hid S Sehat h t d dan B Berbahagia b h i B Bersama DiabetesMellitus, Di b t M llit P Penerbit bit PT Gramedia Pustaka Utama, Jakarta. Tantra, H., (2008), Segala Sesuatu yang Harus Anda Ketahui Tentang Diabetes, Penerbit PT Gramedia Pustaka Utama, Jakarta.
Tripena, A., Budiantara, I.N., (2006), Fourier Estimator in Nonparametric Regressio , I t International ti l Conference C f On O Natural N t lS Sciences i and dA Applied li d Natural N t l Scienes, S i Ahmad Dahlan University, Yogjakarta.Vitahealth, (2004), Informasi Lengkap untuk Penderita dan Keluarga Diabetes, Jakarta, Gramedia Pustaka Utama. Wahba, G., (1990), Spline Models For Observation Data, SIAM Pnsylvania
Wang, Y., (1998), Spline Smoothing Models with Correlated Errors, Journal of The A American i St Statistical ti ti l A Association, i ti 93 93, 341 341-348. 348 Wu, H., dan Zhang, J.T., (2006), Nonparametric Regression Methods for Longitudinal Data Analysis, John Wiley & Sons, Inc., Canada
TERIMAKASIH