PEMODELAN HIBRID MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) ARIMA UNTUK PREDIKSI DATA SERIES HerlinaJusuf Jurusan Kesehatan Masyarakat FIKK Universitas NegeriGorontalo ABSTRAK: Penelitian mengkaji secara teoritis model hibrid MARS ARIMA untuk prediksi data series karena pemodelan data deret waktu biasanya pada kondisi data dengan fluktuasi yang stasioner dan linier adalah cukup memadai dengan menerapkan metode Autoregressive Integrated Moving Average (ARIMA) guna peramalan. Pemodelan deret waktu tak linier, salah satu adalah Multivariate Adaptive Regression Splines (MARS), Model hibrid MARS dengan ARIMA digabungkan karena setiap metode peramalan memiliki keunggulan dan kelemahan dalam menganalisis data, sehingga dapat diperoleh bentuk model terbaik dengan tingkat kesalahan (error) terkecil dalam meramalkan suatu kasus.
Kata Kunci: Multivariate Adaptive Regression Splines (MARS, Autoregressive Integrated Moving Average
PENDAHULUAN Model MARS prediksi adalah model MARS pada variabel respon yang kontinu. MARS merupakan kombinasi yang kompleks dari spline dan rekursif partisi. Model regresi spline memberikan sebuah bentuk persamaan yang merepresentasikan bentuk parametrik polinomial piecewise. Ide dasar dari pemodelan parametrik piecewise (terbagi beberapa region) ini adalah fungsi f ( y ) yang didekati oleh beberapa fungsi parametrik (biasanya berbentuk polinomial orderendah) yang didefinisikan pada setiap region di dalam domain D. Setiap region dipisahkan oleh titik-titik knots, dan fungsi parametrik yang didefinisikan pada tiap region biasanya disebut sebagai fungsi basis. Knots merupakan akhir dari sebuah region dan awal bagi region yang lain. Pemodelan regresi splinedi implementasikan dengan membentuk kumpulan fungsi basis yang dapat mencapai pendekatan spline orde ke-q dan mengestimasi koefisien fungsi-fungsi basis tersebut menggunakan least-squares. Model MARS menghasilkan model yang kontinu pada knots dengan basis fungsi: Km
Bm( q ) ( yt ) skm ( y(t p )( k ,m ) km ) k 1
q
Estimasi dari kurva regresi f ( y ) secara umum didapatkan melalui penalized leastsquares (PLS) yakni meminimumkan persamaan berikut:
b
2 2 1 n yi f yi 2 f m u du n i 1 a
(1.1)
PEMBAHASAN Estimasi Parameter Pada Model Hibrid MARS ARIMA Setelah dilakukan modifikasi model RPR dan dikombinasikan dengan spline, estimator model MARS prediksi untuk data series dapat ditulis sebagai berikut: M
Km
m 1
k 1
fˆ ( yt ) 0 m [ skm ( y( t p )( k ,m ) km )]
(1.2)
dengan
0 m M Km skm y( t p )( k ,m )
= basis fungsiinduk
km
= nilai knots dari variabel independen y( t p )( k ,m )
= koefisien dari basis fungsike-m = maksimum basis fungsi (nonconstant basis fungsi) = derajat interaksi = nilainya1 = variabel independen
Dengan menggunakan estimator MARS, maka model MARS tersaji sebagai berikut: M
Km
m 1
k 1
yi 0 m [ skm ( y( t p )( k ,m ) km )] i Dalam bentuk matrik dapat ditulis menjadi :
Y B ε dimana,
Y B ε
= variable respon, [1, ( y( t p )( k ,m) km )1K ] = fungsi basis, = koefisien dari fungsi basis = error
dengan,
Y ( y1 , y2 , , yn )T dan (0 , 1 , , M )T
(1.3)
1 1 B 1
( y( t 1)( M ,m ) Mm ) k 1 k 1 K1 KM s1m ( y( t 2 )(1,m ) 1m ) sMm ( y( t 2 )( M ,m ) Mm ) k 1 k 1 K1 KM s1m ( y( t p )(1,m ) 1m ) sMm ( y( t p )( M ,m ) Mm ) k 1 k 1 K1
s1m ( y(t 1)(1,m ) 1m )
KM
s
Mm
Untuk memperoleh estimator melalui penalized least-squares yaitu dengan meminimumkan persamaan (1.1) dan digunakan asumsi berikut. Asumsi1.1: Jika (Y( t p )i , km ) titik-titik pada barisan yang tetap, dan ada fungsi kontinu h j (.) yang didefinisikan
pada
[0,1]
sedemikian
hingga
masing-masing
elemen Y( t p )i memenuhi,
Y( t p )i h j (i ) uij , 1 i n, 1 j p dengan {uij } adalah barisan real yang memenuhi, n 1 1 n T ui ui C dan, lim sup max ui j n n n an 1k n i 1 i 1
lim
dengan, uij (ui1 , , uip )T , an n 2 log n , C = matrik definit positif dengan orde p 1
Teorema 1.1. Jika asumsi 1.1. terpenuhi, B matrik non singular dan parameter smoothing
2 0 maka estimator dari ˆ adalah meminimumkan nilai Z , dengan Z (Y B)T (Y B)
yaitu ˆ (B B) B Y Bukti: T
1
T
Perhatikan persamaan (1.1), yaitu: b
2 2 1 n yi f yi 2 f m u du n i 1 a
dengan 2 0 , persamaan menjadi: 2 1 n yi f yi n i 1
(1.4)
Dari persamaan (1.3), maka fˆ yi B , sehingga persamaan (1.4) menjadi: n 1 2 yi B (Y B )T (Y B ) Z n i 1
Untuk memperoleh estimator ˆ digunakan metode kuadrat terkecil, yang pada prinsipnya meminumumkan Z, dinyatakan sebagai berikut: Z (Y B)T (Y B) Z (Y T Y T BTY Y T B TBTB) Z (Y T Y 2T BT Y T BT B)
Untuk memperoleh persamaan normal dilakukan dengan menurunkan secara parsial terhadap
dengan hasil sebagai berikut: Z 2BT Y 2BT B = 0 BT Y BT Bˆ 0 T ˆ T B B B Y karena B matrik non singular, maka ˆ (BT B)1 BT Y
(1.5)
(1.6)
Jadi Teorema 1.1 terbukti. Jumlah parameter MARS selain basis fungsi induk, dapat diperoleh dengan mensubstitusikan persamaan (1.6) ke dalam persamaan (1.3) sebagai berikut:
Y B[(BT B )1 (BT Y )] = B(BT B)1 BT Y
(1.7)
= PY Sehingga, P = B(BT B)1 BT yang berukuran ( M 1) ( M 1) . Karena P adalah matrik simetris dan idempoten maka Trace dari matriks P sama dengan rank dari P yang merupakan jumlah parameter basis fungsi selain konstanta dan jumlah parameter yang diestimasi, dinotasikan sebagai =Trace(B(BT B)1 BT ) 1. C(M)
Teorema1.2. Jikarank dari P adalah (M+1) maka P memiliki (M+1) unit nilai eigen yang tidak bernilai nol dan sebanyak [N-(M+1)] unit nilai eigen yang bernilai nol.
Bukti: Misalkan adalah nilai eigen dan vektor eigen, maka:
P
( 0)
Jika dikalikan T menjadi T P T dan P adalah matrik idempoten ( P P 2 ) maka
T PT P T , sehingga ()T T atau ( 1)T 0 . Hal inimenunjukkan bahwa nilai eigen dari P bernilai 1 sebanyak (M+1) dan bernilai 0 sebanyak [N-(M+1)], sehingga rank dari matrik P sama dengan (M+1). Teorema1.3. Jikaasumsi 1.1 terpenuhi, B matrik non singular dan parameter smoothing 2 0 maka estimator dari ˆ adalah meminimumkan nilai 1 1 N ASR() ( yi f (yi , ))2 2 |f (yi , )|2 dy yaitu ˆ BT B 2 D BT Y N i 1
Bukti: Jika basis fungsi pada persamaan (1.3) dipusatkan kenilai rata-rata nol maka BT B proporsional dengan kovarian smatriks basis fungsi berikut:
V * c
(1.8)
dengan, N
Vij Bj ( yt p )[ Bi ( yt p ) Bi ]
(1.9)
t 1
N
ci ( yt y )Bi ( yt p )
(1.10)
t 1
Bi dan y rata-rata dari seluruh data. Persamaan (1.9) diselesaikan untuk setiap lokasi knot ,
untuk setiap variabel v , untuk semua basis fungsi m dan untuk semua interaksi M . Setiap basis fungsi baru, memasukkan ke baris dan kolom R dan
V , sehingga
penyelesaian persamaan normal (1.5), diperbarui dengan Cholesky Decompotition dengan modifikasi berikut, (V D) c
(1.11)
dimana D adalah matriks diagonal berukuran (M+1)(M+1) dari elemen matriks diagonal matriks
V. ASR RP atau
(1.12)
1 N ( yt f ( yt p , ))2 2 |f ( yt p , )|2 dy N t 1
(1.13)
Pertimbangkan, f ( yt , ) j 1 j Bt ( y ) dan penalti kekasaran (RP), RP T R adalah fungsi m
kuadrat definit positif dari parameter, dengan (1 , , m )T , dan R adalah matrik berukuran m m , dinyatakan sebagai berikut:
R jk 2
1 N n B j ( yt ) Bk ( yt ) N t 1 d 1 yd yd
(1.14)
Sehingga persamaan (1.12) dapat dinyatakan dalam bentuk matriks, yaitu:
1 |Y B|2 T R N (1.15) 1 2 1 1 T T T |Y | 2BY B B R N N N T T Misalkan V N1 B B dan c N1 B Y dimana Y ( y1 , , yN )T . Diasumsikan bahwa rata-rata ASR RP
sampel dari variabel respon setelah dikurangi adalah, y adalah ˆ 2y
atau,
1 N
n
y t 1
t
0 dan varians sampel dari y
1 | y|2 . Maka persamaan (1.15) dapat dinyatakan sebagai, N ASR RP ˆ 2y TV 2cT T R ˆ 2y T (V R ) 2cT (1.16) ˆ 2y TV * 2cT ˆ 2y 2(cT T V * ) ASR RP
N
1 N
( y k 1
k
y )2 N1
M 1
(2c i 1
i
T
2 Dii i )
(1.17) 2 T 2 N1 ( yk y ) i (2c Dii i ) i 1 k 1 Misalkan ASR() ASR RP , maka koefisien dari basis fungsi ˆ diperoleh dengan meminimumkan persamaan (1.16) atau (1.17). N
Agar ASR() minimum maka ASR() 0,
M 1
ASR() T ˆ T * ˆ T * T ˆ (Y Y V 2c ˆ ) 2V ˆ 2c 0 ˆ sehingga, 2V * ˆ 2c V * ˆ c (V R )ˆ c 1 2 ˆ 1 T 1 T B Y B B D N N N
(1.18)
1 T 1 B B 2 D ˆ BT Y N N 1 ˆ BT B 2 D BT Y dimana D adalah matriks diagonal definit positif dari R .
(1.19)
Penyelesaian yang diberikan dalam persamaan (1.19) adalah meminimumkan ASR() dan merupakan estimator MARS. Jadi teorema 1.3 terbukti. Pemilihan Model MARS Pada pemodelan MARS, pemilihan model digunakan metode stepwise. Forward stepwise dilakukan untuk mendapatkan fungsi dengan jumlah basis fungsi maksimum. Kriteria pemilihan basis fungsi pada forward adalah dengan meminimumkan Average Square Residual (ASR). Untuk memenuhi konsep parsemoni (model sederhana) dilakukan backward stepwise yaitu memilih basis fungsi yang dihasilkan dari forward stepwise dengan meminimumkan nilai Generalized Cross-Validation (GCV). Untuk memperoleh matriks Hat dari Persamaan (1.18), diperlukan Teorema berikut. Teorema 2.1Apabila R matriks kuadratik dengan R 1(R 1 )T Y*T Y* dan B 1 adalah faktor Cholesky dari Y*T Y* . Misalkan U dan Q matriks diagonal sedemikian hingga UQ1UT RDRT . selanjutnya, Z Y* ( RT U) maka ZT UT RY*T dan misalkan ˆ U(R 1 )T (RT U)1ˆ maka penyelesaian ˆ adalah: (I + 2Q)ˆ ZT Y = (UT B)Y*T Y
(2.1)
Selanjutnya Y*ˆ Zˆ dan matriks Hat, S (2 ) Z(I + 2Q)1 ZT dengan derajat bebas,
tr[ S (2 )] tr {(I + 2Q)1 ZT Z} tr {(I + 2Q)1 } (1 2Qi )1
(2.2)
i
dimana Qi adalah matrik diagonal ke-i dari Q . Bukti:
Y *T Y * 2 D R 1 ( R 1 )T 2 D R 1 (R 1 )T R 1R2 DRT (R 1 )T R 1 ( I 2 RDRT )(R 1 )T R 1U( I 2Q )UT (R 1 )T dan juga, UT R(Y*T Y* 2 D)RT U I 2Q iniberarti, UT R(Y*T Y* 2 D)RT U(UT (R 1 )T ˆ ) UT R(Y*T Y) atau, ( I 2 R )ˆ ZT Y juga Y* ZUT (R 1 )T sehingga Xˆ ZUT (R 1 )T ˆ Zˆ . Jadi teorema 1.4 terbukti. Berdasarkan teorema 1.3 dapat diperoleh matrikHat pada persamaan (1.18) yaitu
S (2 ) B(BT B + 2 D)1 BT . Selanjutnya pemilihan 2 optimal, yang merupakan parameter pengontrol keseimbangan antara kesesuaian kurva terhadap data dan kemulusan kurva. Dengan diperoleh 2 optimalmaka estimator yang diperoleh juga optimal. Teorema 2.2 (Freidman and Silverman, 1989) Misalkan digunakan model MARS Friedman pada persamaan (1.1), maka 2 optimal diperoleh dengan kriteria GCV sebagai berikut: GCV ( M )
1 N
N
( y
fˆ ( yt p , ))2 2 C( M ) 1 N
t 1
t
(2.3)
dengan: ~ C ( M ) = C(M)+d.M, nilai d yang terbaik berada dalam interval 2 d 4, dan C(M)
Trace[B(B’B)-1B’]+1 adalah banyaknya parameter yang diestimasi Bukti:
=
GCV MARS Friedman dimodifikasi pada penyebutnya, oleh karena itu pandang,
2
1 tr[ I A(2 )] dengan A(2 ) S (2 ) B(BT B + 2 D)1 BT .Sehingga, n
2
1 tr[ I A( 2 )] n
1 tr[ I B( BT B + 2 D )1 BT ] n
2
1 tr[ B( BT B + 2 D) 1 BT ] n
2
1 1
1 tr[ B( BT B) 1 BT + B 2 D 1BT ] n
1
1 tr( B( BT B) 1 BT 1) tr( B 2 D 1BT ) n
1
1 tr( B( BT B) 1 BT 1) d . M n
2
2
2
penambahan 1 pada tr(B(BT B)1 BT karenadalam model MARS selalu melibatkan basis induk (
0 ), sedangkan d disarankan bernilai 2 d 4 . Jadi teorema 2.2 terbukti . Prosedur forward dan backward menghasilkan sebuah model bentuk persamaan (1.1), dan penjabaran dapat disajikan sebagai berikut: M
fˆ ( y ) 0 m [s1m .( y( t p )(1,m ) 1m )] m 1 M
m [ s1m .( y( t p )(1,m ) 1m )][ s2m .( y( t p )( 2 ,m ) 2m )]
(2.4)
m 1 M
m [ s1m .( y( t p )(1,m ) 1m )][ s2m .( y( t p )( 2 ,m ) 2m )][ s3m .( y( t p )( 3,m ) 3m )] m 1
... Dan secara umum persamaan (2.4) dapat dituliskan sebagai berikut:
fˆ ( y ) 0
f (y
Km 1
i
t i
)
Km 2
f ij ( yt i , yt j )
f
Km 3
ijk
( yt i , yt j , yt k ) ...
(2.5)
persamaan (2.5), menunjukkan bahwa penjumlahan pertama meliputi semua basis fungsi untuk satu variabel, penjumlahan kedua meliputi semua basis fungsi untuk interaksi antara dua variabel, penjumlahan ketiga meliputi semua basis fungsi untuk interaksi antara tiga variable dan seterusnya.
Misalkan V (m) { v( k , m)}1Km adalah himpunan darivariabel yang dihubungkan dengan basis fungsi Bm ke-m, maka setiap penjumlahan pertama pada persamaan (2.5) dapat dinyatakan sebagai:
f i ( yi )
Km 1 iV ( m )
m Bm ( yt i )
(2.6)
f i ( yi ) merupakan penjumlahan semua basis fungsi untuk satu variabel yt i dan merupakan spline dengan derajatq=1 yang merepresentasikan fungsi univariat. Setiap fungsi bivariat pada persamaan (2.5) dapat ditulis sebagai:
f ij ( yt i , yt j )
Km 2 ( i , j )V ( m )
m Bm ( yt i , yt j )
(2.7)
Yang merepresentasikan penjumlahan semua basis fungsi dua variabel yt i dan yt j . Penambahan ini untuk menghubungkan kontribusi univariat, yang dituliskan sebagai berikut:
f ij* ( yt i , yt j ) f i ( yt i ) f j ( yt j ) f ij ( yt i , yt j )
(2.8)
Untuk fungsi trivariat pada penjumlahan yang ketiga diperoleh dengan menjumlahkan semua basis fungsi untuk tiga variabel, yang dituliskan sebagai berikut:
f ijk ( yt i , yt j , yt k )
Km3 ( i , j , k )V ( m )
m Bm ( yt i , yt j , yt k )
(2.9)
Penambahanfungsiunivariatedan bivariate mempunyaikontribusidalambentuk:
f ijk* ( yt i , yt j , yt k ) f i ( yt i ) f j ( yt j ) f k ( yt k ) f ij ( yt i , yt j ) f ik ( yt i , yt k ) f jk ( yt j , yt k ) f ijk ( yt i , yt j , yt k )
(2.10)
Persamaan (2.5) merupakan dekomposisi dari analisis varians untuk table kontingensi, yang dikenal dengan dekomposisi ANOVA dari model MARS. Interpretasi model MARS melalui dekomposisi ANOVA adalah merepresentasikan variabel yang masuk dalam model, baik untuk satu variable maupun interaksi antara variabel, selanjutnya merepresentasikan secara grafik. Penambahan aditif Persamaan (2.6) dapat ditunjukan dengan membuat plot antara f i ( yt i ) dengan yt i sebagai salah satu model aditif. Kontribusi interaksi antara dua variable dapat divisualisasikan dengan membuat plot antara
f ij* ( yt i , yt j ) dengan yt i dan yt j menggunakan countur plot. Model dengan interaksi yang lebih tinggi dalam visualisasi dapat dibuat dengan menggunakan plot dalam beberapa variable fixed dengan variable komplemen. Kontinuitas Derajat kontinuitas dipilih untuk memperoleh turunan pertama yang kontinu. Dalam mencari basis fungsidari MARS digunakan q = 1, yaitu sebagai berikut:
bq ( yt p ) [( yt p )]q dimana q 1
(3.1)
Persamaan (3.1) mempunyai arti sebagai, 1 [ ( yt p )] b ( yt p ) 0 1
, jika ( yt p ) 0 , lainnya
(3.2)
atau, ,xt ,t x u
0 ( x t ) ( x u) x t u t
C M 1(t ) C M 1(u)
t xvk u
Vi , M 1(t ) Vi , M 1(u)
,xu
( y k y )Bmk (xvk t ) (u t ) ( y k y )Bmk
xvk u
t xvk u
VM 1, M 1 (t ) VM 1, M 1(u)
( Bik Bi )Bmk ( xvk t ) (u t ) (Bik Bi )Bmk (3.3) xvk u
t xvk u
2 2 Bmk ( xvk t )2 (u t ) Bmk ( 2xvk t u) xvk u
( s 2 ( u) s 2 (t ))/ N dimana, s(t ) x
vk t
Bmk (xvk t ) , Bik dan Bmk adalah elemen dari matriks data basis fungsi, x k adalah
elemen dari matriks data asli, dan y k adalah data respon. Teorema 3.1 Misalkan,
0 C ( x|s 1, t , t , t ) p ( x t )2 r ( x t )3 x t ( x t ) C ( x|s 1, t , t , t ) p ( x t )2 r ( x t )3 0
,x t ,t x t ,x t
(3.4)
, x t ,t x t ,x t
dengan t t t , dan p (4t 3t t )/(t t )2 , r (2t 3t t )/(t t )3 , p (3t 4t t )/(t t )2 ,
r (3t 2t t )/(t t )3
maka
menyebabkan
C(x|s 1, t , t , t ) dan C( x|s 1, t , t , t ) kontinu pada turunan pertama dan kedua di titik x t . Bukti: Untuk x t , pandang 0 C( x|s 1, t , t , t ) p ( x t )2 r ( x t )3 x t
C ( x|s 1, t , t , t ) p ( x t )2 r ( x t )3
, x t , t x t , x t
, x t
p ( t t )2 r ( t t )3 ( x t)
, x t
(3.5)
( t t ) ( t t ) p ( t t ) 2 r ( t t )3 Turunan pertama C( x|s 1, t , t , t ) terhadap t adalah:
C( x|s 1, t , t , t ) p (t t )2 r (t t )3 (t t ) t t t (3.6) 2 p ( t t ) 3r (t t )2 1 Turunan kedua C( x|s 1, t , t , t ) terhadap t adalah:
2 p (t t ) 3r (t t )2 1 t t 2 p 6r (t t ) 0
(3.7)
Dari persamaan (3.6) dan (3.7), diperoleh,
2 p (t t ) 3r (t t )2 1 2 p 6r (t t ) 0 (t t ) menjadi,
2 p (t t ) 3r (t t )2 1 1 2 3r (t t ) 1 dan r 2 3(t t )2 2 p (t t ) 6r (t t ) 0 Substitusikan ke persamaan (3.7), diperoleh (t t ) p (t t )2
1 (t t )3 2 3(t t )
1 (t t ) (t t ) p (t t )2 3 1 1 t t t t p (t t )2 3 3 1 ( 4t 3t t ) p (t t )2 3 1 ( 4t 3t t ) ( 4t 3t t ) p 3 ( t t )2 ( t t )2
selanjutnya substitusikan p ke Persamaan (3.6), diperoleh:
( t t )
( 4t 3t t ) ( t t )2 r ( t t )3 2 (t t )
(t t ) ( 4t 3t t ) r (t t )3 t t 4t 3t t r (t t )3 2t 3t t r (t t )3 r Untuk x t , pandang
( 2t 3t t ) (t t )3
( x t ) Pandang, C( x|s 1, t , t , t ) p ( x t )2 r ( x t )3 0
C ( x|s 1, t , t , t ) ( x t )
,x t ,t x t ,x t
, x t
( t t ) p ( x t ) 2 r ( x t )3 p ( t t ) r (t t ) 2
, x t (3.8) 3
p ( t t )2 r ( t t )3 (t t )
Turunan pertama C( x|s 1, t , t , t ) terhadap t adalah:
C( x|s 1, t , t , t ) p (t t )2 r (t t )3 (t t ) t t t (3.9) 2 2 p ( t t ) 3r ( t t ) 1 Turunan kedua C( x|s 1, t , t , t ) terhadap t adalah:
2 p (t t ) 3r (t t )2 1 t t 2p 6r (t t ) 0
(3.10)
Dari persamaan (3.9) dan (3.10), diperoleh,
2 p (t t ) 3r (t t )2 1 2p 6r (t t ) 0 (t t )
menjadi,
2 p (t t ) 3r (t t )2 1 2 3r (t t ) 1 2p (t t ) 6r (t t )2 0 1 r = 3(t t )2 Substitusikan ke persamaan (3.8), diperoleh
1 (t t )3 (t t ) 3(t t )2 1 p (t t )2 ( t t ) ( t t ) 3
p (t t )2
p ( t t ) 2 ( t t )
1 ( t t ) 3
1 ( 3t 3t t t ) 3 1 (3t 4t t ) (3t 4t t ) p 3 ( t t )2 ( t t )2 p ( t t ) 2
selanjutnya substitusikan p ke persamaan (3.8), diperoleh: (3t 4t t ) (t t )2 r (t t )3 (t t ) ( t t )2 (3t 4t t ) r (t t )3 (t t ) r ( t t )3 (t t ) (3t 4t t ) r (t t )3 t t 3t 4t t r
(3t 2t t ) (t t )3
Sifat-SifatAsimtotikEstimasi parameter pada model Hibrid MARS ARIMA Untuk menyelidiki sifat asimtotik ˆ diperlukan beberapa asumsi: Asumsi 4.1: g(.) dan h(.) memenuhi kondisi Lipschitz order 1. Asumsi4.2 :Fungsibobot Wni (.) memenuhi: (i) Max 1 i n
n
Wni (t j ) O(1), Max 1 j n
j=1
n
W
ni
(t j ) O(1)
j=1
(ii) Max Wni (t j ) O(bn ) 1i, j n
(iii) Max 1 i n
dengan
n
W
ni
(t j )I (|ti t j | cn ) O(cn )
j=1
bn dan cn
adalah
dua
barisan
yang
memenuhi
untuk
n ,
nbn2log 4n , ncn2 0, ncn4log n , nbn2c n2 .
Untuk mengkaji sifat asimtotik kenormalan estimator ˆ digunakan lemma berikut.
1 Lemma 4.1:Jika asumsi .1.1, .1.2 dan.1.3 terpenuhi, maka lim (Y *T Y * ) C dengan C matriks n n definit positif. Bukti: n
Didefinisikan hns (ti ) hs (ti ) Wnk (ti ) X ks dan X is hs (ti ) uis , maka Y*T Y* ( s , m 1, , p) k 1
dapat didekomposisikan sebagai, n
Y i 1
* is
n n n Y * im Y * is Wnk (ti )Y * ks Y * im Wnk (ti )Y * km i 1 k 1 k 1 n n n ( hs (ti ) uis ) Wnk (ti )Y * ks ( hm (ti ) uim ) Wnk (ti )Y * km i 1 k 1 k 1
n n n hs (ti ) Wnk (ti )Y * ks uis hm (ti ) Wnk (ti )Y * km uim i 1 k 1 k 1 n
hns (ti ) uis hnm (ti ) uim i 1 n
n
n
n
i 1
i 1
i 1
i 1
uis uim hns (ti )hnm (ti ) hns (ti )uim hnm (ti )uis n
uis uim Tn1 Tn2 Tn3 i 1
n
Tn1 hns (ti )hnm (ti ) i 1
n n * hs (ti ) Wnk (ti )Y ks hm (ti ) Wnk (ti )Y * km i 1 k 1 k 1 n n n hs (ti ) Wnk (ti )( hs (tk ) uks ) hm (ti ) Wnk (ti )( hm (tk ) ukm ) i 1 k 1 k 1 n n n n n hs (ti ) Wnk (ti )( hs (tk ) Wnk (ti )uks hm (ti ) Wnk (ti )( hm (tk ) Wnk (ti )ukm i 1 k 1 k 1 k 1 k 1 n
n
A1 A2 i 1
O(cn ) O( anbn )
n
Tn2 hns (ti )uim i 1
n hs (ti ) Wnk (ti )Y * ks uis i 1 k 1 n n hs (ti ) Wnk (ti )( hs (tk ) uks )uis i 1 k 1 n n n hs (ti ) Wnk (ti )( hs (tk ) uis Wnk (ti )uks uis i 1 k 1 k 1 n
O(cn an ) O( an2bn )
n
Tn3 hnm (ti )uis i 1
n n hm (ti ) Wnk (ti )Y * km uim i 1 k 1 n n hm (ti ) Wnk (ti )( hm (tk ) ukm )uim i 1 k 1 n n n hm (ti ) Wnk (ti )( hm (tk ) uim Wnk (ti )ukm uim i 1 k 1 k 1
O(cn an ) O( an2bn ) sehingga, 1 n * * 1 n Y is Y im lim uij uik Tn1 Tn2 Tn3 n n n n i 1 i 1
lim
1 n lim uij uik [O( cn ) O( anbn )] [O( an cn ) O( a n2bn )] [O(ancn ) O(a n2bn )] n n i 1 n 1 lim uij uik n n i 1 1 lim [ O( cn ) O( anbn )] [ O( an cn ) O(a n2bn )] [O(ancn ) O(a n2bn )] n n 1 n lim uij uik 0 n n i 1 csm
Jadi Lemma 4.1. terbukti.
Dari Lemma 4.1, maka maka Y*T Y* O(n) artinya terdapat bilangan real M 1 ,
1 *T * (Y Y )i M1 , n
sedemikian hingga
E(Y*T ) 0
dan
Var(Y*T ) 2 (Y*T Y* ) . Dengan
1 *T * (Y Y )i M1 terhadap variabel random Y*T maka setiap M 2 0 berlaku n
k n 2 M 2 dan 1
P[|Y *T 0| n 2 M 2 ] 1
2 (Y *T Y * ) 1 ( n 2 M 2 )2
(Y *T Y * ) nM 2 2 1 1 2 Y *T Y * n M 22 M1 2 M 22 2
atau, P[|n 2 Y*T | M 2 ] 2 1
M1 M 22
jika untuk sembarang 1 0 dipilih M 1 sehingga 2
M 2 2
(4.1) M1 1 maka, M 22
M1 M1 1 1
Sehingga persamaan (4.1) dapat ditulis sebagai, P[|n 2 Y*T | M 2 ] 1 1
(4.2)
Berdasarkan definisi4.2 dan definisi1.12, maka persamaan (4.2) menjadi, Y*T Op ( n 2 ) dan 1
dapat dinyatakan sebagai, Y*T o p ( n)
(4.3)
persamaan (4.3) dan teorema 2.1, untuk mendapatkan distribusi asimtotik n 2 Y*T . 1
Misalkan Y * i vektor yang berukuran p 1 yaitu bariske-i dari matrik Y * dan Zi Y *i i maka Vi 2Y *iY *iT dan 1 n 1 n 2 * *T 1 n * *T 2 V lim Y Y = lim Y iY i 2C i i i n n n n n n i 1 i 1 i 1
lim
d Jadi, n 2 Y*T N (0, 2C) 1
(4.4)
Dari persamaan (1.5) dan substitusikan kepersamaan (1.3), diperoleh: ˆ (BT B)1 BT (B ) (BT B)1 (BT B) (BT B)1 BT (BT B)1 BT
(4.5)
sehingga, ˆ (BT B)1 BT ˆ ) n [( BT B )1 BT ] n ( 1 T 1 n ( B B ) BT n 1 n(BT B )1 BT n 1 BT B n
1
(4.6)
BT n
d n (ˆ ) C1Z dengan Z ~ N (0, 2C) , d C1Z ~ N ( 0, 2C1CC1 ) sehingga, n (ˆ ) N (0, 2C1 ) Selanjutnya apakah estimator ˆ konsisten untuk yang artinya lim P(|ˆ n | ) 1 n
Dari lemma 1.1,
persamaan (1.10), maka:
atau p lim ˆ . Pandang persamaan (1.5) dan substitusikan ke persamaan (1.3), diperoleh:
ˆ (BT B)1 BT (B ) (BT B )1 (BT B ) (BT B )1 BT (BT B )1 BT ( 1n BT B )1 1n BT
(4.7)
maka, p lim ˆ p lim ( 1n BT B)1 1n BT p lim ˆ lim( 1n BT B)1 p lim 1n BT n
menurut lemma 4.1, persamaan (1.19) menjadi;
(4.8)
p lim ˆ [(C)1 0] p lim ˆ sedangkan variansi estimator adalah, lim Var (ˆ n ) lim Var[ n ( BT B )1 BT ] n n lim Var[(BT B )1 BT ] n lim (BT B )1 BT B(BT B )1Var ( ) n T 1 2 lim (B B ) n
lim ( 1n BT B )1 ( 1n 2 ) n
C1 0 0
Berdasarkan hasil di atas, ternyata estimator ˆ secara asimtotik mempunyai sifat kenormalan, konsisten dan varians minimum. SIMPULAN 1. Estimator MARS adalah𝜃 = 𝐵 𝜏 𝐵 + 𝛿 2 𝐷
−1
𝐵𝜏 𝑌 dengan meminimumkan ASR 𝜃 .
2. Pada pemodelan MARS, pemilihan model digunakan metode stepwise. Forward stepwise dilakukan untuk mendapatkan fungsi dengan jumlah basis fungsi maksimum. Kriteria pemilihan basis fungsi pada forward adalah dengan meminimumkan Average Square Residual (ASR). Untuk memenuhi konsep parsemoni (model sederhana) dilakukan backward stepwise yaitu memilih basis fungsi yang dihasilkan dari forward stepwise dengan meminimumkan nilai Generalized Cross-Validation (GCV). 3. Sifat-SifatAsimtotik Estimasi parameter pada model Hibrid MARS ARIMA, dimana estimator ˆ secara asimtotik mempunyai sifat kenormalan, konsisten dan varians minimum. DAFTAR PUSTAKA Abraham, A. (2002),Analysis of Hybrid Soft and Hard Computing Techniques for Forex Monitoring Systems. IEEE International Conference on Fuzzy Systems (IEEE FUZZ'02), 2002 IEEE World Congress on Computational Intelligence, Hawaii, ISBN 0780372808, IEEE Press pp. 1616 -1622, 2002
Abraham, A. and Steinberg, D. (2002),MARS: Still an Alien Planet in Soft Computing. School of Computing and Information Technology, Salford System.Inc, 8880 Rio San Diego, CA 92108, USA Bates, J.M. and Granger, C.W.J (1969),The combination of forecasts. Operational Research Quarterly 20, 451- 468 Breiman, L. (1991),Discussion of “Multivariate Adaptive Regression Splines”, by J.H. Freidman, Annals of Statistics, Vol. 19, 82-90. Box, G.E.P and Jenkins, G.M., (1976),Time Series Analysis Forcasting and Control, Revised Edition, Holdenday, San Fransisco.Vol 65. 297-303 Box, G.E.P., Jenkins, G.M., and Reinsel. G.C., (1994),Time Series Analysis Forcasting and Control, 3d edition, Englewood Cliffs : Prentice Hall. Bowerman O’Connell,(1993),Forecasting & Time series an Applied Approach Third Edition. The Duxbury Advenced Series in Statistics and Decision Sciences.DuxburyPress : California. Chattfield, C. (1997),Time Series, Theory and Pratice and Forecasting, Chapman Hall, London. Cryer, J.D., (1986),Time Series Analysis, Boston : Publishing Company Friedman, J.H. (1990),Estimating Functions Of Mixed Ordinal And Categorical Variables Using Multivariate Adaptive Regression Splines. Technical Report LCS 107, Statistics Department, Stanford University. Friedman,J.H. (1991),Multivariate Adaptive Regression Splines(with discussion).The analysis of Statistika.19: 1 – 141. Friedman, J.H. and Silverman, B.W. (1989),Flexible Parsimony Smoothing And Additive Modeling.Technometrics, 31, 3 – 39. Lewis, P.A.W and J.G. Stevens.(1991),” Nonlinier Modeling of time Series Using Multivariate Adaptive Regression Splines (MARS)”. Journal of the American Statistical Assosation, 86, No. 416.(Dec.,1991), pp.864-877. Nash. M.S. and Bradford. D. F (2001),Parametric And Non Parametric logistic Regression For Prediction Of Precence Absence Of An Amphibian. Las Vegas : Nevada Wei, W.S William. (1990),Univariate and Multivariate Methods. California. Addison Wesley Publishing Company Wahba, G,(1990),“Spline Models for Observational Data, Society for Industrial and Applied Mathematics”. Philadelphia. Pennsylvania.