JMP : Volume 1 Nomor 1, April 2009 UJI LINEARITAS BERDASARKAN ESTIMASI MEAN DAN VARIANSI BERSYARAT UNTUK PROSES RUNTUN WAKTU Supriyanto Program Studi Matematika, Fakultas Sains dan Tekink Universitas Jenderal Soedirman, Purwokerto Herni Utami Jurusan Matematika, Fakultas MIPA Universitas Gajah Mada, Yogyakarta ABSTRACT. This study aims to examine the benefits of testing linearity in the case of live test data. Bootstrap procedure is used to form the estimators of the statistics. Hypothetical form is used to follow the linear model. And compare the value of criticism from the distribution of this value with the test statistics that have been calculated based on the observed time series data existing. This procedure starts with a model determines autoregression to the data. By using the Akaike information criterion, order estimation obtained from the autoregression models.
Keywords. lag, kernel method, heteroscedastic procedure, autoregresi linear autoregression, Akaike information. I. PENDAHULUAN Misalkan {X t , t ≥ 0} adalah proses stasioner yang mempunyai momen sampai order 4. Uji linearitas akan didasarkan pada mean bersyarat dan variansi bersyarat :
M k ( x ) = E[X t X t − k = x ] Vk ( x ) = var[X t X t −k = x ] k adalah lag, yang dapat bernilai negatif dan bervariasi. Mean dan variansi bersyarat di atas, diestimasi dengan metode kernel, dari n observasi, yaitu
{X1 , X 2 ,..., X n } . Adapun estimasi mean bersyarat sebagai berikut : n
ˆ (x) = M k
(n − k ) ∑ X t K h ( x − X t − k ) n
t = k +1 n −1
∑K t =1
h
(x − X t )
=
aˆ k ( x ) pˆ( x )
dimana K h ( x ) = h −1 K (h −1 x ) , dengan K adalah fungsi kernel dan h adalah bandwidth. Dalam hal ini digunakan h = n −1 / 5 SD (X) , yang mana untuk variansi Diterima 15 Februari 2009, disetujui untuk dipublikasikan 21 April 2009.
32
Supriyanto dan Utami, H.
dan bias kuadrat dari estimasi kernel ordinal, dalam hal ini baik untuk kasus normal. Estimator pˆ( x ) adalah estimasi dari densitas probabilitas marginal p(x).
Demikian juga variansi bersyarat, diestimasikan dengan n
ˆ (x) = V k
(n − k )−1 ∑ X t 2 K h ( x − X t −k ) n
t = k −1 n −1
∑K t =1
h
ˆ 2 (x) −M k
(x − X t )
Untuk pembuktian konsistensi secara lemah dan konsistensi secara kuat dari estimasi-estimasi di atas dapat dilihat Robinson(1983), Journal of Time Series Vol. 4 No. 3. Selanjutnya diperkenalkan indek nonlinearitas :
[
]
L( M k ) = E {M k ( X t − k ) − ρ k X t − k } = ∫ {M k ( x ) − ρ k x} p( x )dx 2
Untuk
mencegah
{X t '} = [{X t
− E(X t )} / SD (X t )] dimana E(Xt) dan
deviasi
{
dari
s = (n − 1)
−1
{Xt}
∑ (X t
t
yang
}
− X )2
Nonlinearitas memperkenalkan
dependensi
2
1/ 2
diestimasikan
{
skala,
SD(Xt)
digunakan
adalah mean dan standar
dengan
X = n −1 ∑ t X t
dan
.
dideskripsikan
[{
dimana σ k = E (X t − ρ k X t − k
dalam
variansi
}] ) }= (1 − ρ ) var(X ) .
L' (Vk ) = E Vk (X t − k ) − σ k 2
pada
bersyarat
dengan
2 2
2
2
k
t
Namun untuk konsistensi
dengan prosedur heteroscedastik untuk pemodelan variansi bersyarat digunakan
[{
L(Vk ) = E Vk (e t − k ) − σ e
}]
2 2
2
dengan σ e = var(e t ) dan {et} adalah proses residual dari autoregresi linear yang terbaik, yaitu et = Xt - a1Xt-1 - ... - apXt-p dengan p order yang ditentukan dengan kriteria informasi akaike, dan ai diestimasikan dengan kuadrat terkecil.
Uji Linearitas Berdasarkan Estimasi
33
II. ESTIMASI FUNGSIONAL
Fungsional L(Mk) diestimasikan dengan
{
1 n ˆ ˆ Lˆ(M k ) = ∑ M k (X t ) − ρ k X t n t =1
} w (X ) 2
t
dengan ρˆ k = ∑ (X t − X )(X t − k − X ) / ∑ (X t − X )
2
t
t
Fungsi w adalah fungsi pemberat, dimaksudkan untuk mencegah munculnya kuantitas bernilai ekstrim. Sedang estimasi untuk L(Vk) adalah
Lˆ(Vk ) =
{
}
n 1 ˆ (eˆ ) − σˆ ˆ 2 2 w (eˆ ) V ∑ k t e t n − p t =l + pˆ
pˆ
dan eˆ t = X t − ∑ aˆ i X t −i i =1
Pada uji linearitas, H0 akan ditolak jika nilai Lˆ( M k ) dan Lˆ(Vk ) terlalu besar. III. SIFAT-SIFAT ASIMTOTIS
Untuk h = o(n-1/5) dan h = O(n-1/5), kita dapat memperoleh asimtotik normalitas untuk Lˆ(M k ) dan Lˆ( Vk ) dengan tambahan syarat bahwa {Xt}variabel random identik dan independen. Untuk variabel random dependen {Xt} kami menduga bahwa asimtotik normalitas akan terus memenuhi asimtotik lemah. Jika h∞n − r , r < 1/5 asimtotik normal dapat dibuktikan untuk kasus dependen, dengan menggunakan teorema limit pusat mixing strong. Terhadap hipotesis null H0’ : Mk(x) = ρkX, k = 1,2,... hal ini benar untuk model Gaussian dan model-model autoregresi order pertama pada umumnya, tetapi tidak untuk semua model-model autoregresi moving average. Mean distribusi asimtotik sebagai berikut :
{
}
−1 E Lˆ(M k ) ∞(nh ) ∫ K 2 ( z )dz ∫ Vk ( x ) w ( x )dx + h 4
{∫ K
2
}
2
( z )dz ρ k
2
∫p
−1
( x ){p' ( x )} w ( x )dx 2
dengan p’ adalah derivatif dari p(30 x). Kasus selanjutnya adalah asimtotik variansi dari Lˆ(M k ) , didefinisikan sebagai berikut :
{
}
∫
∫
{
var Lˆ(Mk ) = 6(n 2 h) −1 var( X t ) G 2 ( z )dz w( x )dx + o (n 2 h) −1
∫
G( z ) = K( y )K( z + y )dy
},
34
Supriyanto dan Utami, H.
Dengan argumen yang sama, dapat dilakukan untuk L(Vk). Untuk residual proses yang telah diketahui, terhadap hipotesis null bahwa {Xt} adalah suatu model autoregresi moving average, {et} adalah suatu deret variabel independen, dan untuk h = O(n-1/5), maka
{
}
{
}
2 E Lˆ( Vk ) ∞ (nh ) −1 ∫ K 2 ( z )dz ∫ s k ( x ) − rk ( x ) w ( x )dx ,
{
}
{
}
2 2 var Lˆ(Vk ) ∞ 2(n 2 h ) −1 ∫ G 2 (z)dz ∫ s k ( x ) − rk ( x ) w ( x )dx .
(
)
(
)
dengan s k ( x ) = E e 4 t + k e t = x = E(e 4 t ) , rk ( x ) = E e 2 t + k e r = x = σ 2 e . Dalam prakteknya kita menggunakan e t = X t − ∑ aˆ i X t −i .
IV. PROSEDUR UJI BERDASARKAN BOOTSTRAP
Ide dasar adalah menggunakan boostrap untuk membentuk distribusi null dari Lˆ(M k ) dan Lˆ(Vk ) terhadap hipotesis null : H0 : { Xt } mengikuti suatu model autoregresi linear. Dan membandingkan nilai kritik dari distribusi ini dengan nilai uji statistik yang telah dihitung berdasarkan data runtun waktu terobservasi yang ada. Prosedur ini dimulai dengan menentukan suatu model autoregresi untuk data yang ada. Dengan menggunakan kriteria informasi Akaike, diperoleh estimasi order dari model autoregresi. Selanjutnya dihitung estimasi residual : pˆ
eˆ t = X t − ∑ aˆ i X t −i i =1
dan diasumsikan
⎧
p
⎫
⎩
i =1
⎭
{e t } = ⎨X t − ∑ a i X t −i ⎬ independen
untuk model autoregresi
order p. Centering {eˆ t } dan bentuk replikasi bootstrap sebanyak B, sehingga diperoleh
{eˆ } sebanyak B. Untuk masing-masing {eˆ }dihitung Xt* dengan rumus sebagai *
*
t
berikut : Xt* =
pˆ
∑ a i X t −1 + e t * i =1
t
Uji Linearitas Berdasarkan Estimasi
35
Kemudian kita hitung nilai Lˆ(Mk ) dan Lˆ(Vk ) untuk {Xt*}. Untuk Lˆ(M k ) kita hitung 1 Lˆ* (M k ) = n
∑ {Mˆ k * (X t * ) − ρˆ k X t * } w (X t * ) n
2
t =1
Dari hasil perhitungan Lˆ(M k ) untuk masing-masing {Xt*} diperoleh estimasi bootsrap L(Mk) sebanyak B. Kemudian dari hasil tersebut dapat dihitung distribusi {Xt*}. Daerah kritik dihitung berdasarkan distribusi tersebut. Untuk nilai kritik kita tentukan dengan menggunakan quantil ke α. Langkah terakhir, kita hitung
{
1 n ˆ ˆ Lˆ(M k ) = ∑ M k (X t ) − ρ k X t n t =1
} w (X ) 2
t
untuk proses original {Xt}, dan hipotesis linearitas ditolak jika Lˆ(M k ) lebih besar dari nilai kritik α dari distribusi bootstrap. Jika proses autoregresi conditional heteroscedastik type heterogenitas di dalam residual, yaitu e t = g(e t −1 )η t dimana ηt independen, maka residual {et} menjadi tak berkorelasi tetapi tidak independen. Pelanggaran dari sifat independensi ini tidak mudah dideteksi dengan L(Mk), dan fungsional L(Vk) lebih cocok untuk statistik uji linearitas, karena ini didasarkan pada variansi bersyarat. Distribusi bootstrap dikonstruksikan dari replikasi {eˆ * t }, sedemikian sehingga
{
}
1 ˆ * (e *) − σˆ 2 k ,e* 2 w (e *) Lˆ * (Vk ) = ∑ V k t t n t dan hipotesis dari linearitas ditolak jika Lˆ(Vk ) lebih besar dari nilai kritik dari distribusi bootstrap. Karena L(Mk) dan L(Vk) bervariasi nilainya untuk semua k, maka untuk uji linearitas digunakan statistik uji : Lˆ sup (M k ) = sup Lˆ(M j ) , j≤ k
Lˆ sup (Vk ) = sup Lˆ(V j ) , j≤ k
36
Supriyanto dan Utami, H.
1 k Lˆ ave (M k ) = ∑ Lˆ(M j ) k j=1
1 k Lˆ ave (Vk ) = ∑ Lˆ(V j ) k j=1
V. HASIL SIMULASI
Untuk simulasi, digunakan data runtun waktu berukuran n = 100. Dari data ini akan diuji apakah data mempunyai model linear, dengan kata lain akan diuji mengenai linearitas. Untuk pengujian ini digunakan prosedur resampling. Dalam uji kali ini, hipotesisnya adalah : H0 : {Xt} mengikuti suatu model autoregresi linear. Sebelum dilakukan pengujian, kita periksa apakah data stasioner (Gambar 1). Untuk simulasi kali ini, setelah data di plot ternyata data stasioner. Dari data tersebut mempunyai model autoregresi order pertama, yaitu Xt = 0.9129181Xt-1 + et. Dilakukan resampling {et*} sebanyak 100 kali. Dari resampel tersebut diperoleh distribusi pendekatan bootstrap, yang dapat dilihat dari hasil program komputer. Statistik uji diperoleh 0,9151852 dan nilai kritik 1,45456. Karena statistik uji kurang dari nilai kritik, maka kita dapat menyimpulkan bahwa data
0.0
0.2
0.4
f
0.6
0.8
1.0
mengikuti model autoregresi.
-2
-1
0
1 u
Gambar 1. Plot data hasil simulasi
2
Uji Linearitas Berdasarkan Estimasi
37
VI. DAFTAR PUSTAKA
Bain, L.J., dan Engelhardt, M., Introduction to probability and Mathematical Statistics, Wadsworth Publishing Company, California, 1992.
Goodman, Roe, Introduction to Stochastic Models, Benjamin/Cummings Publishing Company, California, 1998. Hu, X. J. dan Lawless, J.F., Estimation of rate and Mean Functions from Truncated Recurrent Event Data, JASA, 91(1996), 300-310.
Hu, X. J. dan Lawless, J.F., Estimation from Truncated Lifetime Data with Supplementary Information on Covariate and Censoring Times, Biometrika, 83(1996), 747-761.
Hu, X. J.,Lawless, J.F., dan Suzuki, K., Nonparametric Estimation of a Lifetime Distribution When Censoring Times are Missing, Technometrics, 40(1998), 3-13.
Kalbfleisch, J.D. dan Lawless, J.F., Estimation of Reliability in Field Performance Studies, Technometrics, 30(1998), 365-388.
Kalbfleisch, J.D. , Lawless, J.F., dan Robinson, J.A., Methods for the Analysis and Prediction of Warranty Claims, Technometrics, 33(1991), 273-285.
Lawless, J.F., Statistical Models and Methods for Lifetime Data, John Wiley & Sons, New York, 1982. Lawless, J.F., Introduction Technometrics, 42(2000), 5-6.
to
Two
Classics
in
Reliability
Theory,
Supriyanto dan Utami, H.
38
Supriyanto, Estimasi Nonparametrik Distribusi Tahan Hidup : Kasus Data Tersensor dari Unit-Unit tak Terputus, Tesis, Pascasarjana Universitas Gadjah
Mada , Yogyakarta, 2001. Shao, Jun, dan Tu, Dongsheng, The Jacknife and Bootstrap, Springer, New York, 1995. Suzuki, K., Nonparametric Estimation of Lifetime Distributions from a Record of Failures and Follow-Ups, JASA, 80(1985), 68-72.
Thall, P.F. dan Lachin, J.M., Analysis of Recurrent Event : Nonparametric Methods of Random-Interval Count Data, JASA, 83(1988), 339-347.