SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA UNY 2016 S - 19
Identifikasi Spurious Long Memory Dengan Menggunakan Metode Window Parzen Gumgum Darmawan1, 2Bertho Tantular, 3Zulhanif, 4Resa Septiani Pontoh 1,2,3,4
Statistika (MIPA, UNIVERSITAS PADJADJARAN) email
[email protected]
Abstrak—Spurious long memory disebut juga dengan long memory. Kondisi ini terjadi karena beberapa hal diantaranya adalah adanya data pencilan (outlier), structure break. Jika data deret waktu mempunyai sifat Spurious long memory, maka pemodelan dengan menggunakan ARFIMA (Autoregresive Fractionnaly Integrated Moving Average) akan menghasilkan MSE dan MAPE yang besar. Untuk itu perlu di identifikasi apakah data deret waktu yang akan diolah mempunyai sifat Spurious long memory atau tidak. Salah satu sifat adanya gejala Spurious long memory pada data deret waktu adalah adanya ketidak konsistenan nilai pembeda d dari data jika banyaknya data berubah. Identifikasi gejala Spurious long memory melalui plot tidak bisa menjadi kesimpulan. Dalam penelitian ini akan digunakan periodogram dengan menggunakan penghalus Window Parzen untuk mengidentifikasi adanya gejala Spurious long memory. Kata kunci: Periodogram, Spurious Long Memory, Window Parzen.
I.
PENDAHULUAN
Data deret waktu akan mempunyai sifat ketergantungan jangka panjang (long memory) jika diantara pengamatan dengan periode yang terpisah jauh masih mempunyai korelasi tinggi. Sifat dari data deret waktu seperti ini mempunyai fungsi autokorelasi (ACF) k untuk lag ke-k, turun secara hiperbolik. Sedangkan data deret waktu yang stasioner akan mempunyai sifat ketergantungan jangka pendek (short memory) jika mempunyai fungsi autokorelasi k yang turun secara cepat atau turun secara eksponensial. Model data deret waktu ketergantungan jangka panjang sering disebut dengan Model ARFIMA (Autoregressive Fractionally Integrated Moving Average) dengan parameter pembeda berbentuk bilangan pecahan, ini berbeda dengan model ARIMA yang mempunyai parameter pembeda berupa bilangan bulat. Penelitian mengenai model ARFIMA pertama kali dikembangkan pada [1] adalah merupakan pengembangan dari model ARIMA. Pada referensi [2] mengkaji sifat-sifat long memory dari model ARFIMA stasioner dan nonstasioner. Pemodelan ARFIMA tidak terlepas dari penaksiran parameter pembedanya. [3] mengembangkan penaksiran parameter pembeda melalui Metode Exact Maximum Likelihood. Sedangkan [4] telah mengembangkan sebuah pendekatan Maximum Likelihood untuk parameter pembeda melalui metode Nonlinear Least Square (NLS), akan tetapi menurut [5] apabila menggunakan metode Maximum Likelihood akan menemui kendala dalam penurunan fungsi autokovarian dari model ARFIMA-nya. Kelemahan ini mengakibatkan para peneliti mencoba melakukan penaksiran parameter melalui metode regresi spektral. Dalam penelitian ini, akan di kaji secara empiris apakah suatu data mempunyai pola spurious long memory atau tidak. Kerugian jika menganalisis data long memory palsu dengan model ARFIMA akan menyebabkan bias yang cukup besar, untuk itu perlu dilakukan identifikasi apakah data long memory yang kita miliki merupakan spurious long memory atau true long memory. Kajian tentang spurious long memory sudah banyak ditelaah seperti pada [6], [7] dan [8] yang menyatakan bahwa structure break pada data linier bisa membentuk pola long memory palsu. Selanjutnya [9] mengkaji bahwa markov switching dan Threshold dapat memunculkan sifat long memory palsu pada data nonlinier. Dalam penelitian ini penulis mencoba melakukan identifikasi secara sederhana terhadap data long memory. Data yang mempunyai pola long memory di kurangi satu demi satu (sekuensial) kemudian dihitung nilai koefisien d dengan menggunakan metode SPR. Data yang mempunyai sifat spurious long memory memperlihatkan bahwa dengan mengurangi sedikit data dari data aslinya nilai koefisien pembeda d akan berubah secara signifikan.
MS 121
ISBN 978-602-73403-1-2
II.
METODE PENELITIAN
A Menentukan Nilai koefisien pembeda d Penaksiran parameter long memory melalui metode regresi spektral untuk parameter pembeda (d) diusulkan oleh Geweke dan Porter-Hudak , pertama membentuk fungsi densitas spektral menjadi persamaan regresi linier dan menaksir parameter d melalui metode Ordinary Least Square (OLS). Geweke dan Porter-Hudak mendapatkan taksiran parameter d dari model ARFIMA (p,d,q) sebagai berikut. a.1 Menentukan model spektral ARFIMA(p,d,q).
f Z j fW j 2sin j / 2
2 d
dengan fW
merupakan fungsi densitas spektral dari j
Model ARMA(p,q). Sehingga
2 q exp( i j ) f Z j a 2 p exp( i j ) Dari model di atas
2
j 2 sin 2
f Z j
j 2 j / T , j 1, 2,..., T / 2
2 d
j ,
,
(1)
jika j 0 , untuk sampel berukuran t dan
adalah sebuah himpunan frekuensi harmonik.
a.2 Menentukan bentuk logaritma natural dari model ARFIMA(p,d,q).
ln f Z j d ln 1 exp( i j )
2
ln fW j
fW j fW 0
ln fW 0 d ln 1 exp( i j ) ln -2
dengan mengganti
j 2 j / T , j 1, 2,..., T / 2 .
a.3 Menambahkan bentuk logaritma natural dari periodogram persamaan (2) diperoleh ;
ln I Z j Jika
ln fW 0 d ln 1 exp i j
2
pada kedua sisi
(3)
m T / 2 dengan m adalah bandwith optimal dari regresi spektral, maka j
ln fW j / fW 0 0 .
Menentukan bentuk Periodogram dari persamaan (3). Metode GPH mempunyai bentuk periodogram,
I Z j dengan
Z t ( lnI z j ),
f I W j Z j ln fW 0 f Z j
ln
mendekati nol. Dan jika m / T 0, T , maka a.4
(2)
t
T 1 1 0 2 t cos( t. j ) , j , t 1 2
(4)
nilai autokovarian dari lag ke-t. Bentuk periodogram ini digunakan oleh [10], dengan
mengganti indeks dari frekuensi j l,l 1,...,g T , [10] menyarankan nilai l optimal adalah 2. Sedangkan Penaksiran SPR mempunyai bentuk fungsi periodogram sebagai berikut g (T ) (5) 0 0 2 t t cos( t. j ) , , t 1 * Nilai g T T , dengan 0,9 , sedangkan t merupakan bobot dari fungsi autokovarian yang
I Z j
1 2
*
dikenal dengan nama Window Parzen.
MS 122
SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA UNY 2016
2 3 g* ( T ) * * 1 6 t / g ( T ) 6 t / g ( T ) , 0 t , 2 3 t t g* ( T ) 2 1 * , t g ( T ). 2 g (T )
a.5
Menaksir Parameter pembeda (d) Menurut Geweke dan Porter-Hudak persamaan (3) dapat didekati dengan persamaan regresi
linier sebagai berikut ;
Yj 0 1 X j a j ,
j 1,2,...,m .
Parameter d dapat ditaksir melalui metode Least Square dengan persamaan,
x j x y j y m
ˆ1 dˆ
j 1
xj x m
2
, m g(T ) T ,0 1
(6)
j 1
dengan
ˆ 0 ln fW 0 , Y j ln I Z j ,
X j ln 1 exp( i j )
(7) 2
(8)
1m X Xj . m j 1 Untuk variabel Xj , melalui persamaan Euler
exp i cos i sin , exp( i ) exp( i ) , 2i exp i exp i cos . 2 sin
akan menjadi,
1 X j ln 2 1 exp i j i / 2 i / 2 i / 2 e j e j e j 1 ln 4 sin 2 / 2 j
B.
2
Menentukan Batas Atas Dan Batas Bawah Dari d.
Batas Atas dan Batas Bawah dari d merupakan titik atas dan titik bawah dari taksiran interval d. Disini nilai confident interval-nya adalah 95%. MS 123
ISBN 978-602-73403-1-2
C.
Menetukan Nilai d dari data T-i, secara sekuensial i=1-k.
Nilai d dari data dilakukan untuk T-1,T-2,....T-k, disini k =15 dengan menggunakan metode SPR seperti pada bagian A. D.
Membuat Grafik data d .
Pembuatan grafik kendali d ini dilakukan untuk mempermudah membuat kesimpulan. Penentuan Batas Atas (BA) dan Batas Bawahnya (BB) mengikuti langkah (B). Pembuatan grafik ini digunakan macro R (lihat program listing grafik d). E.
Menentukan Kesimpulan
Kesimpulan apakah data mempunyai sifat spurious long memory atau tidak dapat dilihat pada gambar batas kendali d. Jika ada minimal satu nilai d yang berada diluar batas kendali maka dapat dikatakan bahwa data mempunyai sifat spurious long memory. Sebaliknya, jika semua nilai d berada dalam batas kendali maka dapat dikatakan bahwa data mempunyai sifat true long memory III.
HASIL DAN PEMBAHASAN
Pada bagian ini, langkah-langkah yang telah dilakukan pada bagian II akan diaplikasikan untuk 3 data deret waktu yaitu data AirPassengers, data Emisi_Karbon dan Data Nile. Dari ketiga data tersebut menunjukan pola long memory dengan menggunakan metode SPR. Nilai koefisien pembeda untuk Airpassengers = 0,667, Emisi Karbon = 0,714, dan Nile = 0,413. Data AirPassengers adalah data jumlah penumpang pesawat terbang, data Nile adalah data kenaikan permukaan sungai Nile dan data Amisi Karbon adalah data kadar CO2 di United Kingdom. Data AirPassengers dan Data Nile dapat ditemukan pada software R dengan mengetik data() di R-console, sedangkan data Emisi Karbon dapat di dapatkan di website World Data Bank. Dari hasil penentuan nilai d ketiga data memperlihatkan bahwa data AirPasengers dan Emisi Karbon menunjukan data long memory non stasioner karena d > 0,5 sedangkan data Nile menunjukan data long memory stasioner karena d < 0,5. Nilai Batas Atas dan Batas Bawah untuk setiap data adalah sebagai berikut AirPassengers = [0.891, 0.443], Emisi Karbon = [1.067, 0.360] dan Nile = [0.742, 0.181]. Langkah selanjutnya (langkah 3), menentukan nilai koefisien pembeda (d) untuk T-i setiap data dengan menggunakan metode SPR. Hasil perhitungan dapat dilihat pada tabel 1 dengan i = 15 data terakhir. TABEL 1 NILAI KOEFISIEN PEMBEDA UNTUK TIGA(3) DATA LONG MEMORY T-i
T-1
T-2
T-3
T-4
T-5
T-6
T-7
T-8
T-9
T-10
T-11
T-12
T-13
T-14
T-15
AirPassenger
0,781
0,779
0,799
0,842
0,908
0,92
0,866
0,806
0,747
0,702
0,67
0,643
0,627
0,622
0,631
Emisi_Karbon
0,728
0,739
0,751
0,767
0,713
0,73
0,749
0,758
0,776
0,789
0,802
0,823
0,833
0,843
0,839
Nile
0,431
0,443
0,451
0,452
0,542
0,452
0,446
0,448
0,45
0,444
0,45
0,451
0,453
0,443
0,452
Langkah ke empat yaitu membuat plot gambar, disini kami membuat macro R sebagai berikut. Plot yang dimunculkan adalah data hasil penentuan nilai d sebanyak 15 (berwarna biru) dan garis batas bawah serta garis batas yang berwarna merah. Macro R untuk melakukan komputasi dan pembuatan gambar pada tahap 3 dan 4 dapat dilihat pada lampiran. Hasil dari tabel 1, dibuat gambarnya supaya tampak titik-titik nilai d dari setiap data. Nilai d yang berada antara batas atas dan batas bawah menunjukan bahwa data tersebut true long memory. Dari gambar 1, tampak bahwa data Emisi Karbon dan data Nile merupakan data true long memory karena semua nilai d berada pada interval tersebut. Data AirPassengers mengindikasikan bahwa data tersebut merupakan data Spurious long memory, karena ada dua nilai d yang keluar/melewati Batas atasnya.
MS 124
SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA UNY 2016
AIR PASSENGERS
EMISI KARBON
NILE
GAMBAR 1. PLOT NILAI d UNTUK T-i ,i=15) DARI 3 DATA PENELITIAN
IV.
SIMPULAN DAN SARAN
Dari hasil analisis dapat disimpulkan bahwa data Emisi Karbon dan data Nile merupakan data true long memory sedangkan data AirPassengers mengindikasikan bahwa data tersebut merupakan data Spurious long memory. DAFTAR PUSTAKA Granger,C.W.J dan Joyeux,R, “An Introduction to Long Memory Time Series Models and Fractional Differencing,” Journal of Time Series Analysis,vol.1,pp.15-29 [2] Hosking,J.R.M ,” Fractional Differencing”,Biometrica, vol.68,pp.165-176,1981. [3] Sowell,F.,”Maximum likelihood estimation os stationary univariate fractionally integrated time series models”, Journal of Econometrics,vol.53,page.165-188, 1992. [4] Beran,J,” maximum Likelihood Estimation of the Differencing Parameter for Invertible Short and Long Memory Autoregressive Integrated Moving Average Model,” Journal of the Royal Statistical Society,vol.57,pp.659-672, 1994. [5] Geweke J and Porter-Hudaks,S. “The estimation and aplication of long memory time series models”, Journal of time seris analysis,vol.4,page 221-238,1983. [6] Granger and Hyung,” Occasional Structural Breaks and Long Memory ,” Journal of Empirical Finance, Vol.11,pp.399421,2004. [7] Sibbersten,P,” Long-Memory versus Structural Change : An overview,” Statistical Papers, vol.45,pp.465-515,2004. [8] Banerjee,A and Urga,G, ” Modelling Structural Breaks, Long Memory and Stock Market Volatility : An overview ,” Journal of Econometric, Vol.129,pp.1-24, 2005. [9] Kuswanto and Sibbertsen, “ A Study on Spurious Long Memory in Nonlinear Time Series Models,” Applied Mathematical Science,vol.2,no.55,pp.2713-2734, 2008. [10] Robinson,P.M.,”Log-Periodogram regression of time series with long range dependence”, Annals os statistics,vol.23,page.1048-1072, 1995. [1]
MS 125
ISBN 978-602-73403-1-2
Lampiran Listing_Program_Macro R
# # # #
LISTING PROGRAM IDENTIFIKASI SPURIOUS LONG MEMORY DATA # # # #
########################### SEKUENSIAL SPR ####################################### #x<-read.csv(file="D:emisi_carbon.csv",header=FALSE) #x<-Nile #N<-length(x[,1]) #x<-AirPassengers #N<-length(AirPassengers) d<-fdSperio(x,bandw.exp=0.5,beta=0.9)$d das<-fdSperio(x,bandw.exp=0.5,beta=0.9)$sd.as batas_atas<-d+1.96*das batas_bawah<-d-1.96*das dx<-c(); j<-15 for (i in (1:j)) { dx[i]<-fdSperio(x[(1:(N-i))],bandw.exp=0.5,beta=0.9)$d } d dx batas_atas batas_bawah ####################### GRAFIK BATAS KOEFISIEN DIFFERENCING ####################
#data=read.csv(file="D:AirPassengers.csv",header=FALSE,sep=",") #data=read.csv(file="D:emisi_karbon.csv",header=FALSE,sep=",") #data=read.csv(file="D:nile.csv",header=FALSE,sep=",") critx1=4 critx2=7 BA=rep(0.6752905,15) BB=rep(0.1523082,15) plot(data[,1], type="o", col="blue", ylim=c(0,1),xlim=c(1,15)) lines(BA, type="o", pch=22, lty=2, col="red") lines(BB, type="o", pch=22, lty=2, col="red") title(main="Grafik Batas Koefisien Differencing", col.main="red", font.main=4) legend(12,c("BA","BB"), cex=0.8, col=c("blue","red"), pch=21:22, lty=1:2);
MS 126