Pengenalan
Analisis Deret Waktu ((Time Series Analysis) y ) MA 2081 Statistika Dasar 30 April 2012 Utriweni Mukhaiyar
Ilustrasi Berikut adalah data rata-rata curah hujan bulanan yang
diamati dari Stasiun Padaherang pada tahun 2001 – 2004. Sumber : Modul 3 Praktikum Mekanika Medium Kontinu “ Medan Gravitasi”
Tahun a u 2001 2002 2003 2004
Ja Jan 278.59 299.78 425.21 547.8
Feb eb 279.78 245.88 370.8 308.2
Mar a 355.29 266.64 300.23 388
Apr p 241.34 185.27 157.43 93
Mei e 115.9 122.22 184.96 297
Ju Jun Jul Agust Ju gust 176.9 55.32 29.08 133.1 76.78 32.4 69.93 23.28 14.39 128 47 5
Sep O Oktt Nop op Des es 43.82 313.68 508.49 267.82 26.09 169.05 461.62 415.73 17.86 275.23 433.23 456.02 87 105 389 371.6
Apabila p nilai curah hujan j saat ini dianggap gg p dipengaruhi p g oleh rata-
rata curah hujan kemarin dst, maka data rata-rata curah hujan di atas dapat dikategorikan sebagai suatu deret waktu (time series). 2
Plot Data berdasarkan waktu Rata-rata curah hujan bulanan 2001 - 2004 di Stasiun Padaherang 600
nilai cu urah hujan
500 400 300 200 100 0
0
5
10
15
20
25
waktu (bulan ke-) 3
@ UM
30
35
40
45
Proses Stokastik
4
Proses stokastik adalah barisan peubah acak {Yt , t T }
Setiap proses stokastik memuat ruang keadaan S dan indeks parameterT S : semua nilai yang mungkin dari Yt S danT d T dapat d t bernilai b il i diskrit di k it atau t kontinu k ti
Contoh proses stokastik: g a. Cuaca harian kota Bandung b. Banyaknya trombosit/hari pasien demam berdarah sejak ia terinfeksi c. Laju pertumbuhan populasi orang utan (% per tahun) d Waktu antara mekarnya bunga bangkai yang ke-n d. ke n dengan bunga bangkai yang ke n+1
Misal yt nilai dari Yt maka barisan nilai {yt , t T } disebut realisasi dari {Yt , t T }
Time Series
Jika T : waktu, maka {Yt , t T } disebut time series Realisasinya disebut data TS Studi berkaitan dengan TS disebut analisis TS Permasalahan dalam analisis TS : “Bagaimana Bagaimana menentukan model Yt sehingga model tersebut dapat digunakan untuk forecasting (prakiraan di waktu mendatang)?? ”
Secara umum, model TS dapat ditulis
(1) Yt = f (.) + et Asumsi galat: et ~ N (0, 2) dan tidak berkorelasi
Jika f linier dalam parameter-parameternya maka
persamaan (1) disebut model linier TS Koleksi semua model linier TS dinamakan model ARIMA(p,d,q) (Box-Jenkins, 1976) 5
Contoh Time Series Produksi Tembakau di AS
1500 10 000
Miliar pounds M
6 5 3
500
4
Persen
7
8
2000
9
Tingkat Pengangguran di AS
0
20
40
60
80
100
120
1880
1900
1920
Kuartal
1940
1960
1980
Tahun
Ukuran partikel setelah penyemprotan pengharum ruangan
110
112
114
116
118
20 0000 40000 6000 00 80000
Data Penjualan lynx pelts di Canada
6
1850
1860
1870
1880 Tahun
1890
1900
0
100
200
300 Menit
400
500
Manfaat dan Tujuan TS Memodelkan d lk ddata TS sehingga h ddapat ddilihat l h perilaku l k ddata
lebih lanjut Melakukan prediksi ke depan atau prakiraan jangka pendek (short-time forecasting)
7
Beberapa Konsep Dasar dalam TS K t i Kestasioneran TS {Yt , t T } stasioner jika untuk setiap t,
(konstan) 2. kov(Yt , Yt –k) = k (tidak tergantung t ) 1. E[Yt] =
Secara visual, data TS {Yt , t T } stasioner
jika data TS berfluktuasi di sekitar rataannya dengan variansi konstan
8
Beberapa Konsep Dasar dalam TS ACF fungsi ACF, f i autokorelasi t k l i
ACF (fungsi autokorelasi) : fungsi antara lag k dan k dengan, k = corr (Yt ,Yt –k). ACF sampel: n
(Y Y )(Y
rk t k 1
t
t k
Y )
n
2 ( ) Y Y t t 1
9
rk = 0 (secara signifikan) jika 1 1 1,96 1 96 rk 11,96 96 n n
Beberapa Konsep Dasar dalam TS PACF fungsi PACF, f i parsial i l autokorelasi t k l i PACF (fs. autokorelasi parsial) : fungsi antara lag k
dengan kk di mana kk = corr (Yt , Yt –k) setelah d t l h pengaruh Y1 , Y2, …, Yk-1 ditiadakan.
PACF dapat didefinisikan juga sebagai koefiesien suku
terakhir dari regresi Yt dengan Y1 , Y2, …, Yk.
Artinya, jika Yt = +1Yt-1 + 2Yt-2 + … + kYt-k maka PACF sampel untuk lag k = taksiran dari k. ˆkk ˆk atau t
ˆ
kk
10
= 0 (secara signifikan) jika
1 1 ˆ 1,96 kk 1,96 n n
C t h ACF d Contoh dan PACF d dengan g SPSS number of blowfly 8000 Coefficient
1.0
Upper Confidence Limit
0.5
6000
ACF
numb ber of blowfly
Lower Confidence Limit
0.0
4000 -0.5
-1.0
2000
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Lag Number
number of blowfly
1 3 5 7 9 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 6 6 6 6 7 7 7 7 7 8 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1
Sequence number
Coefficient
1.0
11
Upper Confidence Limit Lower Confidence Limit
0.5
Partial ACF
Dari menu SPSS, pilih Graphs p Time Series Autocorrelations... pilih variabel yang akan dihit dihitung ACF dan d PACF-nya PACF OK
0.0
-0.5
-1.0 1
2
3
4
5
6
7
8
9
10
Lag Number
11
12
13
14
15
16
Model-model Time Series Untuk TS Stasioner 1. Autoregresi (AR) : “regresi terhadap TS yg lalu & galat sekarang sekarang” AR(1): Yt = +1Yt-1 +et , di mana 1<1<1 AR(2): Yt = +1Yt-1 + 2Yt-2 + et , di mana 1<2<1, 2+1<1, 2-1<1 AR(p): Yt = +1Yt-1 + 2Yt-2 + … + pYt-p + et
12
2. Moving Average (MA) : “regresi terhadap galat yang lalu dan galat sekarang” MA(1) Yt = + et – 1et -1 , di mana 1< MA(1): 1 1<1 1 MA(2): Yt = + et – 1et -1 – 2et -2 di mana 1<2<1,, 2+1<1,, 2-1<1 MA(q): Yt = + et – 1et-1 – 2et -2 - … – qet –q
Model-model Time Series Untuk TS Stasioner 3. Autoregresi-Moving Average (ARMA) “ “regresi terhadap h d TS S yang lalu l l dan d semua galat” l ” ARMA(1,1): Yt = +1 Yt-1 +et – 1et -1 ARMA(p,q): Zt = +(1 Yt-1 + … + p Yt-p ) +(et – 1et -1 –… – qet -q ) Catatan: AR(p) = ARMA(p,0), MA(q) = ARMA(0,q)
13
Model-model Time Series Untuk TS tidak Stasioner Misal TS {Yt } tidak stasioner.
Buat TS baru yg stasioner, sebut {Zt } dengan cara diferensi, yaitu Zt = Yt – Yt-1, untuk setiap t. Maka “ARMA(p,q) untuk {Zt} disebut ARIMA (p,1,q) untuk {Zt }” Jika diferensi dilakukan d kali, ditulis
ARIMA(p,d,q) ARIMA( d ) Catatan: ARMA(p,q) = ARIMA (p,0,q) 14
Metode Box Jenkins Tahap awal: Pemeriksaan kestasioneran: - Plot TS - Jika stasioner, lanjutkan ke “tiga tahap iteratif”. Jik tidak Jika tid k lakukan l k k transformasi t f i atau t diferensi dif i Tiga tahap iteratif : 1 Identifikasi 1. 2. Penaksiran parameter 3. Uji diagnostik (pemeriksaan asumsi sisa) Jika pada uji diagnostik, ada asumsi yang dilanggar ulangi lagi 3 tahap iteratif 15
Identifikasi Model
ACF
PACF
AR(p)
Menurun secara Cut off setelah lag p eksponensial atau membentuk gelombang sinus teredam
MA(q)
Cut off setelah lag q
Menurun secara eksponensial atau membentuk gelombang sinus teredam
Mengidentifikasi orde (p,q) model ARMA melalui kriteria
Akaike (AIC)
AIC n log
+ 2m ,
m = # parameter
Hitung nilai AIC untuk setiap (p,q). Orde yang dipilih adalah 16
(p,q) dengan nilai AIC yang paling kecil
Penaksiran Parameter Metode:
- Kuadrat terkecil (untuk model AR) - Maksimum M k i lik lih d likelihood - Melard (digunakan SPSS)
Contoh penaksiran parameter melalui SPSS
Dari menu, pilih Analyze Forecasting Create Models ... Pilih nama TS sebagai Dependent variable Masukkan orde model ARIMA
17
Uji Diagnosis Ingat asumsi galat: et ~ N (0,2) dan tidak berkorelasi P Pengujian ji asumsi: i Cara 1: Plot sisaan
berfluktuasi di sekitar 0 E[et ] = 0
nilai sisaan di sekitar 1,96ˆ Var(et) = 2 2
plot ACF serta plot PACF-nya
rk dan ˆkk signifikan 0 sisaan “tidak berkorelasi”
Cara 2: Uji Ljung-Box Uji j “H0: korelasi antar sisaan = 0” dengan g statistik Ljung-Box j g 2 h * k Jika Q
ditolak 18
*
r Q n(n 2) k 1 n k
> 2, dengan = h – m dan m = # parameter, parameter maka H0
Contoh Hasil produksi bulanan perkebunan teh di lokasi PAL tahun
1992-2009 (T = 216) Produksi teh "PAL" 1992-2009 1992 2009 diferensi 1 kali
300000
150000
250000
100000
200000
produksi teh
produksi teh
Produksi teh "PAL" 1992-2009
150000 100000
0 0
50
100
-50000
50000 0
-100000 0
50
100 bulan ke-
19
50000
150
200
bulan ke-
150
200
Contoh Sari Numerik Data Data perkebunan teh PAL Mean Standard Error Median Mode Standard Deviation p Sample Variance Kurtosis Skewness Range Mi i Minimum Maximum Sum Count 20
133793.6 2488.531 136781 #N/A 36573.79 1.34E+09 0.222436 ‐0.07241 218458 36305 254763 28899412 216
Data perkebunan teh PAL (diff 1 kali) Data perkebunan teh PAL (diff 1 kali) Mean Standard Error Median Mode Standard Deviation Sample Variance Sample Variance Kurtosis Skewness Range Mi i Minimum Maximum Sum Count
455.7023 2407.674 ‐1515 ‐15033 35303.43 1.25E+09 1.25E 09 1.855309 0.701741 216395 ‐81536 81536 134859 97976 215
Contoh Identifikasi ACF menurun seperti
gelombang sinus teredam sedangkan PACF cut off setelah g lag-1. Model yang mungkin adalah AR(1)
ACF cut off setelah
lag-1 sedangkan PACF jjuga g seperti p cut offff setelah lag-1. Ada beberapa model yang g seperti mungkin, ARIMA(1,1,1) 21
Contoh
AR (1)
Penaksiran dan Uji Diagnostik
ARIMA (1,1,1)
Diperoleh AR(1) : Yt 134113, 420 0,535Yt 1 et
22
Diperoleh ARIMA(1,1,1) :
Z t 19, 205 0, 434 Z t 1 0,934et 1 et
Contoh Kesimpulan Berdasarkan hasil Ljung-Box, dimana pada model AR(1) H0
ditolak dit l k ((sisaan i bberkorelasi) k l i) untuk t k semua 1% 10%, 10% sedangkan ARIMA(1,1,1) tidak ditolak untuk <1,7%. Oleh karena itu model ARIMA(1,1,1) ( , , ) bisa dianggap gg p lebih cocok (dengan sisaan yang tidak berkorelasi) sehingga dapat digunakan untuk melakukan short-time forecast dengan menggunakan persamaan : Z t 19,, 205 0,, 434 Z t 1 0,934 , et 1 et
Yt 1 Yt 19, 205 0, 434(Yt Yt 1 ) 0,934et 1 Yt 1 19, 19 205 11, 434Yt 00, 434Yt 1 00,934 934et 1 23
Referensi •
•
Box, G. B G E. E P. P dan d Jenkins, J ki G G. M M. (1976): ( ) Time Ti S Series i Analysis: Forecasting & Control, Holden-Day Inc., San Fransisco Cryer, J. D. dan Chan, K. S. (2008): Time Series Analysis with Applications in R, Springer, New York.
24