Penerapan Model ARIMA (Bagian I) Dr. Kusman Sadik, M.Si Departemen Statistika IPB, 2016
1
Ada tiga tahapan iterasi dalam pemodelan data deret waktu, yaitu: 1. Penentuan model tentatif (spesifikasi model) berdasarkan data contoh untuk mengidentifikasi nilai p, d, dan q. 2. Pendugaan parameter model ARIMA(p, d, q) yang diidentifikasi, yaitu penduga nilai , , dan σ2𝑒 . 3. Analisis diagnostik untuk melihat kelayakan model.
2
Prosedur iterasi ini sering disebut ”Metode BoxJenkins”.
Untuk model ARIMA(p, d, q), spesifikasi dilakukan untuk menentukan nilai p, d, dan q.
Alat yang digunakan pada tahap identifikasi ini adalah fungsi autokorelasi.
Fungsi autokorelasi ini diduga dari data contoh atau disebut
fungsi
autokorelasi
contoh
(sample
of
autocorrelation function atau SACF atau ACF saja).
Disamping itu ada pula fungsi autokorelasi parsial (sample of partial autocorrelation function atau SPACF atau PACF saja) 3
a. ACF nk
rk
(Y Y )(Y t
t 1
n
t k
Y )
2 ( Y Y ) t
,
k 1, 2, ....
t 1
n
Y
Y t 1
t
n
rk merupakan penduga bagi k
4
a. PACF
PACF : kk = Corr(Yt, Yt-k | Yt-1, Yt-2, …, Yt-k+1)
Berdasarkan persamaan Yule-Walker:
j = k1j-1 + k2j-2 + ... + kkj-k j = 1, 2, ..., k; Catatan: j = -j dan 0 = 1
k ACF;
kk PACF ˆkk penduga bagi kk
5
Contoh: Misal diketahui data : 4, 2, 5, 1. Tentukan ACF (r1, r2) dan PACF (𝜙11 , 𝜙22 ) nk
Melalui persamaan rk
(Y Y )(Y t 1
t
n
t k
Y )
2 ( Y Y ) t
,
k 1, 2, ....
t 1
Dapat diperoleh penduga ACF : r1 = -0.7 dan r2 = 0.4
6
Berdasarkan
persamaan
Yule-Walker
dapat
diperoleh
penduga PACF kk:
j = k1j-1 + k2j-2 + ... + kkj-k Untuk k =1 j = 1
1 = 110
1 = 11(1) r1 = 𝜙11 = -0.7
Untuk k = 2 j = 1, 2
1 = 210 + 221
1 = 21 + 221
2 = 211 + 220
2 = 211 + 22 7
1 = 210 + 221
1 = 21 + 221
2 = 211 + 220
2 = 211 + 22
(1)2 = 211 + 22(1)2
...... Pers(1)
2 = 211 + 22
……..
Pers(2)
Berdasarkan Pers(1) dan Pers(2) diperoleh: (1)2 - 2 = 22(1)2 - 22
22 = {(1)2 - 2}/{(1)2 - 1} 𝜙22 = {(r1)2 - r2}/{(r1)2 - 1} = 0.09/(-0.51) = -0.176 8
Pengidentifikasian Model Model MA: Misal MA(1) : Yt = et - et-1
ACF :
1 2 ; k 1 k 0 ; k 1
1.0
1.0
0.8
k
0.8
0.6
rk
0.4
0.6 0.4
0.2
k
0.0 1
2
3
ACF
4
5
0.2
k
0.0 1
2
3
4
5
6
Sample of ACF
9
Karena rk berasal dari data contoh maka diperlukan galat baku bagi rk yaitu Srk.
Sebagai nilai pendekatan : Srk = 1 / n , dimana n adalah banyaknya data.
Sehingga hipotesis H0 : k = 0 ditolak jika | rk | > 2Srk atau | rk | > 2 / n .
Misalnya, jika | r1 | > 2 / n dan | rk | < 2 / n untuk k = 2, 3, …, maka model tentatifnya adalah MA(1).
10
Model AR : Misalkan AR(1) : Yt = Yt-1 + et
ACF : k = k ; k = 1, 2, …
Untuk model AR, ACF merupakan fungsi eksponensial sehingga ACF tidak dapat digunakan untuk menentukan nilai p dalam AR(p).
PACF : untuk k = 1 1 = 11 untuk k = 2 1 = 21 + 221 .... (1)
2 = 211 + 22 .... (2)
11
Berdasarkan persamaan (1) dan (2) 22 = 0. Demikian juga 33 = 44 = ... = 0. 1 Sehingga PACF AR(1): kk 0
; k 1 ; k 1
Dengan demikian PACF dapat digunakan sebagai penentu nilai p dalam model AR(p).
1.0 1.0
0.8
kk
ˆ
0.6
kk
0.8 0.6
0.4
0.4
0.2
0.2 0.0
0.0 1
2
3
PACF
4
5
1
2
3
4
5
6
Sample of PACF
Hipotesis H0 : kk = 0 ditolak jika | ˆkk | 2 / n . 12
Pengidentifikasian nilai p dan q 1.0
tails off
0.8 0.6 0.4 0.2 0.0 1
2
3
4
5
6
7
8
9
Sample of ACF
1.0
cuts off after lag q
0.8 0.6 0.4 0.2 0.0 1
2
3
4
5
6
7
8
9
Sample of ACF
13
14
Contoh (1)
15
Contoh (2)
16
Contoh (3) d=1
d=1
17
Pendugaan Parameter Model Apabila nilai p, d, dan q sudah dapat diidentifikasi, maka selanjutnya dilakukan pendugaan terhadap parameter model, yaitu 1, 2, ..., p untuk model AR(p) dan 1, 2, ..., q untuk model MA(q) berdasarkan data terobservasi Y1, Y2, ..., Yn. Metode pendugaan parameter :
Metode momen,
Metode kuadrat terkecil (least-square),
Metode kemungkinan maksimum (maximum likelihood). 18
1. Metode Momen Metode ini didasarkan pada persamaan momen contoh dan momen teoritis, kemudian memecahkan persamaan-persamaan tersebut untuk mendapatkan penduga bagi parameter model. Misalnya, menduga rataan populasi (teoritis) dengan rataan contoh Y . Model AR a. AR(1) : Yt = Yt-1 + et
k = k ; k = 1, 2, …
1 = ˆ1 ˆ r1 = ˆ
Jadi pada AR(1) penduga bagi parameter model, , adalah r1 yang dapat dihitung dari data. 19
b. AR(1) : Yt = + Yt-1 + et
Bagaimana menduga ?
Perhatikan model : (Yt - 𝑌)= (Yt-1 - 𝑌) + et ↔ (Yt - 𝑌)= (Yt-1 - 𝑌) + et ↔ Yt = (1 - )𝑌 + Yt-1 + et ↔ Yt = + Yt-1 + et Sehingga : = (1 - )𝑌
20
c. AR(2) : Yt = 1Yt-1 + 2Yt-2 + et Berdasarkan persamaan Yule-Walker :
k = 1k-1 + 2k-2 + ... + pk-p maka diperoleh
1 = 1 + 21 dan 2 = 11 + 2 dengan metode momen diperoleh: r1 = ˆ1 + ˆ2 r1 dan r2 = r1 ˆ1 + ˆ2 penyelesaian terhadap dua persamaan ini diperoleh: r1 (1 r2 ) r2 r1 ˆ ˆ dan 2 1 2 2 1 r1 1 r1
2
21
Model MA MA(1) : Yt = et - et-1
1 1 2
ˆ r1 1 ˆ 2
1 1 4r1 sehingga diperoleh : ˆ 2r1
2
Sebagai catatan untuk persamaan ini, apabila | r1 | > 0.5 maka metode momen gagal untuk menduga parameter .
Untuk MA(2), MA(3), dst, metode momen menjadi sangat kompleks, sehingga harus menggunakan metode pendugaan lainnya. 22
Model ARMA ARMA(1, 1) : Yt = Yt-1 - et-1 + et
k
(1 )( ) k 1 2 1 2
2 r sehingga penduga bagi adalah : ˆ 2 1 r1 Untuk menduga dapat digunakan persamaan pertama dengan cara mengganti 1 dengan r1 dan dengan ˆ , yaitu (1 ˆˆ)(ˆ ˆ) r1 1 2ˆˆ ˆ 2 23
Contoh Kasus (Latihan): Misalnya diketahui model AR(2) : Yt = + 1Yt-1 + 2Yt-2 + et. Berdasarkan data diketahui bahwa r1 = 0.75, r2 = 0.61, dan Y = 4.5. Tentukan ˆ , ˆ1 , dan ˆ2 dengan metode momen.
24
2. Metode Kuadrat Terkecil Metode ini dilakukan dengan cara meminimumkan komponen n
pada galat, yaitu
et . 2
t 1
AR(1) : Yt = Yt-1 + et n
S() = et = t 1
2
et = Yt - Yt-1
n
(Y Y t 1
t
2 ) t 1
Penduga bagi parameter model, , dapat diperoleh dengan cara meminimumkan S().
25
MA(1) : Yt = et - et-1
et = Yt + et-1
et = Yt + ( Yt-1 + et-2) et = Yt + Yt-1 + 2Yt-2 + 3Yt-3 + ….
n
S() = et
2
t 1
Meminimumkan S() tidak dapat dilakukan secara analitik / kalkulus karena bersifat non-linear, sehingga harus diselesaikan secara numerik / iteratif, salah satunya melalui algoritma Gauss-Newton. 26
3. Metode Kemungkinan Maksimum Metode ini dilakukan dengan cara memaksimumkan fungsi kemungkinan (likelihood), berdasarkan fungsi sebaran galat (e t).
bsi
AR(1) : Yt = Yt-1 + et, misal et ~ N(0, e2) f(e1, e2, …., en) = (2 )
2 ( n 1) / 2 e
L(,
e2)
= (2 )
2 ( n 1) / 2 e
. exp(
. exp(
1 2 e2
n
1 2 e2
2 e t) t 1
n
(Y Y ) ) 2
t 1
t
t
Penduga dan e2 dapat diperoleh dengan cara memaksimumkan fungsi kemungkinan L(, e2). 27
MA(1) : Yt = et - et-1 Fungsi kemungkinannya, L(, e2), bersifat non-linear sehingga pemaksimumannya harus dilakukan secara numerik / iteratif.
Catatan : SAS dan Minitab menggunakan metode iterasi Gauss-Newton untuk menduga parameter AR(p), MA(q), dan ARIMA(p, d, q).
28
Studi Kasus : Tentukan model terbaik untuk data bulanan penjualan suatu produk (Zt) sebagai berikut:
Zt
10
0
-10 Index
10
20
30
40
Zt : Data Asal 29
2
Zt(lag1)
1 0 -1 -2 -3 Index
10
20
30
40
Zt(lag1) : Data Zt setelah differencing ordo-1
30
3
Zt(lag2)
2 1 0 -1 -2 Index
10
20
30
40
Zt(lag2) : Data Zt setelah differencing ordo-2
31
Autocorrelation Function for Zt
(with 5% significance limits for the autocorrelations) 1.0 0.8
Autocorrelation
0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1
2
3
4
5
6 Lag
7
8
9
10
11
Ada indikasi tidak stasioner. Mengapa? 32
Autocorrelation Function for Zt(lag1)
(with 5% significance limits for the autocorrelations) 1.0 0.8
Autocorrelation
0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1
2
3
4
5
6 Lag
7
8
9
10
11
Ada indikasi tidak stasioner. Mengapa? 33
ACF Autocorrelation Function for Zt(lag2)
(with 5% significance limits for the autocorrelations) 1.0 0.8
Autocorrelation
0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1
2
3
4
5
6 Lag
7
8
9
10
11
Ada indikasi sudah stasioner. Mengapa? 34
PACF Partial Autocorrelation Function for Zt(lag2)
(with 5% significance limits for the partial autocorrelations) 1.0
Partial Autocorrelation
0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1
2
3
4
5
6 Lag
7
8
9
10
11
35
Autocorrelation Function for Zt(lag2)
(with 5% significance limits for the autocorrelations) 1.0 0.8
Autocorrelation
0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6
Partial Autocorrelation Function for Zt(lag2)
-0.8
(with 5% significance limits for the partial autocorrelations)
-1.0 2
3
4
5
6 Lag
7
8
9
10
1.0
11
0.8 Partial Autocorrelation
1
0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1
2
3
4
5
6 Lag
7
8
9
10
11
Kandidat Model : ARIMA(0,2,1)dan ARIMA(1,2,0)
36
ARIMA(0,2,1) ARIMA model for Yt Estimates at each iteration Iteration SSE Parameters 0 66.1073 0.100 0.031 1 57.5810 -0.050 -0.011 2 51.8387 -0.200 -0.048 3 48.8500 -0.350 -0.083 4 48.3704 -0.435 -0.099 5 48.3691 -0.439 -0.099 6 48.3691 -0.439 -0.099
Relative change in each estimate less than
0.0010
Final Estimates of Parameters Type Coef SE Coef MA 1 -0.4393 0.1371 Constant -0.0995 0.1581
P 0.003 0.533
T -3.20 -0.63
Differencing: 2 regular differences Number of observations: Original series 47, after differencing 45 Residuals: SS = 48.3592 (backforecasts excluded) MSE = 1.1246 DF = 43 37
ARIMA(1,2,0) ARIMA model for Yt Estimates at each iteration Iteration SSE Parameters 0 55.9021 0.100 0.035 1 50.7183 0.250 -0.022 2 47.5927 0.400 -0.056 3 46.1186 0.543 -0.069 4 45.9902 0.582 -0.067 5 45.9806 0.592 -0.067 6 45.9799 0.595 -0.067 7 45.9799 0.596 -0.067 8 45.9799 0.596 -0.067 Relative change in each estimate less than
0.0010
Final Estimates of Parameters Type Coef SE Coef AR 1 0.5958 0.1225 Constant -0.06673 0.06299
P 0.000 0.295
T 4.86 -1.06
Differencing: 2 regular differences Number of observations: Original series 47, after differencing 45 Residuals: SS = 45.9799 (backforecasts excluded) MSE = 1.0693 DF = 43 38
Pemilihan Model Terbaik Berdasarkan MSE Terkecil Berdasarkan hasil di atas: ARIMA(0, 2, 1) MSE : 1.1246 ARIMA(1, 2, 0) MSE : 1.0693 Sehingga model terbaik berdasarkan nilai MSE terkecil adalah ARIMA(1, 2, 0). Model terbaik yang diperoleh dapat digunakan untuk melakukan peramalan.
39
1. Melalui Minitab, bangkitkan data yt, (n = 225), berupa model ARIMA(1, 2, 0) dengan = 0.5, Φ = 0.8 serta et ~ Normal(0,1). Gunakan 200 data terakhir dan lakukan proses berikut: a. Berdasarkan ACF dan PACF untuk data yt tersebut, identifikasilah kandidat model yang sesuai. b. Berdasarkan kandidat model tersebut, tentukan model terbaik berdasarkan nilai MSE-nya. c. Bandingkan penduga parameter yang diperoleh untuk model terbaik pada poin (b) tersebut dengan nilai parameter yang sesungguhnya. Apa kesimpulan Anda? 40
2. Melalui Minitab, bangkitkan data yt, (n = 225), berupa model ARIMA(1, 1, 2) dengan = 1.0, Φ = 0.8, θ1 = - 0.9, dan θ2 = 0.7 serta et ~ Normal(0,1). Gunakan 200 data terakhir dan lakukan proses berikut: a. Berdasarkan ACF dan PACF untuk data yt tersebut, identifikasilah kandidat model yang sesuai. b. Berdasarkan kandidat model tersebut, tentukan model terbaik berdasarkan nilai MSE-nya. c. Bandingkan penduga parameter yang diperoleh untuk model terbaik pada poin (b) tersebut dengan nilai parameter yang sesungguhnya. Apa kesimpulan Anda? 41
Lihat Montgomery : Exercise 5.11, hlm. 290
42
Cryer, J.D. and Chan, K.S. 2008. Time Series Analysis with Application in R. Springer.
Montgomery, D.C., et.al. 2008. Forecasting Time Series Analysis 2nd. John Wiley.
Wei, William, W.S. 1990. Time Series Analysis, Univariate and Multivariate Methods. Adison-Wesley Publishing Company Inc, Canada.
Abraham, B. and Ledolter, J. 2005. Statistical Methods for Forecasting. John Wiley.
43
Bisa di-download di http://www.stat.ipb.ac.id/en/index.php?page=dr-kusman-sadik
44
45