Dr. Kusman Sadik Dept. Statistika IPB, 2015
Diagnostik Model Analisis Sisaan Sisaan = Nilai Aktual – Nilai Prediksi Apabila model ARIMA(p, d, q) benar dan dugaan parameter sangat dekat ke nilai yang sebenarnya maka sisaan akan memiliki sifat seperti yang diasumsikan pada et, yaitu: menyebar bebas dan identik et ~ N(0, e2)
Pemeriksaan asumsi tersebut dapat dilakukan secara deskriptif maupun analitik. Secara deskriptif dapat dilakukan sebagai berikut: Kebebasan / independent : plot eˆt dengan t Kenormalan / normality : plot eˆt dengan normal score
Uji Ljung-Box-Pierce (modified Box-Pierce) Secara analitik, uji ini dapat digunakan untuk memeriksa asumsi kebebasan antar et (independence) berdasarkan autokorelasi pada et. H0 : antar et tidak berkorelasi (bebas) H1 : antar et berkorelasi Apabila H0 diterima maka dapat dikatakan bahwa model ARIMA yang digunakan adalah layak. K rˆ 2 Q* = n(n 2) e ( k ) k 1 n k
n
= banyaknya data sisaan, eˆt
rˆe ( k ) = autokorelasi eˆt dengan eˆt k
Tolak H0 jika Q* > 2(db = K – p – q) 1
Dr. Kusman Sadik Dept. Statistika IPB, 2015
Overfitting Diagnostik model dapat pula dilakukan melalui overfitting. Misalnya
: Jika teridentifikasi AR(2) mungkin bisa dilakukan overfitting dengan AR(3).
Pada kasus tersebut, AR(2) dipilih jika :
Penduga parameter tambahan (3) tidak nyata / tidak signifikan.
Penduga parameter 1 dan 2 tidak mengalami perubahan secara signifikan antara AR(2) dengan AR(3).
2
Dr. Kusman Sadik Dept. Statistika IPB, 2015
Studi Kasus : Tentukan model terbaik untuk data penjualan suatu produk (Zt) sebagai berikut: 10
Zt
0
-10 Index
10
20
30
40
Zt : Data Asal
2
Zt(lag1)
1 0 -1 -2 -3 Index
10
20
30
40
Zt : Data Setelah Differencing Ordo-1
3
Zt(lag2)
2 1 0 -1 -2 Index
10
20
30
40
Zt : Data Setelah Differencing Ordo-2
3
Dr. Kusman Sadik Dept. Statistika IPB, 2015
Autocorrelation
Autocorrelation Function for Zt(lag2) 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0
1
2
3
4
5
6
7
8
9
Lag
Corr
T
LBQ
Lag
Corr
T
LBQ
1 2 3 4 5 6 7
-0.44 0.13 -0.18 -0.04 0.02 0.08 0.07
-2.94 0.75 -1.02 -0.22 0.10 0.46 0.40
9.23 10.07 11.72 11.80 11.82 12.20 12.50
8 9 10 11
-0.12 0.06 -0.01 -0.02
-0.65 0.33 -0.05 -0.10
13.30 13.52 13.53 13.55
10
11
Partial Autocorrelation
Partial Autocorrelation Function for Zt(lag2) 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0
1
2
3
4
5
Lag PAC 1 2 3 4 5 6 7
-0.44 -0.08 -0.19 -0.24 -0.15 0.00 0.10
T -2.94 -0.51 -1.27 -1.64 -0.99 0.00 0.69
6
7
Lag PAC 8 9 10 11
-0.07 0.01 0.10 0.02
8
9
10
11
T -0.46 0.06 0.70 0.16
Kandidat Model : ARIMA(0,2,1)dan ARIMA(1,2,0)
MTB > ARIMA 0 2 1 'Yt'; SUBC> Constant; SUBC> Brief 2. ARIMA model for Yt Estimates at each iteration Iteration SSE Parameters 0 66.1073 0.100 0.031 1 57.5810 -0.050 -0.011 2 51.8387 -0.200 -0.048 3 48.8500 -0.350 -0.083 4 48.3704 -0.435 -0.099 5 48.3691 -0.439 -0.099 6 48.3691 -0.439 -0.099 Relative change in each estimate less than
0.0010
4
Dr. Kusman Sadik Dept. Statistika IPB, 2015
Final Estimates of Parameters Type Coef SE Coef MA 1 -0.4393 0.1371 Constant -0.0995 0.1581
T -3.20 -0.63
P 0.003 0.533
Differencing: 2 regular differences Number of observations: Original series 47, after differencing 45 Residuals: SS = 48.3592 (backforecasts excluded) MS = 1.1246 DF = 43 Modified Box-Pierce (Ljung-Box) Chi-Square statistic Lag 12 24 36 Chi-Square 7.6 12.3 24.4 DF 10 22 34 P-Value 0.667 0.952 0.887
MTB > ARIMA 1 2 0 'Yt'; SUBC> Constant; SUBC> Brief 2. ARIMA model for Yt Estimates at each iteration Iteration SSE Parameters 0 55.9021 0.100 0.035 1 50.7183 0.250 -0.022 2 47.5927 0.400 -0.056 3 46.1186 0.543 -0.069 4 45.9902 0.582 -0.067 5 45.9806 0.592 -0.067 6 45.9799 0.595 -0.067 7 45.9799 0.596 -0.067 8 45.9799 0.596 -0.067 Relative change in each estimate less than
0.0010
Final Estimates of Parameters Type Coef SE Coef AR 1 0.5958 0.1225 Constant -0.06673 0.06299
P 0.000 0.295
T 4.86 -1.06
Differencing: 2 regular differences Number of observations: Original series 47, after differencing 45 Residuals: SS = 45.9799 (backforecasts excluded) MS = 1.0693 DF = 43 Modified Box-Pierce (Ljung-Box) Chi-Square statistic Lag 12 24 36 Chi-Square 6.0 11.8 22.5 DF 10 22 34 P-Value 0.816 0.962 0.935
5
Dr. Kusman Sadik Dept. Statistika IPB, 2015
Pemilihan Model Terbaik Berdasarkan hasil di atas, uji Ljung-Box: ARIMA(0, 2, 1) p-Value : 0.667 (Terima H0, galat tidak berkorelasi) ARIMA(1, 2, 0) p-Value : 0.816 (Terima H0) (Terima H0, galat tidak berkorelasi) Berarti model ARIMA(0, 2, 1) dan ARIMA(1, 2, 0) sama-sama layak (memenuhi asumsi kebebasan antar galat). Selanjutnya untuk menentukan model terbaik dapat ditentukan berdasarkan nilai MSE-nya yang terkecil, yaitu: ARIMA(0, 2, 1) MSE : 1.1246 ARIMA(1, 2, 0) MSE : 1.0693 Sehingga model terbaik berdasarkan nilai MSE terkecil adalah ARIMA(1, 2, 0). Model terbaik yang diperoleh dapat digunakan untuk melakukan peramalan.
Latihan (Praktikum) 1. Misalnya diketahui data ekspor terigu (juta ton) dalam lima bulan terakhir tahun 2014, yaitu 21.9, 22.9, 20.6, 22.1, 27.1. Jika untuk data tersebut menggunakan model AR(1) : Yt = + 1Yt-1 + et (a). Tentukan penduga parameternya yaitu ˆ , ˆ1 dengan metode momen. (b). Tentukan penduga bagi sisaan, eˆt (c). Lakukan uji Ljung-Box-Pierce (modified Box-Pierce), apa kesimpulannya. (d). Gunakan Minitab dan SAS, bandingkan hasilnya dengan jawaban Anda pada poin (a), (b), dan (c) di atas.
6