Definisi Seasonal ARIMA adalah model ARIMA yang mengandung
faktor musiman.
Musiman berarti kecenderungan mengulangi pola tingkah
gerak dalam periode musim, biasanya satu tahun untuk data bulanan.
Karena itu, time series musiman mempunyai karakteristik yang
ditunjukkan oleh adanya korelasi beruntun yang kuat pada jarak semusim (periode musim), yakni waktu yang berkaitan dengan banyak observasi pada per periode musim.
Notasi Notasi ARIMA dapat diperluas untuk mencakup aspek musiman yaitu:
ARIMA (p,d,q) (P,D,Q)s Bagian nonmusiman
Bagian musiman
Keterangan: (p,q): komponen non-musiman model ARMA d: orde diferensi non-musimam P : nilai dari seasonal AR (SAR) D : nilai dari differencing seasonal Q : nilai dari moving average seasonal (SMA)
Jumlah periode per musim
Identifikasi Identifikasi bagian non-musiman: Model
ACF
PACF
AR(1)
Menurun secara eksponensial
Signifikan di lag 1
AR(p)
Menurun secara eksponensial
Signifikan sampai lag p
MA(1)
Signifikan di lag 1
Menurun secara ekponensial
MA(q)
Signifikan sampai lag q
Menurun secara ekponensial
ARMA(p,q)
Signifikan keluar sampai lag q
Signifikan keluar sampai lag p
Menurun secara eksponensial (dies down)
Dies down
Identifikasi bagian musiman: Model
ACF
PACF
SAR(1)
Menurun secara exponensial pada level seasonal (lag 1s)
Signifikan pada lag 1s dan selanjutnya tidak signifikan
SAR(P)
Menurun secara exponensial pada level seasonal (lag 1s, 2s, …, Ps)
Signifikan pada lag 1s, 2s,…, Ps dan setelah lag Ps tidak signifikan
SMA(1)
Signifikan pada lag 1s dan selanjutnya tidak signifikan
Menurun secara exponensial pada level seasonal (lag 1s)
SMA(Q)
Signifikan pada lag 1s, 2s, …, Qs dan setelah lag Qs tidak signifikan
Menurun secara exponensial pada level seasonal (lag 1s, 2s, …, Qs)
SARMA (P,Q)
Signifikan pada lag 1s, 2s, …, Qs dan setelah lag Qs tidak signifikan
Signifikan pada lag 1s, 2s, …, Ps dan setelah lag Ps tidak signifikan
Diferensi Diferensi non-musiman: Jika data mengandung tren, maka data perlu didiferensi untuk
menstasionerkannya. Seringkali (namun tidak selalu), diferensi data orde pertama cukup untuk menstasionerkan data.
Diferensi musiman: Jika data mengandung musiman, maka data perlu didiferensi musiman.
Jika data mengandung tren dan musiman, maka dilakukan diferensi non-
musiman dan diferensi musiman.
Contoh Identifikasi: Contoh data produksi beer di Australia: Data dengan panjang periode s = 4 Data mengalami diferensi non-musiman
orde 1 (d = 1) dan diferensi musiman orde 1 (D = 1)
Identifikasi non-musiman: Berdasarkan plot PACF yang signifikan
sampai lag ke-2, diperoleh p = 2
Identifikasi musiman: Berdasar plot ACF yang signifikan
secara musiman (kuartal) di lag 1x4, diperoleh Q = 1
Sehingga modelnya: ARIMA (2,1,0)(0,1,1)4 Dapat dicoba juga model: ARIMA (2,1,0)(0,1,2)4, ARIMA (2,1,1)(0,1,2)4
Model AR(p) dan Seasonal AR(P) Model AR dan AR musiman (SAR): Musiman (AR) Model AR(1):
Z t 1Z t 1 at Model AR(2):
Z t 1Z t 1 2 Z t 2 at Model AR(p)
Z t 1Z t 1 ... p Zt p at
Non Musiman (SAR) Model AR(1)12:
Z t 1Z t 12 at Model AR(2)12:
Z t 1Z t 12 1Z t 24 at Model AR(P)s:
Z t 1Z t s 2 Z t 2 s ... ... P Z t Ps at
Model MA(q) dan Seasonal MA(Q) Model MA dan MA musiman (SMA): Musiman (MA) Model AR(1):
Z t at 1at 1 Model AR(2):
Z t at 1at 1 2 at 2 Model AR(p)
Non Musiman (SMA) Model AR(1)12:
Z t at 1at 12 Model AR(2)12:
Z t at 1at 12 1at 24 Model AR(P)s:
Z t at 1at 1 ... p at q Z t at 1at s 2 at 2 s ... ... Q at Qs
Contoh: Diberikan data bulanan jumlah
turis yang mengunjungi negara Spanyol selama Januari 1970 sampai Maret 1989
1970M01 1970M07 1971M01 1971M07 1972M01 1972M07 1973M01 1973M07 1974M01 1974M07 1975M01 1975M07 1976M01 1976M07 1977M01 1977M07 1978M01 1978M07 1979M01 1979M07 1980M01 1980M07 1981M01 1981M07 1982M01 1982M07 1983M01 1983M07 1984M01 1984M07 1985M01 1985M07 1986M01 1986M07 1987M01 1987M07 1988M01 1988M07 1989M01
820671 4204587 983136 4689122 1113857 6237912 1202174 6637510 1241184 5521607 1204519 5950696 1201802 5561911 1329367 6423660 1606495 7017592 2041841 5878686 1926865 6365971 1808070 7100990 1956456 6953878 1861374 6645627 1893032 7365809 1809238 6837385 1984935 7403956 2178426 7911943 2412604 8735355 2597707
796113 5270484 980217 5223043 1117236 6774008 1126462 7236634 1144593 6464274 1013728 6697118 1054301 6159885 1239682 7037003 1482481 7968573 1708735 6746902 1601051 7918659 1463234 7877330 1656160 8029299 1660730 7674030 1727653 8277600 3489028 8002015 1760252 9102854 2047278 9376459 2362577 9684267 2335168
1297542 2496770 1236050 2853964 1689481 3367080 1477043 3655213 1524258 3205520 1547030 3265465 1334284 3060935 1548567 3421103 2223206 4242651 2137271 4029229 1995573 3930044 1748698 4562962 2000723 4665631 2199483 4590932 2057087 4765686 2149235 4696554 2626673 5253947 2372760 5368966 2920339 5818146 3194855
1188844 1538107 1898694 1753837 1925956 1902552 2388930 2177020 2225725 1589380 1493496 1396028 1969020 1959262 2157524 2266724 2124732 2747310 2868814 2514236 2469649 2249793 2571631 2770367 2769373 2875148 2671888 2972699 3124812 3129638 2919590 3385040 2645591 3279344 3337538 3602793 3505098 4243678
1671536 1101932 1937907 1254621 2163178 1414334 2126606 1538605 1981724 1180996 2118609 1043701 2002472 1338885 2234009 2134599 2789463 2050642 2897433 1837401 2589818 1671046 2719622 1870463 2997200 1910816 2943001 1939699 3197066 2028559 3079927 2073529 3501433 2398096 3864519 2411988 4000187 2624818
2302318 1163845 2586122 1360902 2943452 1797537 3148788 1753958 2814555 1451959 2939469 1452619 2775668 1595662 2995528 2002474 3363263 2354083 3867278 2374483 3138548 2132434 3343539 2323017 3791947 2357866 3797188 2306683 3966746 2413525 4019152 2875588 4248450 3183039 4672446 3394269 4515161 3356166
Plot Data SARIMA 10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0 70
72
74
76
78
80
82
84
86
88
Dari plot data diatas terlihat data memiliki musiman dan trend.
Uji Stasioner:
• Nilai ADF Test Statisticnya lebih besar dari nilai critical value, sehingga data dapat dikatakan belum stasioner dalam mean.
Plot ACF dan PACF Dari plot disamping terlihat bahwa terdapat musiman pada Autokorelasi
Karena data belum stasioner dalam mean maupun variansi maka dilakukan transformasi log dan diferencing orde satu.
Transformasi dan diferensing dilakukan pada kedua situasi baik yang musiman atau non-musiman, kemudian dibandingkan mana yang lebih baik.
Hasil dari transformasi dan diferensing yang non-musiman diberi nama dlogsarima sedangkan yang musiman dslogsarima
DLOGSARIMA 0.8
Plot data setelah ditransformasi dan didiferencing (non-musiman)
0.4
0.0
-0.4
-0.8
-1.2 70
72
74
76
78
80
82
84
86
88
DSLOGSARIMA .8 .6
Plot data setelah ditransformasi dan didiferencing (musiman)
.4 .2 .0 -.2 -.4 -.6 -.8 70
72
74
76
78
80
82
84
86
88
0.8
0.4
0.0
-0.4
-0.8
-1.2 70
72
74
76
78
DLOGSARIMA
80
82
84
86
88
DSLOGSARIMA
Terlihat bahwa masih terdapat pola seasonal yang kuat pada obyek series dlogsarima, dengan variasi yang lebih besar dari dibanding dslogsarima. Karena itu, akan relatif lebih mudah untuk melakukan identifikasi model runtun waktu yang baik bagi data dslogsarima dibanding dlogsarima.
Plot ACF dan PACF Terlihat disini fungsi ACF dari
dslogsarima menurun perlahan, mengindikasikan bahwa data nonstasioner dalam mean. Untuk itu dilakukan diferensi terhadap dslogsarima
Uji Stasioner: Setelah didiferensi, hasil diferensi orde 1 diuji:
Nilai ADF Test Statistiknya lebih kecil dari nilai critical value 1%, sehingga
data sudah stasioner dalam mean.
Identifikasi: Identifikasi Non-Musiman: Plot ACF: signifikan pada lag 1, menunjukkan proses MA nonmusiman (q = 1) Plot PACF: menurun (dies down) Identifikasi Musiman: Plot ACF: signifikan pada lag 12, menunjukkan adanya proses MA musiman (Q = 1). Plot PACF: signifikan pada lag 12, menunjukkan adanya proses AR musiman (P = 1) Sehingga modelnya: ARIMA (0,1,1)(1,1,1)12 Model lainnya: ARIMA (0,1,1)(1,1,0)12 ARIMA (0,1,1)(0,1,1)12
Rangkuman Hasil Modeling Model 1
SAR(12)
-0.407999 (0.0000)
MA(1)
-0.738231 (0.0000)
Model 2
Model 3
-0.726371 (0.0000)
-0.531553 (0.0000) -0.453018 (0.0000)
MA(12) SMA(12)
-0.806210 (0.0000)
MA(12) -0.453018 (0.0000)
SSR
2.821980
2.333060
3.287744
AIC
-1.433143
-1.681088
-1.338068
SBC/BIC
-1.400833
-1.650038
-1.307017
Q(12)
8.8502 (0.546)
11.663 (0.308)
24.094 (0.007)
Q(24)
48.485 (0.001)
29.838 (0.122)
69.530 (0.000)
Q(36)
61.988 (0.002)
44.013 (0.117)
88.355 (0.000)
Berdasrkan rangkuman hasil
modeling di atas, dari uji t terhadap koefisian dari model dan dari uji diagnostik dapat disimpulkan bahwa model terbaik secara statistik adalah model 2
Pada model 1 dan 3 masih
terdapat korelasi serial dalam residual dari model, sehingga model belum cukup baik menggambarkan data.
Model 2 dapat dituliskan
ARIMA(0, 1, 1)(0,1,1)12
Peramalan 1 periode: Hasil fitting dan peramalan untuk data 1 bulan ke depan dengan
menggunakan metode static 14,000,000
Forecast: SARIMAF Actual: SARIMA Forecast sample: 1970M01 1989M04 Adjusted sample: 1971M02 1989M04 Included observations: 218
12,000,000 10,000,000 8,000,000
Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient Bias Proportion Variance Proportion Covariance Proportion
6,000,000 4,000,000 2,000,000 0 72
74
76
78
80
SARIMAF
82
84
± 2 S.E.
86
88
353121.1 218711.3 7.104879 0.045911 0.008252 0.082656 0.909091
Peramalan n periode: Peramalan untuk 12 bulan ke depan: 16,000,000 14,000,000 12,000,000 10,000,000 8,000,000 6,000,000 4,000,000 2,000,000 0 1989Q2
1989Q3 SARIMAF2
1989Q4 ± 2 S.E.
1990Q1
Terima Kasih