Seminar Nasional Statistika IX Institut Teknologi Sepuluh Nopember, 7 November 2009
PENGEMBANGAN MODEL REGRESI DERET WAKTU UNTUK DATA YANG MENGANDUNG VARIASI KALENDER Alfonsus. J. Endharta1 dan Suhartono2 1
Mahasiswa S2 Jurusan Statistika, ITS, Surabaya 2 Dosen Jurusan Statistika, ITS, Surabaya
[email protected];
[email protected]
ABSTRACT In many Islamic countries, the trades often have calendar variation pattern. This happens because the pattern of people consumption to certain products follows Lunar calendar, instead of following common solar calendar. The use of classical time series model, i.e. Decomposition method or Seasonal ARIMA model frequently yield spurious result, especially about the seasonal pattern and outlier data. Calendar variation effects often make model identification difficult, even in univariate time series analysis. This paper presents the development of a comprehensive and easy-to-use method for modeling the time series that contain calendar variation effect. Data about monthly sales of boy moslem cloth in Indonesia are used as case study. The model uses dummy regression and/or autoregressive approach. If the data have trend, the regression use linear trend variable (t). If the data have seasonal pattern, the solution is the addition of dummy seasonal variables or trigonometric regression. The white noise check of the residual is done by using Durbin Watson statistic and autocorrelation function (ACF) plot. The autocorrelated residual is solved by adding appropriate lags of response variable in the model. The addition is done iteratively until the residual satisfy the white noise assumption. The result shows that Calendar Variation model developed by dummy regression is appropriate for evaluating the effect of calendar variation. Additionally, the result of forecast accuracy comparison shows that this Calendar Variation model is better than Decomposition and ARIMA models in forecasting monthly sales of boy moslem cloth. It is showed by the smallest RMSE of testing data. Keywords: calendar variation, Islamic calendar, time series regression
1.
Pendahuluan Sejak adanya sistem penanggalan yang mengikuti sistem rotasi bulan, tidak sedikit proses transaksi perdagangan lokal maupun ekonomi global yang dipangaruhi oleh adanya sistem penanggalan demikian. Kalender Hijriyah, 1
sebagai salah satu contoh sistem penanggalan yang mengikuti sistem rotasi bulan, jelas berbeda dengan sistem penanggalan masehi yang mengikuti sistem surya. Perbedaan inilah yang pada akhirnya menghasilkan data perdagangan lokal maupun ekonomi global memiliki pola tertentu. Pola tertentu yang dimaksud sering disebut pola variasi kalender. Pola variasi kalender banyak terdapat pada data yang dipengaruhi adanya hari libur yang terjadi pada bulan yang berbeda tiap tahunnya(Liu, 1986). Kalender Hijriyah, yang termasuk kalender bulan berdasarkan 12 bulan dalam 1 tahun dengan 354 atau 355 hari, digunakan di cukup banyak negara Islam dan digunakan untuk menentukan hari besar Islam. Indonesia sebagai negara yang mayoritas penduduknya beragama Islam, juga menggunakan kalender Hijriyah untuk menentukan hari besar Islam, misalnya hari besar Idul Fitri. Variasi kalender muncul dengan adanya hari besar Islam ini. Efek-efek variasi kalender dapat diketahui dari banyaknya perdagangan sekitar hari besar Idul Fitri, antara lain sebelum, selama, dan/atau sesudah Idul Fitri. Sebagai contoh, dalam makalah ini penjualan baju muslim pria di sebuah kota di Indonesia. Analisis deret waktu untuk data yang memiliki pola variasi kalender memerlukan penanganan khusus. Liu (1980) mempelajari efek variasi hari libur dengan identifikasi dan estimasi model ARIMA dan menyarankan suatu modifikasi model ARIMA dengan menyertakan informasi hari libur sebagai variabel input deterministik. Analisis deret waktu umum, seperti metode dekomposisi dan model ARIMA dapat memberikan hasil yang tidak benar, terutama mengenai pola musiman dan munculnya pencilan. Beberapa penelitian tentang analysis deret waktu untuk data yang mengandung pola variasi kalender telah dilakukan. Liu (1986) melakukan identifikasi model deret waktu untuk data yang memiliki pola variasi kalender. Dalam penelitiannya, Liu menggunakan model ARIMAdan tambahan variabel efek variasi kalender. Holden, Thompson, dan Ruangrit (2005) melakukan penelitian tentang variasi kalender pada harga saham harian di Thai Stock Market. Holden dkk. menggunakan beberapa model, antara lain regresi linier, General Autoregressive Conditional Heteroscedasticity (GARCH), dan Threshold Autoregressive Conditional Heteroscedasticity (TARCH). Ketiga model ini dibandingkan dengan ketiga model yang sama, namun diberi tambahan variabel efek variasi kalender. Holden dkk. menunjukkan bahwa model-model dengan tambahan variabel efek variasi kalender memberikan hasil yang lebih baik daripada model-model tanpa tambahan variabel. Dalam makalah ini, dikemukakan suatu prosedur untuk membentuk model khusus untuk data yang mengandung pola variasi kalender. Model yang dikembangkan adalah model regresi deret waktu, antara lain model regresi dummy dan regresi trigonometri. 2.
Landasan Teori
2
Pada bagian ini dijelaskan beberapa teori yang diterapkan, terutama metodemetode yang digunakan dalam analisis. Metode-metode yang dimaksud adalah metode dekomposisi, model ARIMA musiman, dan model regresi deret waktu untuk data yang mengandung variasi kalender. 2.1. Dekomposisi Pada bagian ini dijelaskan metode dekomposisi aditif. Dasar metode dekomposisi adalah memisahkan komponen musiman dari komponen lainnya dari suatu deret data. Model dekomposisi aditif ditulis sebagai berikut (lihat Bowerman dan O’Connel, 1993).
yt Tt St Ct It
(1)
dengan
yt Tt St Ct It
= = = = =
pengamatan ke-t komponen trend ke-t komponen musiman ke-t komponen siklik ke-t komponen irregular ke-t
2.2. Model ARIMA Musiman Model ARIMA musiman merupakan model deret waktu linier yang cukup fleksibel dan dapat digunakan dalam pemodelan beragam tipe musiman sebaik model deret waktu non-musiman. Model ARIMA musiman dapat ditulis secara matematis dengan (lihat Wei, 1990; Box, Jenkins, dan Reisel, 1994; Cryer dan Chan, 2008): p (B)
S P (B )(1
B)d (1 BS )D yt
S q (B) Q (B ) t
,
(2)
dengan p (B) S P (B )
=
q (B) S Q (B )
=
= =
1 1 1 1
p Bp S 2S P BPS 1B 2B 2 q Bq 1B 2B S 2S QBQS , 1B 2B
1B
2 2B
dan S adalah periode musiman, B adalah operator backshift, dan t adalah deret noise dengan mean nol dan varians yang konstan. Box dan Jenkins (1976) mengenalkan suatu prosedur pembentukan model ARIMA musiman yang efektif berdasarkan struktur autokorelasi suatu deret waktu. 2.3. Regresi Deret Waktu untuk Variasi Kalender Model regresi dalam analisis deret waktu memiliki bentuk yang sama dengan model regresi linier. Dengan mengasumsikan bahwa variabel respon, yt , untuk t 1,2,...,n dipengaruhi oleh variabel independen yang mungkin, dengan
3
nilainya adalah pasti dan diketahui, hubungan ini dapat ditunjukkan sebagai model regresi linier (Shumway dan Stoffer, 2006). Bila data yt memiliki pola tren, tren (t) digunakan sebagai prediktor, dan dapat ditulis sebagai berikut:
yt
1t
0
wt
(3)
dengan wt adalah residual, yang harus berupa deret noise dan memenuhi asumsi IIDN(0, w2 ). Data dengan pola musiman S1,t , S2,t ,...,Ss,t , dapat ditulis secara matematis sebagai berikut:
yt
0
1S1,t
2 S2,t
...
s Ss,t
wt
(4)
dengan S1,t , S2,t ,...,Ss,t adalah variabel dummy yang mewakili pola musiman. Sebagai contoh, bila data berbentuk data bulanan, ada 12 variabel dummy musiman, 1 dummy mewakili 1 bulan. Bila data berbentuk kuartalan, ada 3 variabel dummy, 1 dummy mewakili 1 kuartal. Selain dengan variabel dummy, model lain untuk data yang memiliki pola musiman adalah regresi trigonometri. Regresi trigonometri untuk data musiman yaitu
yt
0
1 sin
2t s
2
cos
2t s
wt
(5)
dengan S adalah periode musiman. Dengan cara yang sama, data dengan variasi kalender dapat dimodelkan. Model regresi linier untuk data yang mengandung variasi kalender adalah
yt
0
1V1,t
2V2,t
...
pVp,t
wt
(6)
dengan Vp,t adalah variabel dummy untuk efek variasi kalender ke-p. Banyaknya efek variasi kalender dapat diidentifikasi berdasarkan plot deret waktu. Residual wt , diharapkan sebagai deret white noise. Untuk menguji white noise dapat digunakan statistik uji Ljung-Box. Jika wt tidak white noise, lag dari yt digunakan sebagai prediktor tambahan. Penentuan lag yang sesuai yang dimasukkan sebagai prediktor dilakukan berdasarkan plot ACF dan PACF residual (wt ) . Dalam makalah ini, dikembangkan prosedur baru untuk membentuk suatu model yang khusus digunakan bila data memiliki pola variasi kalender, dengan asumsi data memiliki pola trend an musiman. Prosedur yang dimaksud adalah sebagai berikut. 1. Penentuan variabel dummy untuk periode variasi kalender. Sebagai contoh:Vt adalah efek pada saat kejadian, Vt-1 adalah efek sebelum kejadian, Vt+1 adalah efek setelah kejadian, dan seterusnya. Penentuan ini dilakukan berdasarkan plot deret waktu data.
2. Penentuan tren deterministik dan musiman.
4
Tren
:
1t
0
1S1
2 S2
...
- dengan regresi trigonometri,
1 sin
2 t p
Musiman : - dengan regresi dummy,
pSp
2 cos
2 t p
3. Estiimasi model variasi kalender dan pola lainnya secara simultan.
yt
1Vt
2Vt 1
3Vt 2
1t
0
1S1
2 S2
...
pSp
Nt
4. Uji apakah Nt sudah white noise atau belum. Jika belum, ditambahkan lag data respon yang signifikan (orde autoregresif) berdasarkan plot ACF dan PACF. 5. Estimasi ulang parameter efek variasi kalender, pola lainnya (trend an musiman), dan lag yang sesuai secara simultan.
yt
1Vt
2Vt 1
1 yt 1
dengan
t
3Vt 2
2 yt 2
1t
0
... k yt
k
1S1
2 S2
...
pSp
t
harus berupa deret noise.
3.
Metodologi Penelitian Penelitian ini menggunakan data bulanan penjualan baju muslim pria dari perusahaan garmen di Indonesia. Data yang diambil adalah data pada Januari 2000 hingga Desember 2008. Data delapan tahun pertama digunakan sebagai data in-sample dan data sisanya sebagai data out-sample. Analisis diawali dengan mengaplikasikan prosedur baru pada data kasus. Model yang diperoleh dengan prosedur baru dibandingkan dengan model deret waktu umum, yaitu metode dekomposisi dan model ARIMA musiman, berdasarkan RMSE data out-sample. 4.
Hasil Analisis Empiris Data penjualan bulanan baju muslim pria ditunjukkan dengan Gambar 1. Plot deret waktu pada Gambar 1 menunjukkan bahwa terdapat pola variasi kalender pada data. Variasi kalender ini merupakan efek perayaan Idul Fitri tiap Time Series Plot of Boy MoslemCloth Sales 35000
9 10
30000 11
25000 11
10
9
9
10
11
Zt
20000 15000 10000 5000
9 8 8 4 10 11 4 10 911 6 810 2 567 11 911 12 12 8 6 11 3 3 12 10 3 11 8 9 12 3 6 9 6 1 12 7 1 12 45 7 12 12 3 5 8 12 8 2 1 910 34 8 12 246 1 12 1 5 45 7 7 57 1 7 2 678 2 1 6 34 2 5 67 5 345 234
0 Month Jan Year 2000
10
Jan 2001
Jan 2002
Jan 2003
Jan 2004
5
Jan 2005
Jan 2006
Jan 2007
Jan 2008
Gambar 1. Plot deret waktu data bulanan penjualan baju muslim pria
tahun. Oleh karena itu, tambahan tertentu diperlukan dalam model umum, misalnya model regresi deret waktu. Dalam bagian ini, hasil pemodelan dengan model regresi deret waktu akan ditunjukkan dan dibandingkan dengan model deret waktu umum, yaitu metode dekomposisi aditif dan model ARIMA. 4.1. Model Regresi Deret Waktu untuk Data Variasi Kalender Prosedur baru dengan model regresi deret waktu diawali dengan penentuan variabel dummy yang mewakili efek variasi kalender. Penentuan ini dilakukan berdasarkan plot deret waktu. Dalam kasus ini, variabel dummy yang mewakili efek variasi kalender adalah variabel 2 bulan sebelum Idul Fitri, 1 bulan sebelum Idul Fitri, dan pada bulan terdapat Idul Fitri. Parameter model regresi linier diestimasi dengan metode Ordinary Least Square (OLS) dan model yang diperoleh adalah
yt 6887 3884Vt 18996Vt 1 4810Vt
2
wt ,
(7)
dengan Vt adalah variabel dummy untuk data pada bulan Idul Fitri, Vt 1 adalah variabel dummy untuk data 1 bulan sebelum bulan Idul Fitri, dan Vt 2 adalah variabel dummy untuk data 2 bulan sebelum Idul Fitri. Semua parameter model pada persamaan (7) signifikan namun residualnya tidak white noise. Hal ini disebabkan adanya pola tren dan musiman pada data. Oleh karena itu, model diperbarui dengan menambahkan variabel dummy yang mewakili tren dan musiman. Penambahan variabel dummy ini mengubah model pada persamaan (7) menjadi seperti pada persamaan (8).
yˆt 2300Vt 16695Vt 1 2295Vt 2 51.1t 4381M1t 3230M2t 4719M3t 3712M4t 3308M5t 5094M6t 3718M7t 6175M8t 7453M9t 6541M10t 5895M11t 5101M12t
(8)
dengan t adalah tren, M1t adalah variabel dummy untuk bulan Januari, M2t adalah variabel dummy untuk bulan Februari, dan seterusnya. Residual model belum white noise, ditunjukkan dengan plot ACF dan PACF pada Gambar 2. Gambar 2 menunjukkan bahwa ACF dan PACF cuts off setelah lag 1. Oleh karena itu, yt 1 , ditambahkan ke dalam model sebagai prediktor. Sehingga model menjadi:
yˆt
4240Vt 15952Vt 1 2110Vt 2 30.8t 1295M1t 1392M2t 3358M3t 1732M4t 1745M5t 3698M6t 1579M7t 4653M8t 4881M9t (9) 3314M10t 2689M11t 2122M12t 0.415yt 1
Residual model sudah memenuhi asumsi white noise dan RMSE in-sample model persamaan (9) sebesar 1485,74.
6
Autocorrelation Function for Model Residual I
Partial Autocorrelation Function for Model Residual I (with 5%significance limits for the partial autocorrelations)
1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0
Partial Autocorrelation
Autocorrelation
(with 5%significance limits for the autocorrelations)
2
4
6
8
10
12 14 Lag
16
18
20
22
24
1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 2
4
6
8
10
12 14 Lag
16
18
20
22
24
Gambar 2. Plot ACF and PACF residual model I
Pendekatan lain untuk menunjukkan pola musiman dalam model adalah dengan regresi trigonometri. Model regresi trigonometri untuk kasus ini adalah:
yˆt 4820 2410Vt 17247Vt 1 3095Vt
51.1t 1250sin
2
2t 12
390cos
2t . (10) 12
Residual model ini tidak memenuhi asumsi white noise, sehingga ditambahkan lag yang signifikan, yaitu yt 1 . Model regresi trigonometri akhir adalah
yˆt 3430 1677Vt 16694Vt 1 3017Vt
2
0.255yt 1
39.1t 1025sin
2t 12
76cos
2t 12 (11)
Residual model ini memenuhi asumsi white noise dan RMSE data in-sample sebesar 1668.21. 4.2. Perbandingan Metode Dekomposisi, Model ARIMA Musiman, dan Model yang Dikembangkan Metode deret waktu umum, antara lain metode dekomposisi dan ARIMA musiman juga diaplikasikan pada data penjualan baju muslim pria. Model-model ini dbandingkan dengan model yang dikembangkan dengan prosedur baru. Perbandingan ini diringkas berdasarkan RMSE dan ditunjukkan pada Tabel 1. Tabel 1 menunjukkan bahwa model yang dikembangkan menghasilkan ramalan yang lebih akurat daripada metode dekomposisi dan model ARIMA musiman. Hal ini dapat dilihat dari nilai RMSE ketiga model. Berdasarkan RMSE in-sample, model regresi deret waktu yang dikembangkan, yaitu model regresi dummy menghasilkan prediksi yang lebih akurat daripada model lainnya. Berdasarkan RMSE out-sample, model regresi trigonometri yang dikembangkan menghasilkan ramalan yang lebih akurat daripada model-model lainnya. Secara visual, penilaian kebaikan model dapat dilihat dari kedekatan nilai ramalan dan nilai aktualnya. Plot deret waktu pada Gambar 3(a1-c1) menunjukkan akurasi ramalan tiap model. Terlihat pada Gambar 3(a1-c1) bahwa model umum menghasilkan nilai ramalan yang lebih jauh dari nilai aktualnya daripada nilai ramalan yang dihasilkan model yang dikembangkan dengan prosedur baru.
7
Selain dengan gambar perbandingan aktual dan prediksi, akurasi ramalan secara visual juga ditunjukkan dengan plot residual (lihat Gambar 3(a2-c2)). Dari plot residual ini dapat dimengerti bahwa keburukan metode dekomposisi dan model ARIMA musiman, khusus untuk data dengan variasi kalender, terjadi karena efek variasi kalender tidak diikutsertakan di dalam model. Tabel 1. Perbandingan Akurasi Ramalan antar model RMSE
Model
In-sample
Out-sample
Dekomposisi Aditif
4254.517
5392.800
Dekomposisi Multiplikatif
4216.071
5605.252
ARIMA([35],0,0)(1,1,0)12
3333.678
2683.225
ARIMA(0,0,[35])(0,1,1)12
3486.436
3171.309
ARIMA(0,0,[35])(1,1,0)12
3409.108
3092.269
ARIMA([35],0,0)(0,1,1)12
3420.088
2705.159
Regresi Dummy
1485.740
2462.131
Regresi Trigonometri
1668.210
2252.765
Dekomposisi
ARIMA Musiman
Regresi Deret Waktu
5.
Kesimpulan Secara umum, data yang dipengaruhi oleh kalender bulan memerlukan perlakuan khusus. Penggunaan metode dekomposisi dan model ARIMA musiman akan menghasilkan hasil yang tidak benar. Model yang dikembangkan, yaitu model regresi deret waktu, baik model regresi dummy maupun regresi trigonometri, menghasilkan ramalan yang lebih akurat daripada hasil metode dekomposisi dan model ARIMA musiman. Pada kasus data bulanan penjualan baju muslim pria ini model terbaik adalah model regresi trigonometri yang dikembangkan dengan prosedur baru khusus untuk data yang mengandung variasi
8
kalender. Model regresi trigonometri ini menghasilkan nilai RMSE out-sample sebesar 2252,765.
20000
5000
Residual
10000
15000
0
10000
-5000
5000
-10000
Month Jan Year 2000
b1
30000
Jan 2001
Jan 2002
Jan 2003
Jan 2004
Jan 2005
Jan 2006
Residual
5000
15000
-5000
5000
-10000 Jan 2003
Jan 2004
Jan 2005
Jan 2006
Jan 2002
Jan 2003
10000
20000
5000
15000
0
10000
-5000
5000
-10000 Jan 2002
Jan 2004
Jan 2005
Jan 2006
Jan 2007
b2 4
6 10 3 121 8 10 11 23 5 2 910 79 78 4 6 9 121 45 910 5 8 11 9 8 6 9 79 2 7 6 121 5 78 678 11 3 56 23 5 1 6 4 7 1 2 12 12 1 5 11 12234 11 11 12 4 810 1 2 3 10
11
Jan 2001
Jan 2002
Jan 2003
Jan 2004
Jan 2005
Jan 2006
Jan 2007
c2
15000
25000
Jan 2001
9
Time Series Plot of Residual of Trig. Regression
Variable Actual Trig. Regression
a2
3 4
-15000 Month Jan Year 2000
Jan 2007
Time Series Plot of Actual, Trig. Regression
0 Month Jan Year 2000
9
10
10
0
10000
Jan 2002
10
Time Series Plot of Residual of ARIMA
10000
30000
Jan 2001
15000
20000
c1
11
4 8 1 12 4 9 35 8 12 3 234 7 2 5 6 1 2 2 7 5678 6 1 2 56 7 81012 8 9 121 5 7 911 45 78 468 7 910121 5 9 1 5678 11 34 11 3 4 9 246 3 6 1212 10 10121 10 3 3 11 2 12 11
Time Series Plot of Actual, ARIMA Variable Actual ARIMA
Jan 2001
11
11
-15000 Month Jan Year 2000
Jan 2007
25000
0 Month Jan Year 2000
10
15000
25000
0
Data
Variable Actual Add. Decomposition
Residual
Data
30000
Data
Time Series Plot of Residual of Add. Decomposition
Time Series Plot of Actual, Add. Decomposition
a1
Jan 2003
Jan 2004
Jan 2005
Jan 2006
4 3 3 3 9 3 6 12 6 8 12 6 910 3 8 9 2 6 11 4 11 8 12 9 810 2 2 56 89 12 5 8 8 1 1 2 11 6 10 911 5 34 5 910 11 10121 3 567 121 4 9 11 1212 5 7 10121 4 7 10 7 10 67 11 34 7 45 11 24 57 8 12 7 2
-15000 Month Jan Year 2000
Jan 2007
Jan 2001
Jan 2002
Jan 2003
Jan 2004
Jan 2005
Jan 2006
Jan 2007
Gambar 3. Plot deret waktu (a)Dekomposisi aditif, (b) ARIMA musiman, dan(c) Regresi deret waktu (gambar kiri) dan residualnya (gambar kanan)
DAFTAR PUSTAKA Bowerman, B.L., and O’Connel, D. 1993. Forecasting and Time Series: An Applied Approach, 3rd Edition. California: Duxbury Press. Box, G.E.P., and Jenkins, G.M. 1976. Time Series Analysis: Forecasting and Control. San Fransisco: Holden-Day, Revised edn. Box, G.E.P., Jenkins, G.M., and Reinsel, G.C. 1994. Time Series Analysis, Forecasting and Control, 3rd Edition. Prentice Hall, Englewood Cliffs.
9
Cryer, J.D., and Chan, K.S. 2008. Time Series Analysis. With Application in R, 2nd Edition. Springer. Hanke, J.E., and Wichern, D.W. 2005. Business Forecasting. NJ: Prentice Hall, Englewood Cliffs. Holden, K., Thompson, J., and Ruangrit, Y. 2005. The Asian crisis and calendar effects on stock returns in Thailand. European Journal of Operational Research, 163, 242–252. Liu, L.M. 1980. Analysis of Time Series with Calendar Effects. Management Science, 2, 106-112. Liu, L.M. 1986. Identification of Time Series Models in the Presence of Calendar Variation. International Journal of Forecasting, 2, 357-372. Shumway, R.H., and Stoffer, D.S. 2006. Time Series Analysis and Its Applications with R Examples, 2nd Edition. Springer Wei, W.W.S. 1990. Time Series Analysis: Univariate and Multivariate Methods. Addison-Wesley Publishing Co., USA.
10