PERBANDINGAN METODE TIME SERIES REGRESSION DAN ARIMAX PADA PEMODELAN DATA PENJUALAN PAKAIAN DI BOYOLALI Ardita Sukma Perdana (1308 100 503) Dosen Pembimbing: Ir. Dwiatmono A. W., M.Ikom JURUSAN STATISTIKA Fakultas Matematika Dan Ilmu Pengetahuan Alam Institut Teknologo Sepuluh Nopember Surabaya 2010
ABSTRAK Pakaian merupakan salah satu kebutuhan pokok manusia selain makan dan tempat tinggal. Kebutuhan akan pakaian dapat didapatkan di pasar-pasar dan juga toko-toko yang menjual segala macam kebutuhan akan pakaian dan juga perlengkapannya. Berdasarkan data yang telah ada. Banyak penjualan pada setiap tahunnya adalah berbeda. Hal ini disebabkan oleh adanya pengaruh kalender Islam yang digunakan di Indonesia. Penjualan yang banyak terjadi adalah pada saat-saat mendekati hari raya Iedul Fitri yang setiap tahunnya berubah berdasarkan kalender Islam yang berbeda dengan tahun masehi. Hasil analisis yang didapatkan dari analisis statistika deskriptif diketahui pola penyebaran data penjualan rok paling lebar adalah pada data penjualan rok dewasa yang terjadi pada bulan November dengan rata-ratanya adalah sebesar 190,571. Hasil perbandingan metode, model yang sesuai dengan menggunakan metode regresi time series dan juga metode ARIMAX maka didapatkan model dengan nilai RMSE out-sample paling kecil yaitu sebesar 46,68041 adalah analisis dengan menggunakan metode regresi time series dengan model regresi variabel dummy efek variasi kalender dan dummy trend. Peramalan untuk tahun 2010 dan tahun 2011 yaitu tahun 2010 lebaran terjadi pada bulan Sepember banyak taksiran penjualan sebesar 179, taksiran penjualan untuk tahun 2011 terjadinya lebaran adalah pada bulan Agustus taksiran penjualan rok yang akan terjadi adalah sebanyak 320 unit rok. Kata kunci : penjualan pakaian, efek variasi kalender, Time Series Regression, ARIMAX
1. Pendahuluan
Pakaian merupakan salah satu kebutuhan pokok manusia selain makan dan tempat tinggal. Pakaian merupakan kebutuhan yang wajib dipenuhi oleh setiap orang. Kebutuhan akan pakaian dapat didapatkan di pasar-pasar dan juga toko-toko yang menjual segala macam kebutuhan akan pakaian dan juga perlengkapannya. Kebutuhan akan pakaian juga didapatkan dari perusahaan-perusahaan retail. Perusahaan retail merupakan perusahaan yang bergerak dibidang kebutuhan manusia akan pakaian, baik pakaian pria maupun pakaian wanita serta pakaian anak-anak. Perusahaan retail akan mendistribusikan barang dagangannya ke toko retail dan juga pasar-pasar yang menjual segala macam jenis pakaian. Seperti penjualan pakaian di Perusahaan yang terjadi di daerah Boyolali yang mengalami perbedaan jumlah pakaian yang terjual pada tiap bulannya dan juga berpengaruh pada setiap tahunnya. Banyaknya pembelian pakaian dilakukan konsumen adalah pada saat-saat tertentu seperti misalnya bila mendekati akhir tahun. Berdasarkan data yang telah ada. Banyak penjualan pada setiap tahunnya adalah berbeda. Hal ini disebabkan oleh adanya pengaruh kalender Islam yang digunakan di Indonesia. Penjualan yang banyak terjadi adalah pada saat-saat mendekati hari raya Iedul Fitri yang setiap tahunnya berubah berdasarkan kalender Islam yang berbeda dengan tahun masehi. Pada saatsaat mendekati hari raya Iedul Fitri banyak konsumen yang melakukan pembelian pakaian dengan jumlah pembelian yang meningkat dari bulan-bulan lainnya. Untuk mengetahui tingkat kelonjakan pembelian yang terjadi pada tahun-tahun berikutnya dengan pengaruh kalender Islam, maka perlu dilakukan analisis time series pada data perusahaan tersebut. Dengan melakukan analisis data dengan analisis time series diharapkan akan mendapatkan model yang sesuai dengan data yang telah terjadi,
1
sehingga model tersebut dapat digunakan untuk meramalkan penjualan yang akan terjadi pada tahuntahun berikutnya. Metode analisis yang digunakan untuk menentukan model terbaik dari data penjualan rok dewasa di daerah Boyolali ini adalah Metode Regresi Time Series dan ARIMAX, yang akan didapatkan model terbaik yang dapat digunakan untuk meramalkan data penjualan pada tahun-tahun berikutnya. Analisis variasi kalender ini pernah dilakukan oleh Endharta et al (2009) pada seminar di Kairo Mesir tentang Variasi Kalender yang menggunakan analisis ARIMAX untuk meramalkan data time series dengan efek kalender Islam untuk tahun 2009. Permasalahan yang timbul adalah sebagai berikut: Bagaimana karakteristik data penjualan rok dewasa antara tahun 2002 sampai dengan 2009. Bagaimana model terbaik yang didapat dari perbandingan metode regresi time series dan metode ARIMAX untuk data penjualan rok dewasa berdasarkan nilai RMSE. Dan bagaimana peramalan data penjualan rok dewasa pada tahun-tahun berikutnya.
2. Tinjauan Pustaka Analisis Time Series Wei (2006) mengatakan bahwa Time series adalah serangkaian pengamatan terhadap suatu variabel yang diambil dari waktu ke waktu dan dicatat secara berurutan menurut urutan waktu kejadiannya dengan interval waktu yang tetap. Sedangkan menurut Cryer (1986) Time series diartikan sebagai serangkaian data yang didapatkan berdasarkan pengamatan dari suatu kejadian pada urutan waktu terjadinya. Stasioneritas time series merupakan suatu keadaan dimana tidak terdapat pertumbuhan atau penurunan pada data. Secara umumnya data harus horizontal sepanjang sumbu waktu. Dengan kata lain, terjadi perubahan atau fluktuasi data berada disekitar nilai rata-rata yang konstan, tidak tergantung waktu dan ragam dari fluktuasi tersebut. (Makridakis, 1999). Identifikasi Model Autocorrelation function (ACF) ACF atau fungsi autokorelasi merupakan suatu hubungan linear pada data time series antara Zt dengan Zt+k yang dipisahkan oleh waktu k. ACF ini dapat digunakan untuk mengidentifikasi model time series dan melihat kestasioneran data dalam mean. Rumus fungsi Autokorelasi adalah (Wei, 2006):
ρk=
γk cov( Z t , Z t + k ) = var(Z t ) var(Z t + k ) γ 0
dan kovarians antara Zt dan Zt+k adalah γ k = Cov ( Z t , Z t + k ) = E ( Z t − µ )( Z t + k − µ ) dengan : Var (Zt) = Var (Zt+k) = γ0 γk = fungsi Autocovarians ρk = Autocorrelation Function (ACF). Sedang fungsi autokorelasi yang dihitung berdasarkan sampel data dapat dirumuskan sebagai berikut: n−k
( Z t − Z )( Z t + k − Z )
ρˆ k =
t =1
n
untuk k= 0, 1, 2 (Zt − Z )2
t =1
Partial Autocorrelation Function (PACF) Fungsi autokorelasi parsial merupakan korelasi antara Zt dengan Zt+k setelah Zt dijelaskan oleh Zt-1, Zt-2, …., Zt-k+1. Fungsi autokorelasi parsial menurut Wei (2006) dirumuskan sebagai berikut: Cov [( Z t − Zˆ t ), ( Z t + k − Zˆ t + k ) ρk = Var ( Z − Zˆ ) Var ( Z − Zˆ ) t
t
t+k
t+k
Dalam pengamatan time series, sampel PACF dinotasikan dengan φ kk dengan perhitungan:
2
ρ k +1 − φ k +1,k +1 =
1−
k j =1 k j =1
φ kj ρ k +1− j
dan φˆk +1, j = φˆkj − φˆk +1,k +1φˆk ,k +1− j , j= 1, 2, ..., k
φ kj ρ j
Model Time series Model Autoregressive (AR) Model autoregressive adalah model hasil regresi dengan dirinya sendiri pada waktu-waktu sebelumnya. Bentuk umum dari model autoregressive pada orde ke- p atau AR(p) adalah sebagai berikut (Wei, 2006): dimana : φ p
= parameter autoregressive ke-p
a t = nilai residual pada saat t Model Moving Average (MA) Model moving average disebut juga sebagai model rata-rata bergerak. Bentuk umum dari model moving average pada orde ke- q atau MA(q) adalah sebagai berikut (Wei, 2006): dimana :
= parameter moving average ke-q a t = nilai residual pada saat t Model Mixed Autoregressive Moving Average (ARMA) Model ARMA merupakan model campuran dari model AR dan MA. Bentuk umum dari model ARMA dengan orde ke-p,q adalah sebagai berikut:
Model Autoregressive Integrated Moving Average (ARIMA)
Model ARIMA (p,d,q) merupakan model yang telah mengalami proses differencing. Bentuk umum dari model ARIMA pada orde ke-p,q dengan proses differencing sebanyak d adalah sebagai berikut: dengan dan Pemeriksaan Diagnostik White Noise Proses disebut proses white noise apabila tidak ada korelasi dalam variabel acak dengan nilai mean konstan E , biasanya diasumsikan sebagai nol, varians konstan var dan Cov untuk k 0. Dari definisi tersebut, dapat diketahui bahwa proses white noise adalah stasioner dengan fungsi autokovarian (Wei, 2006). Distribusi Normal Dibawah ini merupakan cara pengujian kenormalan data dengan “Kolmogorov Smirnov Test” (Daniel, 1989) Hipotesis: H0: Residual berdistribusi normal H1: Residual tidak berdistribusi normal Statistik Uji: "#$ !
dimana: S(x) = fungsi peluang kumulatif yang dihitung dari data sampel F0(x) = fungsi peluang kumulatif dari distribusi normal %& = Nilai supremum untuk semua dari ' Daerah Penolakan: Tolak H0 jika D > D(1- ,n) atau p-value <
3
Pemilihan Model Terbaik Pada pemodelan data time series terdapat kemungkinan bahwa beberapa model yang didapat sudah sesuai persyaratan yaitu semua parameter signifikan, residual data memenuhi asumsi white noise dan residual berdistribusi normal. Untuk menentukan model terbaik yang digunakan untuk meramalkan dari beberapa model yang memenuhi syarat tersebut, dapat digunakan kriteria berikut ini: Pendekatan out-sample
Pemilihan model terbaik melalui pendekatan out-sample dengan menggunakan RMSE (Root Mean Square Error). Model terbaik adalah model dengan nilai RMSE terkecil. Rumus RMSE dapat ditulis seperti dibawah ini: () *
+) *
1 n 2 e n i =1 i
Analisis Regresi Time Series untuk Variasi Kalender Regresi dalam konteks time series memiliki bentuk yang sama dengan regresi linier umum. Dengan mengasumsikan output atau bentuk dependen yt, untuk t = 1,2,…, n , yang dipengaruhi oleh kemungkinan data input atau independen, dimana inputnya merupakan fix dan diketahui, hubungan ini dapat ditunjukkan dengan model regresi linier (Shumway dan Stoffer, 2006). Jika data yt memiliki trend, trend (t) digunakan sebagai input, yang dapat ditulis sebagai berikut:
y t = β 0 + β 1t + a t
Dimana wt merupakan residual, yang mengalami proses independen dan identik serta berdistribusi normal dengan nilai mean 0 dan varian σ w2 . Bentuk data seasonal S1,t, S2,t, …., Ss,t dapat ditulis:
y t = β 0 + β 1 S1,t + β 2 S 2,t + ... + β s S s ,t + a t
Dimana S1,t, S2,t, …., Ss,t merupakan variabel dummy untuk bentuk seasonal. Sebagai contoh jika datanya bulanan, maka ada 12 variabel dummy seasonal, 1 dummy untuk 1 bulan. Jika data kuarter, maka ada 3 variabel dummy, 1 dummy untuk kuarter pertama dan seterusnya. Model regresi linier untuk data yang memiliki variasi kalender adalah
yt = β 0 + β 1V1,t + β 2V2 ,t + ... + β pV p ,t + a t
Dimana Vp,t adalah variabel dummy untuk efek variasi kalender ke-p. Stepwise Regression Stepwise Regression adalah metode eliminasi langkah mundur mulai dengan nilai regresi terbesar dengan menggunakan semua peubah, dan secara bertahap mengurangi banyaknya peubah dalam persamaan sampai pada suatu keputusan dicapai untuk menggunakan persamaan yang diperoleh. Prosedur seleksi stepwise berusaha mencapai kesimpulan yang serupa namun dengan menempuh arah yang berlawanan, yaitu menyusupkan peubah satu demi satu sampai diperoleh persamaan regresi yang memuaskan. (Draper & Smith, 1992). Model ARIMAX untuk Variasi Kalender Model ARIMA adalah model umum untuk data forcasting. ARIMAX adalah model ARIMA dengan variabel tambahan (Chan dan Chan, 2008). Dalam penelitian ini variabel tambahan adalah variabel dummy untuk efek variasi kalender. Model ARIMA seasonal umum dapat ditulis sebagai berikut:
yt =
θ q (B )Θ Q (B S )
at
θ p (B )Θ P (B S )(1 − B )d (1 − B S )
D
dengan demikian model ARIMA seasonal dengan penambahan variabel dummy dapat ditulis sebagai berikut :
y t = β 1V1,t + β 2V2,t +
+ β sV s ,t +
θ q (B )Θ Q (B S )
θ p (B )Θ P (B S )(1 − B )d (1 − B S )
D
4
at
Banyak Hari Sebelum Lebaran Berikut merupakan langkah selanjutnya pemodelan data yang mengandung variasi kalender, dalam kasus ini adalah pemodelan efek jumlah hari sebelum Lebaran pada penjualan di bulan tersebut dan bulan sebelumnya. Ada dua model tren penjualan yang diestimasi, yaitu (Endharta dkk, 2009):
a. Model untuk efek jumlah hari sebelum Lebaran terhadap penjualan di bulan tersebut, αˆ j =ν 0 +ν1 j
b. Model untuk efek jumlah hari sebelum Lebaran terhadap penjualan di satu bulan sebelum Lebaran terjadi, γˆ j = ω0 + ω1 j 3. Metodologi
Data yang digunakan dalam penelitian ini adalah data sekunder tentang penjualan yang terjadi pada perusahaan retail Grup AMIGO di daerah Boyolali antara tahun 2002 sampai dengan tahun 2009. Identifikasi Variabel Variabel dummy evek variasi kalender yang digunakan dalam penelitian ini adalah sebagai berikut: Lebaran Tanggal Variabel Dummy 2002 6-7 Desember H5 =Desember, dan SH5 = Nopember 2003 25-26 Nopember H24 =Nopember, dan SH24 = Oktober 2004 14-15 Nopember H13 =Nopember, dan SH13 = Oktober 2005 3-4 Nopember H2 =Nopember, dan SH2 = Oktober 2006 23-24 Oktober H22 =Oktober, dan SH22 = September 2007 12-13 Oktober H11 =Oktober, dan SH11 = September 2008 1-2 Oktober H0 =Oktober, dan SH0 = September 2009 21-22 September H20 =September, dan SH20 = Agustus D5 : Banyak minggu dalam satu bulan (0 = 4 minggu, 1 = 5 minggu) Tahun
Langkah Analisis Analisis data merupakan suatu proses pengolahan data yang membahas data secara rinci untuk menghasilkan kesimpulan sesuai tujuan penelitian. Adapun analisis data penjualan celana pendek dilakukan dengan pengujian-pengujian sebagai berikut: Untuk menjawab tujuan nomor 1 dilakukan analisis sebagai berikut: 1. Mendeskripsikan data penjualan rok dewasa pertahun dengan menggunakan software Minitab. 2. Mengintepretasikan hasil statistika deskriptif yang telah diperoleh. Untuk menjawab tujuan ke-2 dilakukan langkah analisis sebagai berikut dengan tahapan : Untuk Metode Analisis dengan menggunakan Metode Regresi Time Series: 1. Menentukan determinasi dari variabel dummy untuk periode variasi kalender. 2. Melakukan determinasi dari deterministic trend dan seasonal. 3. Melakukan estimasi dari model variasi kalender dan pola lain yang simultan. 4. Melakukan pengecekan apakah residual white noise atau tidak. 5. Melakukan estimasi dari efek variasi kalender yang telah terbentuk dari data penjualan rok dewasa. Untuk Metode ARIMAX dengan menggunakan Regresi Dummy: 1. Membagi data menjadi dua untuk data in-sample dan data out-sample. Data in-sample penjualan rok dewasa antara tahun 2002 sampai dengan tahun 2007. Sedangkan data tahun 2008 dan 2009 sebagai data out-sample. 2. Melakukan pengecekan plot data in-sample.
5
3. Melakukan analisis data in-sample dengan menggunakan metode regresi dummy dengan dummy yang digunakan adalah dummy terjadinya Iedul Fitri dalam satu tahun, dummy minggu terjadinya Iedul Fitri, dummy banyaknya minggu dalam satu bulan. 4. Mencari model ARIMA dari residual yang diperoleh. 5. Menggunakan model ARIMA yang diperoleh pada data in-sample dengan tambahan variabel dummy 6. Menyesuaikan dengan data out-sample panjualan rok. 7. Menginterpretasikan model yang didapatkan. Untuk menjawab tujuan ke-3 dilakukan langkah-langkah analisis sebagai berikut : 1. Melakukan peramalah untuk penjualan rok tahun berikutnya dengan menggunakan model terbaik yang telah diperoleh pada tujuan nomor 2. 2. Mengintepretasikan peramalan yang telah diperoleh.
4. Hasil dan Pembahasan Statistika Deskriptif Data penjualan rok dewasa dianalisis dengan menggunakan analisis Statistika Deskriptif Boxplot perbulan adalah sebagai berikut:
Pada gambar di atas dapat dilihat bahwa pola penyebaran data antara bulan Januari sampai dengan bulan Desember tahun 2002 sampai debgan tahun 2009 adalah berbeda. Pola penyebaran paling lebar adalah pada data penjualan rok dewasa yang terjadi pada bulan November dengan rataratanya adalah sebesar 190,571. Sedangkan pola sebaran data paling kecil adalah pada bulan April dengan rata-ratanya sebesar 75,5. Data penjualan rok dewasa memiliki nilai outlier yaitu sebesar 271 dengan rata-rata sebaran datanya adalah sebesar 91,7143. Analisis Time Series #
%$!
"
"
&
%
&
"
%
&
"
%
'$ %
"
'$ %
"
'$ %
"
(
%
"
Secara umum dari gambar di atas dapat dijelaskan bahwa semakin akhir tanggal Lebaran yang terjadi pada suatu bulan maka efek penjualan di satu bulan sebelumnya adalah semakin kecil atau dapat dikatakan bahwa banyaknya penjualan adalah terletak pada tanggal terjadinya lebaran di suatu bulan.
6
Berikut ini merupakan deskripsi lengkap tanggal terjadinya Lebaran selama tahun 2002 sampai dengan tahun 2009: Lebaran
Tahun
Tanggal
Bulan Sebelum Lebaran
2002
6-7 Desember
Nopember
2003
25-26 Nopember
Oktober
2004
14-15 Nopember
Oktober
2005
3-4 Nopember
Oktober
2006
23-24 Oktober
September
2007
12-13 Oktober
September
2008
1-2 Oktober
September
2009
21-22 September
Agustus
Metode Time Series Regression untuk Data Variasi Kalender 1. Model Regresi dengan Variabel Dummy Efek Variasi Kalender pada model akhir yang didapatkan, residual data masih telah memenuhi asumsi White Noise namun belum memenuhi asumsi berdistribusi Normal dengan nilai RMSE model akhir yang diperoleh adalah sebesar 66.0526. Model yang didapatkan tersebut adalah sebagai berikut: yˆ t = 0.104Yt-3 + 0.151Yt-6 + 0.444Yt-12 + 102H11 + 147H13 + 104H22 + 234H24 + 192SH2 + 99.6SH13 + 88.7O30 + 81.3O31 + 94.9O69 + at !
" $
$ ,
! ,
#$% ,! ,
$
! .
*+ !, -,
$
" $ ,
,
,! ,
!
#$% ,
$
.
)
)
)
)
)
)
)
)
)
)
&
#
%$&
,
(# & /( 0)1
!
!
!
*+ !, -,
)
) #
%$Dari gambar di atas tampak bahwa model regresi dengan variabel dummy efek variasi kalender telah memenuhi asumsi white noise namun belum memenuhi asumsi ditribusi normal, sehingga model tersebut dapat dikatakan tidak sesuai untuk memodelkan data penjualan rok yang telah terjadi.
7
2. Model Regresi dengan Variabel Dummy Efek Variasi Kalender & Trend Didapatkan hasil akhirnya adalah sebagai berikut: yˆ t * = 0.472Yt-12* + 0.770t* + 131H13* + 230H24* + 175SH2* + 82.3SH13* + at Dengan yˆ t * = yˆ t -0,3878 yˆt −1 . Model tersebut telah signifikan secara overall dan parsial dengan milai RMSE-nya adalah sebesar 33.5985. !
" $
$ ,
! ,
!
#' ,! ,
$
*+ !, -,
.
$
" $ ,
,
,! ,
!
#' ,
$
.
!
!
*+ !, -,
)
)
)
)
)
)
)
)
)
)
Pada plot ACF dan PACF residual di atas tampak bahwa residual data dari model yang telah didapatkan tersebut adalah telah white noise. Dan juga residual data dari model telah memenuhi asumsi berdistribusi Normal, hal ini dapat dilihat dari gambar di bawah ini: &
#'
&
,
2
!
(# & /( 0)1
)
) #'
Setelah mendapatkan model yang sesuai dan memenuhi residual yang white noise, maka selanjutnya membuat regresi antara nilai koefisien variabel H dan SH terhadap nilai j dari model di atas. Hasil estimasi parameter pada kedua model tersebut adalah sebagai berikut:
αˆ j = −24.9 + 6.63 j γˆ j = 105 − 4.82 j
dengan αˆ j merupakan koefisien dari variabel H dan γˆ j merupakan koefisien dari variabel dummy SH, sedangkan j adalah banyak hari sebelum terjadinya Lebaran. Model di atas menjelaskan bahwa ratarata kenaikan penjualan per hari sebelum Lebaran pada bulan tersebut adalah 7 unit. Sedangkan γˆ j menunjukkan rata-rata penurunan penjualan per hari pada satu bulan sebelum bulan Lebaran akibat berkurangnya hari sebelum Lebaran adalah 5 unit rok. Dengan menambahkan perhitungan tersebut maka didapatkan nilai RMSE out-sample data penjualan rok ini adalah sebesar 46.68041. 3. Model Regresi dengan Variabel Dummy Efek Variasi Kalender & Seasonal Selanjutnya ditambahkan pola musiman pada data penjualan rok yang telah didapatkan dengan menambahkan variabel dummy musiman. Hasil perhitungan model regresi yang diperoleh adalah sebagai berikut: yˆ t = 0.105Yt-1 + 120H2 + 174H5 + 214H11 + 330H13 + 240H22 + 381H24 + 276SH2 + 308SH5 + 74.9SH11 + 159SH13 + 57.7B1 + 43.9B2 + 60.4B4 + 73.4B5 + 89.9B7 + 83.7B8 + 64.2D5 + 70.6O10 + 90.4O22 + 65.2O30 + at
8
untuk nilai RMSE dari model in-sample di atas adalah sebesar 61.05228. Residual data yang diperoleh telah memenuhi asumsi White Noise dan juga telah memenuhi asumsi berdistribusi normal. Hal tersebut dapat dilihat pada gambar di bawah ini: !
" $
$ ,
! ,
!
#() ,! ,
$
*+ !, -,
.
$
" $ ,
,
,! ,
!
#() ,
$
.
!
!
*+ !, -,
)
)
)
)
)
)
)
)
)
)
&
#()
&
,
!
(# & /( 0)1
)
) #()
Pada plot di atas tampak bahwa residual data dari model yang telah didapatkan sudah memenuhi asumsi white noise dan juga telah memenuhi asumsi berdistribusi normal. Setelah mendapatkan model di atas , maka selanjutnya membuat regresi antara nilai koefisien variabel H dan SH terhadap nilai j lagi terhadap model di atas. Hasil estimasi parameter pada kedua model tersebut adalah sebagai berikut:
αˆ j = 129 + 8.86 j γˆ j = 317 − 14.1 j
Model di atas menjelaskan bahwa rata-rata kenaikan penjualan per hari sebelum Lebaran pada bulan tersebut adalah 9 unit rok. dan rata-rata penurunan penjualan per hari pada satu bulan sebelum bulan Lebaran akibat berkurangnya hari sebelum Lebaran adalah 14 unit rok. Dengan menambahkan perhitungan tersebut maka didapatkan nilai RMSE out-sample data penjualan rok ini adalah sebesar 61.05228. Metode ARIMAX 1. ARIMAX dengan Dummy Efek Variasi Kalender yˆ t = 150H2 + 193H5 + 229H11 + 348H13 + 248H22 + 391H24 + 289SH2 + 316SH5 + 68.8SH11 + 169SH13 - 5.2SH22 + 98.0SH24 + 78.2D5 + at residual data yang didapat dari model di atas tersebut dilihat pola ACF dan PACF-nya untuk menentukan kemungkinan model yang sesuai. Berikut adalah ACF dan PACF data residual dari model di atas.
9
!
" $
$ ,
! ,
!
#) ,! ,
$
*+ !, -,
.
$
" $ ,
,
!
#)
,! ,
,
$
.
!
!
*+ !, -,
)
)
)
)
)
)
)
)
)
)
Dari plot ACF dan PACF data residual di atas tampak bahwa residual data tersebut belum White Noise, maka dari itu dilakukan analisis dengan menggunakan software SAS. Model yang didapatkan model yang sesuai adalah model ARIMA (1,0,5) H2, H5, H11, H13, H22, H24, SH2, SH5, SH11, SH13 yang telah White Noise dan juga memenuhi asumsi berdistribusi normal. Hal tersebut dapat dilihat pada gambar di bawah ini: !
" $
$ ,
! ,
!
#* +,,! ,
$
*+ !, -,
.
$
" $ ,
,
!
,! ,
#* +,,
$
.
!
!
*+ !, -,
)
)
)
)
)
)
)
)
)
)
Gambar di atas merupakan gambar plot ACF dan PACF dari residual data model ARIMAX dengan tambahan variabel efek variasi kalender tampak bahwa telah memenuhi asumsi white noise dengan nilai RMSE yang didapatkan adalah sebesar 21.4206. Untuk selanjutnya membuat regresi antara nilai koefisien variabel H dan SH terhadap nilai j dari model ARIMAX di atas. Hasil estimasi parameter pada kedua model tersebut adalah sebagai berikut: 2. αˆ j = 118 + 6.49 j 3.
γˆ j = 238 − 10.6 j
Model di atas menjelaskan bahwa rata-rata kenaikan penjualan per hari sebelum Lebaran pada bulan tersebut adalah 6 unit rok. dan rata-rata penurunan penjualan per hari pada satu bulan sebelum bulan Lebaran akibat berkurangnya hari sebelum Lebaran adalah 11 unit rok. Dengan menambahkan perhitungan tersebut maka didapatkan nilai RMSE out-sample data penjualan rok ini adalah sebesar 53.0378. 2. ARIMAX dengan Dummy Efek Variasi Kalender & Seasonal Model regresi yang didapatkan adalah sebagai berikut: yˆ t = 105H2 + 205H5 + 148H11 + 303H13 + 167H22 + 346H24 + 208SH2 + 271SH5 + 48.8SH11 + 88.0SH13 - 25.3SH22 + 17.0SH24 + 65.8B1 + 50.8B2 + 71.3B3 + 67.8B4 + 80.5B5 + 82.2B6 + 98.5B7 + 94.0B8 + 98.3B9 + 81.0B10 + 45.0B11 + 65.6B12 + at Dari model regresi di atas dengan variabel dummy yang digunakan adalah dummy efek variasi kalender dan dummy musiman didapatkan nilai residual. Berikut merupakan plot ACF dan PACF dari residual data yang telah didapatkan pada model di atas:
10
!
" $
$ ,
! ,
#. ,! ,
!
$
.
*+ !, -,
$
" $ ,
,
!
,! ,
#. ,
$
.
!
!
*+ !, -,
)
)
)
)
)
)
)
)
)
)
Dari plot ACF dan PACF residual data di atas dapat disimpulkan bahwa kemungkinan model yang mungkin adalah ARIMA (1,0,0) dan ARIMA (0,0,1) dengan tambahan variabel dummy. Setelah dilakukan perhitungan pada kedua model yang mungkin tersebut didapatkan bahwa model yang memenuhi adalah model ARIMA (1,0,0) H2, H5, H11, H13, H22, H24, SH2, SH5, SH11, SH13, B1, B2, B4, B5, B7, B8, B10, B11. Nilai RMSE yang diperoleh dari model di atas adalah sebesar 18.76734. model tersebut telah memenuhi asumsi White Noise dan juga telah memenuhi asumsi berdistribusi normal, Hal ini tampak pada gambar di bawah ini: !
" $
$ ,
! ,
!
#* +,' ,! ,
$
*+ !, -,
.
$
" $ ,
,
!
,! ,
#* +,' ,
$
.
!
!
*+ !, -,
)
)
)
)
)
)
)
)
)
)
Pada gambar di atas telah tampak bahwa model tersebut telah memenuhi asumsi white noise. Selanjutnya membuat regresi antara nilai koefisien variabel H dan SH terhadap nilai j dari model ARIMAX di atas. Hasil estimasi parameter pada kedua model tersebut adalah sebagai berikut:
αˆ j = 124 + 6.14 j γˆ j = 234 − 10.5 j
Model di atas menjelaskan bahwa rata-rata kenaikan penjualan per hari sebelum Lebaran pada bulan tersebut adalah 6 unit rok. dan rata-rata penurunan penjualan per hari pada satu bulan sebelum bulan Lebaran akibat berkurangnya hari sebelum Lebaran adalah 11 unit rok. Dengan menambahkan perhitungan tersebut maka didapatkan nilai RMSE out-sample data penjualan rok ini adalah sebesar 61,109. Perbandingan nilai RMSE dari model-model yang didapatkan dapat dilihat pada table berikut: Nilai RMSE Model efek variasi kalender in-sample out-sample Time Series Regresi Variabel dummy trend 33,5985 46,68041 Variabel dummy seasonal 21,1896 61,05228 ARIMAX ARIMA (1,0,5) 21,4206 53,0378 ARIMA (1,0,0) dummy seasonal 61,109 18,76734
11
Peramalan Tahun 2010 dan 2011 Forecast 153 112 116 121 122 128 128 131 134
Bulan 10 11 12 1 2 3 4 5 6
Forecast 135 197 179 154 135 138 141 142 146
Tahun 2009 2009 2009 2010 2010 2010 2010 2010 2010
Bulan 7 8 9 10 11 12 1 2 3
Forecast 147 149 151 117 320 158 164 155 158
Tahun 2010 2010 2010 2010 2010 2010 2011 2011 2011
Bulan 4 5 6 7 8 9 10 11 12
Tahun 2011 2011 2011 2011 2011 2011 2011 2011 2011
Pada table di atas yaitu peramalan penjualan rok dewasa yang terjadi tahun 2010 dan tahun 2011. Pada tahun 2010 lebaran terjadi pada bulan Sepember tanggal 10 dan 11 dengan banyak taksiran penjualan rok adalah sebesar 179 dan untuk penjualan sebelum bulan terjadinya lebaran, yaitu penjualan pada bulan Agustus adalah sebesar 197 unit rok. Sedangankan taksiran penjualan untuk tahun 2011 dengan bulan terjadinya lebaran adalah pada bulan Agustus tanggal 30 dan 31, taksiran penjualan rok yang akan terjadi pada bulan tersebut adalah sebanyak 320 unit rok, dan untuk penjualan pada bulan sebelum terjadinya lebaran, yaitu pada bulan Juli taksiran banyak terjadinya penjualan rok dewasa adalah sebesar 117 unit rok. Hal ini dapat dilihat pada gambar 4.22 di bawah ini: ! %
4
%
!
(
!
'$
3
"
'$
3
"
'$
5. Kesimpulan dan Saran Kesimpulan Dari analisis yang telah dilakukan terhadap data penjualan rok dewasa di daerah Boyolali antara tahun 2002 sampai dengan tahun 2009 maka didapatkan kesimpulan sebagai berikut: 1. Hasil analisis yang didapatkan dari analisis statistika deskriptif diketahui pola penyebaran data penjualan rok paling lebar adalah pada data penjualan rok dewasa yang terjadi pada bulan November dengan rata-ratanya adalah sebesar 190,571. Sedangkan pola sebaran data paling kecil adalah pada bulan April dengan rata-ratanya sebesar 75,5. Data penjualan rok dewasa memiliki nilai outlier yaitu sebesar 271 dengan rata-rata sebaran datanya adalah sebesar 91,7143. 2. Perbandingan metode yang dilakukan untuk menentukan model yang sesuai terhadap data penjualan rok yang telah terjadi dengan menggunakan metode regresi time series dan metode ARIMAX. Hasil perbandingan tersebut didapatkan model terbaik adalah dari metode Time Series Regresi dengan nilai RMSE out-sample paling kecil yaitu sebesar 46,68041. Model tersebut dengan menggunakan metode regresi time series dengan model regresi variabel dummy efek variasi kalender dan dummy trend. 3. Dari model terbaik yang telah diperoleh maka dapat dilakukan peramalan untuk tahun 2010 dan tahun 2011 yaitu tahun 2010 lebaran terjadi pada bulan Sepember tanggal 10 dan 11 dengan banyak taksiran penjualan rok sebesar 179 dan untuk penjualan sebelum bulan terjadinya lebaran, yaitu bulan Agustus adalah sebesar 197 unit rok. Sedangankan taksiran penjualan untuk tahun 2011 dengan bulan terjadinya lebaran adalah pada bulan Agustus tanggal 30 dan 31, taksiran penjualan rok yang akan terjadi adalah sebanyak 320 unit rok, dan untuk penjualan pada bulan
12
sebelum terjadinya lebaran, yaitu pada bulan Juli taksiran banyak terjadinya penjualan rok dewasa adalah sebesar 117 unit rok.
Saran Penjualan yang dianalisis dipengaruhi oleh banyaknya hari libur yang terjadi pada bulan lebaran, namun untuk selanjutnya perlu dilakukan analisis terhadap adanya promo diskon yang diberikan oleh perusahaan retail atau toko retail terhadap penjualan apakah berpengaruh terhadap banyaknya penjualan atau tidak. Daftar Pustaka
Al-Khazali, O. M., Koumanakos, E. P. dan Pyun, C. S. 2008. Calendar anomaly in the Greek stock market: Stochastic dominance analysis. International Review of Financial Analysis, 17, 461–474. Bowerman, B.L. and O’Connell, R.T. 1993, Forecasting and Time Series: An Applied Approach, 3rd edition, Duxbury Press: USA Chan, W. W., dan Chan, L. C. 2008. Revenue Management Strategies Under the Lunar–Solar Calendar: Evidence of Chinese Restaurant Operations. International Journal of Hospitality Management, 27, 381-390. Cryer, D. J. 1986. Time Series Analisis, Boston : PWS-KENT Publishing Company Inc. Daniel, W. W. 1989. Statistika Nonparamerik Terapan, Jakarta : PT Gramedia Pustaka Utama. Draper, N. R, dan Smith, H. 1992. Analisis Regresi Terapan, Jakarta : PT Gramedia Pustaka Utama. Endharta, A. J., Hamzah, N. A., dan Suhartono. 2009. Development Of Calendar Variation Model Based On Time Series Regression And ARIMAX For Forecasting Time Series Data With Islamic Calendar Effect. Proc. ICCS-X Cairo, Egypt, 18, 20-23. Gujarati, D. 1992. Essential of Econometrics, New York: McGraw-Hill Inc. Holden, K., Thompson, J., dan Ruangrit, Y. 2005. The Asian Crisis and Calendar Effect On Stock Return In Thailand. Europian Journal of Operational Research, 136, 242-252 Leontitsis, A., dan Vorlow, C. E. 2006. Accounting for Outliers and Calendar Effects in Surrogate Simulations of Stock Return Sequences. Pysica A, 368, 522-530. Liu, L. 1986. Identification Of Time Series Model In The Presence Of Calender Variation. International Journal of Forecasting, 2, 357-372. Makridakis, W. 1999. Metode dan Aplikasi Peramalan, Edisi kedua. Jakarta : Bina Rupa Aksara,. Saputra, H. 2007. Analisis Peramalan terhadap Dana Pihak Ketiga (DPK) di BANK JATIM Surabaya dengan menggunakan Metode ARIMA Box-Jenkins. Tugas akhir yang tidak dipublikasikan, Institut Teknologi Sepuluh Nopember. Shumway, R.H., dan Stoffer, D.S. 2006. Time Series Analysis and Its Application with R Examples, Edisi kedua. Springer. Walpole, R. E. 1995. Ilmu Peluang untuk Insinyur dan Ilmuwan, Edisi Ketiga. Jakarta : PT Gramedia Pustaka Utama. Wei, W. S. 2006. Time Analysis Univariate and Multivariate Methods, New York : Addison Wesley Publishing Company, Inc. www.wikipedia.com., kebutuhan pokok. Mei 20. 2010. www.wikipedia.com., pakaian. Mei 20. 2010.
13