JURNAL TEKNIK POMITS
1
PERAMALAN KUNJUNGAN WISATA DENGAN PENDEKATAN MODEL SARIMA (Studi kasus : Kusuma Agrowisata) 1
Nofinda Lestari, 2Nuri Wahyuningsih. 1,2 Matematika, FMIPA, Institut Teknologi Sepuluh Nopember Jl. Arief Rahman Hakim, Surabaya 60111 E-mail:
[email protected]
Abstrak—Peramalan jumlah kunjungan wisata yang masuk ke dalam suatu daerah sangat diperlukan oleh pelaku bisnis pariwisata. Untuk itu tujuan utama dalam Tugas Akhir ini adalah untuk pembentukan model dan memperoleh hasil peramalan jumlah kunjungan wisata satu periode ke depan dengan studi kasus di Kusuma Agrowisata Batu Malang. Metode yang digunakan dalam Tugas Akhir ini adalah metode Box Jenkins-SARIMA sebagai pengembangan dari metode ARIMA. Metode ini sesuai dengan situasi yang ada dimana data yang ada bersifat musiman. Langkah pertama yang dilakukan adalah melihat kestasioneran data. Selanjutnya identifikasi model dari plot ACF dan PACF yang menghasilkan kesalahan ramalan terkecil, estimasi parameter, dan diagnosa dengan melihat hasil residual dan normalitas. Software yang digunakan untuk menganalisa data dan pembentukan model adalah dengan software Minitab 15 dan SAS. Hasil analisis menunjukkan bahwa model ARIMA ([2,5],1,1)(1,0,0)12 adalah model yang terbaik. Kata Kunci—ARIMA, Kunjungan Wisata, Metode BoxJenkins, SARIMA
P
I. PENDAHULUAN
ariwisata merupakan bagian yang tidak terpisahkan dari kehidupan manusia. Indonesia sebagai negara yang sedang berkembang dalam tahap pembangunannya, berusaha membangun industri pariwisata sebagai salah satu cara untuk mencapai neraca perdagangan luar negeri yang berimbang [1]. Setiap kota di Indonesia memiliki objek wisatanya masingmasing, Kota Malang, Jawa Timur sebagai salah satu tujuan wisata di Jawa Timur semakin populer. Selain karena udaranya yang sejuk, banyak juga tujuan wisata di sekitar Malang, seperti Kota Batu yang mempunyai beragam wisata alam, contohnya Kusuma Agrowisata. Oleh karena itu Tugas Akhir ini bertujuan untuk meramalkan jumlah pengunjung Kusuma Agrowisata pada tahun 2012 [2]. Pada musim–musim liburan sekolah dan juga tahun baru, jumlah kunjungan wisata di berbagai tempat pariwisata lebih meningkat daripada hari-hari biasa, sehingga metode peramalan yang digunakan dalam Tugas Akhir ini adalah SARIMA. Beberapa penelitian terdahulu memberikan informasi mengenai metode yang dapat diterapkan untuk meramalkan jumlah kunjungan wisata. Naïve Models, Exponential Smoothing dan Seasonal ARIMA merupakan metode yang pernah digunakan oleh Wang dan Lim untuk meramalkan kunjungan wisatawan ke Malaysia dan asal
Australia ke Jepang. Sedangkan Athanasopoulos dan Hyndman memanfaatkan Time Series Regression, Exponential Smoothing dan Innovations state space models dalam meramalkan jumlah kunjungan wisata ke Australia. Metode SARIMA juga pernah digunakan oleh Hermanto untuk meramalkan tingkat penjualan motor di PT. Lancar Sukses Mandiri, oleh Adit untuk memprediksi jumlah wisatawan dalam negeri yang datang ke hotel di Daerah Istimewa Yogyakarta, oleh Roni untuk meramalkan harga bawang merah di enam kota besar Indonesia, oleh Anggraini untuk memodelkan SARIMA dan penerapannya. II. URAIAN PENELITIAN A. Studi Literatur Metode Peramalan adalah cara memperkirakan secara kuantitatif apa yang akan terjadi pada masa yang akan datang, berdasarkan data yang relevan pada masa lalu. Metode ini sangat berguna dalam mengadakan pendekatan analisis terhadap perilaku atau pola dari data yang lalu, sehingga dapat memberikan cara pemikiran, pengerjaan dan pemecahan yang sistematis dan prakmatis serta memberikan tingkat keyakinan yang lebih. Salah satu metode dalam peramalan yaitu metode Box Jenkins. Beberapa model dalam Metode Box-Jenkins yaitu : 1. Model ARIMA (p,d,q) Rumus umum model ARIMA (p,d,q) adalah sebagai berikut [5]: d
φ ( B )(1 − B ) Z t = θ ( B ) a t p
q
dengan : p
φ ( B ) = (1 − φ B − ... − φ B ) 1
p
p
q
θ (B ) = (1 − θ1 B − ... − θ q B ) q
φ (B )
: AR (p)
θ (B )
: AR (p)
p
q
(1 − B) a
t
d
: differencing orde d : nilai residual pada saat t
JURNAL TEKNIK POMITS
2
2. Model ARIMA dan Faktor Musim Notasi ARIMA dapat diperluas untuk menangani aspek musiman, notasi umumnya adalah [5] : ARIMA (p,d,q) (P,D,Q)S dengan : p,d,q : bagian yang tidak musiman dari model (P,D,Q)S : bagian musiman dari model S : jumlah periode per musim Adapun rumus umum dari ARIMA (p,d,q)(P,D,Q)S sebagai berikut : S
S D S Φ B φ p ( B )(1 − B ) (1 − B ) Z = θ q ( B ) Θ ( B ) a P t q t
dengan : φ p (B ) Φ B P
S
(1 − B)
d
d
: AR non seasonal : AR seasonal : differencing non seasonal
S D (1 − B ) :
θqB Θ
Q
S (B )
differencing seasonal
: MA non seasonal
estimasi parameter(φ1 ) − 0 standart error parameter
Daerah penolakan : Tolak
H 0 jika
| t hitung |> tα 2 − n −1
dimana n m enunjukkan banyaknya data dan n menunjukkan banyaknya parameter. Kriteria pengujian: Jika | t hitung |< tα −n −1 maka H 0 diterima. 2
Jika | t hitung |> tα −n−1 maka H 0 ditolak. 2 4. Uji Asumsi Residual Dalam menentukan model ARIMA yang terbaik, harus dipilih model yang seluruh parameternya signifikan, kemudian juga memenuhi 2 asumsi residual yaitu berdistribusi normal dan white noise. a. Distribusi Normal Pengujian kenormalan dapat dihitung dengan menggunakan Kolmogorov-Smirnov. Hipotesa : H 0 : residual berdistibusi normal H1
: residual tidak berdistribusi normal sup
Kemudian ni lai Dhit dibandingkan dengan nilai
D
pada
Tabel Kolmogorov-Smirnov dengan derajat bebas adalah n. dengan : F0 ( x ) :fungsi yang dihipotesiskan yaitu berdistribusi normal S ( x)
n
:fungsi distribusi kumulatif dari data asal :banyaknya residual
Daerah penolakan : Tolak H 0 jika Dhit > D α, n b. White Noise Suatu model bersifat white noise artinya residual dari model tersebut telah memenuhi asumsi identik (variasi residual homogen) serta independen (antar residual tidak berkorelasi). Pengujian asumsi white noise dilakukan dengan menggunakan uji Ljung-Box. Hipotesa : H 0 : ρ1 = ρ 2 = ... = ρ k = 0 : Minimal ada satu ρ i yang tidak sama dengan nol, i = 1.2...., k
: estimasi parameter ≠ 0
Statistik uji : t hitung =
Jika D hit > D maka H 0 ditolak. (1 − α ), n
H1
: MA seasonal
3. Uji Signifikansi Parameter Model peramalan yang diperoleh akan diuji signifikansi parameter modelnya dengan hipotesis sebagai berikut. Hipotesa : H 0 : estimasi parameter = 0 H1
maka H 0 diterima. Jika D hit ≤ D (1 − α ), n
Statistik uji : D hit = x | S ( x ) − F0 ( x ) | Kriteria pengujian:
Statistik uji :
2 K ρˆ k Q = n ( n + 2) ∑ ,n > k k =1 n − k 2
Daerah penolakan : Q > χ (α ; K − p − q ) dengan : K : lag maksimum n : jumlah data (observasi) k : lag ke-k p dan q : order dari ARMA (p,q) ρˆ k
: autokorelasi residual untuk lag ke-k
5. Overfitting Salah satu prosedur pemeriksaan diagnosis yang dikemukakan Box Jenkins adalah overfitting, yakni dengan menambah satu atau lebih parameter dalam model yang dihasilkan pada tahap identifikasi. Karena ada salah satu estimasi parameter yang tidak signifikan maka dilakukan tahap overfitting. Model yang dihasilkan dari hasil overfitting dijadikan sebagai model alternatif yang kemudian dicari model yang terbaik diantara model-model yang signifikan. 6. Kriteria Pemilihan Model Terbaik Dalam analisis time series terdapat banyak data sehingga akan menghasilkan banyak model untuk menggambarkannya. Kadang-kadang pemilihan model terbaik memang mudah namun dilain waktu pemilihan modelnya menjadi lebih sulit. Oleh karena itu dibutuhkan kriteria untuk menentukan model yang terbaik dan akurat. Beberapa kriteria pemilihan model terbaik sebagai berikut : RMSE =
MSE =
1 n ∑ y t − yˆ t n i =1
(
)
Selain itu pemilihan model terbaik dapat menggunakan Mean Absolute Percentage Error (MAPE) yaitu :
JURNAL TEKNIK POMITS
MAPE =
3
n Yt − Yˆt ∑ t =1 Y t
× 100%
n
n menyatakan banyaknya data yang akan dihitung residualnya. Semakin kecil nilai RMSE dan MAPE, maka semakin baik dan model tersebut layak untuk digunakan. B. Sumber Data Data yang dipakai dalam artikel ini adalah data kunjungan wisata Kusuma Agrowisata Batu Malang mulai tahun 20012011 yang didapat dari laporan pihak marketing Kusuma Agrowisata Batu Malang. C. Metodologi Penelitian Identifikasi data dilakukan dengan membuat plot time series untuk menentukan data musiman atau tidak dan melihat data sudah stasioner atau belum. Jika data belum stasioner dalam mean dilakukan differencing, namun jika data tidak stasioner dalam varians maka dilakukan transformasi BoxCox. Kemudian menghitung ACF dan PACF dari data yang sudah stasioner. Dari perhitungan ACF dan PACF yang didapat bisa dibentuk model ARIMA sementara. Tahap selanjutnya adalah penaksiran dan pengujian parameter θ dan φ . Pada pengujian parameter θ1 , φ1 dicek 1
1
apakah parameter yang didapat dari model SARIMA sementara signifikan atau tidak. Setelah itu tahap selanjutnya adalah pemeriksaan diagnostik. Pemeriksaan diagnostik dilakukan untuk uji identik, uji independent, uji normalitas, dan overfitting. Model yang mengandung parameter yang signifikan dicari residualnya. Residual tersebut kemudian diuji whitenoise dan kenormalan distribusinya. Jika pada tahap ini didapatkan kesimpulan bahwa model belum sesuai maka prosedur ini kembali ke tahap identifikasi ARIMA. Langkah terakhir adalah pemilihan model terbaik. Model terbaik dipilih dari model-model yang telah memenuhi semua asumsi yaitu parameter signifikan, white noise, dan berdistribusi normal, serta berdasarkan n ilai AIC dan SBC terkecil serta MSE, RMSE, dan MAPE terkecil. III. HASIL PENELITIAN
Dasar dari pendekatan metode Box-Jenkins dibagi menjadi 3 tahap, yaitu : A. Tahap Identifikasi Yang pertama kali dilakukan yaitu memplot data time seriesnya untuk mengetahui apakah data tersebut merupakan deret berkala musiman atau deret berkala tidak musiman. Gambar 1 menunjukkan plot data time series. Namun setelah dilihat pada Gambar 1 tidak bisa dipastikan apakah data jumlah kunjungan wisata Kusuma Agrowisata termasuk musiman atau tidak.
Gambar 1. Plot time series data jumlah kunjungan wisata Setelah membuat plot time series langkah selanjutnya adalah melihat kestasioneran data dalam varians dan mean. Untuk melihat kestasioneran data dalam varians dapat dihitung mengggunakan rumus sebagai berikut :
[
] [
MRi = max Wi ,..., Wi − r +1 − Wi ,..., Wi − r +1 MR =
]
( MR + ... + MR ) i N ( N − r + 1)
Untuk data kunjungan pariwisata kusuma agrowisata diperoleh nilai
( ) untuk
W = G ln Y i i
λ =1,
dengan
Yλ − 1 i Wi = λG λ − 1
untuk λ <> 0 ,
λ = 0 , Yi data aktual untuk i = 1,..., n , G
geometric mean dari seluruh data, λ nilai lambda, n
jumlah data observasi
Oleh karena λ = 1 maka data kunjungan wisata sudah stasioner dalam varians. Setelah data sudah stasioner dalam varians maka langkah selanjutnya adalah melihat kestasioneran data dalam means. Dengan differencing = 1, maka untuk melihat kestasioneran data dalam means bisa dilihat dari perhitungan ACF dan PACF nya. ACF untuk data jumlah kunjungan wisata diperoleh dengan rumus sebagai berikut :
(
)(
n−k ∑ Z t − Z Z t +k − Z k =1 ρk = = 2 n γ0 ∑ Zt − Z t =1
γk
(
)
)
dengan Z t data time series pada waktu ke t dan Z rata-rata sampel. Sedangkan PACF untuk data jumlah kunjungan wisata diperoleh dengan rumus sebagai berikut : k −1
φˆkk =
dengan
ρk
ρ k − ∑ φˆk −1, j ρ k − j j =1 k −1 1 − ∑ φˆk −1, j ρ j j =1
adalah fungsi autokorelasi. Adapun hasil
perhitungan ACF dan PACF dapat dilihat pada Tabel 1.
JURNAL TEKNIK POMITS
4
Tabel 1. Perhitungan ACF dan PACF Lag
ρk
φˆkk
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
-0.554006 0.166143 -0.135652 -0.139535 0.195992 -0.041697 0.202131 -0.236899 0.051972 -0.042439 -0.216270 0.481885 -0.206168 0.071262 -0.145338 -0.0412832 0.0114817 0.110073 0.145473 -0.234585 0.105491 -0.243787 0.181348 0.0868786 -0.001549 -0.020498 -0.098928 0.027729 -0.102281 0.187224
-0.554006 -0.203122 -0.206841 -0.461579 -0.301312 -0.201342 0.135513 0.003565 -0.003714 0.069203 -0.458017 -0.115634 0.140560 0.090881 -0.020356 0.056475 -0.126167 -0.142088 0.034267 -0.036337 -0.016161 -0.332464 0.007778 0.107872 -0.055735 -0.111093 0.078717 0.070452 -0.084433 -0.057767
Dari Tabel 1 model ARIMA sementara untuk data kunjungan wisata adalah ARIMA (5,1,[1,12]). B. Tahap Penaksiran dan Pengujian Pengujian signifikansi parameter model dengan α = 5% dan menggunakan uji-t adalah sebagai berikut : 1. Pengujian parameter θ
1
Model peramalan yang diperoleh dari ARIMA sementara diuji signifikansi parameter θ dengan hipotesis sebagai
1
berikut. Hipotesa : H 0 : estimasi parameter θ = 0
1
H1
: estimasi parameter θ1 ≠ 0
Statistik uji : t hitung =
pengujian yang sama seperti pengujian parameter θ didapat hasil seperti pada Tabel 2. 2. Pengujian parameter φ
1
Model peramalan yang diperoleh dari ARIMA sementara diuji signifikansi parameter φ dengan hipotesis sebagai
1
berikut. Hipotesa : H 0 : estimasi parameter φ = 0
1
H1
t hitung = t
standart error parameter
α 2
=t ,n −1
Karena t hitung > t α 2
0.025 : 119
=
0.80820 0.03267
= 24.74
= 1.960
maka H 0 ditolak. Sehingga dapat ,n −1
dikatakan estimasi parameter θ signifikan. Dengan langkah
1
: estimasi parameter φ ≠ 0 1
Statistik uji : t hitung =
estimasi parameter(φ1 ) − 0
t hitung = t
standart error parameter
α 2
=t ,n −1
Karena t hitung > t α 2
0.025 : 119
=
0.24326 0.09333
= 2.61
= 1.960
maka H 0 ditolak. Sehingga dapat ,n −1
dikatakan estimasi parameter φ signifikan. Adapun hasil
1
pengujian parameter φ didapat hasil seperti pada Tabel 2.
1
Model
Tabel 3. Pengujian Parameter Estimasi
(5,1,[1,12])
0.80820 -0.25666 0.24326
Std
0.03267 0.03733 0.09333
C. Pemeriksaan Diagnostik Model dikatakan sudah sesuai apabila telah memenuhi ujiuji sebagai berikut :
1. Uji identik Karena pada tahap identifikasi Z t sudah stasioner dalam means dan varians, maka model dapat dikatakan sudah identik. 2. Uji independent Pengujian ini dilakukan untuk melihat adanya independensi dari residual (untuk mengetahui korelasi dari nilai-nilai residual) maka dilakukan uji : Hipotesa: H 0 : ρ1 = ρ 2 = ... = ρ k = 0 H1
estimasi parameter(φ1 ) − 0
1 maka
: Minimal ada satu ρ i yang tidak sama dengan nol, i = 1.2...., k K
Statistik uji : Q = n ( n + 2) ∑ Untuk K = 6 maka :
2 ρˆ k 6 Q = 120 (120 + 2 ) ∑ k =1 120 − k
2
ρˆ k
k =1 n − k
,n > k
JURNAL TEKNIK POMITS
(− 0.150 )2 120 − 1 Q = 14640 2 (− 0.091) 120 − 4
5
(− 0.026 )
2
+
+
120 − 2 2 0.031
(
)
120 − 5
+
+
(− 0.143)
2
120 − 3 2 0.234
(
)
120 − 6
Tabel 5. Perhitungan MSE, RMSE dan MAPE
+
Residual
MSE 882175.4
= 13.46 2
2
Karena Q > χ (α ; K − p − q ) maka H 0 ditolak artinya residual tidak white noise. Dengan cara yang sama bisa dipakai untuk melihat adanya independensi dari residual pada lag 12, 18, dan 24. 3. Uji normalitas Untuk melihat apakah residual berdistribusi normal. Maka dilakukan uji: Hipotesa: H 0 : residual berdistibusi normal : residual tidak berdistribusi normal
Statistik uji : D hit =
sup x | S ( x ) − F0 ( x ) |
= 0.048717 D
(1 − α , n )
939.2419
MAPE(%) 15.93689
IV. KESIMPULAN
2
χ (α ; K − p − q ) = χ ( 0.05;3) = 7.81473
H1
RMSE
= 0.111
Karena D hit ≤ D maka H 0 diterima artinya residual (1 − α , n ) berdistribusi normal. D. Overfitting Model yang dihasilkan dari hasil overfitting dijadikan sebagai model alternatif yang kemudian dicari model yang terbaik diantara model-model yang signifikan. Adapun model-model alternatif yang akan diujikan seperti pada Tabel 4.
Tabel 4. Pengujian Model SARIMA
Signifikan
Keputusan Uji White Noise Tidak White Noise Tidak White Noise White Noise
Signifikan
White Noise
Signifikan
Tidak White Noise Tidak White Noise
Model
Uji Parameter
([1,5],1, [1,12])(1,0,0 )6
Signifikan
([ 2,5],1,1)(1,0,0 )6 (1,1, [ 2,5])(1,0,0 )12 ([ 2,5],1,1)(1,0,0 )12 ([ 2,5],1,1)(0,0,1)12 (5,1,1)(0,0,1)12
Signifikan
Signifikan
Uji Normal Normal Normal Tidak Normal Normal Normal Normal
Dari Tabel 4 didapatkan satu model yang memenuhi semua asumsi yaitu model ARIMA
([ 2,5],1,1)(1,0,0 )12 . Dengan hasil
perhitungan MSE, RMSE dan MAPE pada Tabel 5.
Model yang sesuai untuk kunjungan wisata Kusuma Agrowisata Batu Malang adalah (1 − 0.28436 B
2
5 − 0.31390 B )(1 − 0.58881B )(1 − B )Yt = (1 − B ) a t
dengan : Yt = [ln( Z )] t
2.99
DAFTAR PUSTAKA [1] Anonim 1. Bab 2 Landasan Teori, di akses pukul 22.24 WIB, tanggal 19 Februari 2012.
. [2] Anonim 2. Tips Wisata ke Kota Malang, , di akses pukul 09.50 WIB tanggal 2 8 Februari 2012. [3] Makridakis, S., Steven C. Wheelwright, dan Victor E. McGee. (1999). Metode dan Aplikasi Peramalan, edisi kedua. Binarupa Aksara, Jakarta. [4] Loganathan, Nanthakumar. dan Ibrahim, Y. (2010). “Forecasting International Tourism Demand in Malaysia Using Box Jenkins Sarima Application”. South Asian Journal of Tourism and Heritage (2010). Vol. 3, Number 2. [5] Wei, W.W.S. 2006. Time Series Analysis, Univariate and Multivariate Methods. 2nd edition. Pennsylvania: Pearson Education Inc.