PERAMALAN DEBIT AIR SUNGAI BRANTAS DENGAN MODEL GSTAR DAN ARIMA Oleh: Henny Dwi Khoirun Nisa’ 1205 100 044 Dosen Pembimbing: Dra. Nuri Wahyuningsih, M.Kes Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh November Surabaya 2010
Abstrak Dalam kehidupan sehari-hari, seringkali kita jumpai data yang tidak hanya mengandung keterkaitan dengan kejadian pada waktu sebelumnya, tetapi juga mempunyai keterkaitan dengan lokasi atau tempat yang lain. Data seperti ini disebut data spasial, salah satu data yang diduga mempunyai keterkaitan antar waktu dan lokasi adalah data debit air sungai. Untuk mendapatkan hasil peramalan yang baik maka dilakukan perbandingan dua model yaitu model Generalized Space Time Autoregressive (GSTAR) dan model Autoregressive Integrated Moving Average (ARIMA). Dalam penilitian ini akan diterapkan model GSTAR dengan dua bobot lokasi yaitu bobot seragam, dan bobot inverse jarak. Pemodelan ARIMA dimaksudkan untuk mengatasi permasalahan yang mungkin muncul yaitu dugaan tidak adanya hubungan keterkaitan antar lokasi. Dari analisis yang telah dilakukan, didapatkan model yang sesuai dengan data yaitu model GSTAR(21) – I(1) untuk ketiga lokasi, model ARIMA(1,0,0) untuk Z1, model ARIMA(1,0,0) untuk Z2 , dan model ARIMA([3,10],1,[3,13]) untuk Z3. Dari model GSTAR dan ARIMA yang terbentuk akan dipilih model terbaik yang menghasilkan kesalahan ramalan terkecil. Pemilihan model terbaik didasarkan pada nilai RMSE dari model. Berdasarkan nilai rata-rata RMSE dari peramalan dengan menggunakan one step forecast, didapatkan kesimpulan bahwa model yang paling sesuai dengan kondisi data adalah model GSTAR(2 1) – I(1) dengan bobot lokasi inverse jarak. Kata kunci: GSTAR, ARIMA, RMSE, Debit air, one step forecast.
1. Pendahuluan Sungai Brantas, terletak di propinsi Jawa Timur dengan luas wilayah sungai 26,5% dari wilayah propinsi Jawa Timur. Sebagai sumber air yang sangat potensial bagi usaha pengelolaan dan pengembangan sumber daya air, Sungai Brantas digunakan untuk kebutuhan domestik, air baku air minum dan industri, irigasi, dan lain lain. Seiring dengan semakin banyaknya kajian-kajian mengenai analisis time series, muncul pemikiran adanya dugaan bahwa ada beberapa data dari suatu kejadian yang tidak hanya mengandung keterkaitan dengan kejadian pada waktu-waktu sebelumnya, tetapi juga mempunyai keterkaitan dengan lokasi atau tempat yang lain. Dengan adanya keheterogenan debit air sungai pada setiap lokasi pengukuran maka untuk melakukan pemodelan hendaknya tidak hanya memperhatikan masalah waktu, akan tetapi juga memperhatikan masalah lokasi. Model space-time ini pertama kali diperkenalkan oleh Pfeifer dan Deutsch (1980a, 1980b). Model space-time yang dikembangkan oleh Pfeifer dan Deutsch mempunyai kelemahan dan kelemahan ini diperbaiki oleh Borovkova, Lopuhaa, dan Ruchjana (2002) melalui model yang dikenal dengan model Generalized Space-Time Autoregressive (GSTAR). Model GSTAR ini muncul atas ketidakpuasan terhadap pengasumsian karakteristik lokasi yang seragam (homogen) pada model STAR yang membuat model ini menjadi tidak fleksibel, khususnya pada saat dihadapkan pada lokasi-lokasi yang memiliki karakteristik yang heterogen. Ruchjana (2002) melakukan pemodelan dengan GSTAR untuk data produksi minyak bumi, model yang didapatkan yaitu GSTAR (11) dengan matrik bobot spasial serta estimasinya menggunakan metode kuadrat terkecil (Least Square). Penelitian lainnya dilakukan oleh Borovkova dkk. (2008) mengenai hasil produksi teh bulanan di Jawa Barat. Pada penelitian ini diambil 24 lokasi dengan 94 pengamatan dan estimasinya menggunakan metode kuadrat terkecil (Least Square). Pada tahun 2009 Mir Atus Shofiyah menerapkan model GSTAR pada data produksi gas, model yang didapatkan yaitu model
1
GSTAR (11) – I(1) dengan bobot lokasi inverse jarak dan menggunakan one step forecast. Amstrong (2006) serta Kostenko dan Hydman (2008) menyatakan bahwa variabel yang tidak signifikan dapat digunakan untuk melakukan peramalan. Model GSTAR ini dapat diterapkan pada data debit air sungai Brantas. Dengan diperoleh model GSTAR, diharapkan akan diketahui hasil debit air sungai Brantas, yang menjadi masalah utama dalam model GSTAR adalah pada pemilihan bobot lokasi. Pemilihan bobot lokasi yang optimal akan menghasilkan model yang lebih tepat sehingga diperoleh hasil peramalan yang tepat pula. Kawasan rawan banjir adalah kawasan yang setiap musim hujan mengalami genangan lebih dari enam jam pada saat hujan turun dalam keadaan normal. Dengan diketahuinya peramalan debit air sungai Brantas maka akan diketahui kapan banjir itu akan datang. Sehingga perlu kiranya untuk melakukan peramalan debit air sungai Brantas pada periode yang akan datang.
2. Model ARIMA dan GSTAR Model ARIMA merupakan model yang biasa digunakan pada data deret waktu yang univariat. Model ini dapat menjelaskan keterkaitan suatu pengamatan pada suatu waktu dengan pengamatan pada waktu-waktu sebelumnya. Secara umum model ARIMA(p,d,q) dirumuskan sebagai berikut (Wei, 2006) : (1) p ( B )( 1 B )d Z ( t ) 0 q ( B )e( t ) dengan : 𝑝, 𝑑, 𝑞 ∶ orde AR nonmusiman, orde differencing non-musiman, orde MA nonmusiman ∅𝒑 𝐵 ∶ koefisien komponen AR nonmusiman dengan derajat p 𝜃𝑞 𝐵 ∶ koefisien komponen MA nonmusiman dengan derajat q 𝐵 ∶ backward shift operator nonmusiman Salah satu metode yang digunakan dalam pemodelan ARIMA adalah metode Box-Jenkins. Metode ini menggunakan nilai-nilai sekarang dan nilai-nilai waktu sebelumnya dari suatu variabel untuk menghasilkan model ramalan jangka pendek dengan pendekatan yang iteratif. Model GSTAR merupakan suatu model yang lebih fleksibel sebagai generalisasi dari model STAR. Secara matematis, notasi dari model GSTAR(p1) adalah sama dengan model STAR(p1). Perbedaan utama dari model GSTAR(p1) ini terletak pada nilai-nilai parameter pada lag spasial yang sama diperbolehkan berlainan. Dalam notasi matriks, model GSTAR(p1) dapat ditulis sebagai berikut : p (2) Z ( t ) k 0 k 1W Z ( t k ) e( t ) k 1
Dengan: 1 𝑁 𝚽𝒌𝟎 = diag 𝜙𝑘0 , … , 𝜙𝑘0 1 𝑁 𝚽𝒌𝟏 = diag 𝜙𝑘1 , … , 𝜙𝑘1
pembobot dipilih sedemikian hingga 𝒘𝒊𝒊 = 0 dan 𝒊≠𝒋 𝒘𝒊𝒋 = 1 Penaksir parameter model GSTAR dapat dilakukan dengan menggunakan metode kuadrat terkecil dengan cara meminimumkan jumlah kuadrat simpangannya. Pemilihan atau penentuan bobot lokasi merupakan salah satu permasalahan utama pada pemodelan GSTAR. Beberapa cara penentuan bobot lokasi yang sering digunakan dalam aplikasi model GSTAR telah disebutkan dalam Suhartono dan Atok (2006). Dua bobot lokasi yang digunakan dalam penelitian ini adalah : 1. Bobot seragam (uniform) w ij 1 ni dengan ni = jumlah lokasi yang berdekatan dengan lokasi i. Bobot lokasi jenis ini seringkali digunakan pada data yang lokasinya homogen atau mempunyai jarak antar lokasi yang sama, 2. Bobot invers jarak. Root Mean Squared Error (RMSE) adalah Ukuran perbedaan antara nilai prediksi dari model atau penaksir dengan nilai sebenarnya dari observasi. RMSE dirumuskan sebagai berikut : RMSE
MSE
1 n
Z n
n1
Zˆ n ( l )
(3)
2
l 1
dengan n merupakan banyak ramalan yang dilakukan. Nilai RMSE berkisar antara 0 sampai . Semakin kecil nilai RMSE maka model semakin bagus
2
Akaike’s Information Criteria (AIC) merupakan salah satu kriteria pemilihan dalam penentuan model terbaik pada data in-sample. Model terbaik adalah model dengan nilai AIC paling kecil. Berikut cara perhitungan nilai AIC (Lutkepohl, 2005): ~ 2 (4) AIC ( p ) log det( ( p )) K 2
∑ u
p
Log adalah notasi logaritma natural, det(.) merupakan notasi determinan, dan
~
T
∑( p ) T ∑uˆ uˆ 1
t
u
' t
adalah
t 1
matriks taksiran kovarian residual dari model VAR(p), T merupakan jumlah residual, dan K merupakan jumlah variabel. Dalam hidrologi dikemukakan, debit air sungai adalah, tinggi permukaan air atau elevasi muka air sungai yang terukur oleh alat ukur permukaan air sungai. Pengukuran dilakukan tiap hari, pada jam-jam tertentu. Mrican, Kertosona, dan Ploso merupkan salah satu tempat pengukuran debit air di sepanjang aliran sungai Brantas. Peta ketiga tempat pengukuran debit air sungai Brantas dapat dilihat pada gambar gambar 1 berikut:
Gambar 1 peta lokasi pengukuran debit air di Mrican, Kertosono, dan Ploso
3. Metodelogi Penelitian Data yang digunakan dalam penelitian ini didapat dari Biro Pengelolaan Dat dan Lingkungan. Data yang digunakan sebanyak 120 dibagi menjadi dua yaitu sebagai data in-sample dan data out-sample. Untuk data insample digunakan 90 data yaitu bulan Januari-Maret 2010, sedangkan yang out-sample sebanyak 30 data yaitu bulan April 2010. Data in-sample digunakan untuk membentuk model dan data out-sample digunakan untuk mengecek ketepatan model. Terdapat tiga variabel penelitian yang digunakan dalam penelitian ini, yaitu: 1. Jumlah debit air sungai di out mrican (Z1). 2. Jumlah debit air sungai di kertosono (Z2). 3. Jumlah debit air sungai di ploso (Z 3). Metode time series yang digunakan pada penelitian ini adalah pemodelan ARIMA dan pemodelan GSTAR dengan dua bobot lokasi yaitu bobot lokasi seragam dan bobot lokasi inverse jarak. Pemodelan dilakukan pada data in-sample. Pemilihan model terbaik pada data in-sample berdasarkan pada nilai AIC. Selanjutnya dilakukan peramalan untuk data out-sample. Dari hasil ramalan tersebut dapat diketahui model terbaik yaitu model dengan nilai RMSE terkecil.
4. Hasil Penelitian Data debit air sungai yang dijadikan sebagai data in-sample pada penelitian ini adalah dari bulan JanuariMaret 2010. Deskripsi secara statistik dari data in-sample dapat dilihat pada tabel berikut ini. Tabel 1 Statistika Deskriptif Debit Air sungai Variabel
Mean
Varians
Minimum
Maximum
Z1
186,196
105,457
42,875
584,833
Z2
295,827
137,533
97,000
787,083
Z3
363,010
136,362
179,333
853,208
3
Pola data dari masing-masing variabel dapat dilihat pada Gambar 2.
Gambar 2 Plot Time Series untuk Z1, Z2, dan Z3 Besarnya pengaruh satu variabel terhadap variabel lain pada suatu waktu dapat dilihat melalui nilai korelasi antar lokasi pada matriks korelasi antar lokasi. Tabel 2 Matriks Korelasi Antar Lokasi Lokasi Z1 Z2 Z3 1 0.960 0.862 Z1 0.960 1 0.915 Z2 0.862 0.915 1 Z3 Besarnya nilai korelasi antar lokasi menggambarkan besarnya hubungan keterkaitan antar lokasi. Berdasarkan Tabel 2, dapat dilihat antar lokasi Z1 dengan Z3, Z1 dengan Z2 dan Z2 dengan Z3 mempunyai nilai korelasi yang besar, hal ini menunjukkan adanya keterkaitan yang besar pada waktu yang sama. Nilai korelasi ini signifikan pada sebesar 0,05. Model GSTAR Dalam pemodelan data time series ada dua asumsi yang harus dipenuhi yaitu data harus stasioner dan residual harus white noise. Untuk langkah awal identifikasi model asumsi yang harus dipenuhi adalah data harus stasioner dalam varian dan mean. Stasioneritas data dalam varian dapat dilihat dari plot Box-Cox. sedangkan stasioneritas data dalam mean dapat dilihat dari skema matriks korelasi silang antar variabel dan matriks parsial korelasi silang antar variabel. Hasil identifikasi stasioneritas dalam varian dengan metode Box-Cox Transformation disajikan dalam plot Box-Cox Gambar 3.
Gambar 3 Plot Box-Cox Variabel Z1, Z2, Z3 Dari Gambar 3 diketahui bahwa batas bawah, batas atas, rounded value, dan lambda estimate masingmasing variabel tidak sama. Jika akan dilakukan transformasi, maka transformasi yang dipakai berbeda-beda sesuai dengan lambda estimate masing-masing variabel. Oleh karena itu transformasi tidak perlu dilakukan dan data dapat dianggap stasioner dalam varian (Shofiyah, Dwiatmono, dan Suhartono. 2009). Selanjutnya dilakukan identifikasi stasioneritas dalam mean. Hasil dari identifikasi ini disajikan dalam Gambar 4.
Gambar 4 Skema Matriks Korelasi Silang Z1, Z2, dan Z3
4
Skema matriks korelasi silang pada Gambar 4 terlihat bahwa pada semua lag terdapat nilai korelasi silang yang keluar. Hal ini ditunjukkan oleh banyaknya simbol (+) yang dapat diartikan bahwa adanya hubungan memiliki korelasi positif, sehingga dapat dikatakan bahwa data Z 1, Z2, dan Z3 tidak stasioner dalam mean. Karena data belum stasioner dalam mean maka dilakukan differencing. Setelah dilakukan differencing tingkat 1, didapatkan skema matriks korelasi seperti pada Gambar 5.
Gambar 5 Skema Matriks Korelasi Silang Z1, Z2, dan Z3 sesudah Differencing Gambar 5 menujukkan bahwa data sudah stasioner dalam mean. Hal ini ditunjukkan oleh banyaknya simbol (.) yang mengindikasikan bahwa tidak adanya korelasi. Sedangkan simbol (+) dan (-) pada skema hanya keluar pada lag tertentu. Kondisi ini berarti bahwa data telah stasioner setelah dilakukan differencing 1. Karena data telah stasioner dalam varian dan mean maka dapat dilanjutkan dengan pembentukan model GSTAR. Pencarian orde dilakukan dengan menggunakan model VARIMA, yaitu dengan memeriksa skema matriks korelasi silang (MACF) dan skema matriks korelasi silang parsial (MPACF). Skema matrik korelasi silang dapat dilihat pada Gambar 5, sedangkan skema matriks korelasi silang parsial dapat lihat pada Gambar 6.
Gambar 6 Skema Matriks Korelasi Silang Parsial Z1, Z2, dan Z3 sesudah Differencing Nilai korelasi silang dari lag-lag yang berada diluar nilai standar deviasi dipilih sebagai orde model VARIMA. Orde VARIMA yang mempunyai nilai AIC terkecil merupakan orde yang dianggap paling sesuai dengan karakteristik data. Adapun nilai AIC untuk setiap lag dapat dilihat pada Tabel 3. Tabel 3 Nilai AIC untuk Menentukan Orde GSTAR Model Dugaan Nilai AIC GSTAR(11)–I(1) 24,23252 GSTAR(21)–I(1) 24,054788* GSTAR(31)–I(1) 24,12024 GSTAR(41)–I(1) 24,289707 * Nilai AIC terkecil
Identifikasi terhadap nilai AIC dari model dugaan menghasilkan kesimpulan bahwa model GSTAR yang paling sesuai untuk data in-sample adalah model GSTAR(21)–I(1) karena model dugaan ini mempunyai nilai AIC terkecil diantara model dugaan lainnya. Dari hasil identifikasi yang telah dilakukan, selanjutnya dilakukan penerapan tiga macam bobot lokasi pada model GSTAR(21) – I(1). Dua bobot lokasi yang digunakan dalam penelitian ini adalah : Bobot seragam
0 0 ,5 0 ,5 W 0 ,5 0 0 ,5 0 ,5 0 ,5 0
0 ,503726 0 ,496274 0 0 ,499951 0 ,496323 0 ,503677 0 0
Bobot invers jarak W 0 ,500049
5
Penerapan kedua bobot lokasi pada model GSTAR(21) – I(1) menghasilkan nilai taksiran parameter yang berbeda-beda. Hasil dari estimasi parameter dengan metode least square tersebut ditampilkan dalam Tabel 4 berikut ini. Tabel 4 Taksiran Parameter Model CSTAR(21)-I(1) Bobot lokasi seragam
Paramet er
Bobot lokasi invers jarak
t tabel
Kriteria Pengujian
Kesimpulan
0.1067
1.96
H 0 diterima
tidak signifikan
0,25
0.0568
1.96
H 0 ditolak
signifikan
-0.5688
-4,18
-0.5691
1.96
H 0 diterima
tidak signifikan
-0,71
-0.1146
-0,71
-0.1148
1.96
H 0 diterima
tidak signifikan
-0,40
-0.1005
-0,40
-0.1004
1.96
H 0 diterima
tidak signifikan
3 11
4,45
0.886
4,44
0.885
1.96
H 0 ditolak
signifikan
1 21
0,32
0.035
0,32
0.0354
1.96
H 0 diterima
tidak signifikan
2 21
-0,44
-0.058
-0,44
-0.058
1.96
H 0 diterima
tidak signifikan
2,26
0.3209
2,26
0.3205
1.96
H 0 ditolak
signifikan
t hitung
1 01
2 01
3 01
Nilai taksiran
t hitung
Nilai taksiran
0,47
0.1064
0,47
0,25
0.0568
-4,18
1 11 2 11
3 21
Kemudian dilakukan uji-F dan uji-t 1. Uji Serentak dengan Uji-F Hipotesis : H0 : 011 012 013 111 112 113 211 212 213 0
H1
: sekurang-kurangnya ada ki 1 0 , dengan k 0 ,1,2 ,3 dan i 1,2 ,3
Satistik Uji : Fhitung = MSR = 2,71 MSE
Ftabel
= F0 ,05 ;9 ,261 = 1,88
Dengan = 5%, karena Fhitung > F0 ,05 ;9 ,261 , maka H 0 ditolak artinya secara bersama-sama parameter signifikan terhadap model. 2. Uji Individu dengan Uji-t Hipotesis: H0 : ki 1 0 , dengan k 0 ,1,2 dan i 1,2 ,3 (parameter tidak signifikan) H1 : ki 1 0 , dengan k 0 ,1,2 dan i 1,2 ,3 (parameter signifikan)
Statistik Uji : t hitung
bk 1
S bk 1
Hasil t-hitung dari pengujian masing-masing parameter dapat dilihat pada kolom kedua Tabel 4 t tabel t 0 ,025 ; 261 1.96
Kriteria Pengujian : Dengan = 5%, jika t hitung > t 0 ,025 ; 261 maka H 0 ditolak artinya parameter signifikan. Hasil keputusan pengujian masing-masing parameter model dapat dilihat pada kolom 5 Tabel 4 dan dapat disimpulkan seperti yang ada dalam kolom 6 Tabel 4
6
Karena ada parameter yang tidak signifikan, maka dilakukan pemilihan model regresi terbaik dengan prosedur eleminasi langkah mundur. Parameter yang belum signifikan dihilangkan. Sehingga parameter yang sudah signifikan dapat dilihat pada Tabel 5. Tabel 5 Taksiran Parameter Model CSTAR(21)-I(1) yang signifikan Param Bobot Lokasi Seragam Bobot Lokasi Invers jarak Kriteria t tabel Kesimpulan t hitung t hitung eter Pengujian Nilai taksiran Nilai taksiran 3 01
-4,22
3 11
4,49
3 21
-0,57 0,88 0,32
-4,22 4,49 2,28
-0,57
1.96
H 0 ditolak
signifikan
0,88
1.96
H 0 ditolak
signifikan
H 0 ditolak 2,28 0,32 1.96 signifikan Dari perhitungan parameter diatas hanya di dapat persamaan pada lokasi 3 saja, Parameter yang tidak signifikan tersebut seharusnya tidak dimasukkan dalam persamaan model, namun untuk mengetahui ramalan dari model GSTAR dengan bobot lokasi seragam maka semua parameterakan dimasukkan ke dalam model. Seperti yang dijelaskan oleh Amstrong (2006) serta Kostenko dan Hydman (2008) bahwa variabel yang tidak signifikan dapat digunakan untuk melakukan peramalan. Sehingga dalam penelitian ini, untuk model GSTAR parameter yang tidak signifikan akan tetap digunakan. Setelah didapatkan nilai taksiran untuk semua parameter, selanjutnya dilakukan cek diagnosa untuk mengetahui apakah model yang terbentuk telah sesuai dengan kondisi data. Cek diagnosa dilakukan terhadap residual dari model. Model GSTAR yang terbentuk dikatakan sesuai jika residualnya telah white noise dan mengikuti distribusi multivariate normal. Identifikasi white noise dapat dilihat melalui skema matriks korelasi silang residual pada Gambar 7.
Gambar 7 MACF residual GSTAR(21)-I(1) dengan Bobot Lokasi (a) Seragam, (b) Inverse Jarak. Selanjutnya residual diuji apakah berdistribusi multivariate normal dengan menggunakan q-q plot dan hasilnya ditampilkan pada Tabel 6 Tabel 6 Hasil Uji Multivariate Normal untuk Residual Bobot Lokasi t Seragam 0.733333 Inverse Jarak 0.733333 Residual dari model GSTAR(21) – I(1) dengan bobot lokasi seragam telah memenuhi asumsi white noise dan multivariate normal. Terpenuhinya asumsi white noise dapat dilihat dari Gambar 7 dimana pada skema matriks korelasi silang residual tidak ada lag yang keluar secara bersama. Sedangkan terpenuhinya asumsi multivariate normal dibuktikan oleh t-value dari masing-masing residual yang lebih besar dari 0.05 sehingga dapat dikatakan residual dari bobot lokasi seragam dan inverse jarak sudah berdistribusi multivariate normal. Karena dua asumsi untuk residual telah terpenuhi, maka dapat disimpulkan bahwa model GSTAR(21) – I(1) sudah baik dan sesuai dengan kondisi data. Model ARIMA Penaksiran parameter pada pemodelan GSTAR(21) – I(1) dengan dua macam bobot lokasi menghasilkan parameter yang tidak signifikan. Sehingga muncul dugaan bahwa tidak terdapat korelasi antar lokasi dan antar waktu. Oleh karena itu perlu untuk dilakukan pemodelan pada tiap-tiap lokasi dengan menggunakan
7
model ARIMA. Seperti pada pemodelan GSTAR(21) – I(1) yang telah dilakukan sebelumnya, sebelum menduga model ARIMA perlu diketahui terlebih dahulu apakah data telah stasioner dalam varian dan mean. Kestasioneran dalam varian telah dibuktikan oleh hasil identifikasi dengan menggunakan Box-Cox Transformation yang dilakukan sebelumnya yaitu pada saat pembentukan model GSTAR(21) – I(1). Identifikasi tersebut membuktikan bahwa data pada tiap-tiap lokasi telah stasioner dalam varian. Sedangkan pengujian kestasioneritasan dalam mean untuk tiap-tiap lokasi dapat dilihat dari plot ACF tiap-tiap lokasi pada Gambar 8.
Gambar 8 Plot ACF Variabel Z1, Z2, Z3 Dari Gambar 8 terlihat bahwa plot ACF dari lokasi Z3 turun lambat. Hal ini berarti bahwa data pada lokasi tersebut belum stasioner dalam mean sehingga perlu dilakukan differencing. Sedangkan plot ACF dari lokasi Z1 dan Z2 turun cepat. Kondisi ini mengindikasikan bahwa data pada lokasi Z 1 dan Z2 telah stasioner dalam mean sehingga tidak perlu dilakukan differencing. Data telah stasioner setelah dilakukan differencing sebanyak satu kali pada variabel Z3. Selanjutnya dilakukan penaksiran parameter model time series. Untuk mengetahui parameter yang signifikan, dilakukan pengujian parameter dengan taraf signifikansi 5%. Berikut ini uji individu dengan uji-t. Uji Individu dengan Uji-t Hipotesis: H0 : k 0 dan k 0 , dengan k 0 ,1,2 ,3 (parameter tidak signifikan) H1 : k 0 dan k 0 , dengan k 0 ,1,2 ,3 (parameter signifikan) Statistik Uji : t hitung
bk 1
S bk 1
Hasil t-hitung dari pengujian masing-masing parameter dapat dilihat pada kolom 4 Tabel 7 t tabel t 0 ,025 ;90 1.99
Kriteria Pengujian : Dengan = 5%, jika t hitung > t 0 ,025 ;90 maka H 0 ditolak artinya parameter signifikan. Hasil keputusan pengujian masing-masing parameter model dapat dilihat pada kolom 6 Tabel 7 dan dapat disimpulkan seperti yang ada dalam kolom 7 Tabel 7. Tabel 7 Hasil Estimasi Parameter Dugaan Model ARIMA dan Hasil Uji-t untuk Signifikansi Lokasi
Model
Parameter
t hitung
t tabel
Kriteria pengujian
kesimpulan
Z1
ARIMA(1,0,0)
1
30,49
1,99
H 0 ditolak
signifikan
Z2
ARIMA(1,0,0)
1
34,33
1,99
H 0 ditolak
signifikan
3
3,25
1,99
H 0 ditolak
signifikan
10
-3,16
1,99
H 0 ditolak
signifikan
3
7,31
1,99
H 0 ditolak
signifikan
13
-2,69
1,99
H0 ditolak
signifikan
Z3
ARIMA ([3,10],1,[3,13])
Dari Tabel 7 diketahui bahwa parameter untuk masing-masing model sudah signifikan. Langkah selanjutnya adalah melakukan cek diagnosa terhadap residual untuk mengetahui apakah residual telah white noise dan berdistribusi normal.
8
Tabel 8. Ljung-Box Model ARIMA Lokasi Model Z1 ARIMA (1,0,0) Z2 ARIMA (1,0,0) Z3 ARIMA ([3,10],1,[3,13])
Lag 6 2,68 2,02 3,82
Lag 12 8,84 6,79 5,22
Lag 18 14,67 14,18 14,99
Gambar 9 Plot Probabilitas Residual untuk Z1, Z2, Z3 Dari pengujian dengan Ljung-Box yang telah dilakukan didapatkan p-value seperti pada Tabel 6, p-value dari masing-masing model lebih dari 0.05 yang itu berarti bahwa residual dari model ARIMA telah white noise. Sedangkan dari Gambar 9 dapat diketahui bahwa residual dari model ARIMA tidak berdistribusi normal. Hal ini disebabkan oleh banyaknya outlier yang ada pada data. Perbandingan Pemodelan GSTAR dan ARIMA Model terbaik adalah model dengan kesalahan ramalan terkecil. Oleh karena itu, dilakukan perbandingan hasil ramalan dari tiap-tiap model yang terbentuk. Perbandingan hasil ramalan dilakukan dengan melihat nilai RMSE dari tiap-tiap model. Penerapan masing-masing model pada data in-sample menghasilkan ramalan yang mendekati data asli namun pada data out-sample menghasilkan ramalan yang nilainya relatif konstan dan tidak sesuai dengan pola data asli. Kondisi ini berati bahwa model yang ada sudah cukup sesuai dengan kondisi asli namun perlu dilakukan pemilihan metode peramalan yang lebih sesuai dengan kondisi data asli. Salah satu metode yang bisa digunakan untuk mengatasi kondisi semacam ini adalah one step forecast. Nilai RMSE dari hasil peramalan dengan menggunakan one step forecast dapat dilihat pada Tabel 9. Tabel 9. RMSE Model pada one step Forecast Model Z1 Z2 Z3 Rata-rata GSTAR(21)-I(1) bobot lokasi Seragam 168,3699 192,1352 139,2224 166,5758 GSTAR(21)-I(1) bobot lokasi Inverse jarak 176,2617 175,4109 144,8508 165,5078* ARIMA 169,5066 193,1314 165,3260 175,988 * nilai RMSE yang terkecil di setiap lokasi
Hasil perbandingan pada Tabel 9 menunjukkan bahwa model GSTAR(21)-I(1) bobot lokasi invers jarak mempunyai rata-rata nilai RMSE out-sample yang lebih kecil. Pola ramalan dari model GSTAR(21) – I(1) dengan bobot lokasi inverse jarak ditampilkan dalam Gambar 10.
Gambar 10. Hasil Peramalan One Step Model GSTAR dengan Bobot Invers Jarak
9
5. Kesimpulan Dari analisis yang telah dilakukan didapatkan kesimpulan bahwa model yang sesuai untuk data debit air sungai pada penelitian ini adalah model GSTAR(21) – I(1) untuk ketiga lokasi, model ARIMA(1,0,0) untuk Z1, model ARIMA(1,0,0) untuk Z 2 , dan model ARIMA([3,10],1,[3,13]) untuk Z3. Model terbaik yang dihasilkan adalah model GSTAR(21) - I(1) dengan bobot lokasi inverse jarak. Nilai rata-rata RMSE dari model ini dengan metode peramalan one step forecast adalah 165,5078. Pola ramalan dari model ini dengan metode peramalan one step forecast sudah cukup baik dan mengikuti pola data out-sample.
6. Daftar Pustaka Armstrong, J.S. (2006). Significance Test Harm Progress in Forecasting. International Journal of Forecasting, vol 23, pp. 321-327. Borovkova, S.A. (2002). Generalized STAR model with experimental weights. In M. Stasionopoulos and G. Toulomi (Eds.). Proceedings of the 17th International Workshop on Statistical Modeling, Chania, pp. 139-147. Borovkova, S.A. (2008). Consistency and asymptotic normality of least square estimators in generalized STAR models. Journal compilation Statistica Neerlandica, Neerlandica, pp. 482-508. Box, G.E.P. (1994). Time Series Analysis: Forcasting and Control. 3rd edition, Englewood Cliffs: Prentice Hall. Kostenko, A.V. (2008). Forecasting without significance test?. RobJHynman.com/papers/sst2.pdf. Lutkepohl, H. (2005). New Introduction to Multiple Time Series Analysis, New York: Springger. Pfeifer, P.E. (1980a). A Three Stage Iterative Procedure for Space-Time Modeling. Technometrics, 22 (1), 35-47. Pfeifer, P.E. (1980b). Identification and Interpretation of First Orde Space-Time ARMA Models. Technometrics, 22 (1), 397-408. Ruchjana, B.N. (2002). Pemodelan Kurva Produksi Minyak Bumi Menggunakan Model Generalisasi S-TAR. Forum Statistika dan Komputasi, IPB, Bogor. Shofiyah, M.A. (2009). Peramalan Data PdoduksinGas di Joint Operating Body Pertamina-Petrochina East Java (JOB P-PEJ) dengan Model GSTAR dan ARIMA. Suhartono (2006). Pemilihan bobot lokasi yang optimal pada model GSTAR. Prosiding Konferensi Nasional Matematika XIII, (h. 571-580). Semarang, Indonesia: Universitas Negeri Semarang. Wei, W.W.S. (2006). Time Series Analysis Univariate and Multivariate Methods, second edition, Pearson Education, Inc.
10