KEMENTERIAN PEKERJAAN UMUM BADAN PENELITIAN DAN PENGEMBANGAN PUSAT PENELITIAN DAN PENGEMBANGAN SUMBER DAYA AIR
PENDUGAAN DATA RUNTUT WAKTU MENGGUNAKAN METODE ARIMA
PENDAHULUAN
Prediksi data runtut waktu.
Pelaksanaan dan evaluasi menjadi terarah sesuai dengan kebutuhan sehingga prioritas dan pemilihan alternatif solusi sesuai dengan sumber daya yang tersedia.
Salah satu cara untuk menduga data runtut waktu dapat digunakan metode stokastik yang dinamakan ARIMA (Autoregressive Integrated Moving Average).
ACF dan PACF Autocorrelation Function (ACF) •
Koefisien ini menunjukkan keeratan hubungan antara nilai variabel yang sama tetapi pada waktu yang berbeda
•
Koefisien autokorelasi mengukur tingkat keeratan hubungan antara Xt dengan Xt-1. Sedangkan pengaruh dari timelag 1, 2, 3. . . . dan seterusnya sampai k-1 dianggap konstan
Partial Autocorrelation Function (PACF) •
Koefisien autokorelasi parsial mengukur derajat hubungan antara nilai-nilai sekarang dengan nilai-nilai sebelumnya (untuk time lag tertentu), sedangkan pengaruh nilai variabel time lag yang lain dianggap konstan
•
Koefisien autokorelasi parsial mengukur tingkat keeratan hubungan antara Xt dan Xt-k sedangkan pengaruh dari time lab 1,2,3,…,k-1 dianggap konstan.
MODEL AR dan MA Fungsi Model Autoregresif (AR) •
Fungsi linear dari observasi deret stasioner sebelumnya (meregresikan terhadap dirinya sendiri pada periode yang berbeda) dengan kata lain model ini mengasumsikan bahwa data periode sekarang dipengaruhi oleh data pada periode sebelumnya.
•
Model ini dapat dipilih apabila ACF menunjukkan pola dying down dan PACF menunjukkan pola yang cut off.
Fungsi Moving Average (MA) •
Proses yang menyatakan hubungan ketergantungan antara nilai pengamatan Yt dengan nilai-nilai kesalahan yang berurutan dari periode t sampai t-q.
•
Model ini dapat dipilih apabila ACF menunjukkan pola yang cutoff dan PACF menunjukkan pola dying down
•
Autoregressive (AR) Menunjukkan korelasi antara data Yt dengan lag sebelumnya Yt-1,Yt-2, .., Yt-k.
p
yt a0 i yt 1 t i 1
•
Biasanya dinotasikan dengan AR(p). P merupakan order dari lag model AR
•
Identifikasi Cek correlogram residual : PACF (AR)
•
Moving Average (MA) Menunjukkan adanya hubungan error term pada periode t (t) dengan error term periode sebelumnya (t-i)
yt a0
q
i
t i
0
•
Biasanya dinotasikan dengan MA(q). (q) adalah order dari lag model MA
•
Identifikasi Cek correlogram residual : ACF (MA)
CUT OFF Cut off adalah lag yang tidak signifikan terhadap garis batas signifikansi
Autocorrelation Function for Pembedaan musiman dan reguler (with 5% significance limits for the autocorrelations)
1.0 0.8
Autocorrelation
0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1
5
10
15
20
25
30 35 Lag
40
45
50
55
60
DYING DOWN Dying down adalah lag yang bergerak turun dengan bertambahnya lag (sinusoidal) Partial Autocorrelation Function for Pembedaan musiman dan reguler (with 5% significance limits for the partial autocorrelations)
1.0
Partial Autocorrelation
0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1
5
10
15
20
25
30 35 Lag
40
45
50
55
60
Model ARIMA Musiman (1)
Data runtut waktu yang diperoleh akan digunakan untuk menganalisis runtun waktunya sehingga pola dari data tersebut akan diperlukan dalam peramalan di masa mendatang
Model ARIMA (Autoregressive Integrated Moving Average) yang merupakan model gabungan dari model autoregresif dan moving average yang telah melalui proses differencing sebanyak d kali agar menjadi stasioner.
Model ARIMA Musiman (2) ARIMA Multiplikative (Musiman) = (p,d,q)(P,D,Q)s: Keterangan: p, d, q : Orde AR, Difference, MA non musiman P, D, Q : Orde AR, Difference, MA musiman Difference adalah teknik pengurangan (selisih) untuk menghilangkan nonstationer data dalam mean atau variance. s
: Periode musiman
s=3 s=4 s=6 s = 12 dst
Macam-macam model ARIMA Multiplikative: 1. SAR (0 0 0)(1 0 0) 2. SMA (0 0 0)(0 0 1) 3. ARSMA (1 0 0)(0 0 1) 4. dll
=> Triwulan => Kwartalan => Semesteran => Tahunan
CONTOH ESTIMASI MODEL Estimasi Model dengan melihat perilaku grafik ACF dan PACF. Misalkan model SAR (0 0 0)(1 0 0), -
Model tersebut menunjukkan nilai d & D adalah nol, yang berarti data asli telah stasioner sehingga tidak diperlukan Difference baik terhadap data non musiman dan musimannya.
-
Nilai p nol dan P bernilai 1, yang berarti perilaku PACF menunjukkan tidak ada yang signifikan untuk data musiman, sedangkan pada data musimannya ada yang signifikan.
-
Nilai q & Q adalah 0, yang berarti perilaku ACF menunjukkan tidak ada yang signifikan untuk data musiman dan non musiman.
Model ARIMA Musiman (3) Langkah-langkah metode ARIMA :
1. Tahap Identifikasi Tahap identifikasi dilakukan tiga hal yaitu identifikasi terhadap pola data, kestasioneran data dan perilaku ACF dan PACF. 2. Estimasi Model. Pada tahap estimasi, penentuan nilai estimasi awal untuk parameter-parameter dari model tentatif berdasarkan pola ACF dan PACF. 3. Evaluasi Model. Melakukan uji diagnostik untuk menguji kedekatan model dengan data. Uji ini dilakukan dengan menguji nilai residual dan signifikansi. 4. Peramalan. Peramalan dilakukan menggunakan perangkat lunak MINITAB 14. Nilai hasil peramalan disediakan dari perangkat tersebut.
Diagram Alir ARIMA
Data Inflow
Membuat plot runtut waktu Membuat plot ACF
Data sudah Stasioner? Varians: Transformasi Mean: Differencing
Melihat Plot ACF dan PACF data yang sudah stasioner dalam mean dan varians
Tidak
Pendugaan Model & Pengujian Parameter dari Plot ACF dan PACF
Check model dengan white noice
Model yang sesuai lebih dari 1 Ya
Pemilihat model terbaik. Terlihat dari P value dan SS serta MS Perolehan model ARIMA terbaik Peramalan dengan model yang dibentuk
Tidak
IDENTIFIKASI MODEL (1) Identifikasi model dilakukan untuk mengetahui kestasioneran data aktual. Suatu data harus stasioner terhadap varian dan rataan agar dapat diolah dan menghasilkan prediksi yang baik menggunakan metode ARIMA. Berikut adalah ciri-ciri data yang tidak stasioner berserta contohnya:
Gambar 1 Tidak stasioner dalam mean
Gambar 2 Nilai ACF dari Gambar 1
Gambar 3 Nilai PACF dari Gambar 1
Gambar 4 Tidak stasioner dalam varians
Gambar 5 Nilai ACF dari Gambar 4
Gambar 6 Nilai PACF dari Gambar 4
Gambar 7 Tidak stasioner dalam varians dan mean
Gambar 8 Nilai ACF dari Gambar 7
Gambar 9 Nilai PACF dari Gambar 7
Autocorrelation Function for Pembedaan musiman dan reguler
Trend Analysis Plot for Pembedaan musiman dan reguler
(with 5% significance limits for the autocorrelations)
Linear Trend Model Yt = -0.000490105 + 8.224064E-06*t
1.0 Variable A ctual Fits
1.0
0.8 0.6
0.5
Autocorrelation
A ccuracy Measures MA PE 100.148 MA D 0.242 MSD 0.095
0.0
0.4 0.2 0.0 -0.2 -0.4 -0.6
-0.5
-0.8 -1.0
-1.0 1
32
64
96
128
160 192 Index
224
256
288
1
320
Gambar 10 Stasioner dalam varians dan mean
5
10
15
(with 5% significance limits for the partial autocorrelations)
1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1
5
10
20
25
30 35 Lag
40
45
50
Gambar 11 Nilai ACF dari Gambar 10
Partial Autocorrelation Function for Pembedaan musiman dan reguler
Partial Autocorrelation
Pembedaan musiman dan reguler
1.5
15
20
25
30 35 Lag
40
45
50
55
Gambar 12 Nilai PACF dari Gambar 10
60
55
60
IDENTIFIKASI MODEL (2)
Apabila data yang digunakan belum stasioner maka jangan melanjutkan tahap estimasi, dikarenakan asumsi untuk mengerjakan model ARIMA adalah menggunakan data yang telah stasioner terhadap mean dan varian.
IDENTIFIKASI MODEL (3) Cara untuk menstasionerkan data aktual 1. Cara untuk menstasionerkan data secara mean dengan cara melakukan difference. 2. Sedangkan untuk menstasionerkan data secara varian dengan melakukan Transformasi. Syarat untuk dilakukan Transformasi adalah data tidak bernilai 0, sehingga data yang digunakan adalah data bulanan. Macam-macam transformasi yang dapat dilakukan adalah a. Transformasi Log b. Transformasi Square Root c. Transformasi Square d. Transformasi Arcsin e. Transformasi Cubic
ESTIMASI MODEL ACF Cut off setelah lag 1 atau 2, koefisien korelasi tidak signifikan pada lag-lag musiman Cut off setelah lag musiman L, koefisien korelasi tidak signifikan pada lag-lag non musiman Cut off setelah lag musiman L, terdapat koefisien korelasi yang signifikan pada lag non musiman ke1 atau 2 Dying down
Dying down
Dying down Dying down Sumber: Gaynor and Kirpartik (1994)
PACF
Model
Dying down
Non Seasonal – Moving Average (q=1 atau 2)
Dying down
Seasonal (Q=1)
Dying down
Non Seasonal – Seasonal Moving Average (q=1 atau 2, Q=1)
Cut off setelah lag 1 atau 2, koefisien korelasi tidak signifikan pada lag-lag musiman Cut off setelah lag musiman L, koefisien korelasi tidak signifikan pada lag-lag non musiman Cut off setelah lag musiman L, terdapat koefisien korelasi signifikan pada lag-lag non musiman ke-1 atau 2 Dying down
–
Moving
Average
Non Seasonal – Autoregressive (p=1 atau 2) Seasonal – Autoregressive (P=1)
Non Seasonal – Seasonal Autoregressive (p=1 atau 2, P=1) Mixed (Autoregressive – Moving Average)
EVALUASI MODEL 1. Residual peramalan bersifat acak. Untuk memastikan apakah model sudah memenuhi syarat ini, dapat digunakan indikator Box- Ljung Statistic. Dari session diketahui bahwa nilai P-value untuk uji statistik ini lebih besar dari 0,05 yang menunjukkan bahwa residual sudah acak. 2. Model parsimonious (model relatif sudah dalam bentuk yang paling sederhana). 3. Parameter yang diestimasi berbeda nyata dengan nol. Ini dapat dilihat dari nilai P-value koefisien yang kurang dari 0,05. 4. Kondisi invertibilitas ataupun stasioneritas harus terpenuhi. Hal ini ditunjukkan oleh jumlah koefisien MA atau AR dimana masing-masingnya harus kurang dari satu. 5. Model harus memiliki MS & SS yang kecil.
6. Selain itu grafik ACF dan PACF dari residual menunjukkan pola cut off, yang berarti bahwa residual memang sudah acak.
Contoh output MINITAB