2/6/2011
`
Data deret waktu
`
Metode : ARIMA
`
Tahapan : (1) identifikasi model, (2) estimasi model dan (3) validasi model.
Jimmy Ludin 1309201725 DOSEN PEMBIMBING : Prof. Dra. Susanti Linuwih, M.Stat., Ph.D Dr. Drs. Brodjol Sutijo Supri Ulama, M.Si
`
`
Identifikasi model merupakan tahap yang p gp g paling penting Salah satu metode untuk mengidentifikasi model ARIMA yaitu menggunakan plot partial autocorrelation function (PACF) dan autocorrelation function (ACF) atau disebut sebagai metode correlogram
`
`
Kelemahan correlogram : plot-nya kadang g gy g jjelas untuk lag yang tidak bisa menghasilkan diidentifikasi. Keputusan bersifat subjektif, yang akan membuat hasilnya tidak stabil (Chatfield, C, 2000) Harus mencoba beberapa model ARIMA untuk menghasilkan model terbaik. Cara ini sangat tidak efektif dan efisien
1
2/6/2011
` `
`
` `
`
`
Metode lain yaitu Algoritma Genetika. go t a Ge et a merupakan e upa a sa a satu Algoritma Genetika salah metode yang solusinya dapat mencapai global optimum, walaupun bisa saja menghasilkan solusi yang bersifat lokal optimum jika operator yang digunakan tidak sesuai
Beberapa kajian mengenai penggunaan p y dilakukan. telah banyak operator Goldberg (1989) mengenai ukuran populasi Goldberg dan Deb (1991) mengenai operator seleksi Siriwardene dan Perera (2006) mengenai operator crossover dan mutasi
`
`
`
`
`
Operator Algoritma Genetika diantaranya y p , tipe p seleksi,, crossover,, yaitu ukuran p populasi, mutasi, elitism dan jumlah iterasi. Operator-operator tersebut memegang peranan penting dalam mengontrol proses dari Algoritma Genetika karena menentukan tingkat efisiensi dari metode Algoritma Genetika untuk nt k mendapatkan sol si yang ang solusi optimal.
Penggunaan Metode Algoritma Genetika pemodelan ARIMA: untuk p Ong, Huang, dan Tzeng, (2005) menggunakan metode algoritma genetika untuk mengidentifikasi model ARIMA. Menggunakan operator standar dari metode algoritma genetika untuk mengidentifikasi d l ARIMA model ARIMA.
2
2/6/2011
`
`
`
`
Permasalahan metode Algoritma Genetika y j y g spesifik p yaitu tidak ada p petunjuk yang untuk memilih operator algoritma genetika (Siriwardene dan Perera, 2005) Pemilihan operator algoritma genetika sangat penting sebelum melakukan optimalisasi pada model terutama pada model yang memiliki parameter lebih ata atau sama dengan lima.
Jumlah penumpang angkutan udara yang g dari luar negeri g di bandara Soekarno datang Hatta Jakarta. Data dibagi menjadi dua bagian. Bagian pertama (Januari 1998 sampai Desember 2009) digunakan untuk mengidentifikasi model. Bagian kedua (Januari sampai Juli 2010) dig nakan untuk nt k melihat ak rasi digunakan akurasi peramalan.
`
`
`
`
`
`
Memperoleh model ARIMA dengan g g metode correlogram dan mengunakan algoritma genetika Mengetahui efektifitas dan efisiensi dari operator algoritma genetika yang digunakan untuk mengidentifikasi model ARIMA Mengetahui tingkat akurasi hasil identifikasi k k d metode d tersebut b untuk k menggunakan kedua peramalan.
Mengidentifikasi model ARIMA menggunakan g g dan metode algoritma metode correlogram genetika Melakukan peramalan menggunakan model ARIMA yang dihasilkan dari metode correlogram dan metode algoritma genetika Membandingkan nilai MSE, MAPE, MPE, dan MAD yang dih ilk d l dihasilkan darii peramalan
3
2/6/2011
1. 2. 3. 4.
Melihat stasioneritas data terhadap varians dan rata-rata. Jika tidak stasioner dalam varians, dilakukan transformasi Box-Cox. Jika tidak stasioner dalam mean, maka dilakukan differencing Identifikasi beberapa kemungkinan model yang bisa dibentuk dengan melihat plot ACF dan plot PACF.
5. 6. 7.
Mengestimasi Parameter menggunakan q metode Conditional Least Square Menguji signifikansi parameter dari masing-masing model Memeriksa asumsi dari error dengan uji white noise. Bila tidak memenuhi asumsi, maka model diidentifikasi dengan model ARIMA yang llain. i
Inisialisasi Parameter 1.
Menghitung Error Model
2.
Menghitung MSE
MSE Min? or Iter Max?
Ya
Belum
Menghitung Turunan Error Terhadap Parameter Menghitung Parameter
Selesai
3. 4. 5.
Representasi Kromosom e g s a sas a ju a kromosom o oso Menginisialisasikan jumlah dalam populasi, banyaknya generasi, dan rate mutasi. Menentukan dan Menghitung Fungsi Fitness Seleksi kromosom menggunakan metode roulette wheel dan Boltzmann selection Melakukan crossover terhadap kromosom hasil seleksi dengan metode crossover dua titik dan multi point crossover
4
2/6/2011
6. 7. 8. 9. 10.
`
Melakukan mutasi kromosom. ea u a e ts Melakukan elitism Menghentikan proses jika sudah mencapai jumlah generasi maksimum Menghitung waktu proses dari langkah (3) sampai langkah (8). Menentukan model terbaik berdasarkan nilai fitness yang paling besar
Fungsi fitness yang digunakan pada p penelitian ini adalah :
f ( x) =
1 MSE
MSE =
`
Dalam satu kromosom terdapat beberap gen. Kumpulan kromosom yang dibentuk merupakan k populasi l i atau disebut di b sebagai b i generasi
Populasi
`
`
`
Kromosom 1 Kromosom 2 Kromosom 3 Kromosom 4
1 1 1 0
0 1 1 0
0 1 1 1
1 0 1 1
1 0 0 0
0 1 0 0
0 1 0 1
1 0 1 1
(
1 n ∑ Zt − Zˆt n t =1
)
2
0 1 0 1
1 0 1 1
0 1 0 0
0 1 0 1
0 0 1 0
Mi Misalnya, l k kromosom yang dih dihasilkan ilk adalah d l h (10011; 00100; 10; 00), maka modelnya adalah ARMA (p,q)(P,Q)s yaitu ARMA ([1,4,5], [3])(1,0)s
Proses seleksi yang akan digunakan pada p penelitian ini y yaitu seleksi roulette wheel dan seleksi Boltzmann f ( xi ) Seleksi roulette wheel p( x ) = i
`
0 1 0 0
Seleksi Boltzmann
N
∑ f (x ) i =1
i
p ( xi ) = exp[−( f max − f ( xi )) / T ]
5
2/6/2011
`
`
Crossover mengkombinasikan dua induk hasil
p keturunan seleksi untuk mendapatkan Contoh multi point crossover :
`
`
Induk A Induk B
0 1 1 1 0 1
Keturunan A Keturunan B
0 0 1 1 1 1
0 0
0 1 1 0 0 0
Mutasi adalah proses menukar gen untuk g p p y y populasi baru. Banyaknya menghasilkan tergantung rate mutasi (Pm) Contoh : Populasi
Kromosom 1 Kromosom 2 Kromosom 3 Kromosom 4
Populasi
Kromosom 1 Kromosom 2 Kromosom 3 Kromosom 4
0 1 1 1 1 1 0 0 0 0 1 0 1 0 0 1 0 0 1 1
(with 5%significance limits for the partial autocorrelations) 1.0
0.8
08 0.8
0.6
0.6
Partial Autocorrelation
Autocorrelation
1.0
0.4 0.2 0.0 -0.2 -0.4 -0.6
ARIMA(2,1,0)(1,0,2)
0.4 0.2
-0.4 -0.6 -0.8
-0.8
-1.0
-1.0 1
5
10
15
20 Lag
25
30
35
Nama 12
phi phi PHI TETA TETA
ARIMA(2,1,0)(1,0,3)12 phi
0.0 -0.2
1
5
10
15
20 Lag
25
30
35
0 1 1 0
0 1 1 1
1 0 1 1
Dilakukan mutasi 1 1 0 1 1 1 1 1 1 1 1 1 0 0 0 1
Model
Partial AutocorrelationFunctionfor diff c7
Autocorrelation Function for diff c7 (with 5%significance limits for the autocorrelations)
1 1 1 0
phi PHI TETA TETA TETA 12 ARIMA(2,1,0)(1,0,0)12 phi
phi PHI
ARIMA(2,1,0)(2,0,0)12 phi phi PHI PHI
1 0 0 0
0 1 0 0
0 1 0 1
1 0 1 1
menjadi 1 0 0 0 1 1 0 0 1 0 0 1
Parameter Koef
1 0 1 0
0 0 1 1
pvalue
1 0 1 0
0 0 1 0
0 0 1 0
MSE
White Noise Lag pvalue
1 2 12 12 24
‐0.5678 ‐0.354 0.354 0.7614 0.3138 ‐0.1236
0.000 0.000 0.000 0.028 0.261
0.01685
12 24 4 36 48
0.128 0.03 0.031 0.025 0.017
1 2 12 12 24 36
‐0.5033 ‐0.3483 ‐0.9228 ‐1.3562 ‐0.8253 ‐0.3592
0.000 0.000 0.000 0.000 0.000 0.000
0.01679
12 24 36 48
0.132 0.013 0.009 0.001
1 2 12
‐0.5287 ‐0.3577 0.5734
0.000 0.000 0.000
0.01763
12 24 36 48
0.114 0.008 0.023 0.008
1 2 12 24
‐0.572 ‐0.3636 0.412 0.276
0.000 0.000 0.000 0.002
0.01661
12 24 36 48
0.193 0.042 0.036 0.021
6
2/6/2011
Nama
ARIMA(2,1,0)(0,0,2)12 phi
ARIMA(2,1,0)(2,0,1)
12
Parameter Koef pvalue 1 2 12 24
‐0.5071 ‐0.3736 ‐0.4609 ‐0.4348
0.000 0.000 0.000 0.000
0.01706
phi TETA TETA phi phi PHI PHI TETA
1 2 12 24 12
‐0.5474 ‐0.371 ‐0.0768 0.5836 ‐0.5483 0 5483
0.000 0.000 0.649 0.000 0 005 0.005
0.01631
1 2 12 12
‐0.5553 ‐0.3581 0.7862 0.2684
0.000 0.000 0.000 0.056
0.01701
ARIMA(2,1,0)(1,0,1)12 phi phi PHI TETA
450000
White Noise Lag pvalue
MSE
12 24 36 48
0.304 0.066 0.050 0.012
12 24 36 48
0.119 0.009 0.018 0.007
12 24 36 48
0.120 0.024 0.026 0.017
400000
Ju umlah Penumpang
Model
350000 300000 250000 200000 150000 100000 Jan
Jan
Jan
Jan
Jan
Jan
Jan
Jan
Jan
Jan
Jan
Jan
A k tual Estimasi
Bulan (Tahun 1998-2010)
450000
Model 12
ARIMA([1,3,4],1,[1,2,3,5])(0,0,2)
MSE
phi phi phi teta teta
1 ‐1.4394 3 1.2869 4 0.8016 1 ‐0.9336 2 1.0666
0.024 0.01652 0.000 0.000 0.024 0.000
teta teta TETA TETA
3 1.5697 5 ‐0.6442 1 ‐0.4326 2 ‐0.2932
0.000 0.024 0.024 0.024
White Noise Lag pvalue 12 24 36 48
0.95297 0.60162 0.45416 0.27688
400000
Jumlah Penumpang J
Parameter Nama Koef pvalue
350000 300000 250000 200000 150000 100000 Jan
Jan
Jan
Jan
Jan
Jan
Jan
Jan
Bulan (Tahun 1998-2010)
Jan
Jan
Jan
Jan
A k tual Estimasi
7
2/6/2011
Ukuran Populasi Kriteria MSE Konvergen
Ukuran Populasi 25 50 25 50
Mean 0.017021 0.016985 39.38 34.46
StDev 0.000271 0.00028 29.03 23.88
Min 0.0165 0.0167 3 3
Max 0.0177 0.0176 98 93
Seleksi 1 2 1 2
Mean StDev 0.016915 0.000202 0.017092 0.000309 45.52 26.63 28.31 23 77 23.77
Min 0.0167 0.0165 6 3
Max 0.0175 0.0177 98 94
Crossover 1 2 1 2
Mean StDev 0.016985 0.000281 0.017021 0.00027 37.65 26.74 36.19 26.63
Min 0.0165 0.0167 3 3
Max 0.0177 0.0176 97 98
Mutasi Kriteria MSE
Seleksi Kriteria MSE Konvergen
Konvergen
Kriteria
ARIMA(2,1,0)(2,0,0)12
MSE MAPE MPE MAD
0.0075 0.5077 0.4219 0.0659
Elitism 1 2 1 2
Mean StDev 0.017021 0.00029 0.016985 0.000259 39.46 28.08 34.38 24.97
Min 0.0165 0.0167 6 3
Max 0.0175 0.0177 98 97
Min 0.0165 0.0167 3 3
Max 0.0177 0.0175 98 97
500000
500000
450000
450000
Alg Genetika 12
ARIMA([1,3,4],1,[1,2,3,5])(0,0,2) 0.0041 0.3344 0.1972 0.0430
Jumlah Penumpang
Correlgram
Konvergen
Jumlah Penumpang
Konvergen
Mean StDev 0.016996 0.000258 0.01701 0.000293 39.79 27.14 34.04 25.91
Elitism Kriteria MSE
Crossover Kriteria MSE
Mutasi 0.1 0.25 0.1 0.25
400000
350000
400000
350000
300000
300000 Jan
Feb
Mar
Apr Mei Bulan(Tahun2010)
Jun Aktual Forecast
Jul
Jan
Feb
Mar
Apr
Bulan(Tahun2010)
Mei
Jun
Jul
Aktual Forecast
8
2/6/2011
`
`
Metode Algoritma Genetika dapat menghasilkan tingkat akurasi yang lebih tinggi metode i i dibandingkan dib di k dengan d d Correlogram Efisiensi dari penggunaan operator Algoritma Genetika dalam pemodelan ARIMA dipengaruhi oleh besarnya ukuran populasi, penggunaan tipe seleksi, besarnya rate i d i li i mutasi, dan penggunaan tipe elitism. Sedangkan penggunaan tipe crossover tidak terlalu mempengaruhi tingkat efisiensi.
9