MAKALAH TUGAS AKHIR PENAKSIRAN PARAMETER MODEL ARIMA DENGAN MENGGUNAKAN ALGORITMA GENETIKA Wiwin Yuliani1, Irhamah2, dan Dedy Dwi Prastyo3 1 Mahasiswa Jurusan Statistika FMIPA-ITS (
[email protected]) 2 Dosen Jurusan Statistika FMIPA-ITS (
[email protected]) 3 Dosen Jurusan Statistika FMIPA-ITS (
[email protected]) ABSTRAK Penaksiran parameter dilakukan dengan tujuan untuk menentukan parameter yang sesuai untuk model ARIMA. Dalam praktik, proses menemukan nilai penaksiran parameter memerlukan waktu yang lama dan sangat rumit. Supaya lebih praktis dalam menemukan nilai-nilai yang mendekati nilai optimal maka perlu digunakan metode optimasi. Salah satu metode yang dapat digunakan untuk menyelesaikan permasalahan tersebut yaitu dengan menggunakan pendekatan Algoritma Genetika. Dalam tugas akhir ini, hasil dari penaksiran parameter model ARIMA berdasarkan Algoritma Genetika akan dibandingkan dengan hasil metode penaksiran parameter lain seperti metode Conditional Least Square pada data dua mingguan dari permintaan Arc Tube daya listrik rendah.dari hasil kedua metode penaksiran parameter model ARIMA dihasilkan nilai MSE dan SSE yang besarnya sama. Nilai taksiran parameter dengan metode Conditional Least Square sebesar -0.5505 dan nilai taksiran parameter dengan Algoritma Genetika sebesar -0.55688. Kata Kunci : Conditional Least Square, Algoritma Genetika, MSE. 1. Pendahuluan Model ARIMA adalah model yang dapat digunakan untuk analisis data time series dan peramalan data. Model ARIMA terdiri dari tiga langkah dasar, yaitu tahap identifikasi, tahap penaksiran dan pengujian, dan tahap penerapan (Makridakis, Wheelwright, dan McGee, 1999). Penaksiran parameter dilakukan dengan tujuan untuk menentukan parameter yang sesuai untuk model ARIMA. Dalam praktik, menemukan nilai penaksiran parameter memerlukan waktu yang lama dan sangat rumit. Supaya lebih praktis dalam menemukan nilai-nilai yang mendekati nilai optimal maka perlu digunakan metode optimasi. Salah satu metode yang dapat digunakan untuk menyelesaikan permasalahan tersebut yaitu dengan menggunakan pendekatan Algoritma Genetika. Algoritma Genetika memiliki keunggulan-keunggulan dibandingkan dengan metode-metode yang lain, antara lain sangat cocok digunakan untuk memecahkan masalah global optimum, mudah diubah atau fleksibel untuk diimplementasikan pada berbagai masalah, dan ruang solusi lebih luas (Sivanandam dan Deepa, 2008). Namun, Algoritma Genetika juga memiliki kekurangan antara lain secara pokok disebabkan oleh kurangnya keragaman, karena semua operator genetis, antara lain seleksi, persilangan, dan mutasi dikenakan pada semua populasi, sebagian besar individu akan cenderung menjadi sama (Budiman, 2003). Penelitian terdahulu yang berkaitan dengan Algoritma Genetika antara lain Fariza (2003) melakukan penelitian tentang Hybrid Algoritma Genetika untuk peramalan data time series dan hasil yang didapatkan yaitu peramalan hybrid GA-SA lebih mendekati nilai aktual dan menghasilkan kinerja yang lebih baik dibandingkan dengan ARIMA untuk data time series stasioner, non stasioner dan musiman. Rohman (2009) meneliti tentang identifikasi model ARIMA dengan menggunakan Algoritma Genetika Dalam Tugas Akhir ini, akan didapatkan taksiran parameter model ARIMA yang sesuai pada dua mingguan dari permintaan Arc Tube daya listrik rendah. Diharapkan penggunaan Algoritma Genetika dapat mengatasi kelemahan metode penaksiran perameter lain dalam usaha pencarian solusi yang global optimum. 2. Model Time Series dan Pembentukan Model Time Series Pada bagian ini akan dijelaskan tentang model ARMA, ARIMA, penaksiran parameter model ARIMA dengan Conditional Least Square dan Algoritma Genetika. Masing masing teori tersebut akan dijelaskan sebagai berikut
1
2.1 Model ARMA dan model ARIMA Suatu perluasan yang dapat diperoleh dari model AR dan MA adalah model campuran yang berbentuk (2.1) Zt at 1Z t 1 pZt p 1at 1 q at q yang dinamakan model ARMA(p,q). Model ini biasanya ditulis dengan 1
1
2
B
2
B ...
p
B
p
Zt
1
1
2
B
2
B ...
q
B
q
(2.2)
at
Model ini merupakan penggabungan antara model AR(p) dan MA(q) serta proses differencing orde d pada data time series. Secara umum bentuk model ARIMA(p,d,q) adalah : B 1
p
B
d
Z t
δ0
θ q B at
(2.3)
2.2 Penaksiran parameter model ARIMA dengan Conditional Least Square Dimisalkan model ARMA(p,q) dengan Z t = Z t μ . Bentuk umum dari model ARMA (p,q) adalah Z t
1
Diasumsikan bahwa a t ~ N(0,
Z t
1
2
2
Z t
..
2
p
Z t
θ1 at
at
p
2
.. θ q a t
q
) saling independen. Maka n
f (a |
θ2 at
1
2
, , ,
)
2 a
(2
~
~
)
2
n
1
exp[ 2
(2.4)
2
2 a
at ] t 1
Persamaan log likehood sebagai berikut 2 a
log L ( , , , ~
~
n
)
log( 2
2
2 a
)
S( , , )/2 ~
~
2 a
(2.5)
S ( , , ) merupakan estimasi Conditional Least Square ~
~ n
S( , , ) ~
~
2
t 1
a t ( , , , Z init , a init , Z ) ~
ˆ a2
~
~
~
(2.6)
~
S ( , , ) / db
(2.7)
dengan Z init , a init merupakan nilai inisialisasi awal dan db= (n-p)-(p+q+1) = n-(2p+q+1). S ( , , ) ~
~
~
~
merupakan suatu fungsi nonlinear dengan parameter yang tidak diketahui sehingga diperlukan suatu iterasi nonlinear untuk mendapatkan parameternya. Digunakan iterasi Levenberg-Marquardt
untuk meminimumkan nilai
S(
,
, ~
)
sehingga diperoleh nilai estimasi parameter.
~
2.3 Algoritma Genetika Sejak Algortima Genetika pertama kali dirintis oleh John Holland dari Universitas Michigan pada tahun 1960-an, Algortima Genetika telah diaplikasikan secara luas pada berbagai bidang. Algortima Genetika banyak digunakan untuk memecahkan masalah optimasi, walaupun pada kenyataannya juga memiliki kemampuan yang baik untuk masalah-masalah selain optimasi. John Holland menyatakan bahwa setiap masalah yang berbentuk adaptasi (alami maupun buatan) dapat diformulasikan dalam terminologi genetika. Algoritma Genetika adalah simulasi dari proses evolusi Darwin dan operasi genetika atas kromosom (Sanjoyo, 2006). Pengkodean adalah suatu teknik untuk menyatakan populasi awal sebagai kandidat solusi suatu masalah ke dalam suatu kromosom. Gen dan Cheng (2000) juga menjelaskan bahwa pengkodean merupakan kunci pokok persoalan, dalam melakukan pengkodean harus diperhatikan apakah dapat membangun pencarian genetik yang efektif menggunakan pengkodean. Fitness individu dalam algoritma genetika adalah nilai fungsi objektif untuk fenotipe. Untuk menghitung fitness, kromosom harus terlebih dahulu didekode dan fungsi tujuan harus dievaluasi. Fitness tidak hanya menunjukkan bagaimana solusin yang baik, tetapi juga berhubungan dengan seberapa dekat kromosom pada solusi optimum (Sivanandam dan Deepa, 2008).
2
Menurut Gen dan Cheng (2000), metode seleksi yang paling dikenal adalah seleksi Roulette Wheel. Ide dasar seleksi adalah untuk menentukan probabilitas seleksi atau probabilitas kelangsungan hidup pada setiap kromosom proporsional dengan nilai fitnessnya. Anggota populasi yang memiliki fitness tinggi akan bertahan hidup dan dapat bereproduksi, anggota populasi yang memiliki fitness rendah akan mati. Setelah dilakukan seleksi maka yang dilakukan selanjutnya yaitu mengoperasikan kromosom dengan Crossover dan mutasi. Crossover adalah operator Algoritma Genetika yang utama karena beroperasi pada dua kromosom pada suatu waktu dan membentuk offspring dengan mengkombinasikan dua bentuk kromosom. Cara sederhana untuk memperoleh crossover adalah dengan memilih suatu titik yang dipisahkan secara random dan kemudian membentuk offspring dengan cara mengkombinasikan segmen dari satu induk ke sebelah kiri dari titik yang dipisahkan dengan segmen dari induk yang lain ke sebelah kanan dari titik yang dipisahkan. Keanekaragaman individu dalam populasi telah dihasilkan dengan menggunakan proses seleksi dan pindah silang. Dengan kedua operator genetik tersebut dapat terjadi hilangnya struktur gen tertentu sehingga tidak bisa diperoleh kembali informasi yang terkandung didalamnya. Operator mutasi diperkenalkan sebagai cara untuk mengembalikan informasi yang hilang tersebut. Melalui mutasi, individu baru dapat diciptakan dengan melakukan pengubahan terhadap satu atau lebih nilai gen pada individu yang sama. Pembentukan populasi baru dengan crossover dan mutasi ada kemungkinan kromosom yang paling baik hilang. Oleh karena itu, untuk menjaga agar individu bernilai fitness tertinggi tersebut tidak hilang selama evolusi, maka perlu dibuat satu atau beberapa kopinya(elitism) 3. Metodologi Data yang dipakai dalam penelitian ini adalah data simulasi dan data dua mingguan dari permintaan Arc Tube daya listrik rendah. Data dua mingguan dari permintaan Arc Tube daya listrik rendah dianalisis untuk memperoleh penaksiran parameter dengan metode Conditional least square dan penaksiran parameter mengunakan Algoritma Genetika. Data mulai dari Januari 2000 sampai Desember 2005 dengan jumlah 141. Langkah langkah analisis penelitian adalah sebagai berikut : 1. Mengidentifikasi model ARIMA 2. Menaksir parameter dengan metode Conditional Least Square dan Algoritma Genetika 3. Membandingkan hasil penaksiran parameter 4. Hasil dan Pembahasan Pada bab ini dilakukan analisis metode Conditinal Least Square, dan Algoritma Genetika untuk menaksir parameter model ARIMA dari data dua mingguan dari permintaan Arc Tube daya listrik rendah. Pada metode Algoritma Genetika dilakukan dengan data simulasi terlebih dahulu untuk mengetahui ketepatan iterasi parameter model ARIMA. 4.1 Identifikasi model ARIMA dengan Correlogram Langkah pertama yaitu membuat plot time series data dua mingguan dari permintaan Arc Tube daya listrik rendah. Plot time series dapat dilihat pada Gambar 1 berikut T ime S e r ie s P lot o f da ta
A uto c o r r e la tio n F unc tio n fo r da ta (w ith 5% s ignifica nce lim its fo r the a uto co r r e la tio ns ) 1.0
20 00 00
0.8 0.6
A ut o c o r r e la t io n
da ta
15 00 00
10 00 00
5 00 00
0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0
0 1
14
28
42
56
70
84
98
112
1 26
1
14 0
10
20
30
40
50
60
70
80
90
La g
Ind e x
Gambar 1 Plot time series data asli
Gambar 2 Plot ACF data data asli
3
1 00
1 10
1 20
130
14 0
Gambar 1 menunjukkan bahwa data cenderung tidak stasioner terhadap mean dan varians. Untuk mengetahui kestasioneran data lebih teliti dapat dilihat dari plot ACF dan transformasi Box-Cox. Sedangkan Gambar 2 menunjukkan pola turun lambat sehingga data tidak stasioner terhadap mean. Untuk mengetahui apakah data telah stasioner terhadap varians dapat dilihat dari nilai lamda dari boxcox. T ime S e r ie s P lo t o f diff
B o x -C o x P lot o f da ta L o w er C L
U p p er C L L am b d a
16 00 00 14 00 00 12 00 00
E stim ate
0.80
L o w er C L
0.57
U p p er C L
1.06
Ro u n d ed V alu e
1.00
5 00 00
10 00 00
0
d iff
S t De v
10 00 00
(u sin g 95.0% c o n fid en c e)
8 00 00
-5 00 00
6 00 00
-10 00 00 4 00 00 Lim it
2 00 00 -2
-1
0
1
2
3
4
-15 00 00
5
1
La mb d a
14
28
42
56
70
84
98
112
12 6
14 0
Ind e x
Gambar 3 Box-Cox plot data asli
Gambar 4 Plot time series data yang sudah stasioner
Dari Gambar 3 di atas nilai lamdanya adalah 1 sehingga dapat disimpulkan bahwa data sudah stasioner terhadap varians sehingga data tidak perlu ditransformasi. Karena data tidak stasioner terhadap mean, maka perlu dilakukan differencing agar data stasioner terhadap mean. Gambar 4 menunjukkan bahwa data sudah stasioner dalam varians dan mean. Langkah selanjutnya adalah membuat plot ACF dan PACF yang digunakan untuk menentukan dugaan model sementara. A uto c or r e la tio n F unc tio n fo r diff
P a r tia l A uto c o r r e la tio n F unc tio n fo r diff (w ith 5 % s ignifica nce lim its fo r the pa r tia l a uto co r r e la tio ns )
1.0
1.0
0.8
0.8
0.6
0.6
Pa r t ia l A ut o c o r r e la t io n
A ut o c o r r e la t io n
(w ith 5% s ignifica nce lim its fo r the a uto co r r e la tio ns )
0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8
0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8
-1.0
-1.0
1
5
10
15
20
25
30
35
La g
1
5
10
15
20
25
30
35
La g
Gambar 5 Plot ACF data yang sudah stasioner
Gambar 6 Plot PACF data yang sudah stasioner
Berdasarkan Gambar 5 dapat ditunjukkan bahwa plot ACF cut off setelah lag pertama dan keluar pada lag kedua sedangkan gambar 6 plot PACF cut off setelah lag pertama sehingga dugaan model sementara adalah ARIMA (1,1,0), ARIMA (0,1,1), ARIMA (1,1,1), ARIMA (2,1,0), ARIMA (0,1,2) dan ARIMA (2,1,2). 4.2 Identifikasi model ARIMA dengan MINIC Identifikasi data dua mingguan dari permintaan Arc Tube daya listrik rendah mengunakan metode pattern identification, dalam hal ini digunakan MINIC (Minimum Information Criteria). Didapatkan hasil sebagai berikut: Lags AR 0 AR 1 AR 2 AR 3 AR 4 AR 5
Tabel 1 Identifikasi Model ARIMA mengunakan MINIC MA 0 MA 1 MA 2 MA 3 MA 4 MA 5 21.17851 20.92304 20.92788 20.93609 20.95433 20.95797 20.84401 20.86949 20.8739 20.90799 20.94256 20.97193 20.87204 20.90327 20.90879 20.94225 20.97707 21.0019 20.87518 20.90972 20.94258 20.97724 21.00704 21.03705 20.90894 20.94382 20.96678 21.00049 21.03532 21.05248 20.94095 20.97366 20.99648 21.02786 21.05646 21.082
4
Berdasarkan Tabel 1 diatas diperoleh nilai BIC terkecil pada ARMA(1,0) sehingga dugaan model sementara yang terbaik berdasarkan MINIC adalah ARIMA(1,1,0). Model ARIMA(1,1,0) juga merupakan salah satu dugaan model sementara hasil identifikasi dengan Correlogram. 4.3 Simulasi model AR(1), MA(1), ARMA(1,1) Simulasi dilakukan dengan membangkitkan sebanyak 100, 200 dan 400 data menggunakan macro minitab. Untuk setiap sampel, data dibangkitkan sebanyak 5 kali. Penaksiran parameter data simulasi dilakukan dengan program fitarima.m kemudian dibandingkan dengan program minitab. Hasil penaksiran parameter data simulasi sebagai berikut
sampel 100 100
100
200 200
parameter AR(1) MSE MA(1) MSE phi theta MSE AR(1) MSE MA(1) MSE
Tabel 2 Hasil penaksiran parameter data simulasi rata rata rata rata simulasi sampel parameter simulasi fitarima.m minitab fitarima.m minitab 0.7895 0.8 0.7715 ARMA (1,1) 1 1.1076 1.0699 phi 0.7 0.6832 0.7254 200 0.6 0.5927 0.5728 theta 0.4 0.3741 0.4101 1 1.0673 1.0745 MSE 1 1.0353 1.0456 ARMA (1,1) AR(1) 0.8 0.8058 0.8082 400 0.7 0.7362 0.7941 MSE 1 1.02608 1.0244 0.4 0.4136 0.4746 MA(1) 0.6 0.5929 0.5901 400 1 0.9113 0.9192 MSE 1 1.03874 1.0406 0.8 0.7657 0.784 ARMA (1,1) 1 0.92282 0.9292 phi 0.7 0.689 0.7087 400 0.6 0.5948 0.5954 theta 0.4 0.3861 0.4043 1 0.91752 0.919 MSE 1 1.04198 1.0462
Dari tabel 2 dapat dilihat bahwa hasil rata-rata penaksiran parameter model dan nilai MSE dari Minitab dan program fitarima.m mendekati sama sehingga program fitarima.m dapat digunakan sebagai penaksiran parameter metode Conditional Least Square. 4.4 Penaksiran Parameter model ARIMA dengan Conditional Least Square Setelah mendapatkan dugaan model sementara, langkah yang akan dilakukan selanjutnya yaitu mencari taksiran parameter dengan metode Conditional Least Square. Pada metode tersebut, taksiran parameter didapatkan dengan cara meminimumkan jumlah kuadrat error, namun dari metode tersebut masih belum didapatkan nilai taksiran parameternya karena hasil yang didapatkan berupa fungsi nonlinear sehingga perlu dilakukan optimasi. Optimasi dapat dilakukan dengan algoritma LevenbergMarquardt. Nilai taksiran parameter untuk data kecepatan angin rata-rata harian adalah pada Tabel 3: Tabel 3 Penaksiran Parameter Model ARIMA (1,1,0)
Parameter
Koefisien
MSE
db
SSE
AR(1)
-0.5505
1156000000
140
161840000000
Dari Tabel 3 diatas dapat dilihat bahwa nilai parameter AR(1) sebesar -0.5505, nilai MSE sebesar 1156000000 dan nilai SSE sebesar 161840000000 4.4.1 Pengujian signifikansi Parameter Untuk mengetahui apakah parameter model ARIMA yang ditaksir signifikan atau tidak perlu dilakukan pengujian. Hipotesis yang akan diuji adalah sebagai berikut : H0 : θ = 0 (parameter model tidak signifikan) H1 : θ ≠ 0 (parameter model signifikan) Statisik uji yang digunakan yaitu :
ˆ t
s.e( ˆ )
5
H0 ditolak jika
t
t 0 .005 ;141 dengan nilai t0.005;141 yaitu sebesar 2,576.
model ARIMA (1,1,0)
parameter
Tabel 4 Pengujian taksiran parameter koefisien SE koefisien t-hitung
keterangan
-0.5505
signifikan
AR 1
0.084517529
-6.513441712
Dari Tabel 4 diatas dapat dikatakan bahwa taksiran parameter signifikan karena nilai |t-hitung| > t0.005;141 Langkah selanjutnya adalah pengujian asumsi residual. 4.4.2 Pengujian Asumsi Residual Pengujian pada residual dilakukan untuk mengetahui apakah residual white noise atau tidak. Pengujian menggunakan uji Ljung-Box dengan hipotesis sebagai berikut : H0 : Residual white noise H1 : Residual tidak white noise Statisik uji yang digunakan yaitu : ˆ k2
K
Q
n(n
2) k
1
n
k
H0 ditolak jika nilai p-value > α. Hasil Uji Ljung-Box adalah sebagai berikut : Tabel 5 Pengujian asumsi white-noise model
Ljung - Box
keterangan
lag
12
24
36
48
λ2
90.353
139.713
159.426
166.055
DF
11
23
35
47
P_Value
1.0000
1.0000
1.0000
1.0000
ARIMA (1,1,0)
whitenoise
Tabel 5 menunjukkan bahwa model white-noise karena nilai p_value > α dengan α sebesar 1%. Selanjutnya adalah uji asumsi distribusi normal pada residual dengan hipotesis sebagai berikut : H0 : F x F0 x H1 : F x F0 x . Statistik uji yang digunakan dalam pengujian hipotesis ini adalah sebagai berikut D = sup S x
F0 x
Nilai D adalah jarak vertikal terjauh antara F 0(x) dan S(x) dengan : fungsi peluang kumulatif yang dihitung dari data sampel S x : fungsi distribusi yang dihipotesiskan (normal) F0 x : fungsi distribusi yang belum diketahui. F x Hipotesis nol ditolak jika D
D
0 . 99 ;141
, atau nilai p-value < α.
P r o ba bility P lo t o f r e s idua l No r m a l 99.9
99
M ean
- 87.00
S tD ev
33999
N
95
141
KS
0.073
P - V alu e
0.063
90
Pe r c e nt
80 70 60 50 40 30 20 10 5 1
0.1
-1 00 00 0
-50 00 0
0
500 00
1 00 00 0
C1 4
Gambar 7 Plot kenormalan residual Algoritma Genetika
6
Dari Gambar 7 dapat diketahui bahwa nilai p-value sebesar 0.063 berarti gagal tolak H 0 karena p-value > α dengan α=1% sehingga residual berdistribusi normal. Model ARIMA(1,1,0) menjadi model terbaik untuk data permintaan Arc Tube daya listrik z at rendah. Modelnya adalah sebagai berikut (1 - B)z t 1 t -1 zt
zt
1
- 0 . 5505 z t - 1
at
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya listrik ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.5505 kali permintaan Arc Tube pada waktu t-1 ditambah kesalahan pada saat ke-t. 4.5 Algoritma Genetika 4.5.1 Simulasi model AR(1), MA(1), ARMA(1,1) untuk Algoritma Genetika Simulasi dilakukan dengan membangkitkan sebanyak 100, 200 dan 400 data menggunakan macro minitab. Untuk setiap sampel, data dibangkitkan sebanyak 5 kali. Penaksiran parameter data simulasi dilakukan dengan Algoritma Genetika. Hasil penaksiran parameter data simulasi sebagai berikut Tabel 6 Hasil penaksiran parameter data simulasi
sampel 100 100
100
200 200
parameter AR(1) MSE MA(1) MSE phi theta MSE AR(1) MSE MA(1) MSE
simulasi 0.8 1 0.6 1 ARMA (1,1) 0.7 0.4 1 0.8 1 0.6 1
rata-rata Algoritma Genetika 0.8168
sampel
1.119952 0.6311 1.072292
400 400
0.8291 0.941478 0.6188 0.934108
phi theta MSE
400
simulasi ARMA (1,1) 0.7 0.4 1 0.8 1 0.6 1 ARMA (1,1) 0.7 0.4 1
phi theta MSE AR(1) MSE MA(1) MSE
200
0.7549 0.4455 0.923886
parameter
rata-rata Algoritma Genetika 0.717752 0.396 1.083684
0.8168 1.02749 0.6188 1.04455 0.717752 0.4455 1.066268
Dari tabel 6 dapat dilihat bahwa hasil rata-rata taksiran parameter model dan nilai MSE dari Algoritma Genetika mendekati sama dengan nilai parameter simulasi sehingga program Algoritma Genetika dapat untuk mencari taksiran parameter data asli. 4.5.2 Kromosom Pada Algoritma Genetika untuk penaksiran parameter model ARIMA terdiri dari dua jenis kromosom. Kromosom jenis satu berupa bilangan biner yang didapatkan secara acak yang merepresentasikan model ARMA(p,q), sedangkan kromosom jenis dua berupa bilangan real yang merupakan kumpulan nilai parameter model ARIMA dan didapatkan dari mengkonversikan kromosom jenis satu kedalam bilangan real. Contohnya : model ARMA(2,1) direpresentasikan dengan (1 1 0 0 1 0 1 1 0 0) (0 1 0 0 1) atau 1
1
0
0
1
0
1
1
0
0
0
1
0
0
1
sebagai kromosom jenis satu, kemudian dikonversikan kedalam bilangan real sehingga kromosom berubah menjadi 0.5569
-0.2475
-0.4331
Perubahan kromosom dari bilangan biner menjadi bilangan real disebut sebagai kromosom jenis dua. 4.5.3 Penaksiran Parameter model ARIMA dengan Algoritma Genetika Penaksiran parameter model ARIMA dengan algoritma Genetika dilakukan dengan ukuran populasi atau jumlah kromosom sebanyak 10, 20, 40, dan 100. Dalam Algoritma Genetika memiliki
7
suatu ukuran kebaikan atau nilai fitness yaitu dalam hal ini adalah nilai SSE (Sum Square Error), Nilai fitness yang tinggi menandakan nilai SSE yang kecil. Iterasi pada kromosom dalam suatu populasi akan dilakukan berdasarkan nilai fitness, kromosom yang memiliki nilai fitness tinggi akan selamat dan mampu bertahan pada generasi selanjutnya sedangkan kromosom yang memiliki nilai fitness rendah akan mati dan tereliminasi pada generasi selanjutnya. Iterasi akan berhenti apabila nilai fitness sudah konvergen. Hasil penaksiran parameter model ARIMA dengan mengunakan Algoritma Genetika sebagai berikut Tabel 7 Hasil penaksiran parameter dengan Algoritma Genetika kromosom
generasi
MSE
db
SSE
parameter
10
4
1156000000
140
161840000000
phi
-0.55688
20
4
1156000000
140
161840000000
phi
-0.55688
40
4
1156000000
140
161840000000
phi
-0.55688
100
4
1156000000
140
161840000000
phi
-0.55688
Dari Tabel 7 dapat dilihat bahwa nilai MSE, SSE dan parameter untuk semua jumlah kromosom mempunyai nilai yang sama. Nilai MSE tersebut merupakan nilai MSE terbaik dengan nilai sebesar 1156000000, nilai SSE sebesar 161840000000 serta nilai parameter sebesar -0.55688. 4.5.3.1 Pengujian Signifikansi Parameter Untuk mengetahui apakah parameter model ARIMA yang ditaksir signifikan atau tidak perlu dilakukan pengujian. Hipotesis yang akan diuji adalah sebagai berikut : H0 : θ = 0 (parameter model tidak signifikan) H1 : θ ≠ 0 (parameter model signifikan) Statisik uji yang digunakan yaitu : ˆ
t
H0 ditolak jika
t
s.e( ˆ )
t 0 .005 ;141 dengan nilai t0.005;141 yaitu sebesar 2,576. Tabel 8 Pengujian estimasi parameter model
parameter
koefisien
SE koefisien
t-hitung
keterangan
ARIMA (1,1,0)
AR 1
-0.55688
0.084514711
-6.5891487
signifikan
Dari Tabel 8 diatas dapat dikatakan bahwa taksiran parameter signifikan karena nilai |t-hitung| > t0.005;141 Langkah selanjutnya adalah pengujian asumsi residual. 4.5.3.2 Pengujian Asumsi Residual Pengujian pada residual dilakukan untuk mengetahui apakah residual white noise atau tidak. Pengujian menggunakan uji Ljung-Box dengan hipotesis sebagai berikut : H0 : Residual white noise H1 : Residual tidak white noise Statisik uji yang digunakan yaitu : ˆ k2
K
Q
n(n
2) k
1
n
k
H0 ditolak jika nilai p-value > α. Hasil Uji Ljung-Box adalah sebagai berikut :
8
Tabel 9 Pengujian asumsi white-noise model
Ljung - Box lag
ARIMA (1,1,0)
keterangan
12
24
36
48
λ
90.8313
139.563
159.152
166.253
DF
11
23
35
47
P_Value
1.0000
1.0000
1.0000
1.0000
2
white-noise
Tabel 9 menunjukkan bahwa model white-noise karena nilai p_value > α dengan α sebesar 1%. Selanjutnya adalah uji asumsi distribusi normal pada residual dengan hipotesis sebagai berikut : H0 : F x F0 x H1 : F x F0 x . Statistik uji yang digunakan dalam pengujian hipotesis ini adalah sebagai berikut D = sup S x
F0 x
Nilai D adalah jarak vertikal terjauh antara F 0(x) dan S(x) dengan : fungsi peluang kumulatif yang dihitung dari data sampel S x : fungsi distribusi yang dihipotesiskan (normal) F0 x : fungsi distribusi yang belum diketahui. F x Hipotesis nol ditolak jika D
D
0 . 99 ;141
, atau nilai p-value < α.
P r o ba bility P lo t o f r e s idua l No r m a l 99.9
99
M ean
- 87.99
S tD ev
34000
N
95
141
KS
0.076
P - V alu e
0.048
90
Pe r c e nt
80 70 60 50 40 30 20 10 5 1
0.1
-1 00 00 0
-50 00 0
0
500 00
1 00 00 0
C1 2
Gambar 8 Plot kenormalan residual Algoritma Genetika
Dari Gambar 8 dapat diketahui bahwa nilai p-value sebesar 0.048 berarti tolak H 0 karena pvalue < α dengan α=1% sehingga residual tidak berdistribusi normal. Residual tidak berdistribusi normal dapat terjadi karena adanya beberapa penyabab, salah satunya yaitu adanya data outlier sehingga perlu dilakukan deteksi outlier. Model ARIMA(1,1,0) menjadi model terbaik untuk data permintaan Arc Tube daya listrik z at rendah. Modelnya adalah sebagai berikut (1 - B)z t 1 t -1 zt
zt
1
- 0 . 55688 z t - 1
at
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya listrik ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.55688 kali permintaan Arc Tube pada waktu t-1 ditambah kesalahan pada saat ke-t. 5. Kesimpulan dan saran 5.1. Kesimpulan Berdasarkan pembahasan yang telah diperoleh pada bab sebelumnya, dapat diambil kesimpulan sebagai berikut: 1. Hasil penaksiran parameter model ARIMA dengan mengunakan Conditional Least Square adalah (1 - B)z t zt
zt
1
1
z t -1
at
- 0 . 5505 z t - 1
9
at
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya listrik ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.5505 kali permintaan Arc Tube pada waktu t-1 ditambah kesalahan pada saat ke-t. Dengan MSE sebesar 1156000000 dan SSE sebesar 161840000000. 2. Hasil penaksiran parameter model ARIMA dengan mengunakan Algoritma Genetika adalah : (1 - B)z t zt
zt
1
1
z t -1
at
- 0 . 55688 z t - 1
at
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya listrik ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.55688 kali permintaan Arc Tube pada waktu t-1 ditambah kesalahan pada saat ke-t. Dengan MSE sebesar 1156000000 dan SSE sebesar 161840000000. 3. Dari hasil kedua metode penaksiran parameter model ARIMA tersebut dihasilkan nilai MSE dan SSE yang besarnya sama 5.2. Saran Berdasarkan pembahasan yang telah diperoleh pada bab sebelumnya, dapat diambil suatu saran sebagai berikut: 1. Pada penelitian ini penaksiran parameter model ARIMA dengan Algoritma Genetika hanya berdasarkan kriteria SSE saja. Untuk selanjutnya diharapkan bisa dikembangkan berdasarkan kriteria MSE, signifikansi parameter, dan asumsi distribusi Normal. 2. Pada penelitian ini hanya digunakan data ARIMA non musiman. Untuk selanjutnya diharapkan bisa dikembangkan untuk model ARIMA yang musiman. DAFTAR PUSTAKA Budiman, A., 2003. Optimisasi Daya Reaktif Menggunakan Algoritma Genetik Pseudo-Paralel. Jurnal teknik elektro dan komputer emitor Vol. 3, No. 1, Maret 2003 Fariza, A., 2003. Hybrid Algoritma Genetika Simulated Annealing untuk Peramalan Data time Series. Tugas akhir yang dipublikasikan. Gen, M., dan Cheng, R., 2000. Genetic Algorithms and Engineering Optimization. Canada : John Wiley & Son Inc. Makridakis, S., Wheelwright, S.C., dan McGee, V.E., 1999. Jilid 1 Edisi Kedua, Terjemahan Ir. Hari Suminto. Metode dan Aplikasi Peramalan. Jakarta : Bina Rupa Aksara. Rohman, M.N., 2009. Identifikasi Model Arima Box-Jenkins Mengunakan Algoritma Genetika. Tugas Akhir S1 Statistika ITS Surabaya (tidak dipublikasikan). Sanjoyo. 2006. Aplikasi Algoritma Genetika. Sivanandam, S.N.,dan Deepa, S.N., 2008. Introduction to Genetic Algorithms. Berlin Heidelberg New York : Springer.
10