Aplikasi Metode Bayesian Model Averaging Dengan Pendekatan Markov Chain Monte Carlo (MCMC) Untuk Peramalan Curah Hujan Bulanan Di Stasiun Meteorologi Sukowono Kabupaten Jember 1
Galih Satrio Prayoga, 2 Heri Kuswanto, dan 3 Irhamah, Jurusan Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia e-mail:
[email protected],
[email protected] Abstrak— Indonesia memiliki karakteristik cuaca yang beragam di antar daerah. Perbedaan cuaca dengan keragaman yang tinggi menimbulkan permasalahan baru bagi masyarakat Indonesia seperti wabah penyakit, gangguan kesehatan, keterlambatan transportasi, nelayan yang gagal melaut, kegagalan panen dan kerawanan sosial lainnya. Adanya permasalahan tersebut menyebabkan kebutuhan informasi mengenai cuaca layak untuk diteliti. Oleh karena itu, dibutuhkan peramalan cuaca yang akurat sebagai langkah antisipasi untuk memperkecil dampak yang akan terjadi. Tipe peramalan dapat dikategorikan menjadi dua yaitu peramalan deterministik dan peramalan probabilistik. Peramalan deterministik memberikan hasil berupa suatu titik (point), sehingga kurang dapat digunakan sebagai acuan dalam membuat peramalan cuaca yang sifatnya memiliki variasi yang tinggi. Oleh karena itu, dalam penelitian ini, peneliti menggunakan peramalan probabilistik untuk meramalkan cuaca. Hasil penelitian ini disimpulkan bahwa jumlah training window yang terbaik adalah 15 data dengan kemampuan meng-cover observasi sebesar 89%. Metode BMA – MCMC memberikan hasil yang baik dalam menghasilkan peramalan jangka pendek maupun jangka panjang (2 tahun kedepan). Penerapan metode BMA – MCMC untuk membuat peramalan deterministik sama baiknya dengan metode ORI dan lebih baik daripada metode BMA – EM. Sedangkan penerapan metode BMA – MCMC dalam peramalan probabilistik sama baiknya dengan metode BMA – EM dan lebih baik daripada metode ORI. Kata Kunci— Curah Hujan, BMA-MCMC, Lead time, Training windows.
I. PENDAHULUAN
S
ebagai negara kepulauan, Indonesia memiliki karakteristik cuaca yang beragam di antar daerah. Perbedaan cuaca dengan keragaman yang tinggi menimbulkan masalah tersendiri bagi masyarakat Indonesia seperti wabah penyakit, gangguan kesehatan, keterlambatan transportasi, nelayan yang gagal melaut, kegagalan panen dan kerawanan sosial lainnya. Adanya permasalahan tersebut menyebabkan kebutuhan informasi mengenai cuaca layak untuk diteliti. Oleh karena itu, dibutuhkan peramalan cuaca yang akurat sebagai langkah antisipasi untuk memperkecil dampak yang akan terjadi. Tipe peramalan dapat dikategorikan menjadi dua yaitu peramalan deterministik dan peramalan probabilistik. Peramalan deterministik memberikan hasil berupa suatu titik (point), sehingga kurang dapat digunakan sebagai acuan dalam membuat peramalan cuaca yang si-
fatnya memiliki variasi yang tinggi. Indonesia adalah salah satu negara yang masih mengimplementasikan peramalan deterministik sebagai metode peramalan dalam meramalkan cuaca [1], sehingga dalam penelitian ini, peneliti akan menggunakan peramalan probabilistik untuk meramalkan cuaca. Metode yang seringkali digunakan sebagai pendekatan peramalan probabilistik adalah metode peramalan ensemble. Metode tersebut sangat baik dalam memberikan informasi penting tentang hasil peramalan. Namun bentuk peramalan ensemble cenderung underdispersive atau overdispersive. Bayesian Model Averaging (BMA) dapat memberikan kalibrasi dan ketepatan peramalan probabilistik yang lebih unggul daripada peramalan ensemble sederhana. Metode BMA dapat digunakan sebagai metode untuk meramalkan temperatur, tekanan udara, jumlah curah hujan, kecepatan angin, arah angin, vektor angin dan parameter potensial lainnya [2]. Penelitian tersebut diperkuat oleh penelitian [1] yang menggunakan metode BMA - MCMC untuk mengkalibrasi peramalan temperatur dari kombinasi model deret waktu. Dalam penelitian tersebut disimpulkan bahwa peramalan menggunakan metode BMA - MCMC lebih akurat dalam prediksi daripada metode yang tidak terkalibrasi. Penelitian lainnya pernah dilakukan oleh [3] untuk membandingkan metode BMA dengan pendekatan Expectation – Maximization (BMA – EM) dengan metode EMOS. Hasil penelitian memberikan kesimpulan bahwa metode BMA – EM memberikan peramalan lebih baik dalam meramalkan curah hujan daripada penggunaan metode kalibrasi EMOS. Vrugt, Diks, dan Clark [4] pernah melakukan penelitian dengan metode ensemble Bayesian Model Averaging dengan pendekatan Markov Chain Monte Carlo (BMA-MCMC) untuk dibandingkan dengan metode Bayesian Model Averaging dengan pendekatan Expectation – Maximization (BMA - EM). Penelitian tersebut memberikan hasil bahwa BMA-MCMC sama baiknya dalam memberikan peramalan, tanpa mempertimbangkan jumlah anggota ensemble dan panjang data yang dikalibrasi. Akan tetapi simulasi menggunakan MCMC dapat mengakomodasi variasi yang besar pada distribusi bersyarat dari BMA tanpa melakukan modifikasi pada kode dasar. Penggunaan metode BMA - MCMC juga mampu mengatasi variasi pada distribusi BMA dan dapat memberikan informasi penting mengenai perkiraan bobot dan variasi.
2
Dengan pertimbangan tersebut, dalam penelitian ini digunakan metode BMA – MCMC dengan tujuan untuk membandingkan dengan metode BMA – EM dalam memprediksi curah hujan di kabupaten Jember yang sudah dilakukan [3]. Penelitian ini dilakukan sebagai upaya untuk mendapatkan hasil peramalan yang terbaik, dimana kebutuhan peramalan cuaca di Kabupaten Jember begitu penting. Mengingat Kabupaten Jember memiliki penduduk terbanyak ketiga di Jawa Timur [5], sehingga permasalahan yang berhubungan dengan cuaca menjadi layak untuk diteliti dan permasalahan dapat segera diantisipasi. II. TINJAUAN PUSTAKA A. Bayesian Model Averaging (BMA) Metode Bayesian Model Averaging (BMA) memberikan pembaharuan dalam pemodelan, dengan tidak hanya satu model terbaik yang dipilih tetapi menggunakan seluruh kemungkinan ensembel yang dapat dijadikan pertimbangan [6], [7]. Vrugt [4] menyatakan bahwa metode ini tidak hanya mengacu pada satu model yang terbaik saja namun juga mempertimbangkan model lain yang kemudian diberikan bobot sesuai dengan besar kontribusi dari masing – masing model individu terhadap kemampuan prediksi. Hasil dari metode ini lebih akurat dan handal daripada hasil yang didapatkan dengan metode kalibrasi yang lain. Misalkan 𝑓𝑓𝑘𝑘 = 𝑓𝑓1 , 𝑓𝑓2 , . . . , 𝑓𝑓𝐾𝐾 dengan k adalah prediksi ensemble yang diperoleh dari K model, dan 𝑦𝑦 adalah peramalan ensemble yang terkalibrasi, maka model prediksi BMA (posterior distribusi) untuk peramalan ensemble dapat dituliskan dalam sebuah model mixture dengan bentuk sebagai berikut [7], [4]. 𝑝𝑝(𝑦𝑦|𝑓𝑓1 , 𝑓𝑓2 , … , 𝑓𝑓𝐾𝐾 ) = ∑𝐾𝐾𝑘𝑘=1 𝑤𝑤𝑘𝑘 𝑔𝑔𝑘𝑘 �𝑦𝑦�𝑓𝑓𝑘𝑘̅ � (1) dimana 𝑤𝑤𝑘𝑘 menyatakan peluang posterior dari peramalan 𝑘𝑘 yang terbaik. 𝑤𝑤𝑘𝑘 memiliki nilai nonnegative dan berjumlah satu, dan dapat disebut sebagai bobot yang mencerminkan kontribusi model individu terhadap prediksi selama periode training. Sedangkan 𝑔𝑔𝑘𝑘 �𝑦𝑦�𝑓𝑓𝑘𝑘̅ � adalah pdf gamma yang dipengaruhi oleh jumlah peramalan ensemble fk melalui hubungan. (2) 𝜇𝜇𝑘𝑘 = 𝑏𝑏0 + 𝑏𝑏1𝑘𝑘 𝑓𝑓𝑘𝑘 dan (3) 𝜎𝜎𝑘𝑘 = 𝑐𝑐0 + 𝑐𝑐1𝑘𝑘 𝑓𝑓𝑘𝑘 dimana nilai 𝜇𝜇𝑘𝑘 adalah nilai koreksi bias dari distribusi dan 𝜎𝜎𝑘𝑘 adalah nilai standard deviasi anggota ensemble. Nilai 𝜇𝜇𝑘𝑘 dan 𝜎𝜎𝑘𝑘 dapat digunakan untuk mengestimasi parameter skala dan parameter bentuk sehingga diperoleh pdf gamma 𝑔𝑔𝑘𝑘 �𝑦𝑦�𝑓𝑓𝑘𝑘̅ � [8]. B. Markov Chain Monte Carlo (MCMC) Simulasi MCMC digunakan sebagai pendekatan untuk mengestimasi bobot dan variasi BMA. Simulasi MCMC menggunakan jalur yang memiliki perbedaan, secara serempak untuk sampel 𝑤𝑤𝑘𝑘 , 𝑘𝑘 = 1, … , 𝐾𝐾 dan 𝜎𝜎 2 secara khusus, didasarkan pada pembobotan yang diberikan pada fungsi likelihood. Metode simulasi MCMC yang akhir – akhir ini dikembangkan adalah DiffeRential Evolution Adaptive
Metropolis (DREAM). Pada DREAM, sejumlah N rantai Markov yang berbeda dijalankan secara simultan parallel. Jika state dari rantai tunggal diberikan oleh sebuah vektor 𝜃𝜃 berdimensi d, dimana 𝜃𝜃 = 𝑤𝑤1 , 𝑤𝑤2 , … , 𝑤𝑤𝐾𝐾 , maka masing – masing generasi dari N dalam DREAM mendefinisikan suatu populasi Ω berukuran N x d. Lompatan dalam rantai i = {1, 2, … , 𝑁𝑁} dibangkitkan dengan mengambil beda dari beberapa rantai lain dari Ω yang dipilih secara random : 𝜗𝜗 𝑖𝑖 = 𝜃𝜃 𝑖𝑖 + 𝛾𝛾(𝛿𝛿) ∑𝛿𝛿𝑗𝑗=1 𝜃𝜃 𝑟𝑟(𝑗𝑗 ) − 𝛾𝛾(𝛿𝛿) ∑𝛿𝛿𝑗𝑗=1 𝜃𝜃 𝑟𝑟(𝑛𝑛) + 𝑒𝑒 (4) dimana 𝛿𝛿 merupakan jumlah pasangan yang digunakan untuk menghasilkan titik ramalan dan r(j), r(n)∈ {1, 2, … , 𝑁𝑁 − 1}; r(j) ≠ r(n). Dalam memutuskan penerimaan titik ramalan digunakan rasio metropolis. Deret hasil operasi dalam sampel MCMC dapat menghasilkan parameter robust secara efisien, karena gabungan pdf dari faktor rantai N untuk 𝜋𝜋(𝜃𝜃1 )𝑥𝑥. . 𝑥𝑥 𝜋𝜋(𝜃𝜃𝑁𝑁 ), dengan state 𝜃𝜃1 … 𝜃𝜃𝑁𝑁 dari rantai individu bersifat independen dalam berbagi bentuk setelah nilai DREAM menjadi independen [4]. C. Mean Square Error (MSE) Tidak jarang ditemui terdapat beberapa model yang signifikan dalam membentuk sebuah peramalan. Pilihan utama dari model adalah melihat nilai error yang terkecil. Salah satu metode yang dapat digunakan sebagai pendekatan pemilihan model adalah dengan menggunakan nilai Mean Square Error (MSE). Jika nilai eror dari peramalan deterministik terkalibrasi 𝑒𝑒 = 𝑧𝑧𝑡𝑡 − 𝑦𝑦𝑡𝑡 , dengan zt merupakan nilai observasi sebenarnya dan 𝑦𝑦𝑡𝑡 yt merupakan prediksi peramalan deterministik terkalibra-si, maka nilai MSE dapat dihitung sebagai
𝑀𝑀𝑀𝑀𝑀𝑀 =
1 𝑁𝑁
2 ∑𝑁𝑁 𝑖𝑖=1 𝑒𝑒𝑖𝑖
(5) Nilai N merupakan banyak hari dilakukannya peramalan [9]. Berdasarkan rumus yang digunakan, nilai MSE hanya dapat digunakan sebagai bentuk evaluasi peramalan deterministik.
D. Continuous Ranked Probability Score (CRPS) CRPS merupakan suatu ukuran untuk menilai seberapa reliabel hasil kalibrasi yang telah dihasilkan dengan menggunakan metode BMA dimana suatu hasil peramalan dapat dikatakan bagus jika nilai CRPS yang dihasilkan adalah minimum. Pemilihan metode CRPS sebagai metode evaluasi ketepatan hasil peramalan yang terkalibrasi ini disebabkan karena peramalan yang dihasilkan adalah nilai peramalan terkalibrasi dalam bentuk PDF. Persamaan untuk menghitung CRPS adalah sebagai berikut [10]. 𝑥𝑥=∞ 1 𝑓𝑓 0 2 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 = ∑𝑁𝑁 (6) 𝑖𝑖=1 ∫𝑥𝑥=−∞ (𝐹𝐹𝑖𝑖 (𝑥𝑥) − 𝐹𝐹𝑖𝑖 (𝑥𝑥)) 𝑑𝑑𝑑𝑑 𝑓𝑓
𝑁𝑁
dimana 𝐹𝐹𝑖𝑖 (𝑥𝑥) adalah cdf dari hasil peramalan ke-i, sedangkan 𝐹𝐹𝑖𝑖0 (𝑥𝑥) adalah pengamatan sebenarnya ke-i dan N adalah jumlah hari dilakukannya peramalan. E. Curah Hujan Curah hujan dapat diartikan sebagai ketinggian air hujan yang terkumpul dalam tempat yang datar, tidak menguap, tidak meresap, dan tidak mengalir. Curah hujan 1 (satu) millimeter, artinya dalam luasan satu meter
3
A. Sumber Data Data yang digunakan dalam penelitian ini adalah data observasi dan data peramalan curah hujan bulanan BMKG yang diperoleh dari penelitian [3]. Simulasi dari data tersebut dilakukan sebanyak 24 lead (24 bulan ke depan) untuk bulan Februari 2005 sampai Desember 2009. Panjang lead yang digunakan adalah lead ke – 1, ke – 6, ke – 12, ke – 18 dan ke – 24. Penggunaan lead time yang berbeda – beda digunakan untuk mengetahui kemampuan peramalan ensemble terkalibrasi dalam membuat peramalan jangka panjang. Data time series ini merupakan data curah hujan di Sukowono kabupaten Jember. Variabel penelitian yang digunakan adalah variabel curah hujan bulanan mulai bulan Februari 2005 sampai Desember 2009 dengan skala rasio. B. Metode Analisis Metode Penelitian dilakukan melalui langkah – langkah sebagai berikut. 1. Membentuk plot time series data observasi dan peramalan individual. Kemudian melakukan perbandingan antara data hasil peramalan individual dengan data observasi. Melalui langkah ini, akan dapat diketahui karakteristik dan kebaikan hasil peramalan individual yang digunakan untuk pembentukan ensemble terkalibrasi. 2. Melakukan peramalan ensemble kalibrasi menggunakan BMA dengan pendekatan MCMC. 3. Mengulangi langkah 2 untuk semua data dengan training window dan lead time yang telah ditentukan. 4. Melakukan evaluasi ketepatan peramalan menggunakan MSE dan CRPS. Dalam tahap ini, akan dievaluasi nilai MSE dan CRPS yang dihasilkan dari proses kalibrasi sebanyak lead time yang telah ditetapkan. 5. Membandingkan peramalan hasil metode BMAMCMC dengan BMA-EM yang digunakan oleh [3]. Peramalan dengan nilai MSE dan CRPS lebih kecil adalah peramalan yang lebih baik. 6. Pembuatan kesimpulan. IV. HASIL DAN PEMBAHASAN A. Karakteristik Peramalan Individual Model peramalan individual pada penelitian ini menggunakan metode ANFIS, ARIMA, WaveletARIMA dan Wavelet-ANFIS. Berikut ini contoh karakteristik peramalan individual pada lead 1.
2005
(a)
Curah Hujan (mm)
persegi pada tempat yang datar tertampung air setinggi satu millimeter atau tertampung air sebanyak satu liter [11]. Kriteria intensitas curah hujan dibagi menjadi 4 kategori, yaitu : a. Hujan Ringan : intensitas 5 – 20 mm/hari b. Hujan Sedang : intensitas 20 – 50 mm/hari c. Hujan Lebat : intensitas 50 – 100 mm/hari d. Hujan Sangat Lebat : intensitas >100 mm/hari [12] III. METODOLOGI PENELITIAN
2006
2007
2008
2009
500 400 300 200 100 0
Keterangan : (O) Observasi ------ ARIMA ------ Wav-ARIMA
------ ANFIS ------ Wav-ANFIS
Gambar 1. Karakteristik Peramalan Individual dengan Lead 1
Penerapan metode Wavelet - ARIMA dan ANFIS dalam pembuatan model peramalan ensemble individual, menunjukkan hasil yang baik. Model peramalan ini dapat mengikuti pola nilai observasi dengan baik. Berbeda halnya dengan penerapan metode ARIMA. Pada lead time 1 penerapan metode ARIMA masih dapat menghasilkan nilai peramalan yang dapat mengikuti pola observasi, namun pada lead 6, lead 12, lead 18 dan lead 24 (tidak ditampilkan) penerapan metode ARIMA cenderung memberikan hasil yang flat (datar), artinya metode ARIMA dalam penelitian ini tidak memberikan hasil peramalan jangka panjang yang baik. Oleh karena itu, untuk mengakomodasi kebaikan maupun ketidakbaikan peramalan individual maka keempat model peramalan individual tersebut akan dibentuk sebagai suatu ensemble dengan proses kalibrasi menggunakan metode BMA-MCMC. B. Peramalan Ensemble dengan Kalibrasi BMA-MCMC Pada penelitian [3], disebutkan bahwa keempat model peramalan dibangkitkan menggunakan software khusus yang digunakan oleh BMKG, yaitu HyBMG. Output peramalan yang diperoleh, terdiri dari lima lead time yaitu lead 1, 6, 12, 18 dan 24. Penggunaan lead time yang berbeda–beda dimaksudkan untuk mengevaluasi apakah peramalan jangka panjang masih dapat memberikan hasil yang baik atau tidak, sehingga diharapkan kebutuhan BMKG untuk peramalan jangka panjang (2 tahun kedepan) dapat terpenuhi dengan metode ini. Jika dilakukan perbandingan antara nilai koreksi bias dengan nilai pengamatan curah hujan bulanan yaitu 368 0C, maka nilai ensemble tanpa koreksi bias (𝑓𝑓𝑘𝑘 ) lebih dekat dengan pengamatan sebenarnya daripada nilai ensemble dengan koreksi bias (Tabel 1). Model ANFIS memiliki nilai bobot terbesar pada masing – masing training windows untuk data curah hujan pada bulan Desember 2009. Nilai bobot terbesar model ANFIS dalam peramalan curah hujan bulanan juga ditemukan pada penelitian [3] menggunakan metode kalibrasi dengan pendekatan Expectation Maximitation (EM). Besarnya nilai ini menunjukkan bahwa model ANFIS memiliki kontribusi yang besar dalam melakukan prediktif terkalibrasi untuk peramalan curah hujan di Stasiun Sukowono Kabupaten Jember.
4
Tabel 1. Contoh Parameter untuk Bulan Desember 2009 (Lead ke-1) Training windows (m) 10
Model
𝑎𝑎𝑘𝑘 -51.73 22.12 -138.13 9.90 -70.98 17.48 -160.86 25.74 -42.70 46.31 -139.82 30.83
ANFIS ARIMA Wav-ANFIS Wav-ARIMA ANFIS ARIMA Wav-ANFIS Wav-ARIMA ANFIS ARIMA Wav-ANFIS Wav-ARIMA
12
15
C. Identifikasi Performa Training Window Tabel 2. merupakan contoh parameter yang telah terkalibrasi beserta interval peramalannya pada pengamatan bulan Desember 2009 untuk peramalan lead ke-1. Nilai mean pada lead ke-1, yang paling mendekati nilai observasi (368 mm) adalah nilai mean dengan training window (m) 15. Nilai mean dapat dianggap sebagai nilai peramalan deterministik peramalan terkalibrasi metode BMA-MCMC. Walaupun nilai peramalan deterministik kalibrasi BMA-MCMC tidak dapat menangkap nilai observasi secara tepat namun interval yang terbentuk dari peramalan kalibrasi menggunakan training window 15 dapat menangkap nilai observasi. Tabel 2. Parameter Pdf Predictive Terkalibrasi Lead 1 Mean 208.61 225.87 255.76
Varian 587.30 4754.01 10150.58
0.03
0.03
0.025
0.025
Probability density
Probability density
m 10 12 15
0.02
0.015
0.01
0.005
50
100
150
200
250
300
350
400
Curah Hujan
Probability density
3 2.5 2 1.5 1 0.5 0 -400
-200
0
200
Curah Hujan
400
600
800
𝜎𝜎 2 98.75 98.75 98.75 98.75 97.05 97.05 97.05 97.05 6674.13 6674.13 6674.13 6674.13
35%
(c)
11%
38% 62%
89% masuk interval
keluar interval
0.015
Gambar 3. Persentase Observasi yang Masuk Atau Keluar Interval ( m = 10 (a), m = 12 (b), dan m = 15 (c))
0.01
0 0
50
100
150
200
250
300
350
400
-3
3.5
w 0.69 0.01 0.01 0.29 0.62 0.00 0.21 0.17 0.67 0.00 0.13 0.20
(b)
(a)
65%
(b)
4
𝜇𝜇𝑘𝑘 219.06 77.35 74.36 192.36 264.27 88.64 95.68 250.90 283.28 113.31 108.14 264.10
training window 10 tidak dapat menangkap observasi dengan baik. Interval yang dihasilkan dari peramalan terkalibrasi pada training window 10 lebih kecil dibandingkan dengan training window lainnya, hal ini dikarenakan peramalan individual yang digunakan untuk membentuk peramalan terkalibrasi memiliki nilai keragaman yang kecil. Training window, m = 15 dapat meng-cover observasi lebih baik daripada training window dengan m = 10 dan m = 12. Data yang masuk interval peramalan terkalibrasi dengan training window 15 sebanyak 39 data atau 89% dari total pengamatan. Sedangkan pada training window 10 dapat meng-cover observasi sebanyak 32 data atau 65% dari total pengamatan. Pada training window 12 dapat meng-cover observasi sebanyak 29 data atau 62% dari total pengamatan.
0.02
Curah Hujan
(a) x 10
Batas 2 256.1069 361.0117 453.2317
0.005
0 0
4.5
Batas 1 161.1086 90.7304 58.2913
Parameter 𝑏𝑏𝑘𝑘 𝑓𝑓𝑘𝑘 0.97 277.8 0.79 69.8 1.63 130.1 0.69 263.6 1.21 277.8 1.02 69.8 1.97 130.1 0.85 263.6 1.17 277.8 0.96 69.8 1.91 130.1 0.88 263.6
Keterangan : –––– ANFIS –––– ARIMA –––– Wav-ANFIS –––– Wav-ARIMA –––– Kalibrasi - - - - Observasi - - - - Batas
(c) Gambar 2. Peramalan Curah Hujan Menggunakan Ensemble Terkali-brasi pada bulan Desember 2009 untuk lead 1 dengan m = 10 (a), m = 12(b), m = 15(c)
Kemampuan masing – masing training window dalam membuat prediksi terkalibrasi secara visual dapat digambarkan dengan kurva pdf pada Gambar 2., dimana kurva model ANFIS pada masing – masing training window selalu memiliki bentuk yang mendekati model kalibrasi. Hal ini dikarenakan dalam pembahasan sebelumnya, disebutkan bahwa model ANFIS merupakan model yang memiliki kontribusi besar dalam pembentukan model kalibrasi. Peramalan pada lead 1 dengan
D. Identifikasi Performa Lead Time Performa terbaik dalam meramalkan curah hujan di Stasiun Sukowono pada bulan Desember 2009 ditunjukkan oleh peramalan kalibrasi dengan lead 24 (Tabel 3). Meskipun tidak ada lead time yang dapat menangkap nilai observasi secara tepat, akan tetapi selisih antara nilai observasi (368 mm) dengan nilai taksiran deterministik (mean) yang dihasilkan lead 24 lebih kecil, dibandingkan dengan penggunaan lead time lainnya. Selain itu batas yang dihasilkan oleh lead time 24 juga lebih mendekati nilai sebenarnya. Performa masing – masing lead time dalam membentuk peramalan probabilistik secara visual ditunjukkan oleh kurva prediktif pada Gambar 4. Performa macam lead time yang digunakan dalam penelitian tidak dapat menangkap nilai observasi curah hujan pada bulan Desember 2009 secara baik. Namun pada dasarnya visualisasi ini hanya digunakan untuk menggambarkan performa dari masing – masing lead time dalam menangkap nilai observasi dan kinerja peramalan ensemble dalam membentuk distribusi peramalan terkalibrasi
5
Tabel 3. Parameter Pdf Predictive Terkalibrasi Training Window 10 Mean 208.61 198.62 197.14 191.26 210.01
Lead 1 6 12 18 24
Varian 587.30 1939.25 552.45 1347.54 1698.01
Batas 1 161.11 112.31 151.07 119.31 129.24
E.
Evaluasi dengan Metode Mean Square Error (MSE) Metode Mean Square Error merupakan metode yang paling sederhana dalam menentukan kriteria peramalan terbaik. Metode MSE dapat digunakan hanya untuk peramalan deterministik. Evaluasi menggunakan nilai MSE secara visual dapat dilihat pada Gambar 6.
Batas 2 256.11 284.93 243.20 263.21 290.78
0.025 0.03
0.02
0.015
0.01
35000
30000 0.015
25000 20000
0.01
0.005
ORI
30000
MCMC
25000
EM
MSE
0.02
MSE
Probability density
Probability density
0.025
15000
20000 15000
0.005
10000 0 0
50
100
150
200
250
300
350
0 0
400
50
100
150
Curah Hujan
200
250
300
350
400
(a)
(a)
(b)
0.03
10000
5000
Curah Hujan
5000
0 1
6
12
18
(b)
24
0 1
6
12
18
24
0.025
60000 0.025
50000
0.015
0.01
40000 0.015
MSE
Probability density
Probability density
0.02
0.02
10000 0.005
0.005
(c)
0 0
50
100
150
200
250
300
350
0 50
400
100
150
200
Curah Hujan
0.02
0.015
0.01
0.005
150
200
350
250
300
350
400
Curah Hujan
(e)
Seperti dijelaskan sebelumnya penggunaan lead time yang panjang, bertujuan untuk melihat apakah peramalan menggunakan metode BMA-MCMC cukup baik dalam membuat peramalan 24 bulan (2 tahun) kedepan. Hasil penerapan metode BMA – MCMC yang ditunjukkan Gambar 5. dapat diketahui bahwa presentase tertinggi perbandingan observasi yang masuk interval peramalan dengan yang keluar terdapat pada peramalan kalibrasi dengan lead time ke – 24. Artinya peramalan dengan menggunakan metode BMA – MCMC untuk membuat peramalan jangka waktu 2 tahun ke depan masih memberikan hasil yang baik. (b)
35%
(c)
32%
34%
65% masuk interval
66%
68%
keluar interval
(e)
(d)
23%
31%
69%
1
6
12
18
24
Gambar 6. Nilai MSE untuk training window m = 10 (a), m = 12(b), dan m = 15(c)
Gambar 4. Peramalan Curah Hujan Menggunakan Ensemble Terkalibrasi pada bulan Desember 2009 untuk m = 10 dengan lead = 1 (a), lead = 6 (b), lead = 12 (c), lead = 18 (d), lead = 24 (e).
(a)
0
400
Keterangan : –––– ANFIS –––– ARIMA –––– Wav-ANFIS –––– Wav-ARIMA –––– Kalibrasi - - - - Observasi - - - - Batas
0.03
100
300
(d)
0.025
0 50
250
Curah Hujan
(c) Probability density
30000 20000
0.01
77%
Gambar 5. Persentase Observasi yang Masuk Atau Keluar Untuk nilai m= 10 dengan lead = 1 (a), lead = 6 (b), lead = 12 (c), lead = 18 (d), dan lead = 24 (e)
Pada training window 10 (Gambar 6. (a)) dan 15 (Gambar 6. (c)) masing – masing metode memiliki nilai MSE yang hampir sama kecuali untuk metode kalibrasi dengan pendekatan EM pada lead 12 dan 24 memiliki nilai yang jauh lebih tinggi dibandingkan dengan metode ORI dan metode kalibrasi dengan pendekatan MCMC. Metode ORI merupakan model ensemble tanpa kalibrasi yang dibentuk dengan menghitung rata-rata dan variasi nilai keempat peramalan individual. Pada training window 12 gambar 6. (b) performa terbaik ditunjukkan oleh metode pendekatan MCMC dengan hampir semua nilai MSE yang dihasilkan lebih kecil dibandingkan kedua metode lainnya. Sehingga dapat disimpulkan walaupun metode MCMC adalah metode peramalan probabilistik, akan tetapi dalam membentuk peramalan deterministik metode MCMC juga dapat memberikan hasil yang baik. Kedekatan nilai MSE antara metode ORI dan metode MCMC menyatakan bahwa kedua metode ini sama baiknya dalam membentuk peramalan deterministik. F.
Evaluasi dengan Metode Continuous Ranked Probability Score (CRPS) Evaluasi peramalan probabilistik seringkali menggunakan nilai CRPS sebagai nilai acuan. Nilai CRPS yang kecil merupakan kriteria metode peramalan probabilistik yang baik. Dari gambar 7. diketahui plot nilai CRPS metode EM selalu berada dibawah metode pendekatan MCMC dan ORI. Hal ini menunjukkan metode pendekatan EM lebih baik digunakan dalam meramalkan curah hujan di Stasiun Sukowono daripada metode pendekatan MCMC dan ORI. Namun metode MCMC memiliki nilai tidak jauh berbeda dengan metode pendekatan EM. Nilai CRPS dari metode pendekatan MCMC memiliki nilai yang hampir berdampingan dengan metode EM, sehingga dapat diartikan bahwa metode MCMC
6
hampir sama baik dengan metode pendekatan EM dalam membentuk hasil peramalan probabilistik curah hujan di Stasiun Sukowono. 120
100
100
80
80
CRPS
140
120
CRPS
140
60 ORI
40
MCMC
20
EM
60 40 20
0
(a)
1
6
12
18
24
0
(b)
1
6
12
18
24
140 120
CRPS
100 80 60 40 20 0
(c)
1
6
12
18
24
Gambar 7. Plot CRPS Curah Hujan Pada Masing - Masing Kriteria
EM dalam menghasilkan peramalan probabilistik tidak berbeda jauh, sehingga dapat dikatakan bahwa dalam menghasilkan peramalan probabilistik metode BMA – MCMC memberikan hasil yang sama baiknya dengan metode BMA – EM. B. Saran Permasalahan yang dikaji dalam penelitian ini masih terbatas, sehingga untuk mengembangkan penelitian dapat dilakukan dengan melakukan kajian lebih lanjut dengan menambah jumlah data, training window dan variasi lead time. Penggunaan fungsi linier untuk koreksi bias pada penelitian ini kurang dapat menarik nilai peramalan kalibrasi mendekati nilai sebenarnya. Oleh karena itu, pendekatan koreksi bias dengan fungsi nonlinier maupun seasonal dapat diuji cobakan pada penelitian selanjutnya.
V. KESIMPULAN DAN SARAN
UCAPAN TERIMA KASIH
A. Kesimpulan Dari hasil analisis yang telah dibuat maka dapat diperoleh kesimpulan sebagai berikut. 1. Pada lead time ke-1, training window 15 dapat meng-cover observasi lebih baik daripada training window 10 dan 12. Data yang dapat ditangkap interval peramalan terkalibrasi dengan training window 10, 12 dan 15 berturut turut 65%, 62% dan 89% dari total pengamatan. Banyaknya jumlah training window yang digunakan tidak memberikan pengaruh yang sebanding, artinya makin banyak training window yang digunakan hasil peramalan belum tentu baik. 2. Persentase data yang dapat ditangkap interval peramalan pada lead time 24 dengan training window 10 sudah baik yaitu sebanyak 77% data. Begitu juga penggunaan lead berbeda yang kurang dari 24 bulan, juga memberikan hasil peramalan yang baik yaitu dapat menangkap lebih dari 60% data observasi. Artinya peramalan menggunakan metode kalibrasi BMA – MCMC dapat memberikan hasil yang baik untuk peramalan jangka pendek maupun jangka panjang. 3. Metode yang dapat memberikan nilai MSE terkecil adalah metode ensemble tanpa kalibrasi (ORI) dengan menggunakan training window, m=12 dan lead time 1. Metode ini lebih baik digunakan untuk peramalan deterministik daripada kedua metode lainnya. Namun nilai MSE dari model pendekatan BMA-MCMC juga hampir beriringan dengan nilai MSE metode ORI, sehingga dapat dikatakan bahwa dalam peramalan deterministik untuk meramalkan curah hujan di Stasiun Sukowono Kabupaten Jember penggunaan metode BMA – MCMC sama baiknya dengan metode ORI. 4. Penggunaan lead 1, training window = 15 dan metode EM dalam peramalan probabilistik dapat menghasilkan nilai CRPS yang lebih kecil dibandingkan yang lain. Namun perbedaan nilai CRPS metode peramalan BMA – MCMC dengan BMA –
Penulis mengucapkan terima kasih kepada Badan Meteorologi Klimatologi dan Geofisika (BMKG) Stasiun Meteorologi Sukowono Kabupaten Jember dan Dian Anggraeni yang telah memperbolehkan penulis menggunakan data curah hujan dan data hasil peramalan sebagai bahan analisis dalam penelitian ini. DAFTAR PUSTAKA [1] Kuswanto, H. dan Sari, M. R. 2013. Bayesian Model Averaging With Markov Chain Monte Carlo For Calibrating Temperature Forecast From Combination Of Time Series Models. Journal Of Mathematics And Statistics 9 (4) 349 – 356. [2] Raftery, A.E.2009. Probabilistic Weather Forecasting Via Bayesian Model Averaging and EMOS. National Workshop on Mesoscale Probabilistic Prediction, NCAR. [3] Anggraeni, D. 2013. Kalibrasi Peramalan Ensemble Data Curah Hujan Dengan Metode Ensemble Model Output Statistics (EMOS) dan Bayesian Model Averaging (BMA). Thesis. ITS, Surabaya. [4] Vrugt, J.A., Diks, C.G.H., dan Clark, M.P. 2008. Ensemble Bayesian Model Averaging Using Markov Chain Monte Carlo Sampling. Environmental Fluid Mechanics DOI 10.1007/s 10652 – 008 – 9106 – 3. [5] Badan Pusat Statistik. 2010. Sensus Penduduk 2010. Diakses tanggal 28 februari 2014 di alamat website sp2010.bps.go.id [6] Hoeting, J.A. Madigan, D., Raftery, A.E., dan Volinsky, C.T. 1999. Bayesian Model Averaging : A Tutorial. Statistical Science Vol. 14 No. 4, 382 – 417. [7] Raftery, A.E., Balabdaoui, F., Gneiting, T., dan Polakowski M. 2003. Using Bayesian Model Averging To Calibrate Forecast Ensembles. Monthly Weather Review 133:1155–1174. American Meteorology Society. [8] Sloughter, J.M., Gneiting T., dan Raftery A.E. 2009. Probabilistic Wind Speed Forecasting Using Ensembles and Bayesian Model Averaging. Journal of the American Statistical Association. [9] Wei, W.W.S. 2006. Time Series Univariate and Multivariate Methods. Addison Wesley Publishing Company, Inc. New York. [10] Gneiting, T., Balabdoui, F., dan Raftery, A. E. 2007. Probabilistic Forecast, Calibra-tion and Sharpness. J. R. Statist. Soc B, 69, part 2, pp. 243 – 268. [11] Badan Meteorologi, Klimatologi Dan Geofisika (BMKG). 2012. Buletin Analisis Hujan dan Indeks Kekeringan Bulan November 2012 dan Prakiraan Hujan Bulan Januari, Februari dan Maret 2013. Stasiun Klimatologi Darmaga Bogor. [12] Badan Meteorologi, Klimatologi Dan Geofisika (BMKG). 2013. Analisis Hujan April 2013 Dan Prakiraan Hujan Juni, Juli Dan Agustus 2013 Sulawesi Selatan. Stasiun Klimatologi Maros.
7