ISSN : 2407 - 6511 PREDIKSI CURAH HUJAN MENGGUNAKAN EVOLVING FUZZY Bernadus Seno Aji1, Fhira Nhita2, Adiwijaya3 1,2,3
ProdiS1 Ilmu Komputasi, Fakultas Informatika, Universitas Telkom
[email protected],
[email protected],
[email protected]
ABSTRAK Meteorologi atau ilmu yang mempelajari tentang cuaca dan faktor-faktor yang mempengaruhinya dan salah satu faktor yang dipelajari adalah curah hujan.Pada kehidupan sehari-hari, seringkali kita menemuai prediksi curah hujan diberbagai media massa. Kebutuhan akan keadaan cuaca esok hari sangat dibutuhkan untuk menyusun berbagai rencana. Untuk masa lampau, perkiraan curah hujan sangat bergantung dengan bulannya, ada musim kemarau dan musim penghujan. Namun saat ini, curah hujan semakin sulit untuk diprediksi sehingga diperlukan model atau sistem yang dapat memprediksi curah hujan dengan akurat. Pada penelitian Penelitian ini dijelaskan tentang prediksi curah hujan menggunakan Evolving Fuzzy. Algoritma Genetika akan digunakan untuk mengoptimasi fungsi keanggotaan dan rule Fuzzy. Fuzzy yang telah dioptimasi digunakan untuk memprediksi curah hujan esok hari. Parameter input yang akan digunakan merupakan data parameter cuaca. Berdasarkan hasil pelatihan Fuzzy menggunakan Algoritma Genetika didapat parameter Fuzzy yang optimal dihasilkan dari Ukuran populasi 50, probabilitas crossover 0.7, probabilitas mutasi 0.1 serta jumlah individu yang dievaluasi sebanyak 10000 dengan akurasi pelatihan 66.09% dan akurasi pengujian 63.13%. Kata kunci : prediksi, curah hujan, Evolving Fuzzy, Fuzzy, Algoritma Genetika
1.
Pendahuluan
Wilayah Indonesia berada di antara 6°LU – 11°LS dan merupakan daerah tropis dengan dua musim yakni musim kemarau dan penghujan yang bergantian setiap enam bulan sekali. Musim kemarau berlangsung antara bulan April sampai Oktober.Adapun musim penghujan berlangsung antara bulan Oktober sampai April.Tetapi tidak menutup kemungkinan terjadi anomali cuaca.Berdasarkan data harian curah hujan Badan Meteorologi, Klimatologi dan Geofisika, untuk beberapa tahun terakhir pernyataan tersebut sudah tidak sepenuhnya akurat.Hujan bisa terjadi sepanjang tahun tanpa bisa di prediksi.Jika keadaan ini terus diabaikan dampaknya dapat berakibat terhadap aktivitas manusia.Jakarta Kemayoran sebagai daerah dengan tingkat aktifitas yang tinggi, tidak mengetahui curah hujan yang terjadi membuat rencana yang tersusun sering kali menjadi gagal. Beberapa metode yang digunakan untuk predisi curah hujan adalah metode Jaringan Syaraf Tiruan (JST) [2], metode Adaptive Neuro-Fuzy Inference System (ANFIS) yaitu gabungan antara metode Fuzzy dengan Jaringan Syaraf Tiruan [1], dan metode Evolving Fuzzy berbasis Algoritma Genetika [7]. Pada Penelitian ini membahas prediksi curah hujan dengan metode Evolving Fuzzy berbasis Algoritma Genetika karena curah hujan mempunyai nilai kebenaran yang parsial sehingga Fuzzy merupakan metode yang tepat untuk digunakan, kendala dalam penggunaan Fuzzy sistem adalah tidak adanya pengetahuan pakar yang dapat digunakan untuk menentukan bentuk, batas kaki fungsi keanggotaan, ataupun rule Fuzzy. Kendala tersebut dapat ditutupi dengan menggunakan Algoritma Genetika untuk mengoptimasi parameter Fuzzy berdasarkan data yang diperoleh.Penggunaan Algoritma Genetika digunakan untuk mengoptimasi parameter Fuzzy karena Algoritma Genetika menghasilkan nilai yang baik dalam optimalisasi [5]. Dengan mengetahui curah hujan yang akan terjadi esok hari, diharapkan dapat membantu masyarakat dalam perencanaan kegiatan, sehingga membuat perencanaan berjalan maksimal. 2. Landasan Teori 2.1 Algoritma Genetika Algoritma genetika merupakan algoritma yang berdasar pada teori Darwin. Algoritma ini termasuk kedalam Evolutionary Algorithms. Skema umum Algoritma Genetika sebagai berikut:
154
ISSN : 2407 - 6511 Populasi Awal
Seleksi Individu Reproduksi: Cross-Over dan Mutasi Populasi Baru
Gambar 15 Skema Umum Algoritma Genetika 2.2 Fuzzy Sistem Sistem Fuzzy dirancang untuk menangani kasus yang mempunyai kebenaran parsial dan informasinya kurang lengkap. Sistem Fuzzy mempunyai derajat keanggotaan antara 0 sampai 1. Langkahlangkah utama dalam Fuzzy system sebagai berikut: 2.2.1 Fuzzifikasi Fuzzifikasi adalah proses perubahan suatu nilai crisp ke dalam variabel Fuzzy yang berupa variabel linguistik yang nantinya akan dikelompokkan menjadi himpunan Fuzzy. Fungsi keanggotaan dalam fuzzyfikasi antara lain sebagai berikut: Segitiga
(1)
{
Trapesium
(2) {
Phi
(3) { 2.2.2
Inferensi
Komposisi setiap aturan Fuzzy (IF-THEN RULE) yang digunakan. Apabila yang digunakan adalah operator AND, derajat keanggotaan yang diambil adalah nilai minimum (min {µ (x1), µ(x2)}), sedangkan jika operator yang digunakan adalah OR, derajat keanggotaan yang diambil adalah nilai maksimumnya (max {µ(x1), µ(x2)}). Setelah proses tersebut dilakukan, berikutnya adalah proses penggabungan aturan-aturan Fuzzy untuk mendapatkan daerah dari komposisi aturan-aturan yang digunakan. Pada Metode Mamdani, biasanya menggunakan nilai maksimum atau menggabungkan dari semua aturan yang digunakan. 2.2.3 Defuzzifikasi Defuzzifikasi adalah proses mendapakan nilai crisp dari suatu himpunan Fuzzy. Pada Metode Mamdani, untuk mendapatkan nilai tersebut digunakan Metode Centroid atau mencari bobot nilai tengah kurva daerah Fuzzy (center of gravity). 3. Gambaran Sistem Sistem ini menggunakan Algoritma Evolving Fuzzy untuk meramalkan curah hujan hari esok. Sistem peramalan yang dibangun secara umum terbagi dalam 3 tahap proses umum dalam menentukan prediksi 155
ISSN : 2407 - 6511 yaitu tahap pengolahan data, tahap pelatihan Fuzzy menggunakan Algoritma Genetika. Selanjutnya, tahap pengujian menggunakan parameter Fuzzy sistem yang terbaik yang telah dilatih oleh Algoritma Genetika menggunakan data pengujian. 3.1 Data Data yang digunakan adalah data historis dari data cuaca Kemayoran, Jakarta yang disajikan perhari dari Januari 2007 sampai Desember 2011. Jumlah data yang digunakan adalah sebanyak 1826 data. Parameter cuaca yang digunakan adalah Temperatur (TP), Kecepatan Angin (KA), Tekanan Udara (TU), Kelembaban Relatif (KR), dan Curah Hujan (CH). Berikut sampel data Jakarta Kemayoran: Tabel 9 Data Cuaca
-
TP (oC) 27.35
KA (Knots) 5
TU (Milibar) 1009.5
KR (%) 76.75
CH (mm) 6.5
27.7
8
1009.5
74.5
28.2
10
1009.1
71.5
28.35
9
1009.2
61.75
29.05 : : 27.85
6 : : 5.6
1009.4 : : 1007
64.25 : : 79.25
27.5
3.6
1006.8
80.75
29
4.6
1006.3
78.75
8
27.575
5.8
1006.6
85
16
Jakarta Kemayoran
: : 6.1
Dilakukan pembagian data untuk data pelatihan dan data pengujian dengan proporsi sebagai berikut: 1461 data, 1 Januari 2007 – 31 Desember 2010 untuk proses pelatihan 365 data, 1 Januari 2011 – 31 Desember 2011 untuk proses pengujian
Berdasarkan data cuaca Jakarta Kemayoran, dilakukan pengolahan sehingga data layak untuk digunakan dalam proses selanjutnya. Proses pengolahan data terdiri dari tahap berikut: a. Melakukan penanganan terhadap missing value Pada pengisian missing value dilakukan dengan dua cara, yaitu pengisian missing value mean dan 0. b. Melakukan normalisasi data Rentang nilai data terdapat perbedaan sehingga harus dilakukan normalisasi untuk mendapatkan rentang yang sama [0.1 - 0.9] [11]. 𝑤
(4)
3.2 Pelatihan Menggunakan Evolving Fuzzy Perancangan parameter Fuzzy untuk prediksi curah hujan di Jakarta Kemayoran menggunakan Algoritma Genetika. Algoritma Genetika digunakan untuk mengoptimasi bentuk, jumlah dan batas-batas fungsi keanggotaan yang berupa data masukan Fuzzy serta menentukan sekumpulan aturan Fuzzy yang optimal.
156
ISSN : 2407 - 6511 Inisialisasi Populasi
Populasi Generasi Baru
Dekode Kromosom
Data Pelatihan
Evaluasi Fuzzy
Elitisme Tidak
Seleksi Orang Tua
Rekomendasi
Maks Individu
Mutasi
Ya Berhenti
Gambar 16 Alur Pelatihan Sistem Fuzzy dengan Algoritma Genetika 3.3 Penggujian Sistem Pada tahap ini dilakukan pengujian berdasarkan parameter fuzzy terbaik yang dihasilkan pada tahap pelatihan dengan menggunakan data pengujian. Skema pengujian curah hujan sebagai berikut Data Pengujian
Parameter Fuzzy Optimal
Fuzzy
Hasil Peramalan
Gambar 17 Skema Pengujian Curah Hujan Jakarta Kemayoran 4. Hasil Dan Pengujian 4.1 Skenario Pengujian Berdasarkan pengisian terhadap missing value penelitian ini menggunakan 2 skenario yaitu: a. Skenario 1 adalah data missing value pada curah hujan diisi dengan mean data curah hujan bulan tersebut pada data pelatihan dan menghilangkan missing value pada data pengujian. b. Skenario 2 adalah data missing value pada curah hujan diisi dengan 0. kombinasi parameter evolusi yang digunakan yaitu Maksimal individu yang dievaluasi adalah 10000 dengan ukuran populasi tiap generasinya (50, 100, 200). Probabilitas Crossover (Pc) yang digunakan sebanyak dua nilai (0.7, 0.9), [6]. Sedangkan Probabilitas mutasi digunakan adalah dua nilai (0.1, 0.3), Semua kombinasi diuji sehingga menghasilkan parameter yang optimal menggunakan Evolving Fuzzy. Setiap kombinasi dilakukan pengujian sebanyak 2x dan hasil terbaik yang digunakan. 4.2 Hasil dan Analisis Berdasarkan Kombinasi parameter evolusi yang dilakukan dengan menggunakan algoritma Evolving Fuzzy, dengan input berupa parameter cuaca yang menghasilakan output berupa akurasi pelatihan serta parameter Fuzzy yang optimal. Berikut adalah hasil dari keseluruhan skenario: Tabel 10 Hasil Skenario 1 No
UkPop
Pc
Pm
Akurasi
157
ISSN : 2407 - 6511 1 2 3
0.9 50 0.7
4 5 6 7
0.9 100 0.7
8 9 10 11
0.9 200 0.7
12
0.1
65.76
0.3
62.56
0.1
66.09
0.3
64.22
0.1
62.29
0.3
63.34
0.1
65.17
0.3
64.21
0.1
64.76
0.3
61.53
0.1
63.91
0.3
62.42
Berdasarkan Tabel diatas hasil dari skenario 1 yaitu pengisian missing value menggunakan mean dari curah hujan mempunyai akurasi kurang lebih 65%. Akurasi tertingginya berada pada kombinasi parameter Ukuran populasi 50, Probabilitas Crossover (Pc) 0.7 dan Probabilitas mutasi (Pm) 0.1 dengan akurasi pelatihan 66.09%. Penentuan ukuran populasi, Pc, dan Pm berpengaruh terhadap akurasi yang dihasilkan Tabel 11 Hasil Skenario 2 No
UkPop
1 2 3
0.9 50 0.7
4 5 6 7
0.9 100 0.7
8 9 10 11
Pc
0.9 200 0.7
Pm
Akurasi
0.1
19.87
0.3
19.98
0.1
16.72
0.3
15.38
0.1
18.79
0.3
16.92
0.1
17.19
0.3
13.89
0.1
19.91
0.3
15.98
0.1
19.12
12 0.3 18.23 Berdasarkan Tabel 3 pengisian missing value menggunakan nilai 0, sangat berpengaruh terhadap nilai akurasi yang didapat. Pada skenario 2, nilai akurasi dibawah 20% dengan akurasi tertinggi pada kombinasi parameter evolusi Ukuran populasi 50, Probabilitas Crossover (Pc) 0.9 dan Probabilitas mutasi (Pm) 0.3 dengan akurasi pelatihan 19.98%. Dengan melihat akurasi yang dihasilkan dari skenario 2, parameter fuzzy yang dihasilkan tidak layak digunakan untuk prediksi curah hujan esok hari. Berdasarkan nilai akurasi terbaik yang hasil pelatihan Fuzzy menggunakan Algoritma Genetika, selanjutnya parameter Fuzzy tersebut digunakan dalam proses prediksi menggunakan data testing. Parameter terbaik yang digunakan adalah hasil dari skenario 1 yaitu pengisian missing value dengan mean, ukuran populasi 50, Pc 0.7 dan Pm 0.1. Parameter terbaik skenario tersebut dapat dilihat pada tabel berikut: Tabel 12Parameter terbaik Skenario 1 Jumlah Jenis Fungsi Atribut Nilai Batas Kaki Keanggotaan Linguistik a=0, b=0, c=0.914, TP Phi 2 d=0.944 158
ISSN : 2407 - 6511
TU
Phi
2
KR
Trapesium
4
KA
Trapesium
3
CH
Segitiga
4
a=0.914, b=0.944, c=1, d=1 a=0, b=0, c=0.882, d=0.928 a=0.882, b=0.928, c=1, d=1 a=0, b=0, c=0.937, d=0.967 a=0.937, b=0.967, c=0.975 d=0.983 a=0.975, b=0.983, c=0.987, d=0.987 a=0.987, b=0.987, c=1, d=1 a=0, b=0, c=0.875, d=0.880 a=0.875, b=0.880, c=0.935, d=0.955 a=0.935, b=0.955, c=1, d=1 a=0, b=0.203, c=0.212 a=0.203, b=0.212, c=0.455 a=0.212, b=0.455, c=0.474 a=0.455, b=0.474, c=1
4.3 Analisis Prediksi Curah Hujan Setelah mendapatkan parameter Fuzzy yang terbaik dari proses pelatihan, maka parameter tersebut diuji untuk melakukan prediksi data pengujian. Data pengujian diambil dari januari 2011 sampai desember 2011 dengan menghilangkan missing value. Berdasarkan Kombinasi dari parameter Fuzzy yang optimal yaitu Ukuran Populasi 50, Pc 0.7 dan Pm 0.1 berikut adalah tabel hasil contoh prediksi H+1: Tabel 13 Hasil contoh prediksi H+1 Data Prediksi Eror Aktual 12.4 10.62885 1.771149 8.36
8.510861
0.150861
13.5
10.62885
2.871149
8.36
8.683238
0.323238
119.2
55.86727
63.33273
9.7
10.62885
0.928851
10.36
9.597667
0.762333
11
10.62885
0.371149
Pada Tabel 5 terlihat bahwa data hasil prediksi mempunyai error yang besar ketika data aktual mengalami fluktuasi yang sangat besar dari rata-rata data aktualnya dengan akurasi 63.13% dan selisih error rata-rata 3.99 milimeter.
159
ISSN : 2407 - 6511 140 120 100 80 60 40 20 0
Data Aktual Prediks i
1
2
3
4
5
6
7
8
Gambar 18 Hasil contoh prediksi H+1 Berdasarkan Gambar 4terlihat hasil prediksi tidak bisa mengikuti fluktuasi dari data aktualnya. Hasil prediksi cenderung berada pada rata-rata data aktualnya. Hal ini dikarenakan data curah hujan yang diuji sangat fluktuatif sehingga sulit untuk di prediksi. Untuk melihat fluktuasi dari curah hujan, dilakukan pengujian dengan Zscore [16]. Diasumsikan terjadinya fluktuasi sama dengan data outlier. Zscore melihat jarak suatu nilai dengan rata-ratanya dalam satuan standar deviasi, sehingga semakin besar Zscorenya, semakin terjadi fluktuasi. Hasil Zscore dari data pengujian sebagai berikut : Tabel 14Hasil Zscore Data aktual
Zscore
119.2
10.66
9.7
-0.11
10.36
-0.047
11
0.015
4
-0.67
12
0.11
12.7
0.18
10.9
0.005
3.5
-0.72
30.4
3.02
Kriteria penentuan batas outlier data dipengaruhi oleh banyaknya data yaitu: -
Jika data <=80, Zscore > +-2.5 maka terjadi fluktuasi. Jika data >80, Zscore>= +-3 maka terjadi fluktuasi.
Berdasarkan batasan tersebut, diketahui data yang sangat fluktuasi terdapat 7 nilai. Untuk melihat pengaruhnya terhadap akurasinya, data yang sangat fluktuatif dihilangkan dan dicoba dilakukan prediksi terhadap data yang sudah dihilangkan nilai fluktuatifnya. Berikut adalah tabel contoh prediksi tanpa data fluktuatif. Tabel 15Contoh prediksi H+1 tanpa data Fluktuatif Data Prediksi Eror Aktual 12.4 10.62 1.77 8.36
8.51
0.15
13.5
10.62
2.87
8.36
8.68
0.32
9.7
10.62
0.92
10.36
9.59
0.76
11
10.62
0.37 160
ISSN : 2407 - 6511 4
8.28
4.28
12
8.76
3.23
Berdasarkan Tabel 7 Hasil prediksi mempunyai selisih yang cukup kecil dengan data aktual. Prediksi tanpa data fluktuatif dihasilkan akurasi sebesar 66.14% dengan eror 3.3 Milimeter. Dengan data fluktuatif sebanyak 7 data dan batas outlier +-3 Zscore, berpengaruh terhadap akurasi kurang lebih 4%. Dapat dilihat cukup berpengaruh data yang sangat fluktuatif. Setelah melihat pengaruh fluktuasi data terhadap akurasi, dilakukan prediksi curah hujan menggunakan kelas yang sudah ditetapkan oleh BMKG. Prediksi menggunakan kelas berguna untuk mempermudah penyampaian informasi curah hujan esok hari.Curah hujan esok hari menurut BMKG di klasifikasikan sebagai berikut: a. Curah Hujan ≤ 20mm, dikatagorikan hujan ringan b. 20mm < Curah Hujan ≤ 50mm, dikatagorikan hujan sedang c. 50mm < Curah Hujan ≤ 100mm, dikatagorikan hujan lebat d. Curah Hujan > 100mm, dikatagorikan hujan sangat labat Berikut Tabel prediksi kelas curah hujan esok hari.
Tabel 16Prediksi Kelas Curah Hujan H+1 Kelas Prediksi Aktual 1 1 1
1
1
1
2
1
2
2
1
1
1
1
Dengan melihat Tabel 8 dapat diketahui beberapa kelas sudah dikelompokan dengan baik, tetap ada kelas yang salah pengelompokannya. Berdasarkan prediksi menggunakan kelas terhadap data pengujian, didapatkan hasil akurasi sebesar 94.85%. Akurasi menggunakan kelas jauh lebih tinggi dibandingkan akurasi tanpa menggunakan kelas 5. Kesimpulan dan Saran 5.1 Kesimpulan Berdasarkan analisis terhadap hasil pengujian yang telah dilakukan, penelitian penelitian ini memiliki beberapa kesimpulan, yakni: a. Berdasarkan pelatihan parameter Fuzzy menggunakan Algoritma Genetika pada data curah hujan Jakarta Kemayoran untuk memprediksi curah hujan esok hari menghasilkan parameter terbaik pada Ukuran Populasi 50, Probabilitas Crossover (Pc) 0.7 dan Probabilitas mutasi (Pm) 0.1, Jumlah individu yang dievaluasi 10000 dengan akurasi pelatihan 66.09% dan akurasi pengujian 63.13% dengan akurasi menggunakan kelas sebesar 94.85%. b. Pengisian Missing value sangat berpengaruh terhadap akurasi yang diperoleh. Pengisian missing value dengan mean mempunyai akurasi yang lebih tinggi di banding pengisian missing value 0. 5.2 Saran a. Untuk pelatihan jumlah individu yang dievaluasi lebih banyak sehingga parameter Fuzzy yang optimal lebih berpeluang di dapatkan. b. Inputan parameter cuaca dapat dianalisa sehingga didapat inputan yang terbaik.
161
ISSN : 2407 - 6511
Daftar Pustaka [1] Abbas, Gholam, dkk, 2012. “Spring rainfall prediction based on remote linkage controlling using adaptive neuro-Fuzzy inference system (ANFIS)”. [2]
Adiwijaya, U.N. Wisesty, F. Nhita, Some Line Search Tech-niques on the Modified Backpropa-gation for Forecasting of Weather Data in Indonesia, Far East Journal of Mathematical Sciences 86:2 (2014), pp. 391 -396
[3] Adiwijaya, T.A.B. Wirayuda, U.N. Wisesty, Z.K.A. Baizal, U. Haryoko, An improvement of Backpropagation Performance by Using Conjugate Gradient on Forecasting of Air Temperature and Humidity in Indonesia, the Far East Journal of Mathematical Sciences , Special Volume 2013 no.1, pp. 57-67 [4] Lee,Sunyoung, dkk, 1998. “Rainfall Prediction Using Artificial Neural Networks” oleh Journal of Geographic Information and Decision Analysis, vol. 2, no. 2, pp. 233 - 242, 1998 [5]
Navianti, Dynes R, dkk, Penerapan “Fuzzy Inference System pada Prediksi Curah Hujan di Surabaya Utara” oleh JURNAL SAINS DAN SENI ITS Vol. 1, No. 1, (Sept. 2012) ISSN: 2301-928X
[6]
Suyanto, 2005. Algoritma Genetika dalam MATLAB.Yogyakarta: ANDI.
[7]
Suyanto, 2007. Artificial Intelligence, Searching, Reasoning, Planning, and Learning.Bandung: Informatika.
[8]
Suyanto, 2008. Soft Computing, Membangun Mesin Ber-IQ Tinggi.Bandung: Informatika.
[9]
Tongwan, teerawat, dkk, 2011. “An Estimation of Rainfall using Fuzzy Set-Genetic Algorithms Model” of American J. of Engineering and Applied Sciences 4 (1): 77-81, 2011
[10] Hyndman, rob, dkk, 2005. “Another Look at Measures of Forecast Accuracy” of Monash University [11] Naba, Agus, 2009. Belajar Cepat Fuzzy Logic menggunakan Matlab. Yogyakarta: Andi [12] Indrabayu, dkk, 2012. “Prediksi Curah Hujan dengan Fuzzy Logic” Universitas Hasanudin. 13]
Nhita, F., Adiwijaya, A rainfall forecasting using fuzzy system based on genetic algorithm, International Conference of Information and Communication Technology (ICoICT), 2013 pp. 111 – 115
[14] Wilson, Tom, 2012.” Forecast Accuracy and Uncertainty of Australian Bureau of Statistics State and Territory Population Projections”. International Jurnal of Population Research [15] Gede. Personal Interview.Missing Value curah hujan. Juli 2014 [16] Yuliana, dkk,2013. “Penentuan parameter fisis curah hujan dikota Pekanbaru”. FMIPA Universitas Riau [17] World Meteorological Organization, 2008. “Guide to Meteorological Instruments and Methods of Observation”
[18] Wijayanto, Antonius, 2007.” Analisis Faktor-Faktor Yang Mempengaruhi Komitmen Pelanggan Melalui Peran Tenaga Penjual”. Thesis. Universitas Diponegoro. [19] G Instrument, 2010. “Understanding Error and Accuracy”. [20] S. Nurcahyo, F. Nhita, Adiwijaya, Rainfall Prediction in Kemayoran Jakarta Using Hybrid Genetic Algorithm (GA) and Partially Connected Feedforward Neural Network (PCFNN), 2nd International Conference on Information and Communication Technology (ICoICT) 2014
162