Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 2, No. 3, Maret 2018, hlm. 930-939
e-ISSN: 2548-964X http://j-ptiik.ub.ac.id
Peramalan Curah Hujan Menggunakan Metode High Order Fuzzy Time Series Multi Factors Ahmada Bastomi Wijaya1, Candra Dewi2, Bayu Rahayudi3 Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email:
[email protected],
[email protected],
[email protected] Abstrak Kabupaten Malang merupakan salah satu kabupaten di Jawa Timur yang memiliki tingkat produksi pertanian yang cukup tinggi dimana hampir disetiap kecamatanya memiliki lahan pertanian. Permasalahannya adalah pada saat curah hujan yang tinggi tidak sedikit petani yang mengalami gagal panen. Curah hujan adalah salah satu dari beberapa faktor yang mempengaruhi perubahan iklim sehingga sangat menentukan hasil panen yang diperoleh. Permasalahan gagal panen ini dapat diatasi dengan melakukan peramalan curah hujan, dengan adanya peramalan curah hujan petani dapat menentukan waktu pola tanam yang sesuai sehingga dapat mengantisipasi terjadinya gagal panen. Pada penelitian ini peramalan curah hujan dalam dasarian berdasarkan beberapa faktor yaitu suhu, kelembaban, dan kecepatan angin. Metode yang digunakan untuk peramalan curah hujan dasarian adalah High Order Fuzzy Time Series Multi factors. Pada metode ini pembentukan subinterval dilakukan dengan menggunakan fuzzy C-means. Dalam menghitung kesalahan hasil peramalan menggunakan Mean Square Error (MSE). Berdasarkan hasil pengujian yang dilakukan semakin kecil threshold serta semakin besar data training dan order maka nilai kesalahan yang diperoleh semakin rendah. Hasil peramalan curah hujan dasarian untuk peramalan satu tahun kedepan menggunakan metode ini mendapatkan hasil MSE terbaik sebesar 539,698. Kata kunci: curah hujan, fuzzy C-means, fuzzy time series, peramalan. Abstract Malang Regency is one of the regencies in East Java which has a high level of agricultural production in almost every district has agricultural land. The problem is when high rainfall is not a few farmers who experienced crop failure. Rainfall is one of several factors that affect climate change so it is very important to determine the yields obtained. The problem of this harvest failure can be overcome by forecasting rainfall, with rainfall forecasting farmers can determine the time of the appropriate cropping patterns so as to anticipate the occurrence of crop failure. On the research of forecasting rainfall in dasarian based on several factors namely temperature, humidity, and wind speed. The methods used for forecasting rainfall dasarian is a High-Order Fuzzy Time Series Multi factors. In this method the formation of subinterval using fuzzy C-means. In calculating the error of forecasting result using Mean Square Error (MSE). Based on the results of tests conducted the smaller threshold and the greater data training as well order the value error is obtained increasingly low. The result of forecasting dasarian rainfall for forecasting one year ahead using this method get the best MSE result of 539,698. Keywords: rain fall, fuzzy C-means, fuzzy time series, forecasting. memiliki lahan pertanian (BPS Jatim, 2015). Permasalahan yang terjadi pada sektor pertanian yaitu terjadinya gagal panen apabila memasuki musim penghujan dengan curah hujan yang tinggi yaitu diatas 200 mm per bulan serta apabila memasuki musim kemarau dengan curah hujan yang rendah yaitu dibawah 100 mm per bulan (BMKG Staklim Karangploso Malang, 2015). Dalam mengatasi hal tersebut upaya yang
1. PENDAHULUAN Kabupaten Malang merupakan salah satu kabupaten di Jawa Timur yang terkenal akan potensi alam yang dimiliki. Dalam hal ini, terkenal akan potensi alamnya karena kabupaten Malang memiliki tingkat produksi di sektor pertanian yang cukup tinggi, dimana hampir seluruh kecamatan di kabupaten Malang Fakultas Ilmu Komputer Universitas Brawijaya
930
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
dilakukan petani selama ini hanya melakukan tindakan seperti melakukan panen secara dini. Upaya ini dianggap petani cukup efektif dalam mengurangi besarnya kerugian gagal panen, akan tetapi sebaiknya yang dilakukan adalah melakukan suatu tindakan agar kerugian yang dialami petani tidak terjadi lagi. Salah satu contoh tindakan yang dapat dilakukan adalah membuat Kalender Tanam (KATAM). KATAM dapat digunakan petani sebagai alat bantu atau pedoman dalam menentukan awal musim tanam terbaik, seperti yang telah dilakukan oleh Badan Penelitian dan Pengembangan (Balitbang) Pertanian Kementerian Pertanian. Dalam pembuatan KATAM, Balitbang menggunakan data peramalan curah hujan dari Badan Meteorologi Klimatologi dan Geofisika (BMKG). Akan tetapi BMKG mengakui bahwa prakiraan cuacanya saat ini memang masih kurang akurat dan masih kalah dengan prakiraan cuaca di Amerika Serikat (Yunanto, 2014). Pentingnya akan prakiraan cuaca terbukti adanya beberapa penelitian sebelumnya yaitu penelitian mengenai prakiraan cuaca dengan input faktor yang mempengaruhi cuaca yang berupa data time series menggunakan metode Adaptive Neuro Fuzzy Inference System (ANFIS) (Dewi, 2014), dan penelitian mengenai prediksi cuaca menggunakan metode Backpropagation Neural Network yang terbukti memiliki nilai akurasi yang baik dalam prediksi cuaca (Dewi, 2013). Teknik atau metode peramalan curah hujan yang sering digunakan BMKG adalah metode Autoregressive Integrated Moving Average (ARIMA), ANFIS, dan Wavelet (Kurniawan, 2007). Namun dalam penerapannya gabungan dari ketiga metode tersebut masih kurang memuaskan yaitu tingkat akurasinya hanya mencapai 60% - 70%. Menurut BMKG kurangnya tingkat akurasinya ini disebabkan oleh keadaan pola atmosfer di Indonesia yang selalu berubah – ubah dan kurang menentu. Selain metode yang digunakan oleh BMKG, adapun penelitian sebelumnya yang meramalkan curah hujan yaitu penelitian menggunakan metode Fuzzy Time Series Chen dengan studi kasus curah hujan di Samarinda, dalam penelitian ini menggunakan data time series curah hujan bulanan dengan kesimpulan pengunaan data yang sedikit memiliki tingkat akurasi lebih tinggi dibandingkan menggunakan data yang banyak yaitu menghasilkan nilai RMSE terkecil 73,68 dan MAE terkecil 53,9. (Fauziah, et al., 2016). Fakultas Ilmu Komputer, Universitas Brawijaya
931
Selain peramalan yang hanya menggunakan data time series dari data yang akan diramalkan juga terdapat penelitian sebelumnya yang menggunakan faktor faktor yang mempengaruhi dari data yang akan diramalkan. Salah satunya yaitu penelitian dengan menggunakan metode Clusterwise Linear Regression (CLR). Penelitian ini menggunakan data bulanan pada delapan stasiun cuaca di kota Victoria, Australia. Peramalan curah hujan pada penelitian ini menggunakan faktor yang mempengaruhi yaitu suhu maksimum, suhu minimum, penguapan, tekanan uap, dan radiasi matahari. Hasil penelitian ini terbukti dapat melakukan peramalan curah hujan dengan hasil yang cukup baik yaitu dengan nilai RMSE terkecil 19,7 dan MAE terkecil 12,9 (Bagirov, et al., 2017). Metode yang digunakan pada penelitian ini adalah metode High Order Fuzzy Time Series Multi Factors. Terdapat empat inputan yang juga dijadikan sebagai variabel dalam penelitian ini yaitu curah hujan, suhu udara, kelembaban udara, dan kecepatan angin. Pembentukan subinterval yang berfungsi dalam pendefinisian fuzzy set dilakukan dengan menggunakan klasterisasi fuzzy C-means. Pada penelitian ini dalam melakukan perhitungan nilai error untuk mendapatkan hasil evaluasi menggunakan metode Mean Square Error (MSE). 2. DATA YANG DIGUNAKAN Data yang digunakan pada penelitian ini adalah data curah hujan beserta faktor yang mempengaruhinya yaitu suhu, kelembaban, dan kecepatan angin. Data ini diambil dari BMKG kelas III Karangkates, Kabupaten Malang. Data yang digunakan dalam bentuk dasarian yaitu dari tahun 2011 sampai 2016. Dasarian adalah dalam rentang waktu sepuluh hari, sehingga dalam satu bulan dibagi menjadi tiga dasarian.
Dasarian pertama yaitu pada tanggal 1 sampai dengan 10, Dasarian kedua yaitu pada tanggal 11 sampai dengan 20, Dasarian ketiga yaitu pada tanggal 21 sampai dengan akhir bulan.
Pada penelitian ini data curah hujan dalam satuan milimeter (mm), kelembaban dalam persen (%), suhu udara dalam satuan celsius (˚C), dan kecepatan angin dalam satuan kilometer per jam (km/jam).
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
932
3. METODE Mulai
3.1. Fuzzy C-means Fuzzy C-means (FCM) pertama kali diperkenalkan oleh Dunn dan dikembangkan oleh Bezdek yang banyak digunakan dalam pengenalan pola. Metode ini merupakan pengembangan dari metode non-hierarkhi KMeans Cluster, selanjutnya dilakukan iterasi sampai mendapatkan keanggotaan kelompok tersebut (Klawon, 2001). Fuzzy C-means (FCM) merupakan salah satu algoritma fuzzy clustering, dan juga teknik klasterisasi dimana tiap data ditentukan oleh derajat keanggotaanya. Tujuan penggunaan algoritma FCM yaitu untuk menemukan pusat cluster atau centroid dengan meminimumkan fungsi objektif.
Data dasarian curah hujan, suhu, kelembaban, kecepatan angin
Universe_of_Discourse
Jumlah_Cluster
Perhitungan pusat cluster
3.2. Fuzzy Time Series Pembentukan subinterval dan Fuzzy Set
Pada tahun 1996, Chen memperkenalkan metode peramalan dengan menggunakan metode Fuzzy Time Series. Metode Fuzzy Time Series memiliki perbedaan dengan metode peramalan time series biasa atau konvensional yaitu terdapat pada data yang digunakan untuk peramalan. Pada metode Fuzzy Time Series data yang digunakan adalah berupa fuzzy set atau himpunan fuzzy dari bilangan – bilangan real atas himpunan semesta yang ditentukan. Jadi Fuzzy Time Series merupakan metode dengan menggunakan data berupa fuzzy set yang berasal dari bilangan real atas Universe of Discorse pada data aktual. Universe of Discourse adalah himpunan semesta dari data penelitian (Chen, 1996).
Fuzzifikasi
Pembentukan Fuzzy Logical Relationship
Defuzzifikasi
Nilai hasil peramalan
Berhenti
3.3. High Order Fuzzy Time Series Multi Factors Metode High Order Fuzzy Time Series Multi Factors adalah metode Fuzzy Time Series (FTS) yang melibatkan beberapa faktor yang mempengaruhi peramalan dengan berdasarkan beberapa periode waktu sebelum periode yang akan diramalkan dalam proses pembentukkan Fuzzy Logical Relationship (FLR). Pada metode ini pembentukkan subinterval yang berfungsi dalam pendefinisian fuzzy set dilakukan dengan menggunakan teknik klasterisasi fuzzy Cmeans. Diagram alir dari siklus penyelesaian masalah menggunakan metode High Order Fuzzy Time Series Multi Factors ditunjukkan dalam Gambar 1. Fakultas Ilmu Komputer, Universitas Brawijaya
Gambar 1. Diagram alir High Order Fuzzy Time Series Multi Factors
Berikut adalah langkah – langkah Metode High Order Fuzzy Time Series Multi Factors Berdasarkan dari Gambar 1 (Lin,Yang, 2009). Langkah 1: melakukan perhitungan Universe of Discourse (U). Sebelum menghitung nilai U, terlebih dulu menghitung nilai mean (rata – rata) pada data sampel ditunjukkan pada Persamaan (1) lalu menghitung nilai standar deviasi (𝜎) ditunjukkan pada Persamaan (2) dan perhitungan U ditunjukkan pada Persamaan (3). 𝑥̅ =
∑𝑛 𝑖=1 𝑥𝑖 𝑛
(1)
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Dimana 𝑥̅ adalah mean (rata – rata), 𝑥𝑖 adalah nilai data ke-i, 𝑛 adalah banyak data. 𝜎=√
2 ∑𝑛 𝑖=1(𝑥𝑖−𝑥̅ )
(2)
𝑛−1
Dimana 𝜎 adalah standar deviasi data. 𝑈 = [𝐷𝑚𝑖𝑛 − 𝜎, 𝐷𝑚𝑎𝑥 + 𝜎]
(3)
Dimana 𝑈 adalah Universal 0f Discourse, 𝐷𝑚𝑖𝑛 adalah nilai minimum dari data sampel, 𝐷𝑚𝑎𝑥 adalah nilai maksimum dari data sampel. Langkah 2: menentukan jumlah cluster data. Proses klasterisasi bertujuan untuk membagi U kedalam beberapa subinterval. Hasil perhitungan banyaknya cluster apabila bernilai pecahan maka harus dibulatkan menjadi bilangan bulat. Perhitungan banyaknya cluster ditunjukkan pada Persamaan (4). 𝑘 = ||𝐷𝑚𝑖𝑛 − 𝐷𝑚𝑎𝑥 |/
∑𝑛 𝑡=1|𝑋(𝑡)−𝑋(𝑡−1)| 𝑛−1
|
(4)
Dimana 𝑘 adalah jumlah cluster, 𝐷𝑚𝑖𝑛 adalah nilai minimum dari data sampel, 𝐷𝑚𝑎𝑥 adalah nilai maksimum dari data sampel, 𝑛 adalah banyaknya data sampel, 𝑋(𝑡) = data pada waktu ke-t. Langkah 3: melakukan perhitungan pusat cluster. Pada metode ini proses klasterisasi data menggunakan fuzzy C-means (FCM) untuk mendapatkan pusat cluster sebanyak k. Berikut adalah langkah untuk mendapatkan pusat cluster: 1) menentukan jumlah cluster (c ≥ 2), pembobot (∞ > 𝑤 > 1), maksimum iterasi (maxIter), error minimum yang diharapkan yaitu nilai positif yang sangat kecil (𝜉), fungsi objektif awal (P0 = 0), iterasi awal dideklarasikan 1. 2) memasukkan data X yang akan diklasterisasi berupa matriks berukuran m x n (m = jumlah sampel data, n = attribut setiap data). Contoh : Xij = data sampel kei (i = 1,2,3,4,...,m), attribu ke-j (j=1,2,3,4,..,n). 3) membuat bilangan random µik; i = 1,2,3,4,..,n dan k = 1,2,3,...,c (n = jumlah sampel pada data, c = jumlah cluster yang Fakultas Ilmu Komputer, Universitas Brawijaya
933 akan dibentuk) sebagai elemen – elemen matriks partisi awal. Untuk bilangan penyusun matriks partisi awal dihitung jumlahnya setiap kolom. Selanjutnya untuk menghitung derajat keanggotaan awal dengan melakukan normalisasi pada matiks partisi, pada normalisasi dilakukan dengan membagi bilangan random pada baris i, kolom k dengan jumlah bilangan pada kolom k.
4) melakukan perhitungan cluster ke-k: Vkj, dengan k = 1,2,3,4,..,c dan j = 1,2,3,4,...,m. Perhitungan pusat cluster ditunjukkan pada Persamaan (5). 𝑉𝑘𝑗 =
𝑤 ∑𝑛 𝑖=1((𝜇𝑖𝑘) × 𝑋𝑖𝑗 )
(5)
𝑤 ∑𝑛 𝑖=1(𝜇𝑖𝑘)
Dimana 𝑉𝑘𝑗 adalah pusat cluster pada cluster ke-k dan atribut ke-j, 𝜇𝑖𝑘 adalah derajat keanggotaan pada data ke-i, cluster ke-k, 𝑋𝑖𝑗 adalah data sampel pada data kei, attribut ke-j, w adalah pembobot. 5) melakukan perhitungan fungsi objektif pada iterasi ke-t: P1. Perhitungan fungsi objektif ditunjukkan pada Persamaan (6). 2
𝑤 𝑃𝑡 = ∑𝑛𝑖=1 ∑𝑐𝑘=1([∑𝑚 𝑗=1(𝑋𝑖𝑗 − 𝑉𝑘𝑗 ) ](𝜇𝑖𝑘 ) )
(6) Dimana 𝑃𝑡 adalah fungsi objektif, 𝑋𝑖𝑗 adalah data sampel ke-i, atribut ke-j, 𝑉𝑘𝑗 adalah pusat cluster pada cluster ke-k dan atribut ke-j. 6) melakukan perhitungan perbaikan matriks partisi yang telah ditunjukkan Persamaan (7). −1
𝜇𝑖𝑘 =
2 𝑤−1 [∑𝑚 𝑗=1(𝑋𝑖𝑗 −𝑉𝑘𝑗 ) ] 2
−1
(7)
𝑤−1 ∑𝑐𝑘−1[∑𝑚 𝑗=1(𝑋𝑖𝑗 −𝑉𝑘𝑗 ) ]
Dimana 𝑋𝑖𝑗 adalah data sampel ke-i, atribut ke-j, 𝑉𝑘𝑗 adalah pusat cluster pada cluster ke-k dan atribut ke-j, 𝑤 adalah pembobot. 7) melakukan pemerikasaan kondisi berhenti dengan kondisi sebagai berikut: a. Jika (|𝑃𝑡 − 𝑃𝑡−1 | < 𝜉) atau ( t > MaxIter) maka berhenti,
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
b. Jika tidak memenuhi: t = t +1, ulangi mulai dari langkah ke-4. Langkah 4: Tahapannya, U dibagi kedalam k subinterval: (𝐷𝑚𝑖𝑛 , 𝑑1 ), (𝑑1 , 𝑑2 ), (𝑑2 , 𝑑3 ), … , (𝑑𝑘−1 , 𝐷𝑚𝑎𝑥 ) , dimana di (i = 1,2,3..,k-1) merupakan titik tengah antara dua pusat cluster. k subinterval didefinisikan sebagai 𝑢1 , 𝑢2 , 𝑢3, … , 𝑢𝑘 . Melakukan pembentukan himpunan fuzzy atau fuzzy set. Pada langkah ini fuzzy set direpresentasikan dengan kurva bahu. Pembentukkan fuzy set ditunjukkan pada Persamaan (8). 𝐴1 = 𝐴2 =
𝑓11 𝑢1 𝑓21 𝑢1
+ +
𝑓12 𝑢2 𝑓22 𝑢2
+ +
𝑓13 𝑢3 𝑓23
+ ⋯+
𝑢3
+ ⋯+
𝑓1𝑘 𝑢𝑘 𝑓2𝑘
(8)
𝑢𝑘
… = ⋯+⋯+⋯+ ⋯+ ⋯ 𝑓 𝑓 𝑓 𝑓 𝐴𝑘 = 𝑢𝑘1 + 𝑢𝑘2 + 𝑢𝑘3 + ⋯ + 𝑢𝑘𝑘 1
2
3
𝑘
Langkah 5: Proses fuzzifikasi bertujuan untuk mengubah data sampel yang masih berupa bilangan crisp sehingga menjadi bilangan fuzzy. Masing – masing data dihitung derajat keanggotaannya terhadap fuzzy set yang sudah terbentuk, selajutnya derajat kanggotaan dihitung berdasarkan kurva bahu dan derajat keanggotaan tertinggi menunjukkan hasil fuzzifikasi data tersebut. Contohnya {A(t)}, {B(t)}, {C(t)}, dan {D(t)} dimana t= 1,2,3,..,n merupakan time series dari faktor yang mempengaruhi serta n merupakan banyaknya data. Berdasarkan pembagian subinterval masing – masing, time series ini difuzzifikasikan. Misalkan hasil dari Persamaan (8) yaitu menghitung banyak cluster dari k1, k2, k3, k4. Jadi time series difuzzifikasikan menjadi empat fuzzy time series yaitu: {A(t,i)}, dimana i = 1,2,3,4,..,k1, {B(t,j)}, dimana j = 1,2,3,4,..,k2, {C(t,p)}, dimana p = 1,2,3,4,..,k3, {D(t,q)}, dimana q = 1,2,3,4,..,k4, t = 1,2,3,...,n. Langkah 6: melakukan pembentukkan Fuzzy Logical relationship (FLR). Data sampe sebanyak n periode dipilih sebagai data training untuk membentuk fuzzy time series model. Misalkan t merupakan periode waktu yang akan diramal dengan menggunakan order – 3, maka tiga periode sebelum periode t adalah Fakultas Ilmu Komputer, Universitas Brawijaya
934
t-3, t-2, dan t-1 dimana t = 4,5,6,...,n. Maka FLR yang dihasilkan ditunjukkan pada Persamaan (9) dan berdasarkan persamaan tersebut maka akan membentuk sebuah kumpulan FLR dari data training seperti yang ditunjukkan pada Tabel 1. (𝐴(𝑡−3,𝑖3 ) , 𝐵(𝑡−3,𝑗3) , 𝐶(𝑡−3,𝑝3) , 𝐷(𝑡−3,𝑞3) ), (𝐴(𝑡−2,𝑖2 ) , 𝐵(𝑡−2,𝑗2) , 𝐶(𝑡−2,𝑝2) , 𝐷(𝑡−2,𝑞2) ), (𝐴(𝑡−1,𝑖1 ) , 𝐵(𝑡−1,𝑗1) , 𝐶(𝑡−1,𝑝1) , 𝐷(𝑡−1,𝑞1) )→𝐴(𝑡,𝑖4 ) (9) Tabel 1. Fuzzy Logic Relationship (𝐴(𝑡−3,𝑖3 ) , 𝐵(𝑡−3,𝑗3 ) , 𝐶(𝑡−3,𝑝3) , 𝐷(𝑡−3,𝑞3 ) ), (𝐴(𝑡−2,𝑖2 ) , 𝐵(𝑡−2,𝑗2 ) , 𝐶(𝑡−2,𝑝2) , 𝐷(𝑡−2,𝑞2 ) ), (𝐴(𝑡−1,𝑖1 ) , 𝐵(𝑡−1,𝑗1 ) , 𝐶(𝑡−1,𝑝1) , 𝐷(𝑡−1,𝑞1 ) ) → 𝐴(𝑡,𝑖4) (𝐴(𝑡−2,𝑖3 ) , 𝐵(𝑡−2,𝑗3 ) , 𝐶(𝑡−2,𝑝3) , 𝐷(𝑡−2,𝑞3 ) ), (𝐴(𝑡−1,𝑖2 ) , 𝐵(𝑡−1,𝑗2 ) , 𝐶(𝑡−1,𝑝2) , 𝐷(𝑡−2,𝑞2 ) ), (𝐴(𝑡,𝑖1 ) , 𝐵(𝑡,𝑗1) , 𝐶(𝑡,𝑝1 ) , 𝐷(𝑡,𝑞1) ) → 𝐴(𝑡+1,𝑖4) ⁞ ⁞ ⁞ (𝐴(𝑡+𝑛−7,𝑖3 ) , 𝐵(𝑡+𝑛−7,𝑗3) , 𝐶(𝑡+𝑛−7,𝑝3) , 𝐷(𝑡+𝑛−7,𝑞3) ), (𝐴(𝑡+𝑛−6,𝑖2 ) , 𝐵(𝑡+𝑛−6,𝑗2) , 𝐶(𝑡+𝑛−6,𝑝2) , 𝐷(𝑡+𝑛−6,𝑞2) ), (𝐴(𝑡+𝑛−5,𝑖1 ) , 𝐵(𝑡+𝑛−5,𝑗1) , 𝐶(𝑡+𝑛−5,𝑝1) , 𝐷(𝑡+𝑛−5,𝑞1) ) → 𝐴(𝑡+𝑛−4,𝑖4 ) Langkah 7: Berdasarkan langkah sebelumnya
maka dapat diambil hasil fuzzy ke- H yaitu yang digunakan sebagai data testing atau data uji seperti yang ditunjukkan pada Persamaan (10). (𝐴(𝐻−3,𝑖3 ) , 𝐵(𝐻−3,𝑗3 ) , 𝐶(𝐻−3,𝑝3 ) , 𝐷(𝐻−3,𝑞3 ) ), (𝐴(𝐻−2,𝑖2 ) , 𝐵(𝐻−2,𝑗2 ) , 𝐶(𝐻−2,𝑝2 ) , 𝐷(𝐻−2,𝑞2 ) ), (𝐴(𝐻−1,𝑖1 ) , 𝐵(𝐻−1,𝑗1 ) , 𝐶(𝐻−1,𝑝1 ) , 𝐷(𝐻−1,𝑞1 ) ) → 𝐴(𝐻,𝑖4)
(10) Faktor – faktor di ruas kiri pada Persaman (10) dibandingkan satu per satu dengan FLR data training yang sudah dicatat sebelumnya pada Tabel 1, membandingkannya yaitu dengan cara menghitung nilai absolut dari selisih antara pangkat bawah kedua faktor pada posisi yang sama di FLR. Terdapat 12 fuzzy set di ruas kiri pada masing – masing FLR sehingga dari hasil perbandingan diperoleh 12 nilai absolut yang kemudian dijumlahkan untuk mendapat total selisihnya. Jadi jika total selisih lebih kecil dari threshold yang ditentukan, maka FLR tersebut dinyatakan cocok. Threshold merupakan hasil kali order dan jumlah faktor lalu dijumlahkan dengan konstanta, dimana konstanta adalah bilangan bulat. Selanjutnya jika FLR menemukan N pasangan yang cocok pada Tabel 1, maka N
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
faktor di ruas kanan dari N FLR ini mendasari peramalan fuzzy set A(*,*) yang mana jumlah dari setiap fuzzy set pada umumnya berbeda. Untuk peramalan dengan fuzzy set ditunjukkan pada Tabel 2. Tabel 2. Peramalan Fuzzy Set Ruas Kanan Pusat cluster Frekuensi
A(*,1)
A(*,2)
A(*,3)
....
A(*,k1)
c1
c2
c3
....
ck1
f1
f2
f3
....
fk1
Berdasarkan Tabel 2 dengan menggunakan metode centroid untuk melakukan proses defuzzifikasi. Proses defuzzifikasi dapat ditunjukkan pada Persamaan (11). 𝑘
𝑟𝐻 =
1 𝑐 ×𝑓 ∑𝑖=1 𝑖 𝑖
(11)
𝑘
𝑖 𝑓 ∑𝑖=1 𝑖
Dimana 𝑟𝐻 adalah hasil (result) peramalan data ke-H, 𝑐𝑖 adalah pusat cluster i dimana A(*,i) adalah ruas kanan dari FLR hasil proses pencocokan, 𝑓𝑖 adalah frekuensi / banyaknya muncul A(*,i) pada saat proses pencocokan. Pada penelitian ini perhitungan keakuratan peramalan menggunakan metode Mean Square Error (MSE). Pada penentuan nilai evaluasi memilih menggunakan metode MSE karena metode ini dapat menunjukan hasil skala kemiripan antara hasil data peramalan dengan data aktual. Berikut merupakan metode Mean Square Error (MSE) yang ditunjukan pada Persamaan (12) (Wang, Chen, 2009). 𝑀𝑆𝐸 =
2 ∑𝑛 𝑖=1(𝐹𝑡−𝐴𝑡 )
𝑛
935
selanjutnya nilai MSE yang diperoleh dihitung rata – ratanya. 4.1. Pengujian pengaruh order terhadap nilai MSE Pada pengujian ini dilakukan untuk mengetahui pengaruh order terhadap nilai MSE. Order merupakan urutan jumlah dari data time series pada periode waktu t yang mempengaruhi nilai data. Jadi jika nilai order adalah 3 maka peramalan akan melibatkan 3 data sebelumnya pada proses pembentukan Fuzzy Logical Relationship (FLR). Pada pengujian ini hanya nilai order yang diubah – ubah sedangkan variabel lain akan dibuat tetap. Pengujian akan dilakukan sebanyak sepuluh kali. Pada pengujian ini nilai variabel jumlah data training adalah 72 yaitu dari data Januari 2014 dasarian 1 sampai Desember 2015 dasarian 3, nilai data testing adalah 36 yaitu dasarian 1 Januari 2016 sampai dasarian 3 Desember 2016, nilai konstanta adalah 10. Nilai threshold diperoleh dari perhitungan jumlah faktor dikali order dan dijumlah nilai konstanta. Berikut adalah hasil pengujian pengaruh order terhadap nilai MSE yang ditunjukkan pada Gambar 2.
Gambar 2. Grafik hasil pengujian order terhadap nilai MSE
(12)
Dimana 𝑀𝑆𝐸 adalah nilai Mean Square Error Rate, 𝐴𝑡 adalah nilai aktual pada data ke-t, 𝐹𝑡 adalah nilai hasil peramalan untuk data ke-t, n adalah banyaknya data. 4. HASIL DAN PEMBAHASAN Pada penelitian ini dilakukan empat pengujian yaitu pengujian terhadap nilai order, nilai threshold, pengujian terhadap jumlah data training untuk mengetahui pengaruhnya terhadap nilai Mean Square Error (MSE), dan pengujian validasi sistem untuk mengetahui kestabilan hasil implementasi. Pengujian pada penelitian ini pada setiap pengujian dilakukan percobaan sebanyak sepuluh kali dan Fakultas Ilmu Komputer, Universitas Brawijaya
Berdasarkan Gambar 2, order yang berbeda - beda mempengaruhi besar nilai MSE. Dalam penelitian ini menentukan order memiliki ketentuan yaitu nilai order harus lebih dari 0 dan batas maksimal order adalah setengah dari nilai data training (Lin,Yang, 2009). Nilai MSE terbesar yang ditunjukkan pada pengujian ini adalah 965,547 pada pengujian order 6 dan nilai MSE terkecil adalah 541,8393 pada pengujian order 30. Pada Gambar 6.1 menunjukkan bahwa pada order 3 ke order 6 mengalami peningkatan nilai MSE selanjutnya pada order 6 hingga order 30 mengalami penurunan. Pada order 3 memiliki nilai MSE lebih kecil dari order 6, order 9, dan
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
order 12 karena memiliki lebih banyak hasil selisih tingkat kecocokan data time series yang tidak terlalu besar dan kurang dari threshold. Selain itu karena data time series dari data sampel yang diperoleh memiliki pola data musiman dimana perubahan pola data tidak terlalu banyak berubah dari tahun ke tahun. Selanjutnya pada pengujian order 6 hingga order 30 menunjukkan penurunan nilai MSE dan order terbesar memiliki nilai MSE terkecil, sehingga dapat disumpulkan bahwa semakin besar order maka semakin kecil pula nilai MSE. Dalam hal ini dengan semakin besarnya order maka data sebelumnya yang digunakan untuk pertimbangan dalam menentukan peramalan semakin banyak. Sehingga semakin tinggi order maka dapat membuat peramalan semakin akurat. Dalam pengujian ini memimiliki kesesuaian dengan penelitian sebelumnya yang berjudul “Implementasi Metode Multi-factors High order Fuzzy Time Series Model untuk Prediksi Harga Emas” yang menyatakan bahwa semakin tinggi nilai order maka semakin kecil nilai kesalahannya (Wardhani, et al., 2015). 4.2. Pengujian pengaruh threshold terhadap nilai MSE Pada pengujian ini akan dilakukan untuk mengetahui pengaruh threshold terhadap nilai MSE. Threshold merupakan hasil dari mengalikan jumlah order dengan jumlah faktor pada data kemudian dijumlahkan dengan dengan nilai konstanta. Pada proses defuzzifikasi terdapat proses menghitung selisih antara pangkat bawah Fuzzy Logical Relationship (FLR) data training dan pangkat bawah FLR data testing. Selanjutnya setelah mendapatkan nilai selisih maka nilai selisih tersebut dibandingkan dengan nilai threshold untuk mencari FLR yang cocok. Pada pengujian ini nilai konstanta saja yang diubah – ubah sementara variabel lainnya tetap. Pengujian akan dilakukan sebanyak sepuluh kali. Pada pengujian ini nilai variabel jumlah data training adalah 72 yaitu dari data Januari 2014 dasarian 1 sampai Desember 2015 dasarian 3, nilai data testing adalah 36 yaitu dasarian 1 Januari 2016 sampai dasarian 3 Desember 2016, dan Nilai order adalah 30. Pada penentuan input konstanta nilai minimal harus lebih besar dari 0 dan nilai maksimal menyesuaikan data sampel yang digunakan (Lin,Yang, 2009). Berikut adalah hasil pengujian pengaruh threshold terhadap nilai MSE yang ditunjukkan pada Gambar 3. Fakultas Ilmu Komputer, Universitas Brawijaya
936
Gambar 3. Grafik hasil pengujian threshold terhadap nilai MSE
Berdasarkan grafik dari Gambar 3 nilai input konstanta yang berbeda - beda mempengaruhi besar nilai MSE, semakin besar nilai konstanta maka nilai threshold juga semakin besar. Dalam hal ini dengan semakin besar nilai threshold maka dalam proses seleksi untuk mencari nilai selisih FLR juga semakin luas batasannya dan jika semakin kecil nilai threshold maka dalam proses seleksi untuk mencari nilai selisih FLR menjadi semakin sempit dan mempermudah proses peramalan karena hanya adanya sedikit data yang cocok dengan data yang akan diramalkan dan mempermudah proses defuzzifikasi. Oleh karena itu, semakin kecil threshold maka dapat membuat peramalan semakin akurat. Akan tetapi nilai threshold tidak boleh terlalu kecil karena dapat menyebabkan kegagalan peramalan. Kegagalan peramalan itu terjadi karena tidak adanya data training yang cocok dengan data testing karena pada metode yang digunakan pada penelitian ini sangat bergantung pada data – data sebelumnya. Dari hasil percobaan diatas hasil MSE terbesar adalah 780,6 yaitu pada konstanta 100 serta threshold 220 dan hasil MSE terkecil adalah 558,485 yaitu pada konstanta 10 dan threshold 130. Dalam pengujian ini memiliki kesesuaian dengan penelitian sebelumnya yang berjudul “Implementasi Metode Multi-factors High order Fuzzy Time Series Model untuk Prediksi Harga Emas” yang menyatakan bahwa semakin kecil nilai threshold maka semakin kecil nilai kesalahannya (Wardhani, et al., 2015). 4.3. Pengujian pengaruh jumlah data training terhadap nilai MSE Pada pengujian ini akan dilakukan untuk mengetahui pengaruh jumlah data training terhadap nilai MSE. Pada pengujian ini jumlah data training adalah data dasarian yaitu 1 tahun,
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
2 tahun, 3 tahun, 4 tahun, dan 5 tahun, dimana dari setiap 1 tahun memiliki 36 data dasarian. Pengujian ini akan dilakukan sebanyak lima kali. Pada pengujian ini jumlah data testing adalah 36 yang merupakan data setelah data training, nilai order adalah setengah dari nilai data training, nilai konstanta adalah 20. Berikut adalah hasil pengujian pengaruh jumlah data training terhadap nilai MSE yang ditunjukkan pada Gambar 4.
937
menggunakan order, threshold terbaik dari pengujian sebelumnya. Pada pengujian ini akan dilakukan sebanyak sepuluh kali. Pada pengujian ini nilai data training menggunakan 36 data yang berbeda agar dapat menunjukkan gambaran variasi dari nilai kesalahan MSE pada peramalan, nilai order adalah 18, dan konstanta adalah 10, sehingga nilai threshold adalah 92. Berikut adalah hasil pengujian validasi sistem yang ditunjukkan pada Gambar 5.
Gambar 5. Grafik hasil pengujian validasi sistem Gambar 4. Grafik hasil pengujian data training terhadap nilai MSE
Berdasarkan dari Gambar 4, pengujian pertama sampai pengujian kelima mengalami penerunan nilai MSE. Sehingga dapat disimpulkan bahwa semakin besar data training maka semakin kecil nilai MSE yang diperoleh. Nilai MSE semakin kecil apabila menggunakan data training dalam jumlah besar karena data yang digunakan memiliki rentang jauh dari periode data testing atau data yang akan diramalkan. Sedangkan data training yang sedikit memiliki nilai MSE yang besar karena data training yang memiliki kecocokan dengan data testing berada pada periode yang jauh sehingga nilai MSE menjadi tinggi. Dalam hal ini terbukti bahwa metode yang digunakan pada penelitian memerlukan jumlah data training yang banyak sehingga dapat menurunkan nilai kesalahannya. Dari hasil percobaan diatas hasil MSE terbesar adalah 786,586 dan hasil MSE terkecil adalah 539,698. Dalam pengujian ini memimiliki kesesuaian dengan penelitian sebelumnya yang berjudul “Peramalan Jumlah Kunjungan Wisatawan Kota Batu Menggunakan Metode Time Invariant Fuzzy Time Series” yang menyatakan bahwa semakin besar jumlah data training maka semakin kecil nilai kesalahannya (Elfajar, et al., 2017). 4.4. pengujian validasi sistem Pada pengujian ini dilakukan untuk mengetahui kestabilan dari sistem dengan Fakultas Ilmu Komputer, Universitas Brawijaya
Berdasarkan dari gambar grafik Gambar 5, bahwa pengujian dari validasi sistem memiliki hasil MSE yang tidak terlalu jauh berbeda dari penggunaan data yang berbeda - beda. Oleh karena itu, dapat disimpulkan bahwa implementasi program dari metode High Order Fuzzy Time Series Multi Factors yang telah digunakan sudah cukup baik untuk digunakan peramalan. Berdasarkan dari pengujian yang dilakukan diatas dapat diketahui bahwa kesalahan terkecil terdapat pada pengujian data training yaitu dengan nilai MSE sebesar 539,698. Nilai tersebut diperoleh dari pengujian data training dasarian dari tahun 2011 hingga 2015 untuk melakukan peramalan pada data dasarian tahun 2016. Berikut adalah perbandingan data aktual dengan hasil peramalan yang ditunjukkan pada grafik Gambar 6.
Gambar 6. Grafik perbandingan data aktual dengan hasil peramalan
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
5. KESIMPULAN Pada penutup ini berisi kesimpulan dimana kesimpulan ini mengacu pada penelitian yang telah dilakukan yang meliputi perancangan, implementasi, serta pengujian dan analisis terhadap hasil implementasi peramalan curah hujan menggunakan metode High Order Fuzzy Time Series Multi Factors maka dapat diambil kesimpulan sebagai berikut. Berdasarkan dari implementasi metode High Order Fuzzy Time Series Multi Factors dalam melakukan peramalan curah hujan dasarian dilakukan dengan beberapa langkah yaitu langkah pertama perhitungan Universe of Discourse yang terdiri perhitungan mean, standar deviasi, dan perhitungan Dmin serta Dmax, langkah kedua yaitu perhitungan jumlah cluster, langkah ketiga yaitu perhitungan pusat cluster menggunakan metode fuzzy C-means, langkah keempat yaitu pembentukan subinterval dan fuzzy set, langkah kelima yaitu proses fuzzifikasi, langkah keenam yaitu pembentukan Fuzzy Logical Relationship (FLR), langkah ketujuh adalah defuzzifikasi yang hasil outputnya merupakan hasil peramalan curah hujan dasarian. Berdasarkan dari pengujian hasil implementasi peramalan curah hujan menggunakan metode High Order Fuzzy Time Series Multi Factors, maka dapat diketahui bahwa: a. Order berpengaruh terhadap nilai error, semakin besar nilai order maka hasil peramalan semakin baik. b. Threshold berpengaruh terhadap nilai error, semakin rendah nilai threshold maka hasil peramalan semakin baik. Akan tetapi nilai threshold tidak boleh terlalu rendah karena dapat menyebabkan kegagalan peramalan. c. Data training berpengaruh terhadap nilai error, semakin besar jumlah data training maka hasil peramalan semakin baik. Sehingga peramalan menggunakan metode High Order Fuzzy Time Series Multi Factors memerlukan banyak data training. d. Hasil implementasi peramalan curah hujan menggunakan metode High Order Fuzzy Time Series Multi Factors cukup baik digunakan untuk peramalan. Hal ini terbukti hasil pengujian validasi sistem menunjukkan grafik yang cukup stabil. Fakultas Ilmu Komputer, Universitas Brawijaya
938
Dari pengujian yang telah dilakukan nilai MSE terkecil terdapat pada pengujian jumlah data training yaitu dengan nilai MSE sebesar 539,698. Nilai tersebut diperoleh dari pengujian jumlah data training dasarian dari tahun 2011 hingga 2015 untuk melakukan peramalan pada data dasarian tahun 2016. 6. DAFTAR PUSTAKA Bagirov, M., Adil., Mahmood, Arshad., and Barton, Andrew. 2017. Prediction of monthly rainfall in Victoria, Australia: Clusterwise linear regression approach. Elsevier. Atmos. Research 188, 20-29. BMKG Staklim Karangploso Malang. 2015. “Analisis Dinamika Atmosfer Dan Laut Dasarian III Maret 2015 Update 2 April 2015”. http://karangploso.jatim.bmkgo.go.id/ind ex.php/analisis-kondisi-dinamikaatmosfer-laut-dasarian-tahun-2015/399analisis-dinamika-atmosfer-dan-lautdasarian-iii-maret-2015-update-2-april2015#axzz3X8h9y4fg&gsc.tab=0. (Diakses 25 Februari 2017). BPS Jawa Timur. 2015. “Jawa Timur Dalam Angka 2015”. https://jatim.bps.go.id/4dm!n/pdf_publika si/Jawa-Timur-Dalam-Angka-2015.pdf. (Diakses 25 Februari 2017) Chen, M. 1996. Forecasting Enrollments based on Fuzzy Time Series. Fuzzy Sets and Systems. 311-319. Dewi, Candra., Kartikasari, Dani., Mursityo, Yusi. 2014. Prediksi Cuaca Pada Data Time Series Menggunakan Adaptive Neuro Fuzzy Inference System (ANFIS). Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Vol. 1. No. 1. hlm. 1824. Dewi, Candra., Muslikh, M. 2013. Perbandingan Akurasi Backpropagation Neural Network dan ANFIS Untuk Memprediksi Cuaca. NATURAL-A. Journal of Scientific Modeling & Computation. Volume 1 No.1. Elfajar, Aria., Setiawan, Budi., Dewi, Candra. 2017. Peramalan Jumlah Kunjungan Wisatawan Kota Batu Menggunakan Metode Time Invariant Fuzzy Time Series. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer. Vol. 1. No. 2. Hlm. 85-94.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer
Fauziah, Normalita., Wahyuningsih, Sri., dan Nasution, Yuki. 2016. Peramalan Menggunakan Fuzzy Time Series Chen (Studi Kasus: Curah Hujan Kota Samarinda). Vol.4. Statistika. Klawon, F. 2001. What is About Fuzzy Clustering? Understanding and Improving the Concept of the Fuzzier. Science Journal. http://public-rzfhwolfebuettel.de/klawon. Kurniawan, Carlos. 2007. Analisis dan Perancangan Program Aplikasi Peramalan Curah Hujan dengan Metode Wavelet (Studi Kasus: BMKG). Kusumadewi, S., Purnomo, H. 2004. “Aplikasi Logika Fuzzy untuk Pendukung Keputusan”. Graha Ilmu Yogyakarta. Lin, Yupei., Yang. Y. 2009. Stock Markets Forecasting Based on Fuzzy Time Series Model. IEEE Conference Publications, 782-886. Wang, Nai-Yi., Chen, Shyi-Ming. 2009. Temperature prediction and TAIFEX forecasting based on automatic clustering techniques and two-factors high-order fuzzy time series. Elsevier. Expert Systems with Applications 36. 2143– 2154. Wardhani, Dessy., Ratnawati, Dian., Setiawan, Budi. 2015. Implementasi Metode Multifactors High order Fuzzy Time Series Model untuk Prediksi Harga Saham. Repositori Jurnal Mahasiswa PTIIK UB. Doro Jurnal. Vol. 6. No. 6. Yunanto, Utomo. 2014. “BMKG Akui Prakiraan Cuacanya Masih Kurang Akurat.” Kompas Sains. Januari 30. http://www.timesindonesia.co.id/read/13 6885/20161118/102415/terendam-airpetani-lamongan-terpaksa-panen-dini. (Diakses 25 Februari 2017).
Fakultas Ilmu Komputer, Universitas Brawijaya
939