FUZZY ASSOCIATION RULES MINING PADA DATA KLIMATOLOGI DAN JUMLAH HOTSPOT DI KALIMANTAN TENGAH DAN KALIMANTAN SELATAN
DEDEK APRIYANI
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
FUZZY ASSOCIATION RULES MINING PADA DATA KLIMATOLOGI DAN JUMLAH HOTSPOT DI KALIMANTAN TENGAH DAN KALIMANTAN SELATAN
DEDEK APRIYANI
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
ABSTRACT DEDEK APRIYANI. Fuzzy Association Rules Mining of Climatology and Total Hotspot Data in Central Kalimantan and South Kalimantan. Under the direction of ANNISA. The occurrence of forest fires was influenced by many factors of weather and climate such as temperature, rainfall, solar radiation, humidity, air stability, speed and direction of wind. Rainfall, relative humidity and temperature were the main factors on the moisture of fuel control. Wind and solar radiation were important factors on drying fuels. It was influenced on change in fuel temperature also temperature and relative humidity in the air. This research was aimed to extract or “mine” knowledge from climatology and number of hotspots data in Central Kalimantan and South Kalimantan by 2001 until 2004. It is using Association Rules Mining method with apriori algorithm to see the relation between the number of hotspots and climatology data. Also fuzzy logic was used to solve an uncertainty and the numerical data. The result of this research was presented in the rules. The rules show relation between climatology and the number hotspots data. In rainy season (November-June) few hotspots were shown. This was influenced by mild temperature, mild solar radiation, mild air pressure, high relative humidity and low wind speed. However in dry season the occurence of forest fires was high in each year. The peak of forest fires occurred in August and September. It was influenced by mild temperatures, low rainfall, low solar radiation, mild air pressure, mild relative humidity, low and mild wind speed. Keyword : association rules mining, hotspot, climatology, apriori, fuzzy
Judul
: Fuzzy Association Rules Mining pada Data Klimatologi dan Jumlah Hotspot di
Nama NRP
Kalimantan Tengah dan Kalimantan Selatan : Dedek Apriyani : G64070030
Menyetujui: Pembimbing,
Annisa, S.Kom, M.Kom. NIP. 19790731 200501 2 002
Mengetahui: Ketua Departemen Ilmu Komputer,
Dr. Ir. Sri Nurdiati, M.Sc. NIP. 19601126 198601 2 001
Tanggal Lulus:
RIWAYAT HIDUP Penulis dilahirkan di Tanjung Enim pada tanggal 13 April 1989. Penulis merupakan anak kedua dari empat bersaudara pasangan Bapak Hendri Rejab dan Ibu Yuni Ningsih. Pada tahun 2007 penulis lulus dari SMA Negeri 1 Muara Enim, Sumatera Selatan. Tanggal 2 Juli 2007 penulis resmi menjadi mahasiswa Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Setelah menyelesaikan Tingkat I (Tingkat Persiapan Bersama) di IPB pada tahun 2008, penulis diterima sebagai mahasiswa Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Selama menjadi mahasiswa di Institut Pertanian Bogor, penulis pernah aktif pada Himpunan Mahasiswa Ilmu Komputer (HIMALKOM) IPB periode 2008/2009. Selain itu pernah menjadi pengurus Lembaga Dakwah Kampus (LDK) Al Hurriyyah pada tahun 2007-2011. Pada tahun 2007 Penulis menjalankan praktik lapangan di Badan Koordinasi Survei dan Pemetaan Nasional (BAKOSURTANAL) Pusat Pemetaan Dasar Rupabumi dan Tata Ruang selama kurang lebih 2 bulan.
PRAKATA Alhamdulillahi Rabbil „alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas limpahan rahmat dan hidayah-Nya sehingga tugas akhir dengan judul Fuzzy Association Rules Mining pada Data Klimatologi dan Jumlah Hotspot di Kalimantan Tengah dan Kalimantan Selatan dapat diselesaikan. Shalawat serta salam juga penulis ucapkan kepada junjungan Nabi Muhammad SAW beserta seluruh sahabat dan umatnya hingga akhir zaman. Penyelesaian tugas akhir ini tidak terlepas dari bantuan beberapa pihak, oleh karena itu penulis mengucapkan terima kasih kepada semua pihak yang telah membantu dalam penyelesaian tugas akhir ini, antara lain: 1 Ayahanda dan ibunda tercinta atas segala do’a, kasih sayang, nasihat dan dukungannya. 2 Kakakku Heni Maharani, Am. Keb, adikku Melly Wulandari dan Reza Novpri Andini yang selalu memberiku motivasi untuk dapat menyelesaikan tugas akhir ini. 3. Ibu Annisa, S.Kom, M.Kom selaku dosen pembimbing yang selalu memberikan bimbingan dan saran selama penelitian dan penulisan tugas akhir ini. 4. Bapak Hari Agung Adrianto, S.Kom, M.Si dan Bapak Toto Haryanto S.Kom, M.Si yang telah bersedia menjadi dosen penguji. 5. Bapak Dr. Erianto Indra Putra, S.Hut, M.Si yang telah banyak memberikan pengetahuannya tentang kebakaran hutan. 6. Ibu Ir. Sri Wahjuni, M.T. selaku dosen pembimbing akademik yang banyak memberikan arahan dan dukungan dalam mengambil mata kuliah di departemen Ilmu Komputer sampai akhir studi. 7. Teman satu Laboratorium SEINS mahasiswa bimbingan Ibu Annisa, S.Kom, M.Kom. yaitu Fani Wulandari, Dhieka Avrilia Lantana, M. Yoga Permana, M. Arif Fauzi, Ayi Imanudin, Remarchtito, Hidayat dan Yuridis Kurniawan atas kerjasama, kebersamaan, masukan, dukungan serta bantuanya selama penyelesaian tugas akhir ini. 8. Devi Dian Permana, Winda Giam, Arif N dan Kak Luky yang telah berbagi ilmunya kepada penulis sehingga tugas akhir ini dapat terselesaikan. 9. Novi Ariyanti, Fitri Indriani, Lili Suryani, Destia Harum dan Mbak Endang atas do’a, perhatian dan dukungannya. 10. Mb Elvira, Endah Mulia Ningsih, Sarah Ayu Anggraeni, Lina Yasmina, Sri Lindawati, Nida, Mbak Irnita, Mbak Ana, Mbak Noni, Mbak Lely dan teman-teman Pondok Pesantren Mahasiswi Al Iffah lainnya atas do’a dan motivasinya. 11. Teman-teman satu perjuangan di SDM Al Hurriyyah 2011 yaitu Wina, Chacha, Tia, Ami, Aini, Ana, Retno, Akhir, Sidik, Kindi, Agung dan Ilman atas kebersamaan, pengertian, semangat, kesabaran, do’a dan motivasinya selama penyelesaian tugas akhir ini. 12. Seluruh teman-teman Ilkomerz 44 IPB yang tidak dapat disebutkan namanya satu-persatu atas persahabatan, bantuan, do’a, dukungan dan motivasi yang selalu diberikan selama kuliah hingga tugas akhir ini selesai. Penulis juga mengucapkan terima kasih kepada semua pihak yang telah membantu selama pengerjaan penyelesaian tugas akhir ini yang tidak dapat disebutkan satu-persatu. Semoga penelitian ini dapat memberikan manfaat.
Bogor,
Desember 2011
Dedek Apriyani
DAFTAR ISI Halaman DAFTAR GAMBAR ..................................................................................................................... viii DAFTAR TABEL ......................................................................................................................... viii DAFTAR LAMPIRAN ................................................................................................................. viii PENDAHULUAN ............................................................................................................................ 1 Latar Belakang ......................................................................................................................... 1 Tujuan ...................................................................................................................................... 1 Ruang Lingkup ......................................................................................................................... 1 Manfaat Penelitian ................................................................................................................... 1 TINJAUAN PUSTAKA ................................................................................................................... 2 Hotspot ..................................................................................................................................... 2 Kebakaran Hutan ...................................................................................................................... 2 Cuaca Kebakaran Hutan ........................................................................................................... 2 Data Mining ............................................................................................................................. 2 Association Rule ...................................................................................................................... 3 Algoritme Apriori .................................................................................................................... 3 Fuzzy Set .................................................................................................................................. 3 Fuzzy Association Rules Mining Using Apriori ....................................................................... 4 METODE PENELITIAN ................................................................................................................. 4 Praproses Data.......................................................................................................................... 5 Pembentukan Membership Function ........................................................................................ 7 Pembentukan Data Fuzzy ......................................................................................................... 7 Association Rule Mining Menggunakan Algoritme Apriori ..................................................... 8 Representasi Pengetahuan ........................................................................................................ 9 Lingkungan Pengembangan Sistem ......................................................................................... 9 HASIL DAN PEMBAHASAN ........................................................................................................ 9 Pembersihan data ................................................................................................................... 10 Seleksi data ............................................................................................................................ 10 Transformasi data ................................................................................................................... 10 Pembentukan data Fuzzy........................................................................................................ 10 Fuzzy Association Rule Mining .............................................................................................. 11 Pembentukan frequent itemset ............................................................................................... 11 Pembentukan Aturan Asosiasi ............................................................................................... 12 Pengaruh faktor-faktor iklim terhadap terjadinya kebakaran hutan ....................................... 12 Musim Hujan.......................................................................................................................... 13 Musim Kemarau ..................................................................................................................... 13 Data Tahun 2001 .................................................................................................................... 14 Data Tahun 2002 .................................................................................................................... 14 Data Tahun 2003 .................................................................................................................... 14 Data Tahun 2004 .................................................................................................................... 15 All Data (Tahun 2001-2004) .................................................................................................. 15 KESIMPULAN DAN SARAN ...................................................................................................... 15 Kesimpulan ............................................................................................................................ 15 Saran ...................................................................................................................................... 15 DAFTAR PUSTAKA ..................................................................................................................... 16 LAMPIRAN ................................................................................................................................... 17
DAFTAR GAMBAR Halaman 1 Segitiga api (Brown & Davis, 1973) ............................................................................................. 2 2 Tahap-tahap dalam proses Knowledge Discovery in Database (Han & Kamber 2001) ................ 3 3 Representasi non-fuzzy dan fuzzy set untuk variabel kuantitatif (Calargun 2008). ........................ 4 4 Metodologi penelitian .................................................................................................................... 4 5 Tahap pembersihan dan seleksi data .............................................................................................. 5 6 Sebaran data temperatur udara setelah dilakukan tahap Moving Average ..................................... 6 7 Sebaran data curah hujan setelah dilakukan tahap Moving Average ............................................. 6 8 Sebaran data penyinaran matahari setelah dilakukan tahap Moving Average ............................... 6 9 Sebaran data tekanan udara setelah dilakukan tahap Moving Average .......................................... 6 10 Sebaran data kelembaban setelah dilakukan tahap Moving Average ........................................... 6 11 Sebaran data kecepatan angin setelah dilakukan tahap Moving Average .................................... 6 12 Sebaran data jumlah hotspot ........................................................................................................ 7 13 Fungsi keanggotaan Triangular ................................................................................................... 7 14 Tahap pembentukan data fuzzy. ................................................................................................... 7 15 Tahap pembangkitan Large Itemset ............................................................................................. 8 16 Persebaran hotspot tahun 2001 .................................................................................................... 9 17 Persebaran hotspot tahun 2002 .................................................................................................... 9 18 Persebaran hotspot tahun 2003 .................................................................................................... 9 19 Persebaran hotspot tahun 2004 .................................................................................................. 10 20 Fungsi keanggotaan temperatur ................................................................................................. 10 21 Fungsi keanggotaan curah hujan ............................................................................................... 11 22 Fungsi keanggotaan penyinaran matahari .................................................................................. 11 23 Fungsi keanggotaan tekanan udara ............................................................................................ 11 24 Fungsi keanggotaan kelembaban ............................................................................................... 11 25 Fungsi keanggotaan kecepatan angin ........................................................................................ 11 26 Fungsi keanggotaan jumlah hotspot .......................................................................................... 11 27 Kelembaban relatif dan kejadian kebakaran hutan .................................................................... 12 28 Curah hujan dan kejadian kebakaran hutan ............................................................................... 12 29 Temperatur maksimum dan kejadian kebakaran hutan.............................................................. 12 30 Kecepatan angin dan kejadian kebakaran hutan ........................................................................ 12
DAFTAR TABEL Halaman 1 Data fuzzy untuk Algoritme Apriori............................................................................................... 4 2 Perhitungan metode Moving Average ............................................................................................ 5 3 Perhitungan metode Moving Average dengan Microsoft Excel .................................................... 6 4 Perhitungan derajat keanggotaan ................................................................................................... 8 5 Rule-rule yang dihasilkan pada musim hujan .............................................................................. 13 6 Rule-rule bulan Agustus .............................................................................................................. 14 7 Rule-rule bulan September .......................................................................................................... 14 8 Rule-rule data tahun 2001............................................................................................................ 14 9 Rule-rule data tahun 2002............................................................................................................ 14 10 Rule-rule data tahun 2003.......................................................................................................... 14 11 Rule-rule data tahun 2004.......................................................................................................... 15 12 Rule-rule data all data ............................................................................................................... 15 13 Rule-rule yang sering muncul pada tahun 2002-2004 ............................................................... 15
DAFTAR LAMPIRAN Halaman 1 Contoh data mentah sebelum dilakukan praproses ...................................................................... 18 2 Rule-rule pada data tiap bulan ..................................................................................................... 20
PENDAHULUAN Latar Belakang Kebakaran hutan di Indonesia sering terjadi pada musim kemarau setiap tahunnya. Selain karena aktivitas manusia yang tidak terkendali, cuaca dan iklim dapat menjadi pemicu terjadinya kebakaran hutan dengan berbagai cara yang saling berhubungan yaitu, iklim menentukan jumlah total bahan bakar yang tersedia, iklim menentukan jangka waktu dan kekerasan musim kebakaran, cuaca mengatur kadar air dan kemudahan bahan bakar hutan untuk terbakar, dan cuaca mempengaruhi proses penyalaan dan penjalaran kebakaran hutan (Chandler et al dalam Thoha 2001). Faktor-faktor cuaca dan iklim seperti suhu, curah hujan, radiasi matahari, kelembaban, stabilitas udara, kecepatan angin dan arah angin secara langsung dapat mempengaruhi terjadinya kebakaran hutan (Thoha 2001). Hotspot merupakan titik-titik di permukaan bumi dimana titik-titik tersebut merupakan indikasi adanya kebakaran hutan dan lahan. Indikasi yang dimaksud adalah suhu panas hasil kebakaran hutan yang naik ke atmosfer (suhu yang relatif lebih tinggi dibanding dengan suhu sekitarnya) dan ditangkap oleh satelit serta didefinisikan sebagai hotspot berdasarkan ambang batas suhu (treshold) tertentu (Ratnasari dalam Permana 2011). Dengan demikian, ada keterkaitan antara data klimatologi dan jumlah hotspot yang dicatat setiap harinya. Untuk mendapatkan keterkaitan antara data klimatologi dan jumlah hotspot tersebut dilakukan proses data mining menggunakan metode Association Rules Mining. Association Rules Mining digunakan untuk menemukan hubungan yang menarik antar item dari database yang berukuran besar (Han & Kamber 2001). Metode ini telah digunakan pada beberapa penelitian sebelumnya, yaitu penelitian Hariona (2009) melakukan Association Rules Mining pada data sebaran bangunan kota Bogor dan penelitian Mustika (2006) telah melakukan pengembangan aplikasi Fuzzy Association Rules untuk data Potensi Desa (PODES). Pada penelitian ini, dilakukan ekstraksi pengetahuan data klimatologi dan jumlah hotspot untuk melihat model data klimatologi yang bisa menyebabkan bertambah atau berkurangnya jumlah hotspot. Logika fuzzy digunakan untuk mengatasi ketidakpastian serta menangani data klimatologi dan jumlah hotspot yang berbentuk numerik.
Hasil akhir dari penelitian ini diharapkan dapat menyajikan rule atau pola keterkaitan antara data klimatologi dan jumlah hotspot. Berikut diberikan contoh rule yang dapat dihasilkan, “Jika kelembaban udara tinggi maka jumlah hotspot sedikit”. Rule tersebut menunjukan keterkaitan yang kuat antara kelembaban udara tinggi dan jumlah hotspot sedikit, karena pada saat kondisi kelembaban udara tinggi kemungkinan besar jumlah hotspot yang dideteksi sedikit. Rule-rule yang ditemukan diharapkan dapat dimanfaatkan dalam pengambilan keputusan untuk menanggulangi masalah kebakaran hutan. Selain itu, rule yang dihasilkan juga dapat dimanfaatkan dalam melakukan prediksi terjadinya kebakaran hutan. Tujuan 1.
2.
3.
Tujuan dari penelitian ini adalah: Mengembangkan suatu sistem Fuzzy Association Rules Mining berbasis web pada data klimatologi dan jumlah hotspot. Menerapkan metode Fuzzy Association Rule dengan menggunakan algoritme Apriori. Menemukan pola-pola atau hubungan asosiatif antara beberapa item data pada data klimatologi dan jumlah hotspot per bulan dan per tahun di Kalimantan Tengah dan Kalimantan Selatan.
Ruang Lingkup 1.
2.
3.
Ruang lingkup penelitian ini meliputi: Data yang digunakan adalah data klimatologi dan jumlah hotspot di Kota Kalimantan Tengah dan Kalimantan Selatan dari tahun 2001 sampai tahun 2004. Data klimatologi yang digunakan yaitu suhu udara, curah hujan, penyinaran matahari, tekanan udara, kelembaban dan kecepatan angin. Hubungan asosiatif antara beberapa item yang dicari dilihat per bulan dari bulan Januari sampai Desember dan per tahun dari tahun 2001 sampai tahun 2004
Manfaat Penelitian Hasil penelitian ini berupa aturan-aturan asosiasi yang memberikan informasi mengenai pola atau hubungan asosiatif antara beberapa item pada data klimatologi dan jumlah hotspot diharapkan dapat dimanfaatkan oleh pihak yang berkepentingan sebagai bahan pendukung dalam pengambilan keputusan terkait penanganan kebakaran hutan di Kalimantan
1
Tengah dan Kalimantan Selatan. Selain itu, rule yang dihasilkan juga dapat dimanfaatkan dalam melakukan prediksi terjadinya kebakaran hutan.
TINJAUAN PUSTAKA Hotspot Kebakaran hutan dan lahan dapat dipantau menggunakan data AVHRR-NOAA (Advanced Very High Resolution RadiometerNational Oceanic and Atmospheric Administration) yang diluncurkan oleh National Aeronautics and Space Administration (NASA-USA) yaitu melalui pengamatan hotspot (Thoha 2008). Hotspot merupakan titik-titik panas di permukaan bumi, dimana titik-titik tersebut merupakan indikasi adanya kebakaran hutan dan lahan. Hotspot adalah suatu titik yang menandakan sumber panas. Hotspot juga merupakan salah satu indikator kemungkinan terjadinyan kebakaran hutan. Sehingga dengan data hotspot dapat dilakukan analisis, pemantauan, dan terkadang harus melakukan pemeriksaan langsung ke lapangan untuk mengetahui apakah diperlukan langkah pencegahan kebakaran. Pemantauan hotspot dilakukan dengan cara penginderaan jauh (remote sensing) menggunakan satelit (Ratnasari dalam Permana 2011). Kebakaran Hutan Kebakaran hutan adalah suatu proses reaksi yang menyebar secara bebas dari perpaduan antar tiga unsur yang saling mendukung oksigen, bahan bakar dan panas, yang ditandai dengan adanya panas, cahaya dan asap. Proses ini menyebar dengan bebas dan mengkonsumsi bahan bakar alam yang terdapat di hutan seperti serasah, rumput, humus, ranting–ranting, kayu mati, tiang, gulma, semak, dedaunan, dan pohon segar lainnya (Brown dan Davis dalam Fadli 2011). Ilustrasi tiga unsur yang mendukung terjadinya kebakaran hutan dapat dilihat pada Gambar 1.
Gambar 1 Segitiga api (Brown & Davis 1973).
Cuaca Kebakaran Hutan Cuaca dan iklim dapat menjadi pemicu terjadinya kebakaran hutan dengan berbagai cara yang saling berhubungan yaitu, iklim menentukan jumlah total bahan bakar yang tersedia, iklim menentukan jangka waktu dan kekerasan musim kebakaran, cuaca mengatur kadar air dan kemudahan bahan bakar hutan untuk terbakar, dan cuaca mempengaruhi proses penyalaan dan penjalaran kebakaran hutan (Chandler et al dalam Thoha 2001). Data Mining Data mining merupakan proses ekstraksi informasi atau pola yang penting dalam database yang berukuran besar (Han & Kamber 2001). Data mining merupakan bagian dari proses Knowledge Discovery in Databases (KDD). Berikut adalah tahapantahapan pada proses KDD: 1. Pembersihan data Pembersihan data dilakukan untuk membuang noise dan data yang tidak konsisten. 2. Integrasi data Integrasi data merupakan tahapan penggabungan data dari beberapa sumber 3. Seleksi data Seleksi data adalah tahap pengambilan data yang relevan dengan proses analisis dari database. 4. Transformasi data Pada tahap ini data diubah menjadi bentuk yang sesuai untuk di mining dengan cara dilakukan peringkasan atau operasi agregasi. 5. Aplikasi teknik Data Mining Data mining merupakan proses yang penting dalam KDD dimana metodemetode cerdas diaplikasikan untuk mengekstrak pola-pola dari kumpulan data. 6. Evaluasi pola-pola yang ditemukan Evaluasi pola dilakukan untuk mengidentifikasi pola-pola tertentu yang menarik atau bernilai yang mepresentasikan pengetahuan berdasarkan suatu ukuran kemenarikan. 7. Representasi pengetahuan Dengan teknik visualisasi pengetahuan yang sudah digali dapat direpresentasikan kepada pengguna.
2
Proses dari KDD dapat dilihat pada Gambar 2.
untuk {Milk, Diapers, Beer} adalah 2 dan jumlah total transaksi adalah 5, maka support bagi aturan tersebut adalah 2/5 = 0.4. Confidence didapat dengan membagi support count untuk {Milk, Diapers, Beer} dengan support count untuk {Milk, Diapers}, yaitu 2/3 = 0.67 (Tan P, Steinbach M, Kumar V 2006). Algoritme Apriori Menutut Pramudiono (2003) algoritme untuk Association Rule Mining yang paling populer dikenal sebagai Apriori dengan paradigma generate and test, yaitu pembuatan kandidat kombinasi item yang mungkin berdasar aturan tertentu lalu diuji apakah kombinasi item tersebut memenuhi syarat support minimum. Kombinasi item yang memenuhi syarat tersebut disebut frequent itemset, yang nantinya dipakai untuk membuat aturan-aturan yang memenuhi syarat confidence minimum. Pseudocode dari algoritme Apriori menurut Agrawal et al (1994) adalah sebagai berikut :
Gambar 2 Tahap-tahap dalam proses Knowledge Discovery in Database (Han & Kamber 2001). Association Rule Association Rule adalah ekspresi implikasi yang dinyatakan dalam bentuk XY, dimana X dan Y adalah itemset terpisah (disjoint) yaitu X ∩ Y= Ø. Kekuatan aturan asosiasi dapat diikur dengan support dan confidence. Support menentukan seberapa sering aturan tersebut diterapkan dalam dataset, sedangkan Confidence menentukan frekuensi item dalam Y muncul dalam transaksi yang mengandung X. Definisi formal dari keduanya sebagai berikut: Support, s (X→Y) =
σ (X ∪ Y) N
Confidence, c (X→Y) =
σ (X ∪ Y) σ (X)
Contoh : Perhatikan aturan {Milk, Diapers}{Beer}. Karena support count
1) L1 = {large 1-itemsets}; 2) for ( k = 2; Lk-1<=ϕ ; k++ ) do 3) begin 4) Ck =apriori-gen(Lk-1); // kandidat baru 5) forall transactions t ∈ D do 6) begin 7) Ct = subset(Ck, t); // kandidat yang ada dalam t forall candidates c ∈ Ct do 8) 9) c.count++; 10) end 11) Lk ={c ∈ Ck | c.count ≥ minsup} //semua kandidat pada Ck dgn minimum support 12) end 13) Answer =υk Lk;
Fuzzy Set Teori fuzzy set telah terbukti menjadi salah satu cara yang sangat berguna dalam data mining. Fuzzy set lebih dimengerti oleh manusia. Fuzzy set menangani data numerik menjadi lebih baik karena dapat memperhalus “sharp boundaries” data (Çalargün 2008). Contoh representasi non-fuzzy dapat dilihat pada Gambar 3a dan fuzzy set untuk variabel kuantitatif dapat dilihat pada Gambar 3b. Sumbu X adalah nilai dari variabel kuantitatif. Sumbu Y adalah derajat keanggotaan dalam himpunan dingin, hangat, dan panas (cold, warm, and hot).
3
Pada Gambar 3a, misalnya nilai 10 adalah anggota dari cold set pada derajat 1 dan anggota dari dua set lainnya, warm dan hot berada pada derajat 0. Dalam logika fuzzy nilai tertentu dapat memiliki derajat keanggotaan antara 0 dan 1 dan dapat menjadi anggota lebih dari satu fuzzy set. Gambar 3.b, nilai 10 adalah anggota cold set pada derajat 0,4 dan anggota dari warm set pada tingkat 0,75.
Large items dengan satu elemen adalah {dry, hot}, mild dan wet dihilangkan karena memiliki frekuensi ¼=0.25 yang lebih kecil dari 0.4. Elemen fuzzy lainnya juga dihilangkan karena frekuensinya 0. Large items dengan dua elemen didapatkan dari join Large items satu elemen dengan dirinya sendiri dan periksa nilai support dari setiap kandidat. Large items dua elemen adalah {dry hot, hot dry}. Hasilnya berupa aturan-aturan sebagai berikut: If spring is dry then summer is hot [50%,66,6 %]. If summer is hot then spring is dry[50%, 66,6 %] (Calargun 2008).
METODE PENELITIAN Tahapan yang dilakukan pada penelitian ini dapat dilihat pada Gambar 4. Mulai
Data Klimatologi dan Jumlah Hotspot
Pembersihan Data
Gambar 3 Representasi non-fuzzy dan fuzzy set untuk variabel kuantitatif (Calargun 2008). Fuzzy Association Rules Mining Using Apriori Algoritme Apriori terkenal digunakan pada association rules mining untuk himpunan data transaksional. Database fuzzy sangat mirip dengan database transaksional sehingga Algoritme Apriori bisa digunakan untuk menemukan aturan-aturan asosiasi pada data fuzzy (Çalargün 2008). Berikut contoh eksekusi Algoritme Apriori menggunakan data fuzzy pada Tabel 1 dengan minimum support dan minimum significant 0,4 dan elemen fuzzy untuk curah hujan adalah {dry, fair, wet}, sedangkan temperatur adalah {cold, mild, hot}. Tabel 1 Data fuzzy untuk Algoritme Apriori Basin Meric Meric Meric Meric
Spring Precipitation Dry Dry Wet Dry
Summer Temperature Mild Hot Hot Hot
Seleksi Data
Transformasi Data
Pembentukan Membership Function
Pembentukan Data Fuzzy
Association Rules Mining Menggunakan Algoritme Apriori
Output
Evaluasi Pola
Representasi Pengetahuan
Selesai
Gambar 4 Metodologi penelitian. 4
Tahap-tahap yang dilakukan pada penilitian ini mengacu pada proses Knowledge Discovery in Database (KDD), dijelaskan sebagai berikut : Praproses Data Praproses data dilakukan langkah-langkah sebagai berikut: a. Pembersihan data Pembersihan data dilakukan jika terdapat data yang mengandung noise, nilai yang hilang (kosong) dan data yang tidak konsisten. b. Seleksi data Pada tahap ini dipilih atribut yang dibutuhkan dalam proses Association Rules Mining. Atribut data klimatologi yang dipilih adalah data dalam bentuk numerik, sedangkan untuk data hotspot adalah data yang jumlah hotspot per hari yang diambil. Tahap-tahap pembersihan dan seleksi data dapat dilihat pada Gambar 5. c. Transformasi data Setelah dilakukan tahap pembersihan dan seleksi data selanjutnya dilakukan tahap transformasi data. Data ditransformasi ke dalam bentuk yang sesuai untuk proses selanjutnya.
Tahap transformasi data meliputi: 1. Menggunakan metode Moving Average Diberikan N titik data dan diputuskan untuk menggunakan T pengamatan pada setiap rata-rata (yang disebut dengan ratarata bergerak orde (T) atau MA(T), sehingga keadaannya adalah sebagai berikut: :
Secara ringkas perhitungan metode ini dapat dilihat pada Tabel 2. Tabel 2 Perhitungan metode Moving Average Waktu
Moving Average
T T+1 T+2 Dalam penelitian ini menggunakan Orde(5). Metode Moving Average ini dapat dilakukan dengan menggunakan Microsoft Excel, perhitungannya dapat dilihat pada Tabel 3.
Gambar 5 Tahap pembersihan dan seleksi data.
5
Tabel 3 Perhitungan metode Moving Average dengan Microsoft Excel t 1 2 3 4 5 6 7 .. ..
data X1 X2 X3 X4 X5 X6 X7 … …
N
Xn 2.
3.
MA(5)
(X1 + X2 + X3+ X4+ X5)/5 (X2 + X3 + X4+ X5+ X6)/5 … … (X(n-5) + X(n-4) +X(n-3) + X(n-2) + X(n-1))/5
Gambar 8 Sebaran data penyinaran matahari setelah dilakukan tahap Moving Average.
Konversi atribut tanggal menjadi fomat date (YYYY/MM/DD) yang semula kolom tanggal dalam format general. Konversi data hasil seleksi yang memiliki format Microsoft Excel (*.xlsx) menjadi format *.csv untuk dimasukan ke dalam database.
Sebaran data dari atribut temperatur udara, curah hujan, penyinaran matahari, tekanan udara, kelembaban dan kecepatan angin yang sudah dilakukan tahap Moving Average secara berurutan dapat dilihat pada Gambar 6 sampai Gambar 11. Atribut jumlah hotspot tidak dilakukan tahap Moving Average. Sebaran data dari atribut jumlah hotspot dapat dilihat pada Gambar 12.
Gambar 9 Sebaran data tekanan udara setelah dilakukan tahap Moving Average.
Gambar 10 Sebaran data kelembaban setelah dilakukan tahap Moving Average.
Gambar 6 Sebaran data temperatur udara setelah dilakukan tahap Moving Average.
Gambar 11 Sebaran data kecepatan angin setelah dilakukan tahap Moving Average. Gambar 7 Sebaran data curah hujan setelah dilakukan tahap Moving Average.
6
Gambar 13 Fungsi keanggotaan Triangular. Pembentukan Data Fuzzy
Gambar 12 Sebaran data jumlah hotspot. Pembentukan Membership Function Bentuk fungsi keanggotaan yang digunakan adalah bentuk Triangular. Bentuk triangular bisa dilihat pada Gambar 13. Setiap atribut dibuat fungsi keanggotaannya masing-masing. Derajat keanggotaan x(µ[x]):
(
)
( (
) )
(
)
Sebelum melalui tahap mining, data harus diubah terlebih dahulu ke dalam bentuk fuzzy. Pada tahap ini akan didapatkan nilai keanggotaan dari setiap himpunan fuzzy. Data fuzzy inilah yang akan di lakukan proses assocition rule mining untuk mendapatkan aturan-aturan asosiasi. Proses pembetukan data fuzzy dari data yang sudah dilakukan tahap praproses disajikan pada Gambar 14. Himpunan fuzzy temperatur adalah {rendah, sedang, tinggi}. Pada Gambar 14 diberikan contoh data setelah dilakukan tahap praproses untuk data temperatur. Dari data temperatur tersebut ditransformasi menjadi data fuzzy menggunakan fungsi keanggotaan temperatur. Untuk perhitungan derajat keanggotaan dari setiap data dapat dilihat pada Tabel 4. Himpunan fuzzy yang dipilih untuk proses mining adalah yang bernilai maksimal.
Gambar 14 Tahap pembentukan data fuzzy.
7
Tabel 4 Perhitungan Derajat Keanggotaan Tanggal
09/11/2003
10/07/2003
Derajat keanggotaan ( (
) )
( (
) )
( (
) )
( (
) )
( ( 17/08/2003
( (
Association Rule Mining Menggunakan Algoritme Apriori Pada tahap association rule mining mengunakan Algoritme Apriori ini bisa dipecah ke dalam dua langkah yaitu sebagai berikut (Kantardzic 2003): 1. Langkah Pencarian Large Itemset: Menemukan seluruh item dari transaksi yang memenuhi minimum support threshold. Support untuk suatu itemset adalah jumlah transaksi dalam database yang mengandung itemset tersebut. Itemset yang memenuhi persyaratan ini disebut frequent itemset (large itemset) dan sebaliknya infrequent itemset (small itemset). Ilustrasi pembentukan large itemset disajikan pada Gambar 15. 2. Langkah Rules
) ) ) )
Pembangkitan
Association
Dengan menggunakan frequent itemset yang terbentuk dihasilkan (strong) association rules yang memenuhi minimum confidence threshold yang telah ditentukan sebelumnya.
Gambar 15 Tahap pembangkitan Large Itemset.
8
Representasi Pengetahuan Representasi pengetahuan merupakan tahap akhir dimana pada tahap ini sudah ditemukan pola yang bersesuaian yang kemudian direpresentasikan ke pengguna menggunakan teknik visualisasi agar pengguna dapat memahami pengetahuan tersebut. Lingkungan Pengembangan Sistem Lingkungan pengembangan sistem Fuzzy Associatio rules mining pada Data Klimatologi dan Jumlah Hotspot di Kota Kalimantan Tengah dan Kalimantan Selatan ini meliputi perangkat keras dan perangkat lunak dengan spesifikasi sebagai berikut: a. Perangkat keras processor : Intel(R) Core(TM)2 Duo 2 GHz memory : 3 GB harddisk : 160 GB monitor : 14.1’’ resolusi 1280 x 800 px keyboard b. Perangkat lunak sistem operasi:Windows 7 Professional pengolah data : Microsoft Excel 2010 paket web server:BitNami WAPPStack web server : Apache 2.2.17 database : PostgreSQL 9.0.3-1 bahasa pemrograman : PHP 5.2.17 tool untuk memanajemen PostgreSQL : phpPgAdmin 5.0.2 web browser : Mozilla Firefox 7 Editor program : Notepad++, Macromedia Dreamweaver 8
Stasiun Tjilik Riwut Hotspot Kalimantan Tengah Kalimantan Selatan Gambar 16 Persebaran hotspot tahun 2001.
Stasiun Tjilik Riwut Hotspot Kalimantan Tengah Kalimantan Selatan Gambar 17 Persebaran hotspot tahun 2002.
HASIL DAN PEMBAHASAN Data yang digunakan dalam penelitin ini adalah data klimatologi tahun 2001 sampai tahun 2004, Balai Besar Meteorologi dan Geofisika Wilayah III, Stasiun Meteorologi Tjilik Riwut, Nomor stasiun 96655, Kalimantan Tengah dan Kalimantan Selatan dan data hotspot dari tahun 2001 sampai 2004 di Kota Kalimantan Tengah dan Kalimantan Selatan. Stasiun Meteorologi Tjilik Riwut terletak pada 002° 13' 34'' LS dan 113° 56' 42'' BT yang berada di dalam daerah pemantauan hotspot tersebut. Persebaran hotspot pada tahun 2001, 2002, 2003 dan 2004 secara berurutan dapat dilihat pada Gambar 16 sampai Gambar 19. Data klimatologi dan hotspot ini didapatkan dalam bentuk file excel dari Departemen Konservasi Sumber Daya Hutan, Fakultas Kehutanan IPB. Contoh data asli yang didapatkan disajikan pada Lampiran 1.
Stasiun Tjilik Riwut Hotspot Kalimantan Tengah Kalimantan Selatan Gambar 18 Persebaran hotspot tahun 2003.
9
atribut itu adalah temperatur (maksimum), curah hujan, penyinaran matahari, tekanan udara, kelembaban (rata-rata), dan kecepatan angin terbesar. Peristiwa cuaca khusus dan arah angin tidak dipilih untuk dilakukan proses penggalian data karena bukan termasuk data numerik. Data yang digunakan dalam proses mining adalah data numerik yang selanjutnya akan diubah ke dalam bentuk data fuzzy.
Stasiun Tjilik Riwut Hotspot Kalimantan Tengah Kalimantan Selatan Gambar 19 Persebaran hotspot tahun 2004. Data klimatologi yang didapatkan meliputi temperatur (oC) terdiri atas temperatur ratarata, maksimum dan minimum, curah hujan (mm), penyinaran matahari (%), peristiwa cuaca khusus, tekanan udara (mb), kelembaban (%), kondisi angin terdiri atas kecepatan ratarata, arah terbanyak dan kecepatan terbesar. Data hotspot dihitung jumlah hotspot per harinya pada tiap tahun, lalu data hotspot yang digunakan adalah data jumlah hotspot per harinya yang kemudian digabung dengan data klimatologi yang sudah dipilih tersebut. Sebelum dilakukan penggalian untuk menemukan pola-pola hubungan asosiatif, data harus melewati tahap praproses terlebih dahulu. Tahap praproses data yang dilakukan sebagai berikut: Pembersihan data Pada data klimatologi yang sudah dipilih masih terdapat nilai yang kosong dan tidak dalam bentuk numerik. Misal pada atribut curah hujan terdapat nilai yang kosong, hal ini berarti tidak terjadi hujan pada hari tersebut. Data tersebut tetap digunakan dengan memberi nilai 0 pada nilai yang kosong dan nilai non numerik tersebut agar dapat dimasukan ke dalam database untuk diolah pada tahap berikutnya. Begitu pula dengan data jumlah hotspot, jika terdapat nilai yang kosong yang berarti tidak ada titik api yang terdeteksi tiap harinya maka diberikan nilai 0 pada data tersebut.
Data klimatologi yang sudah dipilih digabung dengan data jumlah hotspot, sehingga terdapat tujuh atribut data yang diolah untuk menemukan association rules. Hubungan asosiatif antara beberapa item yang dicari dilihat per bulan dari bulan Januari sampai Desember dan per tahun dari tahun 2001 sampai tahun 2004 serta semua data dari tahun 2001 sampai 2004. Transformasi data Tahap transformasi data meliputi: 1. Dilakukan tahap Moving Average orde(5) pada data yang sudah diseleksi. 2. Konversi atribut tanggal menjadi fomat date (YYYY/MM/DD) yang semula kolom tanggal dalam format general. 3. Konversi data hasil seleksi yang memiliki format Microsoft Excel (*.xlsx) menjadi format *.csv untuk dimasukan ke dalam database. Pembentukan data Fuzzy Pembentukan data fuzzy menggunakan fungsi keanggotaan triangular. Batasanbatasan fungsi keanggotaan yang digunakan pada tiap atributnya dipilih berdasarkan pengalaman pakar, yaitu Dr. Erianto Indra Putra S.Hut, M.Si. Fungsi keanggotaan temperatur, curah hujan, penyinaran matahari, tekanan udara, kelembaban, kecepatan angin dan jumlah hotspot secara berurutan dapat dilihat pada Gambar 20 sampai Gambar 26.
Seleksi data Pada tahap ini dilakukan pemilihan enam atribut dari semua atribut yang ada. Ketujuh
Gambar 20 Fungsi keanggotaan temperatur.
10
Gambar 21 Fungsi keanggotaan curah hujan.
Gambar 22 Fungsi keanggotaan penyinaran matahari.
Gambar 25 Fungsi keanggotaan kecepatan angin
Gambar 26 Fungsi hotspot.
keanggotaan
jumlah
Fuzzy Association Rule Mining
Gambar 23 Fungsi keanggotaan tekanan udara.
Fuzzy associaton rules mining adalah tahap untuk menemukan aturan-aturan asosiasi pada data fuzzy. Untuk melihat pola asosiatif tiap tahunnya dilakukan analisis asosiasi pada data tahun 2001, tahun 2002, tahun 2003, tahun 2004, tahun 2001 sampai 2004 (semua data) sedangkan untuk mengetahui pola asosiatif tiap bulan, dilakukan analisis dari bulan Januari sampai Desember pada semua data di tahun 2001-2004 tersebut. Selain itu juga dapat ditemukan aturan-aturan asosiatif per musim yaitu musim hujan (November-Juni) dan kemarau (Juli-Oktober). Pembentukan frequent itemset
Gambar 24 Fungsi keanggotaan kelembaban.
Pada tahap pembentukan frequent itemset sistem men-scan database untuk mendapatkan kandidat 1-itemset (himpunan item yang terdiri dari 1 item) dan menghitung nilai supportnya. Misalnya T adalah himpunan semua data klimatologi dan jumlah hotspot yang dipilih dalam database. Support dari suatu itemset (S) merupakan presentase dari transaksi dalam T yang mengandung S. Itemset yang memiliki nilai support lebih dari atau sama dengan nilai minimum support dinyatakan sebagai frequent itemset sedangkan itemset selainnya tidak diikutsertakan dalam tahap pembentukan itemset selanjutnya.
11
Pembentukan Aturan Asosiasi Aturan-aturan asosiasi dibangkitkan dari frequent itemset yang telah didapatkan sebelumnya. Setiap aturan yang terbentuk dihitung nilai confidence-nya. Semua aturan yang memiliki nilai confidence lebih dari atau sama dengan nilai minimum confidence yang telah ditentukan akan diambil, selainya akan dibuang. Penelitian ini bertujuan menemukan pola asosiasi antara data klimatologi dan jumlah hotspot, oleh karena itu rule-rule yang dihasilkan adalah rule-rule yang pada consequent-nya terdapat item jumlah hotspot. Contoh rule yang consequent-nya terdapat item jumlah hotspot: “CH.KeringJ.banyak”, yang berarti jika curah hujan banyak maka jumlah hotspot yang terdeteksi banyak. Dari rule yang dihasilkan tersebut dapat dilihat faktor-faktor yang dapat mempengaruhi terjadinya kebakaran hutan. Untuk rule “J.banyakCH.Kering” tidak dibangkitkan karena consequent-nya bukan item jumlah hotspot. Pengaruh faktor-faktor iklim terjadinya kebakaran hutan
terhadap
Menurut pakar bidang kebakaran hutan, yang paling mempengaruhi terjadinya kebakaran hutan adalah curah hujan dan kelembaban yang akan menentukan kadar air dari bahan bakar. Pengaruh kelembaban relatif terhadap kejadian kebakaran hutan dapat dilihat pada Gambar 27 dan pengaruh curah hujan terhadap kejadian kebakaran hutan dapat dilihat pada Gambar 28.
dilihat pada Gambar 29. Curah hujan rendah, kelembaban rendah dan temperatur udara yang tinggi dapat memicu terjadinya kebakaran hutan karena kondisi bahan bakar yang mudah sekali terbakar. Namun sebaliknya ketika curah hujan tinggi, kelembaban tinggi dan temperatur udara rendah, yang biasa terjadi pada musim hujan (bulan November-Juni) akan menghasilkan jumlah hotspot yang sedikit.
Gambar 29 Temperatur maksimum kejadian kebakaran hutan.
dan
Kecepatan angin dan penyinaran matahari juga dapat mempengaruhi terjadinya kebakaran hutan. Angin dapat membantu penjalaran api sehingga api terus dapat merembet ke tempat yang belum terbakar. Semakin besar kecepatan angin maka akan semakin cepat api menjalar ke tempat lain dan dapat memperbesar nyala api. Pengaruh kecepatan angin terhadap kejadian kebakaran hutan dapat dilihat pada Gambar 30. Penyinaran matahari dapat membantu proses pengeringan bahan bakar sehingga bahan bakar akan semakin mudah terbakar.
kejadian
Gambar 30 Kecepatan angin dan kejadian kebakaran hutan. Fuller dalam (Thoha 2001) menyatakan bahwa perbedaan pemanasan matahari pada permukaan bumi berperan dalam variasi iklim yang memberikan kontribusi pada bahaya kebakaran hutan. Penyinaran matahari, selain memanaskan permukaan bumi juga memanaskan lapisan udara di bawahnya. Pemanasan udara menimbulkan perbedaan tekanan udara yang menyebabkan terbentuknya pola pergerakan angin sehingga angin akan bergerak dari daerah bertekanan tinggi ke daerah bertekanan rendah.
Temperatur udara yang mempengaruhi suhu bahan bakar dan kemudahannya untuk terbakar. Pengaruh temperatur maksimum terhadap kejadian kebakaran hutan dapat
Variabel utama yang mengontrol kadar air bahan bakar pada bahan bakar mati adalah curah hujan, kelembaban relatif dan suhu. Angin dan penyinaran matahari merupakan faktor penting pada pengeringan bahan bakar,
Gambar 27 Kelembaban relatif dan kejadian kebakaran hutan.
Gambar 28 Curah hujan dan kebakaran hutan.
12
dimana pengaruhnya pada perubahan suhu bahan bakar dan suhu dan kelembaban relatif pada udara yang berbatasan langsung dengan permukaan bahan bakar (Thoha 2001). Oleh karena itu penelitian ini menggunakan atribut temperatur udara, curah hujan, penyinaran matahari, kelembaban, tekanan udara dan kecepatan angin untuk menemukan pola asosiatif terhadap jumlah hotspot yang terdeteksi. Musim Hujan Pada bulan-bulan dengan curah hujan rendah yaitu sekitar bulan November sampai Juni biasanya frekuensi terjadinya kebakaran sedikit. Pada Tabel 5 disajikan rule-rule yang dibangkitkan pada data musim hujan dengan menggunakan minimum support 60% dan minimum confidence 90%. Tabel 5 Rule-rule pada musim hujan Rules T.sedangJ.sedikit CH.keringJ.sedikit SM.sedangJ.sedikit TU.sedangJ.sedikit K.tinggiJ.sedikit Kec.kecilJ.sedikit T.sedang,CH.keringJ.sedikit T.sedang,SM.sedangJ.sedikit T.sedang,TU.sedangJ.sedikit T.sedang,K.tinggiJ.sedikit CH.kering,SM.sedangJ.sedikit CH.kering,TU.sedangJ.sedikit CH.kering,K.tinggiJ.sedikit CH.kering,Kec.kecilJ.sedikit SM.sedang,TU.sedangJ.sedikit SM.sedangTU.sedang,J.sedikit SM.sedang,K.tinggiJ.sedikit TU.sedang,K.tinggiJ.sedikit TU.sedang,Kec.kecilJ.sedikit CH.kering,TU.sedang,Kec.kecil J.sedikit
Conf(%) 99.32 97.36 98.48 97.14 99.60 97.36 99.24 99.35 99.23 99.84 98.59 97.05 99.54 97.38 98.34 90.03 99.83 99.54 97.08 97.09
Dari rule-rule yang dihasilkan data musim hujan terlihat bahwa ketika musim hujan jumlah hotspot yang dideteksi sedikit. Faktorfaktor yang mempengaruhi jumlah hotspot sedikit adalah temperatur udara sedang, penyinaran matahari sedang, tekanan udara sedang, kelembaban tinggi dan kecepatan angin kecil. Namun ada rule yang tidak sesuai dengan pengetahuan dari pakar, yaitu “CH.keringJ.sedikit”. Pengetahuan yang didapatkan dari pakar, jika curah hujan kering maka jumlah hotspot akan semakin banyak. Dari rule tersebut dapat dinyatakan bahwa pada musim hujan terdapat kondisi jika curah
hujan kering maka kemungkinan besar jumlah hotspot yang terdeteksi sedikit sedikit. Hal ini terjadi karena item CH.kering terjadi bersamaan dengan item J.sedikit memilki frekuensi yang besar dalam dataset yang digunakan. Pada Tabel 5 dapat dilihat pada musim hujan terdapat juga rule yang menggandung tiga dan empat item. Ini berarti jumlah hotspot yang terdeteksi bisa dipengaruhi oleh tiga atau empat faktor iklim. Misalnya, “T.sedang,K.tinggiJ.sedikit”, rule ini menyatakan jika temperatur udara sedang dan kelembaban udaranya tinggi maka kemungkinan besar jumlah hotspot yang terdeteksi banyak. Musim Kemarau Kebakaran hutan sering terjadi pada musim kemarau sekitar bulan Juli sampai Oktober. Puncak kebakaran hutan kota Kalimantan Tengah dan Kalimantan Selatan dari tahun 2001 sampai 2004 terjadi pada bulan Agustus dan September. Beberapa rule yang dihasilkan pada data bulan Agustus menggunakan minimum support 20% dan minimum confidence 35%. dapat dilihat dalam Tabel 6 dan rule-rule pada data bulan September menggunakan minimum support 20% dan minimum confidence 30% dapat dilihat pada Tabel 7. Untuk rule-rule pada bulan lainnya disajikan pada Lampiran 2. Dari Tabel 6 dapat dilihat bahwa faktor yang mempengaruhi jumlah hotspot banyak pada bulan Agustus adalah temperatur sedang, curah hujan kering, penyinaran matahari banyak, tekanan udara sedang, kelembaban sedang, dan kecepatan angin kecil. Pada bulan Agustus juga terjadi kondisi jumlah hotspot yang dideteksi sedikit. Jumlah hotspot sedikit dideteksi ketika temperatur sedang, curah hujan kering, tekanan udara sedang, kelembaban sedang atau kecepatan kecil. Temperatur sedang memiliki keterkaitan dengan jumlah hotspot banyak dengan nilai confidence sebesar 48.65% dan memiliki keterkaitan dengan jumlah hotspot sedikit dengan nilai confidence sebesar 37.84%. Hal ini menunjukkan bahwa tingkat kepercayaan atau tingkat kebenaran rule “Jika temperatur sedang maka jumlah hotspot banyak” lebih besar daripada rule“Jika temperatur sedang maka jumlah hotspot sedikit”.
13
Tabel 6 Rule-rule bulan Agustus Rules T.sedangJ.sedikit T.sedangJ.banyak CH.keringJ.sedikit CH.keringJ.banyak SM.sedangJ.sedikit SM.banyakJ.banyak TU.sedangJ.sedikit TU.sedangJ.banyak K.sedangJ.sedikit K.sedangJ.banyak Kec.kecilJ.sedikit Kec.kecilJ.banyak
Conf(%) 48.65 37.84 41.13 39.52 52.54 42.62 37.27 41.82 38.32 43.93 41.38 37.93
Dari Tabel 7 dapat dilihat bahwa faktor yang mempengaruhi jumlah hotspot banyak pada bulan September adalah temperatur sedang, curah hujan kering, tekanan udara sedang, kelembaban sedang, dan kecepatan angin sedang. Sedangkan untuk jumlah hotspot sedikit dipengaruhi ketika temperatur sedang, curah hujan kering, sinar matahari sedang, tekanan udara sedang atau kecepatan angin kecil. Tabel 7 Rule-rule bulan September Rules T.sedangJ.banyak T.sedangJ.sedikit CH.keringJ.banyak CH.keringJ.sedikit SM.sedangJ.sedikit TU.sedangJ.banyak TU.sedangJ.sedikit K.sedangJ.banyak K.sedangJ.sedikit Kec.kecilJ.banyak Kec.kecilJ.sedikit
Conf(%) 31.82 48.86 31.36 50.85 55.41 31.58 52.63 32.94 48.24 33.33 48.57
Data Tahun 2001 Rule-rule yang dibangkitkan pada data tahun 2001 dengan menggunakan minimum support 60% dan minimum confidence 80% dapat dilihat pada Tabel 8. Data Tahun 2002 Rule-rule yang dibangkitkan pada data tahun 2002 dengan menggunakan minimum support 60% dan minimum confidence 80% dapat dilihat pada Tabel 9.
Tabel 8 Rule-rule data tahun 2001 Rules T.sedangJ.sedikit CH.keringJ.sedikit SM.sedangJ.sedikit TU.sedangJ.sedikit Kec.kecilJ.sedikit T.sedang,CH.keringJ.sedikit T.sedangCH.kering,J.sedikit T.sedang,TU.sedangJ.sedikit T.sedangTU.sedang,J.sedikit CH.kering,SM.sedangJ.sedikit SM.sedangCH.kering,J.sedikit CH.kering,TU.sedangJ.sedikit CH.keringTU.sedang,J.sedikit TU.sedangCH.kering,J.sedikit SM.sedang,TU.sedangJ.sedikit SM.sedangTU.sedang,J.sedikit
Conf (%) 92.36 87.46 92.83 87.46 85.50 91.80 85.45 91.70 84.36 92.21 84.91 86.60 81.05 81.05 92.49 88.30
Tabel 9 Rule-rule data tahun 2002 Rules CH.keringJ.sedikit TU.sedangJ.sedikit Kec.kecilJ.sedikit CH.kering,TU.sedangJ.sedikit TU.sedangCH.kering,J.sedikit CH.kering,Kec.kecilJ.sedikit Kec.kecilCH.kering,J.sedikit
Conf (%) 82.77 82.45 85.14 82.59 80.13 85.50 83.33
Data Tahun 2003 Rule-rule yang dibangkitkan pada data tahun 2003 dengan menggunakan minimum support 60% dan minimum confidence 80% dapat dilihat pada Tabel 10. Tabel 10 Rule-rule data tahun 2003 Rules T.sedangJ.sedikit CH.keringJ.sedikit SM.sedangJ.sedikit TU.sedangJ.sedikit Kec.kecilJ.sedikit T.sedang,TU.sedangJ.sedikit T.sedangTU.sedang,J.sedikit CH.kering,SM.sedangJ.sedikit CH.kering,TU.sedangJ.sedikit SM.sedang,TU.sedangJ.sedikit TU.sedang,Kec.kecilJ.sedikit
Conf (%) 86.08 80.36 83.44 82.13 81.85 86.27 80.59 81.75 80.25 83.62 82.27
14
Data Tahun 2004
KESIMPULAN DAN SARAN
Rule-rule yang dibangkitkan pada data tahun 2004 dengan menggunakan minimum support 60% dan minimum confidence 80% dapat dilihat pada Tabel 11. All Data (Tahun 2001-2004) Rule-rule yang dibangkitkan pada data tahun 2001 sampai tahun 2004 (Alldata) dengan menggunakan minimum support 60% dan minimum confidence 80% dapat dilihat pada Tabel 12. Tabel 11 Rule-rule data tahun 2004 Rules T.sedangJ.sedikit CH.keringJ.sedikit SM.sedangJ.sedikit TU.sedangJ.sedikit K.tinggiJ.sedikit Kec.kecilJ.sedikit CH.kering,TU.sedangJ.sedikit CH.kering,Kec.kecilJ.sedikit SM.sedang,TU.sedangJ.sedikit SM.sedangTU.sedang,J.sedikit TU.sedang,K.tinggiJ.sedikit K.tinggiTU.sedang,J.sedikit TU.sedang,Kec.kecilJ.sedikit
Conf (%) 92.19 86.54 93.54 90.38 97.62 86.52 89.01 85.22 95.73 85.17 98.68 89.29 89.10
Tabel 12 Rule-rule data all data Rules T.sedangJ.sedikit CH.keringJ.sedikit SM.sedangJ.sedikit TU.sedangJ.sedikit Kec.kecilJ.sedikit CH.kering,TU.sedangJ.sedikit CH.kering,Kec.kecilJ.sedikit
Conf (%) 88.72 84.28 90.25 85.58 84.77 84.51 83.88
Terdapat beberapa rule yang sering muncul pada setiap tahunnya. Rule yang sering muncul pada setiap tahunnya tersebut disajikan dalam Tabel 13. Dari rule-rule yang sering muncul terlihat bahwa setiap tahunnya jumlah hotspot yang dideteksi sedikit ketika kondisi curah hujan kering, tekanan udara sedang atau kecepatan angin kecil. Tabel 13 Rule-rule yanga sering muncul pada data 2001-2004 Conf Rules (%) CH.keringJ.sedikit 82.77 TU.sedangJ.sedikit 82.45 Kec.kecilJ.sedikit 85.14 CH.kering,TU.sedangJ.sedikit 82.59
Kesimpulan Dari rule-rule hasil percobaan yang dilakukan pada data klimatologi dan jumlah hotspot tahun 2001 sampai 2004 diperoleh kesimpulan sebagai berikut: 1. Pada musim hujan yaitu bulan November sampai Juni jumlah hotspot yang dideteksi sedikit. Faktor yang mempengaruhinya adalah temperatur udara sedang, penyinaran matahari sedang, tekanan udara sedang, kelembaban tinggi dan kecepatan angin kecil. 2. Pada musim kemarau, khususnya bulan Agustus dan September adalah puncak kebakaran hutan kota Kalimantan Tengah dan Kalimantan Selatan dari tahun 2001 sampai 2004. 3. Jumlah hotspot banyak pada bulan Agustus dipengaruhi oleh temperatur sedang, curah hujan kering, penyinaran matahari banyak, tekanan udara sedang, kelembaban sedang, dan kecepatan angin kecil. 4. Jumlah hotspot banyak pada bulan September dipengaruhi oleh temperatur sedang, curah hujan kering, tekanan udara sedang, kelembaban sedang, dan kecepatan angin sedang. 5. Rule-rule yang sering muncul setiap tahunnya adalah CH.keringJ.sedikit, TU.sedangJ.sedikit,Kec.kecilJ.sedikit, CH.kering,TU.sedangJ.sedikit. 6. Data yang digunakan pada penelitian ini masih bersifat unbalance sehingga masih terdapat rule-rule yang tidak akurat. Saran Penelitian ini masih memiliki kekurangan dan dapat dikembangkan menjadi aplikasi yang lebih baik lagi. Adapun saran yang dapat dilakukan pada penelitian-penelitian selanjutnya antara lain: 1. Penggunaan data klimatologi dan jumlah hotspot dalam kurun waktu yang lebih lama, sehingga pola asosiatif yang ditemukan menjadi lebih akurat. 2. Penggunaan fungsi keanggotaan lain seperti Trapezoidal, Gaussian, Sigmoidal, Bell Shaped dan lain-lain agar didapatkan himpunan fuzzy sesuai dengan input data. 3. Melibatkan pengalaman-pengalaman pakar klimatologi secara langsung dalam pembentukan fungsi keanggotaan. 4. Pada proses pembentukan himpunan fuzzy dapat menggunakan algoritma fuzzy Clustering, seperti Fuzzy C-Means, Fuzzy
15
Subtractive Clustering dan Fuzzy Adaptive Clustering. 5. Dikembangkan menjadi sistem fuzzy spatio-temporal Association Rule Mining.
Permana MY. 2011. Indexing Spatio-Temporal Data pada Data Hotspot [skripsi]. Bogor: Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor.
DAFTAR PUSTAKA
Pramudiono I. 2003. Pengantar Data Mining: Menambang Permata Pengetahuan di Gunung Data. IlmuKomputer.Com
Agrawal R, Srikant R. 1994. Fast Algorithms for Mining Association Rules. Santiago: In Proc. 1994 International Conference Very Large Data Bases (VLDB). Brown AA, Davis P. 1973. Forest Fire Control and Use.New York: McGraw-Hill Books Company. Hlm 658 Çalargün SÜ. 2008. Fuzzy Association Rule Mining from Spatio-Temporal Data: An Analysis of Meteorological Data in Turkey [Tesis]. Turkey: Department of Computer Engineering, The Graduate School of Natutal and Applied Sciences, Middle East Technical University. Chandler CP, Cheney L, Trabaud and Williams. 19831. Fire in Forestry Vol. I Forest Fire Behaviour and Effects. John Wiley and Sons, Inc. Canada. Darmaningrat EWT. 2008. Analisa Pola Data Hasil Tangkapan Ikan dengan Metode Association Rule Menggunakan Algoritma Apriori [skripsi]. Malang: Program Studi Ilmu Komputer, Jurusan Matematika, FMIPA, Universitas Brawijaya. Fadli MH. 2011. Data Warehouse SpatioTemporal Kebakaran Hutan Menggunakan GeoMondrian dan GeoServer [skripsi]. Bogor : Departemen Ilmu Komputer, Institut Pertanian Bogor. Hariona P. 2009. Spatial Association Rule Mining terhadap Data Sebaran bangunan Kota Bogor [skripsi]. Bogor: Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor.
Putra EI. 2011. Kebakaran Gambut, Anomali SST dan Curah Hujan. Bogor:Departemen Silvikultur, Fakultas Kehutanan, Institut Pertanian Bogor. Ratnasari E. 2000. Pemantauan Kebakaran Hutan dengan Menggunakan Data Citra NOAA-AVHRR dan Citra Landsat TM: Studi Kasus di Kota Kalimantan Timur [skripsi]. Bogor: Fakultas Kehutanan, Institut Pertanian Bogor. Tan P, Steinbach M, Kumar V. 2006. Intoduction to Data Mining. USA : Pearson Education, Inc Thoha AS. Penggunaan Data Hotspot untuk Monitoring Kebakaran Hutan dan Lahan Di Indonesia [Makalah]. Medan: Departemen Kehutanan, Fakultas Pertanian, Universitas Sumatera Utara. Thoha AS. Cuaca Kebakaran Hutan Kaitannya dengan Upaya Pencegaham Kebakaran Hutan di Indonesia [Makalah]. Medan: Program Ilmu Hutan, Fakultas Pertanian, Universitas Sumatera Utara. Zubaidah A, Arief M. 2004. Distribusi Spasial Hotspot dan Sebaran Asap Indikator Kebakaran Hutan/Lahan di Pulau Sumatera dan Kalimantan Tahun 2002. Jurnal Pengindraan Jauh dan Pengolahan Data Citra Digital Vol. 1, No.1, juni 2004:58-65
Han J, Kamber M. 2001. Data Mining: Concepts and Techniques. USA : Morgan Kaufmann Publishers. Kantardzic M. 2003. Data Mining: Concepts, Models, Methods, and Algorithms.USA : IEEE Press. Lutfi M. 2010. Penentuan Pola Sekuensial Data Sirkulasi Perpustakaan Menggunakan Algoritme AprioriAll (Studi Kasus di Perpustakaan IPB) [skripsi]. Bogor: Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor.
16
LAMPIRAN
Lampiran 1 Contoh data mentah sebelum dilakukan praproses BADAN METEOROLOGI DAN GEOFISIKA BALAI BESAR METEOROLOGI DAN GEOFISIKA WILAYAH III STASIUN METEOROLOGI TJILIK RIWUT JL A DONIS SAMAD PALANGKA RAYA DATA KLIMATOLOGI BULAN : DESEMBER 2003 GARIS LINTANG GARIS BUJUR TINGGI DIATAS PERMUKAAN LAUT
: 002° 13' 34''LS : 113° 56' 42' 'BT : 27 Meter
NO.STASIUN : 96655
18
Lanjutan
Catatan :
kolom 4 dan 14
=
2 x 07.00 + 13.00 + 18.00 4
kolom
=
Rata-rata dari 8 jam
8
Mengetahui : KEPALA STASIUN METEOROLOGI TJILIK RIWUT
HIDAYAT, SP Nip. 120 112 636
19
Lampiran 2 Rule-rule pada data tiap bulan Rule-rule pada data bulan Januari dengan minsup 70% dan minconf 95% Rules T.sedang-->J.sedikit CH.kering-->J.sedikit SM.sedang-->J.sedikit TU.sedang-->J.sedikit K.tinggi-->J.sedikit T.sedang,CH.kering-->J.sedikit CH.kering-->T.sedang,J.sedikit T.sedang,SM.sedang-->J.sedikit SM.sedang-->T.sedang,J.sedikit T.sedang,TU.sedang-->J.sedikit TU.sedang-->T.sedang,J.sedikit T.sedang,K.tinggi-->J.sedikit K.tinggi-->T.sedang,J.sedikit CH.kering,TU.sedang-->J.sedikit CH.kering,K.tinggi-->J.sedikit TU.sedang,K.tinggi-->J.sedikit T.sedang,CH.kering,TU.sedang-->J.sedikit CH.kering,TU.sedang-->T.sedang,J.sedikit T.sedang,CH.kering,K.tinggi-->J.sedikit CH.kering,K.tinggi-->T.sedang,J.sedikit T.sedang,TU.sedang,K.tinggi-->J.sedikit TU.sedang,K.tinggi-->T.sedang,J.sedikit
Conf(%) 100 100 100 100 100 100 98.21 100 100 100 98.17 100 99.09 100 100 100 100 97.98 100 98.98 100 98.95
Rule-rule pada data bulan Februari dengan minsup 70 % dan minconf 95% Rules T.sedang-->J.sedikit CH.kering-->J.sedikit SM.sedang-->J.sedikit TU.sedang-->J.sedikit K.tinggi-->J.sedikit Kec.kecil-->J.sedikit T.sedang,CH.kering-->J.sedikit T.sedang,SM.sedang-->J.sedikit T.sedang,K.tinggi-->J.sedikit CH.kering,SM.sedang-->J.sedikit CH.kering,TU.sedang-->J.sedikit CH.kering,K.tinggi-->J.sedikit CH.kering,Kec.kecil-->J.sedikit Kec.kecil-->CH.kering,J.sedikit SM.sedang,TU.sedang-->J.sedikit SM.sedang,K.tinggi-->J.sedikit T.sedang,CH.kering,SM.sedang-->J.sedikit T.sedang,SM.sedang,K.tinggi-->J.sedikit
Conf(%) 98.98 99.04 98.95 98.95 98.9 100 98.89 98.88 98.82 98.85 98.84 98.80 100 97.59 98.77 98.84 98.77 98.77
20
Lanjutan Rule-rule bulan Maret dengan minsup 70 % dan minconf 95% Rules T.sedang-->J.sedikit CH.kering-->J.sedikit SM.sedang-->J.sedikit TU.sedang-->J.sedikit Kec.kecil-->J.sedikit T.sedang,CH.kering-->J.sedikit T.sedang,SM.sedang-->J.sedikit T.sedang,TU.sedang-->J.sedikit T.sedang-->TU.sedang,J.sedikit T.sedang,Kec.kecil-->J.sedikit CH.kering,TU.sedang-->J.sedikit CH.kering-->TU.sedang,J.sedikit SM.sedang,TU.sedang-->J.sedikit SM.sedang-->TU.sedang,J.sedikit TU.sedang,Kec.kecil-->J.sedikit T.sedang,CH.kering,TU.sedang-->J.sedikit T.sedang,CH.kering-->TU.sedang,J.sedikit T.sedang,SM.sedang,TU.sedang-->J.sedikit T.sedang,SM.sedang-->TU.sedang,J.sedikit
Conf(%) 100 99.07 100 99.16 100 100 100 100 95.37 100 99.03 95.33 100 97,00 100 100 95.60 100 96.70
Rule-rule pada data bulan April dengan minsup 70 % dan minconf 95% Rules CH.kering-->J.sedikit SM.sedang-->J.sedikit TU.sedang-->J.sedikit K.tinggi-->J.sedikit Kec.kecil-->J.sedikit CH.kering,SM.sedang-->J.sedikit CH.kering,TU.sedang-->J.sedikit CH.kering,K.tinggi-->J.sedikit CH.kering,Kec.kecil-->J.sedikit CH.kering-->Kec.kecil,J.sedikit SM.sedang,TU.sedang-->J.sedikit SM.sedang,Kec.kecil-->J.sedikit TU.sedang,K.tinggi-->J.sedikit TU.sedang,Kec.kecil-->J.sedikit K.tinggi,Kec.kecil-->J.sedikit CH.kering,TU.sedang,Kec.kecil-->J.sedikit SM.sedang,TU.sedang,Kec.kecil-->J.sedikit
Conf(%) 100 100 100 100 100 100 100 100 100 95.33 100 100 100 100 100 100 100
Rule-rule pada data bulan Mei dengan minsup 70 % dan minconf 95% Rules CH.kering-->J.sedikit TU.sedang-->J.sedikit Kec.kecil-->J.sedikit CH.kering,TU.sedang-->J.sedikit CH.kering,Kec.kecil-->J.sedikit TU.sedang,Kec.kecil-->J.sedikit TU.sedang-->Kec.kecil,J.sedikit CH.kering,TU.sedang,Kec.kecil-->J.sedikit CH.kering,TU.sedang-->Kec.kecil,J.sedikit
Conf(%) 98.25 98.13 98.32 97.94 98.17 98.10 96.26 97.89 95.88
21
Lanjutan Rule-rule pada data bulan Juni dengan minsup 70 % dan minconf 80% Rules CH.kering-->J.sedikit TU.sedang-->J.sedikit Kec.kecil-->J.sedikit CH.kering,TU.sedang-->J.sedikit TU.sedang-->CH.kering,J.sedikit CH.kering,Kec.kecil-->J.sedikit Kec.kecil-->CH.kering,J.sedikit
Conf(%) 88.70 87.96 87.85 87.38 83.33 87.50 85.05
Rule-rule pada data bulan Juli dengan minsup 70 % dan minconf 80% Rules T.sedang-->J.sedikit CH.kering-->J.sedikit TU.sedang-->J.sedikit Kec.kecil-->J.sedikit T.sedang,CH.kering-->J.sedikit T.sedang-->CH.kering,J.sedikit T.sedang,TU.sedang-->J.sedikit T.sedang-->TU.sedang,J.sedikit T.sedang,Kec.kecil-->J.sedikit Kec.kecil-->T.sedang,J.sedikit CH.kering,TU.sedang-->J.sedikit TU.sedang-->CH.kering,J.sedikit CH.kering,Kec.kecil-->J.sedikit Kec.kecil-->CH.kering,J.sedikit TU.sedang,Kec.kecil-->J.sedikit Kec.kecil-->TU.sedang,J.sedikit T.sedang,CH.kering,TU.sedang-->J.sedikit T.sedang,CH.kering-->TU.sedang,J.sedikit T.sedang,TU.sedang-->CH.kering,J.sedikit
Conf(%) 88.39 85.95 86.09 87.96 88.07 85.71 88.35 81.25 88,00 81.48 85.71 83.48 87.62 85.19 87.88 80.56 88,00 80.73 85.44
Rule-rule pada data bulan Oktober dengan minsup 50 % dan minconf 60% Rules CH.kering-->J.sedikit TU.sedang-->J.sedikit CH.kering,TU.sedang-->J.sedikit CH.kering-->TU.sedang,J.sedikit TU.sedang-->CH.kering,J.sedikit
Conf(%) 65.29 69.72 68.87 60.33 66.97
Rule-rule pada data bulan November dengan minsup 70 % dan minconf 95% Rules CH.kering-->J.sedikit K.tinggi-->J.sedikit TU.sedang,K.tinggi-->J.sedikit K.tinggi-->TU.sedang,J.sedikit
Conf(%) 95,00 100 100 100
22
Lanjutan Rule-rule pada data bulan Desember dengan minsup 70 % dan minconf 95% Rules T.sedang-->J.sedikit CH.kering-->J.sedikit SM.sedang-->J.sedikit TU.sedang-->J.sedikit K.tinggi-->J.sedikit T.sedang,CH.kering-->J.sedikit T.sedang,TU.sedang-->J.sedikit T.sedang,K.tinggi-->J.sedikit CH.kering,TU.sedang-->J.sedikit CH.kering,K.tinggi-->J.sedikit TU.sedang,K.tinggi-->J.sedikit T.sedang,CH.kering,K.tinggi-->J.sedikit
Conf(%) 99.12 99.11 98.90 99.06 100 99.02 98.96 100 98.94 100 100 100
23