KLASIFIKASI KERAPATAN TITIK API DI BENGKALIS RIAU DENGAN MENGGUNAKAN ALGORITME POHON KEPUTUSAN ID3 SPASIAL
ROUDHOTUL JANNAH
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Kerapatan Titik Api di Bengkalis Riau dengan Menggunakan Algoritme Pohon Keputusan ID3 Spasial adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Juli 2014 Roudhotul Jannah NIM G64100126
ABSTRAK ROUDHOTUL JANNAH. Klasifikasi Kerapatan Titik Api di Bengkalis Riau dengan Menggunakan Algoritme Pohon Keputusan ID3 Spasial. Dibimbing oleh IMAS SUKAESIH SITANGGANG. Kebakaran hutan dianggap sebagai masalah tahunan di Indonesia. Sekitar 20.000 titik api tercatat setiap tahunnya pada periode 2001-2012 di Pulau Sumatera. Kemunculan titik api merupakan indikator adanya kebakaran hutan. Penelitian ini bertujuan untuk menentukan model klasifikasi berdasarkan sejarah data kebakaran hutan di Kabupaten Bengkalis, Provinsi Riau Indonesia untuk memprediksi kerapatan titik api. Data yang digunakan dalam penelitian ini adalah data titik api di Bengkalis tahun 2008. Karakteristik wilayah penelitian termasuk tutupan lahan, sumber pendapatan masyarakat, curah hujan, temperatur, dan kecepatan angin. Metode yang digunakan dalam penelitian ini adalah algoritme pohon keputusan ID3 spasial. Penelitian ini telah berhasil membentuk dua pohon keputusan untuk mengklasifikasikan wilayah menjadi tiga kategori kerapatan titik api yaitu kategori low, medium, dan high. Akurasi tertinggi pohon keputusan adalah 60,47% pada set pengujian di wilayah Kabupaten Rokan Hilir, provinsi Riau Indonesia. Kata kunci: algoritme ID3 spasial, bengkalis, kebakaran hutan, pohon keputusan, titik api
ABSTRACT ROUDHOTUL JANNAH. Hotspot Density Classification in Bengkalis Riau using Spatial ID3 Decision Tree Algorithm. Supervised by IMAS SUKAESIH SITANGGANG. Forest fire is considered as a yearly problem in Indonesia. About 20,000 hotspots were recorded each year in the period of 2001-2012 in the Sumatera Island. Hotspot occurrence is an indicator for forest fire events. This research aims to determine the classification model based on historical forest fire data in Bengkalis district, Riau Province Indonesia to predict density of hotspots. The data used in this research are hotspots data in Bengkalis in 2008. Characteristics of the study area includes land cover, income source of community, precipitation, temperature, and wind speed. The method applied in this research is the spatial ID3 decision tree algorithm. This research has successfully produced two decision trees to classify the areas into three categories of hotspot density namely low, medium, and high categories. The highest-accuracy of decision tree is 60.47% on the testing set in the area of Rokan Hilir district, Riau province Indonesia. Keywords: bengkalis, decision tree, forest fire, hotspot, spatial ID3 algorithm
KLASIFIKASI KERAPATAN TITIK API DI BENGKALIS RIAU DENGAN MENGGUNAKAN ALGORITME POHON KEPUTUSAN ID3 SPASIAL
ROUDHOTUL JANNAH
Skripsi Sebagai salah satu syarat memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
Penguji: 1 Hari Agung Adrianto, SKom MSi 2 Endang Purnama Giri, SKom MKom
Judul : Klasifikasi Kerapatan Titik Api di Bengkalis Riau dengan Menggunakan Algoritme Pohon Keputusan ID3 Spasial Nama : Roudhotul Jannah NRP : G64100126
Disetujui oleh
Dr Imas Sukaesih Sitanggang, SSi MKom Pembimbing I
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen
Tanggal Lulus:
PRAKATA Puji dan syukur atas kehadirat Allah SWT yang telah memberikan rahmat dan karunia-Nya, sehingga penulis dapat menyelesaikan tugas akhir dengan judul Klasifikasi Kerapatan Titik Api di Bengkalis Riau dengan Menggunakan Algoritme Pohon Keputusan ID3 Spasial. Penelitian ini dilaksanakan mulai Oktober 2013 sampai dengan Juni 2014, bertempat di Departemen Ilmu Komputer. 1 2
3
4 5 6 7
Penulis ingin menyampaikan ucapan terima kasih khususnya kepada: Orang tua dan keluarga tercinta yang telah memberikan doa dan dukungan yang besar untuk penulis dalam mengerjakan tugas akhir ini. Ibu Dr Imas Sukaesih Sitanggang, SSi MKom, selaku dosen pembimbing tugas akhir yang telah memberikan bimbingan dan arahannya selama pengerjaan tugas akhir ini. Bapak Hari Agung Adrianto, SKom MSi dan Bapak Endang Purnama Giri, SKom MKom, selaku dosen penguji tugas akhir yang telah memberikan kritik dan saran untuk tugas akhir ini. Sahabat tercinta yang selalu mendukung dan menyemangati penulis selama penulis mengerjakan tugas akhir ini. Keluarga Family House, khususnya Papi dan Mami, yang telah memberikan doa dan dukungan kepada penulis selama pengerjaan tugas akhir ini. Teman-teman di Departemen Ilmu Komputer, khususnya angkatan 47 (Pixels IPB), yang telah memberikan doa dan dukungan untuk penulis. Semua pihak-pihak yang tidak dapat disebutkan satu persatu yang telah memberikan dukungan dan bantuan dalam pengerjaan tugas akhir ini.
Semoga tugas akhir ini dapat bermanfaat untuk pihak-pihak terkait pencegahan kebakaran hutan.
Bogor, Juli 2014
Roudhotul Jannah
DAFTAR ISI DAFTAR TABEL
viii
DAFTAR GAMBAR
viii
DAFTAR LAMPIRAN
viii
PENDAHULUAN
1
Latar Belakang
1
Perumusan Masalah
2
Tujuan Penelitian
2
Manfaat Penelitian
2
Ruang Lingkup Penelitian
2
METODE PENELITIAN
2
Data dan Area Studi Penelitian
2
Tahapan Penelitian
3
Peralatan Penelitian
6
HASIL DAN PEMBAHASAN Praproses Data
6 6
Pembuatan Model Klasifikasi
11
Pengujian dan Evaluasi Model Klasifikasi
13
Presentasi Model
16
KESIMPULAN DAN SARAN
16
Kesimpulan
16
Saran
16
DAFTAR PUSTAKA
17
LAMPIRAN
18
RIWAYAT HIDUP
21
DAFTAR TABEL 1 2 3 4 5 6 7 8 9 10
Pergantian nama atribut dan nama layer Pergantian nilai atribut dari layer sumber pendapatan (l0) Pergantian nilai atribut dari layer tutupan lahan (l1) Pergantian nilai atribut dari layer curah hujan (l2) Pergantian nilai atribut dari layer temperatur (l3) Pergantian nilai atribut dari layer kecepatan angin (l4) Modul Python yang digunakan (Sitanggang et al. 2013) Kombinasi layer masukan Jumlah kelas aktual dan hasil prediksi data uji pertama Jumlah kelas aktual dan hasil prediksi data uji kedua
9 10 10 10 10 10 11 12 15 15
DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9 10
Diagram alir penelitian Algoritme pohon keputusan ID3 spasial Contoh layer yang bertumpangan Persebaran titik api berupa titik Sumber pendapatan Kabupaten Bengkalis Tutupan lahan di Kabupaten Bengkalis Layer cuaca Layer kerapatan titik api berupa poligon Potongan pohon keputusan data latih pertama Potongan pohon keputusan data latih kedua
3 4 5 7 7 7 8 9 13 13
LAMPIRAN 1 Aturan-aturan pohon keputusan dari data latih pertama 2 Aturan-aturan pohon keputusan dari data latih kedua
18 19
1
PENDAHULUAN Latar Belakang Kebakaran hutan merupakan permasalahan yang terus berulang di Indonesia. Tercatat dalam data historis bahwa antara tahun 2001 sampai tahun 2012, di pulau Sumatera mengalami rata-rata sekitar 20 000 peringatan titik api setiap tahunnya dengan tingkat keyakinan deteksi lebih dari 30 persen (Austin et al. 2013). Kemunculan titik api di beberapa wilayah ini merupakan indikator adanya kebakaran hutan. Dengan adanya kemunculan titik api ini masyarakat sekitar dapat lebih waspada dan menghindari beberapa hal yang dapat menyebabkan kebakaran hutan di sekitar wilayah munculnya titik api tersebut. Kebakaran hutan ini juga berpengaruh pada negara tetangga seperti Singapura dan Malaysia. Pada hari Jumat, 21 Juni 2013, terjadi kebakaran hutan di wilayah Riau, dan Indeks Standar Polusi (ISP) yang digunakan untuk mengukur polusi udara di Singapura meningkat tajam hingga angka rekor 400, jauh lebih tinggi dari angka 226 yang terekam pada peristiwa kebakaran hutan besar pada tahun 1998. Angka 400 tersebut jauh lebih tinggi juga dari angka 100 yang merupakan batas maksimum yang dapat diterima sebagai kualitas udara yang sehat (Austin et al. 2013). Informasi kemunculan titik api ini merupakan data spasial yang berukuran besar karena dicatat setiap hari. Salah satu metode untuk menganalisis data titik api adalah spatial data mining di antaranya menggunakan algoritme pohon keputusan ID3 spasial. Teknik pohon keputusan spasial ini dapat digunakan untuk membuat model klasifikasi pada data spasial yang berukuran besar. Terdapat beberapa penelitian terkait dengan pembuatan model klasifikasi yang menggunakan teknik pohon keputusan, salah satunya adalah penelitian yang mengusulkan sebuah metode baru untuk memperluas penerapan pohon keputusan konvensional terhadap dataset spasial (Li & Claramunt 2006). Entropi konvensional yang digunakan dalam pengolahan pohon keputusan diganti dengan entropi ukuran ruang yang memperhitungkan pengaruh ruang dan autokorelasi spasial. Pergantian ini menyebabkan pohon keputusan berbasis entropi spasial dapat menggunakan struktur hierarki untuk mencerminkan distribusi spasial data geografis dan menghasilkan klasifikasi yang memperhitungkan dimensi ruang. Penelitian lain dalam klasifikasi spasial adalah penelitian mengenai algoritme ID3 yang diperluas (Sitanggang et al. 2013). Dalam penelitian tersebut, sebuah dataset spasial disimpan dalam suatu set layer yang mana layer tersebut dibagi menjadi dua kategori, yaitu layer penjelas dan layer target. Semua layer disajikan dalam fitur diskret (poligon, garis, dan titik). Algoritme ini menghitung information gain spasial sebagai perluasan dari information gain pada algoritme ID3 non-spasial. Ukuran spasial dihasilkan dari hubungan spasial baik topologi maupun metrik (jarak) yang digunakan dalam formula information gain spasial. Algoritme ini memilih sebuah layer penjelas yang memiliki information gain spasial tertinggi sebagai layer pemisah terbaik. Layer ini memisahkan dataset ke dalam partisi yang lebih kecil semurni mungkin seperti semua tuple dalam partisi tersebut berasal dari kelas yang sama.
2 Dalam penelitian ini, algoritme pohon keputusan ID3 spasial (Rinzivillo dan Turini 2004) akan diterapkan pada data titik api Kabupaten Bengkalis tahun 2008 dan data karakteristik wilayah Kabupaten Bengkalis seperti sumber pendapatan, tutupan lahan, curah hujan (mm/day), temperatur (K), dan kecepatan angin (m/s). Perumusan Masalah Kebakaran hutan menjadi salah satu permasalahan yang serius di Indonesia salah satunya di Kabupaten Bengkalis, Riau. Oleh karena itu, pencegahan kebakaran hutan sangat diperlukan. Salah satu upaya pencegahan kebakaran hutan adalah dengan membuat model klasifikasi yang dapat digunakan untuk memprediksi kerapatan titik api yang muncul di wilayah tersebut dengan menggunakan algoritme pohon keputusan ID3 spasial. Tujuan Penelitian Tujuan dari penelitian ini adalah menentukan model klasifikasi dari kerapatan titik api di wilayah Bengkalis dengan menggunakan algoritme pohon keputusan ID3 spasial. Selain itu, tujuan penelitian ini adalah mengevaluasi pohon keputusan spasial yang dihasilkan oleh algoritme ID3 spasial. Manfaat Penelitian Model klasifikasi kerapatan titik api yang dihasilkan dalam penelitian ini diharapkan dapat digunakan dalam memprediksi kemunculan titik api sebagai upaya pencegahan kebakaran hutan. Ruang Lingkup Penelitian Penelitian ini melingkupi area studi yaitu Kabupaten Bengkalis, Riau. Data yang digunakan dalam penelitian ini adalah data persebaran kemunculan titik api pada tahun 2008 dan karakteristik wilayah tersebut yang mencakup sumber pendapatan, tutupan lahan, curah hujan (mm/day), temperatur (K), dan kecepatan angin (m/s). Teknik klasifikasi yang digunakan dalam penelitian ini adalah algoritme pohon keputusan ID3 spasial (Rinzivillo dan Turini 2004). Dalam penelitian ini, poligon pada layer target memotong poligon-poligon pada layerlayer penjelas.
METODE PENELITIAN Data dan Area Studi Penelitian Kabupaten Bengkalis merupakan salah satu dari 11 kabupaten/kota di provinsi Riau dengan luas 7 793.93 km². Wilayahnya mencakup daratan bagian pesisir timur pulau Sumatera. Secara geografis, Kabupaten Bengkalis berada pada posisi 2o30’-0o17’ Lintang Utara dan 100o52’-102o10’ Bujur Timur. Kabupaten Bengkalis memiliki letak yang sangat strategis karena berada di tepi alur pelayaran internasional yang paling sibuk di dunia, yakni selat Malaka, serta
3 berada pada kawasan segitiga pertumbuhan ekonomi Indonesia-MalaysiaSingapura (Pemerintah Provinsi Riau 2013). Data yang digunakan dalam penelitian ini adalah data persebaran titik api pada tahun 2008 di Kabupaten Bengkalis beserta karakteristiknya, seperti sumber pendapatan, tutupan lahan, curah hujan (mm/day), temperatur (K), dan kecepatan angin (m/s). Data titik api diperoleh dari Firms Modis Fire, University of Maryland. Data sumber pendapatan tahun 2008 diperoleh dari Badan Pusat Statistik (BPS), Indonesia. Data mengenai tutupan lahan tahun 2008 diperoleh dari Badan Informasi Geospasial (BIG). Data curah hujan (mm/day), temperatur (K), dan kecepatan angin (m/s) merupakan data rataan tahun 2008 dan diperoleh dari BMKG, Indonesia. Tahapan Penelitian Penelitian ini akan dilakukan dengan beberapa tahapan. Tahapan penelitian dapat dilihat pada diagram alir dalam Gambar 1. Mulai
Data Latih Kebakaran Hutan Kabupaten Bengkalis
Pembuatan Model Klasifikasi dengan Menggunakan Algoritme Pohon Keputusan ID3 Spasial (Implementasi)
Data Uji Kebakaran Hutan Kabupaten Rokan Hilir
Praproses Data
Data Latih Kebakaran Hutan Kabupaten Bengkalis Setelah Praproses
Pengujian dan Evaluasi Model
Presentasi Model Selesai
Gambar 1 Diagram alir penelitian a Praproses Data Tahap praproses data dilakukan terhadap semua layer yang digunakan, baik layer target maupun layer penjelas. Tahap pertama praproses data adalah pemilihan data untuk layer target dan layer penjelas. Tahap kedua adalah penentuan sistem koordinat, pada tahapan ini akan dilakukan proses penyeragaman proyeksi dan sistem koordinat untuk setiap data yang digunakan pada penelitian ini. Tahap ketiga adalah pembuatan layer kerapatan titik api menggunakan layer persebaran titik api dan layer sumber pendapatan. Tahap terakhir adalah pergantian nama dan nilai atribut agar dapat digunakan dengan baik dalam tahap implementasi menggunakan bahasa pemrograman Python. b Pembuatan Model Klasifikasi Pada tahapan ini data latih yang dihasilkan pada tahap praproses data digunakan untuk membuat model klasifikasi yang mampu menempatkan data baru ke kelas yang tepat. Pembuatan model klasifikasi ini akan menggunakan algoritme ID3 spasial (Rinzivillo dan Turini 2004). Alur pembentukan model klasifikasi dengan menggunakan algoritme pohon keputusan ID3 spasial yang diimplementasikan dengan bahasa pemrograman Python ditunjukkan pada Gambar 2.
4 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Algoritme 1: Generate_SDT Masukan: Layer S dari area sampel Daftar L dari layer-layer Keluaran: Pohon Keputusan Spasial Buat node baru N; Jika sampel didalam S seluruhnya adalah kelas c maka Beri label N dengan c; Keluar; Selesai Jika L adalah kosong maka Beri label N dengan majority_class(S); Keluar; Selesai Pilih layer best_split dari L; Pisahkan S berdasarkan layer best_split dalam {S(c1).....S(cp)}; Untuk setiap S(ci), i = 1, 2, ....., p lakukan Tentukan Ni = Generate_SDT(S(ci), L\{best_split}); Buat sebuah cabang dari N ke Ni dinamakan dengan nilai yang dipilih; Selesai
Gambar 2 Algoritme pohon keputusan ID3 spasial (Rinzivillo dan Turini 2004) Salah satu proses utama algoritme ini adalah pemilihan layer pemecah untuk node saat ini (baris ke-14 dalam Gambar 2). Strategi yang didasarkan pada entropi dilakukan untuk mengukur seberapa baik layer memecahkan sampel. Setelah layer dipilih untuk node uji, sampel dipartisi berdasarkan layer tersebut dan hubungan spasial intersection (baris ke-15 dalam Gambar 2). Pada proses klasifikasi, transaksi direpresentasikan sebagai tuple. Transaksi dikelompokkan bersama-sama sesuai dengan atribut A. Jika atribut untuk memisahkan sampel dipilih dengan cara yang tepat, sampel di setiap sub-partisi dapat meningkatkan keseragamannya (mengurangi entropi). Dengan cara yang sama, sampel spasial dikelompokkan sesuai dengan informasi yang ditemukan dalam layer yang lain. Layer Li dipilih dan sampel dibagi ke dalam layer target S yang sesuai untuk layer ini. Layer target S adalah kelas mayoritas yang sebagian besar sampel berasal dari kelas S. Secara umum, jika layer Li memiliki q nilai yang mungkin maka layer ini dapat membagi sampel dalam subset q+1, yaitu sebuah subset untuk setiap nilai vj, j=1,2,...,q, dan subset khusus yang tidak sesuai dengan nilai-nilai ini (disebut ¬L(C)). Li(vj) digunakan untuk merujuk ke semua ciri di Li yang memiliki nilai vj. Diberikan subset Li(vj), untuk j=1,2,...,q, dengan mempertimbangkan semua sampel yang memotong setiap ciri dalam Li(vj). Sub-layer ini dianggap sebagai Li(vj, C). Untuk setiap nilai kelas ck, dinyatakan dengan Li(vj, ck) sebagai sebuah ciri dalam Li(vj,C) yang kelasnya adalah ck. Ketika sebagian sampel berpotongan (overlap) dengan poligon dengan nilai vk dan poligon dengan nilai vl (Gambar 3(a)) terjadi pemisahan: pertama, sebagian dari sampel dihitung dengan cara memotong sampel tersebut dengan poligon vk; bagian sisa dari sampel berkaitan dengan poligon lain; bagian sisa yang mungkin dari sampel tidak diklasifikasikan. Misalnya, sampel pada Gambar 3(a) dipartisi menjadi
5 tiga sampel (Gambar 3(b)). Untuk kesederhanaan, dinyatakan bahwa setiap ciri dalam Li(vj, ck) sebagai perwakilan untuk tuple (vj, ck). Untuk tuple yang dihasilkan, kardinalitas yang digunakan sebagai ukuran kuantitatif adalah area dari poligon yang bersesuaian dengan tuple tersebut.
Gambar 3 Contoh layer yang bertumpangan (a) Sebuah sampel (di tengah) bertumpangan dengan 2 poligon; (b) sampel setelah pemecahan Pada setiap langkah algoritme, salah satu layer dipilih untuk membentuk sebuah pohon dan untuk memisahkan sampel (baris ke-17 dalam Gambar 2). Pada bagian ini, information gain spasial digunakan untuk memilih layer yang mengklasifikasikan sampel lebih baik daripada yang lain. Information gain ini didasarkan pada entropi. Secara intuitif, information gain dapat mengukur impurity sampel. Kemudian, layer yang akan dipisahkan dipilih dengan mempertimbangkan pengurangan entropi yang disebabkan oleh pemecahan sampel. Information gain spasial merupakan metode untuk menghitung entropi layer L. Pertama, entropi dari sampel dievaluasi, yaitu informasi yang dibutuhkan untuk mengidentifikasi kelas transaksi spasial. Pada transaksi tuple, frekuensi sampel dinyatakan sebagai rasio dari transaksi yang menggunakan luas daerah sampel. Layer L yang dinyatakan dengan mes(L) adalah jumlah dari daerah semua poligon dalam L. Jika S memiliki l kelas yang berbeda (yaitu c1,c2,...,cl) maka entropi untuk S adalah (Rinzivillo dan Turini 2004): H S =−
l
mes(Sci )
i=1 mes(S)
log2
mes(Sci )
(1)
mes(S)
Jika L adalah layer non-kelas dengan nilai v1,v2,...,vq, pembagian sampel didasarkan pada layer ini. Pembagian sampel yang didasarkan pada layer nonkelas ini menghasilkan satu set layer L(vi, S) untuk setiap nilai vi yang mungkin dalam L dan dapat juga menghasilkan layer ¬L(S). Dari persamaan (1) entropi untuk sampel bisa dihitung di setiap sub-layer L(vi, S). Nilai entropi yang diharapkan untuk pemisahan diberikan oleh (Rinzivillo dan Turini 2004): H SL =
mes ⇁L S mes S
H ⇁L S +
q mes L vj ,S j=1 mes S
H(L vj ,S )
(2)
Layer ¬L(S) merupakan sampel yang tidak dapat diklasifikasikan oleh layer L (yaitu sampel tidak berpotongan dengan layer L). Dalam penelitian ini, diasumsikan bahwa setiap poligon pada layer target memotong poligonpoligon pada layer-layer penjelas. Information gain spasial untuk layer L diberikan oleh (Rinzivillo dan Turini 2004):
6 Gain L =H S − H(S|L)
(3)
Layer L yang menyajikan information gain tertinggi dipilih sebagai perpecahan terbaik dan node yang berkaitan dengan L dan edge untuk setiap nilai dari layer dibuat (baris ke-18 dalam Gambar 2). Sampel dipisahkan di antara edge sesuai dengan nilai setiap edge. Proses seleksi diulang untuk setiap cabang dari node dengan mempertimbangkan semua layer kecuali L. c Pengujian dan Evaluasi Model Klasifikasi Pada tahapan ini akan dilakukan pengujian kinerja model klasifikasi ini dalam mengklasifikasikan suatu data baru dengan menggunakan data uji, yaitu data kebakaran hutan Kabupaten Rokan Hilir. d Presentasi Model Pada tahap ini akan dihasilkan aturan-aturan klasifikasi yang diperoleh dari pohon keputusan terbaik. Aturan-aturan tersebut digunakan untuk mengklasifikasikan data baru. Peralatan Penelitian Pembuatan model klasifikasi ini menggunakan komputer personal dengan spesifikasi sebagai berikut: 1 Perangkat Keras Processor Intel(R) Core(TM) i3 CPU M 380 @ 2.53GHz. Memori 2 GB RAM. 2 Perangkat Lunak Sistem operasi Windows 7 32-bit. Bahasa pemrograman Python 2.7.2. Sistem Manajemen Basis Data PostgreSQL 9.2.1 dan PostGIS sebagai ekstensi PostgreSQL untuk menyimpan dan mengolah data spasial. Quantum GIS 1.8.0 untuk mengolah dan visualisasi data spasial. Weka 3.6 untuk clustering data titik api. Microsoft Excel 2007 untuk praposes dan analisis data.
HASIL DAN PEMBAHASAN Praproses Data Tahap praproses data dilakukan terhadap semua data yang digunakan, baik layer target maupun layer penjelas. Tahapan praproses data yang dilakukan sebagai berikut: 1 Pemilihan data Pada tahapan ini dilakukan pemilihan data untuk layer target dan layer penjelas. Layer target yang digunakan adalah data titik api Kabupaten Bengkalis pada tahun 2008. Layer penjelas yang digunakan adalah data sumber pendapatan, tutupan lahan, curah hujan (mm/day), temperatur (K), dan kecepatan angin (m/s). Penjelasan mengenai data tersebut sebagai berikut:
7 Layer persebaran titik api Layer ini memiliki atribut gid, latitude, longitude, nama satelit, nomor orbit, waktu, tanggal, sumber, provinsi, kabupaten, geometri. Objek pada layer ini berupa titik-titik (Gambar 4) yang tersebar di 69 desa di Kabupaten Bengkalis. Legenda Titik api Bengkalis
Gambar 4 Persebaran titik api berupa titik Layer sumber pendapatan Layer sumber pendapatan (Gambar 5) berisi informasi tentang sumber pendapatan penduduk tiap desa di Kabupaten Bengkalis. Layer ini memiliki atribut gid, nomor kecamatan, nomor desa, sumber pendapatan, dan geometri. Legenda Plantation Mining Other_agriculture Trading_restaurant Forestry Agriculture Manufacture Services
Gambar 5 Sumber pendapatan Kabupaten Bengkalis Layer tutupan lahan Layer tutupan lahan (Gambar 6) berisi informasi tentang penggunaan lahan tiap desa di Kabupaten Bengkalis. Layer ini memiliki atribut gid, jenis tutupan lahan, dan geometri. Legenda Plantation Dryland_forest Mangrove Settlemen tWater_body Embankment
Bare_land Shrubs nt Paddy_field Unirrigated_agri_field Swamp Mix_garden
Gambar 6 Tutupan lahan di Kabupaten Bengkalis Layer cuaca Layer cuaca ini meliputi data curah hujan (mm/day), temperatur (K), dan kecepatan angin (m/s). Layer curah hujan (mm/day) (Gambar 7(a)) berisi informasi tentang curah hujan (mm/day) tiap desa di Kabupaten Bengkalis. Layer ini memiliki atribut gid, kode grid (kategori curah hujan (mm/day)), dan geometri. Layer temperatur (K) (Gambar 7(b)) berisi informasi tentang kondisi temperatur (K) tiap desa di Kabupaten Bengkalis. Layer ini memiliki atribut gid, kode grid (kategori temperatur (K)), dan geometri. Layer kecepatan angin (m/s) (Gambar 7(c)) berisi informasi tentang kecepatan angin (m/s) tiap desa di
8 Kabupaten Bengkalis. Layer ini memiliki atribut gid, kode grid (kategori kecepatan angin (m/s)), dan geometri. Legenda Legenda 0 1 2
(a) Curah hujan (mm/day)
3 4
Legenda 297 298 299
(b) Temperatur (K) Gambar 7 Layer cuaca
0 1 2 3 4
(c) Kecepatan angin (m/s)
2 Penentuan sistem koordinat Pada tahapan ini dilakukan proses penyeragaman proyeksi dan sistem koordinat untuk setiap data yang digunakan pada penelitian ini. Jika data memiliki sistem koordinat berbeda, maka akan sulit untuk diolah. Penelitian ini menggunakan proyeksi dan sistem koordinat UTM (Universal Transverse Mercator) zone 47N karena Kabupaten Bengkalis dan Kabupaten Rokan Hilir berada pada proyeksi dan sistem koordinat tersebut. 3 Pembuatan layer kerapatan titik api Tahap awal pembuatan layer kerapatan titik api adalah menghitung jumlah titik api tiap desa yang ada di Kabupaten Bengkalis. Dalam tahap ini diperlukan layer titik api dan sumber pendapatan. Layer sumber pendapatan ini menyimpan informasi tentang luas tiap desa yang ada di Kabupaten Bengkalis. Oleh karena itu, jumlah titik api tiap desa dapat diketahui. Selanjutnya adalah perhitungan kerapatan titik api tiap desa. Kerapatan titik api ini didapatkan dengan membagi jumlah titik api tiap desa dengan luas tiap desa (km2). Setelah kerapatan titik api tiap desa diketahui, kategori mengenai titik api (low, medium, high) tiap desa dapat diketahui dengan menggunakan teknik clustering K-Means. Kategori ini yang nantinya akan digunakan untuk proses klasifikasi sebagai label target. Membuat layer hotspot_per_desa dan menghitung jumlah titik api tiap desa Layer hotspot_per_desa adalah layer kerapatan titik api yang nantinya akan dijadikan sebagai layer target. Layer ini berisi geometri sumber pendapatan, jumlah titik api tiap desa, luas desa, kerapatan titik api tiap desa, dan kategori titik api. Berikut adalah kueri untuk membuat layer tersebut: CREATE TABLE hotspot_per_desa AS SELECT i.geom AS income_source_geom, COUNT(*) AS jumlah_hotspot FROM hotspot_bengkalis_utm47n AS h, income_source_bk_utm47n AS i WHERE ST_WITHIN(h.geom, i.geom) GROUP BY i.geom;
Luas tiap desa dibutuhkan untuk menghitung kerapatan titik api tiap desa. Berikut adalah kueri untuk menghitung luas tiap desa: UPDATE hotspot_per_desa SET luas_desa = ST_AREA(income_source_geom)/1000000;
Kerapatan titik api dibutuhkan untuk mengkategorikan titik api tiap desa. Berikut adalah kueri untuk menghitung kerapatan titik api tiap desa: UPDATE hotspot_per_desa SET densitas = jumlah_hotspot/luas_desa;
9 Kategori titik api dibutuhkan sebagai label target dalam proses klasifikasi. Berikut adalah kueri untuk membuat kategori titik api: UPDATE hotspot_per_desa SET kategori = 'low' WHERE densitas <= 0.0860674445140457; UPDATE hotspot_per_desa SET kategori = 'medium' WHERE densitas > 0.0860674445140457 AND densitas <= 0.247052891800435; UPDATE hotspot_per_desa SET kategori = 'high' WHERE densitas > 0.247052891800435;
Kategori titik api tersebut diperoleh dengan menggunakan teknik clustering K-Means. Hal pertama yang dilakukan adalah menyalin kolom densitas titik api hasil kueri kemudian disimpan pada Microsoft Excel. Setelah itu, file tersebut disimpan dengan format CSV agar dapat diolah dalam Weka 3.6. Setelah data di-load, langkah selanjutnya dilakukan clustering menggunakan K-Means dengan 3 cluster dan menghasilkan 59 data dengan kategori low, 6 data dengan kategori medium, dan 4 data dengan kategori high. Ketiga kategori tersebut akan digunakan sebagai label target dalam proses klasifikasi dengan teknik pohon keputusan spasial. Gambar 8 menunjukkan layer kerapatan titik api yang dihasilkan. Legenda Low Medium High
Gambar 8 Layer kerapatan titik api berupa poligon 4 Pergantian nama dan nilai atribut Pada tahapan ini dilakukan pergantian nama (Tabel 1) dan nilai atribut. Pergantian ini dilakukan karena pada pembentukan layer baru, penamaan tabel pada basis data akan mengikuti nilai atribut dari setiap layer, sedangkan basis data memiliki maksimal karakter untuk penamaan tabel. Oleh karena itu, penamaan nilai atribut dikodekan berdasarkan layer dan nilai atributnya. Hal ini dapat dilihat pada Tabel 2 (layer sumber pendapatan), Tabel 3 (layer tutupan lahan), Tabel 4 (layer curah hujan), Tabel 5 (layer temperatur), dan Tabel 6 (layer kecepatan angin). Selain itu, pergantian nama dan nilai atribut ini dilakukan agar dapat digunakan dengan baik dalam tahap implementasi menggunakan program pohon keputusan spasial menggunakan bahasa pemrograman Python yang telah dibuat oleh Sitanggang et al. (2013). Tabel 1 Pergantian nama atribut dan nama layer Sebelum Semua atribut kelas layer penjelas Atribut kelas layer target Sumber pendapatan Tutupan lahan Curah hujan Temperatur Kecepatan angin
Sesudah exp_attr target_attr l0 l1 l2 l3 l4
10 Tabel 2 Pergantian nilai atribut dari layer sumber pendapatan (l0) Sebelum Plantation Mining Other_agriculture No_data Trading_restaurant Forestry Agriculture Manufacture Services
Sesudah l0v0 l0v1 l0v2 l0v3 l0v4 l0v5 l0v6 l0v7 l0v8
Tabel 3 Pergantian nilai atribut dari layer tutupan lahan (l1) Sebelum Plantation Dryland_forest Mangrove Settlement Water_body Embankment Bare_land Shrubs Paddy_field Unirrigated_agri_field Swamp Mix_garden
Sesudah l1v0 l1v1 l1v2 l1v3 l1v4 l1v5 l1v6 l1v7 l1v8 l1v9 l1v10 l1v11
Tabel 4 Pergantian nilai atribut dari layer curah hujan (l2) Sebelum 0 1 2 3 4
Sesudah l2v0 l2v1 l2v2 l2v3 l2v4
Tabel 5 Pergantian nilai atribut dari layer temperatur (l3) Sebelum 297 298 299
Sesudah l3v0 l3v1 l3v2
Tabel 6 Pergantian nilai atribut dari layer kecepatan angin (l4) Sebelum 0 1 2 3 4
Sesudah l4v0 l4v1 l4v2 l4v3 l4v4
11 Pembuatan Model Klasifikasi Teknik pohon keputusan ID3 spasial ini diimplementasikan dengan menggunakan bahasa pemrograman Python 2.7.2 dan data kebakaran hutan Kabupaten Bengkalis yang telah dipraproses. Terdapat beberapa modul Python dalam penelitian ini, diantaranya diberikan dalam Tabel 7. Tabel 7 Modul Python yang digunakan (Sitanggang et al. 2013) Modul Fungsi db_config.py db_connect.py entropy.py sdtree.py print_tree.py reformat_tree.py clean_tree.py test.py
Modul konfigurasi ke basis data yang akan digunakan pada tahap implementasi. Modul untuk menyambungkan kode program dengan basis data. Modul perhitungan entropi dan spatial information gain. Modul untuk menghasilkan layer baru dan pohon keputusan spasial. Modul untuk mencetak pohon keputusan yang telah dibentuk. Modul untuk memformat pohon keputusan agar mudah dipahami. Modul untuk menghilangkan kategori none pada pohon keputusan. Modul untuk melakukan pengujian pada pohon keputusan dengan menggunakan data uji.
Modul-modul tersebut merupakan hasil penelitian sebelumnya (Sitanggang et al. 2013). Dalam penelitian ini telah dilakukan modifikasi pada modul entropy.py dan sdtree.py khususnya pada fungsi entropi dan spatial information gain. Hal ini dilakukan dengan menyesuaikan formula spatial information gain yang diperkenalkan oleh Rinzivillo dan Turini (2004). Potongan program Python yang telah dimodifikasi untuk menghitung entropi dan spatial information gain sebagai berikut:
Potongan kode program Python pada modul entropy.py sebagai berikut:
Potongan kode program Python pada modul sdtree.py sebagai berikut:
12 Pada tahap implementasi ini data latih dibagi menjadi 2, yaitu data sumber pendapatan dengan data cuaca dan data tutupan lahan dengan data cuaca. Pembagian data latih ini dilakukan karena berdasarkan percobaan yang telah dilakukan, data sumber pendapatan dan tutupan lahan tidak dapat disatukan dengan data cuaca sebagai layer masukan untuk menghasilkan sebuah pohon keputusan. Hal ini diasumsikan terjadi karena terdapat poligon pada layer baru yang tidak berpotongan dengan poligon pada layer target sehingga menimbulkan pesan error seperti berikut:
Hal ini terjadi karena nilai log2 pada formula entropi hanya dapat dihitung untuk luasan perpotongan poligon yang lebih besar dari 0. Error tersebut mengakibatkan program Python tidak dapat menghitung entropi dan spatial information gain. Sebelumnya, kombinasi layer masukan telah dilakukan dan hasilnya ditunjukkan pada Tabel 8. Tabel 8 Kombinasi layer masukan Layer Masukan l0, l1, l2, l3, l4 l0, l1, l2, l3 l0, l1, l2, l4 l0, l1, l2 l3, l4 l2, l3, l4 l0, l1 l0, l2, l3, l4 l1, l2, l3, l4
Hasil Pohon keputusan tidak terbentuk Pohon keputusan tidak terbentuk Pohon keputusan tidak terbentuk Pohon keputusan tidak terbentuk Pohon keputusan terbentuk Pohon keputusan terbentuk Pohon keputusan terbentuk Pohon keputusan terbentuk Pohon keputusan terbentuk
Keterangan: l0 = Sumber pendapatan, l1 = Tutupan lahan, l2 = Curah hujan, l3 = Temperatur, dan l4 = Kecepatan angin.
Dari kedua data latih tersebut, terbentuk dua pohon keputusan dengan beberapa aturan yang didominasi dengan kategori low. Terdapat beberapa aturan dengan kategori none dan aturan tersebut dihapus untuk keperluan pengujian. Kategori none merupakan kategori untuk poligon dari suatu layer penjelas yang tidak berpotongan dengan layer kerapatan titik api. Gambar 9 menunjukkan subpohon keputusan yang dihasilkan dari data latih pertama dengan node akar yaitu layer temperatur. Gambar 10 menunjukkan subpohon keputusan yang dihasilkan dari data latih kedua dengan node akar yaitu layer temperatur. Dari subpohon keputusan pada Gambar 9 diperoleh 17 aturan klasifikasi. Sementara itu, dari subpohon keputusan pada Gambar 10 diperoleh 38 aturan klasifikasi. Aturanaturan ini akan digunakan untuk menguji seberapa baik pohon keputusan yang telah dibentuk mengklasifikasikan data baru.
13
Gambar 9 Potongan pohon keputusan data latih pertama
Gambar 10 Potongan pohon keputusan data latih kedua Pengujian dan Evaluasi Model Klasifikasi Pembuatan data uji Pengujian dan evaluasi model klasifikasi ini dilakukan untuk kedua data latih yang telah dibuat, yaitu data sumber pendapatan dengan cuaca dan data tutupan lahan dengan cuaca. Data uji yang digunakan disesuaikan dengan data latih, layer-layer yang digunakan, nama layer, nama atribut, dan nilai atribut. Namun, pada kedua data latih terdapat nilai atribut dari suatu layer yang tidak ada pada layer data uji dan sebaliknya. Nilai atribut yang ada pada data latih namun tidak ada pada data uji, misalnya layer tutupan lahan kategori “embankment” (l1v5), maka pada data uji ditiadakan nilai atribut dengan kode l1v5. Sementara itu, nilai atribut yang ada pada data uji namun tidak ada pada data latih diberi kode dengan meneruskan urutan yang telah ada, misalnya pada data latih nilai atribut terakhir layer tutupan lahan adalah “mix_garden” (l1v11) maka pada data uji nilai atribut terakhir layer tutupan lahan adalah “natural_forest” (l1v12). Data uji yang telah disesuaikan dengan data latih diintegrasikan menjadi satu tabel. Setelah data uji diintegrasikan, data uji tersebut diekspor dan disimpan dalam bentuk CSV, kemudian kolom gid dan geometri dihapus karena tidak digunakan dalam tahap pengujian. Hal ini menyebabkan duplikasi data dan data yang duplikat tersebut dihapus sehingga untuk data uji sumber pendapatan dan
14 cuaca berkurang dari 396 data menjadi 56 data, sedangkan untuk data uji tutupan lahan dan cuaca berkurang dari 866 data menjadi 119 data. Dari fail CSV yang sudah dilakukan penghapusan data duplikat, fail tersebut dikonversi menjadi berekstensi .file melalui aplikasi Notepad. Hal ini dilakukan untuk kebutuhan pada kode program (test.py). Berikut adalah kueri untuk mengintegrasikan data uji: CREATE TABLE target_l0 AS SELECT t.gid, t.geom, t.kategori AS target_attr, a.exp_attr AS l0 FROM target AS t, l0 AS a WHERE ST_Intersects(t.geom, a.geom) ORDER BY t.gid; CREATE TABLE target_l1 AS SELECT t.gid, t.geom, t.kategori AS target_attr, b.exp_attr AS l1 FROM target AS t, l1 AS b WHERE ST_Intersects(t.geom, b.geom) ORDER BY t.gid; CREATE TABLE target_l2 AS SELECT t.gid, t.geom, t.kategori AS target_attr, c.exp_attr AS l2 FROM target AS t, l2 AS c WHERE ST_Intersects(t.geom, c.geom) ORDER BY t.gid; CREATE TABLE target_l3 AS SELECT t.gid, t.geom, t.kategori AS target_attr, d.exp_attr AS l3 FROM target AS t, l3 AS d WHERE ST_Intersects(t.geom, d.geom) ORDER BY t.gid; CREATE TABLE target_l4 AS SELECT t.gid, t.geom, t.kategori AS target_attr, e.exp_attr AS l4 FROM target AS t, l4 AS e WHERE ST_Intersects(t.geom, e.geom) ORDER BY t.gid;
Kueri diatas adalah untuk membuat tabel atau layer baru untuk masingmasing layer penjelas yang sudah terintegrasi dengan layer target. Kemudian layer-layer tersebut diintegrasikan menjadi satu sesuai dengan data ujinya. Kueri berikut adalah untuk mengintegrasikan data uji yang akan digunakan untuk menguji pohon keputusan data latih pertama: CREATE TABLE dataset_testing_1 AS SELECT DISTINCT t.gid,t.geom, a.l0 AS l0,c.l2 AS l2,d.l3 AS l3,e.l4 AS l4, t.kategori AS target_attr FROM target_l0 AS a, target_l2 AS c, target_l3 AS d, target_l4 AS e,target AS t WHERE t.gid = a.gid AND t.gid = c.gid AND t.gid = d.gid AND t.gid = e.gid ORDER BY t.gid;
Kueri berikut adalah untuk mengintegrasikan data uji yang akan digunakan untuk menguji pohon keputusan data latih kedua: CREATE TABLE dataset_testing_2 AS SELECT DISTINCT t.gid,t.geom, b.l1 AS l1,c.l2 AS l2,d.l3 AS l3,e.l4 AS l4, t.kategori AS target_attr FROM target_l1 AS b, target_l2 AS c, target_l3 AS d, target_l4 AS e,target AS t WHERE t.gid = b.gid AND t.gid = c.gid AND t.gid = d.gid AND t.gid = e.gid ORDER BY t.gid;
Pengujian pohon keputusan sumber pendapatan dan cuaca Pengujian pohon keputusan ini dengan data uji untuk wilayah Rokan Hilir menghasilkan nilai akurasi 60.47%. Jumlah kelas kerapatan titik api yang diprediksi salah dan benar oleh pohon keputusan dapat dilihat pada Tabel 9.
15 Tabel 9 Jumlah kelas aktual dan hasil prediksi data uji pertama Data Uji 1 Kelas aktual
Low Medium High
Total
Kelas hasil prediksi Low Medium High Unclassified 26 0 0 6 12 0 0 4 5 0 0 3 43 0 0 13
Total 32 16 8 56
Nilai akurasi tersebut dihitung berdasarkan formula berikut: Akurasi =
banyak total prediksi yang benar ×100% total banyaknya prediksi
Akurasi =
26+0+0 26 ×100% = ×100% = 60.47% 26+12+5+0+0+0+0+0+0 43
Pengujian pohon keputusan tutupan lahan dan cuaca Pengujian pohon keputusan ini dengan data uji untuk wilayah Rokan Hilir menghasilkan nilai akurasi 58%. Jumlah kelas kerapatan titik api yang diprediksi salah dan benar oleh pohon keputusan dapat dilihat pada Tabel 10. Tabel 10 Jumlah kelas aktual dan hasil prediksi data uji kedua Data Uji 2 Kelas aktual
Low Medium High
Total
Low 58 30 12 100
Kelas hasil prediksi Medium High Unclassified 0 0 9 0 0 10 0 0 0 0 0 19
Total 67 40 12 119
Nilai akurasi tersebut dihitung berdasarkan formula berikut: Akurasi =
banyak total prediksi yang benar ×100% total banyaknya prediksi
58+0+0 58 ×100% = ×100% = 58% 58+30+12+0+0+0+0+0+0 100 Pohon keputusan yang dihasilkan dari data latih pertama tidak dapat mengklasifikasikan 39.53% objek pada data uji pertama. Sedangkan pohon keputusan yang dihasilkan dari data latih kedua tidak dapat mengklasifikasikan 42% objek pada data uji kedua. Seluruh kelas aktual pada data uji pertama dan data uji kedua diprediksi sebagai kategori low, hal ini disebabkan oleh pohon keputusan yang didominasi dengan kategori low. Hasil prediksi unclassified diperoleh karena terdapat data uji yang tidak dapat diklasifikasikan oleh pohon keputusan yang dihasilkan dari data latih. Hal ini terjadi karena adanya perbedaan karakteristik wilayah antara kedua wilayah tersebut. Oleh karena itu, hasil prediksi unclassified ini tidak diperhitungkan dalam perhitungan akurasi pohon keputusan. Akurasi =
16 Presentasi Model Dari pohon keputusan yang dibentuk dari data latih pertama yaitu data sumber pendapatan dan cuaca diperoleh 17 aturan. Beberapa aturan yang terbentuk adalah sebagai berikut: Aturan 1 : Jika temperatur = 298 K dan curah hujan = 0 mm/day dan kecepatan angin = 3 m/s maka kerapatan titik api = low. Aturan 2 : Jika temperatur = 298 K dan curah hujan = 1 mm/day dan kecepatan angin = 2 m/s maka kerapatan titik api = low. Aturan 3 : Jika temperatur = 298 K dan curah hujan = 1 mm/day dan kecepatan angin = 3 m/s maka kerapatan titik api = low. Dari pohon keputusan yang dibentuk dari data latih kedua yaitu data tutupan lahan dan cuaca diperoleh 38 aturan. Beberapa aturan yang terbentuk adalah sebagai berikut: Aturan 1 : Jika temperatur = 298 K dan tutupan lahan = unirrigated agri field dan curah hujan = 0 mm/day maka kerapatan titik api = low. Aturan 2 : Jika temperatur = 298 K dan tutupan lahan = unirrigated agri field dan curah hujan = 1 mm/day maka kerapatan titik api = low. Aturan 3 : Jika temperatur = 298 K dan tutupan lahan = unirrigated agri field dan curah hujan = 2 mm/day maka kerapatan titik api = low.
KESIMPULAN DAN SARAN Kesimpulan Penelitian ini berhasil menentukan model klasifikasi dari persebaran titik api di wilayah Bengkalis dengan menggunakan algoritme pohon keputusan ID3 spasial. Pada data latih sumber pendapatan dan cuaca menghasilkan 17 aturan dan data latih tutupan lahan dan cuaca menghasilkan 38 aturan. Model klasifikasi ini berhasil mengklasifikasikan data baru dengan akurasi data uji sumber pendapatan dan cuaca di wilayah Rokan Hilir adalah 60.47% dengan data yang unclassified sebanyak 13 data. Sementara itu, akurasi data uji tutupan lahan dan cuaca di wilayah Rokan Hilir adalah 58% dengan data yang unclassified sebanyak 19 data. Data unclassified adalah data uji yang tidak dapat diklasifikasikan oleh pohon keputusan yang dihasilkan dari data latih. Saran Saran untuk penelitian selanjutnya sebagai berikut: 1 Penggunaan dataset yang lebih banyak dan akurat untuk wilayah selain Bengkalis dan Rokan Hilir agar model klasifikasi yang dihasilkan dapat diuji lebih lanjut pada data baru. 2 Studi literatur untuk menentukan layer yang tepat yang akan digunakan pada pembentukan pohon keputusan. 3 Penggabungan aspek temporal dalam klasifikasi. 4 Pelabelan kategori kerapatan titik api dengan mempertimbangkan jumlah kategori untuk klasifikasi.
17
DAFTAR PUSTAKA Austin K, Alisjahbana A, Sizer N. 2013. Data Terbaru Menunjukkan Kebakaran Hutan Di Indonesia Adalah Krisis Yang Telah Berlangsung Sejak Lama [Internet]. [diunduh 2013 Oktober 20]. Tersedia pada: http://insights.wri.org/news/2013/06/data-terbaru-menunjukkan-kebakaranhutan-di-indonesia-adalah-krisis-yang-telah-berlangs#fire Li X, Claramunt C. 2006. A Spatial Entropy-Based Decision Tree for Classification of Geographical Information. Transaction in GIS. 10(3): 451467. Pemerintah Provinsi Riau. 2013. Kabupaten Bengkalis [Internet]. [diunduh 2013 Desember 9]. Tersedia pada: http://www.riau.go.id/index.php?/detail/6 Rinzivillo S, Turini F. 2004. Classification in Geographical Information Systems. Di dalam Boulicaut et al., editor. The 8th European Conference on Principles and Practice Knowledge Discovery in Databases; 2004 Sep 20-24. Pisa, Italy. New York (US): Springer-Verlag. hlm 374-385. Sitanggang IS, Yaakob R, Mustapha N, Ainuddin AN. 2013. Classification Model for Hotspots Occurrences using Spatial Decision Tree Algorithm. Journal of Computer Science. 9(2): 244-251. doi:10.3844/jcssp.2013.244.251.
18 Lampiran 1 Aturan-aturan pohon keputusan dari data latih pertama Aturan 1 Aturan 2 Aturan 3 Aturan 4 Aturan 5 Aturan 6 Aturan 7 Aturan 8 Aturan 9 Aturan 10 Aturan 11 Aturan 12 Aturan 13 Aturan 14 Aturan 15 Aturan 16 Aturan 17
: Jika temperatur = 298 K dan curah hujan = 0 mm/day dan kecepatan angin = 3 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan curah hujan = 1 mm/day dan kecepatan angin = 2 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan curah hujan = 1 mm/day dan kecepatan angin = 3 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan curah hujan = 1 mm/day dan kecepatan angin = 1 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan curah hujan = 2 mm/day dan kecepatan angin = 2 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan curah hujan = 2 mm/day dan kecepatan angin = 1 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan curah hujan = 3 mm/day maka kerapatan titik api = low. : Jika temperatur = 297 K dan curah hujan = 1 mm/day maka kerapatan titik api = low. : Jika temperatur = 297 K dan curah hujan = 2 mm/day dan kecepatan angin = 2 m/s maka kerapatan titik api = low. : Jika temperatur = 297 K dan curah hujan = 2 mm/day dan kecepatan angin = 1 m/s maka kerapatan titik api = low. : Jika temperatur = 297 K dan curah hujan = 3 mm/day dan sumber pendapatan = services maka kerapatan titik api = low. : Jika temperatur = 297 K dan curah hujan = 3 mm/day dan sumber pendapatan = other agriculture maka kerapatan titik api = low. : Jika temperatur = 297 K dan curah hujan = 3 mm/day dan sumber pendapatan = plantation maka kerapatan titik api = low. : Jika temperatur = 297 K dan curah hujan = 3 mm/day dan sumber pendapatan = mining maka kerapatan titik api = medium. : Jika temperatur = 297 K dan curah hujan = 3 mm/day dan sumber pendapatan = forestry maka kerapatan titik api = low. : Jika temperatur = 297 K dan curah hujan = 4 mm/day dan kecepatan angin = 1 m/s maka kerapatan titik api = high. : Jika temperatur = 299 K maka kerapatan titik api = low.
19 Lampiran 2 Aturan-aturan pohon keputusan dari data latih kedua Aturan 1 Aturan 2 Aturan 3 Aturan 4 Aturan 5 Aturan 6 Aturan 7 Aturan 8 Aturan 9 Aturan 10 Aturan 11 Aturan 12 Aturan 13 Aturan 14 Aturan 15 Aturan 16 Aturan 17 Aturan 18 Aturan 19 Aturan 20 Aturan 21 Aturan 22 Aturan 23
: Jika temperatur = 298 K dan tutupan lahan = unirrigated agri field dan curah hujan = 0 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = unirrigated agri field dan curah hujan = 1 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = unirrigated agri field dan curah hujan = 2 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = paddy field dan kecepatan angin = 2 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = paddy field dan kecepatan angin = 3 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = paddy field dan kecepatan angin = 1 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = shrubs dan curah hujan = 0 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = shrubs dan curah hujan = 1 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = shrubs dan curah hujan = 2 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = bare land maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = water body dan curah hujan = 0 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = water body dan curah hujan = 1 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = water body dan curah hujan = 2 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = settlement dan curah hujan = 0 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = settlement dan curah hujan = 1 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = settlement dan curah hujan = 2 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = mangrove dan kecepatan angin = 2 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = mangrove dan kecepatan angin = 3 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = mangrove dan kecepatan angin = 1 m/s maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = dryland forest dan curah hujan = 0 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = dryland forest dan curah hujan = 1 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = dryland forest dan curah hujan = 2 mm/day maka kerapatan titik api = low. : Jika temperatur = 298 K dan tutupan lahan = dryland forest dan curah hujan = 3 mm/day maka kerapatan titik api = low.
20 Lanjutan Aturan 24 : Jika temperatur = 298 K dan tutupan lahan = plantation dan curah hujan = 0 mm/day maka kerapatan titik api = low. Aturan 25 : Jika temperatur = 298 K dan tutupan lahan = plantation dan curah hujan = 1 mm/day maka kerapatan titik api = low. Aturan 26 : Jika temperatur = 298 K dan tutupan lahan = plantation dan curah hujan = 2 mm/day maka kerapatan titik api = low. Aturan 27 : Jika temperatur = 298 K dan tutupan lahan = plantation dan curah hujan = 3 mm/day maka kerapatan titik api = low. Aturan 28 : Jika temperatur = 298 K dan tutupan lahan = mix garden dan kecepatan angin = 2 m/s maka kerapatan titik api = low. Aturan 29 : Jika temperatur = 298 K dan tutupan lahan = mix garden dan kecepatan angin = 3 m/s maka kerapatan titik api = low. Aturan 30 : Jika temperatur = 298 K dan tutupan lahan = mix garden dan kecepatan angin = 1 m/s maka kerapatan titik api = low. Aturan 31 : Jika temperatur = 298 K dan tutupan lahan = swamp maka kerapatan titik api = low. Aturan 32 : Jika temperatur = 297 K dan curah hujan = 1 mm/day maka kerapatan titik api = low. Aturan 33 : Jika temperatur = 297 K dan curah hujan = 2 mm/day dan kecepatan angin = 2 m/s maka kerapatan titik api = low. Aturan 34 : Jika temperatur = 297 K dan curah hujan = 2 mm/day dan kecepatan angin = 1 m/s maka kerapatan titik api = low. Aturan 35 : Jika temperatur = 297 K dan curah hujan = 3 mm/day dan kecepatan angin = 0 m/s maka kerapatan titik api = low. Aturan 36 : Jika temperatur = 297 K dan curah hujan = 3 mm/day dan kecepatan angin = 1 m/s maka kerapatan titik api = low. Aturan 37 : Jika temperatur = 297 K dan curah hujan = 4 mm/day dan kecepatan angin = 1 m/s maka kerapatan titik api = high. Aturan 38 : Jika temperatur = 299 K maka kerapatan titik api = low.
21
RIWAYAT HIDUP Penulis dilahirkan di Serang pada tanggal 01 September 1992 yang merupakan anak ke-8 dari 8 bersaudara dengan ayah bernama H Ali Rachwan dan Ibu bernama Hj Jumatul Adawiyah. Pada tahun 2007, penulis menempuh pendidikan menengah atas di SMA Negeri 2 Krakatau Steel Cilegon dan masuk program IPA. Pada tahun 2010, penulis lulus dari SMA Negeri 2 Krakatau Steel Cilegon dan diterima di Program Studi (S-1) Ilmu Komputer Institut Pertanian Bogor melalui jalur SNMPTN atau Seleksi Nasional Masuk Perguruan Tinggi Negeri pada tahun yang sama. Pada tahun 2013, penulis melaksanakan kegiatan praktik kerja lapangan (PKL) di instansi pemerintah yaitu Badan Pemeriksa Keuangan Republik Indonesia, Jakarta Pusat, selama 35 hari kerja.