SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI RIAU MENGGUNAKAN POHON KEPUTUSAN C4.5
KHAIRIL AMRI
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Sistem Informasi Geografis Berbasis Web untuk Klasifikasi Kemunculan Titik Api di Provinsi Riau Menggunakan Pohon Keputusan C4.5 adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Juni 2014 Khairil Amri NRP G64100006
ABSTRAK KHAIRIL AMRI. Sistem Informasi Geografis Berbasis Web untuk Klasifikasi Kemunculan Titik Api di Provinsi Riau Menggunakan Pohon Keputusan C4.5. Dibimbing oleh IMAS SUKAESIH SITANGGANG. Kebakaran hutan merupakan masalah serius karena dapat menyebabkan rusaknya ekosistem hutan dan lingkungan sekitar di banyak wilayah di Sumatera dan Kalimantan, termasuk Provinsi Riau. Salah satu upaya pencegahan terjadinya kebakaran hutan adalah dengan menyediakan informasi terkait titik api dan karakteristik wilayah yang berpotensi munculnya titik api. Informasi tersebut dapat disajikan dalam bentuk sistem informasi geografis (SIG) untuk klasifikasi kemunculan titik api. Penelitian ini bertujuan untuk membangun modul klasifikasi kemunculan titik api dalam SIG menggunakan OpenGeo Suite 3.0. Modul klasifikasi dibuat menggunakan metode pohon keputusan yaitu algoritme C4.5. Penerapan algoritme C4.5 pada data kebakaran hutan menghasilkan 109 aturan klasifikasi dengan akurasi 69.56%. SIG memiliki fitur-fitur utama yaitu menampilkan peta, pan map, zoom in, zoom out, scale, mouse position dan fungsi klasifikasi kemunculan titik api berdasarkan karakteristik wilayah. Dengan adanya SIG ini, dapat ditentukan apakah suatu wilayah berpotensi munculnya titik api berdasarkan karakteristik wilayah yang dapat digunakan dalam pengambilan keputusan terkait pencegahan kebakaran hutan. Kata kunci: algoritme C4.5, klasifikasi, pohon keputusan, sistem informasi geografis, titik api
ABSTRACT KHAIRIL AMRI. Web-Based Geographic Information System for Hotspot Occurrences Classification in Riau Province using C4.5 Decision Tree. Supervised by IMAS SUKAESIH SITANGGANG. Forest fire is a serious problem because it causes damages to forest ecosystem and surrounding environment in many areas in Sumatera and Kalimantan including Riau Province. One of activities in forest fire prevention is to provide relevant information about hotspot and characteristics of areas where hotspots probably occur. Such information can be presented in a geographic information system (GIS) for classification of hotspot occurrences. This study aims to develop a classification of hotspot occurrences module in a GIS using OpenGeo Suite 3.0. The classification module was made using the decision tree method namely the C4.5 algorithm. Applying the C4.5 algorithm on the forest fire data generated 109 classification rules with accuracy of 69.56%. The SIG has major features such as displaying map, pan map, zoom, in, zoom out, scale, mouse position and a classification module for hotspot occurrences based on characteristics of areas. The GIS enables users to determine whether an area is potential for hotspot occurrences or not based on its characteristics. Potential hotspot occurrences can be used in decision making related to forest fire prevention. Keywords: classification, C4.5 algorithm, decision tree, geographic information system, hotspot
SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI RIAU MENGGUNAKAN POHON KEPUTUSAN C4.5
KHAIRIL AMRI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
Penguji: 1 Hari Agung Adrianto, SKom MSi 2 Rina Trisminingsih, SKom MT
Judul Skripsi : Sistem Informasi Berbasis Web untuk Klasifikasi Kemunculan Titik Api di Provinsi Riau Menggunakan Pohon Keputusan C4.5 Nama : Khairil Amri NIM : G64100006
Disetujui oleh
Dr Imas Sukaesih Sitanggang, SSi MKom Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan September 2013 ini ialah kebakaran hutan, dengan judul Sistem Informasi Geografis Berbasis Web untuk Klasifikasi Kemunculan Titik Api di Provinsi Riau Menggunakan Pohon Keputusan C4.5. Skripsi ini merupakan salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Penulis mengucapkan terima kasih kepada semua pihak yang telah berperan dalam penelitian ini, di antaranya: 1 Mama, kakak, adik, keponakan dan keluarga lainnya yang telah memberikan dukungan, doa, motivasi, semangat, dan kasih sayang yang sangat besar 2 Ibu Dr Imas Sukaesih Sitanggang, SSi MKom selaku dosen pembimbing yang telah memberikan bimbingan, saran, arahan, dan bantuan selama penyelesaian skripsi 3 Bapak Hari Agung Adrianto, SKom MSi dan Ibu Rina Trisminingsih SKom MT selaku dosen penguji atas kesediaannya menguji pada waktu sidang 4 Sahabat-sahabat terbaik penulis, Hafizd Adityo Utomo, Resti Hidayah, Roudhotul Jannah, Risa Ika Wijayanti, Colin Sabatini Lumban Tobing, terima kasih atas doa, semangat, dan bantuannya, semoga sukses untuk kita semua 5 Kak Anna Qahhariana dan kak Sonita Veronica Br Barus atas bantuannya 6 Teman-teman PIXELS 47 yang terus memberikan semangat dan keceriaan serta kenangan bagi penulis. 7 Seluruh dosen dan civitas akademika Departemen Ilmu Komputer IPB 8 Semua pihak yang telah membantu dalam penyelesaian skripsi ini yang tidak bisa penulis sebutkan satu persatu. Penulis berharap semoga skripsi ini bermanfaat bagi pihak yang membutuhkan.
Bogor, Juni 2014
Khairil Amri
DAFTAR ISI DAFTAR TABEL
viii
DAFTAR GAMBAR
viii
DAFTAR LAMPIRAN
viii
PENDAHULUAN
1
Latar Belakang
1
Perumusan Masalah
1
Tujuan Penelitian
1
Manfaat Penelitian
2
Ruang Lingkup Penelitian
2
METODE
2
Data dan Area Studi
2
Tahapan Penelitian
3
Perangkat Penelitian
6
HASIL DAN PEMBAHASAN
7
Praproses Data
7
Pembagian Dataset
8
Pembuatan Modul Klasifikasi Menggunakan Pohon Keputusan C4.5
8
Menghitung Akurasi Pohon Keputusan
9
Pembuatan Modul Klasifikasi Titik Api dalam Sistem Informasi Geografis
9
SIMPULAN DAN SARAN
13
Simpulan
13
Saran
13
DAFTAR PUSTAKA
14
LAMPIRAN
15
RIWAYAT HIDUP
20
DAFTAR TABEL 1 2 3 4
Kategori untuk jarak terdekat dengan pusat kota Kategori untuk jarak terdekat dengan jalan Kategori untuk jarak terdekat dengan sungai Confusion matrix
7 8 8 9
DAFTAR GAMBAR 1 2 3 4 5 6 7 8
Diagram alir penelitian Komponen dasar dalam SIG berbasis web (Peng dan Tsou 2003) Potongan kode program klasifikasi Kode program untuk menampilkan penanda Tampilan halaman utama klasifikasi titik api di Provinsi Riau Tampilan data dan hasil klasifikasi sesuai masukan pengguna Tampilan peta menggunakan Google Map Tampilan menu “Tentang Sistem”
3 6 10 11 11 12 12 13
DAFTAR LAMPIRAN 1 Contoh record data yang belum dikonversi dari derajat menjadi kilometer 15 2 Contoh record data yang sudah dikonversi dari derajat menjadi kilometer dan dikategorikan 16 3 Contoh hasil klasifikasi dengan C4.5 menggunakan Weka 3.6.9 17
PENDAHULUAN Latar Belakang Indonesia merupakan negara yang sebagian besar daratannya ditutupi hutan. Luas hutan Indonesia adalah 98.56 juta hektar atau 52.4% luas wilayah Indonesia (Kemenhut 2012). Luasnya hutan Indonesia menjadikan Indonesia sebagai salah satu paru-paru dunia. Namun, dari tahun ke tahun luas hutan di Indonesia semakin menyusut. Laju deforestasi hutan Indonesia mencapai 610 375.92 hektar per tahun (Kemenhut 2012). Banyak hal yang menyebabkan menyusutnya luas hutan di Indonesia, salah satu di antaranya adalah kebakaran hutan. Kebakaran hutan termasuk masalah serius yang membutuhkan perhatian penuh dalam penanggulangannya. Kebakaran hutan dapat menyebabkan rusaknya keseimbangan ekosistem hutan. Selain itu, kebakaran hutan juga akan menurunkan produksi oksigen (O2) yang diperlukan manusia. Oleh karena itu, kebakaran hutan harus dikendalikan dengan sebaik-baiknya. Pengendalian kebakaran hutan dapat dilakukan dengan berbagai cara, salah satu di antaranya adalah membangun sistem informasi geografis (SIG) untuk persebaran titik api. Titik panas adalah indikator kebakaran hutan yang mendeteksi suatu lokasi yang memiliki suhu relatif lebih tinggi dibandingkan dengan suhu di sekitarnya (Kemenhut 2009). Pada penelitian ini dibentuk modul klasifikasi kemunculan titik api di Provinsi Riau dalam sistem informasi geografis (SIG). Pada penelitian ini, klasifikasi kemunculan titik api dilakukan menggunakan algoritme C4.5. Modul ini diintegrasikan dengan SIG data histori titik api di Indonesia yang dibangun oleh Barus (2014).
Perumusan Masalah Informasi persebaran titik api dapat divisualisasikan dalam bentuk peta menggunakan SIG. Pengembangan aplikasi SIG sudah banyak dilakukan. Namun, pada aplikasi tersebut hanya menampilkan lokasi kebakaran hutan dan belum terdapat modul klasifikasi titik api. Modul klasifikasi titik api sangat penting untuk menentukan lokasi rawan kebakaran berdasarkan karakeristik lokasi terjadinya titik api. Informasi tersebut bermanfaat dalam pengambilan keputusan terkait pengendalian kebakaran hutan di Provinsi Riau. Rumusan masalah dari penelitian ini yaitu membangun dan mengintegrasikan modul klasifikasi kemunculan titik api pada SIG berbasis web yang telah dibangun oleh peneliti sebelumnya.
Tujuan Penelitian Penelitian ini bertujuan: 1 Menerapkan algoritme C4.5 dalam pembentukan klasifikasi kemunculan titik api di Provinsi Riau. 2 Membuat modul pohon keputusan dalam sistem informasi geografis berbasis web untuk prediksi kemunculan titik api di Provinsi Riau.
2 3 Visualisasi hasil klasifikasi kemunculan titik api dalam bentuk peta.
Manfaat Penelitian Penelitian ini diharapkan bermanfaat dalam menentukan daerah yang rawan terjadi kebakaran berdasarkan karakteristik lokasi tersebut sehingga dapat dijadikan informasi tambahan dalam pengambilan keputusan terkait pengendalian kebakaran hutan di Provinsi Riau.
Ruang Lingkup Penelitian Ruang lingkup penelitian ini meliputi: 1 Data yang digunakan adalah data hotspot Provinsi Riau tahun 2005 yang sudah dilakukan pembersihan data, perhitungan jarak terdekat suatu lokasi terhadap pusat kota, jalan, dan sungai pada penelitian Fernando (2014). 2 Data pendukung berupa data karakteristik wilayah yaitu jalan, sungai, dan pusat kota. 3 Modul klasifikasi diintegrasikan pada sistem informasi geografis berbasis web yang dikembangkan oleh Barus (2014). 4 Pengembangan sistem menggunakan OpenGeo Suite 3.0 sebagai DBMS (PostGIS) serta web map server (GeoServer) dan XAMPP 1.7.3 sebagai web server.
METODE Data dan Area Studi Data yang digunakan dalam penelitian ini merupakan data spasial. Data spasial berhubungan dengan geometri fitur spasial. SIG menggunakan dua model dasar untuk merepresentasikan fitur spasial yaitu vektor dan raster. Model data vektor menggunakan titik dan koordinat x, y untuk membangun fitur spasial titik, terdiri atas titik dan edge (garis) yang menghubungkan titik-titik ini ke bentuk polygon. Model data raster menggunakan sebuah grid untuk merepresentasikan variasi spasial dari sebuah fitur. Setiap sel dalam grid memiliki nilai yang berhubungan dengan karakteristik fitur spasial pada lokasi itu. Data raster sangat cocok digunakan untuk merepresentasikan fitur spasial yang kontinu seperti curah hujan dan ketinggian (Chang 2002). Data yang digunakan berupa hasil perhitungan jarak terdekat suatu lokasi terhadap pusat kota, jalan, dan sungai dalam satuan derajat serta kelas kemunculan titik api (7169 record kelas true dan 7200 record kelas false). Kelas true mengindikasikan titik api sedangkan kelas false bukan titik api. Data ini merupakan hasil praproses yang telah dilakukan oleh Fernando (2014). Jarak terdekat suatu lokasi ke pusat kota, jalan, dan sungai menunjukkan jarak terdekat titik dengan kelas true dan false ke pusat kota, jalan, dan sungai terdekat. Data lain yang digunakan adalah peta Provinsi Riau, data jalan, sungai, dan pusat kota dalam
3 format shapefile. Peta Provinsi Riau yang digunakan terdiri atas 9 kabupaten (Rokan Hulu, Rokan Hilir, Kuantan Singingi, Indragiri Hulu, Kampar, Bengkalis, Pelalawan, Siak, dan Indragiri Hilir) dan 2 kota (Pekan Baru dan Dumai). Data pusat kota terdiri atas Tembilahan, Selat Panjang, Dumai, Balai Pungut, Duri, dan Bengkalis.
Tahapan Penelitian Penelitian ini dilakukan dalam beberapa tahap seperti yang diilustrasikan pada Gambar 1. Mulai
Praproses data Pembagian dataset
Pembuatan modul klasifikasi menggunakan algoritme pohon keputusan C4.5
Pohon keputusan
Menghitung akurasi pohon keputusan
Data training
Data uji
Pembuatan modul klasifikasi titik api dalam sistem informasi geografis Peta klasifikasi titik api
Ya
Selesai
Akurasi ≥ threshold
Tidak
Gambar 1 Diagram alir penelitian Praproses Data Pada praproses data dilakukan 3 tahap, yaitu menghapus data duplikat, mengkonversi nilai data dari derajat menjadi kilometer (km), serta diskretisasi dan mengkategorikan data jarak terdekat dengan pusat kota, jalan, serta sungai. Data hasil perhitungan jarak terdekat dengan pusat kota, jalan, dan sungai, beberapa di antaranya merupakan data duplikat. Untuk itu, perlu dilakukan penghapusan data duplikat untuk mendapatkan hasil yang lebih akurat. Setelah menghapus data duplikat, kemudian dilakukan konversi nilai terhadap jarak terdekat dengan pusat kota, jalan, dan sungai yang semula dalam satuan derajat menjadi km agar lebih mudah dipahami oleh pengguna.
4 Data yang telah dihapus duplikatnya dan dikonversi menjadi km kemudian dilakukan diskretisasi berdasarkan frekuensi guna mendapatkan hasil yang merata untuk setiap interval. Jarak terdekat dengan pusat kota dibagi menjadi 10 interval yang diberi label M1 sampai M10. Jarak terdekat dengan jalan dibagi menjadi 5 interval yang diberi label RO1 sampai RO5. Jarak terdekat dengan sungai dibagi menjadi 5 interval yang diberi label RI1 sampai RI5. Pembagian Dataset Data hasil perhitungan jarak terdekat dengan pusat kota, jalan, dan sungai dibagi menjadi data training dan data uji dengan k-fold cross validation. Data training digunakan untuk membangun pohon keputusan, sedangkan data uji digunakan untuk menghitung akurasi pohon keputusan. Pembuatan Modul Klasifikasi Menggunakan Algoritme Pohon Keputusan C4.5 Klasifikasi adalah sebuah bentuk analisis data yang model ekstraksi datanya menggambarkan kelas data penting. Model tersebut disebut classifier yang memprediksi kategori (discrete, unordered) label kelas. Klasifikasi data merupakan proses yang terdiri atas dua tahap, yaitu pembelajaran dan klasifikasi. Pada tahap pembelajaran, data training dianalisis dengan sebuah algoritme klasifikasi. Learned model atau classifier direpresentasikan dalam bentuk aturan klasifikasi. Pada tahap klasifikasi, data uji digunakan untuk menghitung akurasi dari aturan klasifikasi. Jika akurasi dianggap dapat diterima, aturan-aturan yang telah terbentuk dapat digunakan untuk klasifikasi data tuple baru (Han et al. 2012). Model klasifikasi berguna untuk keperluan deskriptif dan prediktif. Pada tahapan ini dibuat pohon keputusan untuk klasifikasi kemunculan titik api. Atribut targetnya adalah kelas dengan label T (true) dan F (false). Kelas T (true) menunjukkan kemunculan titik api, sedangkan kelas F (false) menunjukkan ketidakmunculan titik api. Pohon keputusan adalah sebuah flowchart dengan struktur seperti pohon di mana setiap internal node (nonleaf node) menunjukkan tes pada atribut, setiap cabang merupakan hasil dari tes, dan masing-masing node (terminal node) memegang label kelas (Han et al. 2012). Pada penelitian ini digunakan algoritme pohon keputusan C4.5. Algoritme C4.5 dikembangkan dari algoritme ID3 untuk membangkitkan pohon keputusan. Algoritme C4.5 mengadopsi konsep “greedy” (nonbacktracking), yaitu membentuk pohon keputusan dengan metode divide dan conquer data secara rekursif dari atas ke bawah (Han et al. 2012). Algoritme C4.5 secara rekursif mengunjungi setiap decision node, memilih pemisahan (split) yang optimal, sampai tidak ada pemisahan yang mungkin. Algoritme C4.5 menggunakan konsep information gain atau entropy reduction untuk memilih pemisahan yang optimal (Larose 2005). Entropy himpunan kasus S yang memiliki k atribut berbeda untuk setiap kelas C dan information gain untuk atribut X didefinisikan sebagai berikut (Quinlan 1993):
5 k
Entropy (S) = - ∑ j=1
freq(Cj ,S) freq(Cj ,S) × log2 ( ) |S| |S| |S |
Gain (X) = entropy (S) - ∑ni=1 |S|i × entropy (Si) dengan: Freq (Cj, S) |𝑆| 𝑆 𝐶𝑗 𝑘 𝑆𝑖 𝑛 X |𝑆𝑖 | |𝑆|
: jumlah atribut j pada kelas C dalam himpunan kasus S : banyaknya himpunan kasus S : himpunan kasus : subset C yang memiliki label kelas j : banyaknya kelas : subset ke-i : banyaknya subset : atribut : proporsi record dalam subset i.
Pada setiap pohon keputusan, algoritme C4.5 memilih pemisahan (split) optimal menjadi pemisahan (split) yang memiliki information gain tertinggi. Hasil klasifikasi berupa aturan-aturan pohon keputusan. Dalam penelitian ini dibangun modul klasifikasi pohon keputusan dalam SIG yang berisi aturan-aturan klasifikasi. Modul klasifikasi dibangun menggunakan bahasa pemrograman PHP. Menghitung Akurasi Pohon Keputusan Akurasi pohon keputusan yang dihasilkan dapat dilihat dari confusion matrix, yaitu matriks yang memperlihatkan perhitungan banyaknya label kelas yang diprediksi benar dibagi label kelas keseluruhan. Jika hasilnya melebihi threshold 65% diproses ke tahap berikutnya, apabila kurang dari threshold 65%, masuk ke proses pembuatan modul klasifikasi pohon keputusan untuk pengolahan data kembali. Pembuatan Modul Klasifikasi Titik Api dalam Sistem Informasi Geografis SIG berbasis web adalah produk-produk SIG yang dipublikasi di Internet yang dapat diakses oleh siapapun sebagai penyedia informasi atau data sharing. SIG berbasis web umumnya memiliki empat komponen utama yaitu klien, server web dengan server aplikasi, server peta, dan server data (Peng dan Tsou 2003). Server klien sebagai antarmuka pengguna untuk berinteraksi dengan program SIG berbasis web. Server web menerima permintaan klien, melayani halaman web statik, dan melibatkan server aplikasi. Server aplikasi mengatur transaksi server, keamanan, dan keseimbangan beban. Server peta memroses permintaan klien dan membangkitkan hasil. Server data melayani data geospasial dan data non spasial serta menyediakan akses data dan menajemen sebuah Structured Query Language
6 (SQL) (Peng dan Tsou 2003). Komponen dasar SIG berbasis web diilustrasikan pada Gambar 2. Client Client
Web Server with Application Server
Map Server
Data Server
Client Gambar 2 Komponen dasar dalam SIG berbasis web (Peng dan Tsou 2003) Pada tahapan ini, data yang telah diolah melalui proses klasifikasi dengan algoritme C4.5 diolah kembali dengan menggunakan perangkat lunak OpenGeo Suite 3.0. Proses ini dilakukan untuk membentuk peta rawan kebakaran yang baru berdasarkan aturan yang dihasilkan. Hasilnya diintegrasikan dengan sistem informasi geografis yang sudah ada untuk visualisasi kemunculan titik api di Provinsi Riau. Perangkat Penelitian Pembuatan modul klasifikasi untuk data persebaran titik api di Provinsi Riau ini menggunakan perangkat lunak dan perangkat keras sebagai berikut: 1 Perangkat keras berupa komputer personal dengan spesifikasi sebagai berikut: a. Intel® Core ™ i5-2430M CPU @ 2.40GHz b. Memori RAM 4.00 GB c. 750GB HDD d. Mouse 2 Perangkat lunak a. Sistem operasi Windows 8 b. OpenGeo Suite 3.0 untuk mengelola data peta c. Microsoft Excel 2013 untuk mengolah data titik api dalam format .csv d. XAMPP 1.7.3 sebagai web server e. Adobe Dreamweaver CS 6 untuk mengkodekan aturan-aturan pohon keputusan f. Bahasa pemrograman PHP g. Quantum GIS 2.0.1 Dufour untuk visualisasi data spasial h. RapidMiner 5 untuk diskretisasi data jarak berdasarkan frekuensinya i. Weka 3.6.9 untuk klasifikasi data
7
HASIL DAN PEMBAHASAN Praproses Data Tahapan-tahapan yang dilakukan dalam praproses data adalah sebagai berikut: 1 Menghapus data duplikat Data yang digunakan diolah menggunakan Microsoft Excel dan dilakukan penghapusan data duplikat untuk menghasilkan klasifikasi yang lebih akurat. Data yang semula berjumlah 14 369 record, setelah dihapus data duplikat menjadi 11 810 record. 2 Mengkonversi nilai data Data jarak terdekat dengan pusat kota, jalan, dan sungai semula dalam satuan derajat, kemudian dikonversi ke km dengan mengalikan setiap nilai jarak dengan pengali 111.3199. Angka tersebut merupakan hasil bagi keliling bumi dengan 360 karena keliling bumi berbentuk lingkaran. Contoh data yang belum dikonversi dari derajat ke km dapat dilihat pada Lampiran 1. Konversi nilai dari derajat menjadi km bertujuan memudahkan pengguna memahami data yang ditampilkan pada web sistem informasi geografis. 3 Diskretisasi data Atribut jarak terdekat dengan pusat kota, jarak terdekat dengan jalan, dan jarak terdekat dengan sungai didiskretisasi berdasarkan frekuensi menggunakan perangkat lunak RapidMiner 5. Untuk memudahkan implementasi jumlah digit desimal ditetapkan satu sehingga jumlah objek untuk setiap interval berubah dari output yang dihasilkan RapidMiner 5. Contoh data yang sudah dikonversi dari derajat ke km dan dikategorikan dapat dilihat pada Lampiran 2. Kategori data untuk atribut jarak terdekat dengan pusat kota, jarak terdekat dengan jalan, dan jarak terdekat dengan sungai berturut-turut dapat dilihat pada Tabel 1, Tabel 2, dan Tabel 3. Tabel 1 Kategori untuk jarak terdekat dengan pusat kota Kategori M1 M2 M3 M4 M5 M6 M7 M8 M9 M10
Interval jarak ke Jumlah objek pusat kota (km) (0, 22.8] 1256 (22.8, 32.8] 1170 (32.8, 42.8] 1207 (42.8, 54.0] 1099 (54.0, 67.3] 1259 (67.3, 77.4] 1104 (77.4, 90.7] 1182 (90.7, 108.5] 1223 (108.5, 126.3] 1135 >126.3 1175
8 Tabel 2 Kategori untuk jarak terdekat dengan jalan Kategori RO1 RO2 RO3 RO4 RO5
Interval jarak ke Jumlah objek jalan (km) (0, 0.2] 2163 (0.2, 0.7] 2548 (0.7, 1.6] 2387 (1.6, 3.8] 2337 >3.8 2375
Tabel 3 Kategori untuk jarak terdekat dengan sungai Kategori RI1 RI2 RI3 RI4 RI5
Interval jarak ke Jumlah objek sungai (km) (0, 1.7] 2384 (1.7, 3.9] 2427 (3.9, 7.2] 2508 (7.2, 12.8] 2171 >12.8 2320 Pembagian Dataset
Data akan dibagi menjadi data latih dan data uji menggunakan metode 10folds cross validation. Setiap bagian (fold) dijadikan sebagai data uji dan n-1 fold dijadikan data latih. Proses ini dilakukan oleh Weka 3.6.9 pada saat klasifikasi data untuk membangkitkan aturan-aturan pohon keputusan.
Pembuatan Modul Klasifikasi Menggunakan Pohon Keputusan C4.5 Dataset yang terbentuk diklasifikasikan menggunakan algoritme C4.5. Algoritme C4.5 memilih atribut yang memiliki information gain yang paling tinggi sebagai atribut uji. Pada Weka 3.6.9, algoritme C4.5 diimplementasikan dengan modul J48. Algoritme C4.5 menghasilkan 109 aturan yang dapat dilihat pada Lampiran 3. Beberapa contoh aturan yang terbentuk antara lain: Aturan 1: Jika jarak terdekat dengan sungai kurang dari atau sama dengan 1.7 km maka lokasi tersebut tidak berpotensi terjadi kebakaran (false). Aturan 2: Jika jarak terdekat dengan sungai di antara 1.7 km dan 3.9 km dan jarak terdekat dengan pusat kota kurang dari atau sama dengan 22.8 km maka lokasi tersebut tidak berpotensi terjadi kebakaran (false). Aturan 3: Jika jarak terdekat dengan sungai di antara 3.9 km dan 7.2 km dan jarak terdekat dengan pusat kota di antara 108.5 km dan 126.3 km dan jarak terdekat dengan jalan kurang dari 0.2 km maka lokasi tersebut berpotensi terjadi kebakaran (true). Aturan 4: Jika jarak terdekat dengan sungai di antara 7.2 km dan 12.8 km dan jarak terdekat dengan pusat kota di antara 32.8 km dan 42.8 km dan jarak
9 terdekat dengan jalan di antara dari 0.7 km dan 1.6 km maka lokasi tersebut berpotensi terjadi kebakaran (true). Aturan 5: Jika jarak terdekat dengan sungai lebih besar dari 12.8 km dan jarak terdekat dengan pusat kota kurang dari 22.8 km maka lokasi tersebut berpotensi terjadi kebakaran (true).
Menghitung Akurasi Pohon Keputusan Dengan menggunakan metode pengujian cross validation 10 folds, diperoleh confusion matrix untuk pohon keputusan C4.5 yang dapat dilihat pada Tabel 4. Tabel 4 Confusion matrix Kelas hasil prediksi Total True False True 2168 2442 4610 Kelas aktual False 1152 6048 7200 Total 3320 8490 11 810 Dari confusion matrix dalam Tabel 4, dapat diketahui bahwa sekitar 34% dari data yang diklasifikasi kelas true merupakan salah klasifikasi dan sekitar 29% dari data yang diklasifikasi kelas false merupakan salah klasifikasi. Akurasi model pohon keputusan yang diperoleh dapat dihitung sebagai berikut: akurasi =
banyak total prediksi yang benar total banyaknya prediksi
2168+6048 2168+2442+1152+6048 8216 akurasi = = 0.6956 11 810 Akurasi pohon keputusan yang menunjukkan keakuratan pohon keputusan dalam mengklasifikasikan kemunculan titik api adalah 69.56%. akurasi =
Pembuatan Modul Klasifikasi Titik Api dalam Sistem Informasi Geografis Data spasial yang meliputi jarak terdekat dengan pusat kota, jarak terdekat dengan jalan, jarak terdekat dengan sungai, kelas, peta Provinsi Riau, pusat kota, jalan, dan sungai disimpan dalam basis data spasial dalam SIG. Data ini diolah lebih lanjut untuk menampilkan hasil klasifikasi titik api berdasarkan pohon keputusan yang telah diperoleh pada tahap sebelumnya. SIG dibangun menggunakan perangkat lunak OpenGeo Suite 3.0. Seperti yang diilustrasikan pada Gambar 2, komponen SIG berbasis web ada 4, yaitu klien, server web dengan server aplikasi, server peta, serta server data. Pada penelitian ini, web browser bertindak sebagai klien. Apache yang telah tergabung dalam package XAMPP 1.7.3 bertindak sebagai server web. Server web disebut juga sebagai server HTTP, berfungsi untuk memberikan respon atas permintaan
10 dari web browser via HTTP. Modul klasifikasi kemunculan titik api terletak pada bagian server web. Server aplikasi berperan sebagai translator atau penghubung antara server web dan server peta. Server aplikasi meliputi model common gateway interface (CGI) atau CGI extension seperti Microsoft’s Internet Server Application Program Interface (ISAPI) dan Active Server Pages (ASP), dan lain-lain. Selanjutnya Geoserver bertindak sebagai server peta yang memroses permintaan klien dan membangkitkan peta. PostGIS bertindak sebagai server data yang melayani data spasial dan non spasial. Geoserver dan PostGIS sudah terdapat dalam package OpenGeo Suite 3.0. Gambar 3 merupakan potongan kode program untuk klasifikasi.
Gambar 3 Potongan kode program klasifikasi Data hasil klasifikasi diintegrasikan dengan peta Provinsi Riau dan ditampilkan penanda untuk visualisasi lokasi-lokasi yang tidak atau berpotensi terjadi kebakaran berdasarkan jarak terdekat terhadap pusat kota, jalan, dan sungai yang dimasukkan pengguna. Gambar 4 merupakan potongan kode program untuk menampilkan penanda. Gambar 5 menunjukkan halaman muka SIG untuk klasifikasi titik api. Halaman muka ini memiliki beberapa fitur utama yang terdiri atas pan map, zoom in, zoom out, scale, dan peta Provinsi Riau menggunakan Openlayer. Pada peta Provinsi Riau terlihat sungai (garis biru), jalan (garis coklat), pusat kota (titik merah muda) serta marker. Marker muncul setelah tombol “Prediksi” yang terlihat pada Gambar 6 ditekan. Marker berwarna merah untuk hasil klasifikasi true dan berwarna biru untuk hasil klasifikasi false.
11
Gambar 4 Kode program untuk menampilkan penanda
Gambar 5 Tampilan halaman utama klasifikasi titik api di Provinsi Riau Tampilan hasil klasifikasi kemunculan titik api berdasarkan data jarak lokasi ke pusat kota, jalan, dan sungai terdekat yang di-input-kan pengguna diberikan pada Gambar 6. Terdapat 2 tombol pada Gambar 6, tombol “Prediksi” berfungsi untuk menampilkan hasil klasifikasi serta marker dan tombol “Reset Map” untuk menghapus tabel hasil klasifikasi serta marker pada peta. Data yang ditampilkan pada tabel merupakan data yang sesuai dengan masukan pengguna dan hasil klasifikasi kemunculan titik api. Gambar 7 menunjukkan halaman SIG yang menampikan peta menggunakan google map. Tampilan ini muncul ketika masuk ke menu “Google Map”. Pada halaman ini ditampilkan pan map, zoom in, zoom out, scale, map type control, marker, dan info window. Info window muncul ketika pengguna melakukan aksi pada marker. Info window dapat ditutup dengan menekan close button pada pojok kanan atas info window. Pada info window ditampilkan keterangan dari marker meliputi info kabupaten / kota, jarak titik tersebut dengan pusat kota, jalan, dan sungai. Selain itu, pengguna dapat mengganti jenis tampilan peta google map. Tampilan default yaitu jenis roadmap. Pengguna dapat menggantinya dengan tipe satellite atau terrain menggunakan fitur map type control.
12
Gambar 6 Tampilan data dan hasil klasifikasi sesuai masukan pengguna
Gambar 7 Tampilan peta menggunakan Google Map Gambar 8 merupakan tampilan menu “Tentang Sistem”. Pada halaman ini terdapat keterangan tentang sistem dan sumber data yang digunakan. SIG yang telah dibangun memiliki beberapa fungsi. Fungsi-fungsi yang terdapat pada SIG telah diuji menggunakan metode black box dengan hasil setiap fungsi berjalan dengan baik. Pengujian dilakukan untuk 6 kelas uji, yaitu menu utama, menu google map, menu tentang sistem, hasil klasifikasi, dan tabel. Hasil pengujian selengkapnya dapat dilihat pada Lampiran 4.
13
Gambar 8 Tampilan menu “Tentang Sistem”
SIMPULAN DAN SARAN Simpulan Simpulan dari penelitian ini yaitu: 1 Penerapan algoritme C4.5 untuk data kebakaran hutan di Provinsi Riau yang terdiri atas jarak terdekat dengan pusat kota, jalan, dan sungai menghasilkan 109 aturan klasifikasi untuk titik api dengan akurasi 69.56%. 2 Sistem informasi geografis untuk klasifikasi titik api berdasarkan pohon keputusan C4.5 berhasil dibangun menggunakan perangkat lunak OpenGeo Suite 3.0. SIG memiliki enam modul utama yaitu menampilkan peta, pan map, zoom in, zoom out, scale, mouse position dan fungsi klasifikasi kemunculan titik api berdasarkan karakteristik lokasi yang di-input-kan pengguna. 3 Visualisasi hasil klasifikasi titik api dalam bentuk peta memudahkan pengguna dalam melihat lokasi yang rawan terjadinya titik api berdasarkan karakteristik lokasi tersebut yaitu jarak terdekat ke pusat kota, jalan, dan sungai.
Saran Penelitian ini masih memiliki kekurangan, saran yang dapat disampaikan untuk penelitian selanjutnya adalah sebagai berikut: 1 Dilakukan praproses dengan pendekatan yang berbeda untuk diskretisasi dan tranformasi data. 2 Dilakukan penambahan atribut lain meliputi jenis tanah dan ketinggian lahan guna membangkitkan pohon keputusan untuk klasifikasi titik api yang lebih baik.
14
DAFTAR PUSTAKA Barus SV. 2014. Sistem informasi geografis berbasis web untuk data histori hotspot di Indonesia menggunakan OpenGeo Suite 3.0 [skripsi]. Bogor (ID): Institut Pertanian Bogor. Chang KT. 2002. Introduction to Geographic Information Systems. New York (US): McGraw-Hill. Fernando V. 2014. Klasifikasi data spasial untuk kemunculan hotspot di Provinsi Riau menggunakan algoritme ID3 [skripsi]. Bogor (ID): Institut Pertanian Bogor. Han J, Kamber M, Pei J. 2012. Data Mining: Concepts and Techniques. 3rd ed. Massachusetts (US): Morgan Kaufmann. [Kemenhut] Kementerian Kehutanan. 2009. Peraturan Menteri Kehutanan Nomor: P.12/Menhut-II/2009 tentang pengendalian kebakaran hutan [Internet]. [diunduh 2013 Nov 3]. Tersedia pada: http://storage.jakstik.ac.id/ProdukHukum/kehutanan/P12_09.pdf. [Kemenhut] Kementerian Kehutanan. 2012. Statistik kehutanan Indonesia 2011 [Internet]. [diunduh 2013 Okt 30]. Tersedia pada: http://agungwi.files.wordpress.com/2012/11/buku-statistik-juli2012_terbaru.pdf. Larose DT. 2005. Discovering Knowledge in Data: an Introduction to Data Mining. New Jersey (US): J Wiley. Peng ZR, Tsou MH. 2003. Internet GIS: Distributed Geographic Information Services for the Internet and Wireless Networks. New Jersey (US): J Wiley. Quinlan JR. 1993. C4.5: Programs for Machine Learning. Vol ke-1. California (US): Morgan Kaufmann.
15 Lampiran 1 Contoh record data yang belum dikonversi dari derajat menjadi kilometer Jarak terdekat dengan pusat kota (derajat) 0.39 0.35 1.23 1.22 0.52 0.27 0.22 1.17 0.14 0.41
Jarak terdekat dengan jalan (derajat) 0.000744 0.010375 0.005791 0.003971 0.004044 0.003050 0.000793 0.042827 0.026304 0.001737
Jarak terdekat dengan sungai (derajat) 0.09 0.15 0.03 0.00 0.03 0.19 0.02 0.08 0.18 0.10
Kelas T T T T T F F F F F
16 Lampiran 2 Contoh record data yang sudah dikonversi dari derajat menjadi kilometer dan dikategorikan Jarak terdekat dengan pusat kota (km) 50.09396 84.60312 43.41476 38.96197 136.9235 57.88635 30.05637 24.49038 130.2443 15.58479
Jarak terdekat dengan jalan (km) 4.442823 1.032791 0.082819 1.154933 0.644653 0.450129 0.339516 0.088272 4.767545 2.928167
Jarak terdekat dengan sungai (km) 5.565995 18.92438 10.01879 16.69799 3.339597 3.339597 21.15078 2.226398 8.905592 20.03758
Kategori jarak ke pusat kota M4 M7 M4 M3 M10 M5 M2 M2 M10 M1
Kategori Kategori jarak ke jarak ke Kelas jalan sungai RO5 RO3 RO1 RO3 RO2 RO2 RO2 RO1 RO5 RO4
RI3 RI5 RI4 RI5 RI2 RI2 RI5 RI2 RI4 RI5
T T T T T T F F F F
17 Lampiran 3 Contoh hasil klasifikasi dengan C4.5 menggunakan Weka 3.6.9 MinDist_River = RI5 | MinDist_Maincities = M3: T (458.0/133.0) | MinDist_Maincities = M1: T (525.0/133.0) | MinDist_Maincities = M2: T (464.0/123.0) | MinDist_Maincities = M4: F (135.0/50.0) | MinDist_Maincities = M6: T (149.0/42.0) | MinDist_Maincities = M8: F (125.0/44.0) MinDist_River = RI2 | MinDist_Maincities = M3: F (178.0/46.0) | MinDist_Maincities = M1: F (162.0/39.0) | MinDist_Maincities = M5: F (309.0/108.0) | MinDist_Maincities = M7: F (278.0/98.0) | MinDist_Maincities = M2: F (151.0/48.0) | MinDist_Maincities = M8: F (290.0/89.0) | MinDist_Maincities = M10: F (351.0/46.0) MinDist_River = RI3 | MinDist_Maincities = M3: F (155.0/42.0) | MinDist_Maincities = M7 | | MinDist_Road = RO3: F (46.0/13.0) | | MinDist_Road = RO1: F (100.0/25.0) | | MinDist_Road = RO4: T (44.0/19.0) | | MinDist_Road = RO2: F (62.0/14.0) | | MinDist_Road = RO5: F (40.0/7.0) | MinDist_Maincities = M4: F (287.0/98.0) | MinDist_Maincities = M6: F (250.0/97.0) | MinDist_Maincities = M8: F (302.0/85.0) | MinDist_Maincities = M10: F (240.0/26.0) MinDist_River = RI4 | MinDist_Maincities = M5: F (232.0/87.0) | MinDist_Maincities = M7: F (210.0/70.0) | MinDist_Maincities = M4: F (198.0/56.0) | MinDist_Maincities = M8: F (237.0/38.0) | MinDist_Maincities = M10: F (90.0/16.0) MinDist_River = RI1: F (2384.0/605.0)
18 Lampiran 4 Hasil pengujian fungsi-fungsi SIG No
Kondisi awal Halaman utama
Hasil yang diperoleh Tampilan halaman utama Tampilan halaman google map Tampilan halaman tentang sistem Tampilan hasil klasifikasi dan marker pada peta Openlayer dan google map Tampilan peta yang diperbesar
Hasil uji OK
Pilih navigasi zoom out
Tampilan peta yang diperkecil
OK
Pilih pan
navigasi
Tampilan peta yang digeser ke kiri, kanan, atas, dan bawah
OK
Pilih satellite pada map type control Pilih terrain pada map type control Tampilan peta
Tampilan peta dengan tipe satellite Tampilan peta dengan tipe terrain Tampilan scale
OK
Mengarahkan mouse pada tampilan peta
Tampilan koordinat longitude dan latitude berdasarkan posisi mouse pada peta
OK
Kelas uji
Deskripsi uji
1
Menu utama
Menampilkan halaman utama
2
Menu google map
Halaman utama
Pilih menu google map
3
Menu tentang sistem Hasil klasifikasi dan marker
Menampilkan halaman google map Menampilkan menu tentang sistem Menampilkan hasil klasifikasi dan marker pada peta
Halaman utama
Pilih menu tentang sistem
Halaman utama dan google map
Memperbesar peta
Halaman tampilan peta Openlayer dan google map Halaman tampilan peta Openlayer dan google map Halaman tampilan peta Openlayer dan google map Halaman tampilan peta google
Pilih kategori “Jarak dengan pusat kota”, “Jarak dengan sungai”, “jarak dengan jalan”, dan tekan tombol Prediksi Pilih navigasi zoom in
4
5
Menu tampilan peta
Memperkecil peta
Menggeser peta
Mengganti jenis peta
Menampilkan scale
Menampilkan mouse position
Halaman tampilan peta Openlayer dan google map Halaman tampilan peta Openlayer
Skenario uji Pilih home
menu
OK
OK
OK
OK
OK
OK
19
6
Tabel
Menampilkan info window
Halaman tampilan peta google
Click marker
Reset peta
Halaman tampilan peta Openlayer dan google map Halaman utama dan google map
Tekan tombol Reset Map
tampilan
Menampilkan tabel
pada
Pilih kategori “Jarak dengan pusat kota”, “Jarak dengan sungai”, “jarak dengan jalan”, dan tekan tombol Prediksi
Tampilan info kabupaten, jarak dengan pusat kota, jarak dengan sungai, dan jarak dengan jalan dari marker tersebut Tampilan peta tanpa marker
OK
Tampilan tabel kabupaten, jarak dengan pusat kota, jarak dengan jalan, dan jarak dengan sungai
OK
OK
20
RIWAYAT HIDUP Penulis dilahirkan Tanjung Jati pada tanggal 18 Oktober 1992 dari pasangan Bapak Zairul Zaidar dan Ibu Indrawati. Penulis merupakan anak kedua dari tiga bersaudara. Pada tahun 2010, penulis lulus dari SMA Negeri 1 Kecamatan Guguak, Kabupaten Lima Puluh Kota, Sumatera Barat dan penulis diterima sebagai mahasiswa di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun yang sama, penulis mendapatkan beasiswa Bidik Misi. Selama menjalani perkuliahan, penulis pernah menjadi asisten praktikum mata kuliah Penerapan Komputer semester genap tahun akademik 2012/2013 dan semester gasal tahun akademik 2013/2014. Penulis pernah melaksanakan praktik kerja lapangan (PKL) di Direktorat Jenderal Perdagangan Dalam Negeri, Kementerian Perdagangan pada tahun 2013. Selain itu, penulis juga pernah menjadi finalis pada Gemastik 6 kategori Data Mining pada tahun 2013.