HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU ILHAM ALPHA DINOV

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU

ILHAM ALPHA DINOV

DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014

PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Hierarchical Clustering Pada Data Time Series Hotspot Provinsi Riau adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Maret 2014

Ilham Alpha Dinov NIM G64114008

ABSTRAK ILHAM ALPHA DINOV. Hierarchical Clustering Pada Data Time Series Hotspot Provinsi Riau. Dibimbing oleh IMAS SUKAESIH SITANGGANG. Kebakaran hutan menjadi permasalahan tahunan di Indonesia khususnya di provinsi Riau. Penelitian ini menerapkan metode hierarchical clustering untuk data time series hotspot menggunakan rumus jarak rataan untuk menganalisis distribusi hotspot di provinsi Riau. Penelitian ini fokus pada persebaran hotspot di bulan Juni, Juli dan Agustus periode tahun 2001 hingga tahun 2012. Dekomposisi data time series diolah untuk mendapatkan pola kemunculan hotspot selama periode tersebut. Hierarchical clustering menghasilkan 4 buah cluster pada ketinggian sekitar 300 dendrogram. Sebagian besar hotspot pada cluster-cluster tersebut berada di daerah perkebunan. Kata kunci: Data Time Series, kebakaran hutan, hotspot, hierarchical clustering.

ABSTRACT ILHAM ALPHA DINOV. Hierarchical Clustering on Hotspot Time Series Data in Riau Province. Supervised by IMAS SUKAESIH SITANGGANG. Land and forest fires become yearly issues in Indonesia, particularly in Riau province. This work applied the hierarchical clustering method for hotspot time series data using average distance formula to analyze hotspots distribution in Riau province. This work focuses on the hotspots distribution in June, July and August for the period 2001-2012. Time series data decomposition was generated to obtain the hotspot occurrence patterns over the period. Hierarchical clustering on the data results 4 clusters at the height of dendrogram about 300. Most of hotspots in these clusters are located in plantation. Keywords: data time series, forest fires, hotspot, hierarchical clustering

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU

ILHAM ALPHA DINOV

Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA ILMU PENGETAHUAN ALAMM INSTITUT PERTANIAN BOGOR BOGOR 2014

Judul Skripsi : Hierarchical Clustering Pada Data Time Series Hotspot Provinsi Riau Nama : Ilham Alpha Dinov NIM : G64114008

Disetujui oleh

Dr Imas Sukaesih Sitanggang, SSi MKom Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom Ketua Departemen

Tanggal Lulus:

PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Juli 2013 ini ialah Data Mining, dengan judul Hierarchical Clustering Pada Data Time Series Hotspot Provinsi Riau. Penulis menyadari bahwa dalam proses penulisan skripsi ini banyak mengalami kendala, namun berkat bantuan, bimbingan, kerjasama dari berbagai pihak dan berkah dari Allah subhanahu wa ta'ala sehingga kendala-kendala yang dihadapi tersebut dapat diatasi. Untuk itu penulis menyampaikan ucapan terima kasih dan penghargaan kepada Ibu Dr Imas Sukaesih Sitanggang SSi, MKom selaku pembimbing yang telah dengan sabar, tekun, tulus dan ikhlas meluangkan waktu, tenaga dan pikiran memberikan bimbingan, motivasi, arahan, dan saransaran yang sangat berharga kepada penulis selama menyusun skripsi. Ucapan terimakasih juga saya saya tujukan kepada Bapak Toto Haryanto SKom MSi dan Bapak Asyhar Agmalaro SSi MKom selaku penguji atas segala masukan dan saran yang telah diberikan. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, serta seluruh keluarga atas segala doa dan kasih sayangnya. Semoga karya ilmiah ini bermanfaat.

Bogor, Februari 2014

Ilham Alpha Dinov

DAFTAR ISI DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

PENDAHULUAN

1

Latar Belakang

1

Tujuan Penelitian

2

Manfaat Penelitian

2

Ruang Lingkup Penelitian

2

METODE

2

Data Penelitian

2

Lingkungan Pengembangan

3

Prosedur Analisis Data

3

Praproses Data

3

HASIL DAN PEMBAHASAN

4

Pengumpulan Data

4

Praproses Data Time Series Hotspot

6

Analisis Data

7

Clustering Data Time Series

7

SIMPULAN DAN SARAN

12

Simpulan

12

Saran

12

DAFTAR PUSTAKA

13

RIWAYAT HIDUP

14

DAFTAR TABEL 1 2 3 4

Kelas penutupan lahan provinsi Riau Rataan dan Persentase tiap kelas penutupan lahan selama satu tahun kurun waktu 2001 hingga tahun 2012. List anggota pembagian cluster berdasarkan pembagian ketinggian dendrogram Jumlah hotspot tiap cluster dengan pemotongan dendrogram pada ketinggian 300 per tipe penutupan lahan

3 8 10 11

DAFTAR GAMBAR 1 2 3 4 5 6 7 8

Diagram tahapan penelitian Diagram alur praproses data Jumlah hotspot provinsi Riau dari tahun 2001 hingga tahun 2012 Frekuensi hotspot berdasarkan tipe penutupan lahan di wilayah Riau tahun 2001 hingga tahun 2012 Dekomposisi data time series hotspot Riau tahun 2001 hingga tahun 2012 Dendrogram data hotspot selama setahun dari tahun 2001 hingga tahun 2012 Grafik jumlah hotspot tiap bulan selama 12 tahun (2001-2012) Dendrogram hotspot bulan Juni, Juli dan Agustus dari tahun 2001 hingga tahun 2012

2 4 5 5 7 8 9 9

PENDAHULUAN Latar Belakang Kebakaran hutan dan lahan menjadi permasalahan yang kian mencolok di Indonesia. Peluang terjadinya kebakaran hutan di Indonesia meningkat dari tahun ke tahun. Hal tersebut menandakan perubahan hotspot yang terjadi di suatu wilayah bersifat dinamis seiring waktu yang berjalan. Kebakaran hutan ini merupakan salah satu masalah yang berulang sehingga menghasilkan informasi waktu dan lokasi persebaran hotspot. Informasi tersebut dapat diolah untuk menghasilkan kebijakan dalam penanganan kebakaran hutan di Indonesia. Salah satu upaya pencegahan kebakaran hutan tersebut yakni dengan mengetahui persebaran pengelompokan hotspot yang berpotensi tinggi terhadap terjadinya kebakaran hutan. Konsep data mining sesuai untuk diterapkan pada data hotspot tersebut. Clustering digunakan untuk untuk mengelompokkan data berdasarkan pada kedekatan dari suatu karakteristik sampel. Secara umum, clustering merupakan proses pengelompokan sekumpulan objek ke dalam kelas yang objeknya mirip (Han dan Kamber 2006). Ukuran kemiripan dan ketidakmiripan dinilai berdasarkan nilai atribut yang mendeskripsikan objek. Tujuan dari clustering adalah untuk mengidentifikasi struktur data yang belum berlabel yang ditentukan secara objektif oleh data yang terorganisir ke dalam grup yang homogen dengan meminimalisir kesamaan antar grup dan memaksimalkan ketidakmiripan antar grup (Liao 2005). Data hotspot merupakan salah satu indikator kemungkinan terjadinya kebakaran hutan pada wilayah tertentu. Pemantauan hotspot dilakukan dengan penginderaan jauh (remote sensing) menggunakan satelit. Data hotspot merupakan data time series karena diamati secara periodik setiap harinya oleh satelit seperti NOAA dan MODIS. Time series adalah serangkaian waktu koleksi pengamatan yang dilakukan secara kronologis (Tak-Chung 2011). Contoh data time series yang sering ditemui adalah data suhu harian (daily temperature), total penjualan mingguan (weekly sales totals) dan harga reksa dana (prices of mutual funds). Penelitian ini dilakukan untuk melihat pola persebaran hotspot di Riau dalam kurun waktu dari tahun 2001 sampai tahun 2012. Time series clustering dipilih sebagai metode yang digunakan karena merupakan salah satu metode yang sesuai untuk melihat pola pengelompokan per satuan waktu. Terdapat dua kategori utama dalam time series clustering yaitu ―whole clustering‖ dan ―subsequence clustering‖. ―Whole clustering‖ adalah clustering yang dilakukan pada banyak objek time series untuk serangkaian kelompok yang sama. ―Subsequence clustering‖ berdasarkan pada ekstraksi sliding window atau window yang berjalan dari time series tunggal yang bertujuan untuk menemukan kesamaan dan perbedaan time windows atau antar objek waktu (Keogh et al 2003). Contoh dari “whole clustering” adalah penggunaan dua buah objek waktu seperti bulan dan tanggal. “Subsequence clustering” hanya menggunakan satu objek waktu saja, misal objek tanggal seperti yang digunakan dalam penelitian ini. Penelitian ini termasuk pada subsequence clustering karena hanya menggunakan satu objek time series yaitu tanggal.

2 Tujuan Penelitian 1 Analisis data time series hotspot, dengan melihat pola kecenderungan kemunculan hotspot selama 12 tahun dari tahun 2001 hingga tahun 2012. 2 Menentukan pengelompokan hotspot menggunakan metode hierarchical clustering. Manfaat Penelitian Penelitian ini diharapkan membantu pihak–pihak yang membutuhkan informasi terkait pengelompokan hotspot provinsi Riau periode 2001 – 2012. Ruang Lingkup Penelitian 1 Analisis dan pengelompokkan data time series hotspot dilakukan menggunakan modul-modul terkait dalam perangkat lunak komputasi statistika R (www.rproject.org). 2 Formula jarak yang digunakan dalam hierarchical clustering adalah average / rataan

METODE Pemodelan dan analisis clustering data hotspot dilakukan dengan menggunakan perangkat lunak R. Penelitian ini dilakukan dalam beberapa tahap seperti yang ditunjukkan pada Gambar 1.

Gambar 1 Diagram tahapan penelitian Data Penelitian Data yang digunakan dalam penelitian ini adalah data hotspot provinsi Riau tahun 2001 hingga tahun 2012 yang diunduh dari situs NASA dan tipe data

3 penutupan lahan provinsi Riau pada tahun 2008 sebagai kelas target. Luas daerah tiap tipe penutupan lahan dapat dilihat pada Tabel 1. Tabel 1 Kelas penutupan lahan provinsi Riau Tipe Penutupan Lahan Plantation Dryland Forest Agricultural Field Shrubs Natural Forest Bare Land Swamp & Mangrove

Luas Area (km2) 28,417.13 17,497.66 20,294.21 8,176.02 8,110.41 3,029.42 3,746.12

Lingkungan Pengembangan Perangkat keras dan perangkat lunak yang digunakan untuk penelitian ini adalah sebagai berikut Perangkat keras berupa komputer personal dengan spesifikasi sebagai berikut: o Processor Intel® CoreTM i5 o Memory 4 GB o Hardisk 320 GB Perangkat lunak: o Sistem operasi Microsoft Windows 8 o Tool untuk komputasi statistika R 3.0.1 64 Bit o Tool R Studio untuk memudahkan modifikasi sintaks R o DBMS PostgreSQL 9.1 o Quantum GIS 1.8.0 untuk analisis, visualisasi data spasial dan pemisah data hotspot per tipe kelas penutupan lahan. o PostGIS 2.0 sebagai ekstensi spasial dalam PostgreSQL 9.1 untuk menghubungkan dengan Quantum GIS 1.8.0. o Microsoft Excel untuk memanipulasi data time series hasil kueri DBMS menjadi masukan R Prosedur Analisis Data Praproses Data Praproses dilakukan untuk mempersiapkan dataset time series untuk keperluan analisis awal dan clustering. Tahapan praproses data dapat dilihat pada Gambar 2. Pada langkah awal, data dimasukkan ke dalam aplikasi Quantum GIS 1.8.0 untuk dilakukan proses clipping. Proses ini memisahkan tiap tipe penutupan lahan dan untuk mendapatkan data hotspot yang berada di wilayah provinsi Riau dari tahun 2001 hingga tahun 2012. Selanjutnya hasil proses clipping di-export menjadi shape file agar file tersebut dapat diolah di dalam DBMS PostgreSQL. Kemudian data yang diperoleh di-import ke dalam DBMS PostgreSQL 9.1 yang telah terintegrasi dengan PostGIS 2.0. Selanjutnya dilakukan kueri–kueri hingga didapatkan data yang dibutuhkan untuk clustering. Sebelum data digunakan

4 menjadi data masukan R, struktur data diubah menjadi struktur data yang sesuai dengan struktur data masukan R dengan bantuan Microsoft Excel 2010. Selanjutnya data dapat diolah menggunakan R dengan bantuan tool R Studio.

Gambar 2 Diagram alur praproses data

HASIL DAN PEMBAHASAN Pengumpulan Data Pada penelitian ini, data yang digunakan adalah: 1 Data persebaran hotspot Data persebaran hotspot yang digunakan adalah data hotspot dari tahun 2001 hingga tahun 2012 yang diunduh dari situs resmi NASA. Data ini memiliki atribut latitude, longitude dan acq_date. Atribut latitude dan longitude menggambarkan letak hotspot dalam peta geografis provinsi Riau sedangkan atribut acq_date adalah keterangan tanggal suatu hotspot muncul pada titik tertentu. Gambar 3 menyajikan jumlah hotspot di wilayah provinsi Riau dari tahun 2001 hingga tahun 2012.

5 14000 11746

Jumlah Hotspot

12000

11079

10937

10000 7726

8000

6891

6840

5911

6000

5628 4229

4128

4067

4000 2000

1645

0 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 Tahun

Gambar 3 Jumlah hotspot provinsi Riau dari tahun 2001 hingga tahun 2012

Jum;ah Hotspot

Dari Gambar 3 terlihat bahwa tahun 2005, 2006 dan 2009 merupakan tahun–tahun yang memiliki catatan jumlah hotspot tinggi. 2 Data penutupan lahan Data penutupan lahan di wilayah Riau terbagi atas tujuh tipe yaitu lahan perkebunan (plantation), hutan kering (dryland forest), lahan pertanian (agricultural field), semak (shrubs), hutan alami (natural forest), lahan kosong (bare land), serta rawa dan bakau (swamp & mangrove). Gambar 4 menunjukkan grafik kemunculan hotspot per kelas penutupan lahan dari tahun 2001 hingga tahun 2012. 40000 35000 30000 25000 20000 15000 10000 5000 0

35744

12995

10817

7978

6001

5887 1405

Tipe penutupan lahan

Gambar 4 Frekuensi hotspot berdasarkan tipe penutupan lahan di wilayah Riau tahun 2001 hingga tahun 2012

6 Praproses Data Time Series Hotspot 1 Import shape file ke dalam Quantum GIS Data awal hotspot yang didapatkan berupa shape file yang berisi data hotspot yang berada di dalam dan di luar wilayah provinsi Riau. Untuk memudahkan memanipulasi data awal tersebut maka dilakukan importing file ke dalam aplikasi Quantum GIS. 2 Kueri dan clipping data hotspot dengan data penutupan lahan Proses kueri dan clipping ini dilakukan guna mendapatkan hotspot yang berada di dalam wilayah provinsi Riau tiap tahun dari tahun 2001 hingga tahun 2012. Kueri dilakukan untuk pengelompokan data hotspot berdasarkan tahun. Setelah data hotspot sudah terbagi berdasarkan tahun, selanjutnya dilakukan proses clipping data. Clipping data dilakukan untuk memisahkan data hotspot tiap tipe penutupan lahan. Langkah terakhir proses clipping adalah mengelompokkan data berdasarkan tujuh kelas landcover di wilayah provinsi Riau yaitu lahan perkebunan (plantation), hutan kering (dryland forest), lahan pertanian (agricultural field), semak (shrubs), hutan alami (natural forest), lahan kosong (bare land), serta rawa dan bakau (swamp & mangrove). 3 Export layer hasil clipping menjadi shape file Hasil kueri dan clipping di-export menjadi shape file. Sehingga dapat diolah selanjutnya menggunakan DBMS PostgreSQL. 4 Import shape file ke dalam PostgreSQL Agar PostgreSQL dapat membaca shape file yang berisi data spasial, terlebih dahulu dipasang tool pendukung PostGIS. Satu buah shape file menghasilkan satu buah tabel dalam PostgreSQL. Pada tahap ini akan dihasilkan tabel–tabel hotspot provinsi Riau dari tahun 2001 hingga 2012 dan tabel penutupan lahan provinsi Riau. 5 Kueri untuk mendapatkan frekuensi hotspot per hari Data yang dibutuhkan untuk kelas target dalam metode clustering adalah kelas pada data penutupan lahan Provinsi Riau. Untuk itu perlu penyaringan data hotspot yang terdapat pada masing–masing kelas penutupan lahan tiap tahun dalam periode 12 (dua belas) tahun. 6 Modifikasi struktur data menggunakan Microsoft Excel Hotspot di setiap tipe penutupan lahan tidak muncul setiap hari, sehingga data hasil kueri pada proses sebelumnya tidak bisa langsung dijadikan data masukan dalam sintak R. Untuk membuat struktur data time series hotspot perlu dihitung jumlah hotspot per hari selama setahun. Dengan menggunakan Microsoft Excel struktur data dapat dimodifikasi sesuai dengan format yang dibutuhkan aplikasi R.

7 Analisis Data Gambar 5 menyajikan dekomposisi data time series hotspot di wilayah Riau pada kurun waktu 2001 hingga 2012. Label observed merupakan gambaran banyaknya hotspot per hari selama setahun pada data time series tahun 2001 hingga tahun 2012. Proses dekomposisi menghasilkan trend yang tidak linear maupun kuadratik, terlihat pada Gambar 5 baris kedua label Trend. Apabila dilihat trend masing-masing tahun, jumlah hotspot akan terlihat signifikan naik dan signifikan turun disekitar pergantian tahun. Hal ini dapat dilihat pada awal pergantian tahun 2002, 2003, 2006, 2008, 2009, dan 2011 yang naik secara signifikan. Sedangkan pada awal pergantian tahun 2004, 2005, 2007 dan 2010 yang turun secara signifikan. Season atau musiman dari data time series didefinisikan sebagai pola yang berulang selama interval waktu yang tetap.

Gambar 5 Dekomposisi data time series hotspot Riau tahun 2001 hingga tahun 2012 Clustering Data Time Series Pada algoritme clustering, data akan dikelompokkan menjadi cluster-cluster berdasarkan kemiripan satu data dengan yang lain. Prinsip dari clustering adalah memaksimalkan kesamaan antar anggota satu cluster dan meminimumkan kesamaan antaranggota cluster yang berbeda. Dengan menggunakan algoritme Hierarchical Clustering kita bisa membagi cluster berdasarkan ketinggian ketidakmiripan atau dissimilarity antar cluster

8 dendrogram. Hasil keseluruhan dari algoritme hierarchical clustering secara grafik dapat digambarkan sebagai tree, yang disebut dengan dendrogram. Tree ini secara grafik menggambarkan proses penggabungan dari cluster–cluster yang ada, sehingga menghasilkan cluster dengan level yang lebih tinggi (Steinbach et al 2000). Tampilan dendrogram hasil hierarchical clustering data hotspot dalam setahun kurun waktu 2001 hingga tahun 2012 dapat dilihat pada Gambar 6

Gambar 6 Dendrogram data hotspot selama setahun dari tahun 2001 hingga tahun 2012 Sebanyak 80,852 hotspot yang diamati dalam 365 hari yang berada dalam rentang waktu tahun 2001 hingga tahun 2012. Data tersebut dibagi per kelas penutupan lahan tiap tahunnya. Tabel 2 menyajikan rataan dan persentase jumlah hotspot tiap kelas penutupan lahan dalam 12 (dua belas) bulan setiap tahun selama kurun waktu dari tahun 2001 hingga tahun 2012. Tabel 2 Rataan dan Persentase tiap kelas penutupan lahan selama satu tahun kurun waktu 2001 hingga tahun 2012. No 1 2 3 4 5 6 7

Kelas Plantation Dryland_forest Agricultural_field Shrubs Natural_forest Bare_land Swamp_Mangrove

Rataan Hotspot Persentase (%) 8.16 44.22 1.82 9.87 2.77 16.22 1.47 7.28 1.35 7.28 2.47 13.38 0.32 1.74

Gambar 7 menyajikan grafik jumlah hotspot tiap bulan selama kurun waktu 12 (dua belas) tahun dari tahun 2001 hingga 2012. Dapat dilihat bahwa bulan Agustus memiliki frekuensi hotspot paling banyak dibandingkan dengan frekuensi hotspot di bulan yang lainnya yaitu sebanyak 14.450 hotspot.

Jumlah Hotspot

9 16000 14000 12000 10000 8000 6000 4000 2000 0

14450 1216112873

12593 7882 5577

4773

4229 3516

1487

772 514

Bulan

Gambar 7 Grafik jumlah hotspot tiap bulan selama 12 tahun (2001-2012) Data bulan Agustus dan dua bulan sebelumnya menjadi titik fokus pengamatan karena bulan-bulan tersebut merupakan urutan bulan yang memiliki jumlah frekuensi hotspot paling banyak dibandingkan dengan total frekuensi pada urutan bulan–bulan lainnya. Sebanyak 39,484 hotspot ditemukan pada bulanbulan tersebut. Gambar 8 menyajikan tampilan plot pada bulan Juni, Juli dan Agustus selama kurun waktu 12 (dua belas) tahun dari tahun 2001 hingga tahun 2012.

Gambar 8 Dendrogram hotspot bulan Juni, Juli dan Agustus dari tahun 2001 hingga tahun 2012 Dari Gambar 8 dapat dilihat bahwa proses clustering menghasilkan dendrogram yang memiliki ketinggian yang menyatakan ketidaksamaan atau dissimilarity antar dua cluster. Pada Tabel 3 dapat terlihat pembagian cluster berdasarkan ketinggian dendrogram dan susunan objek anggota tiap-tiap cluster tersebut.

10 Tabel 3 Cluster berdasarkan ketinggian dendrogram Ketinggian Dendrogram 300

Banyak Cluster 4

200

4

Anggota Cluster 1 Cluster 2 Cluster 3 Cluster 4

Cluster 1 Cluster 2 Cluster 3 Cluster 4

159, 161 197, 217 193, 213 175, 212, 221, 166, 225, 227, 184, 198, 185, 194, 214, 216, 168, 205, 218, 220, 206, 199, 229, 157, 160, 169, 171, 231, 233, 195, 232, 228, 176, 222, 170, 164, 177, 209, 183, 186, 202, 190, 187, 189, 165, 182, 191, 178, 180, 163, 188, 192, 200, 201, 196, 154, 158, 153, 155, 244, 235, 243, 241, 203, 239, 240, 242, 238, 208, 237, 181, 204, 230, 173, 210, 162, 207, 215, 156, 211, 234, 179, 236, 174, 167, 172, 224, 226 159, 161 212, 221, 166, 225, 227 198, 185, 194, 214, 216, 168, 205 218, 220, 206, 199, 229, 157, 160, 169, 171, 231, 233, 195, 232, 228, 176, 222, 170, 164, 177, 209, 183, 186, 202, 190, 187, 189, 165, 182, 191, 178, 180, 163, 188, 192, 200, 201, 196, 154, 158, 153, 155, 244, 235, 243, 241, 203, 239, 240, 242, 238, 208, 237, 181, 204, 230, 173, 210, 162, 207, 215, 156, 211, 234, 179, 236, 174, 167, 172, 224, 226

Pada Tabel 3 dapat dilihat pemotongan dendrogram pada titik ketinggian 300 menghasilkan sebanyak 4 cluster dan pemotongan dendrogram pada titik ketinggian 200 juga menghasilkan 4 cluster. Tabel 4 menyajikan persebaran jumlah hotspot per cluster pada pemotongan titik 300 dendrogram pada data bulan Juni, Juli dan Agustus periode tahun 2001 hingga 2012 tiap tipe penutupan lahan. Tipe penutupan lahan plantation (perkebunan) memiliki frekuensi tertinggi pada tiap cluster yang telah dihasilkan.

11

Tabel 4 Jumlah hotspot tiap cluster dengan pemotongan dendrogram pada ketinggian 300 per tipe penutupan lahan Tipe penutupan lahan Plantation Dryland forest Agricultural Field Shrubs Natural Forest Bareland Swamp mangrove

Cluster 1 279 80 95 61 34 42 11

Jumlah Hotspot Cluster 2 Cluster 3 604 557 146 160 254 212 157 82 130 179 134 55 33 17

Cluster 4 16,476 3,757 6,011 3,233 3,368 2,748 569

Tabel 5 menyajikan persebaran jumlah hotspot pada masing-masing cluster per tipe penutupan lahan pada pemotongan titik ketinggian 300 pada dendrogram data bulan Juni, Juli, dan Agustus periode tahun 2001 hingga 2012. Tipe penutupan lahan plantation (perkebunan) memiliki frekuensi tertinggi pada tiap cluster yang telah dihasilkan. Tabel 5 Jumlah hotspot tiap cluster dengan pemotongan dendrogram pada ketinggian 200 per tipe penutupan lahan Tipe penutupan lahan Plantation Dryland forest Agricultural Field Shrubs Natural Forest Bareland Swamp mangrove

Cluster 1 279 80 95 61 34 42 11

Jumlah Hotspot Cluster 2 Cluster 3 1,266 1,629 383 269 527 715 214 408 224 318 172 295 55 51

Cluster 4 14,742 3,411 5,235 2,850 3,135 2,470 513

12

SIMPULAN DAN SARAN Simpulan Berdasarkan penelitian yang telah dilakukan terhadap data time series hotspot, diambil kesimpulan sebagai berikut: 1 Dekomposisi data time series hotspot menghasilkan trend yang tidak linear maupun kuadratik. Jumlah hotspot signifikan naik dan signifikan turun di sekitar pergantian tahun. 2 Pada pemotongan titik ketinggian dendrogram 300 dari data bulan Juni, Juli dan Agustus hasilkan 4 buah Cluster dan 4 buah Cluster pada pemotongan di titik ketinggian dendrogram 200. 3 Pada pemotongan ketinggian dendrogram 300 dari data bulan Juni, Juli dan Agustus tipe penutupan lahan perkebunan (plantation) memiliki jumlah hotspot paling banyak di setiap cluster. 4 Pada pemotongan ketinggian dendrogram 200 untuk data bulan Juni, Juli dan Agustus tipe penutupan lahan perkebunan (plantation) memiliki jumlah hotspot paling banyak di setiap cluster. 5 Dalam kurun waktu 12 tahun persentase kemunculan hotspot terbanyak pada penutupan lahan perkebunan (plantation). Saran Beberapa hal yang perlu dikembangkan lebih lanjut dari penelitian ini antara lain: 1 Penggunaan metode clustering lain guna mendapatkan hasil cluster yang lebih baik. 2 Dilakukan validasi cluster untuk mendapatkan cluster terbaik dari data time series hotspot.

13

DAFTAR PUSTAKA Han J, Kamber M. 2006. Data Mining Concepts and Techniques Second Edition. San Fransisco (US): Morgan Kaufmann Publisher. Keogh E, Lin J, Truppel W. 2003. Clustering of time series subsequences is meaningless: Implications for past and future research. Di dalam: Proc. of the 3rd IEEE International Conference on Data Mining; 2003 Nov 19-22; Melbourne, FL, USA. hlm 115–122. Liao TW. 2005. Clustering of time series data—a survey. Pattern Recognition. 38(11): 1857-1874. Makridakis S, Wheelwright SC, Hyndman RJ. 1998. Forecasting Methods and Applications. New York (US): John Wiley & Sons, Inc. Steinbach M, Karypis G, Kumar V. 2000. A comparisont of document clustering techniques. Minnesota (US) [Internet]. [diunduh 2014 Jan 01]. Tersedia pada: http://glaros.dtc.umn.edu/gkhome/fetch/papers/doccluster.pdf Tak-Chung Fu. 2011. A review on time series data mining. Engineering Applications of Artificial Intelligence. 24 (1): 164–181.

14

RIWAYAT HIDUP Penulis dilahirkan di Nagari Taeh Baruah kecamatan Payakumbuh kabupaten Lima Puluh Kota provinsi Sumatera Barat pada tanggal 6 November 1990. Penulis adalah anak pertama dari tiga bersaudara, anak dari pasangan Putra Erial dan Ramona. Penulis menempuh awal pendidikan di TK (Taman Kanak-kanak) Pertiwi Desa Surya Indah kecamatan Pangkalan Kuras kabupaten Pelalawan propinsi Riau pada tahun 1995. Penulis melanjutkan pendidikan sekolah dasar pada tahun 1996 hingga 2002 di SDN 028 Kecamatan Pangkalan Kuras. Kemudian penulis melanjutkan pendidikan Sekolah Menengah Pertama di SMPN 3 Kecamatan Payakumbuh Kabupaten Lima Puluh Kota Sumatera barat dari tahun 2002 hingga tahun 2005. Penulis menempuh pendidikan tingkat Sekolah Menengah Atas di SMAN 1 Kecamatan Guguk Kabupaten Lima Puluh Kota Sumatera Barat pada tahun 2005 hingga tahun 2008. Kemudian penulis melanjutkan pendidikan perguruan tinggi di Program Diploma Institut Pertanian Bogor, Program Keahlian Manajemen Informatika pada tahun 2008 hingga 2011.

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU ILHAM ALPHA DINOV

Recommend Documents