daerah dalam lingkup R dan f(R) adalah fungsi yang dijalankan pada lingkup R. Mekanisme algoritme Naive adalah sebagai berikut : 1 Menentukan dataset D yang merupakan himpunan seluruh poligon / daerah yang ada pada spatial data.
2 Non spatial data Non spatial data yang digunakan adalah data hasil penghitungan suara PILWALKOT tahun 2008 yang bersumber dari KPUD Kota Bogor tahun 2008.
2 Menentukan R dengan menggunakan metode MBR (Minimum Bounding Rectangle) dan mengubahnya ke dalam bentuk matriks ketetanggaan.
P1
P2
P3
P4
Gambar 1 Daerah R yang dibatasi oleh MBR (Frank et al 2007) 3 Mengambil nilai V(R) dari tiap poligon yang berbatasan (masuk ke dalam MBR) dengan poligon yang diamati pada ruang R. 4 Menjalankan fungsi f(R) pada nilai V(R) dalam ruang R. Fungsinya yaitu nilai sebaran normal Z-Value. 5 Memunculkan daftar daerah – daerah yang terindikasi outlier. 6 Memvisualisasikan daerah yang ada pada outlier list.
METODE PENELITIAN
Penelitian ini dilaksanakan secara bertahap sesuai dengan tahapan yang telah disusun pada Gambar 2. Pengumpulan Data Data yang digunakan dalam penelitian ini ada dua jenis yaitu spatial data dan non spatial data, yaitu : 1 Spatial data Spatial data yang digunakan adalah Peta Kelurahan Kota Bogor yang bersumber dari Bakosurtanal tahun 2003.
Gambar 2 Tahapan penelitian Praproses Data Praproses yang dilakukan untuk data PEMILU dan peta. Proses ini sangat berguna untuk memilih data dan peta yang dalam 2
keadaan baik atau jika ada yang rusak diperbaiki. Ada beberapa tahapan dalam fase praproses ini, di antaranya : 1 Pembersihan data Untuk menyesuaikan data pada peta maka data non spatial pada data hasil penghitungan suara PILWALKOT harus ditambahkan beberapa atribut non spatial di antaranya id dan persentase. Lalu proses pembersihan dilakukan dengan cara mencocokkan data yang ada di peta dengan data hasil penghitungan suara PILWALKOT. 2 Transformasi data Pada tahap ini terjadi transformasi data yaitu: a Menransformasi data jumlah hasil pemilihan menjadi persentase hasil pemilihan. b Memisahkan data untuk setiap Kandidat Walikota. Penggabungan spatial data dan non spatial data Proses penggabungan ini dilakukan pada software Arcview dengan cara : 1 Mengubah file (data hasil penghitungan suara PILWALKOT) ke dalam format excel (.xls) dengan atribut id, kelurahan dan persentase.
Membentuk Neighbour List Pada tahap ini shapefile kemudian dijalankan sebuah fungsi untuk menentukan MBR dan hasilnya membentuk matriks tetangga. (MBR) yang bernilai “1” jika masuk ke dalam MBR (bertetangga) dan bernilai “0” jika tidak masuk ke dalam MBR (tidak bertetangga). Kemudian nilai yang bernilai “1” direkap dan dikumpulkan ke dalam neighbour list (MBR) dilihat pada Lampiran 1. Melalui neighbour list ini kita dapat menentukan poligon yang berbatasan. Membentuk Outlier List Dari data yang sudah dibentuk yaitu neighbour list dan matriks shapefile, kemudian dijalankan fungsi yang ada dalam algoritme Naive sehingga membentuk outlier list dari tiap kandidat. Visualisasi Tahap ini adalah tahap terakhir dalam pemrosesan di MATLAB yang divisualisasikan ke dalam peta Kelurahan Kota Bogor dan menampilkan kelurahan yang outlier berdasarkan data pada outlier list. Hasil visualisasi pada tiap kelurahan yang terdeteksi sebagai outlier diberi warna yang berbeda dengan sekitarnya (warna merah) seperti pada Gambar 3.
2 Menggabungkan antara spatial data (data peta Kelurahan Bogor 2003) dan non spatial data (data hasil penghitungan suara PILWALKOT Bogor 2008) dengan menyamakan id-nya menggunakan tool join. 3 Menyimpan hasil penggabungan pada langkah 2 dalam bentuk shapefile (.shp) yaitu format penyimpanan spatial data pada Arcview yang compatible dengan MATLAB. Data untuk tiap Kandidat disimpan dalam shapefile terpisah. Load ke MATLAB Membentuk sebuah matriks setelah data berbentuk shapefile dengan MATLAB. Eksekusi oleh algoritme detection (algoritme Naive)
spatial
outlier
Setelah data berbentuk shapefile tersebut dibaca dan menjadi matriks, lalu mulai dijalankan menggunakan fungsi yang dibangun dari algoritme Naive ini.
Gambar 3 Daerah yang terdeteksi sebagai outlier Algoritme Naive Penelitian ini menggunakan algoritme Naive dengan inputan yang dibutuhkan antara lain D adalah himpunan semesta dari suatu spatial data, R adalah himpunan bagian dari daerah yang diamati, V(R) adalah nilai yang ada pada tiap daerah dalam lingkup R dan f(R) adalah fungsi yang dijalankan pada lingkup R. Alur algoritmenya adalah sebagai berikut :
3
1 D adalah himpunan daerah Bogor yang terdiri dari 68 desa/kelurahan di Kota Bogor. 2 Mengonversi himpunan daerah tersebut ke dalam matriks di MATLAB. 3 Menentukan daerah R menggunakan MBR (Minimum Bounding Rectangle) yang digunakan untuk melihat daerah mana saja yang berbatasan dengan daerah yang sedang diamati dalam poligon Desa/Kelurahan Kota Bogor. Kemudian mengambil nilai pada ruang R dari tiap kelurahan V(R) dan membentuk neighbour list (MBR). 4 Menentukan fungsi f(R) pada ruang R tersebut dari nilai V(R) yang didapat. Fungsi yang digunakan adalah nilai sebaran normal Z-Value (Abs[(nilai persentase tiap kelurahan – rataan)/simpangan baku]). 5 Lalu ditampilkan outlier list yang merupakan daftar kelurahan yang outlier dari tiap kandidat. 6 Kemudian divisualisasikan ke dalam bentuk peta Kelurahan Kota Bogor. Lingkungan Pengembangan Sistem outlier detection ini menggunakan perangkat keras dan perangkat lunak dengan spesifikasi sebagai berikut : 1 Perangkat keras a Intel® Core 2 Duo Processor @2.4 GHz b Memori DDR2 2 GB c Harddisk 180 GB d Monitor e Keyboard dan mouse 2 Perangkat lunak a Windows XP SP2 dan Mac OS X Leopard Versi 10.5.2 Operating System b MATLAB 7.4.0.287 R 2007a c Microsoft Office 2007 d Arcview 3.3
HASIL DAN PEMBAHASAN
metode pembahasan yaitu mengamati outlier melalui grafik batang menggunakan pendekatan statistika Z-Value, mengamati outlier melalui metode klasifikasi Equal Interval dan Natural Breaks dan mengamati outlier melalui algoritme Naive. Analisis ke dalam ketiga metode ini dimaksudkan untuk memberikan perbandingan antar metode sehingga terlihat kemiripan dan perbedaan hasil di antara ketiga metode tersebut. • Metode 1 Mengamati outlier berdasarkan grafik batang menggunakan pendekatan statistika Z- Value. Analisis ini dilakukan dengan cara mengamati grafik batang dari data hasil penghitungan suara tiap Kandidat Walikota Bogor melalui pendekatan statistika yaitu persamaan Z-Value, sebagai berikut :
Z=
X−X s
dengan X = nilai persentase, X = nilai rataan persentase dan s=simpangan baku. Persamaan diatas semakin besar nilai persentase (X) semakin besar juga nilai Z artinya memiliki perbandingan yang lurus. Dalam hal ini ditetapkan θ (threshold) bernilai dua (Z > 2) artinya terdapat sebanyak kurang lebih 4% – 5% jumlah outlier dari data. Penentuan nilai θ ini didasarkan pada nilai yang didapatkan dari ZValue kemudian direpresentasikan ke dalam bentuk histogram sehingga terlihat jarak antar bin yang satu dengan bin yang lainnya. Seluruh histogram dilihat pada Lampiran 2. Dari seluruh histogram, didapatkan jarak rata – rata antar bin lebih dari 2. Proporsi pembagian data dari tiap kandidat dilihat pada Tabel 1. Contohnya pada histogram Kandidat satu di Gambar 4, jika nilai θ = 2 memiliki makna bahwa pada selang 0,029 – 1,768 terdapat bagian data sebanyak 95,59% dan terdapat 4,41% (100 % - 95,59%) jumlah outlier yang terdapat pada data Kandidat satu. Jika nilai θ = 3, maka 100% bagian data terdapat pada selang 0,029 – 2,975. Pada metode pertama ini nilai sebaran normal Z-Value ini dihitung dari nilai persentase 68 kelurahan pada tiap kandidat.
Penelitian ini membahas masalah spatial outlier detection pada hasil penghitungan suara pemilihan Walikota Bogor yang terdiri dari lima Kandidat Walikota Bogor sehingga didapatkan hasil. Analisis hasil ini dibahas ke dalam tiga
4
Tabel 1 Proporsi data tiap kandidat No
Kandidat
θ=2
θ=3
1
Kandidat 1
95,59 %
100 %
2
Kandidat 2
95,59 %
98 %
3
Kandidat 3
94,12 %
100 %
4
Kandidat 4
95,59 %
99 %
5
Kandidat 5
94,12 %
99 %
2 Kandidat dua (Ki Gendeng Pamungkas – H. Chusaery) Data hasil penghitungan suara untuk kandidat dua ini dilihat pada grafik batang pada Gambar 6.
Gambar 6 Grafik batang hasil penghitungan suara Kandidat Walikota Bogor kedua Pada kandidat dua ini daftar daerah yang outlier dilihat pada Tabel 3. Gambar 4 Threshold kandidat satu 1 Kandidat satu (H. Syafei Bratasendjaja – H. Akik Darul Tahkik) Data hasil penghitungan suara untuk kandidat satu ini dilihat pada grafik batang pada Gambar 5.
Tabel 3 Outlier list kandidat dua berdasarkan ZValue Id
Kelurahan
Nilai Z
18
Tegallega
5,320
27
Cibuluh
2,166
65
Harjasari
3,074
3 Kandidat tiga (Hj. Iis Supriatini – dr. Ahani) Data hasil penghitungan suara untuk kandidat tiga ini dilihat pada grafik batang pada Gambar 7.
Gambar 5 Grafik batang hasil penghitungan suara Kandidat Walikota Bogor kesatu Pada kandidat satu ini daftar daerah yang outlier dilihat pada Tabel 2. Tabel 2 Outlier list kandidat satu berdasarkan ZValue Id
Kelurahan
Nilai Z
1
Kayu Manis
2,469
14
Sempur
2,027
68
Rancamaya
2,975
Gambar 7 Grafik batang hasil penghitungan suara Kandidat Walikota Bogor ketiga Pada kandidat tiga ini daftar daerah yang outlier dilihat pada Tabel 4.
5
Tabel 4 Outlier list kandidat tiga berdasarkan ZValue Id
Kelurahan
Nilai Z
6
Sukaresmi
2,749
13
Pabaton
2,517
60
Mulyaharja
698
63
Genteng
2,244
4 Kandidat empat (Dody Rosadi – Erik Suganda) Data hasil penghitungan suara untuk kandidat empat ini dilihat pada grafik batang pada Gambar 8.
Gambar 8 Grafik batang hasil penghitungan suara Kandidat Walikota Bogor keempat Pada kandidat empat ini daftar daerah yang outlier dilihat pada Tabel 5.
Gambar 9 Grafik batang hasil penghitungan suara Kandidat Walikota Bogor kelima Pada kandidat lima ini daftar daerah yang outlier dilihat pada Tabel 6. Tabel 6 Outlier list kandidat lima berdasarkan Z-Value Id
Kelurahan
Nilai Z
6
Sukaresmi
3,213
25
Ciluar
2,072
40
Situ Gede
2,279
68
Rancamaya
2,232
Pada metode pertama ini terdapat kelurahan yang outlier lebih dari dua kandidat, contohnya seperti Kelurahan Sukaresmi (id 6). Kelurahan yang memiliki kondisi seperti itu dikarenakan nilai Z yang dihasilkan melebihi batas threshold pada kandidat lainnya (lebih dari satu kandidat).
Tabel 5 Outlier list kandidat empat berdasarkan Z-Value Id
Kelurahan
Nilai Z
2
Kencana
2,212
4
Sukadamai
2,748
6
Sukaresmi
4,910
5 Kandidat lima (H. Diani Budiarto – H. Ahmad Ru’yat) Data hasil penghitungan suara untuk kandidat lima ini dilihat pada grafik batang pada Gambar 9.
• Metode 2 Mengamati outlier melalui metode klasifikasi Equal Interval dan Natural Breaks Pada bagian ini, diberikan histogram pembagian kelas berdasarkan nilai persentasenya dan visualisasi kelurahan di Kota Bogor ke dalam peta yang dibagi ke dalam tiga kelas yaitu kelas rendah (merah), kelas sedang (kuning) dan kelas tinggi (hijau). Pengamatan satu per satu secara visualisasi langsung dari outlier dilihat berdasarkan metode klasifikasinya yaitu Equal Interval dan Natural Breaks (bagian yang dilingkari). Tabel id kelurahan secara lengkap dilihat pada Lampiran 3. • Equal Interval Metode yang menggunakan kelas interval konstan dalam penentuan klasifikasinya (Chang 2002).
6