1
Memilih atribut yang akan diklasifikasikan ke dalam k kelas, misal atribut yang dipilih adalah atribut x.
2
Sekumpulan k-1 nilai dibangkitkan secara acak dalam selang [min{x}, max{x}]. Selang ini digunakan sebagai batas kelas.
3
Nilai rataan dan sum squared deviation untuk setiap kelas dihitung, kemudian dihitung pula total sum squared deviation (TSSD).
4
Masing-masing nilai dalam setiap kelas secara sistematik ditempatkan pada kelas yang berdekatan dan batas kelas ditentukan kembali. Nilai TSSD dihitung kembali. Langkah 4 diulang sampai nilai TSSD di bawah threshold.
pengambilan keputusan cukup sulit sehingga diperlukan visualisasi dari hasil analisis. Setelah proses analisis, akan didapat titik yang merupakan spatial outlier. Titik yang menjadi spatial outlier akan diberi tanda dengan warna yang berbeda dari titik yang bukan merupakan spatial outlier.
HASIL DA PEMBAHASA Pengadaan Data Pada penelitian ini, data yang tersedia adalah sebagai berikut: 1
Kecamatan Bogor Tengah memiliki sebanyak 189 TPS. Pada PILKADA 2008, terdapat 5 kandidat pasangan walikota dan wakilnya.
Load ke Matlab Data hasil penggabungan selanjutnya diolah menggunakan Mapping Toolbox dalam MATLAB 7.0.1.
2
Praproses Hasil dari praproses data adalah sebagai berikut : 1
TPS k=1 k=2 k=3 k=4 k=5 k=6 2
18
3
21
22
17
2
3
1
18
9
4
21
3
2
1
4
18
17
21
4
17
5
3
19
6
1
5
6
4
17
7
19
20
Analisis Spatial Outlier Setelah k-NN list dibentuk, langkah selanjutnya adalah proses analisis. Pada proses analisis diperlukan parameter threshold. Proses analisis menggunakan algoritme Iterative Ratio dan Iterative Z-value. Visualisasi Visualisasi berguna untuk memudahkan dalam merepresentasikan hasil analisis. Visualisasi diimplementasikan dalam bentuk peta. Jika masih berbentuk data, proses
Pembersihan data Banyaknya TPS yang terdapat pada peta lokasi TPS berbeda dengan banyaknya TPS pada data hasil Pilkada. Jumlah TPS yang digunakan pada penelitian ini adalah jumlah TPS yang terdapat pada data hasil Pilkada, sehingga dilakukan penghapusan pada beberapa titik TPS di peta lokasi.
Tabel 1 K-NN list
1
Peta (data spasial) Peta yang tersedia yaitu peta Kota Bogor 1996.
Membentuk k-
list K-NN list dibentuk untuk memudahkan proses analisis spatial outlier dengan Algoritme Iterative Ratio dan Iterative Z-value. Dalam membentuk k-NN list, terlebih dahulu ditentukan nilai k. List ini berisi k-NN dari setiap titik yang dibentuk dalam bentuk tabel. Ilustrasi k-NN list diperlihatkan pada Tabel 1.
Data hasil Pilkada Bogor Tengah 2008 (data non spasial)
2
Transformasi data Untuk kebutuhan perhitungan averageneighbor, dilakukan pengubahan format data dan konstruksi atribut. Jumlah hasil Pilkada diubah ke dalam bentuk persentase di mana jumlah pemilih kandidat dibagi dengan total jumlah pemilih di kelurahan tersebut. Konstruksi atribut dilakukan dengan menambah atribut ID_TPS dan ID_OBJ. ID_TPS merupakan identitas TPS setiap kelurahan yang mengandung informasi tentang kelurahan TPS dan nomor TPS. ID_OBJ merupakan penomoran untuk seluruh TPS. Titik spasial akan direpresentasikan dengan angka mulai dari 1 sampai 189 (sesuai jumlah titik spasial). Penomoran berdasarkan urutan kelurahan
6
yang dimulai dari kelurahan Babakan hingga ingga Babakan Pasar dan dimulai dengan koordinat x dari kanan ke kiri. Representasi fungsi ini diperlihatkan oleh Tabel 2.
secara signifikan dengan seluruh nilai yang ada. Pada spatial outlier,, informasi yang diperlukan tidak hanya nilai saja, tetapi etapi diperlukan juga atribut spasialnya.
Tabel 2 Representasi titik spasial TPS TPS Koordinat x
Koordinat Kelurahan y
ID_OBJ
700010
9271060
B14
1
699968
9271130
B05
2
699913
9271076
B15
3
…
…
…
…
699589
9269404
BP12
188
699348
9269355
BP20
189
Penambahan kedua atribut ini dilakukan untuk memudahkan identifikasi spatial outlier.. Konstruksi juga dilakukan dengan memisahkan data untuk setiap kandidat. Terdapat lima kandidat yang masing masingmasing diberi simbol A, B, C, D, dan E seperti yang terlihat pada Tabel 3. Tabel 3 Kandidat Pasangan Walikota dan Wakilnya Simbol A B C D E
Gambar 9 Global dan spatial outlier. outlier Langkah awal sebelum menduga spatial outlier adalah membagi data menjadi 3 kelas (sedikit, sedang, banyak) dengan metode Equal Interval dan atural breaks.. Setiap kelas diberi warna yang berbeda kemudian divisualisasikan. Titik hijau,, kuning, dan merah masing-masing masing merepresentasikan persentase sedikit, sedikit sedang, dan banyak. Penjelasan proses pembagian data adalah sebagai berikut: 1
Hasil pembagian kelas untuk seluruh TPS disajikan pada Tabel 4. Hasil pembagian kelas dalam bentuk histogram untuk TPS D diperlihatkan pada Gambar 10, sedangkan untuk TPS yang lain dapat dilihat pada Lampiran 1. Dengan hasil visualisasi menggunakan Equal qual Interval, dapat diduga TPS mana yang menjadi spatial outlier dengan melihat warna yang berbeda dari warna di sekitarnya. Contoh ini diperlihatkan pada Gambar 11 yang mengambil daerah kelurahan Babakan. Untuk hasil visualisasi selengkapnya, dapat dilihat pada Lampiran piran 2. Dari Gambar 11 dapat dilihat bahwa titik merah diduga sebagai spatial outlier karena kelasnya berbeda dari daerah sekitarnya, di mana daerah sekitarnya dominan berwarna hijau (kelas sedikit).
Nama H. Syafei Bratasendjada Drs H. Akik Darul Tahkik Ki Gendeng Pamungkas KH. Drs Ahmad Chusairi,MM, MA. Dra. Iis Supriatini, M.Pd. dan dr.H. Ahani Sp.PD H. Dody Rosadi, M.Eng H. Erik Irawan Suganda, MA. Drs. H. Diani Budiarto, M.Si. Drh. Achmad Ru’yat, M.Si
Penggabungan Data Data spasial dan non-spasial spasial yang telah dipraproses digabungkan. Hal yang dilakukan adalah dengan menambahkan atribut dari data non-spasial ke data spasial.
Equal interval
Tabel 4 Pembagian kelas persentase dengan Equal Interval
Pendugaan Spatial Outlier Outlier dapat dideteksi secara global atau secara spasial. Secara global, outlier mudah ditemukan temukan karena hanya memerlukan informasi nilainya saja seperti yang terlihat pada Gambar 9. Outlier akan memiliki nilai yang berbeda
Kelas (dalam %)
Kandidat Sedikit
Sedang
Banyak
A
1.1 - 17.8
17.8 - 34.4
34.4 - 51.1
B
0 - 15.5
15.5 - 30.9
30.9 - 46.5
7
Tabel 4 Lanjutan Kelas (dalam %)
Kandidat Sedikit
Sedang
Banyak
C
0–8
8 - 16.1
16.1 - 24.2
D
1.1 - 17.7
17.7 - 34.3
34.4 - 50.9
E
27.9 - 47.6
47.6 - 67.2
67.2 - 86.9
sedikit
Spatial Outlier juga dapat dilihat dalam bentuk Scatterplot seperti yang terlihat pada Gambar 12. Sumbu x dan sumbu y merupakan koordinat x dan y TPS. Sumbu z merupakan persentasi hasil Pilkada setiap TPS.
B02
banyak sedang
Gambar 12 Spatial outlier dalam bentuk Scatterplot. 2
atural Breaks Hasil yang berbeda diperoleh peroleh dengan menggunakan atural Breaks. Breaks Hasil pembagian untuk seluruh TPS disajikan pada Tabel 6.. Hasil pembagian kelas untuk TPS D dalam bentuk histogram h diperlihatkan Gambar 13 sedangkan TPS yang lain dapat dilihat pada Lampiran 3. Untuk menduga spatial outlier, outlier digunakan cara yang sama dengan cara pada Equal Interval.
Gambar 10 Pembagian kelas persentase untuk kandidat D dengan Equal Interval I . ID_TPS=B02 ID_TPS=
Tabel 6 Pembagian kelas persentase dengan atural Breaks Gambar 11 Spatial outlier dengan Equal Interval . Tabel 5 menunjukkan posisi spatial outlier (ID_OBJ=B02) yang ditunjukkan oleh Gambar 11 dalam tabel, atribut persentase diurutkan terlebih dahulu secara menaik. Dapat dilihat bahwa spatial outlier tidak memiliki nilai yang berbeda secara signifikan dengan keseluruhan nilai yang ada.
Kelas (dalam %)
Kandidat Sedikit
Sedang
Banyak
A
1.1 - 9.9
9.9 – 20
20 - 51.1
B
0 - 9.6
9.6 - 26.4
26.4 - 46.5
C
0 - 4.2
4.2 - 7.5
7.5 - 24.2
D
1.1 - 11
11 - 22.2
22.2 - 50.9
E
27.9 - 55.2
55.2 - 68.5
68.5 - 86.9
Tabel 5 Persentase hasil Pilkada ID_OBJ
ID_TPS
Persentase
44
T05
0.012
…
…
…
78
CB03
0.34
5
B02
0.364
76
CB05
0.382
…
…
…
Spatial Outlier
Gambar 13 Pembagian kelas persentase untuk kandidat D dengan atural Breaks.
8
Dengan contoh daerah yang sama, yakni kelurahan Babakan, secara visual dapat diduga dua spatial outlier seperti yang ditunjukkan oleh Gambar 14. 1 Untuk hasil visualisasi ualisasi TPS yang lain dapat dilihat pada Lampiran 4. Pada Gambar 14 14, kelas yang dominan adalah kelas sedikit dan kelas sedang. TPS yang diduga sebagai spatial outlier juga dapat dilihat dalam bentuk tabel seperti pada Tabel 7 dan dalam bentuk scatterplot seperti pada Gambar 15.
sebagai sebuah variabel (misal S)) dengan tipe struct.. Nomor indeks pada variabel S merepresentasikan urutan objek bersangkutan dalam shapefile.. Ilustrasi struktur variabel S diperlihatkan Gambar 16.
Gambar 16 Struktur variabel S. Membentuk K-earest eighbor List ID_TPS=B02
ID_TPS=B01
Implementasi dari algoritme k-NN k adalah sebagai berikut : 1
Nilai k ditentukan dengan menghitung nilai rata-rata rata dari jumlah TPS di setiap kelurahan. Hal ini dilakukan agar pengelompokan dapat mewakili data di mana proses perhitungannya tidak mempertimbangkan batas kelurahan. Nilai rata-rata rata yang diperoleh adalah 18,1. Nilai ini dibulatkan menjadi 19 karena nilai k umumnya ditentukan dalam jumlah ganjil untuk menghindari munculnya jumlah jarak yang sama dalam proses pengklasifikasian.
Gambar 14 Spatial outlier dengan atural Breaks . Tabel 7 Persentase hasil Pilkada ID_OBJ
ID_TPS
Persentase
44 … 6 …
T05 … B01 …
0.012 … 0.295
5 76 …
B02 CB05 …
… 0.364
Spatial Outlier
Menentukan nilai k
2
Menghitung jarak setiap titik TPS. Untuk menghitung jarak, digunakan perhitungan Euclidean lalu dibentuk matriks jarak seperti yang dicontohkan pada Tabel 8.
0.382 …
Tabel 8 Matriks jarak antartitik
B02 B01
Gambar 15 Spatial outlier dalam bentuk Scatterplot. Load ke Matlab Data yang telah dipraproses di load ke Matlab. Dalam Matlab, data tersebut disimpan
xi
1
2
3
….
189
1
0
81.633
98.311
….
1829
2
81.63
0
77.078
….
1880.2
3
98.31
77.078
0
….
1811.4
4
241.35
244.81
167.76
….
1667.4
5
366.48
372.06
295.14
….
1567.3
….
…
....
….
….
…….
189
1829
1880.2
1811.4
….
0
3
Mengelompokkan setiap titik dengan k nilai terdekat. Setelah mendapatkan matriks jarak, maka langkah selanjutnya adalah mengelompokkan k terdekat untuk setiap
9
titik. Pada langkah ini, dihasilkan k-nearest k neighbor list yang disajikan pada Lampiran 5.
adalah T17, TPS kandidat D adalah PL06, dan TPS kandidat E adalah B12.
Algoritme Iterative Ratio Implementasi algoritme adalah sebagai berikut : 1
Iterative
Ratio
Menghitung fungsi neighborhood g(xi). 1 g(xi ) k xϵ
f f(x) k (xi )
z=3
Dihitung juga fungsi hi = h(xi) =f(xi)/g(xi). Langkah awal yang dilakukan adalah menghitung fungsi neighborhood yaitu fungsi rataan. an. Untuk membandingkan nilai atribut persentase suatu TPS dengan TPS tetangganya, dihitung fungsi perbandingan h(xi) yaitu fungsi perbandingan rasio. Hasil perhitungan akhir untuk fungsi perbandingan diperlihatkan pada Lampiran 6. 2
Proses selanjutnya adalah mencari nilai maksimum dari hasil perhitungan rasio h(xi) untuk seluruh TPS. Jika nilai rasio tersebut lebih dari θ (threshold) yang telah ditentukan, maka TPS tersebut dianggap sebagai spatial outlier.. Nilai θ akan mempengaruhi banyaknya spatial outlier yang akan terdeteksi. Nilai θ ditentukan dengan menormalisasikan hasil dari fungsi perbandingan. Nilai ini ditampilkan ke bentuk histrogram, dari sini dapat ditentukan nilai θ di mana terdapat jarak dari bin yang satu ke bin yang lain lain. Seluruh histogram dapat dilihat pada Lampiran 7. Dari seluruh histogram, jarak rata-rata antar bin tersebut terdapat pada nilai lebih dari 3. Nilai lebih dari 3 memiliki makna bahwa jumlah outlier sebanyak ak kurang lebih 2% 5% dari data. Dengan demikian nilai 3 dijadikan sebagai threshold.. Nilai threshold sebesar 3 dikembalikan menjadi nilai h dengan fungsi ℎ∗!+# sehingga nilai threshold masing-masing masing kandidat berbeda. Contohnya pada TPS dengan kandidat A, penentuan threshold diperlihatkan oleh Gambar 17. Gambar 17 memperlihatkan histogram persentase untuk kandidat A. Daftar threshold setiap kandidat diperlihatkan oleh Tabel 9. Saat iterasi pertama, spatial outlier yang terdeteksi pada TPS kandidat A adalah KK16, TPS kandidat B adalah G03, TPS kandidat C
ℎ ∗ ! + # h = 3.067
Gambar 17 Penentuan threshold. Tabel 9 Threshold untuk setiap kandidat pada algoritme Iterative Ratio Kandidat
Threshold
A
3.067
B
2.648
C
2.671
D
2.9
E
1.454
3
Langkah selanjutnya, titik TPS yang dianggap sebagai spatial outlier diganti nilainya dengan nilai rataan tetangga dari TPS tersebut. Dalam setiap iterasi, hanya akan terdeteksi satu spatial outlier outlier. Hal ini dilakukan agar TPS tersebut tidak terdeteksi kembali sebagai outlier untuk iterasi selanjutnya dan mencegah titik normal rmal yang berada dekat dengan spatial outlier terdeteksi sebagai spatial outlier. outlier Fungsi neighborhood kemudian dihitung kembali. Langkah ini dilakukan terus sampai tidak ada nilai h(xi) yang melebihi threshold.
4
Setelah proses iterasi selesai, didapatkan hasil deteksi spatial outlier.. Jumlah spatial outlier yang terdeteksi untuk TPS kandidat A sebanyak 3, TPS kandidat B sebanyak 2,
10
TPS kandidat C sebanyak 2, TPS kandidat D sebanyak 4, dan TPS kandidat E sebanyak 3. Rincian hasil deteksi spatial outlier dapat dilihat pada Lampiran 8. Berdasarkan hasil pendugaan spatial outlier menggunakan metode Equal Interval dan atural Breaks, titik dengan ID_OBJ=136 bukan merupakan spatial outlier. Dengan algoritme Iterative Ratio, titik dengan ID_OBJ=136 tidak terdeteksi sebagai spatial outlier, sedangkan dengan menggunakan Moran Scatterplot titik dengan ID_OBJ=136 terdeteksi sebagai spatial outlier.
Jumlah spatial outlier yang terdeteksi untuk TPS kandidat A sebanyak 12, TPS kandidat B sebanyak 7, TPS kandidat C sebanyak 1, TPS kandidat D sebanyak 3, dan TPS kandidat E sebanyak 1. Rincian hasil deteksi spatial outlier dapat dilihat pada Lampiran 10. Berdasarkan hasil pendugaan spatial outlier menggunakan metode Equal Interval dan atural Breaks, titik dengan ID_OBJ=81 diduga sebagai spatial outlier. Dengan algoritme Iterative Z-value, titik dengan ID_OBJ=81 terdeteksi sebagai spatial outlier, sedangkan dengan menggunakan Moran Scatterplot titik dengan ID_OBJ=81 tidak terdeteksi sebagai spatial outlier.
Algoritme Iterative Z-value
Visualisasi
Implementasi algoritme Iterative Z-value adalah sebagai berikut :
Pada kedua algoritme Iterative Ratio dan Iterative Z-value, keluaran yang dihasilkan berupa ID dari TPS yang merupakan spatial outlier dan visualisasi dalam bentuk peta. Dengan adanya visualisasi dalam bentuk peta, lebih terlihat letak TPS yang merupakan spatial outlier. Untuk contoh hasil visualisi algoritme Iterative Ratio dan Iterative Z-value pada TPS dengan kandidat A diperlihatkan oleh Gambar 18, dan untuk kandidat yang lain dapat dilihat pada Lampiran 11. Titik yang berwarna merah merupakan TPS spatial outlier, sedangkan titik yang berwarna biru merupakan TPS biasa.
1
Menghitung fungsi neighborhood g(xi). 1 g(xi ) k xϵ
k (xi )
f(x)
Dihitung juga fungsi hi = h(xi) = f(xi) – g(xi). Langkah awal yang dilakukan pada algoritme Iterative Z-value sama dengan algoritme ratio, yaitu dengan menentukan set NNk(xi) dan menghitung fungsi neighborhood. Untuk membandingkan atribut persentase suatu TPS dengan TPS tetangganya, dihitung dengan fungsi perbandingan selisih. 2
3
Nilai tersebut dinormalisasi dengan rataan dan standar deviasi. Langkah selanjutnya, seluruh nilai yang sudah dinormalisasi dicari nilai maksimumnya. Jika nilai maksimum lebih dari threshold, maka TPS tersebut dianggap sebagai spatial outlier. Penentuan threshold sama dengan pada algoritme sebelumnya. Nilai threshold yang digunakan adalah 3. Pada iterasi pertama, spatial outlier yang terdeteksi pada TPS A adalah S05, TPS B adalah T21, TPS C adalah T17, TPS D adalah PL06, TPS E adalah S05. Sama halnya dengan algoritme Iterative Ratio, jika terdeteksi suatu spatial outlier, maka fungsi neighborhood, fungsi perbandingan, dan fungsi normalisasi dihitung kembali. Jika tidak ada nilai normalisasi yang lebih dari threshold, maka iterasi selesai. Hasil akhir dari perhitungan fungsi normalisasi diperlihatkan pada Lampiran 9.
(a) Visualisasi algoritme Iterative Ratio
(b) Visualisasi algoritme Iterative Z-value Gambar 18 Visualisasi hasil deteksi spatial outlier.
11