BAB 4 Hasil Dan Pembahasan 4.1
Implementasi Sistem Pada bagian ini, akan dibahas implementasi dari setiap
perancangan yang sudah dibuat pada bab sebelumnya. 4.1.1
Proses Normalisasi Data Spasial Seperti yang telah dijelaskan pada bagian perancangan
sistem,
sebelum
melakukan
clustering
data
user
harus
memasukkan data berupa data spasial. Data spasial tersebut akan dinormalisasi terlebih dahulu menggunakan rumus Min-Max Normalization. Pada bagian ini akan dibahas proses normalisasi untuk salah satu objek dari data yang dimasukkan oleh user yaitu longitude = 129.879684 dan latitude = -0.444255 dengan nilai minimal untuk longitude adalah 129.879684 dan nilai minimal untuk latitude adalah -3.880696, sedangkan nilai maksimal untuk longitude adalah 134.870481 dan nilai maksimal untuk latitude adalah -0.046692. Berikut ini adalah proses normalisasi tersebut dengan nilai minimal baru yang diinginkan untuk longitude dan latitude adalah nol dan nilai maksimal baru untuk keduanya adalah 100. -
Normalisasi longitude (
28
)
29
(
-
)
Normalisasi latitude ( ( (
) ( )
)
)
Dari proses normalisasi di atas, dapat dilihat bahwa data longitude yang baru adalah 0.00000 dan data latitude yang baru adalah 89.630605. Proses normalisasi tersebut dilakukan pada semua objek data yang dimasukkan oleh user. Data spasial yang menjadi kasus dalam penelitan ini dapat dilihat pada Lampiran 1 dan hasil normalisasi dapat dilihat pada Lampiran 2. Implementasi proses normalisasi tersebut dalam program yang dibuat dituliskan dengan kode seperti pada Kode Program 4.1. Kode Program 4.1 Proses Normalisasi Data 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
$setData = normalisasi($namadb, $kolom1, $kolom2); $A = $setData[0]; $minA = $setData[1]; $maxA = $setData[2]; $C = $setData[3]; $D = $setData[4]; for($i=0; $i
30
Pada baris 1 dari Kode Program 4.1, dapat dilihat program memanggil fungsi normalisasi dengan parameter nama database yang digunakan serta kolom yang berisi data latitude dan longitude. Nilai yang dikembalikan dari fungsi tersebut adalah nilai terkecil dan terbesar data yang akan dinormalisasi serta range yang diinginkan untuk proses normalisasi tersebut. Pengkodean untuk normalisasi data dengan rumus Min-Max Normalization terdapat pada baris 8 dan baris 9 dari Kode Program 1. 4.1.2
Proses Clustering Setelah data spasial dinormalisasi, data tersebut akan
dikelompokkan melalui proses clustering. Proses clustering dilakukan menggunakan Algoritma K-Means. Berikut ini adalah proses clustering terhadap data yang sudah dinormalisasi sesuai dengan penjelasan mengenai Algoritma K-Means pada bab sebelumnya. 1.
Menentukan nilai K atau jumlah cluster dan centroid Misalkan nilai K yang dimasukkan adalah dua, sehingga
centroid yang ditentukan juga sebanyak dua centroid. Centroid awal dalam algoritma K-Means ditentukan secara acak, sehingga hasil clustering dapat berubah-ubah. Pada kasus dalam penelitian ini, jumlah cluster yang baik dengan hasil clustering tidak banyak perubahan adalah dua. Oleh karena itu, pada bagian ini akan dibahas prose clustering untuk jumlah cluster dua. Adapun centroid dari objek tersebut adalah latitude dan longitude dari
31
objek nomor satu (0.000000, 89.630605) yang dapat disimbolkan dengan C1 dan objek nomor dua (15.194267, 99.211999) yang dapat disimbolkan dengan C2. 2.
Mengelompokkan data ke dalam cluster Data dikelompokkan berdasarkan jarak terdekat ke centroid
yang dihitung menggunakan fungsi jarak yaitu Euclidean Distance. Berikut ini adalah contoh perhitungan jarak antara objek dan centroid, untuk objek dengan longitude = 0.000000 dan latitude = 89.630605. -
Jarak objek ke C1 √(
-
)
(
)
Jarak objek ke C2 √(
)
(
)
√
Perhitungan jarak dilakukan pada semua objek data seperti contoh di atas. Berdasarkan hasil perhitungan jarak maka anggota cluster satu berjumlah 10 dan anggota cluster dua berjumlah 69. Hasil perhitungan jarak dapat dilihat pada Lampiran 3. Implementasi perhitungan jarak pada program dituliskan dengan kode seperti pada Kode Program 4.2. Kode Program 4.2 Perhitungan Jarak 1. 2. 3. 4. 5.
function jarak($obj, $cent) { $x = pow(($obj[0]-$cent[0]),2); $y = pow(($obj[1]-$cent[1]),2); return round(sqrt($x + $y), 2); }
32
Pada Kode Program 4.2 terdapat fungsi jarak dengan parameter obj yaitu data objek yang akan dikelompokkan serta cent sebagai centroid yang akan digunakan untuk menghitung jarak. Fungsi jarak melakukan perhitungan jarak antara masingmasing objek data ke centroid yang sudah ditentukan. Sesuai dengan penjelasan mengenai Algoritma K-Means, maka langkah selanjutnya adalah mengelompokkan tiap data ke dalam cluster. Data dikelompokkan berdasarkan hasil
perhitungan jarak
minimum. Implementasi pengelompokkan data pada sistem dapat dilihat pada Kode Program 4.3. Kode Program 4.3 Pengelompokan Data 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27.
function clustering($data, $centroids, $k) { foreach($data as $indexDataObj => $dataObj) { foreach($centroids as $centroid) { $arrJarak[$indexDataObj][] = jarak($dataObj, $centroid); } } foreach($arrJarak as $indexJarak => $jarak) { $cluster = minCent($jarak); $arrTempCluster[$cluster][] = $indexJarak; $arrJarak_dari_clusters = array("$indexJarak" => $jarak); } if(count($arrTempCluster) < $k) { $latLngCluster = maxCent($arrJarak_dari_clusters); foreach($arrTempCluster as $tempIndex => $tempCluster) { foreach($tempCluster as $tempObj) { if($tempObj == $latLngCluster) { $clusters[$k+1][] = $tempObj; } else { $clusters[$tempIndex][] = $tempObj; } } } } else { $clusters = $arrTempCluster; } return $clusters; }
33
Pada Kode Program 4.3 terdapat fungsi clustering yang berfungsi untuk melakukan pengelompokan data. Secara garis besar, fungsi ini akan memanggil fungsi jarak untuk menghitung jarak dan hasilnya ditampung dalam variabel arrJarak. Setelah itu, akan diambil nilai minimum dari hasil perhitungan tersebut. Nilai minimum dari masing-masing objek kemudian dikelompokkan satu cluster yang sama. 3.
Menghitung ulang K cluster Setelah selesai mengelompokan objek ke dalam cluster,
langkah selanjutnya adalah menghitung K cluster dengan centroid yang baru. Centroid baru ditentukan dengan cara sebagai berikut : -
Centroid satu (C1) (
-
)
Centroid dua (C2) (
)
Berdasarkan hasil perhitungan centroid baru sesuai dengan cara di atas, maka centroid baru untuk C1 adalah (10.904094, 40.554836) dan untuk C2 adalah (59.051441, 67.729235). Setelah mendapatkan centroid baru, ulangi langkah kedua dan langkah ketiga sampai tidak ada lagi objek data yang berpindah cluster. Implementasi perhitungan centroid baru dapat dilihat pada Kode Program 4.
34
Kode Program 4.4 Perhitungan Centroid Baru 1. function centroidBaru($latLng) { 2. $x = 0; 3. $y = 0; 4. foreach($latLng as $k) { 5. $x = $x + $k[0]; 6. $y = $y + $k[1]; 7. } 8. $center[0] = round($x / count($latLng), 6); 9. $center[1] = round($y / count($latLng), 6); 10. return $center; 11. } 12. function hitungCent($clusters, $data) { 13. foreach($clusters as $noCluster => $arrObjCluster) { 14. foreach($arrObjCluster as $objCluster) { 15. $arrObjCluster_latLng[$noCluster][] = $data[$objCluster]; 16. } 17. } 18. foreach($arrObjCluster_latLng as $objCluster_latLng) { 19. $cluster_centers[] = centroidBaru($objCluster_latLng); 20. } 21. return $cluster_centers; 22. }
Pada Kode Program 4.4 terdapat dua fungsi yaitu fungsi centroidBaru dan hitungCent. Secara garis besar, fungsi hitungCent akan memanggil fungsi centroidBaru seperti pada baris 19 untuk melakukan perhitungan centroid baru yang akan digunakan pada iterasi berikutnya dari algoritma K-Means. Setiap kode program yang menerapkan proses algoritma KMeans akan dijalankan melalui fungsi kmeans seperti pada Kode Program 4.5.
35
Kode Program 4.5 Eksekusi Algoritma K-Means 1. 2. 3. 4. 5. 6. 7. 8.
9. 10. 11. 12. 13.
function kmeans($data, $k) { if($k <= 0) { echo "Nilai K = ".$k.". K harus bilangan positif!"; exit(0); } $centroidLama = centroid($data, $k); while(true) { $clusters = clustering($data, $centroidLama, $k); $centroidBaru = hitungCent($clusters, $data); if($centroidLama === $centroidBaru) { return(array ($centroidBaru, $clusters)); } $centroidLama = $centroidBaru; } }
Pada Kode Program 4.5 terdapat fungsi kmeans yang akan dieksekusi untuk melakukan proses algoritma K-Means. Program akan menentukan nilai centroid awal dengan memanggil fungsi centroid pada baris 6. Baris 7 sampai baris 12 merupakan perulangan yang dilakukan untuk mendapatkan hasil clustering setelah tidak ada lagi data yang berpindah cluster. Hasil dari proses clustering akan ditampilkan oleh program seperti pada Gambar 4.1.
Gambar 4.1 Hasil Clustering
36
Data yang dimasukkan oleh user adalah data mengenai potensi bahan tambang di Provinsi Papua Barat dengan jumlah titik sebanyak 79 titik. Berdasarkan hasil clustering pada Gambar 12, dapat dilihat bahwa nilai K yang dimasukkan oleh user adalah dua sehingga jumlah cluster
yang dibuat juga sebanyak dua
cluster. Selain itu, juga terdapat link Lihat Peta yang dapat digunakan untuk melihat peta dari hasil clustering yang sudah dilakukan. 4.1.3
Proses Konversi Data Ke Data Spasial Setelah melakukan clustering data, data yang sudah
dinormalisasi harus dikembalikan ke dalam bentuk spasial terlebih dahulu dan kemudian ditampilkan menggunakan Heatmap. Pengkodean untuk mengembalikan data ke dalam bentuk spasial dapat dilihat pada Kode Program 4.6. Kode Program 4.6 Mengembalikan Data Spasial 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17.
$setData = normal($namadb, $kolom1, $kolom2); $B = $setData[0]; $minA = $setData[1]; $maxA = $setData[2]; $C = $setData[3]; $D = $setData[4]; . for($i=0; $i
37
Kode
Program
4.6
merupakan
pengkodean
untuk
mengembalikan data yang sudah dinormalisasi menjadi data spasial. Pada kode program tersebut dapat dilihat bahwa program memanggil fungsi normal yang berfungsi untuk mengambil data yang akan dikembalikan. Proses pengembalian data menjadi bentuk spasial terdapat pada baris 7 sampai baris 9 dari Kode Program 4.6. Setelah berhasil mengembalikan data dalam bentuk spasial, data akan ditampilkan menggunakan Heatmap. 4.1.4
Proses Menampilkan Data Data yang telah dikelompokkan dan dikonversi kembali
dalam bentuk spasial akan ditampilkan menggunakan Heatmap. Berdasarkan kasus yang digunakan dalam penelitian ini, maka daerah yang berpotensi menghasilkan bahan tambang akan berwarna merah. Pengkodean untuk menampilkan data tersebut dapat dilihat pada Kode Program 4.7.
38
Kode Program 4.7 Menampilkan Data Dengan Heatmap 1.
2. 3. 4. 5. 6. 7.
8. 9. 10.
11. 12. 13. 14. 15. 16. 17. 18. 19.
downloadUrl("../Skripsi/fungsi/map_xml.php?namadb="+ namadb, function(data) { var xml = data.responseXML; var markers = xml.documentElement. getElementsByTagName("marker"); for (var i = 0; i < markers.length; i++) { var nama = markers[i].getAttribute("nama"); var cluster = markers[i].getAttribute ("cluster"); var point = new google.maps.LatLng (parseFloat(markers[i]. getAttribute("lat")), parseFloat(markers[i]. getAttribute("lng"))); disk_points.push(point); var html = "
" + nama + "Anggota
cluster " + cluster; var marker = new google.maps.Marker({ position: point}); bindInfoWindow(marker, map, infoWindow, html); marker_array.push(marker); } }); pointArray = new google.maps.MVCArray(disk_points); heatmap = new google.maps.visualization. HeatmapLayer({ data: pointArray }); heatmap.set('radius', 25); heatmap.set('gradient', gradient); heatmap.setMap(map);
Kode Program 4.7 merupakan potongan dari fungsi initialize dengan parameter nama database yang digunakan. Fungsi tersebut dijalankan program untuk menampilkan data yang sudah dikelompokkan melalui clustering menggunakan Heatmap. Baris 1 dari Kode Program 4.7 memanggil data yang sudah dikembalikan ke dalam bentuk spasial sebelumnya. Data tersebut kemudian digunakan oleh fungsi initialize untuk ditampilkan dalam peta seperti yang terlihat pada baris 5 sampai baris 7 dari Kode Program 4.7 dan kemudian disimpan dalam
39
variabel
pointArray
pada
baris
13.
Pengkodean
untuk
menampilkan data dalam variabel pointArray dengan Heatmap terdapat pada baris 17 sampai baris 19 dari Kode Program 4.7. Data yang ditampilkan oleh Heatmap dapat dilihat pada Gambar 4.2.
Gambar 4.2 Peta Hasil Clustering
Gambar 4.2 menunjukkan hasil clustering dari data yang dimasukkan oleh user. Dari gambar tersebut dapat dilihat bahwa daerah yang berpotensi menghasilkan bahan tambang berwarna merah. Pada gambar tersebut juga terdapat form Tambah Objek Baru yang dapat digunakan jika user ingin menambah objek baru. Jika gambar tersebut diperbesar, maka akan ditampilkan detail dari masing-masing titik berupa informasi mengenai objek yang terdapat pada titik tersebut seperti yang ditunjukkan pada Gambar 4.3.
40
Gambar 4.3 Informasi Objek Tiap Titik
4.2
Pengujian
4.2.1
Black Box Testing Setelah melakukan implementasi terhadap perancangan
yang telah dibuat, maka tahap selanjutnya dalam penelitian ini adalah pengujian. Pengujian yang dilakukan yaitu Black Box Testing. Black Box Testing bisa juga disebut sebagai functional testing, sebab pengujian dilakukan pada tiap fungsi yang ada pada program (Saleh, 2009). Pada pengujian dengan Black Box Testing, akan diuji validitas dari fungsi-fungsi yang ada. Fungsi yang berhasil ditandai dengan (), sedangkan fungsi yang gagal ditandai dengan (). Hasil dari pengujian tersebut dapat dilihat pada Tabel 4.1.
41
Tabel 4.1 Hasil Black Box Testing
FUNGSI Upload File
SKENARIO Mengunggah dokumen data objek Normalisasi Mengubah data spasial ke dalam bentuk Kartesius
INPUT Dokumen Excel
Clustering
Setiap cluster memiliki objeknya masingmasing Menekan Daerah hasil link Lihat clustering Peta berwarna merah Menekan Jumlah objek titik objek bertambah, yang anggota diinginkan cluster dan berubah tombol TAMBAH
Latitude dan Longitude objek Mengelompookan Nilai K objek ke dalam dan cluster Dokumen Excel
View Map
Menampilkan peta hasil clustering
Insert Data
Menambahkan data objek yang baru pada peta
HASIL VALIDITAS Dokumen berhasil diunggah Data berhasil dinormalisasi
Black Box Testing dilakukan oleh programmer yang membuat program tersebut, dalam hal ini peneliti. Fungsi-fungsi yang digunakan untuk melakukan clustering diuji melalui Black Box Testing tersebut. Berdasarkan hasil pengujian pada Tabel 4.1, setiap fungsi sudah berjalan dengan baik atau valid.
42
4.2.2
Pengujian Penelitian Selain Black Box Testing, juga dilakukan pengujian
terhadap penelitian yang dilakukan. Pengujian ini dilakukan untuk melihat kembali tujuan dari penelitian ini, yaitu clustering data spasial. Pengujian dilakukan melalui nilai K yang dimasukkan. Hasil dari pengujian tersebut dapat dilihat pada Tabel 4.2. Tabel 4.2 Hasil Pengujian Penelitian
Nilai K 1 2 3
4
5
6
Durasi Jumlah Clustering Anggota 28.6 detik Cluster 1 : 79 Cluster 1 : 40 30.5 detik Cluster 2 : 39 Cluster 1 : 30 28.6 detik Cluster 2 : 38 Cluster 3 : 11 Cluster 1 : 10 Cluster 2 : 27 29.8 detik Cluster 3 : 32 Cluster 4 : 10 Cluster 1 : 11 Cluster 2 : 27 31.9 detik Cluster 3 : 27 Cluster 4 : 3 Cluster 5 : 11 Cluster 1 : 7 Cluster 2 : 18 35.3 detik Cluster 3 : 17 Cluster 4 : 23 Cluster 5 : 3
Nilai K
Durasi Clustering
8
34 detik
9
34.1 detik
10
32.9 detik
Jumlah Anggota Cluster 1 : 1 Cluster 2 : 3 Cluster 3 : 3 Cluster 4 : 21 Cluster 5 : 10 Cluster 6 : 20 Cluster 7 : 11 Cluster 8 : 10 Cluster 1 : 1 Cluster 2 : 3 Cluster 3 : 3 Cluster 4 : 14 Cluster 5 : 10 Cluster 6 : 22 Cluster 7 : 13 Cluster 8 : 3 Cluster 9 : 10 Cluster 1 : 1 Cluster 2 : 1 Cluster 3 : 3
43
7
34.1 detik
Cluster 6 : 11 Cluster 1 : 5 Cluster 2 : 6 Cluster 3 : 21 Cluster 4 : 11 Cluster 5 : 23 Cluster 6 : 3 Cluster 7 : 10
Cluster 4 : 2 Cluster 5 : 14 Cluster 6 : 10 Cluster 7 : 22 Cluster 8 : 13 Cluster 9 : 3 Cluster 10 : 10
Pada Tabel 4.2 dapat dilihat bahwa semakin besar nilai K yang diberikan tidak mempengaruhi durasi clustering. Hal ini terlihat dari durasi clustering yang terus berubah-ubah untuk tiap nilai K. Berdasarkan hasil tersebut, dapat dikatakan bahwa durasi clustering tidak bergantung pada nilai K yang diberikan. Selain itu, hasil yang diperoleh dari pengujian penelitian yaitu mendapatkan daerah yang paling berpotensi menghasilkan bahan tambang. Hasil tersebut dapat dilihat pada Gambar 4.4.
44
Centroid 1
Centroid 2
Centroid 3
Centroid 4
Gambar 4.4 Hasil Pengujian Penelitian
Gambar 4.4 menunjukkan hasil clustering dengan nilai K empat, sehingga ada empat cluster yang dibuat dari proses clustering tersebut. Pada Tabel 4.2 dapat dilihat bahwa cluster terbaik untuk menghasilkan potensi tambang dengan nilai K empat adalah cluster tiga, sedangkan pada Gambar 4.4 dapat dilihat bahwa cluster terbaik untuk menghasilkan potensi tambang adalah cluster dua. Perbedaan ini disebabkan karena centroid yang digunakan dalam Algoritma K-Means ditentukan secara acak.