PERBANDINGAN METODE FUZZY C-MEANS (FCM) DAN FUZZY CSHELL (FCS) MENGGUNAKAN DATA CITRA SATELIT QUICKBIRD (STUDI KASUS DAERAH PEUKAN BADA, ACEH BESAR) Novi Reandy Sasmita1, Hizir Sofyan1, Muhammad Subianto2 1
Jurusan Matematika, Universitas Syiah Kuala, Darussalam, Banda Aceh, 23111, INDONESIA Email :
[email protected] Hp : +62 852 602 43205 2 Jurusan Informatika, Universitas Syiah Kuala, Darussalam, Banda Aceh 23111, INDONESIA
ABSTRAK Analisis kelompok (cluster analysis) yang telah banyak digunakan di berbagai disiplin ilmu bertujuan untuk mengelompokan objek. Sebuah metode pengelompokan yang baik akan menghasilkan kualitas kelompok dengan nilai simpangan baku dalam kelompok ( yang minimum dan nilai simpangan baku antar kelompok ( yang maksimum. Pada penelitian ini dilakukan pengelompokan pixel pada data citra satelit Quickbird tahun 2009 dengan objek penelitian daerah Peukan Bada, Aceh Besar. Pengelompokan tersebut menggunakan Fuzzy Clustering, yaitu metode Fuzzy C-Means (FCM) dan Fuzzy C-Shell (FCS). Berdasarkan perbandingan nilai dan , metode FCM memiliki nilai yang lebih minimum yaitu 0.1933228 dibandingkan dengan metode FCS yaitu 0.2309871 untuk pengelompokkan 5 kelas. Dengan demikian metode FCM memiliki hasil yang lebih baik untuk mengelompokan serta memvisualisasikan untuk data sebenarnya dibandingkan dengan metode FCS pada penginderaan jarak jauh. Kata kunci : Analisis kelompok, Fuzzy Clustering, Fuzzy C-Means (FCM), Fuzzy C-Shell (FCS), Penginderaaan Jarak Jauh.
PENDAHULUAN Satelit Quickbird sering digunakan karena memiliki resolusi yang baik untuk mengklasifikasikan dan menghasilkan peta tematik dengan teknik pengelompokan berdasarkan intensitas warna. Warna akan mewakili sebuah objek misalnya, daerah pemukikan, hutan, badan air dan lain-lain. Teknik pengelompokan digunakan untuk mendapatkan informasi awal dari data citra satelit. Metode konstruksi pengelompokan menjadikan profil objek dalam kelompok akan relatif homogen, sedangkan profil objek dalam kelompok yang berbeda relatif heterogen (Sofyan et al. 2005). Dengan metode pengelompokan konvensional, sebuah data yang berbentuk kabur atau tidak
1
terdefinisi dapat didefenisikan dalam sebuah kelompok menggunakan fuzzy. Fuzzy clustering dapat diaplikasikan untuk himpunan kabur (Zadeh, 1965). Analisis kelompok (cluster) dapat berkaitan dengan kelompok di masing-masing pixel pada data gambar dengan fungsi keanggotaan yang berkisar antara 0 dan 1. Tujuan penelitian ini adalah membandingkan dua metode fuzzy clustering menggunakan data citra satelit Quickbird pada objek penelitian Daerah Peukan Bada, Aceh Besar untuk proses pengelompokan pixel. Beberapa saluran (band) tersegmentasi dari data citra satelit akan dianalisis menggunakan pengelompokan kabur yang akan menghasilkan layer baru berupa kelompok (cluster). Kelompok yang terbentuk ini divalidasi secara komputerisasi untuk mendapatkan metode yang terbaik. Metode pengelompakan yang digunakan dalam penelitian ini adalah Fuzzy C-Means (FCM) dan Fuzzy C-Shell (FCS). Kedua metode digunakan untuk menganalisis dan mengelompokan data sesuai kelas.
METODE PENELITIAN Perangkat Pengujian dan Bahan Pengelompokan menggunakan sistem operasi Linux Ubuntu serta perangkat lunak GRASS dan R dengan objek penelitian Daerah Peukan Bada, Aceh Besar bulan Februari tahun 2009. Penentuan sampel dilakukan secara purposive random sampling, dengan asumsi bahwa lokasi tersebut telah mewakili 5 kelas pengelompokan yaitu air, pertanian, hutan, pemukiman, dan daerah pasir pantai.
Evaluasi Hasil Pengelompokan Evaluasi berupa validasi pengelompokan dilakukan dengan melihat kinerja metode. Kriterianya adalah nilai simpangan baku, yaitu dalam kelompok ( antar kelompok ( yang terbentuk dan [(
dan
∑
.
, dengan
dan
adalah banyaknya kelompok
merupakan simpangan baku kelompok. ∑
(
) ] dengan
adalah rataan kelompok ke-k
adalah rataan keseluruhan kelompok. Metode terbaik adalah yang
mempunyai nilai
yang minimum dan nilai
yang maksimum sehingga
memiliki homegenitas yang tinggi. 2
Akan tetapi akan sulit untuk melihat perbandingan antara nilai karena terdapat kemungkinan diperoleh nilai kriteria ternyata nilai
dan nilai
yang minimum
juga minimum, sedangkan harapannya adalah maksimum,
sehingga yang akan digunakan nilai rasio dipilih adalah nilai rasio
, dengan kata lain metode yang
yang terkecil (Bunkers et al, 1996).
Fuzzy C-Means (FCM) Fuzzy C-Means (FCM) adalah suatu teknik pengelompokan data dimana keberadaan tiap-tiap data dalam suatu kelompok ditentukan oleh nilai keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981. Konsep dasar FCM, menentukan pusat kelompok yang akan menandai lokasi rata-rata untuk tiap-tiap kelompok (Kusumadewi, 2006). Karim (2011) menjelaskan bahwa Fuzzy C Means (FCM) adalah suatu metode pengelompokan yang memungkinkan satu bagian dari data untuk memiliki dua atau lebih kelompok. Pada kondisi awal, pusat pengelompokan ini masih belum akurat. Tiap-tiap data memiliki derajat keanggotaan untuk tiap-tiap kelompok. Dengan cara memperbaiki pusat kelompok dan nilai keanggotaan tiaptiap data secara berulang, maka akan dapat dilihat bahwa pusat kelompok akan bergerak menuju lokasi yang tepat. Zimmerman (dalam kusumadewi, 2006) menjelaskan bahwa algoritma Fuzzy C-Means (FCM) adalah a. Menentukan : a.1.
Matriks
berukuran dengan n = jumlah data yang akan
dikelompokkan, m = jumlah variable (kriteria).
adalah data
sampel ke-i (i=1,2,…n), variable ke-j (j=1,2,…m). b.1.
Jumlah kelompok yang akan dibentuk = C (≥ 2).
c.1.
Pangkat atau pembobot = w ( > 1).
d.1.
Maximum iterasi.
e.1.
Kriteria penghentian =
f.1.
Iterasi awal, t = 1, dan Δ = 1.
b. Membentuk matriks partisi awal
(nilai positif yang sangat kecil).
sebagai berikut :
3
[
(
(
(
(
]
Dimana matrik pastisi awal dipilih secara acak.
adalah nilai dari
sebuah matrik berdasarkan baris dan kolom, begitu juga terhadap x. c. Menghitung pusat kelompok (
, ∑
untuk setiap kelompok : ((
∑
) (
d. Memperbaiki derajat keanggotaan setiap data pada setiap kelompok (perbaiki matrik partisi), sebagai berikut : [∑
(
)
⁄(
(
] dengan:
[∑
(
Dimana i (i=1,2,…c), variable ke-k (j=1,2,…n). Kemudian,
) ] [
adalah jarak observasi. e. Menentukan kriteria pemberhentian, yaitu perubahan matriks partisi pada iterasi sekarang dengan iterasi sebelumnya, sebagai berikut : ‖
Apabila Δ
‖
, maka iterasi dihentikan, namun apabila Δ
elemen dinaikkan iterasi
, maka
dan kembali ke langkah c. Dimana t
adalah jumlah iterasi dari algoritma. Perulangan pada metode Fuzzy C-Means (FCM) didasarkan pada minimisasi fungsi objektif sebagai berikut (Ross, 2005) : (
∑ ∑(
(
Hasil dari algoritma Fuzzy C-Means (FCM) menampilkan data seperti bola berawan dari sebuah kelompok data dalam ruang dimensi P. Algoritma cenderung akan membentuk kelompok dalam bentuk bulat. Ini dapat digunakan dalam ruang untuk mendeteksi bentuk linear (Dave, 1992). Semua kelompok diasumsikan berukuran sama. Setiap kelompok direpresentasikan oleh pusat. Representasi dari sebuah kelompok ini disebut prototipe, karena dianggap sebagai perwakilan dari semua data yang ada pada kelompok. Untuk ukuran, jarak Euclidean sering digunakan untuk jarak antara datum dan protipe (Hoppner, 1999).
4
Fuzzy C-Shell (FCS) Algoritma Fuzzy C-Shell (FCS) dirancang secara khusus untuk memisahkan struktur melingkar dalam gambar karena menggunakan jarak dari lingkaran ke titik pusat yang sesuai di fungsi objektifnya (Ali et al, 2008). Dave (dalam Habibi, 2010) menjelaskan, algoritma Fuzzy C-Shell (FCS) bentuk dasarnya hyper-spherical shell berdimensi P yang dapat dikarakteristikan oleh pusat dan jari-jari. Misal
adalah himpunan riil,
dari p-tuple. Misal
menjadi suatu himpunan data yang
infinite sedemikian sehingga
adalah feature vector ke-k. Misal
adalah fuzzy c-partisi dari
(
dinotasikan sebuah himpunan dari fuzzy c-
partisi dari ); dan misal V adalah c-tuple { tuple {
adalah himpunan riil
}
}
. Misal R adalah c-
.
Algoritma pengelompokan Fuzzy C-Shell (FCS) diberikan sebagai berikut (Habibie, 2010) : a. Menentukan banyak kelompok (
yang ingin dibuat, 2
, dengan
adalah jumlah dari data. Menentukan pangkat (pembobot) =
, antara 1
.
b. Menentukan counter iterasi = 0. Inisialisasi fuzzy c-partisi
. Dimana
adalah matrik. [
(
(
(
(
]
Dimana matrik pastisi awal dipilih secara acak.
= adalah nilai dari
sebuah matrik berdasarkan baris dan kolom, begitu juga terhadap x. c. Menghitung pusat kelompok (
, dan jari-jari kelompok (
dengan
menggunakan persamaan ∑ ∑
( (
, dan persamaan
∑
( ∑
(
Menggunakan metode pengganda Lagrange dengan perkalian inisial untuk iterasi pertama dari persamaan tersebut. d. Menghitung jarak (
.
adalah jarak antara feature vektor ke-
yaitu
dan propotipe ke- didefinisikan sebagai berikut : 5
(
(|
|)
Dari persamaan di atas, ||.|| adalah jarak Euclid, pusat
dan jari-jari
dari bentuk dasar shell cluster. Definisi di atas didasarkan pada mengukur kuadrat jarak, jadi ( dan prototipe (
adalah nilai determinan untuk sebuah titik
,
.
e. Perbaharui anggota iterasi ke- ,
dengan persamaan
= ∑
[
Memeriksa nilai kekonvergenan dengan membandingkan dalam nilai norma yang sesuai. Jika
]
⁄(
dan
, maka berhenti. Jika
, maka naikan iterasi (
dan kembali ke langkah c.
Untuk Fuzzy C-Shell (FCS), meminimalkan bobot jumlah dari jarak poin dari seperti bentuk dasar (prototipe). Jadi fungsi Fuzzy C-Shell (FCS) x
x
didefinisikan sebagai: (
∑ ∑(
(
HASIL DAN PEMBAHASAN Data Citra Satelit Quckbird Daerah Peukan Bada Data citra satelit Quickbird terdiri atas 3 saluran (band). Ketiga saluran tersebut yang menjadi data pada penelitian ini adalah
Saluran 1 satelit Quickbird
Saluran 2 satelit Quickbird
6
Saluran 3 satelit Quickbird
Gabungan saluran 1-3 satelit Quickbird
Kombinasi Data Saluran Berbentuk Matrik Data citra satelit Quickbird pada setiap saluran yang telah diubah menjadi bilangan antara 0-255 untuk setiap pixel menggunakan perangkat lunak GRASS digabungkan menjadi sebuah matrik. Matrik yang terbentuk menghasilkan jumlah 1.003.001 baris dan 3 kolom.
Pengelompokan Fuzzy C-Means (FCM) Setelah melakukan proses Fuzzy C-Means (FCM) pada perangkat lunak R menghasilkan nilai titik pusat untuk setiap kelompok dengan 3 saluran adalah Kelompok 1 2 3 4 5 Kemudian, jumlah berjumlah 163.356,
Saluran 1 Saluran 2 Saluran 3 139.75753 143.06032 120.40934 38.16003 45.89813 37.58733 237.79862 247.58453 245.09537 97.16591 97.99739 73.01230 187.66665 195.93278 184.22407 data untuk setiap kelompok adalah kelompok 1
kelompok 2 berjumlah 347.850, kelompok 3 berjumlah
89.618, kelompok 4 berjumlah 244.237 dan kelompok 5 berjumlah 157.940. Selanjutnya, jumlah proses perulangan 86 kali.
Pengelompokan Fuzzy C-Shell Setelah melakukan proses Fuzzy C-Shell (FCS) pada perangkat lunak R menghasilkan nilai titik pusat untuk setiap kelompok dengan 3 saluran adalah Kelompok 1
Saluran 1 222.605695
Saluran 2 244.87735
Saluran 3 234.72663 7
2 3 4 5 Kemudian, jumlah
3.095671 42.70769 14.78948 224.864938 21.59718 -129.39483 202.730548 199.18554 166.68242 95.126856 114.66419 145.93975 data untuk setiap kelompok adalah kelompok 1
berjumlah 107.824, kelompok 2 berjumlah 47.157,
kelompok 3 berjumlah
534.995, kelompok 4 berjumlah 129.887 dan kelompok 5 berjumlah 183.138. Selanjutnya, jumlah perulangan 21 kali
Perbandingan Fuzzy C-Means (FCM) dan Fuzzy C-Shell (FCS) a.
Perbandingan Hasil Pengelompokan Berdasarkan Gambar Berikut ini adalah hasil dari pengelompokan Fuzzy C-Means (FCM) dan
Fuzzy C-Shell (FCS) yang telah divisualisasikan menggunakan perangkat lunak GRASS.
Hasil Pengelompokan FCM
Hasil Pengelompokan FCS
Secara visualisasi dari dua hasil pengelompokan fuzzy di atas, Fuzzy CMeans (FCM) menghasilkan data pengelompokan yang memiliki keakurasian yang lebih baik dibandingkan Fuzzy C-Shell (FCS) untuk memvisualisasikannya gambaran data sebenarnya. Selajutnya, pada proses ini penelitian hanya dapat mengemukakan jumlah data untuk setiap kelompok yang terbentuk.
b.
Perbandingan Hasil Pengelompokan Berdasarkan Validitas Kelompok Setelah
menggunakan
proses
program
perbandingan simpangan baku dalam kelompok ( (
untuk
menghitung
dan antar kelompok
pada metode Fuzzy C-Means (FCM) dan Fuzzy C-Shell (FCS), 8
sehingga didapati rekapitulasi hasil perhitungan validitas pengelompokan sebagai berikut : Rekapitulasi validasi pengelompokan FCM Kelompok Saluran 1 Saluran 2 5 0.2157710 0.1731114
Saluran 3 0.1910859
Rata-rata 0.1933228
Rekapitulasi validasi pengelompokan FCS Kelompok Saluran 1 Saluran 2 Saluran 3 Rata-rata 5 0.2672103 0.202247 0.2235041 0.2309871 Dari hasil rekapitulasi ke dua table di atas diperolah rata-rata perbandingan dan antar kelompok (
simpangan baku dalam kelompok (
pada
pengelompokan metode FCM adalah 0.1933228, dimana lebih kecil dibandingkan metode FCS adalah 0.2309871, sehingga dapat diambil kesimpulan bahwa metode FCM lebih akurat dibandingkan FCS untuk 5 kelas pengelompokan.
SIMPULAN DAN SARAN Simpulan Dari hasil dan pembahasan, maka dapat disimpulkan bahwa berdasarkan pengujian Fuzzy C-Means (FCM) dan Fuzzy C-Shell (FCS) dengan nilai parameter yang sama, membuktikan bahwa Metode Fuzzy C-Means (FCM) lebih akurat dibandingkan Fuzzy C-Shell (FCS) untuk 5 kelas pengelompokan. Simpulan ini didasari dari nilai perbandingan simpangan baku dalam kelompok (
dan antar kelompok (
didapati perbandingan
dan
. Pada pengelompokan metode FCM
adalah 0.1933228, dimana lebih kecil
dibandingkan pada metode FCS adalah 0.2309871. Selanjutnya, hasil visualisasi menggunakan data pengelompokan FCM juga lebih baik dibandingkan data pengelompkan FCS.
Saran Akan lebih baik jika penelitian ini dilanjutkan dengan menghitung nilai indek validitas untuk pengelompokan pada metode Fuzzy C-Means (FCM) dan Fuzzy C-Shell (FCS) dengan parameter yang sama, sehingga diperoleh berapa kelas yang paling baik untuk data seperti ini .
9
DAFTAR PUSTAKA Ali, M. Ameer., Karmakar, Gour C., and Dooley, Laurence S. 2008. Fuzzy Clustering For Image segmentation Using Generic Shape Information. Malaysian Journal of Computer Scince, Vol 21 (2) : 122-138. Bunkers, Matthew J., Miller Jr, James R., and Degaetano, Arthur T. 1996. Defenition of Climate Regions in the Northern Plain Using an Objective Cluster Modification Technique. Journal Of Climate. Vol 9 : 130-146. Dave, Rajesh N. 1992. Boundary Detection Through Fuzzy Clustering. http://www.csee.usf.edu/~manohar/Papers/FCM/Boundary
detection
through Fuzzy Clustering.pdf. Tanggal akses 12 November 2011. Habibi,
Azwar.
2010.
Pendekatan
Analisis
Fuzzy
Clustering
Pada
Pengelompokkan Statiun Pos Hujan Untuk Membuat Zona Perkiraan Iklim (ZPI) (Studi Kasus Pengelompokkan Zona Prakiraan Iklim (ZPI) Dengan Data Curah Hujan Di Kabupaten Karawang, Kabupaten Subang dan Kabupaten Indramayu). Tesis Program Pasca Sarjana Statistika. Institut Teknologi Sepuluh November, Surabaya. Hoppner, Frank., Klawonn, Frank., Kruse, Rudolf., and Runkler, Thomas. 1999. Fuzzy Cluster Analysis Methods For Classification Data Analysis and Image Recognition. John Wiley and Sons, Ltd, United State of Amerika. Karim, Md. Ehsanul., 2011. Fuzzy C Means Clustering Using Pattern Recognition Concept, Method, Implementations. Lambert Academic Publishing, Germany. Kusumadewi, Sri., Hartati, Sri., Harjoko, Agus., and Wardoyo, Retantyo. 2006. Fuzzy Multi-Attribute Decision Making (FUZZY MADM). Graha Ilmu, Yogyakata. Ross, Timothy J. 2004. Fuzzy Logic With Engineering Applications. John Wiley and Sons, Ltd, United State of Amerika. Sofyan, Hizir., Md said, M.A., Affan, Muzailin., and Bawahidi, Khaled. 2005. The Application of Fuzzy Clustering to Satellite Images Data. Proc. of the 6th WSEAS Int. Conf. on Fuzzy Systems, Portugal : 100-103. Zadeh, L.A. 1965. Fuzzy Sets. Information and Control, Vol 8 : 338-353.
10