TRANSFORMASI MODEL WARNA YUV DAN FUZZY SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI CITRA SATELIT Ahmad Afif Supianto1, Sutrisno2 Informatika/Ilmu Komputer, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya Malang Email :
[email protected],
[email protected] ABSTRAK Di bidang klasifikasi citra satelit, beberapa penelitian telah banyak dilakukan dan dikembangkan untuk meningkatkan tingkat keakuratan dari proses klasifikasi tersebut. Pada citra satelit, area yang akan diklasifikasi memiliki lebih dari dua kelas, sehingga Multi-classification SVM digunakan sebagai pijakan untuk membangun classifier. Namun, Multi-classification SVM tersebut sering menghasilkan daerah yang tidak terklasifikasi (unclassifiable). Selain itu, model warna selain RGB adalah transformasi model warna YUV. Model ini dipilih sebagai metode ekstraksi fitur karena komponen warna Y secara tegas dipisahkan dari komponen chrominance (U dan V) yang mengakibatkan kedua komponen tersebut bersifat independen, sehingga komponen luminance dapat diproses tanpa mempengaruhi kontent warna dari suatu citra dan ruang model YUV tersebut biasanya banyak digunakan dalam gambar dan video. Pada penelitian ini, diusulkan metode klasifikasi yang menggunakan model warna YUV dan Fuzzy Support Vector Machine (FSVM) sebagai classifier. Metode klasifikasi diawali dengan proses ekstraksi fitur komponen warna Y (luminance) dari model warna YUV. Selanjutnya fitur yang dihasilkan dilatih menggunakan metode FSVM sebagai classifier. FSVM diterapkan sebagai classifier untuk menghindari area unclassifiable sebagai pengembangan pada metode Support Vector Machine (SVM), dimana metode SVM mengklasifikasikan data secara stright dengan tidak memperhatikan derajat keanggotaan dari suatu data terhadap semua kelas yang didefinisikan. Tahap berikutnya adalah tahap pengujian sistem untuk mengetahui tingkat akurasi terhadap metode yang diusulkan. Uji coba dilakukan terhadap citra satelit berukuran 256x256 piksel dengan total jumlah data latih sebanyak 450 data citra berukuran 16x16 piksel. Pengujian dilakukan untuk mengklasifikasikan citra ke dalam 3 kelas, yaitu lahan pertanian, area permukiman, dan area perairan. Hasil uji coba menunjukkan bahwa metode yang diusulkan mampu mengklasifikasikan data dengan tingkat akurasi mencapai 74,20%, sedangkan uji coba terhadap ekstraksi fitur RGB dan FSVM menghasilkan tingkat akurasi mencapai 73,52%. Implementasi transformasi model warna YUV dan FSVM yang diusulkan mampu meningkatkan nilai akurasi. Kata Kunci: Citra Satelit, Transformasi Citra, Support Vector Machine, Fuzzy Support Vector Machine.
1
Berbagai penelitian telah dilakukan untuk mengklasifikasikan objek pada citra satelit. Pada tahun 2009, Yuyong dkk. mengusulkan klasifikasi citra satelit melalui pendekatan konversi fitur, dimana citra yang semula dalam format RGB diubah ke dalam format HIS (Hue, Intensity, dan Saturation) [1]. Kemudian mereka menggunakan Fuzzy Support Vector Machine (FSVM) sebagai classifier dalam penelitian yang mereka usulkan. Hasil yang diperoleh dari penerapan metode tersebut meningkatkan presisi dari klasifikasi citra satelit. Penerapan Support Vector Machine (SVM) untuk klasifikasi citra satelit yang diusulkan oleh [1] menjadi ide dasar untuk dikembangkan dalam penelitian ini. SVM telah diterapkan dalam klasifikasi citra satelit dan menunjukkan hasil klasifikasi yang baik. Pada penelitian lain, [2] menggunakan SVM untuk melatih gambar HyMap dan mendapatkan hasil yang lebih baik daripada
PENDAHULUAN
Penelitian di bidang klasifikasi citra telah banyak dilakukan dan dikembangkan, terutama di bidang citra satelit. Identifikasi objek di dalam citra satelit menjadi penting mengingat manfaat yang didapatkan juga begitu besar. Salah satu manfaat yang didapatkan ketika suatu objek dapat diidentifikasi adalah informasi yang dapat diperoleh dari objek tersebut. Misalnya, informasi tentang jenis area, tipe area, sebaran area dan luas area dari objek tersebut. Sebagai contoh, informasi tentang jenis dan luas suatu area sumber pangan, area bangunan atau pemukiman, dan area perairan (seperti: sungai, danau, dan waduk). Dengan mengetahui informasi tersebut maka informasi tentang ketahanan pangan suatu daerah tertentu dan pada waktu tertentu dapat diperoleh. 1
Neural Network. Keuntungan lain yang dihasilkan dari penelitian tersebut adalah dapat digunakan untuk ukuran sampel yang kecil, non-linear dan pengenalan pola dengan dimensi yang tinggi [3]. MultiClassification SVM sering menghasilkan daerah yang tidak terklasifikasi (unclassifiable), sehingga beberapa penelitian selanjutnya metode-metode yang memodifikasi SVM banyak dikembangkan untuk mengatasinya. Least Squares Support Vector Machines (LS-SVMs) diusulkan oleh Suykens dkk. [4] juga diperkenalkan untuk menghindari masalah biaya komputasi. Fuzzy Support Vector Machine (FSVM) diperkenalkan untuk menghindari daerah unclassifiable diusulkan oleh [5] dan [1]. Pada penelitian ini akan digunakan FSVM sebagai classifier pada citra satelit. FSVM yang diusulkan oleh (Yuyong dkk., 2009) menggunakan model transformasi citra HIS sebagai citra masukan untuk proses klasifikasi. Metode transformasi yang lain adalah model YUV. Model warna YUV dipilih dalam tulisan ini, karena dua alasan. Pertama, komponen chrominance (U dan V) secara tegas dipisahkan dari komponen luminance (Y) yang mengakibatkan kedua komponen tersebut bersifat independen, sehingga komponen luminance dapat diproses tanpa mempengaruhi kontent warna dari suatu citra [6]. Kedua, ruang model YUV tersebut biasanya banyak digunakan dalam gambar dan video [7]. Oleh sebab itu, pada penelitian ini akan diusulkan suatu metode baru untuk melakukan klasifikasi citra satelit menggunakan model YUV dan FSVM. Model YUV digunakan sebagai citra masukan. Sedangkan FSVM diterapkan sebagai classifier untuk menghindari daerah unclassifiable sebagai pengembangan pada metode Support Vector Machine (SVM), dimana metode SVM mengklasifikasikan data secara stright dengan tidak memperhatikan derajat keanggotaan dari suatu data terhadap semua kelas yang didefinisikan. Fokus klasifikasi yang dilakukan pada penelitian ini adalah mengelompokkan objek ke dalam tiga kelas, yaitu lahan pertanian, permukiman, dan perairan.
2
MODEL, ANALISIS, DESAIN, DAN IMPLEMENTASI
2.1 Model Warna YUV Model warna YUV digunakan dalam pola transmisi Televisi berwarna komersial di Eropa, sedangkan model RGB (Red, Green, Blue) dikodekan untuk efisiensi transmisi dan pemeliharaan kompatibilitas sebagai pola monokrom dari Televisi. Model YUV terdiri dari komponen luminance/brightness (Y) dan dua komponen konten warna / chrominance (U dan V). Konversi dari RGB (Red, Green, dan Blue) ke model YUV diberikan oleh [8] sesuai dengan Persamaan (1) berikut: 2
(1)
Keuntungan utama dari model YUV dalam pengolahan citra adalah bahwa tingkat pencahayaan (luminance) dan informasi warna (chrominance) adalah independen. Dengan demikian, komponen luminance dapat diproses tanpa mempengaruhi konten chrominance. Informasi detail pada citra digital berada dalam komponen luminance. Oleh karena itu, dapat diambil keuntungan terhadap tingkat kepekaan yang tinggi dari sistem visualisasi manusia berupa variasi brightness daripada variasi chrominance [8]. 2.2 Support Vector Machine Support Vector Machine (SVM) merupakan sebuah classifier linier dengan feature set yang telah ditentukan sebelumnya. SVM akan mencari sebuah hyperplane linier dengan margin terbesar untuk memisahkan kelas yang ada [9]. Margin terbesar, yang kemudian disebut sebagai Maximum Marginal Hyperplane (MMH) tersebut akan memberikan jarak terbesar antar kelas. Jarak antara hyperplane dengan sebuah sisi dari margin tersebut sama dengan jarak antara hyperplane dengan margin pada sisi lainya. Sebuah fungsi penentu atau decision function d(x,w,b) untuk menentukan MMH dapat dinyatakan dengan Persamaan (2) [10] berikut: ,
(2)
dimana W merupakan vektor bobot, W={w1,w2,….,wn}T, X merupakan feature set, dan b adalah sebuah bilangan skalar yang menyatakan nilai bias. Jarak dari hyperplane ke sebuah titik di salah satu kelas adalah
, dimana ||W|| merupakan
Euclidean norm dari W. Seperti yang telah dijelaskan sebelumnya bahwa jarak hyperplane ke sebuah kelas dan jarak hyperplane ke kelas lainnya memiliki nilai yang sama. Oleh sebab itu margin maximal dirumuskan oleh Persamaan (3) berikut: ,
(3)
dengan nilai M merupakan nilai margin yang harus dimaksimalkan. Untuk mengoptimalkan Persamaan 2 sehingga diperoleh sebuah margin maksimal, maka digunakan optimasi quadratik programing yang dinyatakan pada Persamaan (4) ,
(4)
dengan konstrain yTα = 0, αi ≥ 0, i = 1,….l,
(5) (6)
Ahmad Afif Supianto, Transformasi Model Warna YUV dan Fuzzy Support Vector Machine untuk Klasifikasi Citra Satelit
dimana α = [α1, α2,…., αl]T, H merupakan notasi untuk Hessian matrix dimana Hij = yi yj xiT xj dan f merupakan vektor (l,l) dimana f = [1 1 …. 1]T. Dengan memperhatikan Persamaan (3) diperoleh Persamaan (7) dan (8) untuk mendapatkan nilai w dan b yang optimal. ,
x1 D13(x)=0
Kelas 2 Kelas 3
(7) ,
D12(x)=0
Kelas 1
D23(x)=0
(8)
dimana pada Persamaan (8) hanya digunakan data yang merupakan support vector (α>0) [11]. Klasifikasi secara linier sangat terbatas. Seringkali kelas-kelas tidak memiliki sebuah hyperplane tetapi memiliki pemisah berupa yang non-linier dimana batas pemisah yang sebenarnya adalah garis quadratic [11]. Ide dasar dari non-linear SVM adalah dengan memetakan vektor input ke dalam vektor yang memiliki feature space f berdimensi lebih banyak seperti pada Persamaan (9),
0
x2
Gambar 1. Daerah yang diarsir merupakan daerah yang tidak dapat diklasifikasikan. Dengan menggunakan mij (x), dapat didefinisikan fungsi keanggotaan x terhadap kelas i sesuai Persamaan (13) berikut, , ,
, (9)
sehingga permasalahan non-linear dapat diselesaikan menggunakan klasifikasi linier pada feature space baru. Dengan menggantikan nilai dot pada Hessian matrix, pemetaan pada data ke dimensi yang lebih tinggi tidak perlu dilakukan. Salah satu fungsi pemetaan yang sering digunakan dalam SVM adalah fungsi gaussian RBF seperti pada Persamaan (10), ,
2.3 Fuzzy Support Vector Machine Fuzzy Support Vector Machine (FSVM) merupakan pengembangan SVM untuk permasalahan multiclass. Dengan menggunakan decision function yang diperoleh dari SVM untuk sebuah pasangan kelas, setiap kelas didefinisikan sebuah fungsi keanggotaan polyhedral pyramidal [9]. Jika klasifikasi dilakukan secara berpasang-pasangan decision function untuk kelas i dan kelas j dengan margin maksimal diformulasikan pada Persamaan (11). Akan tetapi jika dilakukan klasifikasi akan terdapat data yang tidak dapat diklasifikasikan seperti yang ditunjukkan pada Gambar 1. (11)
FSVM menggunakan fungsi keanggotaan untuk mengklasfikasikan daerah yang tidak dapat diklasifikasikan oleh decision function. Persamaan (12) menunjukkan fungsi keanggotaan mij, (12)
(13)
Sehingga data x akan diklasifikasikan ke dalam kelas i yang memiliki nilai keanggotaan yang paling tinggi. Setelah setiap data terklasifikasi berdasarkan metode yang diusulkan, selanjutnya dilakukan perhitungan tingkat akurasi yang diperoleh melalui Persamaan (14) berikut,
(10)
fungsi tersebut merupakan fungsi kernel yang diterapkan pada penelitian ini.
,
,
,
(14)
Dimana merupakan jumlah data uji yang terklasifikasi dengan benar, dan merupakan jumlah total data uji.
3
SKENARIO UJI COBA
Pada penelitian ini, kami tentukan 3 kelas seperti yang telah disampaikan sebelumnya, yaitu lahan pertanian, permukiman, dan perairan. Dalam tahap pengujian akan diamati pengaruh dari perbedaan parameter yang digunakan. Pengujian meliputi pengujian pengaruh parameter pada fungsi kernel Gaussian RBF dan pengaruh jumlah data latih. Pengujian tersebut akan diimplementasikan pada fitur yang diusulkan, yaitu model warna YUV. Selain itu, pengujian juga dilakukan pada model warna RGB untuk mengetahui apakah terdapat peningkatan akurasi terhadap transformasi model warna ke dalam model YUV. Dalam pengujian ini akan digunakan total data latih sebanyak 450 data citra, masing-masing kelas terdiri dari 150 data. Setiap data citra berukuran 16x16 piksel. Contoh data latih dapat dilihat pada Gambar 2. Setiap data citra berukuran 16x16 piksel tersebut diambil window 3x3 piksel dan digeser setiap satu piksel horizontal dan vertikal. Setiap 3
window dihitung rata-ratanya untuk setiap channel warna. Window 3x3 piksel tersebut selanjutnya akan digunakan untuk melakukan pengujian terhadap citra uji. Adapun citra uji berukuran 256x256 piksel dapat dilihat pada Gambar 3.
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
4
HASIL UJI COBA
Uji coba dimulai dengan menjalankan uji skenario pertama, yaitu pengaruh parameter terhadap nilai akurasi. Hasil uji coba pada skenario ini ditunjukkan pada Tabel 1. Data pada Tabe1 1 menunjukkan nilai akurasi pada nilai parameter yang berbeda mulai dari 0,1 sampai dengan 1,5 dengan jumlah data latih sebanyak 150 citra, yaitu 50 data untuk setiap kelas. Tabel 1. Nilai Akurasi FSVM untuk model warna YUV dan RGB dengan jumlah data latih sebanyak 150 data citra.
Gambar 2. Contoh data latih. a-e: contoh data latih lahan pertanian, f-j: contoh data latih permukiman, dan k-o: contoh data latih perairan.
Akurasi (%) 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5
Gambar 3. Citra uji berukuran 256x256 piksel. Skenario pertama akan diuji pengaruh parameter terhadap nilai akurasi. Permasalahan klasifikasi citra satelit merupakan permasalahan klasifikasi non-linear, oleh sebab itu digunakan sebuah fungsi kernel yaitu Gaussian RBF. Dalam Gaussian RBF terdapat parameter yang menentukan bagaimana data yang ada dipetakan. Hal ini mengakibatkan bahwa perubahan nilai pada parameter akan mempengaruhi hasil dari klasifikasi itu sendiri. Uji pada skenario pertama menunjukkan bahwa nilai parameter yang berbeda memberikan hasil tingkat akurasi yang berbeda pula. Sehingga pada skenario pengujian selanjutnya digunakan nilai yang memberikan tingkat akurasi tertinggi. Skenario kedua adalah pemberian jumlah data latih terhadap sistem yang telah dibangun. Skenario ini ditujukan untuk mengetahui pengaruh jumlah data latih terhadap tingkat akurasi. Pengujian dilakukan untuk data latih dengan jumlah mulai dari 150 sampai dengan 450 data citra dengan nilai parameter tertinggi. 4
YUV-FSVM 56,71 63,64 68,73 69,49 69,72 70,19 70,42 70,19 70,01 69,61 69,27 68,72 68,48 68,10 67,82
RGB-FSVM 54,77 61,05 67,14 68,86 69,27 69,44 69,48 69,15 68,82 68,57 68,43 68,14 67,85 67,56 67,40
Pada Table 1 dapat terlihat bahwa akurasi tertinggi diperoleh ketika nilai =0,7 baik untuk model warna YUV maupun RGB. Tingkat akurasi untuk model warna YUV dan RGB masing-masing mencapai 70.42% dan 69.48%. Dari semua nilai uji parameter , penerapan model warna YUV menghasilkan nilai akurasi lebih besar dibandingkan dengan model warna RGB. Hal ini menunjukkan bahwa metode yang diusulkan memberikan dampak peningkatan terhadap nilai akurasi. Secara grafis dampak peningkatan tersebut dapat dilihat pada Gambar 4. Gambar 5 dan Gambar 6 masing-masing merupakan hasil klasifikasi untuk metode YUVFSVM dan RGB-FSVM dengan jumlah data latih sebesar 150 dan parameter =0,7. Selanjutnya, pengujian dilakukan untuk mengetahui pengaruh besarnya jumlah data latih yang digunakan terhadap akurasi yang dihasilkan. Tingkat akurasi untuk masing-masing jumlah data latih dapat dilihat pada Tabel 2. Dari tabel tersebut dapat dilihat bahwa nilai akurasi tertinggi diperoleh ketika jumlah data latih sebanyak 450 data. Untuk model warna YUV nilai akurasi mencapai 74,20%, sedangkan untuk model warna RGB mendapatkan nilai akurasi sebesar 73,72%.
Ahmad Afif Supianto, Transformasi Model Warna YUV dan Fuzzy Support Vector Machine untuk Klasifikasi Citra Satelit
pada jumlah 450 data, peningkatan akurasi sudah tidak signifikan lagi, sehingga pada penelitian ini total jumlah data latih yang digunakan adalah 450 data citra. Tabel 2. Nilai Akurasi FSVM untuk model warna YUV dan RGB dengan parameter = 0,7. Jumlah Data Latih 150 225 300 375 450 Rata-rata Gambar 4. Grafik tingkat akurasi dengan perubahan parameter .
Akurasi (%) YUV-FSVM 70,42 72,47 73,13 73,91 74,20 72,83
RGB-FSVM 69,48 72,07 72,68 73,51 73,52 72,25
Hasil klasifikasi untuk metode YUV-FSVM dengan jumlah data latih 450 dan parameter =0,7 ditunjukkan pada Gambar 7. Sedangkan Gambar 8 menunjukkan hasil klasifikasi untuk metode RGBFSVM yang diperoleh dengan jumlah data latih sebesar 450 dan parameter =0,7.
Gambar 5. Hasil klasifikasi metode YUV-FSVM dengan data latih 150 citra dan parameter = 0,7. Gambar 7. Hasil klasifikasi metode YUV-FSVM dengan data latih 450 citra dan parameter = 0,7.
5
Gambar 6. Hasil klasifikasi metode RGB-FSVM dengan data latih 150 citra dan parameter = 0,7. Secara umum, penambahan jumlah data latih yang digunakan akan mengakibatkan meningkatnya nilai akurasi yang dihasilkan. Dengan mengamati pada Tabel 2, bahwa penambahan jumlah data sampai
KESIMPULAN
Hasil uji coba yang telah dilakukan menunjukkan bahwa parameter pada fungsi kernel Gaussian RBF memberikan pengaruh terhadap tingkat akurasi. Akurasi tertinggi diperoleh ketika parameter tersebut bernilai 0,7. Disamping itu, secara umum meningkatnya jumlah data latih yang digunakan selama proses pelatihan terhadap metode yang diimplementasikan, akan memberikan dampak terhadap meningkatnya nilai akurasi yang dihasilkan. Rata-rata akurasi metode yang diusulkan, yaitu YUV-FSVM mencapai 72,83%, sedangkan metode RGB-FSVM mencapai 72,25%. Dari perolehan akurasi tersebut dapat disimpulkan bahwa metode yang diusulkan memiliki rata-rata tingkat 5
akurasi lebih tinggi daripada metode RGB-FSVM. Sehingga implementasi transformasi model warna YUV dan FSVM yang diusulkan mampu meningkatkan nilai akurasi.
[3] [4]
[5]
[6]
[7]
Gambar 8. Hasil klasifikasi metode RGB-FSVM dengan data latih 450 citra dan parameter = 0,7.
6
DAFTAR PUSTAKA
[1] Yuyong, C. dan Zhiyuan, Z. 2009. “Remote Sensing Image Classification Based on the HSI Transformation and Fuzzy Support Vector Machine”. IEEE International Conference on Future Computer and Communication. 632635. [2] Camps-Valls, G. Gomez-Chova, L. dan CalpeMaravilla J. 2004. ”Kernel methods for HyMap imagery knowledge discovery”. Image and
6
[8] [9]
[10]
[11]
Signal Processing for Remote Sensing, Bellingham, WA, 5238:234-243. Vapnik, V. 1998. Statistical Learning Theory, New York John Wiley & Sons. Suykens, J.A.K dan Vandewalle, J. 2003. “Least Squares Support Vector Machine Classifiers”. Neural Processing Letters, 9:293-300. Wei, Wu. dan Guanglai, Gao. 2008. “An application of neuro-fuzzy system in remote sensing image classification”. IEEE International Conference on Computer Science and Software Engineering. 10691072. Rubert, C. Fonseca, L. dan Velho, L. 2005. “Learning Based Super-Resolution Using YUV Model for Remote Sensing Images”. Proceedings of WTDCGPI. Jianping, F. dan Yau, D. K. Y. 2001. “Automatic Image Segmentation by Integrating Color-Edge Extraction and Seeded Region Growing”. IEEE Transactions On Image Processing. 10:1454-1466. Gonzalez, R. C. dan E. Woods R. 2002. Digital Image Processing. Prentice Hall, 2nd Edition. Abe, Shingo dan Takuya Inoue. 2002. “Fuzzy Support Vector Machine for Multiclass Problems”. European Symposium on Artificial Neural Networks, Bruges, Belgia. Han, J. dan Kamber M. 2006. Data Mining:Concepts and Technigues. Morgan Kaufmann Publishers, San Fransisco. Wang, Lipo (Ed.). 2005. Support Vector Machines: Theory and Applications. Springer, New York.