KLASIFIKASI CITRA GIGI BERBASIS TEKSTUR DENGAN FILTER GABOR L. Roidel Simarmata1, Agus Zainal Arifin2, Anny Yuniarty3 Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember (ITS), Surabaya, Indonesia
[email protected] ,
[email protected] ,
[email protected]
Abstrak
Penelitian dan pengembangan aplikasi dengan berbagai metode dalam medical imaging telah berkembang sangat luas. Salah satu penelitian dalam medical imaging adalah segmentasi dan klasifikasi pada citra gigi. Dalam penelitian ini dikembangkan segmentasi gigi dengan memanfaatkan informasi tekstur pada citra dan klasifikasi region hasil segmentasi. Tahap segmentasi mencakup preprosessing, ekstraksi fitur citra dengan metode filter Gabor dan clustering dengan metode fuzzy cmeans (FCM) clustering sedangkan tahap klasifikasi meliputi ekstraksi fitur region dan klasifikasi region dengan metode k-nearest neighbour (k-NN). Hasil ujicoba menunjukkan bahwa algoritma yang digunakan mampu melakukan segmentasi terhadap citra gigi dengan baik dan hasil klasifikasi region menunjukkan tingkat keberhasilan 88.3%. Kata kunci: Filter Gabor, ekstraksi fitur, FCM clustering, deskripsi region, klasifikasi region, kNN classifier 1. Pendahuluan Penelitian dan pengembangan aplikasi dengan berbagai metode dalam medical imaging telah berkembang sangat luas. Salah satu penelitian dalam medical imaging adalah segmentasi dan klasifikasi pada citra gigi. Pada gigi dapat dianalisa bagian tertentu untuk mendapatkan data penting. Data tersebut kemudian diolah untuk mendapatkan informasi penting, misalnya informasi tentang kepadatan tulang, usia, dan lain sebagainya. Dari analisa citra gigi juga dapat dilakukan pengenalan individu. Penyakit osteoporosis atau pengeroposan tulang dalam dunia medis dikenal dengan silent epidemic (wabah terselubung) karena proses pengeroposan tulang ini berlangsung selama bertahun-tahun tanpa menunjukan suatu gejala. Pengeroposan tulang ini ditandai dengan berkurangnya kepadatan mineral tulang atau bone mineral density (BMD). Hasil scanning BMD pada tulang belakang dan paha bisa digunakan untuk mengetahui tingkat resiko terjadinya patah tulang. Metode lain dalam penelitian tentang kekeroposan tulang adalah melalui rahang gigi. Penelitian lain tentang gigi adalah dalam bidang forensic odontology yang fokus dalam identifikasi manusia berdasarkan fitur-fitur gigi. Identifikasi yang biasanya dilakukan bagi korban
kecelakaan biasanya dilakukan melalui gigi, karena beberapa bagian tubuh lain yang diperlukan untuk identifikasi bisa saja tidak utuh lagi sedangkan gigi merupakan bagian tubuh yang paling keras sehingga masih dapat digunakan untuk keperluan identifikasi. Untuk berbagai keperluan diatas maka dokter melakukan analisa terhadap bagian gigi. Akan tetapi terkadang dokter tidak konsisten dalam melakukan pembagian region gigi baik itu antar dokter maupun pada dokter yang sama. Oleh sebab itu diperlukan suatu alat bantu yang berbasis komputer untuk membantu proses analisa gigi dengan cara mengklasifikasikannya dengan tepat dan konsisten. Dalam tugas akhir ini, digunakan pendekatan segmentasi citra berdasarkan informasi tekstur citra gigi. Ekstraksi fitur tekstur untuk segmentasi dilakukan dengan metode signal prosessing menggunakan filter gabor. Kemudian region hasil segmentasi diklasifikasikan untuk memberi label pada region tersebut berdasarkan kelas yang relevan 2. Metode Perangkat lunak ini akan dimulai dengan segmetasi citra dan selanjutnya dilakukan klasifikasi region hasil segmentasi sesuai dengan kelas yang relevan. Diagaram alir proses segmentasi dan klasifiksi dapat dilihat pada gambar 3.6 [4]..
Gambar 3.6 Diagram alir proses segmentasi dan klasifikasi Segmentasi meliputi preprocessing citra, ekstraksi fitur citra dan clustering fitur. Preprocessing citra merupakan proses perbaikan citra untuk digunakan dalam segmentasi. Perbaikan citra dilakukan dengan menghilangkan noise dan peningkatan kontras citra. Selanjutnya dilakukan ekstraksi fitur tekstur citra dengan filter Gabor. Fitur tekstur tersebut akan diseleksi dan hasil seleksi dibentuk dalam fitur vektor tekstur untuk digunakan dalam clustering. Proses clustering akan dilakukan dengan menggunakan Fuzzy C Means (FCM) clustering. Hasil akhir proses clustering adalah matriks yang memuat kelas-kelas hasil clustering. Hasil akhir proses clustering tersebut merupakan hasil akhir segmentasi. Setelah citra terbagi menjadi beberapa segmen atau region maka dilakukan ekstraksi fitur setiap region. Fitur yang diekstraksi dari setiap region adalah mean dan varian region. Fitur hasil ekstaksi region akan dibentuk dalam fitur vektor region. Fitur vektor region tersebut akan digunakan untuk klasifikasi. Selanjutnya dilakukan proses klasifikasi, proses klasifikasi dilakukan dengan kNearest Neighbor (kNN) Classifier. Masing-masing fitur mean dan varian pada fitur vektor region akan diklasifikasikan sesuai dengan kelas yang relevan 2.1 Gabor Filter Filter Gabor dikembangkan untuk menyimulasikan kemampuan visual manusia dalam mengamati tekstur benda. Gabor filter diperoleh dengan memodulasi gelombang sinus dengan fungsi Gaussian pada frekuensi dan orientasi tertentu. Terdapat empat group algoritma yang biasa digunakan untuk ekstraksi fitur dalam image processing, yaitu algoritma statistik, geometrik, model based, dan metode signal processing [6]. Dalam tugas akhir ini akan digunakan ekstraksi fitur dengan metode signal processing dengan menggunakan filter Gabor. (1)
Dengan
u 0 adalah fungsi sinusoidal, x dan y
adalah space ruang fungsi sinusoidal pada koordinat x dan y. Citra input akan memberikan respon citra terhadap masing-masing filter Gabor. Masing-masing respon citra tersebut digunakan sebagai fitur citra. Proses pembentukan fitur citra dengan konsep filter Gabor dapat dilihat pada Gambar 2.1.
Gambar 2.1. proses pembentukan fitur citra 2.2 Seleksi Fitur Seleksi fitur dilakukan untuk memilih fitur-fitur terbaik, yakni fitur-fitur yang mampu memberikan kotribusi besar dalam mendeskripsikan citra asli. Misalkan s ( x, y ) adalah hasil kombinasi seluruh fitur
ekstraksi dan s ( x, y ) adalah subset kombinasi fitur yang ingin dicapai, maka fraksi variasi intensitas s ( x, y ) terhadap s ( x, y ) dapat diukur dengan coefficient of determination (COD) [3] sebagai berikut:
R2 1 dimana
(10)
=
s ( x, y ) s( x, y )
2
x, y
x , y s( x, y )
2
Proses seleksi fitur citra dapat dilihat pada Gambar 2.2.
tiap cluster. Dengan cara memperbaiki pusat cluster (11) keanggotaan tiap-tiap data secara dan nilai berulang, maka dapat dilihat bahwa pusat cluster akan menujui lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi obyektif FCM bertujuan untuk meminimalkan fungsi obyektif pada persamaan (14) n
c
m
J m (U ,V , X ) ( jk ) E j ( xk ) (14) k 1 j 1
dengan m = derajat fuzzy (bilangan real lebih besar dari 1) jk = derajat keanggotaan xj pada cluster k U = matriks partisi fuzzy dengan dimensi n x m V = matriks pusat cluster dengan ukuran c x n X = matriks data yang akan dicluster
E j ( xk ) = Euclidean distance anggota xk dengan pusat cluster. Euclidean distance merupakan jarak Euclidean anggota x dengan pusat cluster v, didefinisikan sebagai berikut: Gambar 2.2. Proses seleksi fitur Citra
E j ( xk ) = x k v j
Berikut adalah algoritma untuk melakukan seleksi ekstraksi fitur citra:
Semakin kecil nilai
1. 2. 3. 4. 5.
2
Hitung nilai R untuk masing-masing kombinasi fitur ekstraksi dan urutkan nilai R2 tersebut secara descending. Fitur dengan R2 tertinggi disimpan pada subset fitur. Hitung kembali nilai R2 dengan dengan mengkombinasikan fitur yang memiliki nilai tertinggi berikutnya. Selama R2 0.95 tambahkan fitur selanjutnya kedalam subset kombinasi fitur sebelumnya dan hitung kembali nilai R2 . Ulangi langkah 4 sampai R2 0.95.
E j ( xk ) maka semakin mirip
xk pada pusat cluster ke vj. Sehingga element xk semakin cocok menjadi anggota cluster j, yang berarti semakin besar nilai U. Berikut algoritma FCM adalah sebagai berikut: 1.
Tentukan a) Jumlah cluster yang akan dibentuk ( C 2 ). b) Maksimum iterasi. c) Kriteria penghentian ( = nilai positif yang sangat kecil).
2.
Bentuk matriks partisi awal, matriks partisi awal biasanya dibuat acak
Subset Fitur hasil seleksi merupakan kombinasi fitur terbaik yang hampir sama dengan citra aslinya. Kondisi R2 0.95 dipilih sebagai asumsi bahwa kombinasi fitur yang dipilih harus memiliki variasi intensitas minimal 95% dari citra asli. 2.3 Fuzzy C-Means Clustering FCM menggunakan model pengelompokan fuzzy sehingga data dapat menjadi anggota dari semua kelas atau cluster yang terbentuk dengan derajat atau tingkat keanggotaan yang berbeda antara 0 hingga 1. Tingkat keberadaan data dalam suatu kelas atau cluster ditentukan oleh derajat keanggotaannya. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981 [1]. Konsep dasar FCM, pertama kali adalah menentukan pusat cluster yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiaptiap data memiliki derajat keanggotaan untuk tiap-
2
. 3.
Hitung pusat cluster w
n
Vij
( k 1
n
) .x kj
( ik ) w k 1
4.
ik
(16)
. Update derajat keanggotaan setiap data pada setiap cluster
c E ik ik j 1 E jk 5.
2 /( w1)
1
.
Jika nilai U berhenti, jika tidak kembali ke langkah 3
dimana
U = U t U t 1
2.4 Deskripsi Region Dalam melakukan klasifikasi terhadap region, hal penting yang perlu diperhatikan adalah deskripsi suatu region. Dalam mendeskripsikan region digunakan fitur mean dan variance sebagai identitas suatu region. 2.5 kNN Classifier Algoritma kNN berusaha mengklasifikasikan data baru yang belum diketahui kelasnya dengan memilih data sejumlah k dari data pelatihan yang letaknya terdekat dari data baru tersebut. Kelas terbanyak dari data terdekat sejumlah k tersebut dipilih sebagai kelas yang diprediksikan untuk data yang baru. Berikut ini adalah algoritma KNN : 1.
2. 3. 4.
Menghitung nilai kemiripan (similarity). Metode perhitungan yang yang sering digunakan adalah : a. Euclidean distance, b. Manhatten Distande Mengurutkan hasil dari perhitungan nilai kemiripan/ketidakmiripan secara terurut menurun Menentukan nilai K dan mengambil Kjumlah tetangga dari hasil langkah 2 Menentukan kelas dari data uji berdasarkan kelas yang paling banyak muncul dari hasil langkah 3
3. Materials Citra input yang digunakan adalah citra grayscale hasil cropping citra panoramic gigi dengan ukuran 128 x 128 piksel dengan tipe jpeg. Terdapat 30 buah citra yang digunakan sebagai training dan 30 buah citra digunakan sebagai testing. Data training digunakan sebagai data pelatihan untuk melakukan klasifikasi terhadap data testing. 4. Hasil Uji Coba Uji coba ini meliputi uji coba untuk menentukan jumlah cluster terbaik, menentukan jumlah tetangga terdekat terbaik dan uji coba untuk melihat performa klasifikasi.
region yang paling minimal. Kesalahan segmentasi yang mungkin terjadi adalah adanya region yang tidak tersegmentasi dengan baik, misalnya region (17)menyatu dengan region akar gigi, region gusi yang gigi yang menyatu dengan region ruang antar gigi dan lain sebagainya. Tabel 1. Hasil uji coba penentuan jumlah cluster Jumlah Kesalahan Segmentasi
Citra
c = 10
c = 15
c = 20
A
4
1
3
B
2
1
1
C
1
1
1
D
1
0
0
E
0
0
1
F
2
1
1
Dari hasil uji coba tersebut dapat dilihat bahwa jumlah cluster terbaik adalah saat c = 15 karena saat nilai c tersebut kesalahan segmentasi yang terjadi sangat minimal. 4.2 Evaluasi uji coba jumlah tetangga terdekat Uji coba ini dilakukan dengan melakukan uji coba terhadap nilai k yang berbeda untuk setiap percobaan dan metode pengukuran jarak yang digunakan. Nilai k merupakan parameter jumlah ketetanggaan terdekat yang digunakan dalam proses klasifikasi. Nilai paremeter yang diuji cobakan antara lain k = {2,3,4,5,6,7,8,9,10} dan untuk metode pengukuran jarak yang diujicobakan adalah metode euclidean distance dan cosine. Kedua metode pengukuran jarak tersebut sangat umum digunakan dalam penghitungan jarak antar piksel. Hasil uji coba ini dapat dilihat pada Tabel 2. Tabel 2. Hasil uji coba penentuan jumlah cluster Nomor Uji Coba
K
1
2
2
3
3
4
4 5 6
4.1 Evaluasi uji coba jumlah cluster
7
Ukuran penentuan jumlah kelas terbaik adalah dengan melihat hasil segmentasi dari setiap percobaan nilai c. Hasil segmentasi terbaik adalah hasil segmentasi dengan kesalahan segmentasi
8
5 6 7 8 9 10
Region Data Uji
Diklasifikasikan Benar Metode Euclidean
Metode Manhatten
450
409
409
450 450
342
350
327
319
317
315
314
317
301
291
291
288
290
283
282
271
450 450 450 450 450 450
Hasil klasifikasi yang paling baik saat nilai k = 2 dan metode pengukuran jarak yang digunakan adalah Euclidean distance, karena pada metode tersebut jumlah region yang diklasifikasikan paling maksimal yakni 2873 region, sedangkan dengan metode Manhatten total yang diklasifikasikan benar adalah 2843 region. 4.3 Evaluasi performa klasifikasi Skenario ini dilakukan untuk melihat bagaimana performa klasifikasi dalam mengklasifikasikan setiap region pada kelas yang relevan. Pada skenario ini akan digunakan hasil parameter terbaik pada skenario pertama dan skenario kedua. Pada skenario ketiga ini digunakan 30 buah citra uji coba dan 30 buah citra training. Hasil uji coba ini dapat dilihat pada Tabel 3. Tabel 3. Hasil uji coba penentuan jumlah cluster Kelas Aktu al 1 2 3 4 5 6
Kelas Prediksi 1
2
3
4
5
6
88.9
6.31
0.526
1.57
2.105
0.526
2.56
96.15
1.28
-
-
-
66.6
33.33
1.075
-
93.54 1.369
84.9
3.22
2.15
5.47
8.219
-
-
1.4 -
-
-
100
Dari tabel 5.6 dapat dilihat bahwa rata-rata keakuratan klasifikasi untuk semua kelas adalah 88.3%. Prediksi kelas terbaik ditunjukkan pada kelas tambalan gigi, gusi, selanjutnya disusul kelas background, kelas gigi dan kelas akar gigi. Sedangkan kelas ruang masih memberikan hasil yang kurang maksimal (masih dibawah rata-rata akurasi klasifikasi). Hal ini disebabkan pada kelas ruang, masih banyak hasil segmentasi yang seharusnya termasuk kelas ruang, namun tergabung dalam region background. 5. Kesimpulan Dari hasil uji coba dan pembahasan dari tugas akhir, penulis menarik beberapa kesimpulan berikut: a)
Hasil segmentasi citra gigi dengan berbasis tekstur sudah sangat baik untuk membagi gigi kedalam enam region, meskipun masih ada region pada suatu region yang seharusnya disegmentasi sebagai kelas lain b) Ukuran nilai ketetanggaan terdekat (k) yang digunakan sangat mempengaruhi hasil klasifikasi, namun nilai k tidak berbanding lurus atau juga tidak berbanding terbalik dengan hasil klasifikasi c) Hasil klasifikasi dengan akurasi rata-rata 92% sudah cukup baik, sehingga segmentasi
berbasis tekstur dengan filter Gabor pada gigi sudah sangat baik digunakan
Daftar Pustaka [1] BezdekJ, Keller J, Krishnapuram R, Pal NR. Fuzzy models and algorithms for pattern recognition and image processing. Boston: Kluwer Academy Publishers; 1999. [2] Farrokhnia F, Jain A K. A multi channel filtering approach to texture segmentation. In: Proceedings CVPR‘91, IEEE conference on computervision and pattern recognition. 1991. p. 364–70. [3] Farrokhnia F, Jain A K. A multi channel filtering approach to texture segmentation. In: Computer Visionand Pattern Recognition, Proceedings CVPR‘91, IEEE Computer Society Conference. 1991. p. 364–70. [4] Kakar m, Dougsnal DR. Automatic segmentation and recognition of lungs and lesion (2009).