Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
Deteksi Glaukoma pada Citra Fundus Retina dengan Metode K-Nearest Neighbor Dian Saktian Tobias1, Anastasia Rita Widiarti2 1,2
Program Studi Teknik Informatika, Fakultas Sains Dan Teknologi, Universitas Sanata Dharma Email:
[email protected],
[email protected]
Abstrak Glaukoma adalah penyakit mata yang diakibatkan tekanan mata tidak normal. Salah satu penyebab tidak normalnya tekanan pada mata adalah tersumbatnya aliran cairan. Glaukoma dapat diidentifikasi dengan meneliti area optik disk dari citra fundus retina. Data citra diperoleh dari sumber internet High-Resolution Fundus (HRF) Image Database. Data diperoleh sebanyak 30 citra, terdiri dari 15 citra terjangkit glaukoma dan 15 citra normal. Penelitian akan terbagi kedalam tiga proses yaitu preproccessing, ekstraksi ciri, dan indentifikasi. Preprocesing yang digunakan yaitu segmentasi manual, grayscaling, dan resize. Untuk ekstraksi ciri menggunakan metode Gray Level Co-occurrence Matrikz (GLCM). Dengan metode GLCM, akan didapatkan matriks kookurensi. Matriks kookurensi ini kemudian dicari fiturnya yaitu kontras, korelasi, homogenitas, dan energi. Untuk identifikasinya menggunakan metode KNearest Neighbor. Penelitian ini akan membagi data menjadi dua bagian yaitu dataset dan data uji. Dataset sebanyak 18 citra dan data uji 12 citra. Perhitungan akurasi menggunakan metode 3 fold cross Validation. Hasil akurasi tertinggi yang didaptkan adalah 50%. Sedangkan untuk hasil pengujian identifikasi sebesar 83%. Kata Kunci: Glaukoma, K-nearest neighbor, GLCM, pengenalan pola Abstract Glaucoma is an eye disease which caused by abnormal eye's pressure. One of the cause is the tears stopped. Glaucoma can be identified by observing at the optic area of fundus retina. This study will be using the images of fundus retina which were obtained from High-Resolution Fundus (HRF) Database on the internet. The database contains 30 images in total, 15 of them were infected by Glaucoma, and the other 15 were normal. This study will be divided into 3 main processes: preprocessing, feature extraction, and identification. Manual segmentation, grayscaling, and resizing will be used at the preprocessing step. The Gray Level Co-occurrence Matrix (GLCM) will be used as its feature extraction to get Co-occurrence Matrix. The end result from this matrix are contrast, correlation, homogeneity and energy value. Whereas to identify used K-Nearest Neighbor method. This research was divided in two parts; those were dataset and test data. For the dataset had 18 images and the test data had 12 images. The accurate calculation used 3 fold cross Validatio. The high result of accuracy was 50%. Whereas the result of test identification was 83%. Keyword: Glaucoma, K-nearest neighbor, GLCM, pattern recognition.
1.
PENDAHULUAN
Mata merupakan salah satu organ tubuh manusia yang paling penting. Selain sebagai organ tubuh, mata juga berperan sebagai alat indera penglihatan. Sebagai salah satu bagian dari organ tubuh tentunya mata tidak lepas dari serangan penyakit, entah itu serangan dari dalam maupun dari luar mata. Yang paling sering menyerang mata adalah iritasi akibat masuknya benda-benda kecil seperti debu ataupun serangga dengan ukuran sangat kecil masuk ke dalam mata. Selain iritasi, ada juga penyakit lain seperti katarak, bintitan, miopi, buta warna, kerabunan, glaukoma, dan masih banyak lagi. Glaukoma adalah penyakit mata yang ditandai oleh tekanan bola mata yang meningkat, ekskavasi dan atrofi papil saraf optik, serta kerusakan lapang pandang yang khas [1]. Glaukoma berasal dari kata Yunani glaukos yang berarti hijau kebiruan, yang memberikan kesan warna tersebut pada pupil penderita glaukoma [2]. Kelainan mata glaukoma ditandai dengan meningkatnya tekanan bola mata, atrofi pupil saraf optik, dan menciutnya lapang pandang. Penyakit yang ditandai dengan peninggian tekanan intraokular ini disebabkan: 1) Bertambahnya produksi cairan mata oleh badan siliar 2) Berkurangnya pengeluaran cairan mata di daerah sudut bilik mata atau di celah pupil. Pada glaukoma akan terdapat melemahnya fungsi mata dengan terjadinya cacat lapang pandang dan kerusakan anatomi berupa ekskavasi (penggaungan) serta degenerasi papil saraf optik, yang dapat berakhir dengan kebutaan. Sebenarnya glaukoma bukan penyakit yang baru-baru ini muncul. Glaukoma telah dikenal sejak lama, akan tetapi belum banyak masyarat mengetahui tentang bahanya penyakit ini.
92
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
Jika terlambat atau tidak ditangani dengan dengan benar, glaukoma dapat menyebabkan kebutaan permanen. Yang membuat kurangnya kesadaran akan bahaya glaukoma dikarenakan gejala dari penyakit ini yang kurang bisa dirasakan secara langsung oleh sang penderita glaukoma itu sendiri. Deteksi glaukoma dapat dilakukan dengan beragam cara, salah satunya adalah dengan melihat ukuran optik disk pada foto fundus digital. Namun hasil identifikasi foto fundus secara manual dapat menghasilkan diagnosis yang kurang tepat. Maka yang akan dilakukan adalah proses simulasi dan analisis suatu sistem yang dapat membantu dokter mendeteksi ukuran optik disk pada foto fundus sehingga dapat mendiagnosis dengan cepat dan akurat. Metode yang digunakan antara lain filtering, template matching, tresholding, serta dilasi dan erosi [3]. 2.
METODE
2.1. Gray Level Co-occurrence Matrix Gray Level Co-occurrence Matrix(GLCM) adalah matriks yang merepresentasekan banyaknya suatu pixel i dan pixel tetangga j yang berada pada sebuah citra. Matriks kookurensi merupakan matriks berukuran L x L (L menyatakan banyaknya tingkat keabuan) dengan elemen P( ) yang merupakan distribusi probabilitas bersama (join probability distribution) dari pasangan titik-titik dengan tingkat keabuan x1 yang berlokasi pada koordinat (j,k) dengan x2 yang berlokasi pada koordinat (m,n). Koordinat pasangan titik-titik tersebut berjarak dengan sudut arah θ [4]. Pada Gambar 1 diperlihatkan bahwa menentukan tenaga untuk membentuk sebuah hubungan antar pixel berdasarkan aturan P(i,j; 1,0o). Karena jarak spasial 1 dan sudut arah 0o, maka pixel j atau pixel tetangga dari pixel i berada di kanan dengan jarak 1 pixel. Contoh, jika i(1,1) maka j(1,2).
Gambar 1. Ilustrasi penetuan arah menunjuk pixel tetangga Gambar 2 menjelaskan bagaimana cara membentuk matriks kookurensi (kanan) dari citra asli (kiri). Nilai tiap cell didapatkan dari jumlah hubungan antar pixel pada citra asli yang memenuhi syarat P(i,j;1,0o) di mana jarak antara suatu pixel dengan pixel tetangga sama dengan 1 dengan arah sudut 0o. Seperti pada Gambar 2 yang ditunjukkan dengan lingkaran di mana nilai i=0 dan j=0, d=1 dan θ=0o hanya ada 1 yang memenuhi. Sedangkan untuk yang nilai i=100 dan j=0, d=1 dan θ=0o ada 6 hubungan pixel yang memenuhi. Cara yang sama dilakukan untuk mengisi matriks GLCM lainya hingga semua nilai matriks GLCM didapatkan.
Gambar 2. Proses membentuk matriks GLCM Dari matriks GLCM yang telah didapatkan, kemudian dicari fitur yang bisa didapatkan dari matriks tersebut. Ada 14 fitur yang bisa didapatkan dari matriks GLCM [5]. Pada fungsi matlab hanya ada 4 fitur
93
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
saja yang bisa didapatkan, seperti yang dijelaskan dalam web mathworks.com, fitur tersebut antara lain contrast, correlation, energy, dan homogeinity. a.
b.
Kontras ∑ | | ( ) i = indeks baris dari matriks P(i,j) j = indeks kolom dari matriks P(i,j) Korelasi ( ∑
)(
) (
(1)
)
(2)
= rata-rata elemen baris pada matriks P(i,j) = rata-rata elemen kolom pada matriks P(i,j) = nilai standar deviasi elemen baris pada matriks P(i,j) = nilai standar deviasi elemen baris pada matriks P(i,j) c.
Energi ∑
d.
(
)
(3)
Homogenitas ∑
( |
)
(4)
|
2.2. K-Nearest Neighbor K-Nearest Neighbour adalah suatu teknik untuk melakukan klasifikasi non parametic. Mirip dengan teknik klastering, pengelompokan suatu data baru berdasarkan jarak data baru itu ke beberapa data tetangga terdekat yang ditentukan oleh user dan yang dinyatakan dengan k [6]. Gambar 3 dibawah menunjukkan jumlah tetangga yang paling dekat yang dapat dimuat dalam rentang nilai k yang telah ditentukan. Gambar 3(a) menunjukan 1 tetangga terdekat, Gambar 3.(b) 3 tetangga terdekat, Gambar 3.(c) 5 tetangga terdekat, dan Gambar 3.(d) 7 tetangga terdekat. Dalam peneilitian ini, untuk menetukan jarak tetangga terdekat digunakan rumus euclidean distance.
Gambar 3. K-NN dengan nilai K tetangga; (a)1-NN; (b)3-NN; (c)5-NN; (d)7-NN Nilai K yang terlalu kecil maka berakibat hasil prediksi yang didapat bisa sensitif terhadap keberadaan noise. Di sisi lain, jika K terlalu besar maka tetangga terdekat yang terpilih mungkin sebenarnya tidak relevan karena jarak yang terlalu jauh [7]. 2.3. Data Jumlah data yang digunakan dalam penelitian sebanyak 30 citra, masing-masing 15 data untuk citra fundus retina sehat dan 15 data untuk citra fundus retina glaukoma. Data dikumpulkan dari sumber
94
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
internet High-Resolution Fundus (HRF) Image Database. Gambar 4 adalah contoh citra dari fundus retina yang belum mengalami tahapan preprocessing, Dimensi data adalah 3504 x 2336[8].
Gambar 4. Citra fundus retina 2.4. Gambaran Umum Sistem Gambar 5 memperlihatkan alur pemrosesan dari citra yang menjadi masukan dalam sistem yang akan dibangun hingga mendapatkan output. Output dari sistem berupa hasil kesimpulan suatu citra terdeteksi glukoma atau tidak. Di dalam sistem metode identifikasi yang digunakan adalah metode KNN.
Gambar 5. Alur identifikasi
2.5. Proses Penelitian Dalam pengenalan pola ada tiga tahap atau proses utama yang dikerjakan. Ketiga proses tersebut adalah preprocessing, ekstraksi ciri, dan identifikasi. Ketiga proses utama tersebut akan dibahas pada sub bab ini. a) Preprocessing Preprocessing yang akan diterapkan pada citra adalah grayscale dan resize. Namun sebelum melakukan kedua proses tersebut, citra akan di crop secara manual untuk mendapatkan optik disk dari citra fundus retina. Gambar 6 adalah proses untuk mendapatkan daerah optik disk dari citra fundus retina dengan cara crop manual pada citra asli. Aplikasi yang digunakan untuk crop adalah Paint pada Windows 7.
Gambar 6. Crop manual citra retina untuk mendapatkan daerah optik disk Dari Gambar 7 memperlihatkan alur citra berwarna, menjadi citra keabuan, dan citra keabuan yang mengalami resize. Untuk tahap grayscaling dan resize sendiri menggunakan fungsi matlab im2bw untuk grayscaling dan resize untuk resize. Resize digunakan agar setiap citra memiliki dimensi yang sama yaitu 100 x 100. Ukuran resize dapat disesuaikan pada saat identifikasi dan hitung akurasi dataset.
Gambar 7. Tahapan preprocessing dari; (a)crop manual; (b)konversi menjadi citra grayscale; (c) dan resize citra
95
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
b) Ekstraksi Ciri GLCM Gambar 8 (a) menunjukan alur dari citra hasil preprocessing digunakan sebagai masukan dalam proses pembuatan matrik kookurensi. Hasil dari preprocessing berupa matriks. Hitung jumlah tingkat keabuan yang ada pada citra hasil preprocessing untuk menentukan ukuran matrik GLCM. Kemudian tentukan besar jarak spasial d dan arah θ untuk mendapatkan nilai dari hubungn antar pixel. Setelah mendapatkan matrik GLCM, hitunglah ciri statistiknya seperti kontras, korelasi, energi, dan homogenitas. Untuk menghitung data statistik dapat dilihat pada rumus kontras 1, korelasi 2, energi 3, dan homogenitas 4. Ciri statistik inilah yang akan digunakan untuk identifikasi. c) Identifikasi K-Nearest Neighbor Setelah mendapatkan ciri statistik dari citra, kemudian ciri akan digunakan untuk tahap identifikasi. Untuk mengukur jarak dalam identifikasi ini menggunakan rumus 2.5 euclidean distance. Dalam proses ini perlu digunakan data training sebagai pembanding. Data training inilah yang akan menjadi acuan citra fundus retina termasuk ke dalam kelas glaucoma atau kelas normal. Hasil perbandingan didapatkan dari jumlah kelas terdekat yang paling banyak dalam jangkauan nilai k. Gambar 8 (b) menunjukkan diagram alur penggunaaan metode KNN untuk identifikasi.
Gambar 8. (a) Diagram blok alur pembentukan GLCM (b) diagram blokalur identifikasi citra fundus retina dengan KNN 3.
HASIL DAN PEMBAHASAN
3.1 Menghitung Akurasi dengan 3 Fold Cross Validation Untuk pengujian akurasi menggunakan data sebanyak 18 citra sebagai training. Data akan dibagi menjadi 3 kelompok data secara merata menjadi 6 data citra untuk tiap kelompok datanya. Untuk data training menggunakan kombinasi dari dua kelompok data. Sedangkan kelompok data yang tersisa akan menjadi data testing. Pengujian akan dilakukan hingga semua kelompok data telah menjadi data testing maupun training. Tabel 1 memperlihatkan rangkuman pembagian data uji dan data set. Tabel 1.Pembagian data untuk data uji dan dataset Pembagian data Data uji Dataset
Data Citra Glaukoma citra 1 sampai 6 citra 7 sampai 15
Normal citra 16 sampai 21 citra 22 sampai 30
Setelah mendapatkan komposisi citra untuk tiap kelompok data seperti yang ditunjukan Tabel 2, dilakukan pengujian validasi. Untuk pengujian akan dilakukan sebanyak 3 iterasi. Penggunaan kelompok data untuk setiap iterasi dapat dilihat pada Tabel 3. Tabel 2.Pembagian data untuk data uji dan dataset
96
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
Kelompok data kelompok 1 kelompok 2 kelompok 3
7 10 13
8 11 14
9 12 15
Data Citra 22 25 28
23 26 29
24 27 30
Tabel 3. Hasil pengujian 3 fold cross validation untuk 18 dataset citra 7 8 9 22 23 24 10 11 12 25 26 27 13 14 15 28 29 30
Indikasi Glaukoma Glaukoma Glaukoma Normal Normal Normal glaukoma glaukoma glaukoma Normal Normal Normal glaukoma glaukoma glaukoma Normal Normal Normal Jumlah data Salah Jumlah data Benar Besar akurasi
k=3 1 1 1 1 1 1 0 0 0 1 1 1 0 0 0 0 0 0 12 6 33.3333
identifikasi k=5 k=7 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 0 1 1 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 10 9 8 9 44.4444 50
k=9 1 1 1 1 1 1 0 0 0 0 1 1 0 0 1 1 0 1 12 6 33.333
Dari pengujian pada Tabel 4, dapat dilihat bahwa akurasi dari 18 data training paling tinggi adalah 50% dengan nilai k = 7. Akurasi yang didapatkan tentu masih kurang baik untuk dijadikan data training dalam sistem deteksi glaukoma. Tabel 4. Hasil pengujian 3 fold cross validation untuk 30 dataset Citra 1 2 3 4 5 16 17 18 19 20 6 7 8 9 10 21 22 23 24 25 11 12 13 14 15 26 27 28 29 30
Indikasi glaukoma glaukoma glaukoma glaukoma glaukoma normal normal normal normal normal glaukoma glaukoma glaukoma glaukoma glaukoma normal normal normal normal normal glaukoma glaukoma glaukoma glaukoma glaukoma normal normal normal normal normal Jumlah Data Benar Jumlah Data Salah Besar Akurasi
k=3 1 1 1 1 1 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 11 19 63.333
97
k=5 1 1 1 1 1 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 9 21 70
Identifikasi k=7 1 1 1 1 1 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 10 20 66.667
k=9 1 1 1 1 1 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 0 0 1 0 1 10 20 66.667
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
Pengujian berikutnya yaitu menggunakan 30 data, dengan membagi data secara kedalam 3 kelompok data dimana masing-masing kelompok data terdiri dari 10 data citra. Hasil dari pengujian ini lebih baik dengan akurasi terbesar yang didapatkan adalah 70% dengan nilai k=5. Nilai akurasi untuk pengujian ini dapat dikatakan cukup untuk digunakan dalam sistem deteksi glaukoma. Akan tetapi karena keterbatasan data, maka pengujian untuk menemukan persentase benar dalam mendeteksi tidak dapat dilakukan. 3.2 Hasil pengujian Identifikasi Tabel 5 memperlihatkan data mentah hasil dari pengamatan uji coba sistem identifikasi. Walaupun akurasi dari dataset untuk 18 data citra hanya mencapai 50%, tetapi hasil uji terhadap 12 data test adalah 83.3333% untuk pengujian dengan nilai k = 9. Pada pengujian ini, persentase identifikasi dengan benar cukup tinggi, akan tetapi karena dataset yang digunakan memiliki akurasi yang kurang, maka hasil ini belum bisa dikatakan valid. Tabel 5. Hasil ujicoba indentifikasi nilai k citra 1 2 3 4 5 6 16 17 18 19 20 21 Jumlah data benar Jumlah data salah persentase benar
4.
identifikasi k=5 k=7 1 1 1 1 1 1 0 1 1 1 1 1 0 0 0 0 0 0 1 1 1 1 1 1 8 9 4 3 66.67 75
k=3 0 1 0 1 0 1 0 0 0 0 1 1 7 5 58.33
k=9 1 1 1 1 1 1 0 0 0 0 1 1 10 2 83.33
SIMPULAN
Penelitian ini menggunakan data berupa citra dari retina yang diambil menggunakan kamera fundus. Data citra berformat JPG. Data yang digunakan diambil dari sumber internet High-Resolution Fundus (HRF) Image Database. Penelitian terbagi menjadi tiga bagian yaitu preprocessing, ekstraksi ciri, dan identifikasi. Preprocessing pada penelitian ini menggunakan metode grayscaling, resize dan segmentasi. Ekstraksi ciri menggunakan metode gray level co-occurrency matrix (GLCM) dengan mengambil empat fitur dari matrik GLCM yaitu kontras, korelasi, homogenitas, dan energy. Untuk identifikasi menggunakan metode K-Nearest Neighbor (K-NN). Untuk membuat matriks kookurensi, terlebih dahulu tentukan arah dan jarak spasial. Kemudian hitung probabilitas munculnya pixel dengan pixel tetangga yang memenuhi syarat jarak spasial dan arah yang telah ditentukan tadi. Untuk pengujian identifikasi data citra dibagi menjadi 18 data training yang terdiri dari 9 citra glaukoma dan 9 citra normal, dan 12 data testing dengan 6 citra normal dan 6 citra glaukoma. Dari percobaan identifikasi didapatkan hasil 83.3333% persentase benar dengan nilai k= 9. Akurasi pengujian tertinggi untuk 30 dataset 70% dengan nilai k = 5. Sedangkan untuk 18 dataset akurasi tertinggi 50% dengan nilai k = 7. Untuk pembuatan matrik kookurensi menggunakan jarak spasial d=1 dan sudut θ=0o. Dalam identifikasi dengan metode KNN, penentuan nilai k sangat memengaruhi hasil identifikasi. 5.
REFERENSI
[1] Radjamin, T. 1984. Ilmu Penyakit Mata. Lembaga Penerbitan Universitas Airlangga, Surabaya. [2] Ilyas, S. 1999. Ilmu Penyakit Mata. Balai Penerbit Fakultas Kedokteran Universitas Indonesia, Jakarta. [3] Hadi, F., Budiman, G., Fauzi, H. 2015. Deteksi Glaukoma Pada Foto Fundus Resolusi Tinggi. Jurnal Fakultas Teknik Elektro. Universitas Telkom. [4] Putra, T. W. A. 2013. Pengenalan Wajah dengan Matriks Kookurensi Aras Keabuan dan Jaringan Saraf Tiruan Probabilistik. Universitas Diponegoro, Semarang.
98
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
[5] Haralick, M. R., Shanmugam, K., & Dinstein, K. 1973. Textural Features for Image Classification. IEEE Transactions On Systems, Man, And Cybernetics. Vol. SMC-3(6): 610-621. [6] Santosa, B. 2007. Data mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis. Graha Ilmu, Yogyakarta. [7] Prasertyo, E. 2014. Data Mining. Andi Offset, Yogyakarta. [8] Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) Lehrstuhl für Informatik 5. 2013. HighResolution Fundus (HRF) Image Database. https://www5.cs.fau.de/research/data/fundus-images/, diakses 12 juni 2016
99