0121: Anto Satriyo Nugroho dkk.
TI-15
PENGEMBANGAN SISTEM COMPUTER AIDED DIAGNOSIS BERBASIS FREE OPEN SOURCE SOFTWARE Anto Satriyo Nugroho1∗ , Made Gunawan1 , Ismail Ekoprayitno Rozi2 , Vitria Pragesjvara1 , Miranti Jatnia Riski1 , Desiani1 , Nuke Dewi Kania, Theda Lukito, Agung Riyadi, Yuni Arti, Ninon Nurul Faiza 1
Pusat Teknologi Informasi & Komunikasi, Badan Pengkajian & Penerapan Teknologi Gedung Teknologi 3 Lantai 3 Puspiptek Serpong, Tangerang 15314 Tel. (021) 75791260 Ext.236 Fax. (021) 75791248 2
Divisi Bioinformatika, Lembaga Biologi Molekuler Eijkman Jl. Diponegoro 69, Jakarta 10340 Tel. (021) 3917131 Fax. (021) 3147982 ∗
e-Mail:
[email protected],
[email protected]
Disajikan 29-30 Nop 2012
ABSTRAK Malaria merupakan penyakit tropis utama yang hingga kini masih banyak ditemukan di berbagai daerah di Indonesia. Penyakit Malaria disebabkan oleh infeksi protozoa pada darah yang disebut plasmodia. Parasit ini terdiri dari 4 spesies: Plasmodium vivax, Plasmodium falciparum, Plasmodium ovale dan Plasmodium malariae. Penyakit Malaria diindikasikan dari berbagai gejala seperti menggigil, demam tinggi, sakit kepala, anemia dan pembesaran Limfa. Di Indonesia diperkirakan jumlah penderita Malaria mencapai sekitar 15 juta, dengan angka kematian 30 ribu per tahun. Angka ini mengindikasikan bahwa Malaria merupakan salah satu penyakit tropis di Indonesia yang harus mendapatkan penanganan serius dan cepat. Salah satu faktor penting dalam penanganan kasus Malaria adalah diagnosa dini Malaria yang akurat. Badan Pengkajian Penerapan Teknologi telah bekerja sama dengan Lembaga Biologi Molekuler Eijkman mengembangkan sistem Computer Aided Diagnosis berbasis teknik pengolahan citra yang mampu membantu proses diagnosa agar berlangsung cepat dan akurat. Dalam periode pertama penelitian ini (2011), telah dikembangkan prototype sistem Computer Aided Diagnosis memanfaatkan teknologi pengolahan citra, untuk mengidentifikasi status penyakit Malaria dari citra apusan tipis darah pasien Malaria, sedangkan pada tahun kedua (2012), sistem ini disempurnakan dengan memasukkan modul klasifikasi komponen darah. Sistem yang dikembangkan merupakan transformasi dari pengetahuan yang dimiliki oleh ekspert microscopist ke dalam rule-based classifier dikombinasikan dengan Bayes Decision. Dalam uji coba dengan data citra mikroskopis darah yang dikumpulkan dari berbagai daerah di Indonesia, sistem ini menunjukkan hasil yang relatif bagus. Akurasi identifikasi tiap komponen: erythrocyte 94.75%, leucocytes 90%, platelets 41.28% dan erythrocyte yang terinfeksi oleh parasit 84.5%, sedangkan akurasi secara keseluruhan sekitar 77.53%. Kata Kunci: Computer aided diagnosis, malaria, microphotograph, apusan tipis
I.
PENDAHULUAN
Malaria merupakan penyakit tropis utama yang hingga kini masih banyak ditemukan di berbagai daerah di Indonesia. Penyakit Malaria disebabkan oleh infeksi protozoa pada darah yang disebut plasmodia. Parasit ini terdiri dari 4 spesies: Plasmodium Vivax, Plasmodium Falciparum, Plasmodium Ovale dan Plasmodium Malariae. Indikasi penyakit ini terlihat dari berbagai gejala seperti menggigil, demam tinggi, sakit kepala, anemia dan pembesaran Limfa. Di Indonesia diperkirakan terdapat sekitar 15 juta penderita, dengan angka kematian 30 ribu per tahun. Angka ini mengindikasikan bahwa Malaria merupakan salah satu
penyakit tropis di Indonesia yang harus mendapatkan penanganan serius dan cepat.[1] Salah satu faktor penting dalam penanganan kasus Malaria adalah diagnosa dini Malaria yang akurat. Dalam praktek medis, dikenal berbagai teknik diagnosa seperti PCR, diagnosa klinis dan diagnosa mikroskopi. Di antara teknik tersebut, diagnosa mikroskopi merupakan teknik gold standard dan relatif paling murah. Teknik ini memanfaatkan mikroskop untuk menghitung parasit, di mana sampel darah diberikan pewarnaan melalui proses kimia yang disebut (Giemsa) staining. Selain murah, diagnosa mikroskopi juga bersifat sensitif, yaitu dapat menentukan kepadatan para-
Prosiding InSINas 2012
0121: Anto Satriyo Nugroho dkk.
TI-16 sit dari darah pasien. Diagnosa ini juga informatif, yaitu dapat dipakai untuk menentukan jenis plasmodium Malaria, yang merupakan salah satu pertimbangan dalam memberikan terapi kepada pasien. Akan tetapi diagnosa mikroskopi ini juga memiliki berbagai kelemahan. Akurasi diagnosa sangat tergantung kepada keahlian dan pengalaman mikroskopis (orang yang bertugas membaca slide apusan darah). Terlebih lagi, prevalensi Malaria di Indonesia cukup rendah, sehingga slide yang dibaca umumnya negatif, maksudnya tidak terjangkit Malaria. Padahal untuk memastikan bahwa seorang pasien darahnya negatif jauh lebih sulit daripada menentukan bahwa seorang pasien statusnya positif terjangkit Malaria. Untuk itu, Badan Pengkajian Penerapan Teknologi bekerja sama dengan Lembaga Biologi Molekuler Eijkman dalam pengembangan sistem Computer Aided Diagnosis berbasis teknik pengolahan citra, yang mampu membantu proses diagnosa, agar berlangsung cepat dan akurat. Dari kajian literatur, beberapa pihak melakukan upaya serupa untuk kasus Malaria di luar negeri, akan tetapi terbatas pada kasus dengan skala kecil. Misalnya Premaratne memakai artificial neural network yang dikhususkan pada spesies Plasmodium falciparum. Model tersebut memakai citra sel yang telah dinormalisasikan sebagai input bagi proses training maupun testing neural network.[2] Studi lain dilakukan oleh Ross yang memakai warna, tekstur dan ciri geometri dari parasit dan sel sebagai vektor fitur, yang selanjutnya diklasifikasikan ke salah satu spesies plasmodium dalam dua tahap.[3] Akan tetapi studi yang mereka lakukan hanya terbatas pada data berskala kecil, 5 sampel untuk training dan 15 sampel untuk testing, sedangkan karakteristik parasit sangat kompleks. Dapat disimpulkan bahwa hingga kini, belum ada studi komprehensif yang dilakukan untuk mengembangkan computer aided diagnosis terhadap kasus Malaria, khususnya di Indonesia berskala besar. Dalam periode pertama penelitian ini (2011), telah dikembangkan prototype sistem Computer Aided Diagnosis memanfaatkan teknologi pengolahan citra, untuk mengidentifikasi status penyakit Malaria dari citra apusan tipis darah pasien Malaria. Beberapa algoritma baru pengolahan citra telah dikembangkan oleh tim peneliti dan bekerja sama dengan ahli mikroskopi di Lembaga Biologi Molekuler Eijkman, sehingga hasilnya dapat diverifikasi langsung oleh praktisi lapangan.[4, 5] Pada tahun pertama penelitian, algoritma tersebut telah dievaluasi pada data citrayang telah terinfeksi oleh Plasmodium Falciparum, dengan hasil cukup baik. sensitivity 92.59% dan specificity of 99.65%, Positive Predictive Value (PPV) of 67.56%, and F1 score of 0.7812.[5] Dalam tahun kedua penelitian ini (2012), kegiatan penelitian difokuskan pada penyempurnaan prototype system sehingga bisa dipakai untuk mendeteksi keber-
adaan berbagai spesies parasit selain Plasmodium falciparum (P. malariae, P. ovale, P. vivax) , pada citra dengan berbagai pada kualitas lapangan.
II.
METODOLOGI
A. Persiapan Data Microphotograph Sample darah pasien Malaria dipersiapkan oleh tim peneliti Lembaga Biologi Molekuler Eijkman, diperoleh dari berbagai daerah di Indonesia. Sample tersebut terdiri dari 5 spesies: Plasmodium falciparum, Plasmodium vivax, Plasmodium ovale, Plasmodium Malariae, dan Plasmodium Knowlesi. Setiap slide dilakukan proses staining memakai standard Giemsa staining protocol. Slide kemudian diperiksa di bawah mikriskop dengan pembesaran 10×100, dan citra ditangkap dengan 5-megapixel Nikon digital sight DS 5 Mc, yang didesain khusus untuk mikroskop cahaya. Data set tersebut kemudian dianalisa secara manual, dan dilakukan perhitungan jumlah parasite, serta fase dan tipe masing-masing sel. B.
Sistem Computer Aided Diagnosis Sistem yang dikembangkan merupakan transformasi pengetahuan yang dimiliki oleh microscopist analyst Lembaga Biologi Molekuler Eijkman ke dalam algoritma pengolahan citra. G AMBAR 1 memperlihatkan bagan sistem yang dibangun untuk melakukan identifikasi citra microphotograph darah pasien. Sistem itu terdiri dari fase preprocessing untuk memperbaiki kualitas citra dan menghapus noise, dilanjutkan dengan fase segmentasi komponen darah dan klasifikasi komponen darah. Tujuan dari dua fase ini adalah mengenali jenis berbagai komponen darah, seperti erythrocyte, leucocyte, thrombocyte, dan artefacts. Erythrocyte sendiri dibagi dua: erythrocyte sehat dan suspected erythrocyte, yaitu erythrocyte yang dicurigai terinfeksi oleh parasit. Selanjutnya Bayes Classifier dipakai untuk menentukan apakah erythrocyte tersebut sehat (bercak hitam itu hanya sekedar artefak) ataukah erythrocyte tersebut benar-benar terinfeksi parasit.
G AMBAR 1: Rancangan sistem Computer Aided Diagno-
sis Malaria
Prosiding InSINas 2012
0121: Anto Satriyo Nugroho dkk. B-1.
Prepocessing
Dalam tahap ini, citra dikonversikan ke gray-scale image, karena informasi warna tidak diperlukan untuk melakukan klasifikasi komponen sel darah. Noise pada citra dihapus memakai Median filter. Pada G AMBAR 2 diperlihatkan gambar berbagai komponen darah: (1) erythrocyte (sel darah merah), (2) leucocyte (sel darah putih) dan (3) platelet dan (4) erythrocyte yang mengandung parasit.
TI-17 gah. Agar proses segmentasi berjalan benar, hasil segmentasi tersebut diperbaiki dengan proses morfologi hole-filling yang dikembangkan pada penelitian terdahulu.[4] G AMBAR 3-4 menunjukkan proses morfologi hole filling yang diterapkan pada sebuah citra, sehingga diperoleh hasil dengan lubang tertutup.
G AMBAR 2: sampel citra darah dengan berbagai komponen yang diberi nomor
B-2.
Segmentasi komponen darah
Tahap ini bertujuan untuk melakukan segmentasi, yaitu memisahkan tiap citra komponen darah dari citra latar belakang. Pada citra input, intensitas terbagai ke dalam 3 level: paling terang, menengah dan paling gelap. Citra thrombocytes, leucocytes dan artefacts umumnya terbentuk dari pixel dengan warna gelap, sedangkan erythrocytes tersusun dari pixel dengan intensitas medium (abu-abu), dan latar belakang paling terang. Karena ada 3 intensitas yang dominan, citra input didekomposisikan ke dalam 3 citra memakai Otsu Dual Thresholding. Citra yang diperoleh terdiri dari 3 dan disebut mask. Mask pertama mengidentifikasikan posisi seluruh komponen darah dan dinotasikan dengan A. Mask kedua adalah citra yang terdiri dari pixel dengan warna paling gelap. Pixel pada mask ini mengindikasikan posisi artefact, nucleus parasit, thrombocytes dan leucocytes. Mask kedua diidentifikasikan dengan Λ. Mask yang terakhir mengindikasikan posisi erythrocytes, yaitu yang tersusun dari pixel dengan warna medium. Mask ini dinotasikan dengan E Karena erythrocytes memiliki struktur cekung, pada saat dual thresholding dilakukan, akan terbentuk lobang di ten-
G AMBAR 3: Fast Hole Filling
B-3.
Klasifikasi tahap pertama: klasifikasi komponen berbasis aturan
Setelah 3 mask file diperoleh, komponen darah diidentifikasi berdasarkan aturan berikut: A mewakili semua komponen dari citra darah, Λ mewakili komponen dengan pixel gelap, E mewakili komponen dengan intensitas piksel sedang. Lima kelas didefinisikan sebagai berikut: ω1 erythrocyte sehat, ω2 : leucocyte ω3 : thrombocyte, ω4 : Thrombocyte menumpang di erythrocyte ω5 : suspected erythrocyte. Selanjutnya klasifikasi dilakukan berdasarkan aturan-aturan sebagai berikut:[6]
G AMBAR 4: kiri: mask file sebelum dilakukan hole filling kanan: setelah hole filling
(i) ∀X ∈ A s.t. (X ∈ / Λ) ∧ (X ∈ E) ⇒ X ∈ ω1 (ii) ∀X ∈ A s.t. (X ∩ Λ 6= φ) ∧ (X ∩ E = φ) ⇒ X ∈ ω3
Prosiding InSINas 2012
0121: Anto Satriyo Nugroho dkk.
TI-18 (iii) ∀X ∈ A s.t. (X ∩ Λ 6= φ) ∧ (X ∩ E 6= φ) ∧(τ1 ≤ area(X) ≤ τ2 ) ⇒ X ∈ ω4 (iv) ∀X ∈ A s.t. (X ∩ Λ 6= φ) ∧ (X ∩ E 6= φ) ∧(area(X) > τ2 ) ⇒ X ∈ ω2 (v) ∀X ∈ A s.t. (X ∩ A 6= φ) ∧ (X ∧ E 6= φ) ∧(area(X) < τ1 ) ⇒ X ∈ ω5
B-4.
Klasifikasi tahap kedua
Apabila sebuah erythrocyte diklasifikasikan ke dalam ω5 (suspected erythrocyte), maka sel tersebut akan diidentifikasikan lebih lanjut untuk memastikan apakah benar-benar terinfeksi oleh parasit atau bercak hitam itu hanya sekedar artefact. Verifikasi ini dilakukan dengan mempartisi sel ke dalam 3 area berdasarkan Otsu dual thresholding (lihat G AM BAR 5), kemudian menghitung rasio white/black pixel sebagaimana diperlihatkan pada G AMBAR 6, sebagai acuan untuk membuat keputusan dengan Bayes classifier.[5]
keberhasilan yang dicapai secara keseluruhan adalah 77.63%, dengan akurasi masing-masing: erythrocyte 94.75%, leucocytes 90%, platelets 41.28% dan erythrocyte yang terinfeksi oleh parasit 84.5%.[6] Analisa terhadap error menunjukkan bahwa umumnya hal itu disebabkan oleh kegagalan segmentasi. Contoh dari kegagalan segmentasi ini diperlihatkan pada G AMBAR 7, di mana thrombocyte masih tersambung dengan erythrocyte, sehingga diidentifikasikan sebagai parasit. Beberapa kesalahan lain disebabkan oleh komponen yang tumpang tindih (overlapping). Saat ini tengah dikaji solusi dari masalah tersebut dengan memanfaatkan teknik segmentasi watershed.[8]
G AMBAR 7: Error yang disebabkan kegagalan segmentasi. Thrombocyte masih tersambung dengan erythrocyte, sehingga diidentifikasikan sebagai parasit
G AMBAR 5: hasil dual thresholding terhadap erythrocyte yang terinfeksi oleh parasit dan erythrocyte yang ditumpangi oleh artefacts
Eksperimen juga dilakukan terhadap spesies yang lain. Eksperimen ini memakai 5 slide P. Falciparum dan 7 slide P.vivax pada fase asexual. Tiap slide diambil data sebanyak 150 citra microphotograph. Hasil eksperimen ini menunjukkan bahwa sistem mampu mendeteksi fase aseksual P. falciparum dan P. vivax relatif baik. Untuk P. falciparum, tingkat sensitifitas sistem 73.59% sedangkan specifisitas 98.54%, PPV (Positive Predicted Value) 23.97% dan score F1 sebesar 29.54%. Adapun P. vivax, sensitifitas sistem sebesar 79.15%, spesifisitas 98.42%, PPV 7.62%, dan score F1 sebesar 12.69%.[7]
IV.
G AMBAR 6: rasio white/black pixel sebagaimana sebagai acuan untuk membuat keputusan dengan Bayes classifier[5]
III.
HASIL DAN PEMBAHASAN
Computer Aided Diagnosis system yang dibangun selanjutnya dievaluasi dengan 40 citra microphotograph. Tingkat
KESIMPULAN
Studi ini merupakan bertujuan untuk mengembangkan sistem Computer Aided Diagnosis, yang membantu praktek klinis di lapangan agar bisa melakukan diagnosa dini Malaria dengan cepat dan akurat. Sistem ini memakai citra microphotograph apusan tipis darah pasien Malaria yang telah dilakukan pewarnaan dengan Giemsa staining. Sistem yang dibangun merupakan transformasi dari pengetahuan ekspert diagnosa mikroskopis yang sering disebut microscopist pada Lembaga Biologi Molekuler Eijkman, ke dalam algoritma pengolahan citra. Hasil yang diperoleh dibandingkan dengan hasil diagnosa yang dilakukan secara manual oleh para microscopist tersebut. Salah satu masalah utama dalam studi ini adalah melakukan klasifikasi komponen darah, dan menentukan ada tidaknya sel darah merah yang terinfeksi. Klasifikasi komponen darah berhasil dilakukan dengan membagi citra darah ke 3 sub citra secara otomatis berdasarkan kemiripan intensitasnya, dan selanjutnya mendefinisikan class tiap komponen
Prosiding InSINas 2012
0121: Anto Satriyo Nugroho dkk. lewat klasifikasi berbasis aturan (rule based classifier). Secara keseluruhan, algoritma yang dikembangkan mampu mendeteksi 77.53% class tiap komponen darah, dengan akurasi masing-masing: erythrocyte sehat 94.75%, suspicious erythrocytes 84.50%. Suspicious erythrocytes ini selanjutnya akan diidentifikasikan dengan Bayes rule, apakah memang benarbenar positif parasit ataukah hanya artefak yang kebetulan posisinya di erythrocyte. Prototype piranti lunak ini sedang dikembangkan lebih lanjut dengan integrasi pada hardware, yaitu microscope camera dan mikroskop dan disambungkan pada laptop yang ringkas dan dapat dipakai secara portable untuk melakukan identifikasi status Malaria pada daerah rawan. Tahun 2013 direncanakan untuk mengevaluasi sistem di kawasan Indonesia timur, yang prevalensi Malaria yang cukup tinggi.
TI-19 Merah Yang Bertumpuk, Prosiding Konferensi Nasional Sistem & Informatika ( KNS&I ), 17 November 2012.
DAFTAR PUSTAKA [1] US Namru-2 Jakarta (2008), Panduan Pelatihan Diagnosis Mikroskopi Malaria, Departemen Parasitologi Medis, [2] S.P. Premaratne, N.D. Karunaweera, S. Fernando, W.S.R. Pererab, R.P. Asanga, S. Rajapaksha (2003), A Neural Network Architecture for Automated Recognition of Intracellular Malaria Parasites in Stained Blood Films, APAMI & CJKMI-KOSMI Conference 2003 [3] N.E. Ross, C.J. Pritchard, D.M. Rubin, A.G. Duse, (2006), Automated Image Processing method for the diagnosis and classification of Malaria on thin blood smears, Medical and Biological Engineering and Computing, Vol.44, No.5, pp.427-436, 2006 [4] D. Anggraini, A.S. Nugroho, C. Pratama, I.E. Rozi, A.A. Iskandar, R.N. Hartono (2011), Automatic Status Identification of Microscopic Images Obtained from Malaria Thin Blood Smears, Proc. of 3rd International Conference on Electrical Engineering and Informatics (ICEEI 2011), CDROM A3-2, Institut Teknologi Bandung, Bandung, Indonesia, July 17-19, 2011 [5] D. Anggraini, A.S. Nugroho, C. Pratama, I.E. Rozi, V. Pragesjvara and M. Gunawan (2011), Automated Status Identification of Microscopic Images Obtained from Malaria Thin Blood Smears using Bayes Decision: A study case in Plasmodium Falciparum, Proc. of International Conference on Advance Computer Science and Information System 2011, Jakarta, Indonesia, 17-18 December 2011 [6] N.D. Kania, T. Lukito, A.S. Nugroho, I.E. Rozi, M. Gunawan, V. Pragesjvara, D. Anggraini (2012), Blood Component Classification for Malaria Computer Aided Diagnosis from Thin Blood Smear Microphotographs, Proc. of 5th International Symposium on Computational Science (ISCS), pp.199-206, 15-16 May 2012 [7] T. Lukito, N.D. Kania, I.E. Rozi, A.S. Nugroho, M. Gunawan, V. Pragesjvara, D. Anggraini (2012), Semiautomated Computer-aided Diagnosis for Malaria Multi species Parasite Detection from Thin Blood Smear Microphotographs”, Proc. of 5th International Symposium on Computational Science (ISCS), pp.296-302, 15-16 May 2012 [8] A. Riyadi, M.J. Riski, N.N. Faiza, Y. Arti, A.S. Nugroho, M. Gunawan, I.E. Rozi (2012), Evaluasi Algoritma Watershed pada Pemisahan Citra Apusan Tipis Sel Darah
Prosiding InSINas 2012