BAB 3 METODOLOGI
3.1 Analisis Kebutuhan dan Masalah 3.1.1
Analisis Kebutuhan Dalam melakukan analisa gambar mammogram, biasanya dokter secara langsung
melakukan pengamatan dan analisis dari gambar yang didapat. Untuk bisa mendapatkan kesimpulan yang tepat, dibutuhkan gambar dengan kualitas tinggi dan ketelitian yang baik. Gambar mammogram dijital diciptakan untuk mengatasi hilangnya detail-detail pada gambar mammogram dengan cara melakukan image preprocessing. Setelah itu, diciptakan juga sebuah teknik yang bisa menganalisa gambar mammogram dijital tersebut, yang disebut juga sebagai CAD. Agar analisa dari dokter maupun CAD dapat berjalan dengan baik, secara ideal dibutuhkan gambar dijital yang mampu menampilkan semua informasi mammogram, sehingga fitur-fiturnya dapat diambil secara jelas. Setelah itu, dibutuhkan juga teknik klasifikasi yang handal untuk bisa melakukan membedakan jenis kanker berdasarkan fitur yang didapat. Khususnya untuk membedakan jenis microcalcification ke dalam jenis benign atau malignant.
36
37
3.1.2
Analisis Masalah Analisa yang dilakukan oleh dokter terhadap gambar mammogram tidak jarang
menghasilkan kesimpulan yang merupakan false negative ataupun false positif. Di mana false negative dapat berakibat fatal bagi pasien dan false positive menyebabkan pasien harus menjalani biopsy yang tidak diperlukan. Diperkirakan, sekitar 25% dari kanker tidak terdeteksi oleh teknik analisis pada tahun 1997. Hal ini disebabkan oleh tingginya biaya untuk melakukan screening, radiologist yang kurang berpengalaman, dan kelelahan dalam melakukan pengamatan oleh manusia. Kanker payudara dapat dibedakan menjadi benign dan malignant berdasarkan mikrokalsifikasi yang ditemukan dalam gambar mammogram. Akan tetapi, proses klasifikasi ini sangat sulit untuk dilakukan secara tepat. Kenyataan yang terjadi adalah banyaknya false negative serta false positif akibat human error (kesalahan oleh dokter ataupun radiologist yang dikarenakan kelelahan, kondisi tubuh kurang fit, maupun ketidaktelitian).
3.2 Solusi Alternatif Untuk menghindari terjadinya false positive dan false negative, second opinion akan dibutuhkan untuk meyakinkan dokter dalam mengambil keputusan. Second opinion dapat diberikan oleh dokter lain atau radiologist yang berpengalaman dalam mengidentifikasi kalsifikasi pada gambar mammogram. Solusi ini kurang ideal karena menggunakan sumber daya minimal dua kali lebih banyak dalam melakukan identifikasi. Tingkat kesalahan untuk setiap dokter juga akan semakin meningkat apabila jumlah gambar mammogram yang harus diklasifikasi semakin
38
banyak. Hal ini bisa dipahami karena otak manusia memiliki batas kejenuhan yang bisa mempengaruhi keputusan yang diambil.
3.3 Metodologi Aplikasi Berbeda dengan otak manusia, komputer tidak memiliki titik jenuh dalam melakukan kalkulasi secara berulang-ulang. Klasifikasi gambar mammogram sudah dimungkinkan dengan berbagai macam teknik dan metode. Metode-metode yang digunakan menggunakan proses yang terdapat dalam computer vision yaitu image preprocessing seperti enchanced dan feature extraction, sedangkan klasifier yang digunakan untuk membedakan microcalcification merupakan benign atau malignant adalah SVM (Support Vector Machines).
39
Sample Image
Preprocess
(Mammogram Image)
Feature Extraction
Preprocessed Mammogram
Features Mammogram Predefined Classes Training
Trained SVM
Offline Training Process Online Classification Process
Mammogram Image
Preprocess
Preprocessed Mammogram
Feature Extraction Features
Classifying Diagnosed Mammogram Class (Normal)
Normal
Abnormality
Abnormal Diagnosed Mammogram Class (Benign)
Benign
Severity
Malignant Diagnosed Mammogram Class (Malignant)
Gambar 3.3 Diagram Alur Aplikasi
40
3.3.1
Offline Training Process Pada proses ini, mula-mula dilakukan image preprocessing pada mammogram
image yang dimasukkan. Setelah itu image tersebut diubah menjadi GLCM (Gray Level Co-occorence Matrix). Dari GLCM ini, kemudian diekstraklah fitur-fitur dengan tingkat diskriminator yang diinginkan. Fitur-fitur yang digunakan tidak dipilih secara acak, melainkan dipilih berdasarkan pemilihan fitur dengan pendekatan t-test sehingga didapat fitur-fitur yang dinilai mempunyai tingkat diskriminator tinggi. Pada penelitian ini, t-test tidak dilakukan karena sudah dilakukan dalam penelitian lain sebelumnya. Fitur-fitur tersebut antara lain mean of difference entropy, range of local homogeneity, dan range of difference variance. Kemudian dilakukanlah training dengan memasukkan fitur yang telah didapatkan dan class yang telah didefinisikan untuk jenis fitur tersebut sehingga kemudian didapatkanlah SVM terlatih yang dapat membedakan class dari mammogram image yang dimasukkan.
3.3.2
Online Classification Process Tahap ini tidak terlalu berbeda dengan proses training. Mula-mula dilakukan
image preprocessing pada mammogram image yang dimasukkan. Lalu setelah diubah menjadi GLCM, diekstrak dan kemudian didapatkanlah fitur yang diinginkan. Setelah itu masukklah ke dalam proses pengklasifikasian yaitu dengan menggabungkan fitur yang didapat dengan SVM yang telah kita training sebelumnya. Maka kemudian akan didapatkan kelas untuk mammogram image tersebut, apakah positif kalsifikasi atau
41
negatif kalsifikasi. Jika positif kalsifikasi, maka akan dilakukan pengklasifikasian kembali apakah termasuk benign atau malignant.
3.3.3
Algoritma Diagnosis Load Image
Image Enhancement
Generate GLCM
Feature Extraction
Classification using SVM #1
Analyze calcification
If NEGATIVE Classify as normal
If POSITIVE Classification using SVM #2
Analyze Severity
If BENIGN Classify as Benign
If MALIGNANT Classify as Malignant
Gambar 3.3.3 Diagram Alur Algoritma
42
3.3.4
Image Preprocessing Proses image preprocessing pada gambar mammogram dilakukan untuk
beberapa tujuan berikut ini: •
Meningkatkan kejelasan gambar agar feature dapat diambil dengan mudah
•
Mengurangi ukuran gambar agar tidak membebani kerja CPU sehingga proses feature extraction dapat dilakukan dengan cepat
•
Membuang detail gambar yang tidak diperlukan dalam proses feature extraction.
Gambar yang diambil dari MIAS adalah berupa gambar grayscale 8 bit dengan 256 tingkat intensitas dengan ukuran 1024 x 1024 pixel. Tahapan preprocessing gambar mammogram yang dilakukan dapat dibagi menjadi 4 tahapan: •
Cropping (memilih ROI)
•
High Pass Filtering
•
Low Pass Filtering
•
Histogram Equalization
3.3.4.1 Image Cropping Tahapan awal dalam melakukan image preprocessing adalah dengan memotong (cropping) sebagian gambar mammogram untuk mendapatkan ROI (Region of Interest). ROI merupakan bagian yang dipilih sebagai sampel dalam dataset yang diidentifikasi untuk hasil yang lebih efektif dan efisien. Pemilihan ROI ini harus dilakukan dengan sebaik mungkin karena ROI ini sangat berperan penting dalam fitur yang akan didapatkan dan kemudian akan diekstrak pada nantinya.
43
Gambar 3.3.4.1 Proses pemotongan gambar mammogram
3.3.4.2 High Pass Filtering Pada tahapan High Pass Filtering, ROI dikonvolusikan dengan matriks kernel berikut ini:
Hasil dari High Pass Filtering adalah sebuah gambar dengan penambahan ketajaman. Setelah itu, gambar tersebut ditambahkan kedalam ROI dengan bobot 50%. Berikut ini adalah ilustrasi High Pass Filtering yang digunakan:
44
Gambar 3.3.4.2 Ilustrasi High Pass Filtering
Tujuan dari High Pass Filtering adalah peningkatan kejelasan tekstur pada gambar mammogram. Dengan begitu, feature yang didapat nantinya bisa lebih diskriminatif.
3.3.4.3 Low Pass Filtering Pada tahapan Low Pass Filtering, gambar yang sebelumnya ditambahkan dengan hasil dari High Pass Filtering dikonvolusikan dengan matriks kernel berikut ini:
Hasil dari Low Pass Filtering adalah sebuah gambar dengan pengurangan ketajaman. Setelah itu, gambar tersebut ditambahkan kedalam gambar sebelumnya dengan bobot 50%. Berikut ini adalah ilustrasi Low Pass Filtering yang digunakan:
45
Gambar 3.3.4.3 Ilustrasi Low Pass Filtering
Tujuan dari Low Pass Filtering adalah mendapatkan gambar yang lebih halus dan mengurangi tingkat keacakan pada GLCM akibat noise yang terjadi setelah High Pass Filtering. Dengan mengurangi noise, feature yang didapatkan nantinya akan lebih handal.
3.3.4.4 Histogram Equalization Pada tahapan Histogram Equalization, dilakukan penyebaran intensitas pada gambar agar feature menjadi lebih mudah terlihat. Nilai intensitas maksimum setelah Histogram Equalization adalah 255, sedangkan nilai minimumnya adalah 0. Berikut adalah ilustrasi gambar beserta histogramnya:
46
Gambar 3.3.4.4 Ilustrasi gambar beserta histogramnya Gambar dari hasil histogram equalization menunjukkan garis batas yang lebih jelas pada gambar sel kalsifikasi yang ada di dalam ROI.
3.3.5
Feature Extraction Mammogram dijital dianalisis dengan menentukan ROI (Region of Interest) lalu
mengubahnya menjadi GLCM (Gray Level Co-Occurrence Matrix) terlebih dahulu, yaitu suatu matriks yang merepresentasikan hubungan ketetanggaan antar piksel dalam gambar pada berbagai arah orientasi dan jarak spasial. Di dalam aplikasi ini, ada 4 GLCM yang digunakan dalam menentukan feature pada gambar mammogram, yaitu GLCM dengan jarak spasial 1 dan sudut 0o, GLCM
47
dengan jarak spasial 1 dan sudut 45o, GLCM dengan jarak spasial 1 dan sudut 90o, dan GLCM dengan jarak spasial 1 dan sudut 135o. Setelah memperoleh matriks kookurensi tersebut, dapat dihitung ciri statistik yang merepresentasikan gambar yang diamati. Berdasarkan data yang dipelajari, yang menjadi strong feature untuk deteksi kanker adalah mean of difference entropy, range of local homogeneity, dan range of difference variance.
-
Difference entropy dihitung dengan rumus:
Lalu dihitung mean-nya (nilai rata-rata)
-
Local homogeneity dihitung dengan rumus:
Lalu dihitung range-nya (nilai maksimum dikurangi nilai minimum)
-
Difference variance dihitung dengan rumus:
Lalu dihitung range-nya (nilai maksimum dikurangi nilai minimum)
48
3.3.6
Support Vector Machine SVM yang digunakan dalam aplikasi ini diambil dari framework EMGU CV
dengan memasukkan: using Emgu.CV.ML; using Emgu.CV.ML.Structure; Dengan cara ini, input yang dimasukkan berupa feature, dan output berupa kelas. Berdasarkan penelitian yang sudah dilakukan secara empiris, parameter yang dipakai untuk dimasukan ke dalam parameter SVM di emgu.cv.ml untuk mendapat hasil terbaik adalah sebagai berikut: kernel type linear svm type c_svc parameter c = 1 mcvtermcriteria(100,0.0001) Pembelajaran (training) dilakukan dengan menggunakan pasangan data input dan data output berupa sasaran yang diinginkan. Data input didapatkan dari hasil perhitungan GLCM yaitu feature mean of difference entropy, range of local homogeneity, dan range of difference variance. Data output didapatkan dari data MIAS. Untuk proses klasifikasi, hanya diperlukan feature mean of difference entropy, range of local homogeneity, dan range of difference variance dari image yang bersangkutan. Aplikasi ini memiliki 2 buah SVM yaitu abnormality untuk mengklasifikasikan ada atau tidaknya kalsifikasi dan severity untuk mengklasifikasi benign atau malignant. SVM severity akan otomatis dijalankan bila hasil dari SVM abnormality menyatakan bahwa ROI yang diambil tersebut positif mengandung kalsifikasi.
49
3.3.7 begin end
Pseudocode
load/choose image load SVM if needed flip image remove label endif select ROI (Cropping) image shrinking image enhancement convert image to GLCM calculate feature_1 = mean of difference entropy (d=1 ,θ =0o, 45 o, 90 o, 135o) calculate feature_2 = range of local homogeneity (d=1 ,θ =0o, 45 o, 90 o, 135o) calculate feature_3 = range of difference variance (d=1 ,θ =0o, 45 o, 90 o, 135o) input to SVM for training and/or classifying if needed save image save SVM endif