JCONES Vol. 5, No. 1 (2016) 158-163
Journal of Control and Network Systems Situs Jurnal : http://jurnal.stikom.edu/index.php/jcone
IDENTIFIKASI JENIS PENYAKIT DAUN TEMBAKAU MENGGUNAKAN METODE GRAY LEVEL CO-OCCURRENCE MATRIX (GLCM) DAN SUPPORT VECTOR MACHINE (SVM) Nauval Zabidi Kurniawan1) Susijanto Tri Rasmana 2) Yosefine Triwidyastuti3) Program Studi/ Jurusan Sistem Komputer Institut Bisnis dan Informatika Stikom Surabaya Jalan Raya Kedung Baruk 98 Surabaya, 60298 Email : 1)
[email protected], 2)
[email protected], 3)
[email protected]
Abstrak: Tembakau merupakan salah satu hasil produk pertanian yang diproses dari bagian daun tanaman tembakau. Masyarakat secara umum hanya mengetahui bahwa tembakau merupakan bahan baku utama rokok, akan tetapi pada kenyataannya ada banyak manfaat lain dari daun tembakau, mulai dari melepaskan gigitan lintah hingga sebagai obat HIV/AIDS dan sebagai biofuel. Pada perkembangannya ada dua faktor yang mempengaruhi kualitas tanaman tersebut, yaitu hama dan penyakit. Untuk meminimalisir penurunan kualitas tembakau, diperlukan sebuah metode analisis yang mampu mendeteksi penyakit pada daun tembakau sedini mungkin. Pada penelitian ini dibuat sebuah sistem yang mampu mendeteksi penyakit daun tembakau sebagai bentuk dari pengembangan teknologi digital (pengolahan citra). Dalam penelitian sistem analisis ini digunakan metode Gray Level Co-occurrence Matrix (GLCM) dengan memanfaatkan ekstraksi fitur – fitur sebuah citra dengan memperhatikan hubungan piksel ketetanggaan dan Support Vector Machine (SVM) sebagai pengklasifikasi jenis penyakit dengan bantuan kernel gaussian (rbf) dan polynomial. Pengujian sistem analisis ini menghasilkan tingkat keberhasilan yang beragam. Rata-rata tingkat keberhasilan pada sistem ini adalah 74% dengan persentase keberhasilan tertinggi 80% pada kernel polynomial dengan jarak piksel 1, 2, 3, 5 dan 6. Sedangkan persentase keberhasilan terkecil bernilai 63% pada kernel gaussian (rbf) dengan jarak piksel 1.
Keyword: daun tembakau, GLCM, ekstraksi fitur, SVM, kernel.
Tembakau merupakan salah satu hasil produk pertanian yang diproses dari bagian daun tanaman tembakau. Masyarakat secara umum hanya mengetahui bahwa tembakau merupakan bahan baku utama rokok, akan tetapi pada kenyataannya ada manfaat lain dari daun tembakau, mulai dari melepaskan gigitan lintah hingga sebagai obat HIV/AIDS dan sebagai biofuel (Zulfikar, 2014) . Pada perkembangan tanaman tembakau ada dua faktor yang mempengaruhi kualitas tanaman tersebut, yaitu hama dan penyakit. Untuk meminimalisir penurunan kualitas tembakau, diperlukan sebuah metode
analisis yang mampu mendeteksi penyakit pada tembakau sedini mungkin. Beberapa metode yang telah dibuat sebelumnya untuk mendeteksi penyakit daun tembakau yaitu “Implementasi Jaringan Saraf Tiruan Untuk Mendeteksi Penyakit Tembakau (Nicotiana Tabacum L) Dengan Metode Backpropagation” (Nainggolan, 2011). Namun metode tersebut hanya menghasilkan keluaran berupa tembakau berpenyakit atau tidak dengan mengolah variabel dari bentuk daun, warna daun, ada tidaknya bau daun, kondisi daun, ada tidaknya bercak pada daun, ada tidaknya bintik pada
Nauval Zabidi Kurniawan, Susijanto Tri Rasmana, Yosefine Triwidyastuti JCONES Vol. 5, No. 1 (2016) Hal: 158
daun, bentuk batang, kondisi batang, warna batang, warna akar dan kondisi akar. Sedangkan penyakit dari daun termbakau sendiri sangat kompleks. Daun tembakau rentan terkena penyakit baik yang disebabkan oleh hama, jamur bahkan virus. Penelitian ini ditujukan untuk membuat sebuah sistem analisis yang mampu mendeteksi penyakit daun tembakau sebagai bentuk dari pengembangan teknologi digital (pengolahan citra) sehingga pendeteksian tidak lagi dilakukan secara manual. Dalam penelitian ini digunakan metode Gray Level Cooccurrence Matrix (GLCM) untuk ekstraksi fitur daun dan Support Vector Machine (SVM) untuk pengklasifikasian/identifikasi penyakit. GLCM yang memiliki fitur-fitur yang mampu mengekstraksi tekstur dengan lebih akurat dan SVM sebagai pengklasifikasi memiliki banyak kelebihan, salah satunya SVM mampu mengklasifikasikan suatu pattern yang tidak termasuk data yang dipakai dalam fase pembelajaran metode tersebut (Nugroho, A., Witarto, A., dan handoko, D., 2003).
dari 2 kelas penyakit tersebut dengan tambahan bantuan fungsi kernel gaussian (rbf) dan kernel polynomial. Tahap terakhir adalah melakukan pengujian sistem terhadap citra data uji dan menganalisis hasil klasifikasi dari jarak piksel terhadap 2 fungsi kernel (3). Dan kemudian dicari jarak piksel dan fungsi kernel yang memberikan tingkat keberhasilan terbaik.
Citra Daun Tembakau Sistem analisis ini menggunakan masukkan berupa citra dari daun tembakau. Citra daun tembakau disini berupa hasil cropping dari gambar keseluruhan daun tembakau dengan ukuran cropping 96 x 96 piksel. Cropping disini menggunakan bantuan Photoshop CS 4. Bagian yang di-crop adalah bagian dari daun tembakau yang terjangkit gejala penyakit lanas atau pun penyakit bercak karat. Ukuran 96 x 96 piksel dipilih karena setelah dilakukan pengambilan sampel sebelumnya menggunakan ukuran yang berbeda terdapat kendala ketika cropping terlalu besar atau terlalu kecil dari bagian daun yang terinfeksi penyakit tersebut
METODE PENELITIAN
Gambar 2. Citra cropping dari gambar daun tembakau
Pembagian Citra Data Latih Dan Data Uji Gambar 1. Blok diagram sistem keseluruhan Penelitian ini menggunakan masukan berupa citra cropping penyakit daun tembakau yang berukuran 96 x 96 piksel. Citra tersebut kemudian dibagi menjadi 2 bagian yakni citra data latih dan citra data uji (1). Kemudian citra data latih dan citra data uji diubah sifatnya dari RGB menjadi grayscale dengan menggunakan fungsi rgb2gray pada MATLAB. Setelah itu dicari ekstraksi fitur GLCM yang terdiri dari fitur contrast, correlation, energy dan homogeneity dengan menggunakan sudut 0˚, 45˚, 90˚ dan 135˚ dengan jarak piksel dari 1 sampai 10 piksel (2). Untuk data latih dilakukan pembelajaran SVM untuk didapat fungsi dari pemisah (hyperplane)
Setelah didapat sejumlah citra penyakit daun tembakau, maka dari kumpulan hasil cropping tersebut dibagi menjadi citra data latih dan citra data uji dalam folder berbeda. Total citra data latih sebanyak 58 citra dengan rincian citra 1 sampai citra 29 adalah citra data latih penyakit bercak karat dan citra 30 sampai 58 adalah citra penyakit lanas. Kemudian citra data latih diletakkan pada 1 folder. Untuk memudahkan pembagian kelas, jumlah citra untuk tiap-tiap jenis penyakit harus sama. Serta folder dari citra data latih direktorinya harus sama dengan folder dari sistem analisis yang akan dibuat. Citra data uji sebanyak 30 citra dengan rincian citra 1 sampai citra 15 adalah citra data uji untuk penyakit bercak karat dan
Nauval Zabidi Kurniawan, Susijanto Tri Rasmana, Yosefine Triwidyastuti JCONES Vol. 5, No. 1 (2016) Hal: 159
citra 16 sampai citra 30 adalah citra penyakit lanas. Dan kumpulan citra data uji diletakkan pada folder terpisah dengan folder data latih tetapi tetap dalam 1 direktori dengan folder dari sistem analisis.
Grayscalling
analisis tekstur yang diperkenalkan oleh Haralick tahun 1973 (Mulkan S., 2012). Dalam membuat matriks GLCM digunakan 2 variabel utama, yaitu orientasi sudut (θ) dan jarak piksel (d). Pada penelitian ini digunakan orientasi sudut (θ) 0˚, 45˚, 90˚, 135˚ dan jarak piksel (d) yang digunakan mulai dari 1 sampai 10 piksel.
Grayscalling adalah proses perubahan warna dari citra dari berwarna menjadi keabuan. Grayscalling citra diperlukan karena GLCM mengekstraksi fitur dengan memperhitungkan level aras keabuan ketetanggaan. Pengubahan dari citra berwarna menjadi bentuk grayscale biasanya mengikuti aturan seperti berikut : I(i, j) = R(i, j) + G(i, j) + B(i, j) (1) 3 Dimana : I(i, j) = Intensitas citra grayscale R(i, j) = Intensitas warna merah dari citra asal G(i, j) = Intensitas warna hijau dari citra asal B(i, j) = Intensitas warna biru dari citra asal Dalam sistem ini, grayscalling dilakukan pada citra data latih dan citra data uji. Untuk melakukan grayscalling di MATLAB, bisa menggunakan fungsi : I = rgb2gray(„variabel_citra‟) Gambar 3 adalah contoh hasil dari proses grayscalling dimana citra yang atas adalah citra yang bersifat RGB dan citra yang bawah adalah citra yang telah diubah menjadi grayscale.
Gambar 3. Citra RGB (atas) dan citra grayscale (bawah)
Gray Level Co-occurrence Matrix Setelah dilakukan grayscalling, maka dicari matriks GLCM. Gray Level CoOccurrence Matrix (GLCM) merupakan metode yang paling sering digunakan untuk
Gambar 4. Ilustrasi dari orientasi sudut dan jarak piksel Co-occurrence matriks adalah matriks bujur sangkar dengan jumlah elemen sebanyak kuadrat jumlah level intensitas piksel pada citra. Setiap titik (i,j) pada matriks kookurensi berorientasi berisi peluang kejadian piksel bernilai (i) bertetangga dengan piksel bernilai (j) pada jarak (d) serta orientasi (180 − θ) (Pradnyana I., 2015). Tahapan dalam membuat matriks kookurensi adalah : 1. Membuat area kerja matriks. 2. Menentukan hubungan spasial antara piksel referensi dengan piksel tetangga dengan memperhatikan nilai sudut (θ) dan jarak piksel (d). 3. Menghitung jumlah kookurensi dan mengisikannya pada area kerja matriks. 4. Menjumlahkan matriks kookurensi dengan transposenya untuk menjadikan simetris. 5. Normalisasi matriks untuk mengubahnya ke bentuk probabilitas. Ekstraksi Fitur – Fitur GLCM Setelah didapat matriks kookurensi GLCM, dilanjutkan dengan mencari nilai fiturfitur dari GLCM. Dalam penelitian ini, fitur GLCM yang digunakan antara lain fitur energy, contrast, correlation dan homogeneity dari 4 orientasi sudut dengan jarak piksel 1 sampai 10. Berikut penjelasan dari masingmasing fitur (Hartadi, 2011).
1. Contrast
Contrast menunjukkan ukuran penyebaran (momen inersia) elemen-elemen matriks citra. Jika letaknya jauh dari diagonal utama, maka nilai kekontrasannya besar. Nauval Zabidi Kurniawan, Susijanto Tri Rasmana, Yosefine Triwidyastuti JCONES Vol. 5, No. 1 (2016) Hal: 160
Secara visual, nilai kekontrasan adalah ukuran variasi antar derajat keabuan suatu daerah citra. 𝑁−1
𝑃(𝑖,𝑗 ) (𝑖 − 𝑗)2
(2)
𝑖,𝑗 =0
Dimana : P(i,j) = nilai elemen matriks kookurensi
2. Correlation Correlation menunjukkan ukuran ketergantungan linear derajat keabuan citra sehingga dapat memberikan petunjuk adanya struktur linear dalam citra. 𝑁−1
𝑃 𝑖,𝑗 [
𝑖−𝜇𝑥 (𝑗 − 𝜇𝑦 )
𝑖,𝑗 =0
(𝜎𝑥 2 )(𝜎𝑦 2 )
]
Kelinearan Nilai Fitur GLCM Setelah didapat nilai ekstraksi fitur GLCM, maka tahap selanjutnya adalah menentukan kelinearan citra tersebut dengan menggunakan Microsoft Office Excel secara manual dengan melihat pesebaran nilai fitur GLCM. Apabila dari hasil ekstraksi tersebut didapat bahwa citra tersebut bisa dipisahkan secara linear, maka penggunaan kernel untuk pelatihan SVM adalah kernel linear (default). Sedangkan jika hasil ekstraksi menunjukkan bahwa hasil tersebut tidak linear, maka diperlukan kernel untuk menyelesaikannya. Berikut pesebaran nilai fitur GLCM :
(3)
Dimana : µx = nilai rata-rata elemen kolom pada matriks Pθ(i , j) µy = nilai rata-rata elemen baris pada matriks Pθ(i , j) σx = nilai standar deviasi elemen kolom pada matriks Pθ(i , j) σy = nilai standar deviasi elemen baris pada matriks Pθ(i , j)
Gambar 5. Pesebaran nilai fitur contrast
3. Energy Energy menunjukkan ukuran konsentrasi pasangan intensitas pada matriks kookurensi. Nilai energy makin membesar bila pasangan piksel yang memenuhi syarat matriks intensitas kookurensi terkonsentrasi pada beberapa koordinat dan mengecil bila letaknya menyebar.
Gambar 6. Pesebaran nilai fitur correlation
𝑁=1
𝑃(𝑖,𝑗 ) 2
(4)
𝑖,𝑗 =0
Gambar 7. Pesebaran nilai fitur energy
4. Homogeneity Homogeneity menunjukkan kehomogenan variasi intensitas dalam citra. Citra homogen akan memiliki nilai homogeneity yang besar. Nilai homogeneity membesar bila variasi intensitas dalam citra mengecil dan sebaliknya. 𝑁−1
𝑖,𝑗 =0
𝑃(𝑖,𝑗 ) 1 + (𝑖 − 𝑗)2
(5)
Gambar 8. Pesebaran nilai fitur homogeneity
Gambar 5 sampai gambar 8 merupakan pesebaran dari nilai tiap fitur GLCM dari citra data latih. Dari gambar tersebut terlihat bahwa nilai fitur GLCM Nauval Zabidi Kurniawan, Susijanto Tri Rasmana, Yosefine Triwidyastuti JCONES Vol. 5, No. 1 (2016) Hal: 161
menunjukkan ketidaklinearan (tidak bisa dipisahkan secara linear), sehingga diperlukan modifikasi SVM dengan menambahkan fungsi kernel agar SVM mampu memisahkan nilai fitur dari penyakit bercak karat dan penyakit lanas dan didapat fungsi pemisah (classifier/hyperplane) dari data nilai fitur tersebut.
Tabel 1. Hasil ekstraksi fitur contrast dan correlation pada 5 citra pertama data uji
Tabel 2. Hasil ekstraksi fitur energy dan homogeneity pada 5 citra pertama data uji
Pembagian Kelas Pembagian kelas jenis penyakit adalah tahap dimana dari 58 data latih tersebut diklasifikasikan berdasarkan jenis penyakitnya. Citra 1 sampai 29 merupakan citra data latih untuk jenis penyakit bercak karat dan citra 30 sampai 58 merupakan citra data latih untuk jenis penyakit lanas. Pembagian kelas ini diperlukan untuk mengklasifikasikan nilai fitur GLCM dari data latih agar nanti sistem mampu mengklasifikasikan nilai fitur GLCM dari citra data uji dan didapatkan keluaran yang diinginkan.
Pelatihan SVM Pelatihan SVM data latih ini bertujuan untuk pembelajaran dari SVM untuk mengklasifikasikan data latih sesuai dengan jenis penyakit. Pengklasifikasian data latih ini disesuaikan dari nilai ekstraksi fitur GLCM dari data latih dengan pembagian kelas jenis penyakit, sehingga didapat fungsi pemisah (classifier/hyperplane) yang optimal yang bisa memisahkan data latih dari 2 kelas jenis penyakit. Pada pelatihan ini digunakan function ‘svmtrain’ dengan tambahan fungsi kernel gaussian (rbf) dan fungsi kernel polynomial untuk mengklasifikasikan antara fitur GLCM yang telah didapat dengan pembagian kelas. Dan hasil dari pelatihan klasifikasi SVM disimpat dalam file „SVMStruct.mat‟ agar nanti bisa digunakan sebagai pengklasifikasi untuk data uji.
HASIL DAN PEMBAHASAN Ekstraksi Fitur GLCM Ekstraksi fitur GLCM didapat ketika citra data telah diubah dari RGB menjadi grayscale. Sehingga akan didapat nilai fitur GLCM berupa nilai fitur energy, contrast, correlation dan homogeneity.
Dari tabel 1 dan 2 terlihat bahwa ekstraksi fitur GLCM telah didapat. Untuk tiap fitur didapat nilai ekstraksi dari sudut 0˚, 45˚, 90˚ dan 135˚.
Hasil Klasifikasi SVM 1. Menggunakan Kernel RBF Pengujian menggunakan kernel rbf menghasilkan tingkat akurasi tertinggi sebesar 77% pada jarak piksel 2 piksel. Rata-rata data yang salah pada pengujian dengan kernel rbf sebanyak 8 data. Hasil pengujian menggunakan kernel RBF adalah sebagai berikut : Tabel 3. Hasil klasifikasi dengan kernel rbf
2.
Menggunakan Kernel Polynomial
Pengujian menggunakan kernel polynomial menghasilkan tingkat akurasi tertinggi sebesar 80% pada jarak piksel 1, 2, 3, 5 dan 6 piksel. Rata-rata data yang salah pada pengujian dengan kernel polynomial sebanyak 7 data. Hasil pengujian menggunakan kernel polynomial adalah sebagai berikut :
Nauval Zabidi Kurniawan, Susijanto Tri Rasmana, Yosefine Triwidyastuti JCONES Vol. 5, No. 1 (2016) Hal: 162
Tabel 4. Hasil klasifikasi dengan kernel polynomial
Gambar 9. Grafik persentase keberhasilan kernel RBF dan polynomial
KESIMPULAN Berdasarkan dari hasil evaluasi dan pengujian yang sudah dilakukan dalam penelitian “Identifikasi Jenis Penyakit Daun Tembakau Menggunakan Metode Gray Level Co-Occurrence Matrix (GLCM) Dan Support Vector Machine (SVM)” ini, sehingga dapat disimpulkan sebagai berikut: 1. Ekstraksi fitur citra daun tembakau menggunakan Gray Level Co-occurrence Matrix berhasil dilakukan. Hal ini terbukti dengan didapat nilai-nilai dari fitur GLCM dengan orientasi sudut 0˚, 45˚, 90˚ dan 135˚ dan jarak piksel mulai dari 1 sampai 10 piksel. 2. Klasifikasi dengan menggunakan Support Vector Machine dari nilai fitur GLCM dapat dilakukan, terbukti dengan hasil keluaran yang didapat dari penelitian ini cukup tinggi, yakni sebesar 74%. Klasifikasi menggunakan gaussian (rbf) menghasilkan tingkat keberhasilan tertinggi sebesar 77% pada jarak piksel 2 piksel. Sedangkan untuk kernel polynomial didapat tingkat keberhasilan tertinggi sebesar 80% pada jarak piksel 1, 2, 3, 5 dan 6 piksel.
DAFTAR PUSTAKA Budiarso, Z. 2010. Identifikasi Macan Tutul Dengan Metode Gray Level Co-occurrence Matrix (GLCM). Skripsi Tidak Diterbitkan. Semarang: Universitas Stikubank.
Direktorat Jenderal Perkebunan. 2011. Pengenalan dan Pengendalian Penyakit Lanas (Phytophthora parasitica var. nicotianae) pada Tanaman Tembakau. Jakarta: Kementerian Pertanian. Fithri, D. 2013. Deteksi Penyakit Pada Daun Tembakau Dengan Menerapkan Algoritma Artificial Neural Network. Kudus: Universitas Muria Kudus. Ganis, Y. 2011. Klasifikasi Citra Dengan Matriks Ko-okurensi Aras Keabuan (Gray Level Co-occurrence Matrix) Pada Lima Kelas Biji-bijian. Skripsi Tidak Diterbitkan. Semarang: Universitas Diponegoro. Gunawan, A. 2014. Identifikasi Jenis Kayu Menggunakan Support Vector Machine Berbasis Data Citra. Jurnal Ilmu Komputer Agri-Informatika, 3(1): 1 – 8. Hartadi, R. 2011. Deteksi Potensi Kanker Payudara Pada Mammogram Menggunakan Metode Gray Level CoOccurrence Matrices. Skripsi Tidak Diterbitkan. Semarang : Universitas Diponegoro. Mabrur, A. 2011. Pengolahan Citra Digital Menggunakan MATLAB. Tulungagung. Nainggolan, D. 2011. Implementasi Jaringan Saraf Tiruan Untuk Mendeteksi Penyakit Tembakau (Nicotiana Tabacum L) Dengan Metode Backpropagation. Skripsi Tidak Diterbitkan. Medan: Universitas Sumatera Utara. Nugroho, A., Witarto, A., dan Handoko, D. 2003. Support Vector Machine – Teori dan Aplikasinya dalam Bioinformatika. (Online). (http://ilmukomputer.com, diakses 16 Desember 2015). Pradnyana, I. 2015. Perancangan Sistem Pendeteksi Genangan Air Potensi Perkembangbiakan Nyamuk Melalui Foto Citra Udara Dengan Metode Gray Level Co-Occurrence Matrix (GLCM). Skripsi Tidak Diterbitkan. Bandung: Universitas Telkom. Santosa, B. 2005. Tutorial Support Vector Machine. Surabaya: Institut Teknologi Sepuluh Nopember. Semangun, H. 2000. Penyakit – Penyakit Tanaman Perkebunan di Indonesia. Yogyakarta: Gadjah Mada University Press.
Nauval Zabidi Kurniawan, Susijanto Tri Rasmana, Yosefine Triwidyastuti JCONES Vol. 5, No. 1 (2016) Hal: 163