Seminar Nasional Teknologi Informasi dan Multimedia 2015
ISSN : 2302-3805
STMIK AMIKOM Yogyakarta, 6-8Februari 2015
DETEKSI DAN KLASIFIKASI DAUN MENGGUNAKAN METODE ADABOOST DAN SVM Zaki Imaduddin1), Hilmy Abidzar Tawakal2) 1), 2)
Teknik Informatika Sekolah Tinggi Teknologi Terpadu Nurul Fikri Kampus A, Sekolah Tinggi Teknologi Terpadu Nurul Fikri. Jl. Margonda Raya No. 522, Depok Email :
[email protected]),
[email protected]) Abstrak Daun merupakan salah satu organ dari tumbuhan yang sering digunakan untuk membedakan jenis tumbuhan. Banyak penelitian dibidang pengolahan citra yang mencoba untuk melakukan proses klasifikasi tumbuhan dengan melakukan klasifikasi daun [3][14][15]. Namun, penelitian-penelitian tersebut mensyaratkan agar citra daun yang digunakan sebagai masukan diambil dari sample daun yang berada dalam keadaan utuh dan baik. Pada kenyataannya tidak setiap saat sample daun dapat diperoleh dengan mudah, pada pohon yang tinggi misalnya atau pada kondisi dimana dibutuhkan proses pengenalan yang cepat. Sampai saat ini belum ada penelitian yang melakukan proses deteksi objek daun secara otomatis sekaligus melakukan pengenalan terhadap objek daun tersebut. Pada penelitian ini diajukan metode yang mampu untuk melakukan pengenalan jenis daun tanpa harus mendapatkan sample daun secara utuh. Metode yang diajukan mampu mendeteksi secara otomatis letak daun serta mengenali jenis dari daun yang terdeteksi tersebut. Hasil penelitian yang didapat dengan metode deteksi menggunakan metode AdaBoost menghasilkan akurasi sebesar 84,23%. dan dengan menggunakan metode klasifikasi SVM, akurasi yang dihasilkan sebesar 71%, sedangkan dengan menggunakan kedua metode tersebut hasil yang didapatkan mencapai 51,68% Kata kunci: AdaBoost, SVM, Haar Like Fitur, LBP 1. Pendahuluan Tumbuhan merupakan salah satu bagian yang terpenting dalam kehidupan, terdapat berbagai macam jenis tumbuhan, Ahli botani asal Amerika Serikat dan Inggris, Rabu (29/12/10), meresmikan pembuatan database tumbuhan terlengkap di dunia. Database tersebut dibuat untuk membantu program para ahli konservasi, pembuat obat dan peneliti pertanian. Database yang bisa diakses di www.theplantlist.org tersebut memuat 1,25 juta nama tumbuhan. Data-data tanaman pertanian seperti gandum dan padi hingga tanaman hias seperti bunga mawar dan paku-pakuan liar [1] dan di indonesia sendiri terdapat lebih dari 38.000 spesies tumbuhan [2] yang tersebar diberbagai wilayah dan perhutanan indonesia, Namun dalam hal ini para
peneliti hanya menggunakan sebagian kecil dari data tumbuhan, yang kemudian diolah menggunakan metode tertentu hingga menghasilkan klasifikasi atau identifikasi objek yang cukup akurat. Identifikasi tanaman didasari pada pengamatan organnya, yaitu tunas, daun, buah, batang, dll dan informasi yang paling akurat mengenai identifikasi taksonomi tumbuhan terletak pada daunnya, dimana bagian tersebut terdapat berbagai karakteristik yang mewakili tumbuhan tersebut, diantaranya adalah bentuk, warna dan tekstur [3]. Penelitian mengenai bagaimana mengenali jenis tumbuhan dengan mengenali daun telah banyak dilakukan. Pendekatan dan metode yang digunakanpun berbeda-beda. Pada penelitian [4] daun diklasifikasikan dengan menggunakan ciri betuk (fitur morfologi), dan tekstur. Fitur morfologi yang digunakan menggunakan 5 basic fitur, sedangkan fitur tekstur didapatkan dengan menggunakan Gray-Level Co-occurrence Matrix (GLCM). Selanjutnya kedua fitur tersebut digabungkan dengan menggunakan PNN. Dengan menggunakan dataset daun dari flavia, akurasi dari model tersebut adalah 93.0833% Serupa dengan penelitian [4], penelitian [5] juga menggunakan fitur morfologi dan tekstur, namun pada penelitian [5] kedua fitur tersebut digunakan sebagai classifier untuk meningkatkan efisiensi dalam pengambilan keputusan. Penggunaan fitur morfologi untuk klasifikasi daun memberikan peningkatan pada tingkat akurasi. Namun penggunaan fitur tersebut juga memberikan beban komputasi tambahan yang membuat proses klasifikasi menjadi lebih lambat. Pada penelitian ini, jumlah fitur yang digunakan dibatasi untuk meningkatkan performa dari classifier, hal ini dilakukan untuk memudahkan sistem dijalankan pada perangkat bergerak dengan sumber daya terbatas (mobile devices). Fitur yang digunakan pada penelitian ini adalah fitur tekstur. Sampai saat ini belum ada penelitian yang melakukan proses pengenalan daun langsung pada pohon atau lokasi lain yang tidak ideal. Seluruh penelitian yang ada mengharuskan adanya citra daun dari sample daun yang sudah dikondisikan. Pada penelitian ini citra daun yang digunakan sebagai citra masukan dapat berupa citra daun
3.2-43
ISSN : 2302-3805
Seminar Nasional Teknologi Informasi dan Multimedia 2015 STMIK AMIKOM Yogyakarta, 6-8Februari 2015
yang berada pada kondisi alamiah seperti pada pohon atau diantara beberapa jenis daun lainnya. Metode yang diajukan pada penelitian ini memungkinkan sistem secara otomatis mendeteksi objek daun diantara objek-objek lain pada citra masukan untuk kemudian dikenali jenis tanaman dari objek daun yang terdeteksi tersebut. Gambar 1 menggambarkan bagaimana alur dari sistem yang dikembangkan.
menyesuaikan diri dengan data dan metode classifier yang lainnya. Dinamakan boosting karena algortima ini dapat mengurangi kesalahan dari weak classifier dan meningkatkan akurasi dari setiap algoritma pembelajaran yang diberikan. Hal ini dikarenakan pada dasarnya AdaBoost dimunculkan untuk mampu mengurangi kesalahan dalam proses pembelajaran [9]. Algoritma AdaBoost disusun dengan menggunakan persamaan dibawah ini: Data citra diberikan label ( 1, 1), … , ( , ) dimana = 0,1 untuk data negatif dan positif berturut-turut.
Untuk setiap citra training, diberi koordinat( , ) dengan = 0 untuk citra yang tidak mengandung object (citra negatif), dan = 1 untuk citra berisi object (citra positif). Gambar 1. Proses Deteksi dan Klasifikasi Secara umum proses yang dilakukan oleh sistem terdiri dari dua tahap, yaitu proses deteksi dan klasifikasi. Pada proses deteksi, dideteksi letak objek daun pada citra masukan. Proses ini dilakukan dengan menggunakan algoritma AdaBoost. Setelah objek daun terdeteksi proses selanjutnya adalah mengenali jenis daun. Proses pengenalan dilakukan dengan menggunakan fitur tekstur. Fitur tekstur pada daun dihitung dengan algoritma LBP (Local Binary Pattern). Classifier yang digunakan untuk melakukan proses klasifikasi adalah dengan SVM (Support Vector Machine).
Inisialisasikan bobot , = berturut-turut, di mana dan dan positif berturut-turut.
Setiap citra diberi bobot awal yang sama, untuk citra negatif, dan
Untuk = 1, … , : 1.
2.
3. 4.
2. Pembahasan
Adaptive Boosting (AdaBoost) AdaBoost singkatan dari Adaptive Boosting, merupakan algoritma machine learning yang tercipta dari kumpulan weak classifier yang dibentuk menjadi menjadi strong classifier [7]. Adaboost diperkenalkan oleh Freund dan Schapire pada tahun 1995 [8]. Dinamakan adaptive karena algoritma ini dapat
untuk
citra positif. Di mana m adalah jumlah total citra negatif, dan l adalah jumlah total citra positif yang digunakan dalam proses training.
Untuk menguji model dari sistem yang telah dikembangkan, dilakukan dengan tiga tahap. Tahap pertama menguji kemampuan dari proses deteksi. Pengujian dilakukan dengan memberikan citra masukan berupa gambar yang terdiri dari beberapa objek daun dalam satu gambar. Pengujian tahap kedua adalah menguji tingkat akurasi dari proses klasifikasi. Pada pengujian ini dilakukan dengan mengunakan dataset flavia [6]. Pengujian ketiga dilakukan dengan menggabungkan keedua tahap yaitu deteksi dan klasifikasi.
Pada bagian ini akan dibahas mengenai masing-masing tahap dalam metode yang diajukan. Tahap pertama adalah proses deteksi dengan menggunakan algoritma AdaBoost, Tahap kedua adalah klasifikasi dengan classifier SVM
, untuk = 0,1 adalah jumlah negatif
Normalisasikan bobot, ←
,
,
∑
,
Untuk setiap fitur, , latih sebuah classifier ℎ yang dibatasi agar menggunakan sebuah fitur tunggal. Kesalahan dievaluasi sehubungan dengan ,
|ℎ ( ) −
=
|
Pilih classifier,ℎ , dengan kesalahan terendah ∈. Perbaharui bobot: ,
=
,
dimana = 0 jika data diklasifikasi dengan benar, = 1 jika sebaliknya, dan = .
Untuk menentukan satu classifier terbaik diperlukan beberapa iterasi perhitungan seperti menghitung error dan update bobot. Hasil perolehan fitur yang memiliki fitness function paling optimal atau error yang paling rendah maka dia yang akan masuk ke classifier pertama.
3.2-44
( )=
ℎ( )
ISSN : 2302-3805
Seminar Nasional Teknologi Informasi dan Multimedia 2015 STMIK AMIKOM Yogyakarta, 6-8Februari 2015
Hal ini dilakukan secara berulang selama iterasi tertentu hingga didapatkan weak classifier terpilih untuk menentukan keberadaan objek yang ditempatkan pada masing-masing stage yang telah terbentuk dengan metode AdaBoost.
Proses deteksi dengan Adaptive Boosting (AdaBoost)
Semua persamaan ini diambil dari sumber referensi [10]. Ekstraksi Fitur (Feature Extraction) Haar-like Feature merupakan metode untuk mengekstraksi fitur dari sebuah gambar. Nama Haar diinspirasi oleh nama Haar Wavelets [11]. Keuntungan dalam menggunakan metode Haar-like ialah: 1.
Model yang lebih representatif untuk membedakan bermacam pola visual seperti citra pejalan kaki, objek dan citra USG jantung [12].
2.
Proses komputasi yang lebih efisien dengan memanfaatkan Integral Images [13].
Gambar 2. Tipe dari Haar-like Feature Perhitungan pada Haar fitur ialah menentukan nilai ratarata dari sisi yang berwana putih dikurangi dengan nilai rata-rata dari sisi yang berwarna hitam. Berikut persamaan untuk perhitungan nilai fitur dengan menggunakan Haar-like Feature: f(x) = sum(Rblack) – sum(Rwhite) Hasil dari deteksi daun menggunakan AdaBoost dan fitur Haar like dapat dilihat pada gambar 3 dibawah ini.
Gambar 4. Proses ekstraksi fitur dan deteksi dengan Haar-like dan AdaBoost Langkah yang digunakan untuk mendeteksi daun ialah melalui proses training dan testing, dimana hal tersebut dapat dilihat pada gambar 4 diatas, dengan penjelasan sebagai berikut: Proses Training: 1. Mengambil sampel daun sebesar 70% dari tiap spesies daun (total 1.335 daun) dari total keseluruhan daun sebanyak 1.907. 2. Lakukan proses ekstraksi fitur dengan menggunakan haar-like fitur pada setiap inputan citra yang berasal dari no 1, dengan mengambil setiap nilai dari tiap-tiap pixel pada semua citra daun, sehingga fitur yang didapatkan dari proses ekstraksi seluruh citra daun bisa lebih dari 100.000 fitur. 3. AdaBoost digunakan untuk melakukan seleksi fitur, dimana fitur-fitur yang dianggap mewakili masing-masing spesies daun (32 jenis) di seleksi dan dibagi-bagi atau dikelompokan berdasarkan Cascade (deretan classifier). 4. Hasil dari Cascade (deretan classifier) di convert menjadi file xml, yang selanjutnya file tersebut digunakan untuk proses testing. Proses Testing: 5.
Gambar 3. Deteksi 3 jenis daun dalam 1 citra
6.
3.2-45
Mengambil sample daun sebesar 30% dari sisa tiap spesies daun (total 572 daun) dari total keseluruhan daun sebanyak 1.907 kemudian mengelompokan daun berdasarkan 3 jenis daun yang berbeda yang diletakan dalam 1 citra yang diperlihatkan pada gambar 4. Melakukan penyocokan nilai fitur dari tiap gambar dengan cara sistem menelusuri tiap pixel dari citra daun, dan mencari nilai fitur yang sama. Agar proses pencarian bisa lebih cepat, maka digunakan metode integral image, hal ini dilakukan agar proses perhitungan dalam pencarian kecocokan nilai antara citra testing dan
ISSN : 2302-3805
Seminar Nasional Teknologi Informasi dan Multimedia 2015 STMIK AMIKOM Yogyakarta, 6-8Februari 2015
7.
8.
hasil fitur yang sudah diseleksi bisa lebih cepat digunakan. Peranan AdaBoost pada proses testing ialah melakukan seleksi objek sekaligus penentuan posisi dan keberadaan daun dengan ditandai oleh deteksi kotak yang terlihat pada langkah 8. Hasil deteksi menggunakan Metode AdaBoost dan fitur Haar-like. Input sebelumnya yang dimulai dari langkah 5, menggunakan 3 daun dari jenis berbeda yang di sejajarkan dalam 1 citra, menghasilkan output berupa terdeteksinya semua jenis daun yang terlihat pada gambar 4.
Support Vector Machine Support Vector Machine merupakan teknik klasifikasi yang masih relatif baru, teknik ini telah banyak digunakan oleh para peneliti untuk menyelesaikan permasalahan mengenai komputasi, dalam metode ini, kita berusaha untuk menentukan fungsi hiperplane atau klasifier terbaik antara fungsi yang tidak terbatas jumlahna untuk memisahkan dua macam objek, Hyperplane terbaik adalah hyperplane yang terletak di tengah-tengah antara set objek dari dua kelas, mencari hyperplane terbaik ekuivalen dengan maksimal margin atau jarak antara dua objek dari kelas yang berbeda.
dalam kasus ini, peneliti menggunakan SVM untuk melakukan pengenalan daun berdasarkan jenisnya. dibantu dengan metode ekstraksi fitur yaitu LBP, Local Binary Pattern merupakan metode texture deteksi yang digunakan untuk mengambil pola daun tulang daun, hasil penggabungan dari kedua metode tersebut maka sistem pengenalan daun dapat berjalan dengan akurasi yang sudah lumayan baik yaitu 71%. AdaBoost-SVM Dengan menggunakan AdaBoost, letak dari objek daun dalam sebuah citra dapat dideteksi. Setelah ditiap-tiap objek daun ditemukan, langkah selanjutnya adalah melakukan proses pengenalan terhadap jenis daun tersebut. Untuk membedakan jenis tanaman berdasarkan daunnya, perlu diketahui ciri atau karakteristik masing-masing daun. Ciri atau karakteristik ini dapat disebut sebagai fitur. Berdasarkan penelitian-penelitian mengenai klasifikasi jenis tanaman berdasarkan citra daun, ciri atau fitur yang banyak digunakan adalah fitur bentuk dan tekstur. Salah satu cara untuk mengetahui fitur tekstur dalam citra (ekstraksi fitur) adalah dengan menggunakan LBP (Local Binary Pattern). setelah didapatkan fitur tekstur dari masing-masing citra, selanjutnya dilakukan proses pembelajaran untuk mendapatkan parameter yang dapat digunakan untuk membedakan jenis daun berdasarkan fitur tekstur. Salah satu metode pembelajaran yang cukup baik untuk membedakan proses klasifikasi adalah SVM (Support Vector Machine).
Gambar 6. Proses pembelajaran (Training)
Gambar 5. Confuse Matriks Table matrix diatas menjelaskan tentang pola pengenalan daun berdasarkan pembandingnya/ ground truth. kotak yang mengandung nilai-nilai diatas merupakan tingkat akurasi yang dapat dibaca sistem berdasarkan tinGkat prediksi daun berdasarkan daun yang sebenarnya. Support Vector Machine (SVM) merupakan sebuah metode yang digunakan untuk mengklasifikasikan data,
Gambar 7. Proses Klasifikasi Proses Klasifikasi dengan Support Vector Machine (SVM) Untuk dapat melakukan proses klasifikasi dibutuhkan pemilihan fitur yang tepat. Fitur yang banyak dipakai dalam penelitian mengenai klasifikasi daun antara lain
3.2-46
Seminar Nasional Teknologi Informasi dan Multimedia 2015
ISSN : 2302-3805
STMIK AMIKOM Yogyakarta, 6-8Februari 2015
fitur warna, bentuk, dan tekstur. Pada penelitian ini hanya akan digunakan satu fitur saja yaitu fitur tekstur. Hanya dipilih satu tesktur saja untuk mengurangi beban komputasi agar proses klasifikasi menjadi lebih cepat karena sesuai dengan tujuan dikembangkannya sistem ini. Proses ekstraksi fitur tekstur menggunakan metode LBP (Local Binary Pattern). Proses klasifikasi menggunakan classifier SVM. Proses klasifikasi dengan SVM diawali dengan proses training. Pada proses training data masukan berupa citra daun dengan label berupa kelas (jenis daun) dari masingmasing citra. Citra daun yang digunakan sebagai dataset adalah dataset flavia yang merupakan dataset yang bebas untuk digunakan. Dari proses training akan didapatkan nilai parameter-parameter model. Dari hasil perpaduan antara kedua metode diatas, dapat dilihat pada gambar di bawah ini.
Jumlah Terdeteksi
3 2,5 2 1,5 1
Daun
0,5 1 17 33 49 65 81 97 113 129
0 Jumlah Daun Gambar 8. Grafik Hasil Deteksi dan Klasifikasi Dari grafik diatas terlihat bahwa metode yang diusulkan pada paper ini sudah berhasil mendeteksi secara lengkap berdasarkan jenis daunnya melalui 3 citra daun yang berbeda didalam 1 gambar dan masing-masing sudah dibagi menjadi 136 kelompok citra daun, dan berhasil mendapatkan akurasi sebesar 51,68%. Contoh Hasil deteksi dan klasifikasi dapat dilihat pada gambar dibawah ini.
Gambar 9. Salah satu contoh Hasil Deteksi dan Klasifikasi
hanya fitur tekstur, dimana fitur ini tidak cukup untuk membantu proses klasifikasi daun, Hasil penelitian yang didapat dari proses deteksi dan klasifikasi ini adalah dengan metode deteksi menggunakan metode AdaBoost menghasilkan akurasi sebesar 84,23%. dan dengan menggunakan metode klasifikasi SVM akurasi yang dihasilkan sebesar 71%, sedangkan dengan menggunakan kedua metode tersebut hasil yang didapatkan mencapai 51,68%. Daftar Pustaka [1] The Plant List (2010). Version 1 Published on internet. http://www.theplantlist.org. Accessed on 12 March 2012. [2] Bappenas. 2003. Indonesia Biodiversity Strategy and Action Plan 2003-2020. Jakarta: Bappenas. [3] Mouine Sofiene, Yahiaoui Itheri, Blondet Anne Verroust “A shape based approach for leaf classification using multiscale triangular representation” Third ACM International Conference on Multimedia Retrieval 2013. [4] Kadir, A., Nugroho, L. E., Susanto, A., & Santosa, P. I. (2011c). Neural network application on foliage plant identification.International Journal of Computer Applications, 29, 15-22 [5] Y. Herdiyeni et al.,“A computer aided system for tropical leaf medicinal plant identification.”IJASEIT, vol. 3, no. 1, pp. 23-27, 2013. [6] S. Wu, F. Bao, E. Xu, Y.-X. Wang, Y.-F. Chang, and Q.-L. Xiang. A leaf recognition algorithm for plant classification using probabilistic neural network. In Signal Processing and Information Technology, 2007 IEEE International Symposium on, pages 11 – 16, dec. 2007. [7] C. Ruan, Q. Ruan, and X. Li, “Real Adaboost feature selection for Object Recognition,” in IEEE 10th International Conference On Signal Processing Proceeding , pp. 1402–1405, 2010. [8] Yoav Freund and Robert E. Schapire. A decision-theoretic generalization of on-line learning and an application to boosting. Journal of Computer and System Sciences, 55(1):119.139, August 1997. [9]Yoav Freund Robert E. Schapire, "A Short Introduction to Boosting," Journal of Japanese Society for Artificial Intelligence, pp. 771-780, September 1999. [10]Viola, Paul A. and Jones, Michael J. "Rapid Object Detection using a Boosted Cascade of Simple Features", IEEE CVPR, 2001. [11]M. Oren, C. Papageorgiou, P. Sinha, E. Osuna, and T. Poggio, “Pedestrian detection using wavelet templates,” in IEEE Conf. Comput. Vis. Pattern Recognit., pp. 193–199, 1997. [12]B. Georgescu, X. Zhou, D. Comaniciu, and A. Gupta, “Databaseguided segmentation of anatomical structures with complex appearance,” in IEEE Conf. Comput. Vis. Pattern Recognit., vol. 2, pp. 429–436, 2005. [13]R. Raghavendra, B. Dorizzi, A. Rao, and G. K. Hemantha, “PSO versus AdaBoost for feature selection in multimodal biometrics,” in 2009 IEEE 3rd International Conference on Biometrics: Theory, Applications, and Systems, pp. 1–7, 2009. [14]Karuna,G, Sujatha,B & Reddy Chandrasekhar, P "WaSS: A Novel Hybrid Method for Object Recognition Using Wavelet based Statistical and Structural Approaches" IJCSI International Journal of Computer Science Issues, Vol. 11, Issue 4, No 2, July 2014. [15]K.Singh,I. Gupta, &S. Gupta, “SVM-BDT PNN and Fourier Moment Technique for Classification of Leaf Shape”.International Journal of Signal Processing, Image Processing and PatternRecognition,vol.3(4), pp. 67-78,2010.
3. Kesimpulan Penelitian ini bertujuan untuk mengetahui secara langsung semua jenis daun yang ada dalam sebuah gambar, hasil eksperimen menunjukkan tingkat akurasi yang masih rendah, dikarenakan fitur yang digunakan
3.2-47
Seminar Nasional Teknologi Informasi dan Multimedia 2015 STMIK AMIKOM Yogyakarta, 6-8Februari 2015
Biodata Penulis Zaki Imaduddin, memperoleh gelar Sarjana Teknik (S.T), Jurusan Teknik Elektro Universitas Muhammadiyah Malang, lulus tahun 2008. Memperoleh gelar Magister Komputer (M.Kom) Program Pasca Sarjana Magister Ilmu Komputer Universitas Indonesia Depok, lulus tahun 2013. Saat ini menjadi Dosen di Sekolah Tinggi Teknologi Terpadu Nurul Fikri, Depok. Hilmy Abidzar Tawakal, memperoleh gelar Sarjana Teknik (S.T), Jurusan Teknik Elektro Universitas Gajah Mada, lulus tahun 2007. Saat ini sedang melaksanakan Studi di Universitas Ilmu Komputer (M.Kom) Program Pasca Sarjana Magister Ilmu Komputer Universitas Indonesia.
3.2-48
ISSN : 2302-3805