JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print)
1
Pengenalan Karakter Tulisan Tangan Angka dan Operator Matematika Berdasarkan Zernike Moments Menggunakan Support Vector Machine Ettyc Juharwidyningsih, Chastine Fatichah, dan Wijayanti Nurul Khotimah Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia email:
[email protected] Abstrak—Saat ini banyak teknologi citra digital yang berhubungan dengan pengenalan karakter tulisan tangan yang merupakan bagian dari pengenalan pola. Pengenalan tulisan tangan penting untuk pengolahan informasi yang memungkinkan proses pemindahan isi dokumen tulisan tangan dari kertas ke dalam komputer. Artikel ini mengembangkan metode pengenalan tulisan tangan angka dan operator matematika menggunakan metode klasifikasi Support Vector Machine (SVM) berdasarkan ekstraksi fitur Zernike Moments. Alasan menggunakan metode ekstraksi fitur Zernike Moments karena mempunyai kelebihan tidak berubah terhadap rotasi, memiliki tingkat sensitif terhadap gangguan yang rendah, dan memiliki sifat ortogonalitas. Dari hasil uji coba terhadap metode klasifikasi tersebut diperoleh metode Support Vector Machine memiliki tingkat akurasi 97%. Kata Kunci—Pengenalan Pola, Preproses, Support Vector Machine, Zernike Moments
P
I. PENDAHULUAN
ERKEMBANGAN teknologi belakangan ini telah banyak membantu dalam meningkatkan kualitas dan kesejahteraan hidup manusia. Seiring dengan perkembangan tersebut, menghadirkan beberapa teknologi yang mampu diterapkan dalam kehidupan masyarakat luas untuk membantu dalam setiap aktivitas manusia. Salah satunya yaitu teknologi yang mampu mengolah citra digital. Saat ini teknologi tersebut tidak hanya untuk pengeditan citra digital dengan menggunakan filter-filter efek yang ada. Banyak penelitian dilakukan terhadap objek berupa citra, yang mana informasi atau knowledge yang didapat dari citra tersebut dapat memberikan kontribusi dan manfaat bagi dunia pendidikan, inovasi teknologi, serta pengelolaan informasi. Teknologi ini termasuk dalam teknologi Optical Character Recognition (OCR). Saat ini banyak ditawarkan dalam produk-produk scanner pada masa terkini. Selain pada produk scanner, teknologi OCR juga terdapat pada Handphone, Smart Phone, dan PDA (Personal Digital Assistant) yang sudah mengimplementasikan teknologi layar sentuh. Oleh karena itu, saat ini dibutuhkan perkembangan teknik pengenalan pola dari sebuah citra [1]. Pengenalan pola merupakan proses mengenali suatu objek secara independen atau berdasarkan kemiripan dengan datadata yang ada sebelumnya. Salah satu pengenalan pola yang
umum dikenal orang adalah pengenalan karakter tulisan tangan. Pengenalan karakter tulisan tangan adalah pengenalan pola tulisan tangan seperti angka dan operator matematika. Permasalahan-permasalahan dalam pengenalan karakter tulisan tangan berasal dari bervariasinya cara penulisan. Untuk mengatasi permasalahan tersebut maka dibutuhkan metode yang tepat agar bisa mengenali variasi pola karakter tulisan tangan. Berbagai penelitian dalam pengenalan karakter tulisan tangan angka telah banyak dilakukan oleh para peneliti. Kemudian banyak dikembangkan dengan bermacam-macam algoritma untuk mendapatkan tingkat akurasi yang tinggi sehingga pola karakter tulisan tangan tersebut bisa dikenali. Namun masih jarang penelitian yang mengenali pola tulisan tangan operator matematika. Oleh karena itu dalam Artikel ini akan dibahas juga pengenalan pola tulisan tangan operator matematika. Adapun penelitian yang terkait yaitu pengenalan pola karakter tulisan tangan angka menggunakan metode ekstraksi fitur Zernike Moments dan proses klasifikasi menggunakan Fuzzy C-Means. Metode ekstraksi fitur Zernike Moments diketahui memiliki tingkat akurasi yang tinggi dalam melakukan ekstraksi fitur bentuk [2]. Zernike Moments memiliki kelebihan sifat ortogonalitas, tidak berubah terhadap rotasi, dan memiliki tingkat sensitifitas terhadap gangguan yang rendah. Penelitian lain yang terkait dengan Artikel ini yaitu pengenalan tulisan tangan angka dengan berbagai metode klasifikasi, salah satunya yaitu Support Vector Machine [3]. Berdasarkan beberapa penelitian sebelumnya, maka Artikel ini mengembangkan metode pengenalan tulisan tangan berupa angka dan operator matematika pada citra persamaan matematika untuk mendapatkan hasil persamaan menggunakan metode klasifikasi Support Vector Machine (SVM) berdasarkan metode ekstraksi fitur Zernike Moments. Dengan menggunakan metode ekstraksi fitur dan metode klasifikasi tersebut maka diharapkan dapat mengatasi masalah dalam pengenalan karakter angka dan operator matematika tulisan tangan yang mempunyai banyak variasi sehingga memudahkan dalam melakukan perhitungan matematika.
JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print)
2
Gambar. 1. Dataset Pelatihan
II. METODOLOGI PENELITIAN
Gambar. 2. Dataset Pengujian
Pada bagian ini akan dibahas dataset yang digunakan pada Artikel ini. Terdapat dua tahapan pada pelaksanaan Artikel ini yaitu tahap pelatihan dan pengujian. Tahap pelatihan terdiri dari empat bagian, yaitu preproses citra, ekstraksi fitur zernike moments, normalisasi data, dan klasifikasi Support Vector Machine yang menghasilkan classifier. Untuk tahap pengujian terdapat proses pemisahan objek citra, melakukan proses yang sama seperti proses pelatihan, dan perhitungan matematika hasil klasifikasi.
mengalami kerusakan pada ukuran citra yang terlalu besar. Hasil proses perubahan ukuran citra yaitu citra yang berukuran 20x20 piksel.
A. Dataset Terdapat dua dataset yang digunakan pada Tugas Akhir ini yaitu dataset pelatihan dan pengujian. Dataset Pelatihan Dataset pelatihan merupakan dataset yang terdiri dari tiga ribu buah citra hitam putih. Dataset tersebut terdiri dari lima belas jenis citra angka dan operator matematika. Masingmasing jenis citra angka dan operator matematika memiliki dua ratus buah citra. Citra tersebut terdiri dari angka 0 sampai 9, operator matematika penambahan, pengurangan, perkalian, pembagian, dan sama dengan. Untuk citra angka berasal dari mnist dataset dengan alamat website http://yann.lecun.com/exdb/mnist/, sedangkan citra operator matematika dibuat sendiri dengan menyamakan ukuran panjang dan lebar pada citra angka. Dataset Pengujian Dataset pengujian merupakan dataset persamaan matematika yang berjumlah tiga puluh buah citra hitam putih. Dataset tersebut dibuat sendiri dengan ukuran yang tidak ditentukan. B. Preproses Preproses (Preprocessing) adalah proses pengolahan data asli sebelum data tersebut diolah menggunakan metode yang sudah dipilih. Preproses citra terdiri dari tiga tahapan, yaitu proses perubahan ukuran citra, operasi morfologi, dan translasi citra. Perubahan Ukuran Citra Proses perubahan ukuran citra adalah proses mengubah ukuran citra yang yang memberikan efek memperbesar dan memperkecil ukuran citra [4]. Proses perubahan ukuran citra pada Artikel ini adalah mengubah ukuran citra ke ukuran 20x20 piksel. Ukuran baru hasil perubahan ukuran citra didapat dengan memperhatikan rasio citra agar tidak
Operasi Morfologi Operasi morfologi yang digunakan pada Artikel ini adalah dilasi dan penipisan. Dilasi dilakukan untuk memperbesar ukuran segmen objek dengan menambah lapisan di sekeliling objek berdasarkan structure element yang digunakan [5]. Structure element yang digunakan yaitu square dengan ukuran tiga. Sedangkan penipisan merupakan salah satu proses pengolahan citra yang digunakan untuk mengurangi ukuran dari suatu citra dengan tetap mempertahankan informasi dan karakteristik penting dari citra tersebut [5]. Dengan adanya operasi morfologi diharapkan mendapatkan citra yang sama antara satu dengan yang lainnya. Translasi Citra Proses translasi citra adalah proses memindahkan setiap elemen piksel citra masukan ke posisi baru pada citra keluaran dimana dimensi dari kedua citra (citra masukan dan citra keluaran) pada umumnya adalah sama [4]. Proses translasi ini memindahkan objek citra di tengah-tengah citra tersebut. Hasil proses translasi citra adalah citra yang berukuran 28x28 piksel. C. Ekstraksi Fitur Zernike Moments Ekstraksi fitur Zernike Moments menghasilkan orde dan pengulangan dari suatu zernike radial polynomial dengan jumlah 47 [6]. Hasil ekstraksi fitur bisa mendapatkan informasi-informasi penting pada sebuah citra, sehingga dapat membedakan citra yang satu dengan citra yang lainnya. Fungsi Zernike Moments yang menghasilkan 47 fitur dapat dihitung berdasarkan (1).
| Z n,m |
n 1
N
N 1
N 1
c 0
r 0
f (c, r ) Rn,m ( )e jm (1)
Zernike Moments adalah pemetaan citra ke dalam kumpulan zernike polynomial. Zernike polynomial adalah kumpulan polinomial yang tegak lurus terhadap unit circle. Karena zernike polynomial tegak lurus terhadap unit circle, maka Zernike Moments memiliki sifat ortogonalitas. Karena Zernike Moments memiliki sifat ortogonalitas maka informasi citra tidak redundan.
JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print)
3
Gambar. 4. Gambaran Umum Proses Pengujian Gambar. 3. Gambaran Umum Proses Pelatihan
D. Normalisasi Data Normalisasi data adalah proses penskalaan nilai atribut dari data sehingga bisa jatuh pada rentang tertentu. Normalisasi data yang digunakan pada Artikel ini adalah normalisasi MinMax [7]. Proses normalisasi data ini bertujuan untuk mendapatkan keseimbangan rentang antar nilai data. Data masukan pada proses ini adalah data hasil ekstraksi fitur. Dengan adanya normalisasi data, fitur yang memiliki nilai dominan bisa diatasi sehingga semua fitur memiliki pengaruh yang sama antara yang satu dengan yang lainnya. E. Support Vector Machine Konsep Support Vector Machine (SVM) dapat dijelaskan secara sederhana sebagai usaha mencari hyperplane terbaik yang berfungsi sebagai pemisah dua buah kelas pada input space. Pattern yang paling dekat disebut sebagai support vector [8]. Sehingga fungsi keputusan dapat dihitung berdasarkan (2). ns
f ( xd ) sign( i yi xi xd b)
(2)
i 1
Secara umum, kasus-kasus di dunia nyata adalah kasus yang tidak linier. Permasalahan ini dapat diselesaikan dengan mentransformasikan data ke dalam dimensi ruang fitur (feature space) yang lebih tinggi sehingga dapat dipisahkan secara linear pada feature space yang baru. Pada proses pelatihan di Artikel ini menghasilkan suatu model SVM yang digunakan proses pengujian untuk mengklasifikasi citra yang baru. Dalam Artikel ini digunakan tipe kernel Radial Basis Function (RBF). F. Pemisahan Objek Citra Pemisahan objek citra dilakukan saat proses pengujian saja. Proses ini memisahkan masing-masing objek citra pada suatu citra persamaan matematika. Sehingga didapatkan satu citra hanya ada satu objek.
G. Perhitungan Matematika Proses perhitungan matematika dilakukan saat proses pengujian. Proses ini dilakukan untuk menghitung hasil klasifikasi suatu citra persamaan matematika. Hasil dari perhitungan matematika merupakan suatu data keluaran. III. UJI COBA DAN ANALISIS HASIL A. Uji Coba Skenario 1 Uji coba skenario 1 yaitu uji coba perbandingan akurasi klasifikasi SVM untuk proses perubahan ukuran citra yang memperhatikan rasio objek citra dengan yang tidak memperhatikan rasio objek citra. Tujuan dilakukan uji coba ini untuk mengetahui pengaruh rasio pada proses perubahan ukuran citra terhadap metode klasifikasi SVM apabila memperhatikan nilai rasio objek citra tertinggi. Citra masukan ini mempunyai jumlah jenis citra sebanyak lima belas. Tiap jenis citra memiliki tiga puluh variasi tulisan tangan. Sehingga total citra ada 450. Citra masukan untuk uji coba ini bisa disebut sebagai citra angka dan operator matematika. Metode klasifikasi SVM yang memperhatikan rasio objek citra pada perubahan ukuran citra akan dihitung rata-rata akurasi dan dibandingkan yang tidak memperhatikan rasio objek citra pada perubahan ukuran citra. Dapat disimpulkan bahwa proses perubahan ukuran citra yang memperhatikan rasio objek citra pada metode klasifikasi SVM mempunyai nilai akurasi lebih tinggi dibandingkan dengan tidak memperhatikan rasio objek citra. Rata-rata akurasi dari SVM yang memperhatikan rasio objek pada proses perubahan ukuran citra yaitu 97.33%, ditunjukkan pada Tabel 1. B. Uji Coba Skenario 2 Uji coba skenario 2 yaitu uji coba perbandingan akurasi metode klasifikasi SVM pada data yang sudah dinormalisasi dan yang tidak dinormalisasi. Tujuan dilakukan uji coba ini untuk mengetahui pengaruh normalisasi data terhadap klasifikasi SVM. Citra masukan untuk uji coba ini adalah citra
JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print) Tabel 1. Perbandingan Akurasi Klasifikasi SVM yang Memperhatikan Rasio dan Tidak Memperhatikan Rasio
No. 1.
Metode Klasifikasi Support Vector Machine
Memakai Rasio (%) 97.33
Tidak Memakai Rasio (%) 78.89
Tabel 2. Perbandingan Akurasi Klasifikasi SVM Pada Data Sudah dinormalisasi dan Tidak dinormalisasi
No.
Metode Klasifikasi
1.
Support Vector Machine
Normalisasi Data (%) 97.33
(a)
(b)
(c)
(d)
Tidak Normalisasi Data 85.11
Tabel 3. Hasil Akurasi Uji Coba Skenario 3
Jenis Citra Angka 0 Angka 1 Angka 2 Angka 3 Angka 4 Angka 5 Angka 6 Angka 7 Angka 8 Angka 9 + = / * Rata-rata Akurasi
angka dan operator matematika. Metode klasifikasi SVM pada data yang sudah dinormalisasi akan dihitung rata-rata akurasi dan dibandingkan dengan data yang tidak dinormalisasi. Dapat disimpulkan bahwa metode klasifikasi SVM pada data yang sudah dinormalisasi mempunyai nilai akurasi yang lebih tinggi dibandingkan dengan data yang tidak dinormalisasi. Rata-rata akurasi dari SVM pada data yang sudah dinromalisasi yaitu 97.33% ditunjukkan pada Tabel 2. C. Uji Coba Skenario 3 Uji coba skenario 3 yaitu uji coba hasil klasifikasi SVM tiap jenis citra tulisan tangan angka dan operator matematika. Tujuan dilakukan uji coba ini untuk mengetahui nilai akurasi dari metode klasifikasi SVM pada tiap jenis citra tulisan tangan angka dan operator matematika. Citra masukan untuk uji coba ini adalah citra angka dan operator matematika. Tiap jenis citra ini akan dihitung akurasinya dan dilakukan klasifikasi SVM. Tabel 3 menampilkan hasil klasifikasi untuk SVM. Untuk akurasi yang paling tinggi pada SVM ada pada angka 0, angka 1, angka 2, angka 8, angka 9, operator matematika penambahan, pengurangan, pembagian, perkalian, dan sama dengan. Dapat disimpulkan bahwa metode SVM mempunyai akurasi yang tinggi dalam mengklasifikasikan citra tulisan tangan angka dan operator matematika. Rata-rata akurasi dari SVM yaitu 97.33%. D. Uji Coba Skenario 4 Uji coba skenario 4 yaitu uji coba hasil klasifikasi SVM pada citra persamaan matematika. Tujuan dilakukan uji coba
SVM 100% 100% 100% 90% 97% 93% 90% 90% 100% 100% 100% 100% 100% 100% 100% 97.33%
Tabel 4. Rincian Hasil Uji Coba Skenario 4 Klasifikasi SVM
Nama Citra
(e)
Gambar 5. Citra (a), (b), (c), (d), dan (e) adalah Citra Persamaan Matematika Uji Coba Skenario 4
4
Citra a Citra b Citra c Citra d Citra e Rata-rata Akurasi
Jumlah Klasifikasi Berhasil 3 3 3 2 5 94.12%
Jumlah Seluruh Objek Citra 3 3 3 3 5 17
ini untuk mengetahui nilai akurasi metode klasifikasi SVM pada citra persamaan matematika. Selain itu juga bisa membuktikan kebenaran pada uji coba skenario 3. Citra masukan pada uji coba skenario 4 adalah citra persamaan matematika dengan ukuran yang tidak ditentukan dengan jumlah tiga puluh buah citra. Jika dilihat pada Tabel 4 metode klasifikasi SVM memiliki akurasi yang tinggi dalam mengklasfikasikan citra persamaan matematika. Untuk SVM nilai akurasinya yaitu 94.12%. Sudah dijelaskan diuji coba skenario 3, jika metode klasifikasi SVM merupakan metode yang baik dalam mengklasifikasikan citra tulisan tangan angka dan operator matematika. Terbukti juga dalam uji coba skenario 4, metode klasifikasi SVM bisa baik dalam mengklasifikasikan citra persamaan matematika. IV. KESIMPULAN/RINGKASAN 1. Proses perubahan ukuran citra yang memperhatikan rasio objek citra menunjukkan hasil klasifikasi Support Vector Machine yang lebih baik dibandingkan dengan proses perubahan ukuran citra yang tidak memperhatikan rasio objek citra. 2. Penambahan proses normalisasi data akan mampu meningkatkan nilai akurasi dalam mengklasifikasikan citra tulisan tangan angka dan operator matematika.
JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print) 3. Algoritma Support Vector Machine memiliki tingkat akurasi yang tinggi dalam melakukan klasifikasi citra tulisan tangan angka dan operator matematika UCAPAN TERIMA KASIH Penulis E.J. mengucapkan terima kasih kepada Allah SWT, kedua orang tua dan keluarga penulis, dosen pembimbing, kepala jurusan, dosen, dan staf Teknik Informatika, serta kerabat dekat dan pihak yang telah membantu menyelesaikan artikel ini. DAFTAR PUSTAKA [1] P Yal Eke, "Fuzzy sets and models of decision making," Computers & Mathematics with Applications, vol. 44, no. 7, pp. 863-875, Oktober 2002. [2] Xiao-Jun Tong, Shan Zeng, Nong Sang, and Ling-Hu Zeng, "Handwritten Numeral Recognition Based on Fuzzy C-Means Algorithm," 2010 Ninth International Symposium on Distributed Computing and Applications to Business, Engineering and Science, 2010. [3] Ming Wu and Zheng Zhang, "Handwritten Classification using the MNIST Data Set," The Mnist Database of Handwritten Digits. [4] Darma Putra, Pengolahan Citra Digital. Yogyakarta, Jawa Tengah: Andi, 2010. [5] Batra Pratama Yudha, "Operasi Morfologi pada Citra Biner," IlmuKomputer.com, Feb. 2014. [6] Amir Tahmasbi, Fatemeh Saki, and Shahriar B Shokouhi, "Classification of benign and malignant masses based on Zernike moments," Computers in Biology and Medicine, pp. 726–735, June 2011. [7] "Computational Statistics & Data Analysis," The Official Journal of the International Association for Statistical Computing (IASC), vol. 177, p. 431, 1983 - present. [8] V Kecman, Support Vector Machines: Theory and Applications, Lipo Wang, Ed. Heidelberg, Netherrlands: Springer, 2005.
5