Seminar Nasional Teknologi Informasi dan Multimedia 2015
ISSN : 2302-3805
STMIK AMIKOM Yogyakarta, 6-8 Februari 2015
PENGENALAN POLA TULISAN TANGAN AKSARA JAWA MENGGUNAKAN MULTI LAYER PERCEPTRON Madha Christian Wibowo1), I Dewa Gede Rai Mardiana2), Sandy Wirakusuma3) 1), 2), 3)
Sistem Komputer STMIK Surabaya Jl. Raya Kedung Baruk 98, Surabaya 60298 Email :
[email protected]),
[email protected]),
[email protected])
Abstrak Wibowo dan Wirakusuma [1] mencoba membuat aplikasi optical character recognition (OCR) untuk mengubah tulisan Aksara Jawa yang ada pada dokumen-dokumen kuno tersebut menjadi teks digital menggunakan model multi layer perceptron (MLP). Aksara Jawa yang digunakan hanya 5 huruf, “Ha”, “Na”, “Ca”, “Ra”, dan “Ka”. Seluruh sampel yang dijadikan bahan pelatihan dapat dikenali. Akan tetapi, dari 25 sampel baru yang diuji hanya 14 sampel yang berhasil dikenali dengan benar. Sedangkan Hasibuan [2] menggunakan self organizing map (SOM) untuk melakukan pengenalan pola pada huruf cetak Aksara Jawa dengan rata-rata tingkat keberhasilannya mencapai 75,5%.
Penelitian ini berfokus pada optical character recognition (OCR) untuk tulisan tangan Aksara Jawa Nglegena. Metode pengenalan pola yang digunakan adalah multi layer perceptron dengan algoritma pembelajaran back propagation. Sampel yang digunakan adalah 100 set sampel untuk pelatihan dan 50 set sampel untuk pengujian. Bobot akhir yang dihasilkan telah mampu mengenali sampel pelatihan sebesar 100%, dan sampel pengujian sebesar 38,1%. Kata kunci: Aksara Jawa Nglegena, pengenalan pola, multi layer perceptron, back propagation, optical character recognition.
Basu dan Das sudah berhasil mengenali pola tulisan tangan untuk [3] angka dan [4] huruf Bangla, serta [5] angka Arab menggunakan MLP dengan rata-rata tingkat keberhasilan di atas 75%. Namun yang mereka gunakan adalah citra tulisan yang sudah diekstrak cirinya.
1. Pendahuluan Indonesia adalah negara yang memiliki bermacammacam suku dan budaya. Masing-masing suku dan budaya di Indonesia memiliki ciri khas, tak terkecuali dengan bentuk tulisan. Salah satu suku di Indonesia yang memiliki ciri khas dalam tulisan adalah suku Jawa yang hurufnya disebut dengan Aksara Jawa.
Penelitian ini menggunakan MLP dengan algoritma pembelajaran error back propagation untuk melakukan pengenalan pola terhadap pola Aksara Jawa berdasarkan citra hasil tulisan tangan. Huruf yang dikenali adalah 20 jenis huruf dasar Aksara Jawa modern.
Aksara Jawa terdiri dari konsonan dasar, vokal, angka, pasangan, pangkon, dan tanda baca. Bentuk Aksara Jawa yang paling dasar adalah aksara konsonan dasar, yang disebut dengan Aksara Jawa Nglegena. Aksara Jawa Nglegena terdiri dari 20 huruf yang masing-masing huurfnya mewakili suku kata dengan bunyi tertentu, seperti yang ditunjukkan pada Gambar 1.
Multi layer perceptron (MLP) adalah pengembangan dari model perceptron yang dikembangkan oleh Rosenblatt [6] pada tahun 1958. Perceptron memiliki keterbatasan hanya dapat menyelesaikan masalah-masalah yang linier, sedangkan MLP dapat digunakan untuk menyelesaikan masalah yang lebih kompleks. Pada dasarnya, MLP adalah perceptron yang memiliki layer atau lapisan tambahan di antara layer input (neuron Xi) dan layer output (neuron Yi) yang disebut dengan hidden layer. Bentuk jaringan umum MLP dapat dilihat pada Gambar 2. Proses perhitungan dari setiap neuronnya sama dengan perceptron, seperti pada Persamaan 1. Sinyal output neuron (v) kemudian dimasukkan ke dalam sebuah fungsi aktivasi. [7] Dalam hal ini fungsi aktivasi yang digunakan adalah fungsi binary sigmoid dengan fungsi seperti pada Persamaan 2 dengan bentuk pada Gambar 3 [8].
Gambar 1. Aksara Jawa Nglegena
3.8-1
ISSN : 2302-3805
Seminar Nasional Teknologi Informasi dan Multimedia 2015 STMIK AMIKOM Yogyakarta, 6-8 Februari 2015
Gambar 2. Model Multi Layer Perceptron
y f bs v
1 .......................... (2) 1 e v
Meskipun digunakan dalam jaringan saraf tiruan, back propagation sendiri bukanlah sebuah jaringan saraf tiruan. Back propagation adalah sebuah algoritma pembelajaran untuk jaringan saraf tiruan sehingga didapatkan kombinasi nilai bobot-bobot antar neuron yang sesuai. Metode pembelajaran back propagation adalah pembelajaran berdasarkan contoh. Selama proses pembelajaran, algoritma ini perlu untuk diberikan pasangan-pasangan input dan output. Masing-masing pasang berupa satu set pola input beserta output yang diharapkan terhadap pola tersebut. Back propagation akan menggunakan output yang diharapkan tersebut serta output yang dihasilkan oleh jaringan saraf tiruan untuk mengubah nilai bobot-bobot yang ada dalam jaringan saraf tiruan [9].
Gambar 3. Fungsi Sigmoid n
v ij x ki 1 w(i j1,k ) b ij ..................... (1) k 0
v : Sinyal output yang dihasilkan neuron x : Sinyal input untuk neuron w : Bobot/sinaps yang menghubungkan neuron dengan neuron-neuron di layer sebelumnya b : Bias i : Indeks layer dari neuron j : Indeks neuron pada layer ke-i k : Indeks neuron pada layer sebelumnya (i-1) n : Jumlah neuron pada layer ke-i
Untuk mengubah bobot-bobot itu dengan algoritma back propagation, digunakan Persamaan 3.
w(i j1,k ) w(i j1,k ) ij y ki 1 ............... (3)
Gambar 4. Diagram Blok Sistem
3.8-2
ISSN : 2302-3805
Seminar Nasional Teknologi Informasi dan Multimedia 2015 STMIK AMIKOM Yogyakarta, 6-8 Februari 2015
out t ( j , p ) y out g ( y out j j j ) ............ (4)
Tabel 1. Kombinasi Input dan Output Pola Aksara Target Neuron Output keInput 4 3 2 1 0 0 0 0 0 0 Ha 0 0 0 0 1 Na 0 0 0 1 0 Ca 0 0 0 1 1 Ra 0 0 1 0 0 Ka 0 0 1 0 1 Da 0 0 1 1 0 Ta 0 0 1 1 1 Sa 0 1 0 0 0 Wa 0 1 0 0 1 La 0 1 0 1 0 Pa 0 1 0 1 1 Dha 0 1 1 0 0 Ja 0 1 1 0 1 Ya 0 1 1 1 0 Nya 0 1 1 1 1 Ma 1 0 0 0 0 Ga 1 0 0 0 1 Ba 1 0 0 1 0 Tha 1 0 0 1 1 Nga
ij hi 1 wki ,h g ( y ij ) ............. (5) g bs ( y ) f bs ( y ) 1 f bs ( y ) ..... (6) Pada algoritma back propagation, poin yang penting adalah bagaimana mendapatkan δ. Di mana nilai δ untuk neuron-neuron di layer output adalah hasil perhitungan error dari tiap-tiap neuron. Sehingga δ dapat dihitung dengan Persamaan 4. Sedangkan untuk neuron-neuron di layer yang lain, δ dapat dihitung dengan Persamaan 5. Dengan g () adalah turunan pertama dari f () , turunan pertama untuk fungsi sigmoid dari Persamaan 2 dapat dilihat pada Persamaan 6. Sedangkan parameter µ adalah laju pembelajaran yang menentukan kecepatan proses pembelajaran hingga dapat mendekati nilai bobot yang optimal. Semakin besar nilai µ, semakin cepat prosesnya. Tetapi, resolusinya juga kurang baik. Diagram blok pada Gambar 4 menunjukkan model yang akan digunakan. Objek yang digunakan adalah citra dari tulisan tangan. Citra tulisan tangan diakuisisi langsung dari responden menggunakan digital pen. Citra tersebut dituliskan secara virtual ke dalam sebuah objek kanvas yang memiliki resolusi 30000 piksel (200 x 150 piksel) yang kemudian disimpan di file.
Bobot dan jaringan ini kemudian akan diuji dengan mencoba mengenali sampel-sampel yang digunakan sebagai data pembelajaran serta 50 set sampel lain (1000 data) seperti contoh pada Gambar 6 yang digunakan sebagai data pengujian untuk proses evaluasi bobot dan jaringan yang dihasilkan dari proses pembelajaran.
Dari proses akuisisi data didapatkan jumlah citra sampel yang digunakan adalah 100 set tulisan tangan Aksara Jawa sehingga total ada 2000 sampel yang akan digunakan dalam proses pembelajaran. Tetapi karena ukurannya yang masih terlalu besar, sampel-sampel tersebut harus melalui tahap pemrosesan awal supaya ukurannya menjadi lebih kecil. Untuk itu dilakukan proses pengecilan citra dengan menggunakan skala 10 : 1, sehingga data-data yang akan digunakan sebagai proses pembelajaran berukuran 20 x 15 piksel (300 data)
2. Pembahasan Proses pembelajaran dilakukan dengan konfigurasi: -
Sampel-sampel yang telah dikecilkan ini digunakan sebagai data input pada jaringan MLP, yang kemudian hasil dari MLP akan dievaluasi dengan target dari masingmasing input. Bila masih ada kesalahan antara hasil MLP dengan target, bobot-bobot yang ada pada MLP akan disesuaikan dengan menggunakan algoritma back propagation hingga hasilnya konvergen.
Jumlah hidden layer Jumlah neuron input Jumlah neuron layer 1 Jumlah neuron layer 2 Jumlah neuron output Laju pembelajaran (µ) Error minimum Iterasi maksimum
: : : : : : : :
2 300 120 80 5 0.1 10E-3 10E+5
Proses pembelajaran dilakukan sebanyak 849044 iterasi dengan menggunakan 100 set sampel input dengan nilai error akhir sebesar 0.00958442307671328. Ini berarti bahwa proses pembelajaran selesai hingga target error minimum terhadap data sampel terpenuhi.
Dalam penelitian ini, ke-2000 sampel tulisan akan dilatihkan menggunakan MLP dan back propagation dengan kombinasi pola input dan target output seperti pada Tabel 1. Sampel-sampel tersebut akan dijadikan sebagai data pembelajaran untuk algoritma MLP dan back propagation dengan proses seperti pada diagram alir proses pelatihan di Gambar 5. Pelatihan terus dilakukan hingga mencapai batasan nilai error tertentu. Hasil yang didapatkan dari proses pembelajaran tersebut adalah bobot dan konfigurasi bentuk jaringan MLP.
Bobot dan jaringan yang dihasilkan kemudian digunakan untuk melakukan proses pengenalan terhadap sampel pembelajaran dan sampel uji. Dari pengujian ini didapatkan hasil bahwa seluruh sampel pembelajaran yang dicoba untuk dikenali ulang berhasil dikenali dengan benar. Sedangkan untuk sampel uji, 381 sampel dari 1000 sampel uji yang tersedia dapat dikenali dengan benar seperti tersaji pada Tabel 2.
3.8-3
Seminar Nasional Teknologi Informasi dan Multimedia 2015
ISSN : 2302-3805
STMIK AMIKOM Yogyakarta, 6-8 Februari 2015
Gambar 6. Contoh 100 dari 1000 Sampel Uji Tabel 2. Hasil Pengujian Sampel Uji Aksara Berhasil Aksara Berhasil 23 20 Ha Pa 13 23 Na Dha 9 11 Ca Ja 32 19 Ra Ya 18 24 Ka Nya 22 21 Da Ma 20 19 Ta Ga 19 7 Sa Ba 8 22 Wa Tha 31 20 La Nga 381 TOTAL
(a) (b) (c) Gambar 6. Karakter-karakter yang salah dikenali Sampel uji yang paling sering salah dikenali adalah aksara “Ca”, “Wa”, dan “Ba” seperti pada Gambar 6. Aksaraaksara tersebut memang memiliki kemiripan dengan aksara-aksara lainnya. Sebagai contoh, aksara “Ca” dengan “Sa”, “Wa”, dan “Dha” memiliki kemiripan ciri di beberapa bagian. Karakter-karakter dalam Aksara Jawa memang memiliki pola-pola yang rumit dan banyak di antaranya yang hanya memiliki sedikit perbedaan. Akan lebih baik bila ada informasi yang ditambahkan pada pola input [10], seperti ekstraksi fitur-fitur khusus yang menjadi ciri pembeda dalam Aksara Jawa. Sehingga dengan demikian proses pengenalan pola dapat dilakukan dengan lebih baik. Gambar 5. Diagram Alir Proses Pelatihan 3.8-4
Seminar Nasional Teknologi Informasi dan Multimedia 2015
ISSN : 2302-3805
STMIK AMIKOM Yogyakarta, 6-8 Februari 2015
Sandy Wirakusuma, memperoleh gelar Sarjana Komputer (S.Kom.), Jurusan Sistem Komputer STMIK Surabaya, lulus tahun 2010. Memperoleh gelar Magister Teknik (M.T.) Program Pasca Sarjana Magister Teknik Elektro Institut Teknologi Sepuluh Nopember Surabaya, lulus tahun 2013.
3. Kesimpulan Dari proses pembelajaran dengan menggunakan 100 set sampel, bobot dan konfigurasi jaringan yang dihasilkan telah dapat mengenali dengan benar seluruh sampel pembelajaran. Di lain pihak, tingkat keberhasilan untuk 50 set sampel uji adalah 38,1%. Persentase tingkat keberhasilan ini masih terlalu rendah. Hal ini disebabkan karena banyaknya pola huruf-huruf Aksara Jawa yang mirip satu sama lain. Untuk mengatasi hal ini, selanjutnya akan dilakukan penelitian untuk melakukan ekstraksi ciri yang sesuai bagi pola-pola huruf Aksara Jawa. Daftar Pustaka [1]
Wibowo, M.C. dan Wirakusuma, S., “Pengenalan Pola Tulisan Tangan Aksara Jawa ‘Ha Na Ca Ra Ka’ Menggunakan Multi Layer Perceptron”, in Proc. Seminar Nasional Sistem & Teknologi Informasi (SNASTI) 2013, pp. ICCS 27 – ICCS 32. Surabaya. Oktober 24, 2013. [2] Hasibuan, F.M., dkk., “Desain dan Implementasi Sistem Penerjemah Aksara Jawa ke Huruf Latin Berbasis Pengolahan Citra Digital dan Jaringan Saraf Tiruan Self-Organizing Map (SOM)”, (online) http://cdndata.ittelkom.ac.id/tapa/jurnal/ 111060121.pdf. 2011. [3] Basu, S., dkk., “Handwritten ‘Bangla’ Alphabet Recognition using an MLP Based Classifier”, in Proc. 2nd National Conference on Computer Processing of Bangla, pp. 285 – 291. Dhaka. February, 2005. [4] Basu, S., dkk., “An MLP Based Approach for Recognition of Handwritten ‘Bangla’ Numerals”, in Proc. 2nd Indian International Conference on Artificial Intelligence, pp. 407 – 417. Pune. December, 2005. [5] Das, N., dkk., “Handwritten Arabic Numeral Recognition using a Multi Layer Perceptron”, Proceeding National Conference on Recent Trends in Information Systems, pp. 200 – 203. 2006. [6] Rosenblatt, F., “The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain”, in Psychological Review, vol. 5: pp. 368-408. 1958. [7] Fausett, L. “Fundamentals of Neural Networks”. Prentice-Hall, New York. 2006. [8] Ham, F.M. dan Kostanic, I., “Principles of Neurocomputing for Science & Engineering”. McGraw-Hill, New York. 2001. [9] Rumelhart, D.E. dkk., 1986, “Learning Representations by BackPropagating Errors”. Nature, vol. 323: hal. 533-536. [10] Chaudhuri, B.B. dan Bhattacharya, U., “Efficient Training and Improved Performance of Multilayer Perceptron in Pattern Classification”, in Neurocomputing, vol. 34, pp. 11-27. 2000
Biodata Penulis Madha Christian Wibowo, memperoleh gelar Sarjana Komputer (S.Kom.), Jurusan Sistem Komputer STMIK Surabaya, lulus tahun 2008. Sedang menempuh Program Pasca Sarjana Magister Teknik Elektro Institut Teknologi Sepuluh Nopember Surabaya. Saat ini menjadi Dosen di STMIK Surabaya. I Dewa Gede Rai Mardiana, memperoleh gelar Sarjana Komputer (S.Kom.), Jurusan Sistem Komputer STMIK Surabaya, lulus tahun 2005. Memperoleh gelar Master of Engineering (M.Eng.) Program Pasca Sarjana Magister Teknik Elektro Universitas Gajah Mada Yogyakarta, lulus tahun 2014.
3.8-5
Seminar Nasional Teknologi Informasi dan Multimedia 2015 STMIK AMIKOM Yogyakarta, 6-8 Februari 2015
3.8-6
ISSN : 2302-3805