1
ISSN 1979-2867 (print) Electrical Engineering Journal Vol. 5 (2014) No. 1, pp. 1-11
Segmentasi Tulisan Tangan Bersambung pada IAM Handwriting Database Evelyn Evangelista dan Novie Theresia Br. Pasaribu Jurusan Teknik Elektro, Universitas Kristen Maranatha, Bandung Jl. Suria Sumantri 65, Bandung 40164, Indonesia
[email protected],
[email protected]
Abstrak: Pengenalan tulisan tangan adalah salah satu penelitian yang berkembang sudah sejak lama. Segmentasi adalah salah satu proses yang mendukung berkembangnya penelitian mengenai pengenalan tulisan tangan. Segmentasi tulisan tangan terutama untuk tulisan tangan sambung telah menjadi fokus utama dari beberapa penelitian. Pada penelitian ini terdapat tiga tahapan proses seleksi segmentasi yang dilakukan pada daerah middle zone (zona tengah) tulisan tangan, dan proses segmentasi tulisan tangan bersambung dilakukan pada IAM Handwriting Database dengan validasi segmentasi oleh Jaringan Syaraf Tiruan. Hasil yang diperoleh dari penelitian ini, akurasi segmentasi yang tepat sebesar 81,25%. Akurasi segmentasi ini cukup baik, namun hasil segmentasi ini juga dipengaruhi oleh nilai persentase missed segmentation yang sebesar 18,75% dan persentase over-segmentation sebesar 19,02%. Kegagalan pengenalan segmentasi masih terjadi pada kasus tulisan tangan yang tulisannya berhimpitan secara vertikal Kata kunci: Segmentasi, handwriting recognition, IAM Handwriting Database Abstract: Handwriting recognition is one of the researches that have been developed for a long time. Segmentation is one of the processes that support the development of research on handwriting recognition. Handwriting segmentation especially for cursive handwriting has become a major focus of several researches. In this research there are three steps selection processes of character segmentation which is done in middle zone area of the handwriting. The data are taken from the IAM Handwriting Database with segmentation validation by Neural Networks. The results of this research were obtained segmentation correctly by 81.25%. The accuration of segmentation has a good result, but these results are influenced by the result of 18.75% miss segmentation and also by 19.02% of over-segmentation. The unrecognized of segmentation still occurred in the handwriting which the vertical overlap problems in the characters. Keywords: Segmentasi, handwriting recognition, IAM Handwriting Database
I. PENDAHULUAN Seiiring dengan bertambah banyak dokumen-dokumen penting (surat-surat penting) yang masih menggunakan tulisan tangan, sehingga kebutuhan akan sistem yang bisa menerima
2
ELECTRICAL ENGINEERING JOURNAL, VOL. 5, NO. 1, OCTOBER 2014
masukan tulisan tangan dan mengenalinya semakin meningkat. Hal inilah yang menyebabkan penelitian yang berkaitan dengan pengenalan tulisan tangan (handwriting recognition) masih banyak dilakukan/ dikembangkan. Masalah yang muncul dalam pengenalan tulisan tangan di antaranya adalah adanya noise (nilai piksel yang mengganggu atau mengubah bentuk citra), slant (kemiringan tulisan terhadap sumbu y), slope (kemiringan tulisan terhadap sumbu x), ukuran tulisan tangan dan permasalahan zona. Selain itu, pemisahan kata ke dalam bentuk huruf (segmentasi) yang benar juga menjadi faktor penting dalam akurasi pengenalan tulisan tangan. Segmentasi adalah salah satu langkah pre-processing yang penting dan mempengaruhi ketelitian dari pengenalan tulisan tangan. Segmentasi dalam pengenalan tulisan tangan biasanya dibagi menjadi menjadi dua jenis, yaitu explicit segmentation dan implicit segmentation. Pada explicit segmentation pemisahan dilakukan sehingga citra tulisan kata diubah menjadi huruf, sedangkan pada implicit segmentation segmentasi dilakukan sebagai hasil produk dari pengenalan tulisan itu sendiri[1]. Pada penelitian ini akan dilakukan sebuah proses explicit segmentation terhadap citra tulisan tangan. Salah satu persoalan umum dalam explicit segmentation terjadi pada tulisan tangan sambung. Segmentasi huruf akan menjadi lebih sulit karena batas antara huruf satu dengan huruf yang lain tidak terlihat dengan jelas. Selain itu citra tulisan tangan dengan huruf bersambung mempersulit pengenalan tulisan tangan karena bentuk huruf sambung yang berbeda dengan huruf tulisan balok sehingga segmentasi yang benar akan sangat membantu proses pengenalan tulisan tangan. Karena hal – hal tersebut, diusulkan suatu pengujian segmentasi tulisan tangan bersambung dengan validasi segmentasi menggunakan Jaringan Syaraf Tiruan (JST) yang direalisasikan pada IAM Handwriting Database.
II. METODE PENELITIAN Beberapa cara telah dilakukan oleh banyak peneliti untuk melakukan proses segmentasi, terutama menggunakan JST sebagai validasi kandidat titik segmentasi. M. Blumenstein, B.Verma contohnya[2], telah menerbitkan banyak jurnal mengenai beberapa metode segmentasi yang digunakan, antara lain metode hole detection, left and center character, beserta pengembangannya. Fajri Kurniawan, dkk[3] menggunakan kontur dari citra tulisan untuk menentukan segmentasi (dilakukan pada IAM Handwriting Database) dan kemudian Jaringan Syaraf Tiruan untuk memvalidasi kebenaran segmentasi. Segmentasi tulisan bersambung dengan validasi Jaringan Syaraf Tiruan juga dilakukan oleh Tanzila Saba[4]. Dengan metode histogram untuk menentukan ligature, penelitian tersebut menggunakan CEDAR Database untuk menguji proses segmentasi tulisan bersambung. Pada penelitian ini mencoba memodifikasi proses segmentasi yang dilakukan oleh Tanzila [4] Saba , terdapat tiga tahapan proses seleksi segmentasi yang dilakukan pada daerah middle zone (zona tengah) tulisan tangan, dan proses segmentasi tulisan tangan bersambung dilakukan pada IAM Handwriting Database dengan validasi segmentasi oleh JST. Diagram blok segmentasi tulisan tangan bersambung, dapat dilihat pada Gambar 1.
ISSN: 1979-2867
SEGMENTASI TULISAN TANGAN BERSAMBUNG PADA IAM HANDWRITING DATABASE
3
Gambar 1. Diagram Blok Segmentasi Tulisan Tangan Bersambung
Masukan citra tulisan tangan bersambung diambil dari database citra tulisan yang sudah menjadi standar dalam pengujian citra tulisan tangan yaitu IAM Handwriting Database, tulisan tangan bersambung yang digunakan dengan kriteria tulisan tegak (kemiringan terhadap sumbu y kecil) dan lurus (kemiringan terhadap sumbu x kecil) dengan ukuran dan bentuk yang bervariasi. Selanjutnya dilakukan pra-pemrosesan, berupa proses binerisasi citra dan proses thinning (Gambar 2). Setelah dilakukan pra-pemrosesan, pencarian segmentasi diawali dengan mencari zona tengah (middle zone) dari tulisan tangan. Kemudian nilai Integral Proyeksi Kolom (IPK) dari zona tengah tulisan tangan dihitung. Selanjutnya proses seleksi segmentasi yang terdiri dari tiga tahapan dilakukan terhadap kandidat titik segmentasi tulisan tangan tersebut, dengan tujuan untuk mengurangi adanya over-segmentation, yaitu segmentasi/ pemisahan yang terlalu banyak/ berlebih seperti pada Gambar 2.
Gambar 2. Contoh Over-segmentation Tulisan Tangan
Setelah itu dilakukan pengambilan nilai ekstraksi ciri. Ekstraksi ciri dari titik segmentasi akhir yang digunakan berupa density feature (ciri kerapatan). Kemudian data tersebut dilatihkan dan diujikan pada JST untuk memvalidasi segmentasi (memutuskan benar atau tidaknya segmentasi). Keluaran dari JST adalah berupa segmentasi salah atau segmentasi benar. Dikarenakan over-segmentation (segmentasi yang berlebih) sering terjadi, maka dari hasil keluaran JST dilanjutkan proses koreksi segmentasi sehingga diperoleh hasil segmentasi karakter.
II.1. Pra-pemrosesan Pertama-tama citra tulisan tangan diubah dari format grayscale ke dalam bentuk biner. Kemudian dilakukan proses thinning, piksel hitam dari citra tulisan tangan direduksi sehingga didapatkan kerangka yang masih mewakili bentuk piksel hitam citra asli (Gambar 3). Selanjutnya dilakukan proses segmentasi pada tulisan tangan.
ISSN: 1979-2867
4
ELECTRICAL ENGINEERING JOURNAL, VOL. 5, NO. 1, OCTOBER 2014
(a)
(b)
(c)
Gambar 3. (a) Citra dari Database IAM Handwriting Database, (b) Citra Hasil Konversi Biner, (c) Citra Hasil Thinning
II.2. Segmentasi Karakter Tulisan Tangan Bersambung Diagram alir untuk proses segmentasi karakter tulisan tangan bersambung bisa dilihat pada Gambar 4.
Gambar 4. Diagram alir Sub-rutin Segmentasi Karakter Tulisan tangan Bersambung
Proses awal segmentasi tulisan tangan adalah mencari zona tengah dari tulisan tangan. Setelah diperoleh zona tengah tulisan tangan kemudian nilai Integral Proyeksi Kolom (IPK) dari zona tengah tulisan tangan dihitung. Nilai IPK adalah banyak jumlah piksel foreground (hitam) citra tulisan tangan dari tiap-tiap kolomnya (Gambar 5).
ISSN: 1979-2867
SEGMENTASI TULISAN TANGAN BERSAMBUNG PADA IAM HANDWRITING DATABASE
5
Gambar 5. (a) Citra Hasil Thinning Tulisan tangan, (b) Zone Tengah Tulisan tangan, (c) Nilai IPK
Segmentasi Seleksi Awal diawali dengan menyeleksi nilai IPK dari zone tengah tulisan tangan (Gambar 6). Nilai Integral Proyeksi Kolom (IPK) yang minimum, yang bernilai kecil sama dengan 1 akan lolos seleksi menjadi Titik Segmentasi Awal (TSA). IPK bernilai “0” artinya spasi pada tulisan tangan yang jelas terpisah (atau berarti tidak ada tulisan), dan IPK bernilai “1” artinya spasi pada tulisan tangan bersambung.
Gambar 6. Diagram Alir Sub-rutin Segmentasi Seleksi Awal
Setelah TSA diperoleh, maka akan dilajutkan proses Segmentasi Seleksi Lanjut (SSL) (Gambar 7). Setiap posisi dari titik segmentasi (TSA) yang berdekatan nilai maksimum (titik terendah dari goresan) akan dicari dan dipilih sebagai kandidat segmentasi selanjutnya. Posisi segmentasi yang berdekatan dihitung dengan threshold yang telah ditentukan sebelumnya[4]. Jika segmentasi memiliki nilai 0 pada IPK citra hasil thinning maka segmentasi tersebut akan diprioritaskan sebagai kandidat segmentasi dan dihitung posisi tengah dari nilai 0 tersebut. Titik segmentasi yang lolos akan menjadi titik segmentasi lanjut (TSL) dan diseleksi lagi pada proses seleksi akhir.
ISSN: 1979-2867
6
ELECTRICAL ENGINEERING JOURNAL, VOL. 5, NO. 1, OCTOBER 2014
Segmentasi Seleksi Lanjut
A Keterangan : l : banyaknya TSA L : posisi piksel hitam TSA r : posisi TSA yang sedang diproses s : TSA yang sedang diproses
Titik segmentasi awal (TSA) r=0; s=1; sa=0 a=1; a≤ m; a++
ya
ya
s=(s-round(sa/2))
r=0; sa=0; TSL(b)=TSA(a); b=b+1
tidak L(a) ≥ r
c < threshold && sa==0 tidak
B ya r=L(a); s=TSA(a); sa=sa+1
L(a) == 0
c=TSA(a-1)-TSA(a)
B
r=L(a); s=TSA(a)
Titik segmentasi lanjut (TSL)
tidak A
Return Gambar 7. Diagram Alir Sub-rutin Segmentasi Seleksi Lanjut
Pada seleksi akhir (Gambar 8), informasi TSL kemudian digunakan sebagai kandidat segmentasi dan diseleksi menggunakan threshold yang didapatkan dari hasil eksperimen. Seleksi dilakukan dengan menghitung jarak dari satu kandidat segmentasi ke kandidat segmentasi selanjutnya. Jika jarak kurang dari threshold maka kandidat segmentasi selanjutnya akan dibuang. Hasil dari seleksi akhir adalah TSR yang akan dilatihkan ke JST agar pola salah dan benar bisa dikenali. Segmentasi Seleksi Akhir
Keterangan : l : banyaknya TSL
Titik segmentasi lanjut (TSL)
P
a=1; b=1
c=TSL(a+1)-TSL(a)
R a
ya
c < threshold P
tidak TSR(b)=TSL(a); a=a+1; b=b+1
ya
TSR(b)=TSL(a); a=a+2; b=b+1
R
Gambar 8. Diagram Alir Sub-rutin Segmentasi Seleksi Akhir
ISSN: 1979-2867
SEGMENTASI TULISAN TANGAN BERSAMBUNG PADA IAM HANDWRITING DATABASE
7
II.3. Ekstraksi Ciri [1] Pada pengenalan pola, ekstraksi ciri adalah merupakan salah satu komponen yang penting untuk mencirikan atau mendeskripsikan karakteristik yang unik dari suatu citra/pola. Pada penelitian segmentasi karakter tulisan tangan ini menggunakan ekstraksi ciri : density (kepadatan) dari citra tulisan tangan (Gambar 9 & Gambar 10). Nilai density (kepadatan) citra di sekitar titik segmentasi ini yang digunakan sebagai masukan ke dalam Jaringan Syaraf Tiruan (JST).
Gambar 9. Piksel pada citra yang digunakan untuk mengambil nilai density
Gambar 10. Piksel pada citra yang digunakan untuk mengambil nilai density
Contoh perhitungan nilai kepadatan pada Gambar 10 terlihat piksel dengan diperoleh dari suatu citra dengan ukuran 5x5 satuan piksel (totalnya sebanyak 25 piksel) , banyaknya piksel foreground (hitam) adalah 1, maka ∑ / 1/25 0.04.
II.4. Jaringan Syaraf Tiruan (JST) Pada penelitian ini, JST yang digunakan dengan menggunakan Algoritma Backpropagation yang terdiri dari satu unit keluaran, 100 unit masukan, dan satu lapisan tersembunyi dengan 67 unit tersembunyi. Masukan dari pelatihan JST adalah nilai ekstraksi ciri (ciri kepadatan) dari citra yang berada diantara suatu titik segmentasi (citra di sebelah kiri dan citra di sebelah kanan dari titik segmentasi yang bersesuaian), seperti pada Gambar 11. Keluaran dari JST ada dua, yaitu : segmentasi salah (y=0,1) dan segmentasi benar (y=0,9). Pelatihan dilakukan pada 42 citra yang terdiri dari 356 pola segmentasi benar dan salah, dengan capaian error sebesar ≤ 0.01.
ISSN: 1979-2867
8
ELECTRICAL EN NGINEERING G JOURNAL, VOL. 5, NO. 1, OCTOBER R 2014
Citra diseebelah kiri
Titik seegmentasi
C Citra diisebelah kanan n
Gambar 11. 1 Contoh Cittra yang digun nakan sebagaii Input JST
Setelah dilaakukan prosees pelatihan JST, kemud dian dilanjutkkan pada peengujian JST T, nilai keluaaran dari JST T tersebut kem mudian diprooses untuk diikoreksi segm mentasinya.
II.5. Koreksi Segmentasi S Koreksi titiik segmentassi dilakukan setelah prosses pengujiann JST. Jika nnilai keluaraan JST menyyatakan titikk segmentasi tersebut benar, b makaa titik segm mentasi akhirr dari citra akan disim mpan, dan jiika keluarann JST menyyatakan titik k segmentassi tersebut salah, makaa titik segm mentasi akhir yang diujikkan akan diaabaikan. Hassil dari titik segmentasi benar adalah h titik segm mentasi setelaah validasi.
Gambarr 12. Diagram m Alir Sub-rutiin Koreksi Seggmentasi
III. HASIL PERCO OBAAN Pada penellitian ini, citra yang diggunakan pad da pengujiann diambil daari database IAM Handdwriting Daatabase sebaanyak 72 ciitra dengan 368 pola benar dan salah. Kem mudian segm mentasi benarr dan salah akkan dihitung. Segmentasi salah terdirri dari yaitu oover-segmen ntation dan missed m segm mentation. Ovver-segmentaation adalah kelebihan segmentasi s yyang muncull pada satu huruf, h sedanngkan missedd segmentatiion adalah segmentasi s y yang seharussnya ada di antara
ISSN:: 1979-2867
SEGMENTASI TULISAN TANGAN BERSAMBUNG PADA IAM HANDWRITING DATABASE
9
dua huruf tetapi kenyataannya tidak ada. Contoh over-segmentation dan missed segmentation dapat dilihat pada Gambar 13.
Gambar 13. Contoh over-segmentation dan missed segmentation
Adapun tampilan Program Segmentasi Tulisan Tangan Bersambung, adalah sebagai berikut (Gambar 14) :
Gambar 14. Tampilan Program Segmentasi Tulisan Tangan Bersambung
Untuk mengukur akurasi hasil segmentasi tulisan tangan, perhitungan dilakukan dengan cara membandingkan segmentasi citra hasil validasi yang tepat memisahkan huruf dengan benar (segmentasi benar), terhadap segmentasi citra yang dilakukan secara visual mata manusia
ISSN: 1979-2867
10
ELECTRICAL EN NGINEERING G JOURNAL, VOL. 5, NO. 1, OCTOBER R 2014
(segm mentasi targeet). Contoh dapat d dilihat pada p Tabel 1. 1 TABEL 1. CONTOH SEGMEN NTASI CITRA VISUAL I DAN HASIIL VALIDASI
Segmentasi S C Citra Visual
Segmentasi Target
Segmen ntasi Citra Vaalidasi
Missed Seg gmentation
Oversegmentatioon
Segmenttasi Benarr
3
1
2
2
3
0
0
3
Pada contooh dapat terliihat bahwa citra c ‘made’ memiliki 3 segmentasi target. Darii hasil percoobaan segm mentasi citra validasi ‘made’ mem miliki 1 miissed segmeentation, 2 oversegmentation, dan 2 segmenttasi benar. Begitu B juga pada contohh citra ‘will’ yang memiiliki 3 segm mentasi targett. Dari hasil percobaan segmentasi s citra c validasii ‘will’ tidakk memiliki missed m segmentation mauupun over-seegmentation, dan diperoleeh 3 segmenntasi benar. Setelah peercobaan dillakukan padda seluruh citra uji yang y ada, maka didap patkan perhitungan akuraasi sistem secara keseluruuhan yang diiperlihatkan pada Tabel 22. TABEL 2. PRESEENTASE AKURASSI SEGMENTASI TULISAN TANGA AN BERSAMBUN NG
Total Segmentaasi Uji Segmentasi Benar B Missed Segmentaation 368 299 69 P Presentase Segmentasi Bennar 299/368 P Presentase Miissed Segmenttation 69/368 P Presentase Ovver-segmentattion 70/368
Over--segmentation n 70 81,25% 18,75% 19,02%
Dari hasil percobaan, p beberapa darii citra dapat tersegmentas t si dengan beenar, namun masih ada segmentasi s y yang kurang tepat atau tidak terdetek ksi sebagai seegmentasi. P Pada Tabel 2 hasil preseentase akurassi segmentasi secara keseeluruhan dipeeroleh sebesar 81,25%. H Hasilnya term masuk cukupp tinggi, naamun presenntase missed segmentatio on sebesar 18,75% dann presentase oversegmentation sebesar 19,02% % termasuk yaang masih baanyak dan masih harus diiperbaiki. Kekurangann dari Sistem m Segmentaasi Tulisan Tangan T adallah pada cittra yang hurrufnya yang berhimpitann secara verrtikal, metodde ini tidak dapat diapliikasikan, sepperti diperlih hatkan pada Gambar 15. Contoh paada kata ‘Hoouse’ ada 2 huruf h yang menempel m ‘sse’ dan padaa kata ‘Partyy’ huruf yang menemppel adalah ‘P Pa’, tidak dapat d diangggap sebagai segmentasi huruf karenna nilai IPK diantaranya d ( (citra tulisann hasil thinnin ng) bukan niilai minimal (titik segmen ntasi).
Gambar 15. Citra yang gaagal disegmenttasi sebelum masuk m ke JST
ISSN:: 1979-2867
SEGMENTASI TULISAN TANGAN BERSAMBUNG PADA IAM HANDWRITING DATABASE
11
IV. KESIMPULAN Pada penelitian segmentasi tulisan tangan bersambung dengan menggunakan Jaringan Syaraf Tiruan (JST) pada IAM Handwriting Database, telah diujikan pada 368 data uji sehingga diperoleh akurasi pengenalan segmentasi sebesar 81,25%. Akurasi segmentasi ini cukup baik, namun hasil segmentasi ini juga dipengaruhi oleh nilai persentase missed segmentation yang sebesar 18,75% dan persentase over-segmentation sebesar 19,02%. Kegagalan pengenalan segmentasi masih terjadi pada kasus tulisan tangan yang tulisannya berhimpitan secara vertikal. Untuk penelitian selanjutnya, diharapkan dapat dicari metode/ algoritma segmentasi yang lebih tangguh terhadap variasi tulisan tangan manusia, khususnya untuk tulisan tangan yang huruf-hurufnya bersinggungan. Selain itu metode/algoritma tersebut diharapkan bisa mengurangi kasus miss segmentation ataupun over-segmentation.
DAFTAR REFERENSI [1] M. Cheriet, N. Kharma, C. L. Liu, and C. Y. Suen, Character Recognition Systems : A Guide For Students And Practioners, Hoboken, New Jersey: John Wiley & Sons, Inc., 2007. [2] C. K. Cheng, X. Y. Liu, M. Blumenstein, and V. Muthukkumarasamy, “Enhancing neural confidence-based segmentation for cursive handwriting recognition”, in Proc. of the 5th International Conference on Simulated Evolution and Learning, SWA-8, Busan, Korea, 2004. [3] F. Kurniawan, M. S. M. Rahim, N. Sholihah, A. Rakhmadi, and D. Mohamad, “Characters Segmentation of Cursive Handwritten Words based on Contour Analysis and Neural Network Validation”, ITB J. ICT, Vol. 5, No. 1, 1-16, 2011. [4] T. Saba, A. Rehman, and G. Sulong, “Cursive Script Segmentation with Neural Confidence”, ICIC International, Johor, Malaysia, 2011.
ISSN: 1979-2867