DIGITAL INFORMATION & SYSTEM CONFERENCE 2012
DOKUMENTASI ULANG NASKAH BRAILLE MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK 1
2
Chairisni Lubis , Yoestinus Fakultas Teknologi Informasi, Universitas Tarumanagara-Jakarta,
[email protected] 2 Fakultas Teknologi Informasi, Universitas Tarumanagara-Jakarta,
[email protected] 1
ABSTRAK Karakter Braille digunakan oleh penyandang tuna netra untuk membaca dan menulis. Pada penelitian ini, Backpropagation Neural Network digunakan untuk mengenali naskah Braille yang sudah cacat dan tidak memiliki softcopy lagi sehingga dapat didokumentasi ulang dengan baik. Citra Braille mula-mula diproses dahulu (preprosesing) dengan menggunakan proses pengolahan citra untuk memperbaiki kualitas citra. Dengan menggunakan poses deteksi tepi Sobel diharapkan objek citra Braille dapat dipisahkan dari latar belakangnya dan noise dapat dihilangkan. Dan dengan mencari nilai threshold yang sesuai maka kualitas dari titik-titik yang timbul pembentuk karakter Braille dapat diperbaiki. Tingkat keberhasilan pengenalan Backpropagation Neural Network pada pengenalan naskah Braille sangat dipengaruhi oleh besarnya nilai threshold. Untuk tingkat keberhasilan pengenalan tertinggi sebesar 92,31% didapat dengan menggunakan nilai threshold 30. Kata kunci : Backpropagation Neural Network, Braille, deteksi tepi, threshold. 1. PENDAHULUAN Pengenalan pola (Pattern Recognition) merupakan salah satu cabang ilmu komputer yang sedang berkembang pada saat ini. Ada beberapa metoda yang digunakan untuk pengenalan pola, salah satunya adalah Backpropagation Neural Network (BPNN) yang mempunyai kemampuan dalam mengenali pola yang sedikit berbeda dengan pola yang sudah dipelajari sebelumnya. Pada dokumentasi ulang naskah Braille ini, BPNN akan digunakan untuk mengenali karakter Braille yang digunakan oleh penyandang tuna netra untuk membaca dan menulis. Karakter Braille ditulis dalam bentuk huruf timbul (kombinasi dari beberapa titiktitik yang timbul) dengan warna yang sama dengan kertasnya Penyandang tuna netra membaca tulisan Braille dengan cara meraba karakter Braille satu persatu. Kualitas tulisan Braille yang berupa huruf timbul akan berkurang dengan berjalannya waktu, karena sering diraba atau tempat penyimpanan yang kurang baik. Titik yang seharusnya timbul lama kelamaan hampir rata dengan latar belakangnya (cacat), sehingga ada kemungkinan terjadi salah baca. Dokumentasi ulang naskah Braille dengan menggunakan Backpropagation Neural Network (BPNN) ini bertujuan untuk mendokumentasikan ulang naskah Braille dari buku lama yang kemungkinan sudah cacat dan tidak memiliki soft copy lagi. Output dari BPNN dapat digunakan untuk menulis ulang teks Braille tersebut atau untuk mengkonversikan teks Braille menjadi teks Normal yang dapat dibaca oleh manusia yang normal.
91
DIGITAL INFORMATION & SYSTEM CONFERENCE 2012
2. PEMBAHASAN 2.1 Kerangka Teori Pengenalan pola dengan menggunakan Neural Network merupakan salah satu bidang penelitian yang sedang berkembang saat ini. Pola yang dikenali juga sudah bermacammacam misalnya : pola karakter normal, karakter Braille, tanda tangan, wajah dan pola lainnya. Tingkat pengenalannya bisa mencapai lebih dari 90% tetapi masih ada yang belum mencapai 100%, karena itu penelitian terus dikembangkan untuk mendapatkan hasil yang lebih baik. Pengembangannya bisa terletak pada metoda yang digunakan pada pemrosesan awalnya, atau pada metoda Neural Network yang digunakan. Selain itu objek penelitiannya dapat dikembangkan juga. Pada penelitian “ Pengenalan Teks Braille Berbasis Jaringan Saraf Tiruan Feedforward Multilayer Dengan Menggunakan Metoda Backpropagation ” yang dilakukan oleh Praditya Firmansyah, Wahyu Amien safei, dan Iwan setiawan, hasil pengenalanya sudah mencapai 99 %. Objek penelitian yang digunakan berupa naskah Braille (tidak disebutkan kondisinya) yang terdiri dari huruf kecil dan spasi Outputnya berupa suara yang merupakan karakter Braille hasil pengenalan [4]. Untuk meningkatkan kemampuan BPNN dalam mengenali pola naskah braille, maka pada penelitian ini, objek penelitian yang digunakan berupa naskah Braille yang berasal dari buku lama yang kemungkinan sudah cacat dan tidak memiliki soft copy lagi. Hasil pengenalannya akan digunakan untuk menulis ulang buku tersebut. Buku yang dipilih berisi naskah Braille yang terdiri dari huruf kecil, huruf besar, angka, tanda baca, dan spasi. Untuk memisahkan setiap karakter Braille maka digunakan ukuran-ukuran yang sesuai dengan posisi dan jarak titik huruf braille dalam penulisan Braille yang akan dijelaskan pada bab ini. Pada proses pengenalan naskah Braille dengan menggunakan Backpropagation ini ada beberapa proses yang dilakukan. Proses yang akan dijelaskan pada bab ini hanya proses yang paling dominan digunakan dalam penelitian ini yaitu : proses deteksi tepi (edge detection), pengenalan pola dengan menggunakan BPNN, dan akan dijelaskan juga sebelumnya mengenai karakter Braille yang menjadi objek pada penelitian ini. 2.1.1 Karakter Braille Karakter Braille adalah sejenis sistem tulisan sentuh/tulisan timbul yang digunakan oleh tuna netra. Huruf-huruf Braille menggunakan kerangka penulisan seperti kartu domino. Satuan dasar dari sistem tulisan ini disebut sel braille di mana tiap sel terdiri dari enam titik timbul, tiga baris dengan 2 titik. Keenam titik tersebut dapat disusun sedemikian rupa hingga menciptakan 63 macam kombinasi/karakter untuk membentuk huruf-huruf abjad, tanda baca, tanda-tanda dasar untuk matematika, musik, dan sejumlah tanda singkatan [1]. Dari kombinasi keenam titik itu akan tersusun berbagai karakter yang diinginkan. Untuk memudahkan perujukan titik-titik dalam kerangka tersebut diberi nomor tetap 1, 2, 3, 4, 5, dan 6 pada posisi dan jarak seperti pada gambar 1. Teknik membaca naskah braille dimulai dari atas ke bawah dan kiri ke kanan (sama seperti membaca naskah biasa). Sebuah naskah braille dapat di tulis di kedua sisinya
92
DIGITAL INFORMATION & SYSTEM CONFERENCE 2012
(bagian depan dan belakang). Naskah yang hanya memiliki satu sisi saja disebut singlesided, sedangkan yang memiliki kedua-duanya disebut double sided [5].
Gambar 1. Posisi dan jarak titik Braille Sumber : Perpustakaan Institut TeknologiTelkom, Braille, http://www.ittelkom.ac.id, 27 Februari 2011
Gambar 2 Huruf abjad Braille Sumber : Louis Braille School, Braille Alphabet and Numbers, http://louisbrailleschool.org/ban.pdf, 27 Februari 2011
Gambar 3 Tanda baca braille Sumber : Structure of Braille, Punctuation Marks, http://dots.physics.orst.edu/gs_bs_seb.html, 27 Februari 2011 Standarisasi braille yang digunakan di setiap Negara berbeda-beda. Ada yang menggunakan kombinasi 6 titik dan ada juga yang menggunakan 8 titik. Untuk standarisasi braille yang digunakan tunanetra di Indonesia, baik itu Sekolah Luar Biasa maupun lembaga-lembaga ketuna-netraan menggunakan standard tulisan braille seperti gambar 2 dan gambar 3. Untuk menulis huruf besar dan angka braille diawali dengan tanda khusus braille. Tanda ini dimaksudkan untuk mengubah karakter braille. Mengingat kerangka Braille hanya dapat membentuk sebanyak-banyaknya 63 konfigurasi karakter. Hal seperti itu tidak dimungkinkan pada tulisan braille kecuali dengan membubuhkan tanda khusus di depannya. Tanda-tanda khusus Braille dapat dilihat pada gambar 4 dan gambar 5.
93
DIGITAL INFORMATION & SYSTEM CONFERENCE 2012
Gambar 4 Huruf kapital braille Sumber : Braille Font, Free 6-dot Braille & 8-dot Braille Font, http://6dotbraille.com/6-dotbraille-capital-letters.html, 3 Maret 2011
Gambar 5 Angka braille Sumber : Louis Braille School, Braille Alphabet and Numbers, http://louisbrailleschool.org/ban.pdf, 27 Februari 2011 2. 1. 2 Edge Detection Proses deteksi tepi (Edge Detection) bertujuan untuk memperjelas garis-garis batas yang terdapat pada citra gambar. Dekeksi tepi memiliki sifat memperkuat komponen berfrekuensi tinggi. Dengan adanya hal ini, bentuk dasar dari sebuah obyek akan terlihat jelas. Deteksi tepi pada suatu citra adalah suatu proses yang menghasilkan tepi-tepi dari obyek-obyek citra, yang tujuannya adalah :[6] 1. Untuk menandai bagian yang menjadi detail citra 2. Untuk memperbaiki detail dari citra yang kabur, yang terjadi karena error atau adanya efek dari proses akuisisi citra. Secara umum, tepi suatu objek dalam citra dinyatakan sebagai titik yang nilai warnanya berbeda cukup besar dengan titik yang ada di sebelahnya. Ada beberapa mask yang telah dirancang untuk deteksi tepi yaitu Operator Robert, Prewitt, Sobel, Isotropik, dan Operator Laplacian [2]. Pada penelitian ini digunakan metode Sobel untuk mendeteksi tepi citra naskah Braille. dikarenakan metode ini memiliki kelebihan untuk mengurangi noise dalam pengolahan citra yang berguna untuk mendeteksi tepi suatu objek dalam citra digital. 2. 1. 3 Backpropagation Neural Network Metode Back Propagation Neural Network (BPNN) digunakan karena kemampuannya dalam mengenali pola yang sedikit berbeda dengan pola yang sudah dipelajari sebelumnya. Dalam pengenalan pola naskah Braille ini, pola yang sedikit berbeda berasal dari naskah Braille yang cacat akibat seringnya disentuh atau tempat penyimpanan yang kurang baik. Back Propagation Neural Network merupakan salah satu metoda pembelajaran yang terawasi (superviced learning) dalam Neural Network. Setiap metoda pembelajaran dalam Neural Network memiliki 3 buah karakteristik yang mencirikan metode pembelajarannya yaitu : Arsitektur, Metoda Pembelajaran, dan Fungsi Aktivasi.
94
DIGITAL INFORMATION & SYSTEM CONFERENCE 2012
2.2 Metode Penelitian Pada dokumentasi ulang naskah Braille ini digunakan Back Propagation Neural Network (BPNN) untuk proses pengenalannya. Sebelum proses pengenalan dilakukan, terlebih dahulu dilakukan tahap pemrosesan awal (preprosesing) pada citra naskah Braille untuk mendapatkan vektor ciri (feature vector) yang akan diinputkan ke BPNN. Tahapan pemrosesan yang digunakan dalam penelitian ini untuk mengenali naskah Braille adalah 1. Scanning Untuk mendapatkan citra Braille maka naskah Braille yang akan dikenali discan dahulu dengan menggunakan Scanner. Naskah Braille yang akan dikenali berasal dari buku lama yang kemungkinan sudah cacat dan tidak memiliki soft copy lagi. Buku yang dipilih berisi naskah Braille yang terdiri dari huruf kecil, huruf besar, angka, tanda baca, dan spasi. Output citra Braille hasil scanning berupa file berformat BMP. 2. Edge Detection Deteksi tepi Sobel (Sobel edge detection) digunakan untuk meningkatkan penampakan garis batas objek dalam citra Braille, sehingga dapat membedakan citra Braille dari latar belakangnya. 3. Thresholding Proses thresholding dilakukan untuk mengubah nilai intensitas piksel pada citra Braille menjadi 2 nilai yaitu 0 untuk warna hitam dan 255 atau untuk warna putih. Tujuan proses thresholding untuk memisahkan dan membedakan antara karakter Braille dengan latar belakangnya. Pada penelitian ini akan dicari nilai thresholding yang terbaik digunakan untuk mengenali naskah Braille. 4. Feature Exctraction : Ekstraksi ciri (feature extraction) digunakan untuk mendapatkan vektor ciri (feature vector) yang mencirikan karakter Braille. Pada penelitian ini ciri yang diambil adalah nilai dari titik-titik pembentuk karakter Braille yang berukuran matriks 3x2. Setiap titik bernilai 1 dan jika tidak ada titik bernilai 0. Untuk menandai huruf besar dan angka Braille diawali dengan tanda khusus Braille. Dengan demikian terdapat 8 buah vektor ciri untuk setiap karakter Braille. 5. Pattern Recognition Back Propagation Neural Network (BPNN) digunakan untuk Pengenalan pola (pattern recognition) naskah Braille. Input BPNN berasal dari hasil ekstraksi ciri pada proses sebelumnya yang berjumlah 8 buah. Dalam implementasinya nilai neuron input ke 1 sampai 6 merupakan nilai titik-titik pembentuk karakter Braille, sedangkan neuron ke 7 dan 8 mewakili tanda khusus Braille. Nilai dari tanda khusus Braille diambil dari pola yang dimasukkan sebelumnya. Output BPNN berupa hasil pengenalan dari naskah Braille yang berjumlah 75 karakter Braille yang terdiri dari 26 huruf kecil, 26 buah huruf besar, 10 buah angka, 11 tanda baca dan spasi, dan 2 buah tanda khusus untuk menandai karakter angka dan karakter huruf besar. Dengan demikian arsitektur BPNN yang digunakan terdiri dari 8 buah neuron di lapisan input, 75 buah neuron di lapisan output, sedangkan jumlah neuron pada lapisan tersembunyi (hidden layer) ditentukan dengan cara coba-coba. 6. Conversion Output dari BPNN dari hasil proses pengenalan berupa nilai aktivasi neuron output yang mempunyai jangkauan nilai antara 0 dan 1. Untuk mendapatkan hasil pengenalannya`maka biasanya nilai yang kurang dari 0,5 dianggap 0, dan yang lebih
95
DIGITAL INFORMATION & SYSTEM CONFERENCE 2012
dari atau samadengan 0,5 dianggap 1. Kombinasi nilai output 1 dan 0 ini kemudian dicocokkan dengan target yang digunakan dalam proses pembelajaran untuk mendapatkan karakter Braille yang sesuai. Karakter normal didapatkan dengan menggunakan tabel konversi dari karakter Braille ke karakter normal. 2.3 Hasil Pengujian 2.3.1 Data Pengujian Pada dokumentasi ulang naskah Braille ini, data yang digunakan dalam proses pengenalan karakter Braille dengan menggunakan Back propagation Neural Network (BPNN) berasal dari buku : Franklin Bermain Sepak Bola, Pengarang: Paulette Bourgeois & Brenda Clark, Penerbit: Kanisius yang dibraillekan Oleh: Yayasan Mitra Netra Jakarta, 2007. Data diambil/discan dari halaman 1 – 8. Buku tersebut dipinjam dari Perpustakaan Yayasan Mitra Netra, Lebak Bulus-Jakarta. Dengan menggunakan Scanner, karakter Braille dikonversi ke dalam bentuk digital berformat BMP. Citra Braille ini kemudian diproses dengan menggunakan metode yang sudah dijelaskan sebelumnya.Pada proses pembelajarannya, karakter Braille yang digunakan merupakan karakter standard yang ada dalam bab 2. Ada 26 huruf kecil, 26 buah huruf besar, 10 buah angka, 11 tanda baca dan spasi, dan 2 buah tanda khusus untuk menandai karakter angka dan karakter huruf besar. 2.3.2 Hasil Pengujian Pengujian dilakukan dalam 2 tahap, yaitu tahap Pembelajaran dan tahap Pengenalan BPNN Tahap Pembelajaran BPNN Tahap pembelajaran berfungsi untuk mencari nilai learning rate (α) dan jumlah neuron pada hidden layer yang optimum. Metoda yang digunakan untuk mencari nilai optimum adalah metoda coba-coba (try and error). Range nilai yang digunakan untuk mencari nilai laju pembelajaran (α) adalah sebesar 0,1 sampai 1 sedangkan jumlah neuron di hidden layer (n) sebesar 69 sampai 73. Untuk Nilai parameter-parameter BPNN digunakan : - Maximum Epoch = 50.000 - Maximum Error = 0,001 Percobaan pertama dilakukan untuk mencari neuron di hidden layer yang optimum dengan menggunakan nilai α yang tetap sebesar 0,5. Hasilnya dapat dilihat pada tabel 1 di bawah ini. Tabel 1 Jumlah neuron di hidden layer yang optimum
Epoch
α
Max Error
n
Error
37153
0,5
0,001
69
0,00099972
24937
0,5
0,001
70
0,00099924
50000
0,5
0,001
71
3,78457987
50000
0,5
0,001
72
0,58905501
50000
0,5
0,001
73
0,07077887
96
DIGITAL INFORMATION & SYSTEM CONFERENCE 2012
Tabel 2 Laju Pembelajaranyang optimum Max Epoch α n Error Error 50000 0,1 0,001 70 0,00367638 24744 0,2 0,001 70 0,00099978 25613 0,3 0,001 70 0,00099971 50000 0,4 0,001 70 0,07913638 24937 0,5 0,001 70 0,00099924 50000 0,6 0,001 70 0,00719142 19505 0,7 0,001 70 0,00099931 13960 0,8 0,001 70 0,00099991 11148 0,9 0,001 70 0,00099964 25438 1 0,001 70 0,00099979 Dari tabel 1 di atas terlihat nilai maximum error tercapai pada setiap percobaan, dengan demikian diambil kriteria jumlah epoch yang terkecil untuk mendapatkan neuron di hidden layer yang optimum. Pada tabel 1, minimum epoch didapat dengan menggunakan jumlah neuron 70. Selanjutnya dengan menggunakan jumlah neuron di hidden layer sebanyak 70 dicari nilai α yang optimum, hasilnya dapat dilihat pada tabel 2. Dengan menggunakan ketentuan yang sama seperti di atas, maka nilai α terbaik adalah 0,9 Tahap Pengenalan BPNN Pengujian pengenalan naskah Braille pada buku Franklin Bermain Sepak Bola, dilakukan dengan menggunakan nilai threshold yang berbeda pada saat proses thresholding untuk menjadikan nilai biner. Data input diambil dengan cara menscan naskah Braille dengan menggunakan Scanner. Pada saat pengenalan ini, parameter-parameter BPNN dan bobot keterhubungannya diambil dari hasil pembelajaran. Hasil pengujian pengenalannya dapat dilihat pada tabel 3. Tabel 3 Persentase keberhasilan pengenalan
1
20 (%) 84,13
Threshold 30 40 50 (%) (%) (%) 82,54 82,54 77,78
60 (%) -
2
72,36
70,73 71,54 71,54
-
3
87,07
82,31 57,14 52,38
-
4
87,05
82,73 80,58 79,14
-
5
83,44
83,44
6
82,64
84,72 79,86 80,56
-
7
91,88
92,31 89,74 88,89
86,75
8
87,05
84,17
Hal. Buku
81,6
74,1
79,75
58,27
69,94
-
2.3.3 Pembahasan Hasil Pengujian Rata-rata tingkat keberhasilan tertinggi sebesar 84,45% di dapat dengan menggunakan nilai threshold sebesar 20, tetapi dari tabel 3 terlihat untuk tingkat keberhasilan
97
DIGITAL INFORMATION & SYSTEM CONFERENCE 2012
pengenalan tertinggi sebesar 92,31% didapat dengan menggunakan nilai threshold 30. Dengan menggunakan nilai threshold 70 BPNN gagal mengenali naskah Braille, sedangkan pada nilai threshold 60 masih ada naskah Braille yang dapat dikenali. Dari hasil pengamatan, kegagalan pengenalan tersebut disebabkan karena : Pada nilai threshold di atas 60 naskah Braille sulit dikenali, karena pada saat proses ekstraksi ciri piksel-piksel pada bagian awal naskah tidak terdeteksi. Satu titik timbul yang terdapat pada satu karakter braille pada perancangan program diwakili oleh minimal piksel bernilai 1 berjumlah 13. Pada nilai threshold di atas 60, titik timbul sulit terdeteksi karena jumlah piksel bernilai 1 yang berdekatan tidak ada yang berjumlah lebih dari 13. Contoh hasil ekstraksi ciri dengan menggunakan nilai threshold sebesar 70 dapat dilihat pada gambar 6. Kesalahan pengenalan pada karakter a, seharusnya titik timbul terdapat pada posisi 1 (di aturan pola 6 titik). Hasil thresholding menunjukkan jika a yang sudah cacat maka tidak ada titik dalam 1 karakter sehingga dikenal dengan karakter space. Kesalahan pengenalan pada karakter s dan n. Titik timbul huruf s terdapat pada posisi 2, 3, 4 sedangkan untuk huruf n terdapat pada posisi 1, 3, 4, dan 5. Pada proses ekstraksi ciri karakter s, terjadi pergeseran batas sehingga titik 4 terdapat diantara batas titik 1 dan 4 yang menyebabkan titik 1 turut terbaca sebagai titik yang timbul. Begitu pula pada karakter n, terjadi pergeseran batas sehingga titik 5 terdapat diantara batas titik 2 dan 5 yang menyebabkan titik 2 turut terbaca sebagai titik yang timbul. Contoh hasil pengenalan yang salah dapat dilihat gambar 7. BPNN dapat mengenali pola yang hampir sama dengan pola yang sudah dipelajari sebelumnya. Pada karakter Braille dengan pola 6 titik hanya dapat dibentuk 63 kombinasi. Pada perancangan program ini hanya digunakan 37 kombinasi (26 huruf abjad, 8 tanda baca, 1 karakter tanda huruf besar abjad, 1 karakter tanda angka, dan spasi). Sisanya ada 26 kombinasi yang tidak digunakan. Apabila terdapat karakter Braille yang cacat, misalnya titik yang seharusnya timbul menjadi tidak timbul, maka pola yang akan dikenali dapat dianggap sebagai karakter yang lain atau tidak terdeteksi.
3. KESIMPULAN Tingkat keberhasilan pengenalan Backpropagation Neural Network pada pengenalan naskah Braille sangat dipengaruhi oleh besarnya nilai threshold. Rata-rata tingkat keberhasilan tertinggi sebesar 84,45% didapat dengan menggunakan nilai threshold sebesar 20, sedangkan untuk tingkat keberhasilan pengenalan tertinggi sebesar 92,31% didapat dengan menggunakan nilai threshold 30. Dengan menggunakan nilai threshold 70 BPNN gagal mengenali naskah Braille.
98
DIGITAL INFORMATION & SYSTEM CONFERENCE 2012
Sobel Mask
Threshold 70
Ekstraksi Ciri
Gambar 6 Hasil proses ekstraksi cri dengan nilai threshold 70
Penggalan Data Gambar Threshold 20
Ekstraksi Ciri
Pengenalan
Gambar 7 Kesalahan pengenalan karakter s dan n Daftar Pustaka 1. 2. 3. 4.
5.
Didi, T. Mei 2000, Pedoman Format Braille, Fakultas Ilmu Pendidikan Universitas Pendidikan Indonesia, Bandung. Edy, W, 3 Maret 2011, Pengolahan Citra. http://edywinarno.com/wp-content/uploads/ 2009/ 09/ PENGOLAHAN-CITRA_7.pdf. Fausett, L, 1994, Fundamentals of Neural Network. Englewood Cliffs: Prentice-Hall,. Firmansyah P, Amien S W, Setiawan I, Pengenalan Teks Braille Berbasis Jaringan Saraf Tiruan Feedforward Multilayer Dengan Menggunakan Metoda Backpropagation, http://eprints.undip.ac.id/25448/ Perpustakaan Institut Teknologi Telkom, 26 Februari 2011, Pola Braille, http://www.ittelkom.ac.id/library/index.php?view=article&catid=20%3Ainformatika&id=469%3Abraille&option=com_content&Itemid=15.
99
DIGITAL INFORMATION & SYSTEM CONFERENCE 2012
6. 7.
Riyanto, 3 Febuari 2011, Deteksi Tepi, http://www.eepis-its.edu/~riyanto/citra-bab8.pdf. Usman, A, Pengolahan Citra Digital, 2005, Jakarta: Graha Ilmu.
100