SISTEM PENGENALAN TULISAN TANGAN REAL TIME MENGGUNAKAN METODE DOMINANT POINT DAN JARINGAN SYARAF TIRUAN LEARNING VECTOR QUANTIZATION
Oleh: Bakhtiar Arifin (1206 100 722) Dosen Pembimbing: Prof. DR. M. Isa Irawan, MT
JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA
DAFTAR ISI PENDAHULUAN
LATAR BELAKANG
RUMUSAN MASALAH
BATASAN MASALAH
TUJUAN DAN MANFAAT
TINJAUAN PUSTAKA
KAJIAN TERDAHULU
METODE DOMINANT POINT
JARINGAN SYARAF TIRUAN LVQ
METODOLOGI PENELITIAN
RANCANGAN UMUM SISTEM
SEGMENTASI
METODE DOMINANT POINT
KLASIFIKASI
PENGARUH LEARNING RATES
PENGARUH NILAI BATAS CANDIDATE SELECTION
UJI COBA KESELURUHAN
UJI COBA
KESIMPULAN DAN SARAN DAFTAR PUSTAKA
LATAR BELAKANG Perkembangan Komuter dan Device Pendukung
Pengenalan Tulisan Tangan Real Time
Metode Dominant Point
Jaringan Syaraf Tiruan LVQ
RUMUSAN MASALAH Berdasarkan latar belakang masalah di atas maka diperoleh rumusan masalah sebagai berikut: 1. Bagaimana merancang dan membangun sistem
pengenalan tulisan tangan real time. 2. Bagaimana pengimplementasian metode dominant point untuk ekstraksi ciri tulisan tangan real time. 3. Bagaimana pengimplementasian metode jaringan syaraf tiruan learning vector quantization (LVQ) untuk pengenalan karakter tulisan tangan real time.
BATASAN MASALAH Batasan masalah pada penelitian ini antara lain sebagai berikut: 1. Pengenalan karakter dilakukan dengan menggunakan jaringan syaraf tiruan learning vector quantization. 2. Karakter yang akan dikenali adalah data abjad A-Z, az, angka 0-9 dan beberapa simbol matematika (α, ß, γ, π, -, +,* , /, < dan >). 3. Pengenalan dilakukan per-karakter (Single Character Recognition). 4. Sistem akan diimplementasikan menggunakan Java Netbeans 6.8.
TUJUAN DAN MANFAAT Tujuan Tujuan dari tugas akhir ini adalah perencanaan dan pembuatan sistem pengenalan tulisan tangan real time dengan menggunakan metode dominant point dan jaringan syaraf tiruan learning vector quantization. Manfaat Sistem yang akan dibuat diharapkan dapat menjadi alterantif dalam input data komputer selain dari mengetik melalui keyboard. Selain itu dapat juga digunakan sebagai acuan dalam pemilihan metode pengenalan tulisan tangan untuk pengembangan selanjutnya.
KAJIAN TERDAHULU
Asworo (2010)
Achmad Fauzi A (2010)
• Perbandingan Antara Metode Kohonen Neural Network Dan Learning Vector Quantization Pada Sistem Pengenalan Tulisan Tangan Secara Real Time
• Perangkat Lunak Pengkonversi Teks Tulisan Tangan Menjadi Teks Digital
METODE DOMINANT POINT Metode ini merupakan salah satu metode yang digunakan untuk mengenali garis ataupun kurva. Dari semua titik-titik yang diterima sistem sebagai input akan dipilih titik-titik yang merupakan local extrema kurva. Titik-titik inilah yang disebut dengan dominant points. Berdasarkan dominant points yang ada, ditentukan arah gerakan pena. Arah gerakan yang didapat akan dicocokkan dengan reference yang dimiliki dengan menggunakan jaringan syaraf tiruan learning vector quantization.
DOMINANT POINT Dominant point adalah titik-titik yang termasuk dalam kategori berikut ini: (a) titik awal dan titik akhir goresan/stroke; (b) local extrema; (c) titik tengah yang
menghubungkan dua titik dari kategori (a) dan (b).
DIRECTION PRIMITIVES Direction primitives digunakan untuk mengubah arah gerak ke dalam kode. Arah gerak yang dipakai ada 8 macam, yaitu {E, SE, S, SW, W, NW, N, NE}. Arah gerak tersebut akan dikodekan ke dalam bilangan 0 sampai 7. Setelah semua arah dikodekan, akan didapatkan chain code untuk setiap stroke
PEMBAGIAN AREA DIRECTION PRIMITIVES
JARINGAN SYARAF TIRUAN LVQ Adapun algoritma dari LVQ adalah : Langkah 1. Inisialisasikan vektor referensi dan learning rate,
Langkah 2. Selama kondisi berhenti bernilai salah, kerjakan a. Inisialisasikan vektor referensi dan learning rate, b. Temukan sehingga bernilai minimum c. Perbaiki dengan : 1. jika T = c j maka 2. jika T c j maka d. Kurangi learning rate e. Tes kondisi berhenti
w j (baru ) w j (baru )
w j (lama)
x w j (lama )
w j (lama)
x w j (lama )
SKEMA UMUM RANCANGAN SISTEM
AKUSISI DATA goresan ke-1 titik ke-1 (x,y) titik ke-2 (x,y) titik ke-3 (x,y) . . . goresan ke-2 titik ke-1 (x,y) titik ke-2 (x,y) titik ke-3 (x,y) . . .
SEGMENTASI
SEGMENTASI
(a)
(c)
(b)
(d)
Gambar 3.2. Ilustrasi proses segmentasi. a) Input Tulisan, b) Segmentasi Karakter c) Segmentasi Baris, d) Segmentasi Kata.
DOMINANT POINT
Normalisasi Data
Get Start and End Area
GET DOMINANT POINTS 4555555555554654554455454654544444444444444444444444434434343443 3334243432323234233323324324233223323243222232223222222222222221 1221212112212121221110202111111201011011010110100101001001001000 0000000000000000000007070000670777070777707060670760777060770670
5555555555544444444444444444444443333333222222222222222222211111 1111000000000000000000000000007777777777
5432107
GET DOMINANT POINTS
(a) (b) Gambar 3.5. Ilustrasi proses dominant point a) Input Karakter, b) Dominant Point
EKSTRAKSI CIRI • Normalisasi Chain Code
55432107
555555444433332222111100007777
EKSTRAKSI CIRI •
Binerisasi
555555444433332222 111100007777
101101101101101101100100100100 011011011011010010010010001001 001001000000000000111111111111
KLASIFIKASI • Trainig LVQ
KLASIFIKASI • Candidate Selection
Kriteria penilaian precandidate adalah dengan menggunakan jumlah stroke, start area dan end area.Jika kode area tepat sesuai dengan kode yang diinginkan, maka score-nya adalah 100, namun jika areanya bergeser ke daerah yang di sebelahnya maka score yang diberikan adalah 50. Jika areanya melenceng jauh, maka score yang diberikan adalah 0. Masing-masing score untuk kode area akan dirata-rata sesuai dengan jumlah goresannya.
KLASIFIKASI • Testing LVQ
UJI COBA • Pengaruh Learning rates
UJI COBA • Pengaruh Nilai Batas Candidate Selection
UJI COBA
UJI COBA Terdapat beberapa hal yang menyebabkan sistem tidak berjalan dengan baik yaitu : a. Semakin banyak jenis karakter atau angka yang dilatih maka persentase akurasi yang dihasilkan akan semakin berkurang. Hal ini disebabkan karena semakin banyak karakter atau angka yang mirip arah goresannya. b. Penulisan dengan menggunakan mouse kurang memberikan hasil yang baik karena user sulit untuk menyesuaikan antara karakter yang akan dilatih dan diuji.
KESIMPULAN Dari implementasi dan uji coba sistem pengenalan tulisan tangan secara real time dengan metode dominant point dan jaringan syaraf tiruan learning vector quantization diperoleh hasil pengenalan yang cukup baik. Akurasi yang diperoleh pada pengenalan 72 karakter dengan 720 data training sebesar 76%.
SARAN 1.
2.
3.
Data yang digunakan untuk proses training masih kurang bervariasi. Untuk lebih meningkatkan akurasi penenalan tulisan, proses pengenalan bisa dilanjutkan dengan proses postprocessing dengan mencocokkan hasil pengenalan kedalam database kamus untuk mencari kata yang paling mendekati. Pengenalan tulisan tangan untuk simbol-simbol matematika masih bisa dilanjutkan untuk pengenalan indeks, pangkat, matriks dan lain sebagainya.
DAFTAR PUSTAKA [1] Asworo. 2009. “Perbandingan Antara Metode Kohonen Neural Network dan Learning Vector Quantization Pada Sistem Pengenalan Tulisan Tangan Secara Real Time”. Tugas Akhir Jurusan Matematika FMIPA-ITS.
[2] Fausett, L. 1994. Fundamental of Neurall Network : Architectures, Algorithms, and Applications. Prentice Hall International, Inc. [3] Fauzi, Ahmad. 2009. “Perangkat Lunak Pengkonversi Teks Tulisan Tangan Menjadi Teks Digital”. Tugas Akhir Jurusan Matematika FMIPA-ITS. [4] Kristanto, A. 2004. Pengantar Jaringan Syaraf Tiruan. Yogyakarta : Gava Media. [5] Li, X., Yeung, D.Y. 1996. On-line Handwritten alphanumeric Character Recognition Using Dominant Points in Strokes.
[6] Soedjianto,F dkk. 2005. Pengenalan Tulisan Tangan Berdasarkan Arah Gerakan Tangan menggunakan Metode Dominant Point.