BAB II LANDASAN TEORI
2.1. Pengenalan Tulisan Tangan Pengenalan tulisan tangan adalah salah satu cabang dari sistem pengenalan pola yang membahas isu mengenai pengenalan tulisan tangan menggunakan karakterisasi lokal karakter tulisan tangan.Pengenalan tulisan tangan merupakan kemampuan komputer untuk menerima dan menafsirkan citra tulisan tangan yang dapat dimengerti dari sumber seperti dokumen kertas, foto, layar sentuh dan perangkat lainnya.Gambar teks tertulis dapat digunakan secara offline melalui selembar kertas dengan menggunakan alat-alat optik. Selain menggunakan pena dapat juga dilakukan secara online, misalnya, dengan menggunakan layar sentuh (Saraf, 2013). Sistem pengenalan karakter tulisan tangan diklasifikasikan sebagai sistem online dan sistem offline. Dalam sistem online, probabilitas mengenali tulisan tangan yang direkam dengan digitizer saat ujung pena mengenai layar sentuh merupakan pengenalan karakter online. Namun dalam sistem offline, tulisan tangan ditangkap oleh scanner optik kemudian menjadi sebuah gambar.Ini melibatkan konversi otomatis teks dalam gambar ke dalam kode huruf yang bisa digunakan dalam komputer. Pengenalan tulisan tangan adalah proses untuk mengekstrak variasi gaya penulisan tangan yang berbeda (Gupta, 2008). Mengekstraksi informasi dari teks
7
8
ditujukan untuk pengenalan tulisan tangan, yang terdiri dari mengubah tanda grafis menjadi representasi simbolis. Oleh karena itu, gaya tulisan tangan yang spesifik dan unik dihilangkan melalui beberapa tahap pra-pengolahan yang fokus hanya pada pesan yang disampaikan oleh teks tertulis. Ukuran normalisasi, berdasarkan ekstraksi otomatis dari baseline atau kemiringan adalah beberapa teknik-teknikpreprocessingyang merupakan landasan dari sebagian besar sistem pengenalan tulisan tangan.
2.2. Pengolahan Citra Digital Citra digital merupakan sebuah larik (array) yang berisi nilai-nilai real maupun kompleks yang direpresentasikan dengan deretan bit tertentu (Putra, 2010). Pada pengaplikasiannya, dapat dikatakan bahwa pengolahan citra digital adalah sebuah disiplin ilmu yang mempelajari hal-hal yang berkaitan dengan perbaikan kualitas gambar (peningkatan kontras, transformasi warna, restorasi citra), transformasi gambar (rotasi, translasi, skala, transformasi geometrik), melakukan pemilihan citra ciri (feature image) yang optimal untuk tujuan analisis, melakukan proses penarikan informasi atau deskripsi objek atau pengenalan objek yang terkandung pada citra, melakukan kompresi atau reduksi data untuk tujuan penyimpanan data, transmisi data, dan waktu proses data (Sutoyo et.al., 2009). Beberapatahapanyangdigunakanuntuk
pengolahan
citra
digitaladalahakuisisi
gambar, proses transformasi warna citra, proses thresholding dan proses penipisan guratan.
9
2 2.2.1 Aku uisisi Gam mbar Dalam akuisisi gambar, sistem pengeenalan mem mperoleh gam mbar yang d ditangkap o oleh scannerr sebagai gaambar inputt (Pradeep eet al., 2011). Gambar h harus memiiliki format tertentu sepperti JPEG, BMP, dll. Gambar inii diperoleh m melalui scan nner, kamerra digital ataau perangkatt input digittal yang coccok lainnya ( (Pradeep et al., 2011). Scanner digunakan d untuk u mendaapatkan gam mbar abjad t tulisan tangaan. Menuliss beberapa karakter k pad da, kertas puutih tebal deengan pena t tanda tangann hitam dann membuat hhitam danpuutih menunjuukkan gradiien kontras m mencolok. Salahh satu tujuaan utama dari d akuisisi gambar daalam pengollahan citra a adalah mem miliki sumberr masukan yang y sama sehingga s meemiliki standdar gambar y yang
saama.
Huuruf
‘R’’
yang
diperoleeh
( (http://www w.ee.surrey.acc.uk/CVSSP P/demos/charrs74k/)
dari
d diperlihatkan n
G Gambar 2.1..
Gambar 2.1Su umber Data dari The Char74K C (Campos, 2012)
tautan dalam
10
2.2.2 Transformasi Warna Citra Proses transformasi warna yang digunakan adalah citra keabuan (grayscale)yang merupakan proses pengolahan citra dengan cara mengubah nilainilai piksel awal citra menjadi sebuah citra keabuan. Transformasi ini bertujuan untuk meningkatkan kontras pada citra, sehingga informasi-informasi pada citra tersebut dapat lebih terlihat (Shih, 2010). Citra keabuanmerupakan citra yang hanyamenggunakan warna yang merupakan tingkatan warnaabu-abu. Tingkat keabuan disini merupakan warna abu-abu dengan berbagai tingkatan dari hitam hingga mendekati putih.Warna abuabu adalah satu-satunya warnapada ruang RGB dengan komponen merah, hijau, danbiru mempunyai intensitas yang sama (Abiyanto, Imam, dan Ajub, 2007). Citra ini pada setiap pikselnya mengandung satu layer dimana nilai intensitasnya berada pada interval 0–255, sehingga nilai-nilai piksel pada citra keabuan tersebut dapat direpresentasikan dalam sebuah matriks yang dapat memudahkan proses perhitungan pada operasi berikutnya. Secara matematis, perhitungan citra keabuan dapat dirumuskan dengan Persamaan 2.1
3
,
(2.1)
denganSmenyatakan derajat keabuan,R menyatakan nilai intensitas warna merah (red),G menyatakan nilai intensitas warna hijau (green),dan B menyatakan nilai intensitas warna biru (blue).
11
2.2.3 Thresholding Thresholding adalah proses untuk menghasilkan citra binari (bilevel) dari citra keabuan. Citra bilevel adalah citra yang memiliki tingkat abu-abu dalam dua kelasyaitu hitam dan putih, nilai 0 untuk hitam dan 1 untuk putih. Pengelompokan citra oleh piksel bilevel dapat memperkecil dan memudahkan beberapa pengoperasian
proses
pengklasifikasian.
Pada
gambar
seperti
implementasi
membentuk
sederhana,
pengenalan
keluaran
dari
dan
operasi
thresholding adalah citra binari. Secara keseluruhan nilai bilevelmenunjukan hasil yang dapat diklasifikasikan menjadi hitam dan putih. Pada waktu menampilkan gambar, 0 adalah putih dan 1 adalah hitam. Pada citra binari, latar belakang berwarna putih sedangkan objek berwarna hitam (Heriyanto, 2005). Operasi nilai ambang yang akan dicari dinyatakan dengan nilai . Nilai berkisar antara 1 sampai , di mana bernilai 255. Untuk menghitung probabilitas dibedakan
kedalam
probabilitas
foregroundsetiap piksel pada level ke
foreground
dan
background.Bobot
dapat dinyatakan pada persamaan (2.2)
berikut, (2.2)
Dengan
menyatakan bobot foregroundsetiap piksel pada level ke ,
menyatakan nilai piksel pada level ke pada foreground, dan jumlah piksel pada citra.
menyatakan total
12
Bobotbackgroundsetiap piksel pada level ke
dapat dinyatakan pada
Persamaan (2.3) berikut, (2.3)
Dengan
menyatakanbobotbackgroundsetiap piksel pada level ke
menyatakan nilai piksel pada level ke pada background, dan
,
menyatakan total
jumlah piksel pada citra. Total nilai rata-rata untuk foregrounddinyatakan pada persamaan (2.4) berikut, (2.4)
dengan
menyatakan total nilai rata-rataforeground,
level ke
pada foreground,
ke , dan
menyatakan jumlah pikselforeground.
menyatakan piksel pada
menyatakan nilai piksel setiap piksel pada level
Untuk total nilai rata-rata untuk background dinyatakan pada persamaan (2.5) berikut, (2.5)
dengan
menyatakan total nilai rata-ratabackground,
level ke
pada background,
ke , dan
menyatakan jumlah pikselbackground.
menyatakan piksel pada
menyatakannilai piksel setiap piksel pada level
Kemudian hitung nilai variance untuk foreground dan background. Perhitungan nilai variance dinyatakan pada persamaan (2.6) dan (2.7),
13
(2.6)
(2.7)
Denganσ menyatakan nilai varianceforeground, ke
menyatakan piksel pada level
menyatakan total nilai rata-rataforeground,
pada foreground,
menyatakan nilai piksel setiap piksel pada level ke di foreground. Sedangkan σ menyatakan nilai variancebackground,
menyatakan piksel pada level ke
menyatakan total nilai rata-ratabackground,
pada background,
menyatakan
nilai piksel setiap piksel pada level ke di background. Selanjutnya, nilai ambang
dapat ditentukan dengan memaksimumkan
persamaan (2.8) berikut, (2.8)
Dengan
merupakan
palingmaksimum
nilai
yang
ambang
akan
yang
diambil
ambang,σ menyatakan variancebackground,
akan dan
ditentukan,
digunakan
nilai
yang
sebagai
nilai
varianceforeground, bobot foreground,dan
menyatakan
bobotbackground. Pada Gambar
2.2 merupakan contoh hasil proses thresholding.
Gambar2.2 HasilProsesThresholding
14
2.2.4 Penipisan Guratan Proses penipisan guratan(thinning) adalah proses awal untuk berbagai operasi analisis citra. Proses penipisan guratanmelibatkan perpindahan titik atau pola lapisan sampai semua garis memiliki piksel tunggal.Hasil dari garis piksel tunggal disebut kerangka obyek (skeleton). Sebuah cara yang umum untuk mengekstrakcitra menjadi kerangka yaitu memindahkan atau menghapus semua piksel kecuali piksel tepi menjadi kerangka. Hasil dari proses penipisan ini disebut sebagai kerangka, yang dapat mewakili bentuk objek. Pada proses ini, citra masukan akan dilakukan proses pra-pengolahan yaitu proses penipisan guratandari citra binari. Proses penipisan guratanmenggunakan metode zhang suensupaya objek dari citra biner tersebut yang semula pikselnya tebal menjadi 1 piksel. Selanjutnya, hasil dari proses penipisan ini terbagi menjadi 2 nilai. Jika piksel citra yang berwarna hitam maka akan diberi nilai 1 dan yang berwarna putih diberi nilai 0(Rosettacode, 2016).Berikut langkah-langkah detil proses penipisan guratan: 1.
Langkah pertama adalah menandai contourpointp untuk dihapus jika semua kondisi terpenuhi: a) 2
6 1
b) c)
·
·
0
d)
·
·
0
adalah jumlah tetangga dari
Dimana 2
3
4
9
1
yang tidak 0 yaitu
15
2.
Langkah kedua, kondisi (a) dan (b) sama dengan langkah pertama, sedangkan kondisi (c) dan (d) diubah menjadi: (c’)
·
·
0
(d’)
·
·
0
Berikut ilustrasi untuk thinning zhang-suen:
+
Gambar 2.3 Ilustrasi Thinning Zhang Suen
Langkah pertama dilakukan terhadap semua border piksel di citra.Jika salah satu dari keempat kondisi di atas tidak dipenuhi atau dilanggar maka nilai piksel yang bersangkutan tidak diubah.Sebaliknya jika semua kondisi tersebut dipenuhi maka piksel tersebut ditandai untuk penghapusan.Piksel yang telah ditandai tidak akan dihapus sebelum semuaborder points selesai diproses. Hal ini berguna untuk mencegah perubahan struktur data. Setelah langkah 1 selesai dilakukan untuk semua border points maka dilakukan penghapusan untuk titik yang telah ditandai (diubah menjadi 0).
16
Langkah kedua pada data hasil dari langkah 1 menggunakancara yang sama dengan langkah 1 sehingga dalam satu kali iterasi urutan algoritmanya terdiri dari: 1.
Menjalankan langkah 1 untuk menandai border points yang akan dihapus.
2.
Menghapus titik-titik yang ditandai dengan menggantinya menjadi angka 0.
3.
Menjalankan langkah 2 pada sisa border points yang pada langkah 1 belum dihapus lalu yang sesuai dengan semua kondisi yang seharusnya dipenuhi pada langkah 2 kemudian ditandai untuk dihapus.
4.
Hapus titik-titik yang ditandai dengan menggantinya menjadi angka 0.
Prosedur ini dilakukan secara iteratif sampai tidak ada lagi titik yang dapat dihapus, pada saat algoritma ini selesai maka akan dihasilkan skeletondari citra awal.Contoh hasil proses penipisan guratan ditampilkan pada Gambar 2.3.
Gambar2.3Contoh HasilProsesPenipisan Guratan.
2.3 Ekstraksi Fitur Ekstraksi fitur adalah proses penggalian informasi atau ciri penting dari suatu gambar yang dapat dibedakan dari suatu objek atau kelompok objek sehingga dasar informasi ini objek dapatdiklasifikasikandengan ciri yang berbeda.
17
Ini adalah bagian penting dari setiap sistem pengenalan. Ekstraksi fitur memiliki dua tujuan: 1)Membuang aspek-aspek yang tidak relevan dari gambar dan mengambil data yang penting atau diperlukan dan 2) Transform data ke dalam sebuah representasi yang membawa informasi lebih eksplisit. Dengan demikian, ekstraksi fitur memungkinkan untuk mengambil ciri penting dalam sebuah gambar. Ciri penting tersebut dapat membedakan satu citra dengan citra lainnya, ciri juga dapat lebih memperjelas pola perbedaan yang akan sangat memudahkan pemisahan antara kelas dalam proses pengelompokan.
2.3.1 GeometricMomentInvariant Momentinvariant diperkenalkan oleh Hu pada tahun 1962 dalam pengenalan pola dan pengolahan citra(Hu, 1962).Hu menggunakan hasil teori invarian aljabar dan diturunkan tujuh invariant terkenal dengan rotasi benda 2D.Sejak diperkenalkannya momentinvariant, banyak tulisan dan penelitian yang bertujuan
untuk
meningkatkan,
memperluas
dan
melakukan
generalisasimomentinvariant.Momentinvarianttelah menjadi salah satu yang paling penting dan sering digunakan dalam bentuk deskriptor (Flusser, Suk, dan Zitová, 2009). GMImemiliki tujuh fitur yang tidak berubah nilai terjemahan, perubahan skala, mirroring dan rotasi (Huang dan Leng, 2010). Langkah-langkah perhitungan moment geometrik dijelaskan sebagai berikut: 1.
Membaca data citra masukan dari kiri ke kanan dan dari atas ke bawah.
18
2.
Menghitung nilai gambar,
dengan formula (2.9)
,
Dimana
menyatakan
moment
dua
dimensi, dan menyatakan
bilangan bulat 0,1,2, …, f(x,y) menyatakan nilai piksel dari citra,xpyqmenyatakan fungsi basis. 3.
Hitung saat intensitas moment( , ) dengan formula: (2.10)
dan
Dimana menyatakan rata–rata koordinat x,
menyatakan rata–rata
koordinat y. 4. Hitung moment sentral,
dengan formula: ·
Dimana
·
(2.11)
,
menyatakanmoment sentral,p dan qmenyatakanmoment
order,xmenyatakan
koordinat
citra
pada
sumbu
x,ymenyatakankoordinat citra padasumbu y, menyatakan rata–rata koordinat x,
menyatakan rata–rata koordinat y,
,
menyatakan
nilai intensitas citra antara 0 atau 1.
5. Normalisasi moment,
untuk digunakan dalam skala gambar dengan
formula: , ,
, 2,3, …
(2.12)
19
dengan
menyatakan
moment,
menyatakanmomentsentral,p
normalisasi
dan
qmenyatakanmoment
order. 6. Hitung geometric moment,
dengan formula di bawah ini, (2.13) (2.14)
4 3
(2.15) (2.16)
3
3 3
3
(2.17)
3
4
3
3 3
(2.18)
(2.19)
3
2.3.2 United MomentInvariant Pada tahun 2003, telah ditemukan metode baru ekstraksi ciri yang diperkenalkan oleh Yinan bernama UMI(Yinan, 2003). Metode UMI diyakini untuk mengatasi kelemahan metode momentinvariantsebelumnya, yang tidak dapat diterapkan dalam kondisi diskrit (Yinan, 2003). Metode UMI memiliki nilai rotasi, translasi, dan skala tetap invariant. Moment adalah jumlah skalar yang
20
digunakan untuk mengkarakteristik bentuk suatu objek dan untuk mengambil ciri yang signifikan. Invariant adalah sesuatu nilai yang tidak berubah dalam beberapa transformasi dan dapat membedakan objek yang dimiliki untuk kelas yang berbeda (Flusser, Suk, dan Zitová, 2009). Langkah-langkah perhitungan united moment dijelaskan sebagai berikut: 1. Membaca data citra masukan dari kiri ke kanan dan dari atas ke bawah. 2. Menghitung nilai reguler moment citra,
dengan Persamaan 2.9
3. Hitung saat intensitas moment( , ) dengan Persamaan 2.10 4. Hitung momentsentral, 5. Normalisasi moment,
dengan Persamaan 2.11 untuk digunakan dalam skala gambar dengan
Persamaan 2.12 6. Hitung unitedmoment,
sampai
dengan persamaan di bawah ini (2.20)
(2.21)
(2.22)
(2.23)
(2.24)
(2.25)
(2.26)
21
(2.27)
2.3.3 ZernikeMomentInvariant ZMI diperkenalkan oleh Teague. Bila ditinjau dari sisi penghitungan, ZMImemiliki proses penghitungan yang lebih komplek dibandingkan jenis moment yang lain seperti Geometric maupun Legendre. Namun, ZMI telah dibuktikan sebagai salah satu metode ekstraksi ciri yang baik karena kemampuan dalam mempresentasikan sebuah citra (Bin dan Jia-Xiong, 2002). ZMI termasuk pada descriptorregion-based shape yang diartikan bahwa ZMI adalah ekstraksi ciri yang efisien untuk pengenalan pola.Hal ini dikarenakan ZMI memiliki sifat ortogonalitas pada polinomial Zernike dalam hasil ekstraksi ciri yang dibentuk serta memiliki properti yang tidak bergantung pada rotasi citra. Untuk menghitung ZMI dari suatu citra, pusat citra akan dinyatakan sebagai pusat dan koordinat piksel dipetakan menjadi jarak dari unit lingkar. Piksel diluar unit lingkar tidak akan digunakan pada komputasi (Feghi et al.,2010). Pemilihan ZMI sebagai ekstraksi ciri memiliki alasan dikarenakan ZMI memiliki invariant yang baik danmenghasilkan sistem dengan autentikasi yang baik, ZMI juga diyakini lebih akurat, fleksibel, dan lebih mudah direkonstruksi dibanding Hu Moment (Sabhara et al., 2013). Langkah-langkah perhitungan ZMI dijelaskan sebagai berikut: 1.
Membaca data citra masukan dari kiri ke kanan dan dari atas ke bawah. dengan persamaan (2.9)
2.
Menghitung nilai reguler moment citra,
3.
Hitung saat intensitas moment( , ) dengan persamaan (2.10)
22
4.
Hitung moment sentral,
5.
Normalisasi moment,
dengan persamaan (2.11) untuk digunakan dalam skala gambar dengan
persamaan (2.12) 6.
sampai
Hitung zernike moment,
dengan persamaan di
bawah ini:
1 ,
2
4
(2.28) (2.29)
,
3 3
3
(2.30)
,
(2.31)
,
(2.32) 3 3
3 3
, 4
.
(2.33)
2.4 Teknik Penggabungan Fitur Teknik hybrid yang digunakan adalah penggabungan hasil ekstraksi fitur yang digunakan adalah dengan menggabungkan hasil fitur dari setiap ekstraksi fitur. GMI memliki hasil 7 ekstraksi fitur, UMI 8 ekstraksi fitur dan ZMI memiliki 6 ekstraksi fitur. Untuk penggabungan fitur GMI-UMI memiliki 15 fitur yang merupakan penggabungan dari 7 fitur GMI dan 8 fitur UMI, penggabungan GMIZMI memiliki 13 fitur yang terdiri dari 7 fitur GMI dan 6 fitur ZMI, penggabungan UMI-ZMI memiliki 14 fitur yang terdiri dari 8 fitur UMI dan 6
23
fitur ZMI, kemudian untuk penggabungan GMI-UMI-ZMI memiliki 21 nilai fitur yang terdiri 7 fitur GMI, 8 fitur UMI dan 6 fitur ZMI.
2.5 Support Vector Machine (SVM) SVM adalah sistem pembelajaran yang menggunakan ruang hipotesis berupa fungsi-fungsi linear dalam sebuah ruang fitur (feature space) berdimensi tinggi, dilatih dengan algoritma pembelajaran yang didasarkan pada teori optimasi dengan mengimplementasikan learning rate yang berasal dari teori pembelajaran statistik (Christianini dan Taylor,2000). Teori yang mendasari SVM ini telah berkembang sejak tahun 1960-an, tetapi baru pada tahun 1992 Vapnik, Boser, dan Guyon memperkenalkan SVM dan sejak saat itu SVM berkembang dengan pesat. Walaupun SVM tergolong metode yang relatif baru dibandingkan metode lainnya, namun performansinya lebih baik di berbagai bidang seperti bioinformatics, pengenalan tulisan tangan, klasifikasi teks, dan lain sebagainya (Christianini dan Taylor, 2000). Salah satu tujuan dari proses pembelajaran SVM tidak hanya untuk mendapatkan bidang pemisah terbaik dalam meminimalkan empirical risk, tetapi juga memiliki generalisasi yang baik. Generalisasi adalah kemampuan sebuah hipotesis untuk mengklasifikasikan data yang tidak terdapat dalam data pelatihan dengan benar. Structural Risk Minimization (SRM) digunakan untuk menjamin generalisasi tersebut. Tujuan dari SRM yaitu untuk menjamin batas atas dari generalisasi
pada
data
pengujian
dengan
(fleksibilitas) dari hipotesis hasil pembelajaran.
cara
mengontrol
“kapasitas”
24
Ide utama dari metode SVM adalah konsep dari hyperplane margin maksimal. Dengan ditemukannya hyperplane margin maksimal, maka vektor tersebut akan membagi data menjadi bentuk klasifikasi yang paling optimum. Contoh hyperplane yang mungkin muncul untuk klasifikasi data ditunjukkan oleh Gambar 2.4. Pada gambar tersebut terdapat beberapa alternatif bidang pemisah (garis putus-putus ditengah) yang dapat memisahkan semua data set sesuai dengan kelasnya. Class 1 berupa sekumpulan data set dengan simbol kotak, sedangkan class 2 berupa sekumpulan data set dengan simbol lingkaran.
Gambar 2.4RepresentasiHyperplane (Nugroho et al., 2003).
Proses SVM pada penelitian ini menggunakan tools yaitu WEKA dengan kernel yang digunakan telah dinyatakan pada Tabel 2.1.
Tabel 2.1 Persamaan Kernel SVM (Mathworks, 2016)
25
Tipe SVM
Kernel
RBF
1, 2
PolyKernel
1, 2
PuK
1 2 2σ
exp 1, 2 1
2
2
⁄
1⁄