PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
TRANSLITERASI NAMA JALAN BERAKSARA JAWA SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika
Oleh: Kasih Handoyo 135314064
PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
TRANSLITERATION OF JAVANESE STREET NAMES THESIS Submitted in Partial Fulfillment of The Requirements for The Degree of Sarjana Komputer In Informatics Engineering Study Program
By: Kasih Handoyo 135314064
INFORMATICS ENGINEERING STUDY PROGRAM DEPARTMENT OF INFORMATICS ENGINEERING FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2017 ii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
IIALAMAN PI,RSETUJUAN SKRIPSI
TRANSLITERASI NA}IA JALAN BERAKSARA JAWA
Oleh: Kasih Ifandoyo 135314064
Telah Disetujui Oleh:
Dosen Pembimbing
,,, Dr. Anastari, ilitu Widiarti, Nl.Kom.
tll
Tanggal: 15 Mei 2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
HALAMAN PENGESAHAN SKRIPSI
TRANSLITERASI NAMA JAII\N BERAKSARA JAWA Dipersiapkan dan Disusun OIeh: Kasih Handoyo
rtiL,'-'-.:r
Ketua
fti rur*ua, s.si.itu,rom.
S.T.,yft
Sekretaris
&qgHadhiatma, Uru
Penguji
Adi Nu-grdh5$Sf,FM'Eng.
L_-> E.'ftr,tf
F
-l 't'-
Anggota
Yogyakarta 15 Juni 2017 Fakultas Sains dan Teknologi
A#', S.Si., M.Mattr.Sc., Ph.D.
lv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PERNYATAAN KEASLIAN KARYA Saya menyatakan dengan sesmgguhnya bahwa tugas akhir yang saya tulis tidak
mengandung atau memuat hasil karya orang lain, kecuali yang telah disebutkan dalam daftar pustaka dan kutipan selayaknya karya ilmiah.
Yogyakarta, 15 Mei 2017 Penulis
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma:
Nama : Kasih Handoyo
NIM :135314064 Demi pengembangan ilmu pengetahuan, saya memberikan kepada perpustakaan Universitas Sanata Dharma karya ilmiah yang berjudul:
TRANSLITI,RASI NAMA JALAN BERAKSARA JAWA beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan
kepada perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalambentukmedia lain, mengelolanya dalam bentukpangkalandata, mendistribusikan secara terbatas dan mempublikasikan di internet atau media lain
untuk kepentingan akademis tanpa perlu meminta izin dari saya maupun memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai penulis.
Demikian pernyataan ini saya buat dengan sebenarnya.
Yoryakarta, 15 Mei 2017 Yang menyatakan
Vl
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ABSTRAK Bangsa Indonesia merupakan bangsa yang multikultural. Salah satu budaya yang sangat terkenal adalah karya tulis dari suku Jawa yang ditulis menggunakan aksara Jawa. Aksara Jawa inilah yang menjadi ciri khas dan tradisi orang Jawa dalam mengembangkan tradisi tulis-menulis mereka. Seiring dengan perkembangan zaman, aksara Jawa mulai dipertanyakan keberadaannya. Pada generasi saat ini hanya beberapa orang saja yang dapat memahami ataupun membaca aksara Jawa. Sejak berkembangnya teknologi pengenalan pola dan pemrosesan citra maka dapat dibuat suatu sistem yang secara otomatis akan mengenali dan menerjemahkan karakter dari suatu citra ke dalam tulisan dalam bahasa lain yang sering disebut dengan pengenalan aksara atau character recognition. Pada penelitian ini akan dibangun sebuah prototype sistem yang mampu mengenali dan membaca tulisan beraksara Jawa dengan objek nama-nama jalan yang ada di Yogyakarta dalam bentuk citra digital kemudian menerjemahkannya ke dalam tulisan latin. Tahap awal dalam penelitian ini adalah data acquisition. Citra nama jalan diambil menggunakan kamera smartphone sejumlah 130 gambar. Tahap selanjutnya adalah preprocessing. Preprocessing yang dikerjakan adalah cropping, grayscaling, binarization, segmentation dan resizing. Metode yang dipakai dalam proses segmentation menggunakan projection profile. Data yang sudah siap untuk diolah kemudian masuk ke tahap feature extraction and selection. Ektraksi yang dipakai pada penelitian ini adalah ICZ-ZCZ (Image Centroid and Zone-Zone Centroid and Zone). Model klasifikasi yang dipakai dalam penelitian ini adalah template matching. Model ini bekerja dengan mengukur kedekatan atau kesamaan (similarity) antar objek. Data citra yang digunakan untuk pembuatan template sejumlah 100 data. Proses selanjutnya adalah postprocessing, yaitu proses untuk mengelompokkan suku kata agar membentuk kata atau kalimat yang memiliki arti. Hal tersebut perlu dilakukan karena karakter penulisan aksara Jawa adalah tanpa spasi. Tahapan terakhir adalah evaluation, yaitu menguji performa sistem yang direpresentasikan dengan nilai tingkat akurasi. Pengujian dilakukan dengan 2 macam test case, yang pertama data uji yang diambil dalam keadaan normal dan data uji yang bervariasi. Berdasarkan pengujian yang telah dilakukan, tingkat akurasi yang dihasilkan oleh sistem menggunakan pembagian 4 zona secara horizontal sebesar 93.33% untuk data normal dan 86.67% untuk data yang bervariasi sedangkan untuk pembagian 4 zona secara horizontal dan vertikal memiliki tingkat akurasi 76.67% untuk data normal dan 70% untuk data yang bervariasi. Kata kunci: character recognition, Image Centroid and Zone-Zone Centroid and Zone, template matching, postprocessing.
vii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ABSTRACT Indonesia is a multicultural nation. One of the most well-known on their culture is the Javanese scripts which is written in Javanese character. The Javanese Character become tradition and identity for Javanese people to envole their literacy. At this time the existance of Javanese character begun to be inquired. Only few of this generation today could understand and read the Javanese script. The envolving technology of pattern recognition and image processing can make a system that automated to recognize and translate a character from centain image to other languages which usually called by character recognition. In this research will build a system prototype which able to recognize and read the Javanese script on the street names of Yogyakarta in the digital image to Roman lettering. The first step in this research is data acquisition. The street names of Yogyakarta image is taken by smartphone camera as many as 130 images. The next step is preprocessing. The preprocessing method are cropping, grayscaling, binarization, segmentation and resizing. The method is used for segmentation is projection profile. Data which is already to be processed then continue to the next step, it is feature extraction and selection. Extraction method that will be used are ICZ-ZCZ (Image Centroid and Zone-Zone Centroid and Zone). In this research we used template matching for classification model. This model works by counting the similarity between the objects. The number of data to make a template is 100. The next step is postprocessing, that is process which groups the syllables to make meaning word or sentences. This is should be done because characteristic of Javanese character is written without spacing between their character. The final step is evaluation, that is to test the performance of the system which is represented by accuration value. The evaluation process is divided into 2 test case, the first one is dataset taken in normal condition and the second one is dataset in many kind of variances. Based on the testing, the accuracy that can be obtained in 4 horizontal zones is 93.33% for nomal dataset and 86.67% for variance dasatet then in 4 vertical-horizontal zones is 76.67% for normal dataset and 70% for variance dataset. Keywords: character recognition, Image Centroid and Zone-Zone Centroid and Zone, template matching, postprocessing.
viii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
KATA PENGANTAR
Puji dan syukur saya panjatkan kehadirat Tuhan Yesus Kristus oleh karena berkat dan kasih-Nya sehingga tugas akhir saya yang berjudul “Transliterasi Nama Jalan Beraksara Jawa” dapat diselesaikan dengan baik dan tepat waktu. Tugas akhir ini merupakan salah satu persyaratan yang wajib ditempuh pada Program Studi Teknik Informatika Universitas Sanata Dharma untuk memperoleh gelar Sarjana Komputer. Selama persiapan proposal dan penyusunan tugas akhir ini saya mendapat banyak dukungan dan bantuan dari berbagai pihak sehingga saya menyampaikan terima kasih kepada: 1.
Ibu Dr. Anastasia Rita Widiarti, M.Kom. selaku dosen pembimbing skripsi yang telah bersedia memberikan arahan, masukan, motivasi serta kekuatan dalam pekerjaan saya selama menyelesaikan skripsi.
2.
Keluarga saya tercinta yang selalu memberikan dukungan motivasi dan doa sehingga saya selalu bersemangat dalam mengerjakan dan menyelesaikan tugas akhir ini selama 1 semester.
3.
Bapak Albertus Agung Hadhiatma, S.T., M.T. selaku dosen pembimbing akademik yang memberikan saran serta penghiburan selama proses pengerjaan tugas akhir.
4.
Bapak Sudi Mungkasi, S.Si., M.Math.Sc., Ph.D. selaku Dekan Fakultas Sains dan Teknologi.
5.
Saudara Rismanto dan saudari Sekar Mirah yang telah meluangkan waktu, tenaga dan pikiran untuk membantu saya dalam mengambil gambar namanama jalan yang berada di Kota Yogyakarta.
6.
Seluruh dosen Teknik Informatika Universitas Sanata Dharma yang telah mendidik, memberikan ilmu pengetahuan dan pengalaman yang berharga untuk bekal dalam mengerjakan tugas akhir saya ini.
7.
Bapak Susilo Dwiratno selaku kepala Laboratorium Komputer Dasar yang telah memberikan doa dan semangat selama saya mengerjakan tugas akhir.
ix
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8.
Teman-teman satu bimbingan skripsi dan selunrh keluarga Teknik Informatika angkatan 2013 yang selalu memberikan bantuan, seffimgat dan penghiburan dalam menyelesaikan tugas akhir.
Penulis menyadari bahwa masih banyak kekurangan dari tugas akhir ini sehingga penulis mengharapkan
laitik dan
saran yang bersifat membangun untuk
menyempurnakannya. Semoga hrlisan tugas
akhir ini dapat bermanfaat bagi
siapapun yang me,nrbacanya dan saya lfiususnya sebagai penulis.
Yogyakarta, 15 Mei 2017 Penulis
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR ISI
HALAMAN JUDUL................................................................................................ i TITLE PAGE .......................................................................................................... ii HALAMAN PERSETUJUAN ............................................................................... iii HALAMAN PENGESAHAN ................................................................................ iv PERNYATAAN KEASLIAN KARYA ................................................................. v LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS .............................................................. vi ABSTRAK ............................................................................................................ vii ABSTRACT ......................................................................................................... viii KATA PENGANTAR ........................................................................................... ix DAFTAR ISI .......................................................................................................... xi DAFTAR GAMBAR ........................................................................................... xiii DAFTAR TABEL ................................................................................................ xiv BAB I PENDAHULUAN ....................................................................................... 1 1.1 Latar Belakang Masalah ........................................................................... 1 1.2 Rumusan Masalah ..................................................................................... 4 1.3 Tujuan ....................................................................................................... 4 1.4 Batasan Masalah ....................................................................................... 4 1.5 Manfaat ..................................................................................................... 5 1.6 Metodologi Penelitian ............................................................................... 5 1.7 Sistematika Penulisan ............................................................................... 6 BAB II LANDASAN TEORI ................................................................................. 8 2.1 Aksara Jawa .............................................................................................. 8 2.2 Pemrosesan Citra Digital ........................................................................ 13 2.2.1 Citra Berwarna ............................................................................ 13 2.2.2 Citra Berskala Keabuan............................................................... 14 2.2.3 Citra Biner ................................................................................... 14 2.3 Pengenalan Pola ...................................................................................... 15 2.4 Data Acquisition ..................................................................................... 17 2.5 Preprocessing .......................................................................................... 17 2.5.1 Cropping...................................................................................... 17 2.5.2 Grayscaling ................................................................................. 18 2.5.3 Binarization ................................................................................. 18 2.5.4 Image Segmentation .................................................................... 19 2.5.5 Resizing ....................................................................................... 22 2.6 ICZ-ZCZ ................................................................................................. 22 2.7 Template Matching ................................................................................. 27 2.8 Postprocessing......................................................................................... 29 2.9 Evaluation ............................................................................................... 30 BAB III METODE PENELITIAN........................................................................ 32 3.1 Bahan Riset/Data .................................................................................... 32 3.2 Peralatan Penelitian................................................................................. 32 3.3 Metode Pengumpulan Data ..................................................................... 32
xi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3.3.1 Observasi ..................................................................................... 32 3.3.2 Studi Literatur ............................................................................. 33 3.4 Tahap Penelitian...................................................................................... 33 3.4.1 Identifikasi Masalah .................................................................... 33 3.4.2 Studi pustaka ............................................................................... 33 3.4.3 Pengumpulan Data ...................................................................... 34 3.4.4 Pengolahan Data.......................................................................... 34 3.4.5 Perancangan Alat Uji .................................................................. 40 3.4.6 Implementasi ............................................................................... 40 3.5 Desain Alat Uji ....................................................................................... 43 3.6 Pengujian (Testing) ................................................................................. 44 3.7 Pengukuran Akurasi Sistem .................................................................... 44 BAB IV HASIL DAN ANALISA ........................................................................ 45 4.1 Data Acquisition ..................................................................................... 45 4.2 Preprocessing .......................................................................................... 46 4.2.1 Cropping...................................................................................... 46 4.2.2 Grayscaling ................................................................................. 47 4.2.3 Binarization ................................................................................. 47 4.2.4 Image Segmentation .................................................................... 48 4.2.5 Resizing ....................................................................................... 52 4.3 Feature Extraction and Selection ............................................................ 53 4.4 Pembuatan Template Database ............................................................... 57 4.5 Classification........................................................................................... 61 4.6 Postprocessing......................................................................................... 64 4.7 Evaluation ............................................................................................... 67 BAB V PENUTUP ................................................................................................ 87 5.1 KESIMPULAN ....................................................................................... 87 5.2 SARAN ................................................................................................... 88 DAFTAR PUSTAKA ........................................................................................... 90 LAMPIRAN .......................................................................................................... 92
xii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR GAMBAR
Gambar 2.1 Aksara Jawa Legena ............................................................................ 8 Gambar 2.2 Sandhangan Swara .............................................................................. 9 Gambar 2.3 Sandhangan Panyigeg Wanda ........................................................... 10 Gambar 2.4 Sandhangan Wyanjana ...................................................................... 10 Gambar 2.5 Sandhangan Pangkon ........................................................................ 11 Gambar 2.6 Aksara Pasangan ............................................................................... 11 Gambar 2.7 Penulisan Aksara Apel Batu .............................................................. 12 Gambar 2.8 Aksara Rekan .................................................................................... 12 Gambar 2.9 Warna RGB dalam Ruang Berdimensi Tiga ..................................... 14 Gambar 2.10 Citra Biner “Para” ........................................................................... 21 Gambar 2.11 Projection Profile dari Citra Aksara Pa dan Ra ............................... 22 Gambar 2.12 Pembagian Zona dan Perhitungan Jarak (ICZ) ............................... 25 Gambar 2.13 Pembagian Zona dan Perhitungan Jarak (ZCZ) .............................. 26 Gambar 2.14 Aksara Iredha .................................................................................. 29 Gambar 2.15 Aksara Modhang ............................................................................. 29 Gambar 2.16 Aksara Pajeksan .............................................................................. 30 Gambar 3.1 Blok Diagram .................................................................................... 35 Gambar 3.2 Preprocessing Modules ..................................................................... 36 Gambar 3.3 Pembagian 4 Zona Secara Horizontal ............................................... 38 Gambar 3.4 Pembagian 4 Zona Secara Vertikal-Horizontal ................................. 38 Gambar 3.5 Desain Interface Sistem ..................................................................... 43 Gambar 4.1 Citra Jalan Pajeksan .......................................................................... 45 Gambar 4.2 Pemotongan Citra Jalan Pajeksan ..................................................... 46 Gambar 4.3 Citra Abu-Abu Jalan Pajeksan .......................................................... 47 Gambar 4.4 Citra Biner Jalan Pajeksan................................................................. 48 Gambar 4.5 Projection Profile dari Citra Jalan Pajeksan ...................................... 50 Gambar 4.6 Citra Biner Jalan Langensari ............................................................. 51 Gambar 4.7 Projection Profile dari Citra Jalan Langensari .................................. 51 Gambar 4.8 Citra Jalan Pajeksan Hasil Resizing .................................................. 52 Gambar 4.9 Nilai Features dari Citra Jalan Pajeksan ............................................ 56 Gambar 4.10 Citra Jalan Menteri Supeno ............................................................. 57 Gambar 4.11 Hasil Cropping Citra Jalan Menteri Supeno ................................... 58 Gambar 4.12 Citra Abu-Abu Aksara Su ............................................................... 58 Gambar 4.13 Citra Biner Aksara Su ..................................................................... 59 Gambar 4.14 Pembuatan Kombinasi Aksara untuk Template Database .............. 61 Gambar 4.15 Feature Database dari Template beserta Label ............................... 61 Gambar 4.16 Nilai Feature pada Template Pertama ............................................. 62 Gambar 4.17 Nilai Jarak Feature Objek Pertama.................................................. 63 Gambar 4.18 Hasil Klasifikasi Citra Jalan Pajeksan ............................................. 64 Gambar 4.19 Hasil Postprocessing ....................................................................... 67 Gambar 4.20 Kemiripan Aksara Pa dan Wa serta Aksara Ti dan Ri .................... 73
xiii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR TABEL
Tabel 4.1 Tabel Hasil Pengujian Menguunakan 4 Zona Secara Horizontal ......... 67 Tabel 4.2 Tabel Kesalahan Transliterasi Tiap Aksara .......................................... 71 Tabel 4.3 Tabel Nilai Jarak Citra Uji dengan Template ....................................... 72 Tabel 4.4 Tabel Hasil Pengujian Menggunakan 4 Zona Secara Vertikal dan Horizontal.............................................................................................................. 73 Tabel 4.5 Tabel Kesalahan Transliterasi Tiap Aksara Menggunakan 4 Zona Secara Vertikal dan Horizontal ......................................................................................... 76 Tabel 4.6 Tabel Hasil Pengujian Menggunakan 4 Zona Secara Horizontal ......... 79 Tabel 4.7 Tabel Hasil Pengujian Menggunakan 4 Zona Secara Vertikal dan Horizontal.............................................................................................................. 82 Tabel 4.8 Tabel Nilai Akurasi Hasil Pengujian .................................................... 85 Tabel 4.9 Citra yang Diambil Dalam Keadaan Tidak Normal.............................. 85
xiv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB I PENDAHULUAN
1.1
Latar Belakang Masalah Bangsa Indonesia merupakan bangsa yang majemuk. Memiliki wilayah yang terbentang dari Sabang sampai Merauke serta terdiri dari banyak suku, ras, agama, bahasa dan budaya menjadikan bangsa Indonesia sebagai bangsa yang multikultural. Hal inilah yang menyebabkan bangsa Indonesia memiliki kekayaan budaya dan memiliki kekhasan untuk setiap daerahnya. Salah satu budaya yang sangat terkenal adalah karya tulis dari suku Jawa yang ditulis menggunakan aksara Jawa. Aksara Jawa inilah yang menjadi ciri khas dan tradisi orang Jawa dalam mengembangkan tradisi tulis-menulis mereka. Saat ini suku Jawa yang paling banyak berada di Yogyakarta sehingga sampai saat ini kita bisa merasakan nuansa budaya Jawa yang ada di Yogyakarta. Kota Yogyakarta sangat terkenal dengan kota dengan nuansa budaya Jawa yang kental. Keraton Yogyakarta merupakan simbol yang sangat kuat yang mencerminkan masih lestarinya budaya Jawa di Yogyakarta. Gelar sebagai daerah istimewa pun disematkan pada kota ini karena bentuk pemerintahan, penduduknya dan kekayaan budaya Jawa yang masih dihidupi sampai sekarang. Salah satu keistimewaan yang ada di Yogyakarta ini adalah nama-nama jalan yang ada di Yogyakarta. Tidak banyak yang menyadari bahwa nama-nama jalan yang disematkan di setiap sudut jalan tidak sekedar nama saja melainkan nama yang memiliki unsur keaslian budaya dan sejarah yang ada di Yogyakarta. Hal ini yang mempertegas dan mendukung sebutan sebagai kota budaya dan daerah istimewa. Nama-nama jalan yang ada di Yogyakarta dibingkai dengan papan yang berwarna hijau dengan sedikit ornamen khas di sekelilingnya. Uniknya lagi, nama jalan tersebut ditulis dengan huruf latin berbahasa Indonesia pada bagian atas dan ditulis dengan aksara Jawa dibagian bawah.
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 2
Seiring dengan perkembangan zaman, aksara Jawa mulai dipertanyakan keberadaannya. Pada generasi saat ini hanya beberapa orang saja yang dapat memahami ataupun membaca aksara Jawa. Bahkan orang Jawa sekalipun, khususnya yang ada di Yogyakarta belum tentu bisa memahami ataupun membaca Aksara Jawa padahal aksara Jawa merupakan warisan budaya Indonesia yang patut kita jaga dan lestarikan. Hal ini yang menjadi keprihatinan penulis karena akan membuat budaya tulis dengan aksara Jawa menjadi luntur dan menghilang ditengah-tengah masyarakat Jawa sendiri. Sejak berkembanganya teknologi pengenalan pola dan pemrosesan citra maka dapat dibuat suatu sistem yang secara otomatis akan mengenali dan menerjemahkan karakter dari suatu citra kedalam tulisan dalam bahasa lain yang sering disebut dengan pengenalan aksara atau character recognition (Mahto et al., 2015). Definisi pengenalan pola adalah suatu disiplin ilmu sains yang mempunyai tujuan pada pengklasifikasian objek kedalam beberapa kelas atau kategori. Pengenalan pola merupakan bagian integral dalam sistem mesin cerdas (machine intelligence) yang dibuat untuk membuat sebuah keputusan (Theodoridis dan Koutroumbas, 2009). Sedangkan menurut Gonzales dan Woods (2008) pemrosesan citra meliputi suatu proses yang memiliki input dan output berupa image (citra) dan sebagai tambahan meliputi juga proses yang mengekstraksi atribut dari citra hingga sampai pada pengenalan masing-masing objek. Pengenalan aksara atau character recognition termasuk dalam bidang ilmu pengenalan pola yang melibatkan pemrosesan citra didalamnya. Pada penelitian ini akan dibangun sebuah prototype sistem yang mampu mengenali dan membaca tulisan beraksara Jawa dengan objek nama-nama jalan yang ada di Yogyakarta dalam bentuk citra digital kemudian menerjemahkannya ke dalam tulisan latin. Pada penelitian yang sudah dilakukan sebelumnya oleh Widiarti et al. (2014) tentang segmentasi citra manuskrip beraksara Jawa, salah satu tahapan preprocessing yang dilakukan adalah projection profile. Projection profile ini diperlukan untuk menemukan karakter garis dari aksara Jawa kemudian dapat kita peroleh tiap aksara dari
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 3
kumpulan aksara yang ada. Tingkat akurasi yang dihasilkan adalah sebesar 85.9% hingga 94.82%. Setelah melalui tahap preprocessing maka citra nama jalan siap untuk diekstrak cirinya. Ekstraksi ciri diperlukan untuk memperoleh informasi penting dari objek dengan mereduksi dimensi data. Penelitian tentang ekstraksi ciri pengenalan tulisan tangan angka dari 4 script yang terkenal dari India Selatan berbasis zona, yaitu menggunakan metode ICZ (Image Centroid and Zone) dan ZCZ (Zone Centroid and Zone) telah dikerjakan oleh Rajashekararadhya dan Ranjan (2005) untuk pengenalan pola angka tulisan tangan dengan aksara Kannada, Telugu, Tamil dan Malayalam. Dari penelitian tersebut disimpulkan bahwa ekstraksi ciri berbasis zona (zone based) menghasilkan pengenalan yang baik meskipun beberapa tahap preprocessing tidak dikerjakan seperti filtering, smoothing. Tingkat akurasi yang dihasilkan sebesar 99% untuk aksara Kannada dan Telugu serta masingmasing didapat 98% untuk aksara Tamil dan 95% untuk aksara Malayalam. Sampai saat ini terdapat 4 model pengenalan pola yang umum digunakan, yaitu template matching, statistical classification, syntactic or structural matching, dan neural network (Jain et al., 2000). Dari keempat pendekatan atau model pengenalan pola yang ada, template matching merupakan pendekatan yang paling mudah untuk pengenalan pola. Prinsipnya adalah membuat sebuah template atau prototype dari pola yang akan dikenali kemudian mengukur kedekatan atau kesamaan (similarity) antara pola yang akan dikenali dengan pola dari template yang disimpan. Dengan menggunakan pendekatan template matching ini maka dengan input berupa citra nama jalan beraksara Jawa dapat dikenali atau diterjemahkan dengan membandingkan template citra aksara yang ada. Dengan karakteristik penulisan aksara Jawa yang bersifat kesukukataan dan ditulis tanpa spasi maka diperlukan proses pengelompokkan suku kata tersebut agar membentuk kata atau kalimat yang memiliki arti. Penelitian yang dilakukan oleh Widiarti dan Winarko (2012) dalam membangun sebuah algoritma untuk pengelompokkan suku kata dalam manuskrip beraksara Jawa menghasilkan tingkat akurasi 62.96% dan 75% untuk dua halaman buku Hamong Tani.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 4
Berdasarkan dari penelitian yang sudah ada dan tingkat akurasi yang diperoleh oleh penelitian sebelumnya maka penulis ingin menerapkan metode projection profile untuk tahap preprocessing dan ekstraksi ciri menggunakan ICZ-ZCZ (image centroid and zone-zone centroid and zone) pada penelitian yang dilakukan namun menggunakan objek yang berbeda, yaitu citra namanama jalan beraksara Jawa di Kota Yogyakarta. Penelitian ini akan mengenali dan menerjemahkan citra aksara Jawa berupa tulisan nama-nama jalan yang ada di Yogyakarta menggunakan pendekatan template matching. Melalui pengenalan pola ini citra hasil segmentasi akan diekstrak cirinya menggunakan metode ICZ-ZCZ kemudian dengan template database aksara yang dibuat akan dihitung kemiripan antar kedua objek sehingga citra nama jalan yang dimasukkan akan dibandingkan dan menghasilkan suatu informasi yaitu terjemahan dari aksara Jawa. Dengan adanya penelitian ini diharapkan orang akan terbantu dalam mengenal aksara Jawa, disamping itu juga dapat mengenal tempat-tempat yang ada di Yogyakarta dan ikut serta dalam melestarikan budaya Indonesia, khususnya budaya Jawa.
1.2
Rumusan Masalah Berapakah persentase keberhasilan yang diperoleh dalam proses pengenalan nama jalan beraksara Jawa?
1.3
Tujuan Mengetahui performa sistem yang ditunjukkan dengan persentase nilai kebenaran atau akurasi sistem yang mampu dihasilkan untuk mengkonversi citra aksara Jawa menjadi tulisan latin.
1.4
Batasan Masalah Batasan masalah yang ada dalam penelitian ini adalah sebagai berikut: 1.
Pengenalan pola ini menggunakan input berupa sebuah citra aksara Jawa yang diambil menggunakan kamera smartphone dengan jarak
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 5
pengambilan gambar sekitar 50 cm dari tiang serta waktu pengambilan gambar di pagi atau siang hari. 2.
Objek diambil satu arah saja dengan posisi tegak lurus terhadap kamera.
3.
Objek yang diamati merupakan pengenalan nama-nama jalan beraksara Jawa yang ada di Yogyakarta.
4.
Output yang dihasilkan berupa terjemahan dalam huruf latin.
5.
Jumlah data uji yang digunakan sekitar 30 citra nama-nama jalan beraksara Jawa di Yogyakarta.
6.
Aksara Jawa yang akan dikenali berupa aksara pokok (nglegena), aksara pengubah bunyi (sandhangan) dan aksara penutup konsonan (pasangan) serta aksara rekan.
1.5
Manfaat Manfaat yang dapat diperoleh melalui penelitian ini adalah sebagai berikut: 1.
Membantu menerjemahkan citra tulisan nama jalan beraksara Jawa di Yogyakarta secara otomatis melalui prototype sistem yang dibuat.
2.
Ikut serta dalam melestarikan budaya Jawa khususnya tradisi tulismenulis menggunakan aksara Jawa.
1.6
Metodologi Penelitian 1.
Studi Literatur Pada tahap ini semua hal-hal yang mendukung penelitian dipelajari melalui buku-buku referensi ataupun jurnal yang berkaitan dengan pengenalan aksara (character recognition).
2.
Pengumpulan Data Pada tahap ini data tentang citra nama jalan beraksara Jawa di Yogyakarta dikumpulkan untuk digunakan sebagai bahan dalam penelitian. Data dikumpulkan dengan melakukan pengamatan langsung di daerah Kota Yogyakarta kemudian nama-nama jalan yang ditulis menggunakan aksara Jawa diambil gambarnya menggunakan kamera smartphone.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 6
3.
Perancangan Sistem Pada tahap ini akan dibangun sebuah sistem yang dipakai sebagai alat uji untuk mengetahui tingkat akurasi dari algoritma yang digunakan.
4.
Pembuatan Sistem Pada tahap ini sistem mulai dibangun berdasarkan rancangan yang telah dibuat.
5.
Pengujian Sistem diuji performanya dengan menghitung tingkat akurasi yang dihasilkan dalam pengenalan nama-nama jalan beraksara Jawa.
6.
Pembuatan Laporan Pada tahap ini dilakukan penyusunan laporan penelitian berdasarkan tahapan dan proses yang telah dikerjakan dan didukung oleh teori-teori yang dipakai.
1.7
Sistematika Penulisan Pada proposal ini terbagai dalam 5 bab utama, yaitu: 1.
Bab I Pendahuluan Bagian ini berisi mengenai latar belakang tugas akhir, rumusan masalah, tujuan, batasan masalah, metodologi penelitian dan sistematika penulisan.
2.
Bab II Landasan Teori Bagian ini berisi tentang teori yang berkaitan dengan topik tugas akhir.
3.
Bab III Metode Penelitian Bagian ini menguraikan mengenai rencana langkah-langkah yang akan dilakukan dalam penelitian. Langkah-langkah yang dikerjakan meliputi bagaimana cara mendapatkan data, cara mengolah data, cara membuat alat uji jika diperlukan, cara analisis data, cara pengujian, serta dibagian akhir diberikan desain alat uji serta user interface dari alat uji yang akan dibangun.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 7
4.
Bab IV Hasil dan Analisa Bagian ini menjelaskan tentang implementasi dari konsep yang sudah dibuat dan memaparkan hasil analisis terhadap langkah-langkah yang sudah dikerjakan. Semua langkah percobaan dipaparkan secara rinci dan disertai dengan capture dari output proses atau tahapan yang dilakukan.
5.
Bab V Penutup Bagian ini berisi kesimpulan dari percobaan yang telah dikerjakan. Selain itu juga berisi saran untuk kemajuan dan pengembangan penelitian berikutnya yang mengulas tentang proses transliterasi dari aksara Jawa ke aksara latin.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB II LANDASAN TEORI
2.1
Aksara Jawa Sebelum dikenalnya carakan atau yang sekarang disebut dengan hanacaraka, pada zaman dahulu orang telah menggunakan aksara yang lebih tua beredarnya yang dikenal dengan aksara Jawa Kuno atau Kawi (Rochkyatmo, 1996). Aksara Jawa atau yang lebih kita kenal dengan hanacaraka diperkirakan dibuat dan berkembang mulai abad 16 pada era setelah Brawijaya V, sekitar zaman kerajaan Demak. Manuskrip menggunakan aksara Jawa baru muncul pada awal abad 17. Aksara Jawa merupakan turunan dari aksara Brahmi dan Pallawa yang ketika itu banyak digunakan untuk menuliskan bahasa Sansekerta. Pada dasarnya aksara Jawa terdiri dari 20 aksara pokok (nglegena) yang bersifat kesukukataan (sylabic). Sifat penulisan aksara Jawa yang lain seperti ditulis dari kiri ke kanan (abugida) dan ditulis secara bersambung tanpa spasi antar kata (scriptio continua). Selain aksara pokok (nglegena), aksara Jawa memiliki kelompok aksara kapital (murda), aksara vokal (swara), aksara rekaan (rekan), pengubah bunyi (sandhangan), penutup konsonan (pasangan), penutup suku kata (sigeg), angka (wilangan) dan tanda baca. Menurut Hadiprijono (2013) aksara Jawa yang terdiri dari 20 aksara, yaitu dari aksara ha sampai nga adalah sebagai berikut:
Gambar 2.1 Aksara Jawa Legena
8
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 9
Gambar 2.1 merupakan aksara dasar atau pokok yang berjumlah sebanyak 20 aksara. Aksara pokok atau sering disebut legena memiliki arti aksara wuda (telanjang) sebab belum diikuti dengan sandhangan. Selain aksara pokok, aksara Jawa juga terdiri dari 12 aksara sandhangan. Aksara sandhangan adalah aksara yang dipakai untuk mengubah bunyi dari aksara yang diikutinya. Secara khusus, aksara sandhangan tersebut dibagi ke dalam 4 jenis, yaitu 5 sandhangan swara, 3 sandhangan penyigeg wanda, 3 sandhangan wyanjana dan sandhangan pangkon. Untuk sandhangan swara terdiri dari 5 aksara, yaitu sebagai berikut:
Gambar 2.2 Sandhangan Swara Gambar 2.2 merupakan kumpulan dari sandhangan swara, yaitu terdiri dari wulu, suku, taling, taling-tarung dan pepet. Masing-masing sandhangan mempunyai karakteristik tersendiri dalam mengubah bunyi suatu aksara yang diikutinya, yaitu wulu akan membuat suku kata menjadi bunyi vokal /i/, suku akan membuat suku kata menjadi bunyi vokal /u/, taling akan membuat suku kata menjadi bunyi vokal /é/, taling-tarung akan membuat suku kata menjadi bunyi vokal /o/ dan terakhir pepet akan membuat suku kata menjadi bunyi vokal /ê/. Contoh pada Gambar 2.2 untuk membentuk kata “siji” berarti harus menambahkan wulu pada aksara sa dan ja untuk mengubah bunyinya menjadi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 10
si dan ji. Selanjutnya, sandhangan paniyegeg wanda terdiri 3 aksara sebagai berikut:
Gambar 2.3 Sandhangan Panyigeg Wanda Gambar 2.3 adalah sandhangan panyigeg wanda yang terdiri dari layar, wigyan dan cecak. Sigeg artinya pembuat konsonan atau penutup suku kata sedangkan wanda artinya suku kata. Fungsi sandhangan layar akan memberikan bunyi /r/, wignyan akan memberi bunyi /h/ dan cecak akan memberikan bunyi /ng/ pada suku kata yang diikutinya. Contoh pada Gambar 2.3 untuk membentuk kata “gajah” maka dapat ditulis dengan aksara ga dan ja kemudian diberi sandhangan wignyan yang akan memberi konsonan atau akhiran h. Jenis sandhangan berikutnya adalah sandhangan wyanjana yang terdiri dari 3 aksara seperti gambar di bawah ini.
Gambar 2.4 Sandhangan Wyanjana Gambar 2.4 adalah contoh dari sandhangan wyanjana yang terdiri dari cakra, keret dan pengkal. Sandhangan wyanjana merupakan penanda dari gugus konsonan, yakni cakra akan memberikan sisipan kata /ra/, keret akan memberikan sisipan kata /re/ dan pengkal akan memberikan sisipan kata /ya/
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 11
pada masing-masing aksara yang diikutinya. Sebagai contoh pada Gambar 2.4 untuk membentuk kata “putra” maka dapat ditulis dengan aksara pa yang diberi suku lalu aksara ta yang diberi cakra. Terakhir, sandhangan pangkon adalah sebagai berikut:
Gambar 2.5 Sandhangan Pangkon Gambar 2.5 adalah sandhangan pangkon. Fungsi pangkon adalah sebagai penutup suku kata atau membentuk konsonan pada suku kata yang berada di depannya. Sebagai contoh, ketika ingin membentuk kata “tangan” maka dapat ditulis dengan aksara ta, nga dan na yang diberi pangkon sehingga menjadi konsonan n. Selain aksara pokok, dalam penulisan aksara Jawa juga terdapat aksara pasangan. Jumlah dan bunyi aksara pasangan sama seperti aksara legena, yaitu berjumlah 20 dan terdiri dari ha sampai nga. Berikut ini adalah contoh dari aksara pasangan.
Gambar 2.6 Aksara Pasangan Gambar 2.6 adalah contoh dari aksara pasangan. Hanya terdapat 3 aksara saja yang ditulis sejajar dengan aksara legena, yaitu pasangan ha, pasangan sa dan pasangan pa, selain itu penulisan pasangan ditulis di bawah aksara pokok. Fungsi dari aksara pasangan adalah pembentuk konsonan atau penutup suku kata sehingga suku kata yang diberi pasangan dapat digabungkan dengan aksara selanjutnya. Sebagai contoh, lihat gambar di bawah ini.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 12
Gambar 2.7 Penulisan Aksara Apel Batu Gambar 2.7 merupakan sebuah contoh penulisan aksara Jawa menggunakan pasangan. Jika dibaca maka bunyi dari aksara tersebut adalah “apel batu.” Secara sederhana, terdapat 5 buah suku kata, 4 suku kata tersusun dari aksara legena dan sisanya merupakan aksara pasangan. Untuk membentuk kata “apel” maka diperlukan aksara ha, pa yang diberi sandhangan pepet dan la. Penggunaan pangkon harus diletakkan di akhir suku kata sehingga untuk membentuk konsonan /l/ maka pada aksara la diberi pasangan untuk menyambung ke suku kata berikutnya, yaitu ba. Selanjutnya untuk membentuk suku kata tu menggunakan aksara ta yang diberi sandhangan suku. Selain dari 20 suku kata dari ha sampai nga terdapat pula aksara untuk mengakomodasi kata yang tidak bisa memenuhi penulisan dengan aksara pokok. Aksara tersebut terdiri dari 5 buah yang disebut dengan aksara rekan Berikut adalah kelima aksara rekan yang dapat dilihat melalui gambar di bawah ini.
Gambar 2.8 Aksara Rekan Gambar 2.8 merupakan kumpulan aksara rekan. Dengan adanya aksara rekan maka bentuk-bentuk kata yang ditulis menggunakan bahasa asing dapat dipenuhi. Bahasa asing yang di maksud lebih dipengaruhi oleh bahasa Arab, seperti kha, dza, fa, za, gha. Dalam penerapannya, aksara fa dapat pula ditulis sebagai va.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 13
2.2
Pemrosesan Citra Digital Sebuah citra dapat didefinisikan sebagi fungsi dua dimensi, f(x, y), x dan y merupakan koordinat spatial dan amplitudo dari f dengan pasangan koordinat (x, y) disebut intensitas citra atau gray level pada titik tersebut. Ketika x, y dan nilai amplitudo dari f adalah terbatas (finite), bernilai diskrit maka suatu citra dapat disebut sebagai citra digital (digital image). Citra digital ini terbentuk dari angka yang terbatas dan dapat diukur (finite) dari setiap elemennya yang memiliki lokasi dan nilai tertentu. Elemen-elemen tersebut sering kita sebut dengan picture elements, image elements, pels, dan pixels. Pemrosesan yang terkait dengan citra digital ini dapat didefinisikan sebagai suatu proses yang memiliki input dan output berupa image (citra) dan sebagai tambahan meliputi juga proses yang mengekstraksi atribut dari citra hingga sampai pada pengenalan masing-masing objek. (Gonzales dan Woods, 2008). Menurut Kadir dan Susanto (2012) secara umum terdapat tiga jenis citra yang sering digunakan dalam pemrosesan citra yaitu citra berwarna, citra berskala keabuan dan citra biner (citra hitam putih).
2.2.1 Citra Berwarna Citra berwarna merupakan jenis citra yang mempunyai 3 komponen warna, yaitu komponen merah (red), komponen hijau (green) dan komponen biru (blue) sehingga sering disebut dengan citra RGB (Red Green Blue). Setiap komponen R (merah), G (hijau) dan B (biru) memiliki ukuran 8 bit, yaitu berkisar antara 0 sampai dengan 255. Secara umum, jumlah variasi warna yang dapat dihasilkan dari perpaduan citra RGB adalah (2b)3, dengan b adalah jumlah bits disetiap komponen citra. Untuk citra 8-bit, jumlah warna yang dapat dihasilkan sebanyak 16.777.216 warna. Ruang warna RGB biasanya dapat dinyatakan secara grafik dengan RGB color cube (kubus warna RGB).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 14
Gambar 2.9 Warna RGB dalam Ruang Berdimensi Tiga Gambar 2.9 merupakan representasi dari RGB color cube (kubus warna RGB) dengan 3 simpul utama yaitu warna primer (red, green, blue) dan warna sekunder (cyan, magenta and yellow).
2.2.2 Citra Berskala Keabuan Citra berskala keabuan atau sering disebut dengan citra grayscale merupakan representasi citra yang memiliki gradasi warna hitam dan putih sehingga menghasilkan efek warna keabuan. Intensitas warna yang dimiliki citra grayscale adalah 8 bit, yaitu berskala sekitar antara 0 sampai 255. Intensitas 0 menyatakan warna hitam dan intensitas 255 menyatakan warna putih sehingga intensitas antara 0 sampai 255 menghasilkan wana keabuan.
2.2.3 Citra Biner Citra biner merupakan jenis citra yang memiliki intensitas 0 atau 1. Intensitas 0 menyatakan warna hitam dan intensitas 1 warna menyatakan putih. Seringkali citra biner disebut juga sebagai citra black and white atau citra hitam putih.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 15
2.3
Pengenalan Pola Definisi pengenalan pola adalah suatu disiplin ilmu sains yang mempunyai tujuan pada pengklasifikasian objek ke dalam beberapa kelas atau kategori. Objek tersebut bergantung pada pengaplikasiannya, seperti citra, sinyal maupun tipe objek lainnya yang ingin diklasifikasi. Pengenalan pola merupakan bagian integral dalam sistem mesin cerdas (machine intelligence) yang dibuat untuk membuat sebuah keputusan (Theodoridis dan Koutroumbas, 2009). Suatu sistem dapat dikatakan sebagai sistem pengenalan pola jika terdiri dari beberapa komponen seperti data acquisition, preprocessing, feature extraction, feature selection, model selection and training, serta evaluation (Polikar, 2006). Di beberapa kajian penelitian tentang character recognition terdapat sebuah proses atau komponen yang dilakukan sebelum ke tahap evaluation, yaitu postprocessing (Patil dan Srinivasan, 2013). Pengertian dari data acquisition adalah suatu proses bagaimana cara kita memperoleh data, cara mengukur data tersebut dan berapa jumlah data yang diperlukan. Data yang kita dapatkan berasal dari lingkungan sekitar yang kemudian kita ubah kedalam bentuk digital sehingga dapat diolah oleh komputer. Komponen selanjutnya adalah preprocessing, yaitu proses ketika data yang sudah diperoleh (acquired data) dikondisikan sedemikian sehingga siap diolah untuk tahap selanjutnya dengan tujuan agar permasalahan mengenai pengenalan pola dapat dengan mudah diselesaikan. Hal-hal yang biasanya dilakukan dalam tahap preprocessing yaitu outlier removal, data normalization, treating missing data, dll (Theodoridis dan Koutroumbas, 2009). Definisi dari feature extraction adalah mengekstrak atau mengambil fitur-fitur penting dari objek untuk mengurangi dimensi data. Secara singkat, tujuan dari feature extraction adalah menemukan jumlah kecil dari fitur objek (subset) yang mampu membedakan dengan objek lainnya dan yang paling informatif untuk proses klasifikasi. Pentingnya pengurangan dimensi data
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 16
(dimensionality reduction) di dalam pengenalan pola atau bisa dikatakan sebuah feature set kecil tetapi sangat informatif secara signifikan dapat mengurangi kompleksitas dari algoritma yang digunakan untuk proses klasifikasi, waktu dan beban memory untuk menjalankan algoritma. Komponen selanjunya adalah feature selection yaitu menyeleksi atau memilih subset fitur dari set (himpunan) fitur yang telah diidentifikasi sebelumnya menggunakan algoritma yang digunakan pada tahap feature extraction. Pemilihan fitur ini didasarkan pada pencarian subset fitur yang mengarah pada performa generalisasi terbaik dari kinerja classifier ketika dilatih dengan subset tersebut. Model selection and training adalah komponen yang dipenuhi setelah data diperoleh lalu melalui tahap preprocessing, kemudian ektraksi fitur dan pemilihan fitur yang unik atau informatif dari objek tersebut sehingga telah siap untuk memilih classifier dan algoritma pelatihan (training) yang sesuai. Proses klasifikasi dapat dikatakan pemilihan fungsi aproksimasi yang mampu memetakan suatu masukan (input) kedalam informasi pada sebuah class yang sesuai. Ketika proses klasifikasi ini dikatakan sebagai suatu fungsi aproksimasi maka berbagai alat matematika (mathematical tools) seperti algoritma optimasi dapat digunakan. Menurut Jain et al., (2000) algoritma atau pendekatan yang umum digunakan untuk proses klasifikasi adalah template matching, statistical classification, syntactic or structural matching, dan neural network. Proses pengenalan pola, khususnya untuk character recognition belum selesai pada tahap klasifikasi. Menurut Patil dan Srinivasan (2013) proses mentranslasikan sebuah simbol haruslah diletakkan ke dalam konteks yang tepat agar membentuk sebuah karakter, kata, kalimat atau bahkan keseluruhan isi dokumen. Hal yang sama juga dipaparkan oleh Widiarti dan Winarko (2012) pada penelitiannya yang secara khusus tentang manuskrip beraksara Jawa dalam hal grouping (pengelompokan) suku kata agar membentuk suatu kata atau kalimat yang benar. Hal tersebut perlu dilakukan karena karakter penulisan aksara Jawa adalah tanpa spasi sehingga jika tidak dikelompokkan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 17
maka hanya berupa susunan kata, tanpa ada arti atau informasi dari barisan suku kata yang ada. Bagian komponen terakhir, yaitu setelah postprocessing selesai sering disebut sebagai evaluation. Performa kinerja dari classifier perlu dievaluasi menggunakan data baru untuk menghitung tingkat kebenaran atau akurasi yang dihasilkan oleh classifier. Pertama, dataset terlebih dahulu harus dipisah antara data untuk training dan testing. Terkait dengan pembagian dataset untuk memisah data training dan data testing menjadi penting karena data testing harus independent dari data training agar mampu membentuk model yang relatif tepat untuk membentuk prediksi data baru yang akan datang. Namun di sisi lain ada perhatian khusus mengenai data yang dipakai untuk training dan testing yang harus diperhatikan seperti jika sebagian kecil dari data yang digunakan untuk testing maka perkiraan dari performa generalisasi dari classifier mungkin tidak dapat diandalkan (unreliable), sedangkan jika sebagian besar data dipakai untuk testing maka berakibat pada sedikitnya data latih (training) atau sering disebut dengan poor training.
2.4
Data Acquisition Data acquisition merupakan suatu proses yang kita kerjakan untuk memperoleh data, cara mengukur data tersebut dan berapa jumlah data yang diperlukan. Data tersebut bisa diperoleh dengan memotret menggunakan kamera, sensor satelit, atau menggunakan sensor lainnya. Data yang kita dapatkan berasal dari lingkungan sekitar yang kemudian kita ubah kedalam bentuk digital sehingga dapat diolah oleh komputer.
2.5
Preprocessing 2.5.1 Cropping Cropping pada sebuah citra merupakan proses yang dilakukan untuk memotong pada koordinat tertentu yang berada pada area citra tersebut. Proses pemotongan citra (cropping) termasuk dalam kategori operasi geometri citra. Secara umum hanya dibutuhkan 2 buah
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 18
koordinat untuk melakukan proses pemotongan yaitu koordinat awal dan koordinat akhir. Koordinat awal merupakan titik pojok kiri atas citra yang akan dipotong sedangkan koordinat akhir merupakan titik pojok kanan bawah citra yang akan dipotong. Tiap-tiap pixel yang ada pada koordinat tersebut menjadi sebuah citra baru yang merupakan hasil dari pemotongan citra yang dilakukan. 2.5.2 Grayscaling Citra grayscale atau citra keabu-abuan memiliki nuansa warna abu-abu yang berada diantara warna hitam dan putih. Citra graysclace direpresentasikan dengan variasi nilai intensitas tertentu yang berada dalam interval 0 hingga 255. Proses grayscaling mengubah citra berwarna yang memiliki 3 komponen warna R, G dan B menjadi 1 komponen warna dengan memberikan sebuah nilai bobot kepada 3 komponen R, G dan B kemudian dijumlahkan untuk memperoleh intensitas warna abu-abu. Persamaan yang umum dipakai untuk mengubah citra berwarna menjadi citra grayscale menggunakan standar NTSC (National Television System Committee) yang dapat dinyatakan sebagai berikut: 𝑔(𝑥, 𝑦) = 0.299 𝑥 𝑅(𝑥, 𝑦) + 0.587𝑥 𝐺(𝑥, 𝑦) + 0.114 ∗ 𝐵(𝑥, 𝑦)
(2.1)
Dengan: g(x,y) = citra yang akan dikonversi menjadi grayscale R(x,y) = nilai pixel pada lokasi (x,y) untuk komponen R G(x,y) = nilai pixel pada lokasi (x,y) untuk komponen G B(x,y) = nilai pixel pada lokasi (x,y) untuk komponen B 2.5.3 Binarization Binarization merupakan sebuah proses untuk mengubah citra grayscale menjadi citra hitam putih. Citra perlu diubah kedalam format binary karena informasi mengenai warna tidak dibutuhkan, selain itu juga untuk mengurangi dimensi data dan kompleksitas komputasi serta data yang diproses hanya dalam format 0 atau 1. Secara umum suatu
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 19
citra dipisahkan menjadi 2 komponen, yaitu komponen pertama adalah objek dari citra, kemudian yang lainnya adalah background. Untuk mengkonversi
citra
grayscale
menjadi
citra
biner
sekaligus
memisahkan antara objek dan background maka dilakukan proses pengecekan nilai setiap nilai pixel terhadap nilai ambang atau sering disebut dengan pengambangan intensitas atau thresholding. Menurut Kadir dan Susanto (2012) nilai ambang ditentukan dengan terlebih dahulu melihat histogram citra dan dipilih nilai untuk ambang pada bagian lembah. Secara matematis, thresholding atau pengambangan intensitas dapat dinyatakan melalui persamaan: 𝑔(𝑥, 𝑦) = {
1 0
𝑖𝑓 𝑓 (𝑥, 𝑦) > 𝑇 𝑖𝑓 𝑓 (𝑥, 𝑦) ≤ 𝑇
(2.2)
Dengan: g(x,y) = citra hasil segmentasi atau citra biner f(x,y) = citra masukan (x,y)
= titik (x,y) pada citra
T
= nilai thresholding (nilai ambang)
Dalam penerapannya, nilai 1 atau 0 pada persamaan 2.2 dapat saling ditukarkan posisinya. 2.5.4 Image Segmentation Segmentasi citra merupakan suatu metode yang dilakukan untuk memperoleh objek-objek yang terkandung di dalam citra atau membagi suatu citra menjadi beberapa daerah yang memiliki kemiripan atribut antara objek atau daerah pada citra (Kadir et.al., 2012). Penelitian yang telah dilakukan oleh Widiarti et al. (2014) tentang Preprocessing Model of Manuscript in Javanese Characters memaparkan salah satu tahapan penting dalam memperoleh karakter dalam manuskrip adalah menggunakan projection profile. Prinsip kerjanya adalah mencari line image (garis suatu karakter) kemudian dari garis tersebut kita mencari karakter aksara tersebut. Langkah pertama adalah melakukan vertical projection yaitu memproyeksikan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 20
pixel objek secara vertikal untuk memperoleh informasi tentang pixel garis yang memiliki kelompok pixel tertentu yang merupakan representasi dari suatu objek (karakter). Persamaan dari vertical projection dapat ditulis sebagai berikut: 𝐶
𝑃𝑣 [𝑖 ] = ∑ 𝑆[𝑖, 𝑗]
(2.3)
𝑗=1
Dengan: Pv = vektor Pv pada baris ke-i S
= citra masukan berupa citra biner
R,C = ukuran baris dan kolom citra Hasil dari vertical projection yaitu menemukan line image suatu objek sehingga langkah selanjutnya adalah segmentasi karakter. Segmentasi karakter dilakukan untuk memperoleh setiap objek karakter yang terkandung dalam citra. Proses yang dikerjakan untuk melakukan segmentasi karakter adalah menerapkan horizontal projection untuk mendapatkan informasi posisi pixel yang memungkinkan kita potong untuk memperoleh karakter tersebut. Persamaan horizontal projection adalah sebagai berikut: 𝑅
𝑃ℎ [𝑗] = ∑ 𝑆[𝑖, 𝑗]
(2.4)
𝑖=1
Dengan: Ph = vektor Ph pada kolom ke-j S
= citra masukan berupa citra biner
R,C = ukuran baris dan kolom citra Langkah pertama adalah melakukan vertical projection yaitu memproyeksikan pixel objek secara vertikal untuk memperoleh informasi tentang pixel garis yang memiliki kelompok pixel tertentu. Kelompok pixel inilah yang merupakan representasi dari suatu objek
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 21
(karakter). Persamaan dari vertical projection dapat dilihat pada persamaan 2.3. Misalnya kita memiliki sebuah citra biner aksara Jawa pa dan ra dalam satu bagian.
Gambar 2.10 Citra Biner “Para” Gambar 2.10 merupakan contoh representasi citra aksara pa dan ra. Dengan melakukan vertical projection pada Gambar 2.10 maka kita akan menjumlahkan nilai setiap pixel pada semua baris di setiap kolomnya untuk mengetahui letak garis pada masing-masing aksara. Pada citra biner, komponen yang berwarna hitam mempunyai nilai pixel 0 dan komponen putih mempunyai nilai pixel 1, sehingga dapat kita peroleh matriks proyeksi vertikalnya adalah [ 0 5 1 5 1 5 1 5 0 1 1 6 1 1 5 0 ]. Dengan hasil yang diperoleh dapat disimpulkan bahwa jika nilai pada matriks sama dengan 0 berarti pada kolom tersebut tidak terdapat objek, sebaliknya jika nilai pada matrik lebih dari 0 maka menandakan pada kolom tersebut terdapat objek. Dengan kata lain, dapat kita katakan bahwa pada citra tersebut terdapat 2 objek, yaitu objek pertama terletak pada kolom ke-2 sampai ke-8 sedangkan objek kedua terletak pada kolom ke-10 sampai ke-15. Setelah melakukan proyeksi secara vertikal lalu dilanjutkan dengan proyeksi horizontal. Proyeksi horizontal (horizontal projection) dilakukan untuk mengetahui batas atas dan batas bawah pada objek agar secara tepat dapat dipisahkan atau dipotong. Persamaan dari horizontal projection dapat dilihat pada persamaan 2.4. Prinsip kerja dari horizontal projection adalah menjumlahkan pixel masing-masing baris untuk semua kolom pada baris tersebut. Berdasarkan Gambar 2.10
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 22
dapat kita peroleh matriks proyeksi horizontalnya adalah [ 0 6 7 6 6 6 7 0 ]. Berdasarkan hasil dari matriks tersebut dapat disimpulkan bahwa batas paling atas pada objek tersebut berada pada baris ke-2 dan batas paling bawah berada pada baris ke-7. Secara visual, hasil dari projection profile (vertical dan horizontal projection) dapat dinyatakan sebagai berikut:
Gambar 2.11 Projection Profile dari Citra Aksara Pa dan Ra Gambar 2.11 adalah representasi citra hasil projection profile terhadap Gambar 2.10. Gambar sebelah kiri adalah aksara pa dan sebelah kanan adalah aksara ra yang telah tersegmentasi dengan baik. Dengan projection profile maka kita dapat memisahkan masing-masing aksara yang menyusun sebuah kata pada citra nama jalan. 2.5.5 Resizing Resizing atau mengubah ukuran citra merupakan sebuah cara untuk mengubah dimensi citra dengan ukuran tertentu sehingga informasi pixel dari citra tersebut juga berubah. Sebagai contoh, ketika ukuran citra diperkecil maka informasi pixel yang tidak dibutuhkan akan dihilangkan sedangkan ketika ukuran citra diperbesar maka akan ditambahkan informasi pixel baru untuk memperoleh ukuran citra yang lebih besar.
2.6
ICZ-ZCZ ICZ merupakan kependekan dari Image Centroid and Zone. Ekstraksi ciri ICZ pada dasarnya bekerja dengan mencari titik centroid dari citra kemudian citra dibagi menjadi n zona yang sama. Jika citra sudah dibagi kedalam n zona kemudian menghitung jarak antara masing-masing pixel yang ada disetiap zona dengan titik centroid-nya. Total nilai jarak yang ada disetiap
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 23
zona merupakan nilai rerata dari jarak semua pixel di zona tersebut. Hasil dari ekstraksi ciri ICZ akan menghasilkan n fitur dari objek tersebut. ZCZ merupakan kependekan dari Zone Centroid and Zone. Ekstraksi ciri ZCZ bekerja dengan membagi citra menjadi n zona kemudian masingmasing zona dihitung titik centroid-nya masing-masing. Setelah didapatkan titik centroid kemudian menghitung jarak semua pixel di zona tersebut dengan titik centroid. Total nilai jarak yang diperoleh di tiap zona merupakan rerata semua jarak yang dihasilkan. Langkah tersebut diulang sebanyak n zona yang ada sehingga hasil dari ekstraksi ciri ZCZ menghasilkan n fitur. Perbedaan yang mendasar dari ekstraksi ciri ICZ dan ZCZ adalah penghitungan centroid dan pembagian zona yang dilakukan. ICZ bekerja dengan mencari titik centroid-nya terlebih dahulu kemudian citra dibagi kedalam n zona yang sama sehingga akan didapatkan satu titik centroid sedangkan ZCZ membagi n zona citra kemudian masing-masing zona dicari titik centroid-nya sehingga didapatkan centroid sebanyak jumlah zona yang ada. ICZ-ZCZ merupakan gabungan dari kedua ekstraksi ciri tersebut sehingga hasil dari ekstraksi cirinya akan diperoleh sebanyak 2n fitur. Rumus yang digunakan untuk mencari titik centroid dapat dinyatakan sebagai berikut: ∑𝑛𝑖=1 𝑥𝑖 . 𝑝𝑖 𝑥𝑐 = ∑𝑛𝑖=1 𝑝𝑖
(2.5)
∑𝑛𝑖=1 𝑦𝑖 . 𝑝𝑖 ∑𝑛𝑖=1 𝑝𝑖
(2.6)
𝑦𝑐 = Dengan: xc = centroid pada koordinat x yc = centroid pada koordinat y xi = koordinat titik x ke-i yi = koordinat titik y ke-i pi = nilai pixel pada titik ke-i
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 24
Dalam penghitungan jarak antara centroid dengan nilai pixel yang ada di dalam zona menggunakan perhitungan jarak Euclidean distance dengan rumus seperti pada persamaan 2.7. Misalkan terpadat sebuah citra aksara pa seperti Gambar 2.11. Pinsip kerja dari ekstraksi ciri menggunakan ICZ adalah sebagai berikut. Langkah pertama adalah mencari titik centroid-nya. Citra masukkan untuk proses ektraksi ciri adalah citra biner, sehingga objek dari citra memiliki representasi nilai 1, atau bagian yang berwarna putih. Dengan demikian nilai xi dan yi adalah 1 sedangkan untuk nilai pi tergantung dari sumbu mana yang akan kita cari, jika sumbu x maka nilai pi merupakan nilai koordinat objek pada sumbu x sedangkan jika sumbu y maka nilai pi merupakan nilai koordinat objek pada sumbu y. Berdasarkan persamaan 2.5 dan 2.6 ketika suatu bilangan dikalikan 1 akan menghasilan bilangan itu sendiri maka secara sederhana kita cukup menjumlahkan nilai koordinat pada masing-masing sumbu untuk seriap pixel objeknya. Titik centroid untuk 𝑥𝑐 dan 𝑦𝑐 dapat dihitung dengan:
𝑥𝑐 =
2+6+1+3+5+7+1+3+5+7+1+3+5+7+1+3+5+7+1+3+4+ 5+7
𝑦𝑐 =
1+1+2+2+2+2+3+3+3+3+4+4+4+4+5+5+5+5+6+6+6+6+6
23 23
=
92
=
88
23 23
=4 = 3.82
Dengan hasil yang diperoleh maka pusat massa (centroid) objek tersebut berada di titik (4, 3.82). Setelah titik centroid diperoleh maka objek tersebut kita bagi menjadi beberapa zona. Untuk mempermudah perhitungan kita bagi menjadi 3 zona secara horizontal. Jika citra sudah dibagi kedalam 3 zona kemudian menghitung jarak antara masing-masing pixel yang ada disetiap zona terhadap titik centroid-nya. Total nilai jarak yang ada disetiap zona merupakan nilai rerata dari jarak semua pixel di zona tersebut. Hasil dari ekstraksi ciri ICZ akan menghasilkan 3 fitur dari objek tersebut, sesuai dengan jumlah pembagian zona yang diberikan. Adapun persamaan yang digunakan untuk menghitung nilai jarak adalah menggunakan euclidean distance seperti pada persamaan 2.7.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 25
Gambar 2.12 Pembagian Zona dan Perhitungan Jarak (ICZ) Gambar 2.12 merupakan representasi pembagian zona menggunakan ICZ yang dibagi menjadi 3 zona sama besar secara horizontal pada citra aksara pa. Perhitungan untuk fitur pada zona 1 adalah sebagai berikut: 𝑑1 = √(1 − 4)2 + (2 − 3.82)2 = 3.51 𝑑2 = √(2 − 4)2 + (1 − 3.82)2 = 3.46 𝑑3 = √(3 − 4)2 + (2 − 3.82)2 = 2.08 𝑑4 = √(5 − 4)2 + (2 − 3.82)2 = 2.08 𝑑5 = √(6 − 4)2 + (1 − 3.82)2 = 3.46 𝑑6 = √(7 − 4)2 + (2 − 3.82)2 = 3.51 𝑓𝑖𝑡𝑢𝑟1 =
3.51 + 3.46 + 2.08 + 2.08 + 3.46 + 3.51 = 3.01 6
Berdasarkan hasil perhitungan diatas maka ciri atau fitur dari zona 1 adalah 3.01. Cara yang sama juga berlaku untuk mencari nilai ciri atau fitur pada zona 2 dan zona 3 sehingga diperoleh fitur zona ke 2 adalah 2.11 serta zona 3 adalah 2.66. Jika digabung akan menghasilkan 3 fitur, yaitu [ 3.01 2.11 2.66 ]. Setelah semua ciri yang dihitung menggunakan metode ICZ diperoleh maka dilanjutkan dengan mengekstrak ciri objek menggunakan metode ZCZ. Prinsip kerja dari ekstraksi ciri menggunakan ZCZ adalah sebagai berikut. Langkah pertama adalah membagi kedalam beberapa zona, sama dengan langkah sebelumnya, yaitu membagi ke dalam 3 zona secara horizontal kemudian mencari titik centroid untuk setiap zona yang ada. Setelah didapatkan titik centroid-nya, lalu menghitung jarak antara masingmasing pixel yang ada disetiap zona terhadap titik centroid-nya menggunakan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 26
euclidean distance. Total nilai jarak yang ada disetiap zona merupakan nilai rerata dari jarak semua pixel di zona tersebut. Hasil dari ekstraksi ciri ZCZ akan menghasilkan 3 fitur dari objek tersebut, sesuai dengan jumlah pembagian zona yang diberikan. Adapun titik centroid xc dan yc pada zona 1 adalah sebagai berikut: 1 + 2 + 3 + 5 + 6 + 7 24 = =4 6 6 2 + 1 + 2 + 2 + 1 + 2 10 𝑦𝑐 = = = 1.67 6 6 𝑥𝑐 =
Dengan demikian maka titik centroid pada zona 1 adalah (4, 1.67). Proses yang sama juga dilakukan untuk mencari titik centroid pada zona 2 dan zona 3, yang masing-masing titik centroid-nya adalah (4, 1.50) dan (4, 1.56).
Gambar 2.13 Pembagian Zona dan Perhitungan Jarak (ZCZ) Gambar 2.13 merupakan representasi pembagian zona menggunakan ZCZ yang dibagi menjadi 3 zona sama besar secara horizontal pada citra aksara pa. Perhitungan untuk fitur pada zona 1 adalah sebagai berikut: 𝑑1 = √(1 − 4)2 + (2 − 1.67)2 = 3.02 𝑑2 = √(2 − 4)2 + (1 − 1.67)2 = 2.11 𝑑3 = √(3 − 4)2 + (2 − 1.67)2 = 1.05 𝑑4 = √(5 − 4)2 + (2 − 1.67)2 = 1.05 𝑑5 = √(6 − 4)2 + (1 − 1.67)2 = 2.11 𝑑6 = √(7 − 4)2 + (2 − 1.67)2 = 3.02 𝑓𝑖𝑡𝑢𝑟1 =
3.02 + 2.11 + 1.05 + 1.05 + 2.11 + 3.02 = 2.06 6
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 27
Berdasarkan hasil perhitungan diatas maka ciri atau fitur dari zona 1 adalah 2.06. Cara yang sama juga berlaku untuk mencari nilai ciri atau fitur pada zona 2 dan zona 3 sehingga diperoleh fitur zona ke 2 adalah 2.08 serta zona 3 adalah 1.90. Jika digabung akan menghasilkan 3 fitur, yaitu [ 3.01 2.11 2.66 ]. Setelah didapatkan masing-masing 3 fitur menggunakan metode ICZ dan ZCZ lalu fitur tersebut digabungkan sehingga menjadi 6 fitur yang merepresentasikan citra tersebut sehingga dapat ditulis [ 3.01 2.11 2.66 2.06 2.08 1.90 ].
2.7
Template Matching Model klasifikasi yang digunakan dalam penelitian ini adalah menggunakan template matching. Pendekatan template matching dipilih karena paling mudah untuk diterapkan dan sesuai dengan karakteristik data yang akan dikenali. Prinsip pendekatan template matching untuk klasifikasi adalah mengukur kedekatan atau kesamaan (similarity) antar objek atau entities yang diperbandingkan. Objek yang diperbandingkan adalah data uji yang akan dikenali dengan database template yang sudah disimpan. Ketika suatu objek baru yang ingin dikenali dibandingkan dengan database template kemudian diperoleh nilai kesamaan yang relatif besar maka secara langsung objek baru tersebut dapat diklasifikasikan atau dikenali sesuai dengan template pembandingnya. Secara umum rumus yang biasa digunakan untuk mengukur jarak antar 2 objek adalah menggunakan euclidean distance. Adapun rumus euclidean distance dapat ditulis sebagai berikut: 𝑛
𝑑(𝑥, 𝑦) = √∑(𝑥𝑘 − 𝑦𝑘 )2 𝑘=1
Dengan: d(x,y) = jarak antara vektor objek x dan y n
= jumlah dimensi objek
xk , yk = nilai vektor objek x dan y ke-k
(2.7)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 28
Nilai jarak antar objek yang besar menandakan bahwa kedua objek tersebut relatif tidak mirip, sebaliknya jika nilai jarak antar objek bernilai kecil maka kedua objek tersebut relatif mirip (memiliki kesamaan). Sebagai contoh, diberikan sebuah objek A memiliki nilai feature [6 4 3 8 9 4 5 2] dan objek B memiliki nilai feature [4 5 8 2 2 4 2 9] sedangkan terdapat sebuah template C dengan nilai feature [1 8 6 4 4 5 6 4]. Untuk mencari objek mana yang memiliki kemiripan dengan objek C maka berdasarkan nilai feature masingmasing objek dapat dihitung jaraknya sebagai berikut: 𝑑𝐴𝐶 = √(6−1)2 + (4 − 8)2 + (3 − 6)2 + (8 − 4)2 + (9 − 4)2 + (4 − 5)2 + (5 − 6)2 + (2 − 4)2 = √97 = 9.85 𝑑𝐵𝐶 = √(4−1)2 + (5 − 8)2 + (8 − 6)2 + (2 − 4)2 + (2 − 4)2 + (4 − 5)2 + (2 − 6)2 + (9 − 4)2 = √72 = 8.49
Cara diatas merupakan perhitungan yang biasa kita lakukan untuk menghitung nilai jarak menggunakan euclidean distance. Untuk menyingkat proses perhitungan, kita dapat melakukan hal yang berbeda tetapi dengan hasil yang sama menggunakan perhitungan matriks. Cara tersebut adalah sebagai berikut: 𝐷 = [𝐴 − 𝐶 ] 𝐷 = [(6 − 1) (4 − 8) (3 − 6) (8 − 4) (9 − 4) (4 − 5) (5 − 6) (2 − 4)] = [5 − 4 − 3 𝑑𝐴𝐶
4
5 − 1 − 1 − 2]
= √(𝐷 ∗ 𝐷′ ) = √25 + 16 + 9 + 16 + 25 + 1 + 1 + 4 = √97 = 9.85
𝐸 = [𝐵 − 𝐶 ] 𝐸 = [(4 − 1) (5 − 8) (8 − 6) (2 − 4) (2 − 4) (4 − 5) (2 − 6) (9 − 4)] = [3 − 3 𝑑𝐵𝐶
2 −2 −2 −1 −4
5]
= √(𝐸 ∗ 𝐸′ ) = √9 + 9 + 4 + 4 + 4 + 1 + 16 + 25 = √72 = 8.49
Dari hasil perhitungan jarak tersebut, jarak antara objek A dengan C lebih besar daripada jarak antara objek B dengan C, sehingga dapat disimpulkan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 29
bahwa objek B memiliki kemiripan dengan objek C dibandingkan dengan objek A.
2.8
Postprocessing Proses postprocessing dilakukan untuk mengelompokkan suku kata agar membentuk kata atau kalimat yang memiliki arti. Hal tersebut perlu dilakukan karena karakter penulisan aksara Jawa adalah tanpa spasi sehingga jika tidak dikelompokkan maka hanya berupa susunan kata, tanpa ada arti dari barisan suku kata tersebut. Namun sebelum dilakukan proses pengelompokan kita juga harus mengetahui tentang aturan-aturan dalam penulisan aksara Jawa karena sering kali tidak hanya ditulis dengan aksara legena tetapi ditambah dengan sandhangan dan pasangan. Sebagai contoh, perhatikan penulisan aksara berikut ini.
Gambar 2.14 Aksara Iredha Gambar 2.14 di atas jika dibaca bunyinya “iredha.” Aksara tersebut disusun oleh 3 aksara legena, pertama, yaitu ha diberi sandhangan yang letaknya diatas aksara ha berupa wulu sehingga jika dibaca menjadi hi atau i. Aksara kedua ra diberi sandhangan berupa taling di depannya sehingga menjadi re dan yang terakhir adalah aksara dha. Jika semua aksara digabungkan maka dibaca “iredha.”
Gambar 2.15 Aksara Modhang Gambar 2.15 di atas jika dibaca bunyinya “modhang.” Aksara tersebut disusun oleh 2 aksara legena, pertama, yaitu ma diberi sandhangan yang letaknya mengapit aksara tersebut berupa taling dan tarung sehingga jika
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 30
dibaca menjadi mo. Aksara kedua dha diberi sandhangan berupa cecak di atasnya sehingga menjadi dhang. Jika semua aksara digabungkan maka dibaca “modhang.”
Gambar 2.16 Aksara Pajeksan Gambar 2.16 di atas jika dibaca bunyinya “pajeksan.” Aksara tersebut disusun oleh 4 aksara legena dan 1 aksara pasangan. Aksara pertama, yaitu pa lalu aksara kedua yaitu ja diberi sandhangan yang terletak di atasnya berupa pepet sehingga jika dibaca menjadi je. Aksara ketiga yaitu ka. Setalah aksara ka terdapat aksara pasangan sa sehingga aksara di depannya yaitu ka akan berubah menjadi mati atau konsonan k. Aksara terakhir yaitu na diberi pangkon sehingga menjadi mati atau konsonan n. Jika semua aksara digabungkan maka dibaca “pajeksan.” Berdasarkan beberapa contoh diatas maka dapat dirangkum menjadi aturan penulisan menggunakan aksara Jawa dipengaruhi oleh aksara yang lainnya, aksara tersebut dapat berupa sandhangan maupun pasangan. Ketika diberi sebuah pasangan maka aksara asli (legena) akan berubah bunyinya. Terdapat pengecualian untuk sandhangan berupa pangkon yaitu digunakan sebagai sigeg (konsonan penutup suku kata) untuk aksara yang berada di depannya. Aksara legena jika diberi sebuah pasangan maka aksara yang di depan atau di atasnya akan menjadi konsonan atau mati.
2.9
Evaluation Ketika model classifier sudah ditentukan maka proses terakhir adalah menguji sistem pengenalan pola yang sudah dibangun. Dengan menggunakan model template matching maka performa atau unjuk kerja classifier dapat diukur dengan memberikan beberapa data testing menggunakan suatu objek baru untuk dikenali. Performa kinerja dari classifier diukur dari nilai kebenaran atau akurasi dari jumlah objek yang dengan benar dikenali
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 31
dibandingkan dengan jumlah semua objek yang secara umum menggunakan rumus seperti dibawah ini. 𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
∑ 𝑜𝑏𝑗𝑒𝑘 𝑦𝑎𝑛𝑔 𝑑𝑖𝑘𝑒𝑛𝑎𝑙𝑖 𝑑𝑒𝑛𝑔𝑎𝑛 𝑏𝑒𝑛𝑎𝑟 𝑥 100% ∑ 𝑠𝑒𝑚𝑢𝑎 𝑜𝑏𝑗𝑒𝑘
(2.8)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB III METODE PENELITIAN
3.1
Bahan Riset/Data Penelitian ini menggunakan bahan sebuah citra nama jalan beraksara Jawa sebagai input yang akan diproses ke tahap pengenalan aksara. Objek citra nama jalan beraksara Jawa ini diperoleh dengan mengambil foto namanama jalan yang berada di Kota Yogyakarta. Jumlah citra nama jalan yang dipakai dalam penelitian ini sebanyak 130 gambar yang dibagi menjadi 30 gambar untuk data uji dan 100 gambar untuk data template.
3.2
Peralatan Penelitian Spesifikasi perangkat keras yang digunakan dalam pembuatan prototype sistem pengenalan nama jalan beraksara Jawa ini yaitu sebuah komputer dengan prosesor Intel Core i5, kapasitas memory sebesar 6 GB dan ruang penyimpanan (hardisk) sebesar 500 GB. Perangkat lunak yang dipakai dalam proses pembuatan prototype sistem pada penelitian ini adalah Matlab versi 7.10. Pemilihan Matlab sebagai alat untuk membangun prototype sistem karena dukungan toolbox yang lengkap dan cocok dipakai dalam pengolahan data berupa matriks.
3.3
Metode Pengumpulan Data 3.3.1 Observasi Observasi merupakan salah satu metode dalam mengumpulkan data dengan melakukan pengamatan dan pencatatan mengenai gejala atau peristiwa yang sedang diteliti. Objek yang sedang diteliti adalah nama-nama jalan yang ada di Yogyakarta. Data citra nama jalan diperoleh dengan cara melakukan pengambilan gambar nama jalan beraksara Jawa yang dilakukan dengan memotret nama jalan yang ada di berbagai lokasi atau tempat di Yogyakarta.
32
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 33
3.3.2 Studi Literatur Studi literatur merupakan sarana untuk memperoleh informasi yang digunakan untuk mencari topik dan teori-teori yang terkait dengan penelitian yang akan dikerjakan. Teori yang sudah ada dan berbagai penelitian sejenis yang pernah dilakukan akan digunakan sebagai acuan dan pedoman dalam melakukan penelitian saat ini. Sumber-sumber yang dapat dijadikan bahan referensi antara lain buku-buku atau jurnal yang berkaitan dengan pembahasan yang akan diteliti.
3.4
Tahap Penelitian 3.4.1 Identifikasi Masalah Tahap awal dalam penelitian ini adalah merumuskan masalah dengan melihat kondisi yang ada disekitar yaitu membuat sebuah sistem yang mampu menerjemahkan kata yang ditulis menggunakan aksara Jawa. Data mengenai kata dalam aksara Jawa diambil dari nama-nama jalan yang ada di Yogyakarta. Rumusan permasalahan yang akan diselesaikan
adalah
mengukur
kemampuan
sistem
dalam
menerjemahkan tulisan menggunakan aksara Jawa menjadi tulisan latin yang direpresentasikan dengan tingkat akurasi yang dihasilkan oleh sistem. 3.4.2 Studi pustaka Dalam penyusunan penelitian ini penulis memerlukan sumber informasi yang diambil dari beberapa buku referensi, jurnal imiah atau literatur lainnya sebagai rujukan ilmiah yang mendukung penulisan tugas akhir. Melalui studi pustaka ini penulis memperoleh informasi mengenai penelitian-penelitian yang pernah dilakukan untuk dijadikan sebagai landasan teori yang mendasari dalam penulisan laporan tugas akhir. Dengan adanya studi pustaka ini maka penulis dapat menunjukkan relevansi antara topik tugas akhir yang sedang dikerjakan dengan penelitian-penelitian yang sebelumnya sudah pernah dikerjakan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 34
sehingga penelitian yang akan dikerjakan dapat diselesaikan dan dapat dipertanggungjawabkan kebenarannya. 3.4.3 Pengumpulan Data Pengumpulan data menjadi
unsur yang penting dalam
penyelesaian tugas akhir karena digunakan untuk memperoleh informasi atau data yang berguna untuk penelitian yang sedang dikerjakan. Data yang diperoleh nantinya akan diamati dan diolah secara mendalam sesuai dengan prosedur dan teori yang sudah dirumuskan. Data yang digunakan untuk penelitian ini bersumber dari hasil mengambil foto objek nama-nama jalan yang ada di wilayah Yogyakarta. Jarak pengambilan gambar nama jalan kurang lebih 50 cm dari tiang jalan. Objek nama jalan yang dipilih merupakan nama jalan yang ditulis menggunakan aksara Jawa. Teknik yang digunakan dalam mengumpulkan data penelitian ini adalah teknik observasi. Teknik ini umumnya sering dipakai didalam penelitian kualitatif. Observasi pada dasarnya melakukan suatu kegiatan menggunakan panca indera kita, bisa berupa penglihatan, penciuman,
pendengaran
untuk
memperoleh
informasi
yang
dibutuhkan dalam menjawab masalah pada penelitian yang sedang dikerjakan. Dengan menggunakan observasi ini maka data dapat diperoleh secara riil gambaran suatu peristiwa yang berada dilapangan. 3.4.4 Pengolahan Data Setelah semua data terkumpul maka proses selanjutnya adalah pengolahan data. Cara pengolahan data dapat dinyatakan kedalam bentuk blok diagram seperti gambar dibawah ini.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 35
Gambar 3.1 Blok Diagram Gambar 3.1 diatas memvisualisasikan langkah-langkah dalam pengolahan data yang dilakukan. Pada dasarnya, pengolahan data yang dikerjakan dibagi menjadi 2 bagian utama, yaitu pembuatan template database dan pengujian atau testing. Masing-masing bagian memiliki langkah-langkah yang hampir sama, yaitu ketika kita melakukan data acquisition, preprocessing dan feature extraction and selection. Yang membedakan adalah pada pembuatan template database, hasil dari ekstraksi ciri kemudian disimpan sebagai features dari template sedangkan pada bagian pengujian features dari template akan dibandingkan dengan features data uji untuk dihitung jarak kedekatannya kemudian akan diklasifikasikan dengan jarak minimum dari template yang ada. Penjelasan mengenai langkah-langkah yang dilakukan adalah sebagai berikut: a. Data Acquisition Data untuk template dan pengujian merupakan citra nama jalan beraksara Jawa masing-masing berjumlah 100 dan 30 citra. Citra tersebut diambil secara langsung menggunakan kamera smartphone
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 36
dengan resolusi 10 megapixels (4096 x 2304 pixels). Jarak pengambilan gambar sekitar 50 cm dari tiang nama jalan. Pengambilan gambar dilakukan dengan 2 versi, yang pertama data diambil pada keadaan normal, artinya kondisi pencahayaan cukup terang pada waktu pagi hingga siang hari dan sudut pengambilan gambar tegak lurus terhadap papan nama jalan. Versi kedua, untuk membuat data uji bervariasi maka sebagian gambar diambil pada keadaan tidak normal, artinya pengambilan gambar dilakukan dengan pencahayaan yang minim/gelap pada waktu malam hari dan angle/sudut pengambilan gambar sembarang atau tidak tegak lurus terhadap papan nama jalan. Format gambar yang digunakan adalah JPG. Bahan yang digunakan untuk pembuatan template adalah citra aksara
Jawa
nglegena,
sandhangan
dan
pasangan
yang
divariasikan. Data yang dipakai untuk membuat template harus independent terhadap data uji agar mampu membentuk model yang relatif tepat untuk membentuk prediksi data baru yang akan datang. b. Preprocessing Sebelum data diekstrak cirinya maka data tersebut harus disiapkan sedemikian sehingga data tersebut siap untuk diolah. Adapun tahapan yang dilakukan pada preprocessing adalah sebagai berikut:
Gambar 3.2 Preprocessing Modules
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 37
Gambar 3.2 merupakan tahapan dalam proses preprocessing. Secara berurutan, proses tersebut adalah cropping, grayscaling, binarization, dan image segmentation, resizing. Proses cropping dilakukan
secara
manual
menggunakan
photoshop
untuk
mendapatkan citra nama jalan yang ditulis dengan aksara Jawa saja. Proses grayscaling dan binarization diperlukan untuk mengubah citra dari berwarna menjadi citra abu-abu lalu dari citra abu-abu diubah menjadi citra hitam-putih atau citra biner. Kedua proses tersebut menggunakan toolbox pada Matlab yaitu fungsi rgb2gray() dan fungsi im2bw(). Langkah selanjutnya adalah
proses segmentation yaitu proses untuk memisahkan tiap karakter yang menyusun tulisan nama jalan secara otomatis menggunakan metode projection profile. Proses terakhir adalah resizing yaitu mengubah ukuran citra agar memiliki ukuran yang sama untuk mempermudah proses ekstraksi ciri dan klasifikasi. Dengan menggunakan toolbox dari Matlab yaitu imresize() citra diubah ukurannya menjadi 100x110 pixels. Pemilihan ukuran tersebut berdasarkan hasil percobaan untuk mendapatkan ukuran citra terbaik tanpa kehilangan informasi/detail penting dari citra. c. Feature Extraction and Selection Ekstraksi ciri dan pemilihan ciri yang tepat dan sesuai dengan karakteristik objeknya merupakan hal yang sangat berpengaruh terhadap kemampuan sistem untuk mengklasifikasikan objek. Ekstraksi ciri akan mengambil informasi yang penting dari objek sehingga mempermudah dalam proses klasifikasi. Selain itu ektraksi ciri dilakukan untuk mengurangi dimensi data sehingga beban memory lebih sedikit, running time relatif lebih cepat dan mengurangi kompleksitas algoritma untuk proses klasifikasi. Ektraksi yang dipakai pada penelitian ini adalah ICZ-ZCZ (Image Centroid and Zone-Zone Centroid and Zone). Untuk pembagian zona terkait citra aksara Jawa belum ada standar atau penelitian
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 38
yang menguji model pembagian zona terbaik sehingga pada penelitian ini citra dibagi ke dalam 4 zona. Pembagian 4 zona ini diuji menggunakan 2 model yaitu citra dibagi menjadi 4 zona secara horizontal dan vertikal-horizontal. Berikut ini adalah representasi citra ketika dibagi menjadi 4 zona.
Gambar 3.3 Pembagian 4 Zona Secara Horizontal Gambar 3.3 merupakan representasi dari citra yang dibagi menjadi 4 zona secara horizontal. Citra berukuran 100x110 pixels sehingga jika dibagi 4 zona secara horizontal maka tiap zona masing-masing berukuran 25x110 pixels.
Gambar 3.4 Pembagian 4 Zona Secara Vertikal-Horizontal Gambar 3.4 merupakan representasi dari citra yang dibagi menjadi 4 zona secara vertikal dan horizontal. Citra berukuran 100x110 pixels sehingga jika dibagi 4 zona maka setiap zona secara vertikalhorizontal masing-masing berukuran 50x55 pixels. Jumlah feature objek sebanding dengan jumlah pembagian zonanya sehingga ketika diimplementasikan, ekstrasi ciri ICZ memiliki keluaran 4 nilai
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 39
feature dan ekstraksi ZCZ memiliki keluaran 4 nilai features. Pada prinsipnya ekstraksi ciri ICZ-ZCZ merupakan gabungan dari ekstraksi ciri ICZ dan ZCZ sehingga dengan pembagian 4 zona maka menghasilkan nilai 8 nilai features dari objek. d. Pembuatan Template Database Data yang sudah melalui tahap preprocessing dan feature extraction and selection akan menghasilkan keluaran berupa ciri dari objek tersebut. Ciri dari setiap objek yang dijadikan sebagai template disimpan ke database ciri untuk membuat template database. Citra yang digunakan untuk pembuatan template database sebanyak 100 citra yang independen terhadap citra data uji (testing). e. Classification Tahap klasifikasi akan menghitung jarak minimum antara template dengan data uji sehingga data uji yang memiliki kemiripan paling besar akan diklasifikasikan sesuai dengan template-nya. Untuk mengukur
kedekatan
antar
objek
yang
diperbandingkan
menggunakan rumus jarak euclidean distance. f. Postprocessing Pada tahap ini, kumpulan aksara Jawa yang diperoleh dari hasil klasifikasi akan diproses lagi untuk dicek apakah sudah sesuai dengan aturan dalam penulisan aksara atau belum. Jika belum maka akan dibetulkan sesuai dengan kaidah yang berlaku. Jika kata yang membentuk sudah sesuai dengan aturan penulisan aksara Jawa maka akan dikelompokkan menjadi 2 hingga 3 kata, sesuai dengan kata yang menyusun nama jalan yang berada di Kota Yogyakarta. g. Evaluation Tahap akhir dari pengujian menggunakan data uji adalah melakukan evaluasi terhadap classifier dengan menghitung tingkat akurasi yang dihasilkan oleh sistem. Pada tahap ini akan dilakukan pengujuan dengan 2 macam test case. Case pertama data yang diambil dalam kondisi normal, artinya gambar yang diambil dengan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 40
pencahayaan cukup terang dan angle/sudut pengambalian gambar tegak lurus dengan papan nama jalan. Case kedua data yang diambil divariasikan dengan data yang diambil dengan kondisi tidak normal, artinya gambar diambil dengan pencahayaan mini,/gelap dan angle/sudut pengambilan gambar tidak tegak lurus dengan papan nama jalan. Dari 2 test case tersebut masing-masing akan dibandingkan hasil akurasinya menggunakan pembagian 4 zona secara horizontal dan 4 zona secara vertikal-horizontal. Semakin tinggi tingkat akurasi yang dihasilkan maka semakin baik performa sistem dalam mengklasifikasikan suatu objek. 3.4.5 Perancangan Alat Uji Kebutuhan fungsional dari prototype sistem yang akan dibuat adalah sistem mampu menerjemahkan kata dalam aksara Jawa menjadi tulisan latin. Input yang dimasukkan kedalam sistem berupa citra nama jalan beraksara Jawa kemudian akan memberikan output berupa terjemahan tulisan latinnya. Sistem dibuat menggunakan Matlab sebagai tool untuk membangun alat uji. 3.4.6 Implementasi Pada tahap implementasi, tahapan pengolahan data dan perancangan alat uji akan diimplementasikan menjadi sebuah code dengan memanfaatkan Matlab sebagai tools untuk membuat prototype sistem. Sebagai dasar atau alur pemikiran dalam menerjemahkan langkah penelitian menjadi sebuah code maka masing-masing tahapan dapat dituliskan menjadi sebuah algoritma sebagai berikut: a. Projection Profile Vertical Projection Step 1: inisialisasi citra masukan inImage adalah berupa citra biner, vert adalah vektor hasil vertical projection Step 2: hitung jumlahan nilai pixel setiap baris pada masing-masing kolom ke dalam matrik v_proj
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 41
Step 3: inisialisasi matrik bernilai 0 (zeros) berdimensi 1 x panjang kolom citra masukan Step 4: lakukan perulangan i=2 sampai panjang matriks v_proj-1, jika ya lakukan step 5 sampai 7, jika tidak ke step 8 Step 5: Cek apakah v_proj ke i sama dengan 0, jika ya ke step 6, jika tidak ke step 8 Step 6: Cek apakah v_proj ke i+1 tidak sama dengan 0, jika ya maka objek terletak pada kolom ke i+1, simpan letak objek ke variable v_line, jika tidak ke step 7 Step 7: Cek apakah v_proj ke i-1 tidak sama dengan 0, jika ya maka objek terletak pada kolom ke i-1, simpan letak objek ke variable v_line Step 8: nilai vert sama dengan v_line Step 9: selesai Horizontal Projection Step 1: inisialisasi citra masukan inImage adalah berupa citra biner, horz adalah vektor hasil horizontal projection Step 2: hitung jumlahan nilai pixel setiap kolom pada masing-masing baris ke dalam matrik h_proj Step 3: inisialisasi matrik bernilai 0 berdimensi 1 x panjang baris citra masukan Step 4: lakukan perulangan i=2 sampai panjang matriks h_proj-1, jika ya lakukan step 5 sampai 7, jika tidak ke step 8 Step 5: Cek apakah h_proj ke i sama dengan 0, jika ya ke step 6, jika tidak ke step 8 Step 6: Cek apakah h_proj ke i+1 tidak sama dengan 0, jika ya maka objek terletak pada baris ke i+1, simpan letak objek ke variable h_line, jika tidak ke step 7 Step 7: Cek apakah h_proj ke i-1 tidak sama dengan 0, jika ya maka objek terletak pada baris ke i-1, simpan letak objek ke variable h_line Step 8: nilai horz sama dengan h_line Step 9: selesai
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 42
b. Ekstraksi ciri ICZ-ZCZ Step 1: mencari koordinat centroid citra input Step 2: membagi citra ke dalam n daerah yang sama Step 3: menghitung jarak centroid dengan pixel citra yang ada pada daerah tersebut Step 4: hitung rerata jarak pada daerah tersebut Step 5: ulangi langkah 3-4 sampai semua daerah yang ada Step 6: cari koordinat centroid untuk setiap daerah Step 7: menghitung jarak centroid dengan pixel citra yang ada pada daerah tersebut Step 8: hitung rerata jarak pada daerah tersebut Step 9: ulangi langkah 7-8 sampai semua daerah yang ada. Jika sudah lanjut ke step 10 Step 10: Simpan hasil perhitungan jarak sebagai ciri dari objek tersebut
c. Pengukuran jarak antara data uji dengan template Step 1: inisialisasi variabel temp = selisih fitur template baris pertama dengan fitur objek Step 2: hitung jarak pada step 1, simpan ke variabel mind_dist Step 3: inisialisasi variabel min_idx = 1 Step 4: inisialisasi n = jumlah template Step 5: lakukan perulangan untuk n=2 sampai panjang database template, jika ya lakukan step 6 sampai 10, jika tidak ke step 11 Step 6: inisialisasi temp_2 = selisih fitur template ke n dengan fitur objek, lalu Step 7: hitung jarak pada step 6, simpan ke variabel dist Step 8: Jika dist kurang dari min_dist maka ke step 9, jika tidak ke step 5 Step 9: nilai min_dist sama dengan dist Step 10: nilai min_idx = n Step 11: selesai
d. Proses postprocessing Step 1: inisialisai variabel width = panjang string masukan hasil klasifikasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 43
Step 2: lakukan perulangan dari i=1 sampai width, lakukan step 4 sampai 10, jika tidak ke step 11 Step 3: jika i lebih dari 3 dan i kurang dari width, lakukan step 4, jika tidak ke step 10 Step 4: jika string ke i adalah taling, lanjut ke step 5, jika tidak ke step 6 Step 5: jika string ke i+1 adalah tarung, ubah string terakhir menjadi berakhiran o Step 6: ubah string string ke i+1 menjadi berakhiran e Step 7: cek apakah string i+1 adalah pasangan_ha, jika ya maka string ke i dijadikan konsonan, jika tidak ke step 8 Step 8: cek apakah string i+1 adalah pasangan_sa, jika ya maka string ke i dijadikan konsonan, jika tidak ke step 9 Step 9: cek apakah string i+1 adalah pasangan_pa, jika ya maka string ke i dijadikan konsonan, jika tidak ke step 10 Step 10 : gabungkan nilai string ke i ke variabel finalString Step 11: selesai
3.5
Desain Alat Uji Prototype sistem pengenalan pola kata beraksara Jawa yang akan dibangun memiliki desain interface seperti pada gambar dibawah ini.
Gambar 3.5 Desain Interface Sistem
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 44
Secara garis besar, desain interface sistem pada Gambar 3.3 dibagi menjadi 3 bagian penting, yaitu header untuk meletakkan judul, kemudian body sebagai bagian untuk meletakkan fungsi utama dari sistem dan terakhir footer untuk memberikan informasi tambahan diluar fungsi utama mengenai sistem yang dibuat.
3.6
Pengujian (Testing) Pada tahap pengujian, citra nama jalan akan digunakan sebagai input untuk sistem untuk diterjemahkan dari aksara Jawa ke huruf latin. Jumlah pengujian yang dilakukan sebanyak 30 kali yang sesuai dengan jumlah bahan citra yang diperoleh. Dari 30 citra masukan akan dihitung berapa banyak hasil terjemahan yang benar kemudian menghitung tingkat akurasi sistem dalam menerjemahkan aksara Jawa ke huruf latin.
3.7
Pengukuran Akurasi Sistem Kemampuan sistem dalam menerjemahkan kata dalam bentuk aksara Jawa menjadi tulisan latin harus bisa diukur dengan menghitung nilai akurasinya. Cara mengukur tingkat akurasi yaitu dengan membandingkan objek yang dikenali dengan benar oleh sistem dengan jumlah data testing dikalikan dengan 100 persen. Nilai tingkat akurasi yang tinggi menunjukkan bahwa sistem yang dibuat cukup baik untuk menerjemahkan kata dalam aksara Jawa menjadi tulisan latin.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB IV HASIL DAN ANALISA
Pada bab ini akan diuraikan masing-masing tahapan dari transliterasi nama jalan beraksara Jawa. Secara umum tahapan yang dikerjakan seperti pada Gambar 3.1 tentang blok diagram yang dibagi menjadi 6 bagian, yaitu data acquisition, preprocessing, feature extraction and selection, classification, postprocessing dan evaluation. Untuk tahapan dalam pembuatan template terdapat sedikit perbedaan yang hanya terdiri dari 4 proses, yaitu setelah proses feature extraction and selection dilanjutkan ke tahap pembuatan database template. 4.1
Data Acquisition Data berupa citra nama jalan yang digunakan pada penelitian ini diambil menggunakan kamera smarthpone dengan resolusi sebesar 4096 x 2304 pixels. Data citra yang diambil sebanyak 130 buah yang dibagi menjadi 100 citra untuk data template dan 30 citra untuk data uji. Waktu pengambilan citra pada waktu pagi atau siang hari dengan pencahayaan cukup terang. Daerah tempat pengambilan citra berada di daerah Kota Yogyakarta.
Gambar 4.1 Citra Jalan Pajeksan
45
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 46
Gambar 4.1 adalah citra nama Jalan Pajeksan. Citra tersebut diambil pada tanggal 8 April 2017 pada pukul 14:59 WIB. Jarak pengambilan gambar kurang lebih 50 cm dari tiang nama jalan.
4.2
Preprocessing Tahap preprocessing dilakukan untuk mempersiapkan data agar siap untuk diolah untuk tahap selanjutnya (ekstraksi ciri). Proses preprocessing ini dibagi menjadi 5 tahapan seperti pada Gambar 3.2 tentang preprocessing modules, yaitu cropping, grayscaling, binarization, image segmentation dan resizing. 4.2.1 Cropping Citra nama jalan yang diperoleh memiliki 2 tulisan, yaitu tulisan berbahasa Indonesia pada bagian atas dan tulisan beraksara Jawa di bagian bawah. Data citra yang akan dipakai pada penelitian ini adalah citra aksara Jawa saja sehingga perlu dilakukan proses pemotongan menggunakan photoshop untuk mendapatkan citra aksara Jawa. Proses pemotongan citra (cropping) dilakukan untuk semua data yang digunakan sebagai template database maupun sebagai data uji (testing). B = imread('../Citra nama jalan/testing/pajeksan.jpg');
Gambar 4.2 Pemotongan Citra Jalan Pajeksan Gambar 4.2 merupakan citra hasil cropping pada Gambar 4.1 dengan mengambil bagian citra yang hanya memiliki aksara Jawa saja. Proses cropping dilakukan karena data penelitian yang akan digunakan adalah citra aksara Jawa. Setelah dilakukan proses cropping, maka ukuran citra sekarang menjadi 483 x 2353 pixels.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 47
4.2.2 Grayscaling Data citra yang sudah dipotong kemudian akan kita ambil objek dari citra tersebut (aksara Jawa) terhadap latar (background) dengan mengubah citra tersebut menjadi citra abu-abu (grayscale) lalu diubah lagi menjadi citra hitam-putih (biner/black and white). Langkah pertama, yaitu mengubah citra menjadi keabuan (grayscale) menggunakan fungsi rgb2gray() pada Matlab. B = imread('../Citra nama jalan/testing/pajeksan.jpg'); im_gray = rgb2gray(B); imshow(im_gray);
Gambar 4.3 Citra Abu-Abu Jalan Pajeksan Gambar 4.3 merupakan representasi dari citra keabuan yang diperoleh dengan mengubah Gambar 4.2. Hal tersebut dapat dibuktikan dengan nilai variabel im_gray yang sebelumnya nilai variabel B adalah 483x2353x3
uint8
menjadi
483x2353
uint8
yang
menandakan citra tersebut terdiri dari 1 komponen warna. 4.2.3 Binarization Proses binerisasi (binarization) merupakan lajutan dari proses grayscaling yang bertujuan untuk mendapatkan objek citra terhadap latar. Untuk mengubah citra abu-abu menjadi citra biner dapat dilakukan dengan menggunakan fungsi im2bw() pada Matlab. Dengan melakukan konversi ke citra biner ini maka objek citra dapat dinyatakan sebagai bagian dari citra yang berwarna putih sedangkan bagian latar merupakan bagian dari citra yang berwarna hitam. B = imread('../Citra nama jalan/testing/pajeksan.jpg'); im_gray = rgb2gray(B); im_bw = im2bw(im_gray); imshow(im_bw);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 48
Gambar 4.4 Citra Biner Jalan Pajeksan Gambar 4.4 merupakan representasi dari citra biner yang diperoleh dengan mengubah citra abu-abu pada Gambar 4.3. Hal tersebut dapat dibuktikan dengan nilai variabel im_gray adalah 483x2353 uint8 menjadi 483x2353 logical yang artinya citra tersebut terdiri dari nilai 1 dan 0. Nilai 1 merepresentasikan warna putih sedangkan nilai 0 merepresentasikan warna hitam. 4.2.4 Image Segmentation Salah satu karakteristik dari penulisan aksara Jawa adalah bersifat sylabic (kesukukataan). Satu aksara merupakan satu suku kata yang jika dirangkai bersama dengan aksara yang lain maka membentuk suatu kata ataupun kalimat. Sebelum sampai tahap untuk mengenali terjemahan aksara tersebut tentunya kita harus memisahkan antar suku kata yang menyusunnya. Setelah dapat kita pisahkan selanjutnya kita bisa melakukan proses pengenalan pada masing-masing suku kata/aksara tersebut. Input yang dipakai dalam proses segmentasi adalah citra biner (hitam-putih). Objek citra yang berwarna putih merupakan representasi dari aksara yang akan dipisahkan satu per satu terhadap keseluruhan aksara yang ada. Cara untuk memisahkan masing-masing aksara adalah menggunakan projection profile. function [ vert ] = verProj( inImage ) ... v_proj = sum(inImage,1); for i=2 : v_length-1 if v_proj(i)==0 if v_proj(i+1)~=0 v_line(c) = x_val(i+1); elseif v_proj(i-1)~=0 v_line(c) = x_val(i-1); end else
function [ horz ] = horzProj( inImage ) ... h_proj = sum(inImage,2); for i=2 : h_length-1 if h_proj(i)==0 if h_proj(i+1)~=0 h_line(c) = y_val(i+1); else if h_proj(i-1)~=0 h_line(c) = y_val(i-1); end else
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 49
if i==2 ... elseif i==v_length-1 ... end
if i==2 ... elseif i==h_length-1 ... end
Terdapat 2 tahapan dalam metode projection profile, yaitu proyeksi secara verikal (vertical projection) dan proyeksi secara horizontal (horizontal projection). Fungsi verProj() dan horzProj() digunakan untuk mencari posisi atau letak line image suatu citra. Citra masukan sudah diubah menjadi citra biner, sehingga ketika nilai pixelnya adalah 1 maka menandakan di bidang tersebut terdapat image kemudian ketika ada perubahan nilai pixel dari 1 ke 0 atau 0 ke 1 menandakan adanya 1 buah objek pada bidang tersebut. Perbedaan antara
verProj()
dan
horzProj()
terletak
pada
cara
memproyeksikan gambar, verProj() akan memproyeksikan citra secara vertikal sedangkan horzProj() akan memproyeksikan citra secara horizontal. Keluaran dari proses verProj() adalah sebuah matriks yang merepresentasikan letak atau posisi objek dalam bidang. Panjang matriksnya adalah 1 x 2n dengan n adalah jumlah objek, atau dengan kata lain jumlah objek dalam bidang sama dengan panjang matriks dibagi dengan 2. Fungsi horzProj() adalah menetukan batas paling bawah dan atas dari objek sehingga secara tepat setiap aksara dapat dipisahkan dengan baik serta membuang background yang tidak perlu. Dengan mengetahui letak objeknya maka kita dapat melakukan proses cropping secara otomatis untuk memperoleh objeknya. Pemotongan citra dilakukan menggunakan fungsi imcrop() pada Matlab dengan masukan matriks hasil dari vertical projection dan horizontal projection. Untuk dapat memperoleh tiap aksara secara otomatis maka fungsi verProj() dan horzProj() tersebut digabungkan menjadi satu ke dalam fungsi syllable_recognizer() dengan masukan berupa citra hitam-putih.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 50
function [ transliteration ] = syllable_recognizer( im_bw ) ... row = size(im_bw,1); [v_line] = verProj(im_bw); for i=1:2:length(v_line) im_vline = imcrop(im_bw,[v_line(1) 1 v_line(2)-v_line(1) row]); [h_line] = horzProj(im_vline); if length(h_line) == 4 ... elseif length(h_line) == 6 ... else im_hline = imcrop(im_vline, [1 h_line(1) v_line(2)-v_line(1) h_line(2)-h_line(1)]); end ...
Fungsi syllable_recognizer()
diatas menerapkan prinsip
projection profile untuk melakukan segmentasi terhadap setiap objek karakter aksara Jawa pada citra. Setiap citra yang digunakan sebagai template (training) dan testing dikenai projection profile sehingga secara visual dapat dinyatakan sebagai berikut: B = imread('../Citra nama jalan/testing/pajeksan.jpg'); im_gray = rgb2gray(B); im_bw = im2bw(im_gray); t = syllable_recognizer(im_bw);
Gambar 4.5 Projection Profile dari Citra Jalan Pajeksan Gambar
4.5
merupakan
represenrasi
citra
hasil
segmentasi
menggunakan fungsi syllable_recognizer() yang dikenakan pada Gambar 4.4. Dari hasil segmentasi tersebut dapat dilihat bahwa Gambar 4.4 tersusun dari 8 aksara. Secara visual, jika dibangingkan dengan citra asli pada Gambar 4.5 maka citra hasil segmentasi dapat dikatakan berhasil karena masing-masing aksara dapat dipisahkan dengan sempurna. Tidak semua data uji yang dikenai segmentasi memperoleh hasil yang baik, artinya terdapat aksara yang tidak dapat dipisahkan secara
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 51
sempurna dengan aksara lainnya. Sebagai contoh kita dapat melihat citra data uji Jalan Langensari dan hasil segmentasinya sebagai berikut: B = imread('../Citra nama jalan/testing/langensari.jpg'); im_gray = rgb2gray(B); im_bw = im2bw(im_gray); imshow(im_bw);
Gambar 4.6 Citra Biner Jalan Langensari Gambar 4.6 merupakan representasi citra hitam-putih Jalan Langensari yang berukuran 482 x 2354 pixels. Proses selanjutnya adalah melakukan segmentasi untuk memperoleh tiap aksara yang menyusun citra tersebut dengan menggunakan fungsi syllable_recognizer. B = imread('../Citra nama jalan/testing/langensari.jpg'); im_gray = rgb2gray(B); im_bw = im2bw(im_gray); t = syllable_recognizer(im_bw);
Gambar 4.7 Projection Profile dari Citra Jalan Langensari Berdasarkan Gambar 4.7 dapat disimpulkan bahwa pada bagian dua aksara terakhir, yaitu pasangan sa dan aksara ri tidak terpisahkan dengan baik. Hal tersebut bisa terjadi karena penulisan aksara tersebut tidak terpisah dengan baik atau saling berdekatan sehingga ada bagian yang tumpang tindih. Jika kita lihat secara visual, berdasarkan Gambar 4.6 citra Jalan Langensari terdiri dari 8 suku kata, tetapi hasil segmentasi pada Gambar 4.7 menghasilkan hanya 7 suku kata saja. Hal tersebut terjadi karena ada dua suku kata yang menyatu. Keterbatasan segmentasi menggunakan projection profile adalah objek-objek yang ada pada citra harus terpisah secara sempurna, setidaknya memiliki
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 52
jarak yang cukup antar objeknya sehingga tidak ada yang tumpang tindih atau menyatu. 4.2.5 Resizing Berdasarkan hasil dari proses projection profile terhadap citra pada Gambar 4.5 dan Gambar 4.7 dapat kita lihat bahwa hasil segmentasi terhadap citra memiliki ukuran yang berbeda-beda. Hal tersebut bisa terjadi karena terdapat variasi aksara antara aksara asli (legena), aksara legena yang diberi sandhangan, aksara legena yang memiliki pasangan maupun gabungan keduanya. Untuk mempermudah proses ekstraksi ciri dan klasifikasi maka semua aksara, baik pada data training maupun testing akan ditentukan ukurannya sehingga setiap aksara mempunyai ukuran yang sama. Untuk melakukan proses pengubahan ukuran aksara (resizing) dapat dikerjakan dengan menggunakan fungsi imresize() pada Matlab. Ukuran setiap citra kita tentukan sendiri, sehingga untuk penelitian kali ini ditetapkan 100 x 110 pixel. function [ transliteration ] = syllable_recognizer( im_bw ) ... aksara = imresize(im_hline, [100 110]); imshow(aksara); ...
Pemilihan ukuran tersebut dipilih karena untuk mempermudah dalam proses pembagian zona yang akan dikerjakan dalam proses ekstraksi ciri yang akan dibagi ke dalam 4 zona secara horizontal dan 4 zona secara vertikal-horizontal. Secara visual, hasil dari proses resizing dapat dinyatakan sebagai berikut: B = imread('../Citra nama jalan/testing/langensari.jpg'); im_gray = rgb2gray(B); im_bw = im2bw(im_gray); t = syllable_recognizer(im_bw);
Gambar 4.8 Citra Jalan Pajeksan Hasil Resizing
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 53
Gambar 4.8 merupakan citra yang sama dengan Gambar 4.5, yaitu citra hasil segmentasi dari Gambar 4.4, hanya saja yang membedakan adalah hasil segmentasi citra diatas sudah dikenai proses resizing sehingga setiap aksara yang diperoleh mempunyai ukuran yang sama. Proses resizing diperlukan untuk mempermudah dalam membagi zona citra dan menghitung nilai feature dari masing-masing citra.
4.3
Feature Extraction and Selection Kemampuan sistem untuk mengkasifikasikan objek akan lebih efektif dan cepat ketika kita bisa mendapatkan ciri yang bisa membedakan objek satu dengan objek lainnya dibandingkan dengan menggunakan seluruh informasi dari objek yang ada. Dengan memilih ekstraksi ciri yang tepat maka secara langsung akan mengurangi dimensi data yang akan diolah sehingga akan meringankan beban memory, running time relatif cepat dan mengurangi kompleksitas algortima untuk proses klasifikasi. Proses ektraksi ciri dilakukan untuk semua data yang akan diolah, yaitu untuk data training (template) dan data testing. Ektraksi yang dipakai pada penelitian ini adalah ICZ-ZCZ (Image Centroid and Zone-Zone Centroid and Zone). Pada dasarnya, ekstraksi ciri ini terdiri dari 2 jenis yang digabungkan menjadi satu, yaitu ekstraksi ciri ICZ dan ekstraksi ciri ZCZ. Untuk memperoleh fitur dari objek kita perlu mencari terlebih dahulu pusat massa (centroid) dari objek tersebut. Persamaan untuk mencari centroid dapat dilihat pada persamaan 2.5 dan persamaan 2.6. function [ xc, yc ] = imcentroid( inimage ) ... for i = 1 : x for j = 1 : y if inimage(i, j) == 1 xc = xc + j; yc = yc + i; totalPixel = totalPixel + 1; ... xc = xc / totalPixel; yc = yc / totalPixel;
...
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 54
Pada fungsi diatas, titik centroid atau titik pusat massa sumbu x dan y pada suatu citra dapat diperoleh dengan mengalikan nilai pixel yang bernilai 1 dengan posisi pixel pada sumbu x dan y. Setelah diperoleh hasil perkaliannya kemudian dijumlahkan untuk setiap sumbunya. Oleh karena jika suatu bilangan dikalikan dengan 1 adalah bilangan itu sendiri maka persamaan 2.5 dan 2.6 dapat disederhanakan menjadi cukup menjumlahkan posisi koordinat pixel yang bernilai 1 untuk masing-masing sumbu x dan y. Hasil total dari penjumlahan posisi pixel objek pada sumbu x dan y kemudian dibagi dengan total pixel pada objek citra tersebut sehingga diperoleh titik 𝑥𝑐 dan 𝑦𝑐 yang merupakan titik centroid untuk sumbu x dan y. Citra yang digunakan pada penelitian ini berukuran 100 x 110 pixel sehingga dapat dibagi menjadi 4 bagian zona sama besar secara horizontal masing-masing 25x110 pixels dan 4 zona secara vertikal-horizontal yang masing-masing berukuran 50x55 pixels. function [ z1, z2, z3, z4 ] = icz( inimage ) [cx, cy] = imcentroid(imnew); ... for i = 1 : row for j = 1 : col if imnew(i, j) == 1 if (i <= 25) dist = sqrt((j-cx)^2 + (i-cy)^2); sumdistz1 = sumdistz1 + dist; totalpixz1 = totalpixz1 + 1; elseif (i > 25) && (i <= 50) ... elseif (i > 50) && (i <= 75) ... els ... z1 = sumdistz1 / totalpixz1; ...
Fungsi icz() mempunyai input sebuah citra biner dan memiliki 4 output sesuai dengan jumlah zona yang akan membagi citra. Cara kerja fungsi ini yaitu mencari nilai rata-rata jarak antara nilai pixel objek citra terhadap titik centroid-nya. Pertama dengan memanggil fungsi imcentroid() untuk memperoleh titik centroid citra tersebut. Kedua, menghitung jarak antara objek (nilai pixel yang bernilai 1) terhadap centroid-nya menggunakan rumus euclidean distance, seperti pada persamaan 2.7. Nilai jarak tersebut akan di
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 55
total untuk setiap zonanya kemudian dibagi dengan jumlah pixel yang ada di tiap zona. Hal tersebut dilakukan sebanyak zona yang ada. Hasil dari rata-rata nilai jarak pixel objek terhadap centroid pada masing-masing zona itulah yang menjadi feature dari objek citra. function [ z1, z2, z3, z4 ] = zcz( inimage ) ... I1=imnew(1:25,:); [ cx, cy ] = imcentroid(I1); for i = 1 : row for j = 1 : col if I1(i, j) == 1 dist = sqrt((j-cx)^2 + (i-cy)^2); sumdistz1 = sumdistz1 + dist; totalpixz1 = totalpixz1 + 1; ... I2=imnew(26:50,:); [ cx, cy ] = imcentroid(I2); ... I3=imnew(51:75,:); [ cx, cy ] = imcentroid(I3); ... I4=imnew(76:100,:); [ cx, cy ] = imcentroid(I4); ... z1 = sumdistz1 / totalpixz1; ...
Fungsi zcz() mempunyai input sebuah citra biner dan memiliki 4 output sesuai dengan jumlah zona yang akan membagi citra. Cara kerja fungsi ini yaitu membagi objek menjadi 4 zona kemudian mencari titik centroid di masing-masing zona menggunakan fungsi imcentroid(). Setelah titik centroid ditemukan lalu menghitung nilai jarak pixel objek terhadap titik centroid-nya di setiap zona. Untuk menghitung jarak menggunakan euclidean distance, seperti pada persamaan 2.7. Nilai jarak yang diperoleh kemudian di total lalu di bagi dengan nilai total pixel di masing-masing zona. Nilai ratarata jarak objek citra tehadap centroid di masing-masing zona inilah yang menjadi feature objek. function [ feature ] = feature_extraction( inImage ) [z1 z2 z3 z4] = icz(inImage); [z5 z6 z7 z8] = zcz(inImage); feature = [z1 z2 z3 z4 z5 z6 z7 z8]; end
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 56
Setelah diperoleh nilai feature menggunakan fungsi icz() dan zcz() lalu nilai-nilai feature tersebut digabungkan sehingga menjadi 8 feature yang merepresentasikan
objek
tersebut
menggunakan
fungsi
feature_extraction()yang memiliki parameter sebuah citra biner. Sebagai contoh, untuk citra Jalan Pajeksan pada Gambar 4.8 yang diekstrak cirinya menggunakan metode ICZ-ZCZ diperoleh nilai features sebagai berikut:
Gambar 4.9 Nilai Features dari Citra Jalan Pajeksan Gambar 4.9 adalah nilai fitur dari hasil ekstraksi ciri citra nama Jalan Pajeksan pada Gambar 4.8 menggunakan ICZ-ZCZ yang dibagi menjadi 4 zona secara horizontal. Terdapat 8 baris dengan setiap barisnya memiliki 8 nilai features yang mewakili nilai ciri dari 8 objek aksara pada Gambar 4.8. Hal yang dapat disimpulkan dalam proses ekstraksi ciri ini adalah ICZ bekerja dengan mencari titik centroid-nya terlebih dahulu kemudian citra dibagi kedalam n zona yang sama sehingga akan didapatkan satu titik centroid sedangkan ZCZ membagi n zona citra kemudian masing-masing zona dicari titik centroid-nya sehingga didapatkan centroid sebanyak jumlah zona yang ada. ICZ-ZCZ merupakan gabungan dari kedua ekstraksi ciri tersebut sehingga hasil dari ekstraksi cirinya akan diperoleh sebanyak 2n fitur.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 57
4.4
Pembuatan Template Database Model atau metode pengenalan pola pada penelitian ini menggunakan pendekatan template matching. Pendekatan template matching dipilih karena paling mudah untuk diterapkan. Prinsip pendekatan template matching untuk klasifikasi adalah mengukur kedekatan / kesamaan (similarity) antar objek atau entities yang diperbandingkan. Objek yang diperbandingkan adalah data uji yang akan dikenali dengan template yang sudah disimpan. Data yang akan digunakan untuk membuat template database adalah citra nama jalan namun data yang dipakai berbeda dengan data yang digunakan untuk data uji (testing). Jumlah citra yang digunakan untuk pembuatan template database sekitar 100 buah. Dari jumlah citra tersebut dapat dibuat 100 aksara untuk database template. Langkah-langkah dalam pembuatan template database seperti pada blok diagram pada Gambar 3.1 dan blok diagram pada Gambar 3.2.
Gambar 4.10 Citra Jalan Menteri Supeno Gambar 4.10 adalah citra nama Jalan Menteri Supeno. Citra diambil menggunakan kamera smarthpone dengan resolusi sebesar 4096 x 2304 pixels. Citra tersebut diambil pada tanggal 22 Januari 2017 pada pukul 06:39 WIB. Jarak pengambilan gambar kurang lebih 50 cm dari tiang nama jalan. Proses selanjutnya adalah cropping untuk mengambil objek tulisan dengan aksara Jawa. Untuk data template, proses cropping yang dilakukan sedikit berbeda dengan data uji, yaitu citra aksara dipotong per aksara. Sebagai contoh, kita akan menyimpan aksara su pada citra Jalan Menteri
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 58
Supeno, maka kita hanya melakukan cropping pada suku kata su yang terdapat pada citra. inImage = imread('../Citra nama jalan/training/su.jpg');
Gambar 4.11 Hasil Cropping Citra Jalan Menteri Supeno Gambar 4.11 merupakan citra hasil cropping pada Gambar 4.10 untuk mendapatkan suku kata su yang akan disimpan sebagai database template. Setelah di-crop maka ukuran citra aksara su adalah 330 x 223 pixels. Setelah proses cropping, maka dari citra berwarna akan diubah menjadi citra abu-abu. Fungsi untuk mengubah citra berwarna menjadi citra abu-abu atau grayscale menggunakan fungsi rgb2gray() pada Matlab. inImage = imread('../Citra nama jalan/training/su.jpg'); im_gray = rgb2gray(inImage); imshow(im_gray);
Gambar 4.12 Citra Abu-Abu Aksara Su Gambar 4.12 merupakan representasi dari citra keabuan yang diperoleh dengan mengubah Gambar 4.1. Hal tersebut dapat dibuktikan dengan nilai variabel im_gray yang sebelumnya nilai variabel B adalah 330x223x3 uint8 menjadi 330x223 uint8 yang menandakan citra tersebut terdiri dari 1 komponen warna. Tahap selanjutnya adalah mengubah citra abu-abu menjadi citra biner. Fungsi untuk mengubah citra abu-abu menjadi citra biner atau citra hitamputih menggunakan fungsi im2bw() pada Matlab.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 59
inImage = imread('../Citra nama jalan/training/su.jpg'); im_gray = rgb2gray(inImage); im_bw = im2bw(im_gray); imshow(im_bw);
Gambar 4.13 Citra Biner Aksara Su Gambar 4.13 merupakan representasi dari citra biner yang diperoleh dengan mengubah citra abu-abu pada Gambar 4.12. Hal tersebut dapat dibuktikan dengan nilai variabel im_gray adalah 330x223
uint8
menjadi
330x223 logical yang artinya citra tersebut terdiri dari nilai 1 dan 0. Nilai 1 merepresentasikan warna putih sedangkan nilai 0 merepresentasikan warna hitam. Setelah diperoleh citra hitam-putih maka tahap selanjutnya adalah membuang background yang tidak perlu agar citra yang diperoleh benarbenar tepat pada aksaranya saja sekaligus proses resizing citra supaya berukuran 100 x 110 pixels. Setelah proses resizing lalu tahap feature extraction menggunakan metode ICZ-ZCZ. Langkah ini merupakan proses yang sama ketika melakukan segmentasi terhadap citra data uji. Di dalam pembuatan template database ini, data yang disimpan bukanlah objek citranya namun feature dari objek citra yang diperoleh dari proses ekstraksi ciri menggunakan metode ICZ-ZCZ yang menghasilkan 8 features. Delapan features tersebut yang akan disimpan beserta labelnya pada database. inImage = imread('../Citra nama jalan/training/su.jpg'); im_gray = rgb2gray(inImage); im_bw = im2bw(im_gray); row = size(im_bw,1); [v_line] = verProj(im_bw); im_vline = imcrop(im_bw,[v_line(1) 1 v_line(2)-v_line(1) row]); [h_line] = horzProj(im_vline); if length(h_line) == 4 ... elseif length(h_line) == 6 ... else im_hline = imcrop(im_vline, [1 h_line(1) v_line(2)v_line(1) h_line(2)-h_line(1)]); end aksara = imresize(im_hline, [100 110]);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 60
imshow(aksara); feature = feature_extraction(aksara); db_aksara{17,1} = feature; db_aksara{17,2} = 'su';
Script diatas merupakan cara untuk menyimpan suatu data template ke dalam database template. Variabel inImage merupakan data citra template kemudian setelah melaui proses binarization maka akan dikenai proyeksi vertikal dan proteksi horizontal untuk mendapatkan objek aksaranya dan membuang bagian background yang tidak dibutuhkan. Selanjutnya diekstraksi cirinya dan disimpan nilai ciri tersebut ke database template bernama db_aksara. db_aksara{17,1} = feature menunjukkan bahwa nilai feature citra tersebut disimpan pada baris ke 17 kolom 1 sedangkan db_aksara{17,2} = 'su' menunjukkan bawah data pada baris ke 17 memiliki label su yang disimpan pada kolom ke 2. Dengan jumlah citra yang diperoleh untuk pembuatan template database terkadang tidak semua mencakup berbagai kombinasi aksara dalam literasi aksara Jawa sehingga perlu dibuat sebuah kombinasi aksara dengan menggabungkan aksara legena, sandhangan maupun pasangan yang diambil dari data template yang ada. Proses ini diperlukan untuk melengkapi beberapa suku kata yang dapat dibentuk dengan semua kata dasar yang berjumlah 20 aksara. Sebagai contoh, Gambar 4.10 merupakan citra Jalan Menteri Supeno, dalam database kita simpan aksara pe dan konsonan n akan tetapi dari semua data training (data template) belum ada aksara ne dan konsonan m sehingga kita bisa mengkombinasikan aksara na dengan pepet pada aksara pa supaya membentuk kata ne dan kombinasi aksara ma yang diberi pangkon supaya membentuk konsonan m sehingga semua aksara asli dengan pepet dan pangkon menjadi lengkap. Proses untuk membuat tambahan kombinasi aksara tersebut dilakukan menggunakan aplikasi Photoshop.
+
=
dibaca “ne”
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 61
+
=
dibaca “m”
Gambar 4.14 Pembuatan Kombinasi Aksara untuk Template Database Gambar 4.14 merupakan proses pembuatan kombinasi aksara Jawa untuk melengkapi beberapa aksara yang tidak termuat dalam citra data template. Adapun isi dari template database yang berisi nilai feature beserta labelnya adalah sebagai berikut:
Gambar 4.15 Feature Database dari Template beserta Label Gambar 4.15 merupakan isi dari template database yang berisikan nilai features beserta labelnya. Jumlah seluruh data template adalah 100 data yang disimpan dalam variabel db_aksara.
4.5
Classification Setelah melalui tahapan ekstraksi ciri maka kita mendapatkan nilai feature dari data testing dan pada data template (training). Nilai feature dari data uji tersebut akan dihitung jaraknya terhadap semua template database. Proses perhitungan jarak ini menggunakan euclidean distance, seperti pada persamaan 2.7. Sebagai contoh, pada Gambar 4.8 merupakan citra hasil
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 62
preprocessing untuk citra nama Jalan Pajeksan. Masing-masing objek dari citra tersebut akan diekstrak cirinya kemudian akan dilakukan proses perhitungan jarak dengan setiap data template. function [ transliteration ] = syllable_recognizer( im_bw ) ... feature = feature_extraction(aksara); db_size = size(db_aksara,1); temp = db_aksara{1,1} - feature; min_dist = sqrt(temp * temp'); ...
Jika kita menjalankan fungsi syllable_recognizer() dengan parameter citra biner Jalan Pajeksan maka yang pertama, kita bisa mengetahui nilai feature dari setiap objek, yaitu terdiri dari 8 objek citra seperti pada Gambar 4.9. Berdasarkan Gambar 4.9, kita akan menghitung nilai jarak feature objek pertama, yaitu [52.2161 37.5422 33.1642 46.7865 33.4379 34.5602 29.9238 28.8033] terhadap db_aksara{1,1} yang artinya feature pada template pada baris dan kolom ke 1.
Gambar 4.16 Nilai Feature pada Template Pertama Gambar 4.16 merupakan data template pertama yang berisi nilai feature dari objek aksara ga. Nilai feature tersebut akan dibandingkan dengan data uji untuk dihitung seberapa besar jarak antar keduanya. Proses penghitungan jarak menggunakan euclidean distance seperti pada Persamaan 2.7. 𝐷 = [(52.2161 − 46.1527) (37.5422 − 31.0533) (33.1642 − 33.6748) (46.7865 − 50.8807) (33.4379 − 28.2116) (34.5602 − 29.1534) (29.9238 − 27.3860) (28.8033 − 31.8002)] 𝐷 = [6.0634 6.4869 − 0.5106 − 4.0942 5.2263 5.5068 2.5378 − 2.9969] 𝑑1 = √(𝐷 ∗ 𝐷′) = √167.8367 = 12.9552
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 63
Hasil perhitungan jarak antara feature objek citra 1 pada data uji dengan data baris dan kolom ke-1 pada template menghasilkan nilai 12.9552. Hasil yang sama didapatkan melalui perhitungan program, yaitu seperti gambar berikut:
Gambar 4.17 Nilai Jarak Feature Objek Pertama Gambar 4.17 merupakan perhitungan jarak yang dikerjakan oleh sistem. Hasil yang didapatkan sama dengan perhitungan manual yang dilakukan, yaitu 12.9552. Model klasifikasi yang digunakan dalam penelitian ini adalah menggunakan template matching. Prinsip kerja pendekatan template matching adalah mengukur kedekatan atau kesamaan (similarity) antar objek atau entities yang diperbandingkan. Ketika akan sebuah data uji dibandingkan dengan database template kemudian diperoleh nilai jarak yang relatif kecil maka secara langsung objek baru tersebut dapat diklasifikasikan atau dikenali sesuai dengan template pembandingnya. Nilai yang diperbandingkan adalah nilai feature antara data testing dan template yang kemudian kita hitung nilai jaraknya terhadap kedua objek tersebut. function [ transliteration ] = syllable_recognizer( im_bw ) ... min_dist = sqrt(temp * temp'); index_min = 1; for n=2 : db_size temp2 = db_aksara{n,1} - feature; dist = sqrt(temp2 * temp2'); if dist < min_dist min_dist = dist; index_min = n; ...
Ketika nilai awal jarak antara data uji dengan template sudah diperoleh maka proses loop (perulangan) akan dilakukan untuk menguji pada semua template dengan menghitung jarak yang baru kemudian dibandingkan pada setiap iterasinya untuk mencari nilai jarak terkecil. Ketika nilai jarak terkecil sudah ditemukan maka program akan menyimpan nilai indeksnya kemudian mengembalikan nilai label template pada indeks tersebut. Proses looping akan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 64
berhenti ketika semua objek citra pada data uji sudah dibandingkan dengan semua template yang ada. Sebagai contoh, hasil dari klasifikasi citra Jalan Pajeksan pada Gambar 4.4 adalah sebagai berikut:
Gambar 4.18 Hasil Klasifikasi Citra Jalan Pajeksan Pada Gambar 4.18, jika kita cermati hasil tersebut sesuai dengan jumlah aksara yang menyusun kata Jalan Pajeksan yang berjumlah 8 aksara, seperti pada Gambar 4.8. Namun proses untuk mentransliterasikan aksara Jawa ke huruf latin masih belum selesai karena hasil klasifikasi tersebut belum sesuai dengan aturan penulisan tata bahasa yang benar.
4.6
Postprocessing Keluaran dari proses klasifikasi adalah pengenalan karakter tiap aksara. Pada tahap ini sebenarnya proses transliterasi belum dikatakan selesai karena kumpulan suku kata dari hasil pengenalan karakter/aksara masih saling terpisah, belum dikelompokkan ke dalam konteks tertentu agar membentuk kata, kalimat atau informasi yang memiliki arti. Konteks penelitian ini adalah mentranslasikan nama jalan beraksara Jawa sehingga hasil dari proses postprocessing adalah mengelompokkan karakter atau suku kata yang sudah dikenali untuk membentuk kata berupa nama jalan. Secara umum kumpulan suku kata yang berhasil dikenali akan dikelompokkan menjadi 2 atau 3 kelompok yang tersusun dari kata “dalan” (dalam bahasa Indonesia berarti “jalan”) kemudian diikuti nama jalan tersebut. width = length(inText); for i=1 : width if i > 3 && i < width if strcmp(inText{i},'taling') == 1 if strcmp(inText{i+2},'tarung') == 1 temp = inText{i+1};
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 65
temp(end)='o'; inText{i+1} = temp; inText{i} = ''; inText{i+2} = ''; else temp = inText{i+1}; temp(end)='e'; inText{i+1} = temp; inText{i} = ''; end elseif strcmp(inText{i+1},'pasangan_ha') == 1 inText{i+1} = 'ha'; temp = inText{i}; temp(end)=''; inText{i} = temp; elseif strcmp(inText{i+1},'pasangan_sa') == 1 ... elseif strcmp(inText{i+1},'pasangan_pa') == 1 ... elseif strcmp(inText{i},'kter') inText{i}='kter '; elseif strcmp(inText{i},'h') if strcmp(inText{i+1},'ma') inText{i}='h '; end elseif strcmp(inText{i},'ga') if strcmp(inText{i+1},'mu') inText{i}='ga '; end end fprintf('%s',inText{i}); else if i == 3 fprintf('%s ',inText{i}); else fprintf('%s',inText{i}); end ...
Fungsi diatas digunakan untuk mengelompokkan syllable (suku kata) menjadi 2 atau 3 kelompok sehingga membentuk kata tertentu. Kata yang dibentuk berupa nama jalan yang ada di Kota Yogyakarta. Kata pertama adalah dalan sedangkan kata kedua dan ketiga adalah nama jalan tersebut. Secara singkat, alur dari proses fungsi tersebut adalah menggabungkan 3 suku kata pertama yang membentuk kata dalan setelah konsonan n ditambah dengan spasi. Kemudian setelah lebih dari 3 kata akan dicek apakah terdapat sandhangan taling, jika ada maka akan mengecek lagi apakah karakter ketiganya adalah sandhangan tarung, jika ada maka suku kata kedua pada karakter terakhir diganti huruf vokal /o/ namun jika tidak ada tarung maka
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 66
suku kata kedua pada karakter terakhir diganti huruf vokal /e/. Hal tersebut sesuai dengan aturan penulisan aksara Jawa jika terdapat pasangan sandhangan taling dan tarung maka aksara yang diapit diubah bunyinya menjadi berakhiran /o/ tetapi jika hanya terdapat taling saja maka aksara yang di depannya diubah bunyinya menjadi berakhiran /e/. Hanya dua aksara sandhangan tersebut yang memiliki kekhususan karena ditulis sejajar dengan aksara utama sehingga diperlukan postprocessing untuk mengubah bunyi dari aksara yang dikenainya. Setelah aturan untuk sandhangan taling dan tarung maka terdapat kekhususan juga untuk pasangan ha, sa dan pa karena ditulis sejajar dengan aksara utama dibandingkan dengan pasangan yang lain yang ditulis dibawah. Prosesnya hampir sama, yaitu mengecek apakah aksara selanjutnya adalah pasangan ha, sa atau pa, jika ya maka aksara yang berada di depan pasangan tersebut dimatikan atau diubah menjadi konsonan kemudian diikuti dengan aksara pasangan tersebut. Mayoritas nama jalan yang ditemui hanya terdiri dari 2 kata, sebagian kecil ada yang sampai 3 kata. Kata yang pertama adalah dalan yang artinya “jalan” dalam bahasa Indonesia. Kata dalan tersusun dari 3 aksara sehingga setelahnya adalah nama jalan itu sendiri. Jika hanya terdiri dari 2 kata maka proses penggabungan kata yang kedua relatif lebih mudah dari pada yang mempunyai 3 kata. Untuk nama jalan yang memiliki 3 kata maka di dalam program sudah dituliskan aksara terakhir yang menyusun kata kedua agar dapat dipisahkan dengan aksara ketiga dan seterusnya. Dalam data uji hanya terdapat 3 buah data yang memiliki 3 kata, yaitu Jalan Margo Mulyo, Jalan Dokter Sutomo dan Jalan Gajah Mada. Untuk memisahkan kata kedua dengan ketiga kita hanya perlu mengambil suku kata terakhir dari kata kedua. Sebagai contoh untuk Jalan Dokter Sutomo kita ambil aksara terakhir dari akata kedua yaitu kter. Untuk Jalan Gajah Mada dan Jalan Margo Mulyo berturut-turut kita ambil aksara h dan ga. Jika menemui ketiga aksara tersebut maka secara otomatis diberi spasi setelahnya untuk memisahkan aksara selanjutnya. Hanya saja untuk yang berakhiran h dan ga harus dicek lagi apakah ada aksara setelahnya, jika ada maka akan diberi spasi namun jika tidak maka akan lanjut
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 67
ke baris berikutnya. Selain dari kemungkinan yang ada maka program akan mencetak tiap aksara yang ada untuk digabungkan. Sebagai contoh, Gambar 4.4 merupakan citra nama Jalan Pajeksan, maka hasil dari proses klasifikasi dapat dilihat pada Gambar 4.18. Setelah dikenai proses postprocessing maka hasilnya adalah sebagai berikut:
Gambar 4.19 Hasil Postprocessing Pada Gambar 4.19 menunjukkan hasil dari proses postprocessing citra Jalan Pajeksan pada Gambar 4.4 yang telah dikelompokkan dengan benar. Kata pertama membentuk dalan dan kata kedua membentuk pajeksan.
4.7
Evaluation Setelah sistem selesai dibuat maka diperlukan pengujian untuk menilai seberapa handal kinerja dari classifier-nya. Jika sistem memiliki nilai akurasi tinggi maka sistem dapat dikatakan handal, sebaliknya jika nilai akurasi kecil maka sistem tidak cukup handal untuk melakukan proses transliterasi. Performa atau unjuk kerja classifier dapat diukur dengan memberikan data testing menggunakan suatu objek baru untuk dikenali dengan jumlah 30 data. Hasil dari pengujian terhadap 30 data uji baru dapat dilihat dalam tabel di bawah ini. Tabel 4.1 Tabel Hasil Pengujian Menguunakan 4 Zona Secara Horizontal
No 1
Citra
Terjemahan Asli
Hasil
Jalan Balapan Dalan
Ket Benar
Balappan 2
Jalan Dagen
Dalan Dhagen
Benar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 68
3
Jalan Gajah
Dalan
Benar
Gajah 4
5
Jalan
Dalan
Glagahsari
Glagahsari
Jalan Ireda
Dalan
Benar
Benar
Iredha 6
7
8
Jalan
Dalan
Jogokaryan
Jagakaryan
Jalan
Dalan
Juminahan
Juminahhan
Jalan Juwadi
Dalan
Benar
Benar
Benar
Juwadi 9
Jalan Kenari
Dalan
Benar
Kenari 10
Jalan
Dalan
Benar
Kusumanegar Kusumaneg
11
a
ara
Jalan
Dahan
Langensari
Langenaran
Salah
g 12
13
Jalan
Dalan
Lokananta
Lokananta
Jalan Lowanu Dalan
Benar
Benar
Lowanu 14
Jalan Gajah
Dalan
Mada
Gajah Mada
Benar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 69
15
16
Jalan
Dalan
Malioboro
Maliyabara
Jalan Mangga Dalan
Benar
Benar
Mangga 17
18
19
Jalan
Dalan
Mangkuyuda
Mangkuyud
n
an
Jalan
Dalan
Modang
Modhang
Jalan Margo
Dalan
Mulyo
Marga
Benar
Benar
Benar
Mulya 20
Jalan Mutiara
Dalan
Benar
Mutiyara 21
Jalan
Dalan
Notowinatan
Natawinata
Benar
n 22
23
Jalan
Dalan
Pajeksan
Pajeksan
Jalan
Dalan
Parangtritis
Warangtriri
Benar
Salah
s 24
25
Jalan
Dalan
Perkutut
Perkutut
Jalan
Dalan
Surakarsan
Surakarsan
Benar
Benar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 70
26
Jalan Suripta
Dalan
Benar
Suripta 27
Jalan Dokter
Dalan
Sutomo
Dhokter
Benar
Sutama 28
Jalan Tribrata Dalan
Benar
Tribrata 29
30
Jalan
Dalan
Tunggarana
Tunggarana
Jalan Veteran
Dalan
Benar
Benar
Veteran
Berdasarkan rumus untuk menghitung akurasi yaitu Persamaan 2.8 maka nilai akurasi dari hasil dari pengujian pada Tabel 4.1 adalah sebagai berikut: 𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
∑ 𝑜𝑏𝑗𝑒𝑘 𝑦𝑎𝑛𝑔 𝑑𝑖𝑘𝑒𝑛𝑎𝑙𝑖 𝑑𝑒𝑛𝑔𝑎𝑛 𝑏𝑒𝑛𝑎𝑟 𝑥 100% ∑ 𝑠𝑒𝑚𝑢𝑎 𝑜𝑏𝑗𝑒𝑘
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
28 𝑥 100% = 93.33% 30
Secara umum, hasil akurasi sebesar 93.33% menunjukkan bahwa sistem yang dibuat cukup handal dalam melakukan proses transliterasi nama jalan beraksa Jawa yang berada di Kota Yogyakarta. Sebagai pembanding, jika mau dilihat secara lebih mendalam dengan sudut pandang yang berbeda maka kesalahan dalam proses transliterasi sebenarnya hanya beberapa karakter saja sehingga menyebabkan ketidaktepatan nama jalan secara keseluruhan terhadap nama jalan yang asli. Berikut merupakan hasil dari transliterasi yang tidak tepat terhadap nama jalan yang asli.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 71
Tabel 4.2 Tabel Kesalahan Transliterasi Tiap Aksara No
Nama Jalan
Nama Jalan Hasil
Jml. Aksara
Jml. Seluruh
Transliterasi
yang Salah
Aksara
1
Dalan Balapan
Dalan Balappan
0
8
2
Dalan Dagen
Dalan Dhagen
0
7
3
Dalan Gajah
Dalan Gajah
0
6
4
Dalan Glagahsari
Dalan Glagahsari
0
8
5
Dalan Ireda
Dalan Iredha
0
7
6
Dalan Jogokaryan
Dalan Jagakaryan
0
8
7
Dalan Juminahan
Dalan Juminahhan
0
9
8
Dalan Juwadi
Dalan Juwadi
0
6
9
Dalan Kenari
Dalan Kenari
0
6
Dalan
Dalan
Kusumanegara
Kusumanegara
0
9
11
Dalan Langensari
Dahan Langenarang 3
8
12
Dalan Lokananta
Dalan Lokananta
0
9
13
Dalan Lowanu
Dalan Lowanu
0
8
14
Dalan Gajah Mada
Dalan Gajah Mada
0
8
15
Dalan Malioboro
Dalan Maliyabara
0
8
16
Dalan Mangga
Dalan Mangga
0
5
Dalan
Dalan
Mangkuyudan
Mangkuyudan
0
8
Dalan Modang
Dalan Modhang
0
7
Dalan Margo
Dalan Marga Mulya
0
7
10
17 18 19
Mulyo
20
Dalan Mutiara
Dalan Mutiyara
0
7
21
Dalan Notowinatan
Datan Natawinatan
0
9
22
Dalan Pajeksan
Dalan Pajeksan
0
8
23
Dalan Parangtritis
Dalan Warangtriris
2
8
24
Dalan Perkutut
Dalan Perkutut
0
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 72
25
Dalan Surakarsan
Dalan Surakarsan
0
8
26
Dalan Suripta
Dalan Suripta
0
6
Dalan Dokter
Dalan Dhokter
Sutomo
Sutama
0
10
28
Dalan Tribrata
Dalan Tribrata
0
6
29
Dalan Tunggarana
Dalan Tunggarana
0
7
30
Dalan Veteran
Dalan Veteran
0
8
5
226
27
Total
Berdasarkan rumus untuk menghitung akurasi yaitu Persamaan 2.8 maka nilai akurasi dari hasil pada Tabel 4.2 adalah sebagai berikut: 𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
∑ 𝑜𝑏𝑗𝑒𝑘 𝑦𝑎𝑛𝑔 𝑑𝑖𝑘𝑒𝑛𝑎𝑙𝑖 𝑑𝑒𝑛𝑔𝑎𝑛 𝑏𝑒𝑛𝑎𝑟 𝑥 100% ∑ 𝑠𝑒𝑚𝑢𝑎 𝑜𝑏𝑗𝑒𝑘
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
221 𝑥 100% = 97.79% 226
Dari hasil penghitungan untuk proses transliterasi yang didasarkan pada pengenalan per aksara maka diperoleh nilai akurasi sebesar 97.79%. Kesalahan terjadi pada nama Jalan Langensari dan Jalan Parangtritis. Pada nama Jalan Langensari, hasil transliterasi pada kata pertama adalah dahan yang seharusnya berbunyi dalan. Kesalahan yang lain pada dua suku kata terakhir, yaitu sari yang dikenali sebagai satu suku kata rang karena pada proses segmentasi dua suku kata terakhir dikenali sebagai satu suku kata seperti pada Gambar 4.7. Pada nama Jalan Parangtritis, kesalahan transliterasi terjadi pada kata Warangtriris yang seharusnya adalah Parangtritis. Kesalahan tersebut terjadi pada suku kata pertama yang seharusnya pa namun dikenali sebagai wa dan suku kata terakhir yang seharusnya ti namun dikenali sebagai ri. Tabel 4.3 Tabel Nilai Jarak Citra Uji dengan Template Citra Template
Citra Hasil Segmentasi
Pa
Wa
Ti
Ri
Pa
2.32712
1.846651
29.26411
26.07683
Ti
26.808
25.18265
8.755004
2.417192
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 73
Berdasarkan hasil hitung jarak antara citra uji dengan template database maka dapat disimpulkan bahwa kesalahan dalam proses klasifikasi disebabkan karena diperoleh jarak minimum yang tidak sesuai dengan label aksara asli. Aksara pa justru memiliki jarak minimum dengan aksara wa dengan nilai 1.846651 dan aksara ti justru memiliki jarak minimum dengan aksara ri. Hal tersebut bisa terjadi karena tahapan yang dilakukan sebelum klasifikasi, yaitu proses ekstraksi ciri yang mungkin tidak cocok dengan karakteristik aksara Jawa yang memang memiliki banyak kemiripan sehingga perlu dilakukan model pembagian zona yang lain agar bisa membedakan antar aksara yang sangat mirip.
Aksara Pa Aksara Wa Aksara Ti Aksara Ri Gambar 4.20 Kemiripan Aksara Pa dan Wa serta Aksara Ti dan Ri Pada Gambar 4.20 dan Gambar 4.21 menunjukkan bahwa pembagian 4 zona secara horizontal masih kurang cocok untuk diterapkan karena beberapa aksara memiliki karakteristik yang hampir sama sehingga perlu dicoba untuk pembagian zona secara horizontal maupun vertikal. Tabel 4.4 Tabel Hasil Pengujian Menggunakan 4 Zona Secara Vertikal dan Horizontal No 1
Citra
Terjemahan Asli
Hasil
Jalan Balapan Dalan
Ket Benar
Balappan 2
Jalan Dagen
Dalan
Benar
Dhagen 3
Jalan Gajah
Dalan Gajah
Benar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 74
4
5
Jalan
Dalan
Glagahsari
Glagahsari
Jalan Ireda
Dalan
Benar
Benar
Iredha 6
7
8
Jalan
Dalan
Jogokaryan
Jagakaryan
Jalan
Dalan
Juminahan
Juminahhan
Jalan Juwadi
Dalan
Benar
Benar
Salah
Juwaki 9
Jalan Kenari
Dalan
Benar
Kenari 10
Jalan
Dalan
Benar
Kusumanegar Kusumaneg
11
a
ara
Jalan
Dalak
Langensari
Lyangennm
Salah
ar 12
13
Jalan
Dalan
Lokananta
Lokananta
Jalan Lowanu Dalan
Benar
Benar
Lowanu 14
15
Jalan Gajah
Dalan
Mada
Gajah Mada
Jalan
Dalan
Malioboro
Maliyabara
Benar
Benar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 75
16
Jalan Mangga Dalan
Benar
Mangga 17
18
19
Jalan
Dalan
Mangkuyuda
Mangkuyud
n
an
Jalan
Dalan
Modang
Modhang
Jalan Margo
Dalan
Mulyo
Marga
Benar
Benar
Benar
Mulya 20
Jalan Mutiara
Dalan
Benar
Mutiyara 21
Jalan
Dalan
Notowinatan
Natawinata
Benar
n 22
23
24
25
26
Jalan
Dalan
Pajeksan
Pajeksan
Jalan
Dalan
Parangtritis
Warangtritis
Jalan
Dalan
Perkutut
Perkutut
Jalan
Dalan
Surakarsan
Surakarsan
Jalan Suripta
Dalan Suripta
Benar
Salah
Benar
Benar
Benar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 76
27
Jalan Dokter
Dalan
Benar
Sutomo
Dhokter Sutama
28
Jalan Tribrata Dalan
Salah
Triprata 29
30
Jalan
Dalan
Benar
Tunggarana
Tunggarana
Jalan Veteran
Dalan
Benar
Veteran
Berdasarkan rumus untuk menghitung akurasi yaitu Persamaan 2.8 maka nilai akurasi dari hasil dari pengujian pada Tabel 4.4 adalah sebagai berikut: 𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
∑ 𝑜𝑏𝑗𝑒𝑘 𝑦𝑎𝑛𝑔 𝑑𝑖𝑘𝑒𝑛𝑎𝑙𝑖 𝑑𝑒𝑛𝑔𝑎𝑛 𝑏𝑒𝑛𝑎𝑟 𝑥 100% ∑ 𝑠𝑒𝑚𝑢𝑎 𝑜𝑏𝑗𝑒𝑘
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
26 𝑥 100% = 86.67% 30
Untuk melihat secara lebih detail letak kesalahan pengenalan tiap aksara dalam proses transliterasi maka berikut ini merupakan hasil dari transliterasi tiap aksara menggunakan pembagian 4 zona secara vertikal dan horizontal. Tabel 4.5 Tabel Kesalahan Transliterasi Tiap Aksara Menggunakan 4 Zona Secara Vertikal dan Horizontal No
Nama Jalan
Nama Jalan Hasil
Jml. Aksara
Jml. Seluruh
Transliterasi
yang Salah
Aksara
1
Dalan Balapan
Dalan Balappan
0
8
2
Dalan Dagen
Dalan Dhagen
0
7
3
Dalan Gajah
Dalan Gajah
0
6
4
Dalan Glagahsari
Dalan Glagahsari
0
8
5
Dalan Ireda
Dalan Iredha
0
7
6
Dalan Jogokaryan
Dalan Jagakaryan
0
8
7
Dalan Juminahan
Dalan Juminahhan
0
9
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 77
8
Dalan Juwadi
Dalan Juwaki
1
6
9
Dalan Kenari
Dalan Kenari
0
6
Dalan
Dalan
Kusumanegara
Kusumanegara
0
9
11
Dalan Langensari
Dalak Lyangenamar 4
8
12
Dalan Lokananta
Dalan Lokananta
0
9
13
Dalan Lowanu
Dalan Lowanu
0
8
14
Dalan Gajah Mada
Dalan Gajah Mada
0
8
15
Dalan Malioboro
Dalan Maliyabara
0
8
16
Dalan Mangga
Dalan Mangga
0
5
Dalan
Dalan
Mangkuyudan
Mangkuyudan
0
8
Dalan Modang
Dalan Modhang
0
7
Dalan Margo
Dalan Marga Mulya
0
7
10
17 18 19
Mulyo
20
Dalan Mutiara
Dalan Mutiyara
0
7
21
Dalan Notowinatan
Datan Natawinatan
0
9
22
Dalan Pajeksan
Dalan Pajeksan
0
8
23
Dalan Parangtritis
Dalan Warangtritis
1
8
24
Dalan Perkutut
Dalan Perkutut
0
7
25
Dalan Surakarsan
Dalan Surakarsan
0
8
26
Dalan Suripta
Dalan Suripta
0
6
Dalan Dokter
Dalan Dhokter
Sutomo
Sutama
0
10
28
Dalan Tribrata
Dalan Triprata
1
6
29
Dalan Tunggarana
Dalan Tunggarana
0
7
30
Dalan Veteran
Dalan Veteran
0
8
7
226
27
Total
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 78
Berdasarkan rumus untuk menghitung akurasi yaitu Persamaan 2.8 maka nilai akurasi dari hasil pada Tabel 4.5 adalah sebagai berikut: 𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
∑ 𝑜𝑏𝑗𝑒𝑘 𝑦𝑎𝑛𝑔 𝑑𝑖𝑘𝑒𝑛𝑎𝑙𝑖 𝑑𝑒𝑛𝑔𝑎𝑛 𝑏𝑒𝑛𝑎𝑟 𝑥 100% ∑ 𝑠𝑒𝑚𝑢𝑎 𝑜𝑏𝑗𝑒𝑘
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
219 𝑥 100% = 96.9% 226
Berdasarkan hasil transliterasi menggunakan ekstraksi ciri 4 zona secara horizontal dan 4 zona secara vertikal-horizontal pada Tabel 4.1 dan Tabel 4.4 tingkat ketepatan/akurasi dalam membentuk nama jalan yang benar mengalami penurunan nilai, yaitu dari 93.33% menjadi 86.67%. Begitu pula dengan hasil transliterasi tiap aksara pada Tabel 4.2 dan 4.5 mengalami penurunan nilai akurasi dari 97.79% menjadi 96.9%. Di beberapa bagian data uji mengalami penurunan kesalahan dalam pengenalan aksaranya tetapi di bagian lain justru sebaliknya. Sebagai contoh, jika menggunakan pembagian 4 zona secara horizontal, hasil transliterasi pada nama Jalan Parangtritis terdapat 2 aksara yang salah diklasifikasikan, pada nama Jalan Juwadi semua aksara dapat diklasifikasikan dengan benar sedangkan pada pembagian 4 zona secara vertikal dan horizontal data uji nama Jalan Parangtritis hanya terdapat 1 aksara saja yang salah diklasifikasi tetapi pengenalan nama Jalan Juwadi terdapat 1 aksara yang salah diklasifikasi. Secara keseluruhan dapat kita simpulkan bahwa pembagian 4 zona secara horizontal masih lebih cocok untuk diterapkan pada data nama jalan beraksara Jawa dibandingkan dengan pembagian 4 zona secara vertikal-horizontal karena memiliki nilai akurasi yang lebih tinggi. Untuk menguji kemampuan algoritma dalam melakukan proses klasifikasi maka akan dilakukan pengujian dengan memvariasikan data uji. Variasi yang dilakukan yaitu dengan mengambil gambar dengan cahaya yang sangat minim (malam hari) dan diambil dengan sudut pengambilan gambar yang tidak tegak lurus terhadap papan nama jalan. Citra yang digunakan berjumlah 30 yang terdiri dari pengambilan data dalam kondisi normal (cahaya cukup terang dan tegak lurus terhadap papan nama jalan) dan kondisi tidak normal (kondisi cahaya minim dan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 79
variasi angle). Adapun hasil dari proses transliterasi menggunakan 4 zona secara horizontal adalah sebagai berikut: Tabel 4.6 Tabel Hasil Pengujian Menggunakan 4 Zona Secara Horizontal No 1
Citra
Terjemahan
Hasil
Asli
Jalan Balapan Dalan
Ket Benar
Balappan 2
Jalan Dagen
Dalan
Benar
Dhagen 3
Jalan Gajah
Dalan
Benar
Gajah 4
5
Jalan
Dalan
Glagahsari
Glagahsari
Jalan Ireda
Dalan
Benar
Benar
Iredha 6
7
8
Jalan
Dalan
Jogokaryan
Jaganaryan
Jalan
Dalan
Juminahan
Juminahhan
Jalan Juwadi
Dalan
Salah
Benar
Benar
Juwadi 9
Jalan Kenari
Dalan
Benar
Kenari 10
Jalan
Dalan
Kusumanegar Kusumaneg a
ara
Benar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 80
11
Jalan
Dahan
Langensari
Langenaran
Salah
g 12
13
Jalan
Dalan
Lokananta
Lokananta
Jalan Lowanu Dalan
Benar
Benar
Lowanu 14
15
16
Jalan Gajah
Dalan
Mada
Gajah Mada
Jalan
Dalan
Malioboro
Maliyabara
Jalan Mangga Dalan
Benar
Benar
Benar
Mangga 17
Jalan
Dahmang
Mangkuyuda
kukunan
Salah
n 18
Jalan
tarunghtaru
Modang
ng
Salah
tarunggagap erlanmegata rungdhang 19
Jalan Margo
Dalan
Mulyo
Marga
Benar
Mulya 20
Jalan Mutiara
Dalan
Benar
Mutiyara 21
Jalan
Dalan
Notowinatan
Natawinata n
Benar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 81
22
23
Jalan
Katuwa
Pajeksan
jektesaga
Jalan
Dahan
Parangtritis
wagatarungt
Salah
Salah
riris 24
25
26
Jalan
Dalan
Perkutut
Perkutut
Jalan
Dalan
Surakarsan
Surakarsan
Jalan Suripta
Tarunggate
Benar
Benar
Salah
gagatarungn gammugayu rihpta 27
Jalan Dokter
Dalan
Sutomo
Dhokter
Benar
Sutama 28
Jalan Tribrata Dalan
Benar
Tribrata 29
30
Jalan
Dalan
Tunggarana
Tunggarana
Jalan Veteran
Dalan
Benar
Benar
Veteran
Berdasarkan rumus untuk menghitung akurasi yaitu Persamaan 2.8 maka nilai akurasi dari hasil dari pengujian pada Tabel 4.6 adalah sebagai berikut: 𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
∑ 𝑜𝑏𝑗𝑒𝑘 𝑦𝑎𝑛𝑔 𝑑𝑖𝑘𝑒𝑛𝑎𝑙𝑖 𝑑𝑒𝑛𝑔𝑎𝑛 𝑏𝑒𝑛𝑎𝑟 𝑥 100% ∑ 𝑠𝑒𝑚𝑢𝑎 𝑜𝑏𝑗𝑒𝑘
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
23 𝑥 100% = 76.67% 30
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 82
Dengan data uji yang sama proses transliterasi dilanjutkan dengan menggunakan pembagian zona yang berbeda, yaitu dibagi menjadi 4 zona secara vertikal dan horizontal. Hasil dari proses transliterasi dapat dilihat pada tabel berikut: Tabel 4.7 Tabel Hasil Pengujian Menggunakan 4 Zona Secara Vertikal dan Horizontal No 1
Citra
Terjemahan
Hasil
Asli
Jalan Balapan Dalan
Ket Benar
Balappan 2
Jalan Dagen
Dalan
Benar
Dhagen 3
Jalan Gajah
Dalan
Benar
Gajah 4
5
Jalan
Dalan
Glagahsari
Glagahsari
Jalan Ireda
Dalan
Benar
Benar
Iredha 6
Jalan
Dalan
Jogokaryan
Jaganangya
Salah
n 7
8
Jalan
Dalan
Juminahan
Juminahhan
Jalan Juwadi
Dalan
Benar
Salah
Juwaki 9
Jalan Kenari
Dalan Kenari
Benar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 83
10
Jalan
Dalan
Benar
Kusumanegar Kusumaneg
11
a
ara
Jalan
Dalak
Langensari
Lyangennm
Salah
ar 12
13
Jalan
Dalan
Lokananta
Lokananta
Jalan Lowanu Dalan
Benar
Benar
Lowanu 14
15
16
Jalan Gajah
Dalan
Mada
Gajah Mada
Jalan
Dalan
Malioboro
Maliyabara
Jalan Mangga Dalan
Benar
Benar
Benar
Mangga 17
18
Jalan
Dapasangan
Mangkuyuda
_samang
n
kuyudan
Jalan
Rangpasang
Modang
an_parang
Salah
Salah
kungkakam alanmekatar ungdhang 19
Jalan Margo
Dalan
Mulyo
Marga
Benar
Mulya 20
Jalan Mutiara
Dalan Mutiyara
Benar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 84
21
Jalan
Dalan
Notowinatan
Natawinata
Benar
n 22
23
Jalan
Kantawa
Pajeksan
jejsatri
Jalan
Dalan
Parangtritis
wakarangtri
Salah
Salah
kas 24
25
26
Jalan
Dalan
Perkutut
Perkutut
Jalan
Dalan
Surakarsan
Surakarsan
Jalan Suripta
Kungkama
Benar
Benar
Salah
kakakungm ansukajuriju per 27
Jalan Dokter
Dalan
Sutomo
Dhokter
Benar
Sutama 28
Jalan Tribrata Dalan
Salah
Triprata 29
30
Jalan
Dalan
Tunggarana
Tunggarana
Jalan Veteran
Dalan
Benar
Benar
Veteran
Berdasarkan rumus untuk menghitung akurasi yaitu Persamaan 2.8 maka nilai akurasi dari hasil dari pengujian pada Tabel 4.7 adalah sebagai berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 85
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
∑ 𝑜𝑏𝑗𝑒𝑘 𝑦𝑎𝑛𝑔 𝑑𝑖𝑘𝑒𝑛𝑎𝑙𝑖 𝑑𝑒𝑛𝑔𝑎𝑛 𝑏𝑒𝑛𝑎𝑟 𝑥 100% ∑ 𝑠𝑒𝑚𝑢𝑎 𝑜𝑏𝑗𝑒𝑘
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
21 𝑥 100% = 70% 30
Berdasarkan variasi pengujian yang telah dilakukan maka hasilnya dapat dirangkum sebagai berikut. Tabel 4.8 Tabel Nilai Akurasi Hasil Pengujian Pembagian Zona
Data Diambil Dalam Keadaan Normal
Data Diambil Dalam Keadaan Tidak Normal
93.33%
86.67%
76.67%
70%
4 Zona Secara Horizontal 4 Zona Secara Vertikal dan Horizontal
Data diambil dalam keadaan normal artinya pengambilan gambar dilakukan pada kondisi cahaya cukup terang, yaitu pada pagi hingga siang hari dan pengambilan gambar tegak lurus terhadap papan nama jalan. Data diambil dalam keadaan tidak normal artinya pengambilan gambar dilakukan dengan cahaya yang sangat minim yaitu pada malam hari dan pengambilan gambar dengan angle atau sudut tertentu (tidak tegak lurus terhadap papan nama). Dengan hasil akurasi yang diperoleh pada Tabel 4.8 maka dapat disimpulkan bahwa nilai akurasi tertinggi diperoleh dengan menggunakan pembagian 4 zona secara horizontal dan data diambil dalam keadaan normal, yaitu sebesar 93.33%. Variasi terhadap data uji secara signifikan berpengaruh terhadap nilai akurasi yang dihasilkan karena data diperoleh dengan keadaan tidak normal. Secara visual, citra data uji yang diambil dengan kondisi tidak normal adalah sebagai berikut: Tabel 4.9 Citra yang Diambil Dalam Keadaan Tidak Normal Citra Biner
Citra Hasil Segmentasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 86
Ketika citra diambil dalam keadaan tidak normal maka memerlukan proses preprocessing yang lebih komplek seperti peningkatan kontras, reduksi noise dan deteksi kemiringan secara otomatis ketika citra diambil dalam angle atau sudut tertentu. Ketika masuk ke proses segmentasi menggunakan projection profile juga akan berdampak pada proses pemisahan per karakter karena noise yang ada pada citra menyebabkan citra tidak dapat dipisahkan dengan baik. Pemilihan model klasifikasi menggunakan template matching juga berdampak secara signifikan ketika data uji yang dipakai bervariasi sehingga model klasifikasi ini sangat tidak cocok untuk diterapkan jika variabilitas data uji beragam.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB V PENUTUP
5.1
KESIMPULAN Berdasarkan penelitian tentang Transliterasi Nama Jalan Beraksara Jawa yang telah dikerjakan maka dapat ditarik kesimpulan sebagai berikut: 1.
Penelitian ini menggunakan model klasifikasi template matching dengan data traning atau template sebanyak 100 citra aksara Jawa dan data uji berjumlah 30 citra yang independen terhadap data training. Untuk akurasi yang dihasilkan dalam pembagian 4 zona secara horizontal cukup tinggi, yaitu 93.33% untuk data normal dan 86.67% untuk data yang bervariasi sedangkan untuk pembagian 4 zona secara horizontal dan vertikal memiliki tingkat akurasi 76.67% untuk data normal dan 70% untuk data yang bervariasi.
2.
Kelemahan classifier menggunakan model template matching adalah sangat bergantung pada jumlah template yang disimpan dan terbatasnya variasi data uji yang digunakan sehingga tidak cocok dipakai ketika data uji yang digunakan beragam. Perbedaan posisi atau letak citra akan sangat berpengaruh terhadap ketepatan classifier dalam menentukan sebuah objek baru yang dimasukkan sehingga dibutuhkan template yang cukup banyak yang mengakomodasi berbagai posisi dan letak citra. Namun jika template terlalu banyak tentu saja akan mempengaruhi kecepatan sistem dalam proses klasifikasi, selain itu membutuhkan storage yang besar untuk menyimpan semua template. Di sisi lain kelebihan menggunakan template matching adalah relatif mudah diimplementasikan dan masih cukup relevan diterapkan untuk kasus pada penelitian ini.
3.
Data uji yang digunakan dalam bentuk kata yang terdiri dari 2 sampai 3 kata sehingga diperlukan proses grouping (pengelompokkan) setelah masing-masing karakter aksara dikenali. Postprocessing diperlukan
87
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 88
dalam character recognition untuk mentranslasikan simbol atau aksara ke dalam konteks yang tepat agar membentuk kata, kalimat atau informasi yang memiliki makna. Hal tersebut harus didukung pula dengan memahami karakteristik aksara yang digunakan dan rule (aturan) penulisan aksara tersebut. 4.
Ekstraksi ciri yang digunakan pada penelitian ini adalah ekstraksi ciri berbasis zona, yaitu Image Centroid and Zone dan Zone Centroid and Zone yang digabungkan menjadi satu, secara singkat disebut ICZ-ZCZ. Pembagian zona yang dilakukan adalah dengan membagi citra ke dalam 4 zona sama besar secara horizontal. Berdasarkan tingkat akurasi yang dihasilkan, ekstraksi ciri dengan 4 zona secara horizontal ini cocok digunakan untuk data citra nama jalan beraksara Jawa daripada pembagian 4 zona secara horizontal dan vertikal.
5.
Proses segmentasi yang dilakukan untuk memisahkan masing-masing aksara menggunakan metode projection profile. Berdasarkan penelitian yang sudah dilakukan, metode ini memiliki kekurangan ketika objek yang terdapat dalam citra tidak saling terpisah dengan sempurna dan terdapat noise pada citra tersebut. Dalam penulisan aksara Jawa terkadang terdapat jarak yang begitu dekat antar aksara sehingga terdapat bagian yang saling tumpang tindih. Jika dikenai projection profile biasa objek yang saling berdekatan tersebut akan dikenali sebagai 1 buah objek.
5.2
SARAN Untuk penelitian selanjutnya tentang Transliterasi Nama Jalan Beraksara Jawa, terdapat beberapa saran untuk memperbaiki kekurangan pada penelitian tersebut, antara lain: 1.
Mengembangkan proses deteksi secara otomatis tulisan yang ditulis menggunakan aksara Jawa terhadap seluruh objek cira sehingga proses cropping yang dilakukan dapat secara otomatis mengambil citra aksara Jawa saja.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 89
2.
Menambahkan proses pada tahap preprocessing untuk gambar yang diambil dalam kondisi tidak normal seperti pencahayaan yang gelap dan gambar yang memiliki sudut kemiringan tertentu. Preprocessing yang dapat ditambahkan seperti peningkatan kontas atau pencahayaan, noise reduction dan deteksi kemiringan citra yang mampu merotasi citra supaya dalam posisi lurus atau tegak.
3.
Salah satu kelemahan model classifier menggunakan template matching adalah bergantung pada banyaknya template dan cara membandingkan objek dengan setiap template yang ada sehingga diperlukan model classifier yang lebih efisien dalam hal komputasi untuk mempercepat proses eksekusi program dan tidak memakan bergitu banyak ruang penyimpanan.
4.
Segmentasi menggunakan projection profile pada kondisi tertentu tidak cocok untuk diimplementasikan karena tidak dapat memisahkan tiap aksara jika terdapat penulisan yang bersambung dengan aksara lainnya atau tidak saling terpisah dengan baik sehingga diperlukan metode lain supaya dapat memisahkan tiap aksara meskipun secara visual tidak terpisah dengan baik.
5.
Melanjutkan penelitian tentang transliterasi nama jalan beraksara Jawa namun diaplikasikan menggunakan perangkat smartphone dengan output berupa suara atau terjemahan dalam bahasa Indonesia atau bahasa Inggris.
6.
Mengembangkan penelitian ini untuk mentranslasikan penulisan aksara Jawa yang berbentuk kalimat yang terdapat pada sebuah teks atau buku.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR PUSTAKA
Duda, Richard O., Hart, Peter E. & Stork, David G. (2001). Pattern Classification (2nd ed.). United States of America: John Willey & Sons, Inc. Genk Kobra Javaholic. (2015). Gaul Aksara Jawa. Yogyakarta: LKiS Pelangi Aksara. Gonzales, Rafael C. & Woods, Richard E. (2008). Digital Image Processing (3rd ed.). United States of America: Pearson Prentice Hall. Hadiprijono, J.S. (2013). Trampil Maca lan Nulis Aksara Jawa. Yogyakarta: Kanisius. Jain, Anil K., Duin, Robert P.W. & Mao, Jianchang. (2000). Statistical Pattern Recognition. Journal IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, pp. 4-37. http://dl.acm.org/citation.cfm?id=331105 (Diakses 17 Oktober 2016 pukul 09.00 WIB). Kadir, Abdul & Susanto, Adhi. (2012). Teori dan Aplikasi Pengolahan Citra. Yogyakarta: CV. Andi Offset. Mahto, Manoj K., Bhatia, Karamjit & Sharma, R.K. (2015). Combined Horizontal and Vertical Projection Feature Extraction Technique for Gurmukhi Handwritten Character Recognition. International Conference on Advances in Computer Engineering and Applications, No. 978-1-46736910-7, pp. 59-65. https://www.researchgate.net/publication/277571316 (Diakses 20 Oktober 2016 pukul 19.00 WIB). Patil, Renuka., Srinivasan, G.N. (2013). A Survey on Character Recognition. International Journal of Engineering Sciences Research-IJESR, Vol. 04, ISSN: 2230-8504. ijesr.in/wp-content/uploads/2012/07/IJESR-Y1304236R.pdf (Diakses 19 Oktober 2016 pukul 19.00 WIB). Polikar, Robi. (2006). Pattern Recognition. Wiley Encyclopedia of Biomedical Engineering. http://users.rowan.edu/~polikar/RESEARCH/PUBLICATIONS/wiley06. pdf (Diakses 27 Oktober 2016 pukul 19.30 WIB). Rajashekararadhya, S. V. & Ranjan, P. Vanaja. (2005). Efficient Zone Based Feature Extraction Algorithm For Handwritten Numeral Recognition of Four Popular South Indian Scripts. Journal of Theoretical and Applied Information Technology, Vol. 4, No. 12, pp. 1171-1181. http://www.jatit.org/volumes/research-papers/Vol4No12/4Vol4No12.pdf (Diakses 19 November 2016 pukul 21.00 WIB). Rochkyatmo, Amir. (1996). Pelestarian dan Modernisasi Aksara Daerah. Jakarta: Proyek Pengkajian dan Pembinaan Nilai-Nilai Budaya Direktorat Sejarah dan Nilai Tradisional Direktorat Jendral Kebudayaan Departemen Pendidikan dan Kebudayaan. Theodoridis, Sergios & Koutroumbas, Konstantinos. (2009). Pattern Recognition (4th ed.). Canada: Academic Press. Widiarti, Anastasia Rita., Harjoko, Agus., Marsono & Hartati, Sri. (2014). Preprocessing Model of Manuscript in Javanese Characters. Journal of
90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 91
Signal and Information Processing, Vol. 5, ISSN: 2159-4465, pp. 112-122. www.scirp.org/journal/PaperInforCitation.aspx?PaperID=50477 (Diakses 22 Oktober 2016 pukul 19.30 WIB). Widarti, Anastasia Rita & Winarko, Edi. (2012). Widiarti-Winarko Algorithm for Grouping Syllables Result from the Javanese Literature Document Image Recognition. Conference: 16th WSEAS International Conference on Computers, at Kos Island, Greece. https://repository.usd.ac.id/4870/ (Diakses 22 Oktober 2016 pukul 19:00.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN
Lampiran 1. Desain Interface Alat Uji Transliterasi Nama Jalan Beraksa Jawa
Lampiran 2. Dokumentasi Pengambilan Data Penelitian
Gambar 3.2 Pengambilan Citra Nama Jalan Hayam Wuruk
Gambar 3.1 Pengambilan Citra Nama Jalan Juminahan
92
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 93
Gambar 3.3 Pengambilan Citra Nama Jalan Tegal Kemuning
Gambar 3.4 Pengambilan Citra Nama Jalan Margo Utomo