APLIKASI ANDROID PENERJEMAH BAHASA NON-LATIN DENGAN PENGENALAN CITRA KARAKTER
ADI KIRANA WIJAYAJATI
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Aplikasi Android Penerjemah Bahasa non-Latin dengan Pengenalan Citra Karakter adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, April 2015
Adi Kirana Wijayajati NIM G64124041
ABSTRAK ADI KIRANA WIJAYAJATI. Aplikasi Android Penerjemah Bahasa non-Latin dengan Pengenalan Citra Karakter. Dibimbing oleh KARLINA KHIYARIN NISA. Bahasa dengan karakter nonlatin merupakan bahasa yang sulit untuk dipelajari karena penulisannya yang relatif rumit. Beberapa bahasa yang menggunakan karakter nonlatin antara lain Arab, Cina (sederhana), Rusia, Jepang, Korea, dan Thailand. Pada penelitian ini, suatu sistem pengenalan karakter nonlatin berbasis Android dirancang untuk mengenali citra karakter nonlatin menggunakan Tesseract library OCR (Optical Character Recognition) dan menerjemahkannya menjadi bahasa Indonesia dan Inggris menggunakan Microsoft Translator. OCR adalah teknik untuk mengubah teks nondigital menjadi teks digital atau dapat diartikan sebagai pengenalan karakter optik. Pada penelitian ini terdapat 8 kebutuhan fungsional, yaitu memilih bahasa asal, mengambil citra menggunakan kamera dan memotongnya, mengambil citra melalui galeri, melakukan konversi dari citra ke teks, mengedit teks nonlatin hasil OCR, memilih bahasa tujuan, menampilkan hasil terjemahannya, dan me-reset aplikasi. Berdasarkan 650 contoh karakter nonlatin yang terdiri dari 5 bahasa telah diuji, nilai akurasi terbaik yang didapat adalah 95.03% pada kondisi pencahayaan normal. Adapun faktor-faktor yang dapat mempengaruhi akurasi tersebut antara lain: intensitas cahaya, kemiringan, fokus, dan penulisan secara vertikal. Evaluasi usability menghasilkan nilai 82.4%. Kata Kunci: Android, citra, nonlatin, OCR, teks, Tesseract.
ABSTRACT ADI KIRANA WIJAYAJATI. Android Application Language Interpreter with Recognition of non-Latin Character Image. Supervised by KARLINA KHIYARIN NISA. Languages with nonlatin characters are more difficult to learn because the writing is relatively complicated. Some languages that use nonlatin characters are Chinese (simplified), Russian, Japanese, Korean, and Thai. In this study, a nonlatin character recognition system based on Android is designed to recognize the image of nonlatin characters using the Tesseract library OCR (Optical Character Recognition) and translated into Bahasa Indonesia and English. OCR is a technique to convert nondigital text into digital text. In this study, there were 8 functional requirements which are choosing origin language, taking image with a camera and cropping, taking an image from the gallery, converting an image to text, editing nonlatin text of OCR result, choosing target language, displaying the translation, and resetting. Based on 650 examples of nonlatin characters that consisted of 5 languages that have been tested, the best accuracy for the result is 95.03% on normal light. Factors that effect the accuracy are the intensity of light, tilted text, motion bluring, and vertical writing. The value of usability evaluation is 82.4%. Keywords: Android, image, nonlatin, OCR, Tesseract, text.
APLIKASI ANDROID PENERJEMAH BAHASA NON-LATIN DENGAN PENGENALAN CITRA KARAKTER
ADI KIRANA WIJAYAJATI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015
Penguji: 1 Dr Ir Agus Buono, MSi MKom 2 Muhammad Asyhar Agmalaro, SSi MKom
Judul Skripsi : Aplikasi Android Penerjemah Bahasa non-Latin dengan Pengenalan Citra Karakter Nama : Adi Kirana Wijayajati NIM : G64124041
Disetujui oleh
Karlina Khiyarin Nisa, SKom MT Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen
Tanggal Lulus:
PRAKATA Alhamdulillahi rabbil βalamin, puji syukur penulis panjatkan ke hadirat Allah subhanahu wa Ta'ala atas berkat, rahmat, taufik, dan hidayah-Nya sehingga penyusunan skripsi yang berjudul Aplikasi Android Penerjemah Bahasa non-Latin dengan Pengenalan Citra Karakter dapat diselesaikan dengan baik. Sholawat serta salam semoga selalu tercurahkan kepada Nabi Muhammad shalallahu 'alaihi wassallam beserta keluarga, sahabat, dan para pengikutnya yang telah memberikan contoh dalam meraih kebahagiaan di dunia dan akhirat. Terima kasih penulis ucapkan kepada orang tua penulis, ayahanda tercinta Purwoto yang selalu menjadi inspirasi kebijaksanaan dalam tutur dan laku penulis. Ibunda Morita, yang tak pernah lelah memberikan motivasi wejangan, doa, cinta, dan kasih sayang dalam mendidik. Dosen pembimbing Ibu Karlina Khiyarin Nisa, SKom MT atas waktu, ilmu, kesabaran, nasihat, dan masukan yang selalu diberikan selama pengerjaan tugas akhir ini, Bapak Dr Ir Agus Buono, MSi MKom dan Bapak Muhammad Asyhar Agmalaro, SSi MKom selaku penguji atas waktu, masukan, dan koreksinya. Serta teman-teman Ilmu Komputer alih jenis angkatan 7 atas pengalaman berbagi ilmu serta atas kebersamaan dan dukungannya selama penulis menjalani waktu di Departemen Ilmu Komputer IPB. Semoga karya ilmiah ini bermanfaat. Bogor, April 2015
Adi Kirana Wijayajati
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN Latar Belakang
1 1
Perumusan Masalah
2
Tujuan
2
Manfaat Penelitian
2
Ruang Lingkup Penelitian
2
METODE Pengumpulan Data
2 3
Analisa Pengenalan Karakter
3
Penerjemahan Karakter non-Latin
4
Perancangan Aplikasi
4
Implementasi
4
Pengujian
5
Evaluasi
5
HASIL DAN PEMBAHASAN Pengumpulan Data
5 5
Analisa Pengenalan Karakter
6
Penerjemahan Karakter non-Latin
11
Perancangan Aplikasi
12
Implementasi
15
Pengujian
16
Evaluasi
19
SIMPULAN DAN SARAN Simpulan Saran DAFTAR PUSTAKA LAMPIRAN RIWAYAT HIDUP
20 20 20 21 22 47
DAFTAR TABEL 1 Data uji citra karakter nonlatin 2 Rancangan antarmuka pengguna 3 Implementasi sistem 4 Pengujian sistem menggunakan metode black box 5 Skenario pengujian 6 Contoh pengujian karakter Cina (sederhana) 7 Akurasi pada masing-masing skenario 8 Contoh pengujian penerjemahan 9 Klasifikasi penarikan kesimpulan hasil evaluasi usability 10 Evaluasi usability
6 15 16 17 17 18 18 19 19 20
DAFTAR GAMBAR 1 Metode penelitian 2 Alur kerja Tesseract OCR Engine 3 Diagram alur Grayscaling 4 Ilustrasi Gaussian Smoothing 2 dimensi 5 Algoritme Otsu 6 Identifikasi outline 7 Contoh fitted baseline 8 Contoh pemisahan karakter 9 Use case diagram 10 Activity diagram
3 3 7 8 9 10 10 11 12 14
DAFTAR LAMPIRAN 1 Pengujian pengenalan karakter dan terjemahannya 2 Lembar kuesioner dengan tanggapan responden
22 44
PENDAHULUAN Latar Belakang Bahasa merupakan protokol dalam berkomunikasi, penggunaan bahasa yang sesuai sangat penting dalam terciptanya komunikasi untuk mengirim maupun menerima pesan yang akan diolah menjadi informasi. Namun, dalam pengaplikasiannya sangat sulit untuk mengetahui pesan yang yang disampaikan secara tertulis dan menggunakan bahasa dengan karakter nonlatin seperti Cina, Jepang, Korea, Rusia, dan Thailand. Dalam proses pembelajarannya, untuk mengenali dan menerjemahkan karakter nonlatin yang kita jumpai cukup sulit. Hal ini dikarenakan proses menterjemahkan memerlukan masukan berupa teks dengan karakter nonlatin. Untuk mengatasi masalah tersebut, teknik optical character recognition (OCR) dapat dimanfaatkan. OCR merupakan teknik pengenalan karakter optik yang berfungsi untuk mengubah karakter teks nondigital menjadi teks dalam bentuk digital. Namun, dalam implementasinya diperlukan suatu perangkat mobile untuk menjalankan teknik pengenalan karakter optik agar proses pengenalan karakter nonlatin dapat dilakukan di mana saja dan kapan saja, misalnya ketika sedang melakukan perjalanan pariwisata ke negara yang menggunakan karakter nonlatin sebagai huruf resmi negara tersebut. Android merupakan sistem operasi mobile phone open source yang berbasis Linux menggunakan bahasa pemograman Java. Selain mendukung pengembangan standar terbuka pada perangkat mobile. Adapun fitur pendukung yang disediakan oleh Android agar memudahkan pengembang untuk mengembangkan aplikasi antara lain: storage, network, multimedia, GPS, dan phone service (Fajaruddin 2011). Pada penelitian ini akan menghasilkan suatu aplikasi pengenalan karakter nonlatin dan menerjemahkannya ke dalam karakter latin pada bahasa Indonesia dan Inggris. Tidak seperti aplikasi Android lainnya, misal Word Lens yang hanya mendukung bahasa Rusia sebagai bahasa dengan karakter nonlatin untuk diterjemahkan ke dalam bahasa Inggris, pada aplikasi yang akan dibangun juga mendukung bahasa dengan karakter nonlatin lainnya, yaitu Cina (sederhana), Jepang, Korea, dan Thailand untuk nantinya diterjemahkan ke dalam bahasa Inggris dan Indonesia. Pada proses pengenalan karakter nonlatin diperlukan suatu library OCR open source, yaitu Tesseract. Mesin OCR yang berbasis bahasa pemrograman C/C++ ini akan diterapkan pada perangkat Android dengan menggunakan bahasa pemrograman Java. Pada penelitan sebelumnya, tesseract OCR engine menghasilkan akurasi yang cukup besar, yaitu 96.33% (Smith 2007). Dengan mengaplikasikan Tesseract OCR Engine, penelitian ini diharapkan menghasilkan akurasi yang besar pula. Sedangkan dalam proses penerjemahan dilakukan secara online menggunakan Microsoft Translator. Penggunaan Microsoft Translator didasarkan pada tingkat akurasi dalam penerjemahan yang lebih tinggi dibandingkan kompetitor utamanya yaitu Google translate (Goodman 2014). Penelitian ini juga melakukan evaluasi usability menggunakan kuesioner yang meliputi learnability, efficiency, memorability, errors, dan satisfaction.
2 Perumusan Masalah 1 2 3 4
Perumusan masalah pada penelitian ini antara lain: Bagaimana Tesseract OCR engine dapat diterapkan dalam pengenalan citra karakter nonlatin pada perangkat Android? Seberapa besar keakuratan Tesseract OCR engine dalam mengenali karakter nonlatin? Bagaimana pengaruh intensitas cahaya, kemiringan, fokus, dan penulisan karakter secara vertikal terhadap keakuratan pengenalan karakter? Bagaimana hasil evaluasi usability melalui kuesioner kepada pengguna? Tujuan
1 2 3 4
Tujuan pada penelitian ini antara lain: Menerapkan tesseract OCR engine pada perangkat Android untuk mengenali citra karakter nonlatin. Mengetahui keakuratan Tesseract OCR engine dalam mengenali citra karakter nonlatin. Mengetahui pengaruh intensitas cahaya, kemiringan, fokus, dan penulisan secara vertikal terhadap keakuratan pengenalan karakter. Mengetahui hasil evaluasi usability melalui kuesioner kepada pengguna. Manfaat Penelitian
Pada penelitian ini, manfaat yang diperoleh adalah membantu masyarakat dalam mengenali karakter nonlatin dengan bahasa Cina (sederhana), Jepang, Korea, Rusia, dan Thailand dalam bentuk nondigital ke dalam bentuk digital serta menerjemahkannya ke dalam bahasa Indonesia dan Inggris pada suatu aplikasi mobile. Ruang Lingkup Penelitian Ruang lingkup pada penelitian ini antara lain: 1 2
3 4 5
Pengenalan karakter nonlatin dilakukan pada citra yang bukan hasil tulisan tangan. Karakter nonlatin hanya bahasa dengan karakter yang didukung oleh Tesseract OCR dan Microsoft Translator yaitu Cina (sederhana), Jepang, Korea, Rusia, dan Thailand. Pengguna sudah mengetahui bahasa untuk karakter yang akan dikenali. Masukan citra memiliki ekstensi yang didukung oleh Android dan tesseract OCR, yaitu format JPEG, GIF, PNG,dan BMP. Pengujian pengenalan karakter dilakukan pada citra yang divariasikan pada intensitas cahaya, kemiringan, fokus, dan penulisan secara vertikal.
METODE Metode pada penelitian ini terdiri dari beberapa tahapan dengan alur kerja yang dapat dilihat pada Gambar 1.
3
Gambar 1 Metode penelitian Pengumpulan Data Pada tahap awal penelitian, dilakukan pengumpulan data uji citra karakter nonlatin berupa citra digital dan citra nondigital. Pada penelitian ini, pemilihan bahasa dengan karakter nonlatin antara lain: Cina (sederhana), Jepang, Korea, Rusia, dan Thailand. Pemilihan karakter Cina sederhana dengan pertimbangan bahwa dalam pengaplikasiannya lebih banyak digunakan dan lebih mudah dalam pengenalannya dibandingkan karakter Cina (tradisional) (Shi-zong 2009). Analisa Pengenalan Karakter Pada penelitian ini, proses pengenalan citra karakter dilakukan dengan menggunakan Tesseract OCR Engine. Mesin OCR dikembangkan di HewlettPackard (HP) pada tahun 1984 dan 1994 (Smith 2007). Adapun alur kerja dalam pengenalan citra karakter dapat dilihat pada Gambar 2.
Image Preprocessing Grayscaling Removing noise Thresholding
Citra Biner
Feature Extraction Connected Component Labelling Segmentation Line Finding Baseline Fitting Fixed Pitch Detection Non Fixed Pitch Detection Blob
Citra Teks
Word Recognition Adaptive Classifier
Gambar 2 Alur kerja Tesseract OCR Engine
4 Penerjemahan Karakter non-Latin Setelah karakter nonlatin berhasil dikenali dengan baik. Proses selajutnya adalah penerjemahan karakter nonlatin ke dalam bahasa Indonesia atau Inggris. Pemilihan bahasa Indonesia dan Inggris sebagai bahasa tujuan dalam penerjemahan dikarenakan penelitian ini dibuat di negara Indonesia menggunakan bahasa Indonesia, sedangkan bahasa Inggris merupakan bahasa internasional yang secara resmi dipelajari oleh hampir semua negara di dunia. Perancangan Aplikasi Pada tahap perancangan aplikasi terdiri dari beberapa proses yaitu use case diagram, activity diagram dan perancangan antarmuka. Use Case Diagram Use case diagram merupakan salah satu dari UML (Unified Modelling Language) diagram yang bertujuan untuk memodelkan proses bisnis dari perspektif pengguna. Pada use case diagram terdiri dari aktor sebagai pengguna aplikasi dan aksi-aksi yang dapat dilakukan oleh aktor tersebut. Activity Diagram Activity diagram menggambarkan alur aktivitas dalam sistem yang akan dibangun sehingga dapat mencerminkan perancangan alur sistem dari awal, proses yang mungkin terjadi di dalamnya, dan akhir dari alur sistem yang telah diaplikasikan. Perancangan Tampilan Antarmuka Tampilan antarmuka merupakan media komunikasi yang digunakan antara pengguna dan sistem. Sistem yang akan dibangun diharapkan mudah dipahami dan dimengerti oleh pengguna agar fungsi dari sistem dapat dioperasikan dengan baik oleh pengguna. Implementasi Pada penelitian ini, sistem dibangun dan diimplementasikan menggunakan perangkat keras dan perangkat lunak dengan rincian sebagai berikut. 1
Perangkat keras a Sony Ericsson ST18i (Xperia Ray) dengan sistem operasi Android Ice Cream Sandwich v4.0.4 i CPU 1 GHz Scorpion ii Memory internal 512 MB dan microSD 8 GB iii Kamera 8 MP, 3264 x 2448 pixels, autofocus, LED flash b Dell inspiron dengan sistem operasi Windows 7 Home Basic i Intel Core i3-2370M Processor ii Nvidia GeForce GT 630M DDR3 1 GB iii Memory 4 GB DDR3
5 iv Harddisk 500 GB 5400 RPM 2. Perangkat lunak a Eclipse Juno ADT b Android SDK c Tesseract OCR d Tesseract Traineddata e API Microsoft Translaor 0.6.1 Pengujian Tahap pengujian menggunakan metode black box terhadap fungsi-fungsi utama pada sistem yang telah diimplementasikan pada perangkat mobile Android. Pengujian pengenalan karakter oleh Tesseract OCR menggunakan data uji karakter nonlatin dari masing-masing bahasa dengan skenario pengujian yang berbeda-beda. Adapun skenario pengujian yang dimaksud mencakup pengujian secara normal, pengujian dengan intensitas cahaya sangat terang dan redup, pengujian dengan kemiringan 30 dan 60 derajat, pengujian dengan citra blur atau kabur, dan pengujian dengan karakter vertikal. Hal ini diperlukan untuk mengetahui tingkat akurasi pada masing-masing skenario pengujian dalam mengenali citra karakter nonlatin. Evaluasi Pada tahap terakhir yaitu evaluasi dilakukan dengan cara memberikan kuesioner kepada pengguna aplikasi yang telah dibangun ini. Kuesioner dirancang dengan memperhatikan lima aspek usability yang terdiri dari learnability, efficiency, memorability, errors,dan satisfaction (Nielsen 2012). Tujuan utama kuesioner adalah untuk mengumpulkan informasi dari responden berupa tingkat kepuasan mengenai kekurangan dan kelebihan suatu aplikasi (Rubin dan Chissnell 2008). Kepuasan pengguna diukur menggunakan skala Likert 1 sampai 5 untuk membantu pengguna mengekspresikan kepuasan mereka terhadap aplikasi. Adapun penilaian kuesioner untuk mengukur tingkat usability adalah sebagai berikut. 1 2 3 4 5
SS (Sangat Setuju) nilai 5 S (Setuju) nilai 4 RR (Ragu-ragu) nilai 3 TS (Tidak Setuju) nilai 2 STS (Sangat Tidak Setuju) nilai 1
HASIL DAN PEMBAHASAN Pengumpulan Data Pengumpulan data dilakukan dengan cara mencari 10 citra karakter nonlatin pada masing-masing bahasa sebagai data uji digital. Data uji digital diuji mengunakan fitur galeri pada perangkat mobile Android. Sedangkan data uji nondigital merupakan hasil cetak dari data uji digital yang nantinya akan diuji
6 menggunakan fungsi kamera pada perangkat mobile Android. Adapun data uji tersebut untuk lebih lengkapnya dapat dilihat pada Tabel 1.
Bahasa
Tabel 1 Data uji citra karakter nonlatin Data Uji Citra Karakter non-Latin ke1,5,9 2,6,10 3,7
4,8
Cina (sederhana)
Jepang
Korea
Rusia
Thailand
Analisa Pengenalan Karakter Image Preprocessing Pada bagian image preprocessing dilakukan proses grayscaling, removing noise dan thresholding. Pada bagian ini diharapkan menghasilkan citra biner yang nantinya menjadi masukan pada tahap berikutnya tahap feature extraction. 1 Grayscaling Konversi citra berwarna menjadi grayscale merupakan tahapan awal dalam image preprocessing. Pada proses grayscaling, citra yang pada awalnya terdiri dari 3 layer matriks, yaitu R-layer, G-layer, dan B-layer akan diubah menjadi 1 layer matriks dan hasilnya adalah citra grayscale yang hanya memiliki derajat keabuan. Untuk mengubah citra berwarna, fungsi yang digunakan adalah
7 ARGB_8888 yaitu mendefinisikan nilai alpha channel, merah, hijau, dan biru yang kemudian dapat dirumuskan dengan persamaan di bawah agar menjadi citra dengan derajat keabuan. gs= ((r + g +b)/3) & 0xFF Dengan format warna ini dihasilkan citra grayscale dengan intensitas keabuan yang dipengaruhi oleh variabel warna merah hijau, dan biru. Sedangkan nilai alpha channel berupa 0xFF merupakan ketransparanan dengan nilai 0. Adapun diagram alur dari proses grayscaling dapat dilihat pada Gambar 3.
Start Loading Image h = image.getHeight() w = image.getWeight() x=0 y=0
No
x<w ? Yes y
No
x=x+1
R= Color.red(x,y) G= Color.green(x,y) B= Color.blue(x,y) set pixel (x,y) with (R + G + B) / 3 y=y+1 Grayscaled image
finish
Gambar 3 Diagram alur Grayscaling
8 2 Removing Noise Pada penelitian ini, proses removing noise menggunakan unsharp mask yang merupakan hasil pengurangan citra asli dengan citra yang telah diperhalus atau telah melalui proses smoothing. g(x,y) = f(x,y) β ππ ππππ‘ βππ (π₯, π¦) Proses smoothing pada penelitian ini menggunakan gaussian smoothing dengan konvolusi matriks 3x3. Smoothing dilakukan dengan tujuan untuk menghaluskan citra dan mendekatkan simbol yang berbentuk karakter yang memiliki ruang menjadi lebih mudah dikenali oleh program aplikasi sebagai suatu karakter yang utuh dan bukan simbol-simbol yang terpisah (Fisher et al. 2003). Adapun distribusi gaussian smoothing dalam citra 2 dimensi dapat dirumuskan sebagai berikut. 1
ππ ππππ‘ βππ (π₯, π¦) = 2ππ 2 π
π₯ 2 +π¦ 2 2π 2
β
Dari perumusan gaussian smoothing dalam berntuk 2 dimensi tersebut, maka dapat diilustrasikan dengan Gambar 4.
Gambar 4 Ilustrasi Gaussian Smoothing 2 dimensi 3 Thresholding Pada proses selanjutnya citra akan berubah menjadi citra biner yang hanya mempunyai dua kemungkinan nilai yaitu 0 untuk hitam dan 1 untuk putih. Pada proses ini tiap piksel pada citra akan diklasifikasikan berdasarkan ambang batas tertentu, jika nilai piksel kurang dari ambang batas, maka piksel tersebut akan bernilai 0. Namun, jika nilai piksel lebih dari atau sama dengan ambang batas, maka piksel tersebut akan bernilai 1. Dalam proses binerisasi citra ini menggunakan global thresholding metode Otsu dengan tujuan untuk membagi histogram citra gray ke dalam dua daerah yang berbeda secara otomatis tanpa membutuhkan masukan nilai ambang batas. Probabilitas setiap piksel pada level ke-i dapat dinyatakan sebagai berikut. ππ = ππ / N ππ = jumlah piksel pada level ke-i N = total piksel pada citra
9 Dalam menentukan nilai ambang batas pada metode Otsu, ada beberapa hal yang perlu diketahui, nilai zeroth cumulative moment, first cumulative moment, dan nilai mean berturut-turut dapat dinyatakan dengan rumus berikut (Putra 2004). Ο(k)=
π π=1 ππ
ΞΌ(k)=
π π=1 π. ππ
ππ =
πΏ π=1 π. ππ
Nilai ambang k dapat ditentukan dengan memaksimumkan persamaan: πππ₯ 2 ππ΅2 (π β ) = 1β€π<π ππ΅ (π) dengan ππ΅2 (k) =
[π π π π β π(π)]2 π π [1βπ(π)]
Algoritme untuk menentukan nilai ambang batas citra menggunakan metode Otsu dapat dilihat pada Gambar 5. tMean = 0; variance = maxVariance = 0; firstCM = zerothCM = 0 for (i=0,i
10
Gambar 6 Identifikasi outline Pada Gambar 19 dapat dijelaskan bahwa karakter (a) mengalami proses pelabelan berupa outline (b), setelah proses pelabelan, outline akan membentuk blob yang merupakan tipe data untuk binary file (c), yang pada akhirnya outline karakter berhasil diidentifikasi (d) (Smith 2007). Segmentation Proses selanjutnya adalah segmentation. Ada beberapa tahap dalam segmentation agar karakter pada citra berhasil dikenali, antara lain: line finding, baseline fitting, dan chopping. 1 Line Finding Algoritme line finding dirancang agar dapat membaca teks dengan derajat kemiringan tertentu tanpa harus meng-skew (proses mengubah halaman miring menjadi tegak) sehingga tidak menurunkan akurasi pengenalan citra karakter (Smith 2007). Hasil dari identifikasi outline dapat diasumsikan telah menyediakan informasi berupa region teks dengan ukuran seragam, dengan begitu karakter proses line finding dapat mengidentifikasi karakter yang bersentuhan secara vertikal sebagai teks yang lebih dari satu baris. 2 Baseline Fitting Setelah baris teks ditemukan, baseline dicocokan dengan lebih tepat menggunakan quadratic spline. Fungsi ini digunakan untuk mengatasi citra karakter dengan baseline miring atau berbentuk kurva. Baseline dicocokan dengan partisi blob ke dalam kelompok-kelompok. Pada baseline fitting terdapat 3 pengelompokan garis, yaitu garis tengah (meanline), garis menaik (ascender), dan garis menurun (descender). Contoh fitted baseline dapat dilihat pada Gambar 7.
Gambar 7 Contoh fitted baseline
11 3 Chopping Pada bagian ini, baris karakter yang berhasil diidentifikasi akan dilakukan proses chopping atau dipisahkan untuk tiap karakternya agar proses pengenalan karakter menjadi lebih akurat. Akan tetapi, syarat dari proses pemisahan karakter adalah jarak antarkarakter terdeteksi dengan jarak yang tetap atau fixed pitch detection, jika jarak antarkarakter tidak tetap atau non-fixed pitch detection, maka akan dicari dulu ambang batas jarak antarkarakter untuk menentukan karakter yang terhubung dan karakter yang terpisah. Adapun contoh pemisahan karakter dapat dilihat pada Gambar 8.
Gambar 8 Contoh pemisahan karakter Word Recognition Hasil dari pengenalan karakter nonlatin pada bagian segmentation di atas kemudian akan dicocokan dengan data latih Tesseract yang dapat diunduh secara gratis di http://code.google.com/p/tesseract-ocr/downloads/list. Pada penelitian ini mengidentifikasi berdasarkan 5 bahasa yang menggunakan karakter nonlatin. Data latih yang digunakan adalah sebagai berikut: 1 2 3 4 5
chi_sim.traineddata jpn.traineddata kor.traineddata rus.traineddata tha.traineddata
: data latih karakter Cina (sederhana) : data latih karakter Jepang : data latih karakter Korea : data latih karakter Rusia : data latih karakter Thailand
Proses klasifikasi dilakukan dengan terlebih dahulu mengukur jarak antara karakter yang diuji terhadap karakter-karakter yang telah tersedia pada data latih Tesseract dengan mengoptimalkan rumus jarak Euclidean.
dx,y = (π₯1 β π¦1)2 + (π₯2 β π¦2)2 Selanjutnya untuk mencocokkan fitur dilakukan pencarian jarak terdekat dengan algoritme pencarian best first search. Hasil keluaran pada proses ini harus berupa karakter string (UTF-8). Oleh karena itu, terdapat fungsi getUTF(8) pada class TessBaseApi di library Tesseract OCR yang bertujuan untuk mengubah unicode karakter nonlatin yang terdiri dari bilangan hexadesimal menjadi karakter string (UTF-8). Penerjemahan Karakter non-Latin Setelah proses pengenalan citra karakter nonlatin selesai, proses selanjutnya adalah penerjemahan secara online oleh Microsoft Translator.
12 Penerjemahan dilakukan dari bahasa karakter nonlatin ke dalam bahasa Indonesia dan Inggris. Proses penerjemahan dapat berlangsung dengan baik dengan cara memberikan tautan berupa Microsoft Translator API dalam format .JAR dan dengan menambahkan client ID serta client secret pada kode program. Perancangan Aplikasi Use Case Diagram Pada penelitian ini, perancangan aplikasi dapat digambarkan dengan use case seperti pada Gambar 9. Dari use case diagram tersebut, dapat dijelaskan bahwa seorang pengguna diharuskan memilih bahasa asal, mengambil citra menggunakan kamera dengan tambahan fungsi crop atau dari galeri, dan memilih bahasa tujuan untuk selanjutnya sistem menterjemahkan hasil konversi teks dari citra ke dalam bahasa tujuan. Pada bagian pilih bahasa asal, bahasa yang tersedia antara lain: Cina (sederhana), Jepang, Korea, Rusia, dan Thailand. Sedangkan untuk pilih bahasa tujuan, bahasa yang digunakan adalah Indonesia dan Inggris.
Gambar 9 Use case diagram Activity Diagram Pada penelitian ini proses bisnis dijelaskan menggunakan activity diagram yang menghubungkan aksi yang dilakukan antar komponen. Adapun komponen dalam mengoperasikan aplikasi pengenalan bahasa nonlatin hingga tahap penerjemahan antara lain: 1 Pengguna Pada bagian pengguna, proses yang dilakukan sesuai dengan aksi pada use case diagram, antara lain pilih bahasa asal, pilih citra karakter yang ingin dikenali, pilih bahasa tujuan, melakukan aksi sebagai pemicu dalam menerjemahkan, dan melakukan reset aplikasi.
13 2 Tesseract OCR Pada bagian Tesseract OCR proses yang dilakukan adalah melakukan konversi citra menjadi karakter digital. Proses konversi dilakukan dalam beberapa tahapan antara lain: preprocessing, feature extraction, segmentation, dan word recognition. a Preprocessing Pada bagian preprocessing, proses yang dilakukan antara lain grayscaling yaitu mengubah citra RGB menjadi citra grayscale dengan rumus (R+G+B)/3. Tahap berikutnya adalah removing noise dengan menggunakan metode unsharp mask yaitu mengurangi nilai tiap piksel citra grayscale dengan nilai tiap piksel citra grayscale yang telah melalui tahap smoothing menggunakan metode gaussian smoothing. Setelah tahap removing noise selesai, tahap berikutnya adalah thresholding menggunakan metode Otsu yaitu dengan mencari nilai maksimum dari variance sebagai nilai threshold atau nilai ambang batas. b Feature extraction Pada bagian feature extraction, proses yang dilakukan adalah connected component labelling yaitu dengan cara mengidentifikasi komponen yang terhubung sehingga membentuk outline pada karakter yang diuji untuk selanjutnya dilakukan tahap segmentation. c Segmentation Pada bagian segmentation, proses yang dilakukan antara lain line finding, baseline fitting, dan chopping. Pada bagian line finding, Tesseract OCR Engine dirancang agar dapat membaca karakter dengan derajat kemiringan tertentutanpa harus meng-skew karakter tersebut. Proses selanjutnya adalah baseline fitting yaitu pencocokan garis pangkal menggunakan quadratic spline, sehingga dapat mengidentifikasi karakter pada teks dengan ketinggian beragam dalam satu baris. Proses selanjutnya adalah chopping dengan cara menentukan jarak antarkarakter terlebih dahulu. Jika jarak antarkarakter tetap, karakter dalam suatu baris teks dapat langsung dipotong agar lebih mudah dalam pengenalan tiap karakternya. Namun, jika jarak antarkarakter beragam, akan diidentifikasi terlebih dahulu nilai ambang batas antarkarakter untuk mengetahui pemisahan antarkarakter menggunakan jeda atau tidak. d Word recognition Pada bagian word recognition, proses yang dilakukan adalah mencocokan data uji hasil tahap segmentation dengan data latih dengan mengoptimalkan rumus pencarian jarak euclidian dan best first search untuk pemilihan jarak terdekat. Setelah karakter berhasil diidentifikasi, proses selanjutnya adalah mengubah karakter set unicode hasil pengenalan data uji menjadi karakter string (UTF8) untuk selanjutnya hasil dari word recognition akan ditampilkan kepada pengguna. 3 Microsoft Translator Sedangkan pada bagian Microsoft Translator proses yang dilakukan adalah menerjemahkan karakter digital hasil pengenalan citra ke dalam bahasa tujuan secara online berdasarkan tiap baris data. Pengaplikasian activity diagram pada penelitian ini dapat dilihat pada Gambar 10.
14
Gambar 10 Activity diagram
15 Perancangan Tampilan Antarmuka Pada penelitian ini dihasilkan aplikasi Android pengenalan citra karakter nonlatin menggunakan Tesseract OCR dan menerjemahkannya menggunakan Microsoft Translator. Berdasarkan activity diagram tersebut, dibuatlah perancangan antarmuka pengguna seperti pada Tabel 2, dengan adanya perancangan antarmuka di bawah, diharapkan perancangan alur sistem yang dilakukan pada activity diagram akan terwujud. Halaman utama
Tabel 2 Rancangan antarmuka pengguna Pilih bahasa asal Bahasa asal terpilih
OCR citra ke teks
Pilih bahasa tujuan
Bahasa tujuan terpilih
Ambil citra
Menerjemahkan teks
Implementasi Pada tahap implementasi ini menghasilkan suatu aplikasi pada perangkat mobile Android yang dapat menerjemahkan karakter nonlatin dengan bahasa Cina (sederhana), Jepang, Korea, Rusia, dan Thailand yang berasal dari citra sebagai masukannya. Keluaran pada sistem merupakan hasil terjemahan dalam bahasa Indonesia atau bahasa Inggris sesuai kebutuhan pengguna. Hasil implementasi berupa aplikasi pada tahap perancangan tersebut dapat dilihat pada Tabel 3.
16 Tampilan awal
Tabel 3 Implementasi sistem Pilihan bahasa Pilihan masukan asal citra
Crop / pemotongan
Terjemahan Indonesia
Galeri
Pengenalan karakter
Kamera
Pilihan bahasa tujuan
Terjemahan Inggris
Pengujian Berdasarkan hasil pengujian menggunakan metode black box (Khan et al. 2012) pada bagian implementasi di atas, dapat disimpulkan bahwa seluruh fungsi
17 pada aplikasi yang dibangun berjalan dengan baik sesuai yang direncanakan pada bagian analisa kebutuhan dan desain. Berikut hasil pengujian menggunakan metode black box dapat dilihat pada Tabel 4. Tabel 4 Pengujian sistem menggunakan metode black box No. Nama fungsi Hasil pengujian 1 Memilih bahasa asal Berhasil 2 Mengambil citra melalui kamera dan memotongnya Berhasil 3 Mengambil citra melalui galeri Berhasil 4 Menampilkan teks hasil OCR Berhasil 5 Mengubah teks hasil OCR Berhasil 6 Memilih bahasa tujuan Berhasil 7 Menterjemahkan teks hasil OCR ke bahasa tujuan Berhasil 8 Me-reset aplikasi Berhasil Pada bagian pengujian, selain pengujian fungsi sistem menggunakan metode black box, dilakukan pula pengujian untuk mengetahui besarnya akurasi pengenalan karakter yang dihasilkan pada aplikasi yang dibangun serta untuk mengetahui pengaruh dari intensitas cahaya, kemiringan citra karakter, dan kabur tidaknya citra dalam pengenalan karakter pada citra. Oleh karena itu, diperlukan beberapa skenario untuk memanipulasi citra agar dapat diuji untuk mengetahui pengaruh dari intensitas cahaya, kemiringan citra dan kabur tidaknya citra. Adapun skenario pengujian untuk lebih lengkapnya dan contoh pengujian pengenalan karakter dapat dilihat pada Tabel 5 dan Tabel 6. Pengujian
Intensitas Cahaya
Fokus
Tabel 5 Skenario pengujian Kategori Kamera Terang Lampu putih 15W (jarak lampu kurang dari 20cm) Normal Lampu putih 15W (jarak lampu + 2 meter) Redup
Lampu kuning 10W
Fokus Kabur / Blur
Menunggu fokus Langsung ambil tanpa menunggu fokus
0Β°
Kemiringan
30Β° 60Β°
Posisi kamera sejajar dengan citra karakter Posisi kamera miring 30Β° dengan citra karakter Posisi kamera miring 60Β° dengan citra karakter
Galeri Brightness = 50 (Microsoft office picture manager) Brightness = 0 (Microsoft office picture manager) Brightness = -50 (Microsoft office picture manager) Langsung Gaussian blur 1,5px (Adobe imageready) Rotate 0Β° Rotate 30Β° Rotate 60Β°
18 Tabel 6 Contoh pengujian karakter Cina (sederhana) No Skenario Citra OCRed teks Terjemahan Kamera Galeri Kamera Galeri Indonesia / Inggris 1 Normal Geser / Slide 2 Sangat Geser / terang Slide 3 Redup Geser / Slide 4 Blur Geser / Slide
Akurasi 6/6 6/6 6/6 3/6
5
Miring 30Β°
-
0
6
Miring 60Β°
-
0
7
Vertikal
Geser / Slide
6/6
Dari skenario pengujian dan contoh pengujian dalam pengenalan karakter di atas yang dilakukan pada masing-masing bahasa dengan karakter nonlatin, maka diperoleh akurasi pengenalan karakter pada masing-masing bahasa dengan masing-masing skenario seperti pada Tabel 7 dengan rincian hasil pengujian yang terdapat pada Lampiran 1. No . 1 2 3 4 5 6 7
Pengujian Normal Sangat terang Redup Miring 30Β° Miring 60Β° Blur / kabur Vertikal
Tabel 7 Akurasi pada masing-masing skenario Bahasa Cina Jepang Korea Rusia Thailand 100 96 92.05 93.39 93.75 78.3 77.3 82.5 85.35 88.5
Rata-rata akurasi 95.03 82.39
95 5 0 61.7
84 28.7 0 54.5
83.75 15.84 0 45.45
85 67.91 8.5 52.25
83.75 43.42 8.34 62.28
86.3 32.17 3.36 55.35
90.8
94
48.85
-
-
77.88
Berdasarkan tabel 7, dapat disampaikan bahwa akurasi terbaik pengenalan karakter adalah 95.03% yaitu ketika kondisi pencahayaan normal dengan kemiringan 0Β° dan citra tidak kabur atau blur. Akurasi pengenalan karakter sedikit menurun ketika pencahayaan dibuat sangat terang maupun redup dan pada
19 pengujian karakter dengan penulisan secara vertikal pada bahasa Cina dan Jepang, tetapi hal tersebut tidak berlaku pada karakter Korea. Akurasi juga akan menurun tajam ketika citra dimiringkan maupun dibuat kabur karena proses pengenalan karakter pada citra tidak invariant terhadap kemiringan walaupun pada tahap line finding terdapat fungsi untuk skewing / memiringkan karakter pada citra. Akurasi pada pengujian citra kabur atau blur juga menurun cukup tajam karena proses removing noise menggunakan metode unsharp mask yaitu dengan cara mengurangi nilai citra asli dengan citra yang sudah melalui tahap smoothing. Oleh sebab itu, jika citra asli yang digunakan sudah dalam keadaan kabur, tentunya akan lebih sulit untuk menemukan outline pada karakter yang diuji. Adapun contoh pengujian penerjemahan karakter secara online menggunakan Microsoft Translator dapat dilihat pada Tabel 8.
No.
Bahasa
1
Cina
2
Jepang
3 4 5
Korea Rusia Thailand
Tabel 8 Contoh pengujian penerjemahan Terjemahan Hasil pengenalan karakter Indonesia Inggris Geser Slide Area memancing Toilet Peringatan Terima kasih
Fishing area Toilet Warning Thank you
Evaluasi Pada tahap evaluasi usability ini diberikan sejumlah task atau tugas berupa kuesioner yang sudah dipersiapkan sebelumnya kepada pengguna saat berinteraksi dengan sistem. Bentuk dari lembar kuesioner dan tanggapan dari para responden terdapat pada Lampiran 2. Kuesioner dirancang menggunakan bahasa yang mudah dimengerti oleh pengguna. Klasifikasi penarikan kesimpulan berdasarkan rata-rata nilai evaluasi kuesioner terdapat pada Tabel 9. Tabel 9 Klasifikasi penarikan kesimpulan hasil evaluasi usability Nilai Kesimpulan <20% Sangat tidak setuju bahwa aplikasi sangat mudah dipahami dan dimengerti > 20% dan < 40% Tidak setuju bahwa aplikasi sangat mudah dipahami dan dimengerti > 40% dan < 60% Ragu-ragu bahwa aplikasi sangat mudah dipahami dan dimengerti > 60% dan < 80% Setuju bahwa aplikasi sangat mudah dipahami dan dimengerti > 80% Sangat setuju bahwa aplikasi sangat mudah dipahami dan dimengerti Berdasarkan kuesioner di atas, dilakukan evaluasi usability terhadap penilaian 5 responden. Adapun persentase penilaian tiap responden didapat
20 πππππ βππ ππ ππ’ππ πππππ
dengan perhitungan, x 100%. Berikut penilaian evaluasi πππππ ππππ ππππ usability menggunakan kuesioner pada tiap responden terdapat pada Tabel 10. Tabel 10 Evaluasi usability Penilaian No. Responden SS S RR TS 1 Pertama 5 20 2 Kedua 5 13 7 3 Ketiga 14 10 1 4 Keempat 2 18 5 5 Kelima 6 15 4 Rata-rata penilaian tiap responden (%)
STS
Nilai (%) 84 78.4 90.4 77.6 81.6 82.4
Pada tabel evaluasi usability di atas dapat disampaikan bahwa pada ratarata nilai evaluasi usability menggunakan kuesioner adalah 82.4% yang berarti aplikasi yang dibangun pada penelitian ini yaitu aplikasi Android penerjemah bahasa nonlatin dengan pengenalan citra karakter sangat mudah dimengerti dan sangat mudah untuk dipelajari dalam penggunaanya.
SIMPULAN DAN SARAN Simpulan Pada penelitian ini menghasilkan aplikasi Android untuk pengenalan citra karakter nonlatin dengan Tesseract library. Dari pengujian terhadap 650 data uji citra yang terdiri dari 5 bahasa (Cina sederhana, Jepang, Korea, Rusia, dan Thailand), sistem mampu mengenali citra karakter nonlatin dengan akurasi terbaik sebesar 95.03% pada kondisi pencahayaan normal dengan kemiringan 0Β°, serta mampu menerjemahkannya ke dalam bahasa Indonesia dan Inggris. Pengujian pada citra yang divariasikan pada intensitas cahaya, kemiringan, blur atau kabur tidaknya citra, dan penulisan secara vertikal pada bahasa yang mendukung penulisan secara vertikal, menunjukkan bahwa faktor-faktor tersebut dapat menurunkan tingkat akurasi pengenalan karakter. Hasil pengujian usability responden mendapatkan nilai sebesar 82.4%, hal ini menunjukkan bahwa aplikasi Android yang dibangun sangat mudah dipelajari dan dimengerti oleh pengguna. Saran Sistem aplikasi pengenalan citra karakter nonlatin yang dibangun masih memiliki kekurangan, sehingga diperlukan adanya pengembangan dan perbaikan agar sistem menjadi lebih baik. Beberapa tahapan pengenalan pola yang perlu diperbaiki yaitu pada bagian line finding agar lebih invariant terhadap kemiringan karakter pada citra serta perbaikan pada bagian removing noise agar menjadi lebih tangguh dalam mengenali citra dalam keadaan kabur atau blur.
21
DAFTAR PUSTAKA Fisher R, Perkins S, Walker A, Wolfart E. 2003. Gaussian Smoothing. Alertbox [Internet]. [diunduh 2015 Februari 01]. Tersedia pada http://homepages.inf.ed.ac.uk/rbf/HIPR2/gsmooth.htm. Goodman S. 2014. Machine Translation β Google Translate vs Bing Translator. Linnworks [Internet]. (2014 Januari 15 [diunduh pada 2015 maret 1]). Tersedia pada http://blog.linnworks.com/google-bing-translate/. Khan M, Khan F. 2012. A Comparative Study of White Box, Black Box and Grey Box Testing Techniques. International Journal of Computer Science and Applications. 3:12-15.doi:10.14569/IJACSA.2012.030603. Nielsen J. 2012. Usability 101: Introduction to Usability. Nielsen Norman Group [Internet]. (2012 januari 4 [diunduh 2014 Desember 01]). Tersedia pada http://www.nngroup.com/articles/usability-101-introduction-to-usability/. Putra D. 2004. Binerisasi Citra Tangan dengan Metode Otsu. Jurnal Teknologi Elektro. 3(2). Rubin J, Chisnell D. 2008. Handbook of Usability Testing : How to Plan, Design, and Conduct Effective Test. Indianapolis (US): Wiley Publishing Inc. Shi-zhong D. 2009. The Choice of Traditional vs. Simplified Character in US Classroom. Di dalam: Charles C, Shelly R, Lily R, Nydia L, Jennifer L, Max S, Jean Z, Rae Z, editor. US-China Education Review; 2009 Desember; Illinois, Amerika Serikat. Illinois(US): David Publishing Company. hlm: 67-73. Smith R. 2007. An Overview of the Tesseract OCR Engine. ICDAR '07: Proceedings of the Ninth International Conference on Document Analysis and Recognition II; 2007 Sept 23-26; Curitiba, Brasil. Washington DC (US): IEEE Computer Society. hlm 629-633.
22
LAMPIRAN Lampiran 1 Pengujian pengenalan karakter dan terjemahannya Pengujian citra karakter bahasa Cina (sederhana) Citra OCRed teks No Skenario Kamera Galeri Kamera Galeri 1. Normal
Terjemahan Indonesia Inggris
2/2
Sangat terang Redup Blur
2. .
Akurasi
1/2 1/2 Buka
Open
2/2
Miring 30Β° Miring 60Β°
0
Normal 7 Sangat terang
4/4
Redup
4/4
Blur
2/4
Miring 30Β° Miring 60Β°
0
4/4
Bagus sekali
Very good
0 0
Vertikal
4/4
3.
Normal 7
6/6
.
Sangat terang Redup
6/6
Blur
Geser
Slide
6/6 3/6
23 Lanjutan No
4. .
Skenario
.
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
0
Miring 60Β°
0
Vertikal
6/6
Normal 7 Sangat terang Redup
2/2 1/2 2/2 Api
Fire
1/2
Miring 30Β°
0
Miring 60Β° Normal 7
0
Sangat terang
4/4
Redup
4/4
Blur
2/4
4/4
Kartun
6.
Akurasi
Miring 3 30Β°
Blur
5.
Citra Kamera Galeri
Cartoon
Miring 30Β°
0
Miring 60Β°
0
Vertikal
2/4
Normal
Air soda
Soda water
6/6
24 Lanjutan No
7.
Skenario
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
Akurasi
Sangat terang
6/6
Redup
6/6
Blur
4/6
Miring 30Β°
1/6
Miring 60Β°
0
Vertikal
6/6
Normal
2/2
Sangat terang
1/2
Redup
2/2
Blur
8.
Citra Kamera Galeri
Air
Water
2/2
Miring 30Β° Miring 60Β°
0
Normal
4/4
Sangat terang
4/4
Redup
4/4
0
Beijing
Beijing
Blur
2/4
Miring 30Β°
0
25 Lanjutan No
9.
Skenario
Kamera
Citra Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
Akurasi
Miring 60Β°
0
Vertikal
4/4
Normal 7
6/6
Sangat terang
5/6
Redup
6/6
Blur
3/6
Miring 30Β°
Bahasa mandarin
Mandar 0 in
Miring 60Β°
0
Vertikal
5/6
10. Normal 7
4/4
Sangat terang
2/4
Redup
4/4 Listrik
Electric
Blur
2/4
Miring 30Β°
0
26 Lanjutan No
Skenario
Citra Kamera Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
Miring 60Β°
0
Vertikal
4/4
Pengujian citra karakter bahasa Jepang Citra OCRed teks No Skenario Kamera Galeri Kamera Galeri 1. Normal
Terjemahan Indonesia Inggris
Blur
.
Akurasi 2/2
Sangat terang Redup
2.
Akurasi
2/2 1/2 Anjing
Dog
1/2
Miring 30Β° Miring 60Β°
0
Normal 7 Sangat terang
9/10
Redup
10/10
Blur
10/10
Miring 30Β°
0
5/10
Area memancing
Fishing area
4/10
Miring 60Β°
0
Vertikal
8/10
27 Lanjutan Citra Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
No
Skenario
3.
Normal 7
6/6
Sangat terang
6/6
Redup
6/6
Blur
3/6
Kamera
Akurasi
.
Miring 30Β°
4. .
Hentikan
Stop it
4/6
Miring 60Β°
0
Vertikal
6/6
Normal 7
6/6
Sangat terang
5/6
Redup
6/6
Blur
3/6
Miring 30Β°
Pada hari libur
On holiday
3/6
Miring 60Β°
0
Vertikal
6/6
28 Lanjutan Citra Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
No
Skenario
5.
Normal
10/10
Sangat terang
5/10
Redup
10/10
Blur
2/10
Miring 30Β°
6.
Kamera
Permisi
Excuse me
Akurasi
3/10
Miring 60Β°
0
Vertikal
10/10
Normal
10/10
Sangat terang
7/10
Redup
10/10
Blur
4/10
Miring 30Β°
restoran
Restau- 0 rant
Miring 60Β°
0
Vertikal
10/10
29 Lanjutan Citra Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
No
Skenario
7.
Normal 7
6/6
Sangat terang
6/6
Redup
6/6
Blur
3/6
Kamera
Akurasi
.
Saya
I
Miring 30Β°
3/6
Miring 60Β°
0
Vertikal
6/6
8.
Normal 7
2/2
.
Sangat terang Redup
1/2
Blur
9.
1/2 Rumah
Home
1/2
Miring 30Β°
0
Miring 60Β°
0
Normal 7
4/4
. Sangat terang
Sushi
Sushi
4/4
Redup
4/4
Blur
3/4
30 Lanjutan No
Skenario
Citra Kamera Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
Akurasi
Miring 30Β°
0
Miring 60Β°
0
Vertikal
4/4
10. Normal 7 . Sangat
7/10 7/10
terang Redup
4/10
Blur
6/10
Miring 30Β°
Menara tokyo
Tokyo tower
5/10
Miring 60Β°
0
Vertikal
6/10
Pengujian citra karakter bahasa Korea Citra OCRed teks No Skenario Kamera Galeri Kamera Galeri 1. Normal
Terjemahan Indonesia Inggris
Akurasi 5/6
Sangat terang Redup
6/6 5/6 Ikan
Fish
Blur
2/6
Miring 30Β°
0
31 Lanjutan No
2. .
Skenario
Kamera
Citra Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
Miring 60Β°
0
Vertikal
5/6
Normal 7
4/4
Sangat terang
2/4
Redup
2/4
Blur
2/4 Lagu
3. .
Akurasi
Song
Miring 30Β°
0
Miring 60Β°
0
Vertikal
0
Normal 7
6/6
Sangat terang
6/6
Redup
6/6
Blur Kantor pos Miring 30Β°
Post office
1/6 1/6
Miring 60Β°
0
Vertikal
4/6
32 Lanjutan Citra Kamera Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
No
Skenario
4.
Normal 7
7/8
Sangat terang
4/8
Redup
7/8
.
Blur Miring 30Β°
Selamat pagi
Good mornin g
Akurasi
5/8 0
Miring 60Β°
0
Vertikal
2/8
5.
Normal 7
6/6
.
Sangat terang
6/6
Redup
3/6
Blur
6/6 Toilet
6.
Toilet
Miring 30Β°
1/6
Miring 60Β°
0
Vertikal
6/6
Normal
3/4
Sangat terang
Toko buku
Book store
2/4
33 Lanjutan No
7.
Skenario
Citra Kamera Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
Akurasi
Redup
4/4
Blur
1/4
Miring 30Β°
2/4
Miring 60Β°
0
Vertikal
0
Normal 7
4/4
Sangat terang Redup
4/4
Blur
2/4
.
4/4
Kami
8.
We
Miring 30Β°
1/4
Miring 60Β°
0
Vertikal
0
Normal 7
6/8
. Sangat terang Redup Blur
Aku cinta kamu sayangku
8/8 I love you my 8/8 love 4/8
34 Lanjutan No
Skenario
Citra Kamera Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
Akurasi
Miring 30Β°
0
Miring 60Β°
0
Vertikal
7/8
9.
Normal 7
6/6
.
Sangat terang
3/6
Redup
4/6
Blur
1/6 Sendok
Spoon
Miring 30Β°
0
Miring 60Β°
0
Vertikal
3/6
10. Normal 7
6/6
Sangat terang
6/6
Redup
6/6
Blur
Terima kasih
Thank you
3/6
Miring 30Β°
3/6
Miring 60Β°
0
35 Lanjutan No
Skenario
Citra Kamera Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
Vertikal
Akurasi 5/6
Pengujian citra karakter bahasa Rusia No
Skenario
1. Normal Sangat terang Redup Blur Miring 30Β° Miring 60Β°
Pengujian
Citra
OCRed teks
Terjemahan Indonesia Inggris
Kamera
12/12
Galeri Kamera
12/12
Galeri Kamera
6/12
Galeri Kamera
Akurasi
Ayolah
Come on
6/12
Galeri Kamera
8/12
Galeri Kamera
3/12
Galeri
2. .
7 Normal
Kamera
34/34
Galeri Sangat terang
Redup
Kamera Galeri Kamera
Dilarang melewati
Prohibited passing
17/34
17/34
Galeri Blur
Kamera Galeri
5/34
36 Lanjutan No
Skenario
Pengujian
Citra
OCRed teks
Terjemahan Indonesia Inggris
Akurasi
Kamera Miring 30Β°
21/34 Galeri Kamera
Miring 60Β°
3. Normal
0 Galeri
Kamera
7/8
Galeri Sangat terang
Redup
Kamera Galeri Kamera Galeri
Blur Miring 30Β°
Miring 60Β° 4. 7Normal
8/8
Kamera
7/8 Makan malam
Dinner 6/8
Galeri Kamera
8/8 Galeri Kamera 2/8 Galeri Kamera
Peringatan
Warning
20/28
Galeri Sangat terang
Kamera Galeri
22/28
37 Lanjutan No
Skenario
Redup
Pengujian
Citra
OCRed teks
Terjemahan Indonesia Inggris
Kamera
Akurasi
28/28
Galeri Blur
Kamera
7/28
Galeri Miring 30Β°
Kamera 20/28 Galeri Kamera
Miring 60Β° 5. 7Normal Sangat terang Redup Blur Miring 30Β° Miring 60Β° 6. Normal
0 Galeri Kamera
Kamera
6/8
Galeri Kamera
6/8
Galeri Kamera
Salju
Snow 6/8
Galeri Kamera
5/8
Galeri Kamera
0 Galeri Kamera Galeri
Sangat terang
6/8
Galeri
Kamera Galeri
8/8 Dokter
Doctor 8/8
38 Lanjutan No
Skenario Redup
Blur Miring 30Β° Miring 60Β° 7. Normal Sangat terang
Pengujian
Citra
OCRed teks
Terjemahan Indonesia Inggris
Kamera
Akurasi 7/8
Galeri Kamera
3/8
Galeri Kamera
1/8
Galeri Kamera
0
Galeri Kamera
12/12
Galeri Kamera
12/12
Galeri Kamera
Redup
12/12 Galeri
Blur
Kamera
Moskow
Moscow
6/12
Galeri Miring 30Β°
Kamera 12/12 Galeri Kamera
Miring 60Β° 8. 7Normal
2/12 Galeri Kamera Galeri
Pasar
Market
12/12
39 Lanjutan No
Skenario
Pengujian
Sangat terang
Kamera
Redup
Citra
OCRed teks
Terjemahan Indonesia Inggris
Akurasi 12/12
Galeri Kamera
12/12
Galeri Blur
Kamera
12/12
Galeri Miring 30Β°
Kamera 8/12 Galeri Kamera
Miring 60Β°
0 Galeri
9. Normal
Kamera
30/30
Galeri Sangat terang
Redup
Kamera
30/30
Galeri Kamera
Pulau indah
Beautiful island
30/30
Galeri Kamera Blur
0 Galeri
40 Lanjutan No
Skenario
Pengujian
Citra
OCRed teks
Terjemahan Indonesia Inggris
Akurasi
Kamera Miring 30Β°
21/30 Galeri
Kamera Miring 60Β°
3/30 Galeri
10. 7 Normal
Kamera
12/12
Galeri Sangat terang
Kamera 6/12 Galeri Kamera
Redup
12/12 Galeri Kamera
Blur
Berdiri
Stand 12/12
Galeri Miring 30Β°
Miring 60Β°
Kamera 8/12 Galeri Kamera 1/12 Galeri
41 Lanjutan Pengujian citra karakter bahasa Thailand Citra OCRed teks No Skenario Kamera Galeri Kamera Galeri 1. Normal
.
.
Redup
12/12
.
Halo
Hello
4/12
Miring 30Β°
3/12
Miring 60Β°
3/12
Normal 7 Sangat terang Redup
6/12 6/12 0 Jalan tol
Toll road
6/12
Miring 30Β°
3/12
Miring 60Β° Normal 7 Sangat terang Redup
0
Blur
4.
12/12 12/12
Blur
3.
Akurasi
Sangat terang
Blur
2.
Terjemahan Indonesia Inggris
Miring 30Β° Miring 60Β° Normal 7
6/6 6/6 6/6 Bintang
Star
6/6 0 0 7/8
Harimau
Tiger
42 Lanjutan No
Skenario
Citra Kamera Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
Akurasi
Sangat terang Redup
8/8
Blur
4/8
Miring 30Β° Miring 60Β°
4/8
5.
Normal 7
6/6
.
Sangat terang
6/6
Redup
6/6
Blur
6.
.
1/6
Dijual
Sale
5/6
Miring 30Β°
4/6
Miring 60Β°
1/6
Normal
8/8
Sangat terang
4/8
Redup
8/8
Blur
7.
8/8
Pulau
Island
8/8
Miring 30Β°
5/8
Miring 60Β°
1/8
Normal 7
Tas
Bag
14/14
43 Lanjutan No
Skenario
Citra Kamera Galeri
OCRed teks Kamera Galeri
Terjemahan Indonesia Inggris
Akurasi
Sangat terang
12/14
Redup
14/14
Blur
7/14
Miring 30Β°
3/14
Miring 60Β°
0
8.
Normal 7
12/12
.
Sangat terang
12/12
Redup
6/12
Blur
9. .
Terima kasih
Thank you
6/12
Miring 30Β°
9/12
Miring 60Β°
2/12
Normal 7 Sangat terang
8/8
Redup
7/8
Blur
8/8
Perempuan
Women 5/8
Miring 30Β° Miring 60Β° 10. Normal 7 .
5/8 0 24 jam sehari
24 hours a day
8/8
44 Lanjutan Citra No
OCRed teks
Terjemahan
Skenario
Akurasi Kamera
Galeri
Kamera
Galeri
Indonesia
Inggris
Sangat terang
8/8
Redup
8/8
Blur
4/8
Miring 30Β°
5/8
Miring 60Β°
0
Lampiran 2 Lembar kuesioner dengan tanggapan responden PENGUJIAN USABILITY APLIKASI ANDROID PENERJEMAH BAHASA NON-LATIN DENGAN PENGENALAN CITRA KARAKTER
DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR 2015
Nama Lengkap : ________________________________________ Usia : ____ tahun Tempat/tanggal Lahir : ________________________________________ Jenis Kelamin : 1. Laki-laki 2. Perempuan KETERANGAN: SS= Sangat Setuju RR=Ragu-ragu STS=Sangat Tidak Setuju S=Setuju TS=Tidak Setuju Bubuhkan tanda ceklist (β) pada kolom yang nilainya paling sesuai menurut Anda. Jawaban yang jujur sangat membantu untuk keberhasilan penelitian ini. Terima kasih atas partisipasi Anda.
45 Lanjutan No
Pertanyaan SS
Aspek Learnability 1 Apakah anda berhasil menemukan aplikasi Android sebagai penerjemah bahasa nonlatin dengan pengenalan citra karakter? 2 Apakah ikon aplikasi mudah dikenali? 3 Apakah anda berhasil membuka aplikasi Android βNon-Latin Translatorβ? Aspek Efficiency 4 Apakah tampilan aplikasi mudah dikenali? 5 Apakah tulisan pada layar mudah dibaca? 6 Apakah komposisi warna sudah sesuai? 7 Apakah aplikasi mudah dioperasikan? Aspek Memorability 8 Apakah nama aplikasi mudah diingat? 9 Apakah fungsi aplikasi mudah diingat? 10 Apakah tombol-tombol pada aplikasi mudah dimengerti? 11 Apakah tombol-tombol pada aplikasi mudah digunakan? 12 Apakah bahasa yang digunakan mudah dimengerti? Aspek Errors 13 Apakah aplikasi dapat melakukan pemilihan bahasa asal dengan baik? 14 Apakah anda berhasil menggunakan tombol Take Image? 15 Apakah anda berhasil melakukan fungsi crop? 16 Apakah aplikasi berhasil mengambil gambar dari kamera dan galeri? 17 Apakah aplikasi dapat mengenali karakter nonlatin dengan baik? 18 Apakah aplikasi dapat melakukan pemilihan bahasa tujuan dengan baik? 19 Apakah aplikasi dapat menerjemahkan karakter nonlatin ke dalam bahasa Indonesia dan Inggris? 20 Apakah anda berhasil menggunakan tombol Reset? Aspek Satisfaction 21 Apakah anda setuju aplikasi ini cukup membantu dalam mengenali citra karakter nonlatin? 22 Apakah anda setuju aplikasi ini cukup membantu menerjemahkan teks nonlatin?
S
1
4
2
5 3
4 2 1 2
1 3 3 3
1 1 2
2 4 3
2
3
Penilaian RR TS STS
1 2
4
1
4
1
1
4
3
3 1
2 1
2
2
1
5 5 2
2
1
4
2
3
1
46 Lanjutan No 23 24 25
Pertanyaan Apakah spesifikasi aplikasi yang ditawarkan sesuai dengan kebutuhan? Apakah anda ingin menggunakan aplikasi ini pada perangkat mobile anda? Apakah anda akan menyarankan teman menggunakan aplikasi ini?
SS 1
S 2
Penilaian RR TS STS 2
1
1
3
1
2
2
47
RIWAYAT HIDUP Penulis dilahirkan di Semarang pada 30 Mei 1990 dari pasangan Bapak Purwoto dan Ibu Morita. Penulis yang merupakan lulusan dari SMA N 15 Semarang pada tahun 2008 kemudian melanjutkan studi dengan jenjang diploma Politeknik Telkom Bandung hingga pada tahun 2011 dan pada tahun 2012 melanjutkan pendidikan sebagai mahasiswa program studi Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.