APLIKASI ANDROID PENERJEMAH BAHASA NON-LATIN DENGAN PENGENALAN CITRA KARAKTER ADI KIRANA WIJAYAJATI

APLIKASI ANDROID PENERJEMAH BAHASA NON-LATIN DENGAN PENGENALAN CITRA KARAKTER

ADI KIRANA WIJAYAJATI

DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015

PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Aplikasi Android Penerjemah Bahasa non-Latin dengan Pengenalan Citra Karakter adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, April 2015

Adi Kirana Wijayajati NIM G64124041

ABSTRAK ADI KIRANA WIJAYAJATI. Aplikasi Android Penerjemah Bahasa non-Latin dengan Pengenalan Citra Karakter. Dibimbing oleh KARLINA KHIYARIN NISA. Bahasa dengan karakter nonlatin merupakan bahasa yang sulit untuk dipelajari karena penulisannya yang relatif rumit. Beberapa bahasa yang menggunakan karakter nonlatin antara lain Arab, Cina (sederhana), Rusia, Jepang, Korea, dan Thailand. Pada penelitian ini, suatu sistem pengenalan karakter nonlatin berbasis Android dirancang untuk mengenali citra karakter nonlatin menggunakan Tesseract library OCR (Optical Character Recognition) dan menerjemahkannya menjadi bahasa Indonesia dan Inggris menggunakan Microsoft Translator. OCR adalah teknik untuk mengubah teks nondigital menjadi teks digital atau dapat diartikan sebagai pengenalan karakter optik. Pada penelitian ini terdapat 8 kebutuhan fungsional, yaitu memilih bahasa asal, mengambil citra menggunakan kamera dan memotongnya, mengambil citra melalui galeri, melakukan konversi dari citra ke teks, mengedit teks nonlatin hasil OCR, memilih bahasa tujuan, menampilkan hasil terjemahannya, dan me-reset aplikasi. Berdasarkan 650 contoh karakter nonlatin yang terdiri dari 5 bahasa telah diuji, nilai akurasi terbaik yang didapat adalah 95.03% pada kondisi pencahayaan normal. Adapun faktor-faktor yang dapat mempengaruhi akurasi tersebut antara lain: intensitas cahaya, kemiringan, fokus, dan penulisan secara vertikal. Evaluasi usability menghasilkan nilai 82.4%. Kata Kunci: Android, citra, nonlatin, OCR, teks, Tesseract.

ABSTRACT ADI KIRANA WIJAYAJATI. Android Application Language Interpreter with Recognition of non-Latin Character Image. Supervised by KARLINA KHIYARIN NISA. Languages with nonlatin characters are more difficult to learn because the writing is relatively complicated. Some languages that use nonlatin characters are Chinese (simplified), Russian, Japanese, Korean, and Thai. In this study, a nonlatin character recognition system based on Android is designed to recognize the image of nonlatin characters using the Tesseract library OCR (Optical Character Recognition) and translated into Bahasa Indonesia and English. OCR is a technique to convert nondigital text into digital text. In this study, there were 8 functional requirements which are choosing origin language, taking image with a camera and cropping, taking an image from the gallery, converting an image to text, editing nonlatin text of OCR result, choosing target language, displaying the translation, and resetting. Based on 650 examples of nonlatin characters that consisted of 5 languages that have been tested, the best accuracy for the result is 95.03% on normal light. Factors that effect the accuracy are the intensity of light, tilted text, motion bluring, and vertical writing. The value of usability evaluation is 82.4%. Keywords: Android, image, nonlatin, OCR, Tesseract, text.

APLIKASI ANDROID PENERJEMAH BAHASA NON-LATIN DENGAN PENGENALAN CITRA KARAKTER

ADI KIRANA WIJAYAJATI

Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015

Penguji: 1 Dr Ir Agus Buono, MSi MKom 2 Muhammad Asyhar Agmalaro, SSi MKom

Judul Skripsi : Aplikasi Android Penerjemah Bahasa non-Latin dengan Pengenalan Citra Karakter Nama : Adi Kirana Wijayajati NIM : G64124041

Disetujui oleh

Karlina Khiyarin Nisa, SKom MT Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom Ketua Departemen

Tanggal Lulus:

PRAKATA Alhamdulillahi rabbil ‘alamin, puji syukur penulis panjatkan ke hadirat Allah subhanahu wa Ta'ala atas berkat, rahmat, taufik, dan hidayah-Nya sehingga penyusunan skripsi yang berjudul Aplikasi Android Penerjemah Bahasa non-Latin dengan Pengenalan Citra Karakter dapat diselesaikan dengan baik. Sholawat serta salam semoga selalu tercurahkan kepada Nabi Muhammad shalallahu 'alaihi wassallam beserta keluarga, sahabat, dan para pengikutnya yang telah memberikan contoh dalam meraih kebahagiaan di dunia dan akhirat. Terima kasih penulis ucapkan kepada orang tua penulis, ayahanda tercinta Purwoto yang selalu menjadi inspirasi kebijaksanaan dalam tutur dan laku penulis. Ibunda Morita, yang tak pernah lelah memberikan motivasi wejangan, doa, cinta, dan kasih sayang dalam mendidik. Dosen pembimbing Ibu Karlina Khiyarin Nisa, SKom MT atas waktu, ilmu, kesabaran, nasihat, dan masukan yang selalu diberikan selama pengerjaan tugas akhir ini, Bapak Dr Ir Agus Buono, MSi MKom dan Bapak Muhammad Asyhar Agmalaro, SSi MKom selaku penguji atas waktu, masukan, dan koreksinya. Serta teman-teman Ilmu Komputer alih jenis angkatan 7 atas pengalaman berbagi ilmu serta atas kebersamaan dan dukungannya selama penulis menjalani waktu di Departemen Ilmu Komputer IPB. Semoga karya ilmiah ini bermanfaat. Bogor, April 2015

Adi Kirana Wijayajati

DAFTAR ISI DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN Latar Belakang

1 1

Perumusan Masalah

2

Tujuan

2

Manfaat Penelitian

2

Ruang Lingkup Penelitian

2

METODE Pengumpulan Data

2 3

Analisa Pengenalan Karakter

3

Penerjemahan Karakter non-Latin

4

Perancangan Aplikasi

4

Implementasi

4

Pengujian

5

Evaluasi

5

HASIL DAN PEMBAHASAN Pengumpulan Data

5 5

Analisa Pengenalan Karakter

6

Penerjemahan Karakter non-Latin

11

Perancangan Aplikasi

12

Implementasi

15

Pengujian

16

Evaluasi

19

SIMPULAN DAN SARAN Simpulan Saran DAFTAR PUSTAKA LAMPIRAN RIWAYAT HIDUP

20 20 20 21 22 47

DAFTAR TABEL 1 Data uji citra karakter nonlatin 2 Rancangan antarmuka pengguna 3 Implementasi sistem 4 Pengujian sistem menggunakan metode black box 5 Skenario pengujian 6 Contoh pengujian karakter Cina (sederhana) 7 Akurasi pada masing-masing skenario 8 Contoh pengujian penerjemahan 9 Klasifikasi penarikan kesimpulan hasil evaluasi usability 10 Evaluasi usability

6 15 16 17 17 18 18 19 19 20

DAFTAR GAMBAR 1 Metode penelitian 2 Alur kerja Tesseract OCR Engine 3 Diagram alur Grayscaling 4 Ilustrasi Gaussian Smoothing 2 dimensi 5 Algoritme Otsu 6 Identifikasi outline 7 Contoh fitted baseline 8 Contoh pemisahan karakter 9 Use case diagram 10 Activity diagram

3 3 7 8 9 10 10 11 12 14

DAFTAR LAMPIRAN 1 Pengujian pengenalan karakter dan terjemahannya 2 Lembar kuesioner dengan tanggapan responden

22 44

PENDAHULUAN Latar Belakang Bahasa merupakan protokol dalam berkomunikasi, penggunaan bahasa yang sesuai sangat penting dalam terciptanya komunikasi untuk mengirim maupun menerima pesan yang akan diolah menjadi informasi. Namun, dalam pengaplikasiannya sangat sulit untuk mengetahui pesan yang yang disampaikan secara tertulis dan menggunakan bahasa dengan karakter nonlatin seperti Cina, Jepang, Korea, Rusia, dan Thailand. Dalam proses pembelajarannya, untuk mengenali dan menerjemahkan karakter nonlatin yang kita jumpai cukup sulit. Hal ini dikarenakan proses menterjemahkan memerlukan masukan berupa teks dengan karakter nonlatin. Untuk mengatasi masalah tersebut, teknik optical character recognition (OCR) dapat dimanfaatkan. OCR merupakan teknik pengenalan karakter optik yang berfungsi untuk mengubah karakter teks nondigital menjadi teks dalam bentuk digital. Namun, dalam implementasinya diperlukan suatu perangkat mobile untuk menjalankan teknik pengenalan karakter optik agar proses pengenalan karakter nonlatin dapat dilakukan di mana saja dan kapan saja, misalnya ketika sedang melakukan perjalanan pariwisata ke negara yang menggunakan karakter nonlatin sebagai huruf resmi negara tersebut. Android merupakan sistem operasi mobile phone open source yang berbasis Linux menggunakan bahasa pemograman Java. Selain mendukung pengembangan standar terbuka pada perangkat mobile. Adapun fitur pendukung yang disediakan oleh Android agar memudahkan pengembang untuk mengembangkan aplikasi antara lain: storage, network, multimedia, GPS, dan phone service (Fajaruddin 2011). Pada penelitian ini akan menghasilkan suatu aplikasi pengenalan karakter nonlatin dan menerjemahkannya ke dalam karakter latin pada bahasa Indonesia dan Inggris. Tidak seperti aplikasi Android lainnya, misal Word Lens yang hanya mendukung bahasa Rusia sebagai bahasa dengan karakter nonlatin untuk diterjemahkan ke dalam bahasa Inggris, pada aplikasi yang akan dibangun juga mendukung bahasa dengan karakter nonlatin lainnya, yaitu Cina (sederhana), Jepang, Korea, dan Thailand untuk nantinya diterjemahkan ke dalam bahasa Inggris dan Indonesia. Pada proses pengenalan karakter nonlatin diperlukan suatu library OCR open source, yaitu Tesseract. Mesin OCR yang berbasis bahasa pemrograman C/C++ ini akan diterapkan pada perangkat Android dengan menggunakan bahasa pemrograman Java. Pada penelitan sebelumnya, tesseract OCR engine menghasilkan akurasi yang cukup besar, yaitu 96.33% (Smith 2007). Dengan mengaplikasikan Tesseract OCR Engine, penelitian ini diharapkan menghasilkan akurasi yang besar pula. Sedangkan dalam proses penerjemahan dilakukan secara online menggunakan Microsoft Translator. Penggunaan Microsoft Translator didasarkan pada tingkat akurasi dalam penerjemahan yang lebih tinggi dibandingkan kompetitor utamanya yaitu Google translate (Goodman 2014). Penelitian ini juga melakukan evaluasi usability menggunakan kuesioner yang meliputi learnability, efficiency, memorability, errors, dan satisfaction.

2 Perumusan Masalah 1 2 3 4

Perumusan masalah pada penelitian ini antara lain: Bagaimana Tesseract OCR engine dapat diterapkan dalam pengenalan citra karakter nonlatin pada perangkat Android? Seberapa besar keakuratan Tesseract OCR engine dalam mengenali karakter nonlatin? Bagaimana pengaruh intensitas cahaya, kemiringan, fokus, dan penulisan karakter secara vertikal terhadap keakuratan pengenalan karakter? Bagaimana hasil evaluasi usability melalui kuesioner kepada pengguna? Tujuan

1 2 3 4

Tujuan pada penelitian ini antara lain: Menerapkan tesseract OCR engine pada perangkat Android untuk mengenali citra karakter nonlatin. Mengetahui keakuratan Tesseract OCR engine dalam mengenali citra karakter nonlatin. Mengetahui pengaruh intensitas cahaya, kemiringan, fokus, dan penulisan secara vertikal terhadap keakuratan pengenalan karakter. Mengetahui hasil evaluasi usability melalui kuesioner kepada pengguna. Manfaat Penelitian

Pada penelitian ini, manfaat yang diperoleh adalah membantu masyarakat dalam mengenali karakter nonlatin dengan bahasa Cina (sederhana), Jepang, Korea, Rusia, dan Thailand dalam bentuk nondigital ke dalam bentuk digital serta menerjemahkannya ke dalam bahasa Indonesia dan Inggris pada suatu aplikasi mobile. Ruang Lingkup Penelitian Ruang lingkup pada penelitian ini antara lain: 1 2

3 4 5

Pengenalan karakter nonlatin dilakukan pada citra yang bukan hasil tulisan tangan. Karakter nonlatin hanya bahasa dengan karakter yang didukung oleh Tesseract OCR dan Microsoft Translator yaitu Cina (sederhana), Jepang, Korea, Rusia, dan Thailand. Pengguna sudah mengetahui bahasa untuk karakter yang akan dikenali. Masukan citra memiliki ekstensi yang didukung oleh Android dan tesseract OCR, yaitu format JPEG, GIF, PNG,dan BMP. Pengujian pengenalan karakter dilakukan pada citra yang divariasikan pada intensitas cahaya, kemiringan, fokus, dan penulisan secara vertikal.

METODE Metode pada penelitian ini terdiri dari beberapa tahapan dengan alur kerja yang dapat dilihat pada Gambar 1.

3

Gambar 1 Metode penelitian Pengumpulan Data Pada tahap awal penelitian, dilakukan pengumpulan data uji citra karakter nonlatin berupa citra digital dan citra nondigital. Pada penelitian ini, pemilihan bahasa dengan karakter nonlatin antara lain: Cina (sederhana), Jepang, Korea, Rusia, dan Thailand. Pemilihan karakter Cina sederhana dengan pertimbangan bahwa dalam pengaplikasiannya lebih banyak digunakan dan lebih mudah dalam pengenalannya dibandingkan karakter Cina (tradisional) (Shi-zong 2009). Analisa Pengenalan Karakter Pada penelitian ini, proses pengenalan citra karakter dilakukan dengan menggunakan Tesseract OCR Engine. Mesin OCR dikembangkan di HewlettPackard (HP) pada tahun 1984 dan 1994 (Smith 2007). Adapun alur kerja dalam pengenalan citra karakter dapat dilihat pada Gambar 2.

Image Preprocessing Grayscaling Removing noise Thresholding

Citra Biner

Feature Extraction Connected Component Labelling Segmentation Line Finding Baseline Fitting Fixed Pitch Detection Non Fixed Pitch Detection Blob

Citra Teks

Word Recognition Adaptive Classifier

Gambar 2 Alur kerja Tesseract OCR Engine

4 Penerjemahan Karakter non-Latin Setelah karakter nonlatin berhasil dikenali dengan baik. Proses selajutnya adalah penerjemahan karakter nonlatin ke dalam bahasa Indonesia atau Inggris. Pemilihan bahasa Indonesia dan Inggris sebagai bahasa tujuan dalam penerjemahan dikarenakan penelitian ini dibuat di negara Indonesia menggunakan bahasa Indonesia, sedangkan bahasa Inggris merupakan bahasa internasional yang secara resmi dipelajari oleh hampir semua negara di dunia. Perancangan Aplikasi Pada tahap perancangan aplikasi terdiri dari beberapa proses yaitu use case diagram, activity diagram dan perancangan antarmuka. Use Case Diagram Use case diagram merupakan salah satu dari UML (Unified Modelling Language) diagram yang bertujuan untuk memodelkan proses bisnis dari perspektif pengguna. Pada use case diagram terdiri dari aktor sebagai pengguna aplikasi dan aksi-aksi yang dapat dilakukan oleh aktor tersebut. Activity Diagram Activity diagram menggambarkan alur aktivitas dalam sistem yang akan dibangun sehingga dapat mencerminkan perancangan alur sistem dari awal, proses yang mungkin terjadi di dalamnya, dan akhir dari alur sistem yang telah diaplikasikan. Perancangan Tampilan Antarmuka Tampilan antarmuka merupakan media komunikasi yang digunakan antara pengguna dan sistem. Sistem yang akan dibangun diharapkan mudah dipahami dan dimengerti oleh pengguna agar fungsi dari sistem dapat dioperasikan dengan baik oleh pengguna. Implementasi Pada penelitian ini, sistem dibangun dan diimplementasikan menggunakan perangkat keras dan perangkat lunak dengan rincian sebagai berikut. 1

Perangkat keras a Sony Ericsson ST18i (Xperia Ray) dengan sistem operasi Android Ice Cream Sandwich v4.0.4 i CPU 1 GHz Scorpion ii Memory internal 512 MB dan microSD 8 GB iii Kamera 8 MP, 3264 x 2448 pixels, autofocus, LED flash b Dell inspiron dengan sistem operasi Windows 7 Home Basic i Intel Core i3-2370M Processor ii Nvidia GeForce GT 630M DDR3 1 GB iii Memory 4 GB DDR3

5 iv Harddisk 500 GB 5400 RPM 2. Perangkat lunak a Eclipse Juno ADT b Android SDK c Tesseract OCR d Tesseract Traineddata e API Microsoft Translaor 0.6.1 Pengujian Tahap pengujian menggunakan metode black box terhadap fungsi-fungsi utama pada sistem yang telah diimplementasikan pada perangkat mobile Android. Pengujian pengenalan karakter oleh Tesseract OCR menggunakan data uji karakter nonlatin dari masing-masing bahasa dengan skenario pengujian yang berbeda-beda. Adapun skenario pengujian yang dimaksud mencakup pengujian secara normal, pengujian dengan intensitas cahaya sangat terang dan redup, pengujian dengan kemiringan 30 dan 60 derajat, pengujian dengan citra blur atau kabur, dan pengujian dengan karakter vertikal. Hal ini diperlukan untuk mengetahui tingkat akurasi pada masing-masing skenario pengujian dalam mengenali citra karakter nonlatin. Evaluasi Pada tahap terakhir yaitu evaluasi dilakukan dengan cara memberikan kuesioner kepada pengguna aplikasi yang telah dibangun ini. Kuesioner dirancang dengan memperhatikan lima aspek usability yang terdiri dari learnability, efficiency, memorability, errors,dan satisfaction (Nielsen 2012). Tujuan utama kuesioner adalah untuk mengumpulkan informasi dari responden berupa tingkat kepuasan mengenai kekurangan dan kelebihan suatu aplikasi (Rubin dan Chissnell 2008). Kepuasan pengguna diukur menggunakan skala Likert 1 sampai 5 untuk membantu pengguna mengekspresikan kepuasan mereka terhadap aplikasi. Adapun penilaian kuesioner untuk mengukur tingkat usability adalah sebagai berikut. 1 2 3 4 5

SS (Sangat Setuju) nilai 5 S (Setuju) nilai 4 RR (Ragu-ragu) nilai 3 TS (Tidak Setuju) nilai 2 STS (Sangat Tidak Setuju) nilai 1

HASIL DAN PEMBAHASAN Pengumpulan Data Pengumpulan data dilakukan dengan cara mencari 10 citra karakter nonlatin pada masing-masing bahasa sebagai data uji digital. Data uji digital diuji mengunakan fitur galeri pada perangkat mobile Android. Sedangkan data uji nondigital merupakan hasil cetak dari data uji digital yang nantinya akan diuji

6 menggunakan fungsi kamera pada perangkat mobile Android. Adapun data uji tersebut untuk lebih lengkapnya dapat dilihat pada Tabel 1.

Bahasa

Tabel 1 Data uji citra karakter nonlatin Data Uji Citra Karakter non-Latin ke1,5,9 2,6,10 3,7

4,8

Cina (sederhana)

Jepang

Korea

Rusia

Thailand

Analisa Pengenalan Karakter Image Preprocessing Pada bagian image preprocessing dilakukan proses grayscaling, removing noise dan thresholding. Pada bagian ini diharapkan menghasilkan citra biner yang nantinya menjadi masukan pada tahap berikutnya tahap feature extraction. 1 Grayscaling Konversi citra berwarna menjadi grayscale merupakan tahapan awal dalam image preprocessing. Pada proses grayscaling, citra yang pada awalnya terdiri dari 3 layer matriks, yaitu R-layer, G-layer, dan B-layer akan diubah menjadi 1 layer matriks dan hasilnya adalah citra grayscale yang hanya memiliki derajat keabuan. Untuk mengubah citra berwarna, fungsi yang digunakan adalah

7 ARGB_8888 yaitu mendefinisikan nilai alpha channel, merah, hijau, dan biru yang kemudian dapat dirumuskan dengan persamaan di bawah agar menjadi citra dengan derajat keabuan. gs= ((r + g +b)/3) & 0xFF Dengan format warna ini dihasilkan citra grayscale dengan intensitas keabuan yang dipengaruhi oleh variabel warna merah hijau, dan biru. Sedangkan nilai alpha channel berupa 0xFF merupakan ketransparanan dengan nilai 0. Adapun diagram alur dari proses grayscaling dapat dilihat pada Gambar 3.

Start Loading Image h = image.getHeight() w = image.getWeight() x=0 y=0

No

x<w ? Yes y
No

x=x+1

R= Color.red(x,y) G= Color.green(x,y) B= Color.blue(x,y) set pixel (x,y) with (R + G + B) / 3 y=y+1 Grayscaled image

finish

Gambar 3 Diagram alur Grayscaling

8 2 Removing Noise Pada penelitian ini, proses removing noise menggunakan unsharp mask yang merupakan hasil pengurangan citra asli dengan citra yang telah diperhalus atau telah melalui proses smoothing. g(x,y) = f(x,y) – 𝑓𝑠𝑚𝑜𝑜𝑡 ℎ𝑒𝑑 (𝑥, 𝑦) Proses smoothing pada penelitian ini menggunakan gaussian smoothing dengan konvolusi matriks 3x3. Smoothing dilakukan dengan tujuan untuk menghaluskan citra dan mendekatkan simbol yang berbentuk karakter yang memiliki ruang menjadi lebih mudah dikenali oleh program aplikasi sebagai suatu karakter yang utuh dan bukan simbol-simbol yang terpisah (Fisher et al. 2003). Adapun distribusi gaussian smoothing dalam citra 2 dimensi dapat dirumuskan sebagai berikut. 1

𝑓𝑠𝑚𝑜𝑜𝑡 ℎ𝑒𝑑 (𝑥, 𝑦) = 2𝜋𝜎 2 𝑒

𝑥 2 +𝑦 2 2𝜎 2

−

Dari perumusan gaussian smoothing dalam berntuk 2 dimensi tersebut, maka dapat diilustrasikan dengan Gambar 4.

Gambar 4 Ilustrasi Gaussian Smoothing 2 dimensi 3 Thresholding Pada proses selanjutnya citra akan berubah menjadi citra biner yang hanya mempunyai dua kemungkinan nilai yaitu 0 untuk hitam dan 1 untuk putih. Pada proses ini tiap piksel pada citra akan diklasifikasikan berdasarkan ambang batas tertentu, jika nilai piksel kurang dari ambang batas, maka piksel tersebut akan bernilai 0. Namun, jika nilai piksel lebih dari atau sama dengan ambang batas, maka piksel tersebut akan bernilai 1. Dalam proses binerisasi citra ini menggunakan global thresholding metode Otsu dengan tujuan untuk membagi histogram citra gray ke dalam dua daerah yang berbeda secara otomatis tanpa membutuhkan masukan nilai ambang batas. Probabilitas setiap piksel pada level ke-i dapat dinyatakan sebagai berikut. 𝑝𝑖 = 𝑛𝑖 / N 𝑛𝑖 = jumlah piksel pada level ke-i N = total piksel pada citra

9 Dalam menentukan nilai ambang batas pada metode Otsu, ada beberapa hal yang perlu diketahui, nilai zeroth cumulative moment, first cumulative moment, dan nilai mean berturut-turut dapat dinyatakan dengan rumus berikut (Putra 2004). ω(k)=

𝑘 𝑖=1 𝑃𝑖

μ(k)=

𝑘 𝑖=1 𝑖. 𝑃𝑖

𝜇𝑇 =

𝐿 𝑖=1 𝑖. 𝑃𝑖

Nilai ambang k dapat ditentukan dengan memaksimumkan persamaan: 𝑚𝑎𝑥 2 𝜎𝐵2 (𝑘 ∗ ) = 1≤𝑘<𝑙 𝜎𝐵 (𝑘) dengan 𝜎𝐵2 (k) =

[𝜇 𝑇 𝜔 𝑘 − 𝜇(𝑘)]2 𝜔 𝑘 [1−𝜔(𝑘)]

Algoritme untuk menentukan nilai ambang batas citra menggunakan metode Otsu dapat dilihat pada Gambar 5. tMean = 0; variance = maxVariance = 0; firstCM = zerothCM = 0 for (i=0,i
10

Gambar 6 Identifikasi outline Pada Gambar 19 dapat dijelaskan bahwa karakter (a) mengalami proses pelabelan berupa outline (b), setelah proses pelabelan, outline akan membentuk blob yang merupakan tipe data untuk binary file (c), yang pada akhirnya outline karakter berhasil diidentifikasi (d) (Smith 2007). Segmentation Proses selanjutnya adalah segmentation. Ada beberapa tahap dalam segmentation agar karakter pada citra berhasil dikenali, antara lain: line finding, baseline fitting, dan chopping. 1 Line Finding Algoritme line finding dirancang agar dapat membaca teks dengan derajat kemiringan tertentu tanpa harus meng-skew (proses mengubah halaman miring menjadi tegak) sehingga tidak menurunkan akurasi pengenalan citra karakter (Smith 2007). Hasil dari identifikasi outline dapat diasumsikan telah menyediakan informasi berupa region teks dengan ukuran seragam, dengan begitu karakter proses line finding dapat mengidentifikasi karakter yang bersentuhan secara vertikal sebagai teks yang lebih dari satu baris. 2 Baseline Fitting Setelah baris teks ditemukan, baseline dicocokan dengan lebih tepat menggunakan quadratic spline. Fungsi ini digunakan untuk mengatasi citra karakter dengan baseline miring atau berbentuk kurva. Baseline dicocokan dengan partisi blob ke dalam kelompok-kelompok. Pada baseline fitting terdapat 3 pengelompokan garis, yaitu garis tengah (meanline), garis menaik (ascender), dan garis menurun (descender). Contoh fitted baseline dapat dilihat pada Gambar 7.

Gambar 7 Contoh fitted baseline

11 3 Chopping Pada bagian ini, baris karakter yang berhasil diidentifikasi akan dilakukan proses chopping atau dipisahkan untuk tiap karakternya agar proses pengenalan karakter menjadi lebih akurat. Akan tetapi, syarat dari proses pemisahan karakter adalah jarak antarkarakter terdeteksi dengan jarak yang tetap atau fixed pitch detection, jika jarak antarkarakter tidak tetap atau non-fixed pitch detection, maka akan dicari dulu ambang batas jarak antarkarakter untuk menentukan karakter yang terhubung dan karakter yang terpisah. Adapun contoh pemisahan karakter dapat dilihat pada Gambar 8.

Gambar 8 Contoh pemisahan karakter Word Recognition Hasil dari pengenalan karakter nonlatin pada bagian segmentation di atas kemudian akan dicocokan dengan data latih Tesseract yang dapat diunduh secara gratis di http://code.google.com/p/tesseract-ocr/downloads/list. Pada penelitian ini mengidentifikasi berdasarkan 5 bahasa yang menggunakan karakter nonlatin. Data latih yang digunakan adalah sebagai berikut: 1 2 3 4 5

chi_sim.traineddata jpn.traineddata kor.traineddata rus.traineddata tha.traineddata

: data latih karakter Cina (sederhana) : data latih karakter Jepang : data latih karakter Korea : data latih karakter Rusia : data latih karakter Thailand

Proses klasifikasi dilakukan dengan terlebih dahulu mengukur jarak antara karakter yang diuji terhadap karakter-karakter yang telah tersedia pada data latih Tesseract dengan mengoptimalkan rumus jarak Euclidean.

dx,y = (𝑥1 − 𝑦1)2 + (𝑥2 − 𝑦2)2 Selanjutnya untuk mencocokkan fitur dilakukan pencarian jarak terdekat dengan algoritme pencarian best first search. Hasil keluaran pada proses ini harus berupa karakter string (UTF-8). Oleh karena itu, terdapat fungsi getUTF(8) pada class TessBaseApi di library Tesseract OCR yang bertujuan untuk mengubah unicode karakter nonlatin yang terdiri dari bilangan hexadesimal menjadi karakter string (UTF-8). Penerjemahan Karakter non-Latin Setelah proses pengenalan citra karakter nonlatin selesai, proses selanjutnya adalah penerjemahan secara online oleh Microsoft Translator.

12 Penerjemahan dilakukan dari bahasa karakter nonlatin ke dalam bahasa Indonesia dan Inggris. Proses penerjemahan dapat berlangsung dengan baik dengan cara memberikan tautan berupa Microsoft Translator API dalam format .JAR dan dengan menambahkan client ID serta client secret pada kode program. Perancangan Aplikasi Use Case Diagram Pada penelitian ini, perancangan aplikasi dapat digambarkan dengan use case seperti pada Gambar 9. Dari use case diagram tersebut, dapat dijelaskan bahwa seorang pengguna diharuskan memilih bahasa asal, mengambil citra menggunakan kamera dengan tambahan fungsi crop atau dari galeri, dan memilih bahasa tujuan untuk selanjutnya sistem menterjemahkan hasil konversi teks dari citra ke dalam bahasa tujuan. Pada bagian pilih bahasa asal, bahasa yang tersedia antara lain: Cina (sederhana), Jepang, Korea, Rusia, dan Thailand. Sedangkan untuk pilih bahasa tujuan, bahasa yang digunakan adalah Indonesia dan Inggris.

Gambar 9 Use case diagram Activity Diagram Pada penelitian ini proses bisnis dijelaskan menggunakan activity diagram yang menghubungkan aksi yang dilakukan antar komponen. Adapun komponen dalam mengoperasikan aplikasi pengenalan bahasa nonlatin hingga tahap penerjemahan antara lain: 1 Pengguna Pada bagian pengguna, proses yang dilakukan sesuai dengan aksi pada use case diagram, antara lain pilih bahasa asal, pilih citra karakter yang ingin dikenali, pilih bahasa tujuan, melakukan aksi sebagai pemicu dalam menerjemahkan, dan melakukan reset aplikasi.

13 2 Tesseract OCR Pada bagian Tesseract OCR proses yang dilakukan adalah melakukan konversi citra menjadi karakter digital. Proses konversi dilakukan dalam beberapa tahapan antara lain: preprocessing, feature extraction, segmentation, dan word recognition. a Preprocessing Pada bagian preprocessing, proses yang dilakukan antara lain grayscaling yaitu mengubah citra RGB menjadi citra grayscale dengan rumus (R+G+B)/3. Tahap berikutnya adalah removing noise dengan menggunakan metode unsharp mask yaitu mengurangi nilai tiap piksel citra grayscale dengan nilai tiap piksel citra grayscale yang telah melalui tahap smoothing menggunakan metode gaussian smoothing. Setelah tahap removing noise selesai, tahap berikutnya adalah thresholding menggunakan metode Otsu yaitu dengan mencari nilai maksimum dari variance sebagai nilai threshold atau nilai ambang batas. b Feature extraction Pada bagian feature extraction, proses yang dilakukan adalah connected component labelling yaitu dengan cara mengidentifikasi komponen yang terhubung sehingga membentuk outline pada karakter yang diuji untuk selanjutnya dilakukan tahap segmentation. c Segmentation Pada bagian segmentation, proses yang dilakukan antara lain line finding, baseline fitting, dan chopping. Pada bagian line finding, Tesseract OCR Engine dirancang agar dapat membaca karakter dengan derajat kemiringan tertentutanpa harus meng-skew karakter tersebut. Proses selanjutnya adalah baseline fitting yaitu pencocokan garis pangkal menggunakan quadratic spline, sehingga dapat mengidentifikasi karakter pada teks dengan ketinggian beragam dalam satu baris. Proses selanjutnya adalah chopping dengan cara menentukan jarak antarkarakter terlebih dahulu. Jika jarak antarkarakter tetap, karakter dalam suatu baris teks dapat langsung dipotong agar lebih mudah dalam pengenalan tiap karakternya. Namun, jika jarak antarkarakter beragam, akan diidentifikasi terlebih dahulu nilai ambang batas antarkarakter untuk mengetahui pemisahan antarkarakter menggunakan jeda atau tidak. d Word recognition Pada bagian word recognition, proses yang dilakukan adalah mencocokan data uji hasil tahap segmentation dengan data latih dengan mengoptimalkan rumus pencarian jarak euclidian dan best first search untuk pemilihan jarak terdekat. Setelah karakter berhasil diidentifikasi, proses selanjutnya adalah mengubah karakter set unicode hasil pengenalan data uji menjadi karakter string (UTF8) untuk selanjutnya hasil dari word recognition akan ditampilkan kepada pengguna. 3 Microsoft Translator Sedangkan pada bagian Microsoft Translator proses yang dilakukan adalah menerjemahkan karakter digital hasil pengenalan citra ke dalam bahasa tujuan secara online berdasarkan tiap baris data. Pengaplikasian activity diagram pada penelitian ini dapat dilihat pada Gambar 10.

14

Gambar 10 Activity diagram

15 Perancangan Tampilan Antarmuka Pada penelitian ini dihasilkan aplikasi Android pengenalan citra karakter nonlatin menggunakan Tesseract OCR dan menerjemahkannya menggunakan Microsoft Translator. Berdasarkan activity diagram tersebut, dibuatlah perancangan antarmuka pengguna seperti pada Tabel 2, dengan adanya perancangan antarmuka di bawah, diharapkan perancangan alur sistem yang dilakukan pada activity diagram akan terwujud. Halaman utama

Tabel 2 Rancangan antarmuka pengguna Pilih bahasa asal Bahasa asal terpilih

OCR citra ke teks

Pilih bahasa tujuan

Bahasa tujuan terpilih

Ambil citra

Menerjemahkan teks

Implementasi Pada tahap implementasi ini menghasilkan suatu aplikasi pada perangkat mobile Android yang dapat menerjemahkan karakter nonlatin dengan bahasa Cina (sederhana), Jepang, Korea, Rusia, dan Thailand yang berasal dari citra sebagai masukannya. Keluaran pada sistem merupakan hasil terjemahan dalam bahasa Indonesia atau bahasa Inggris sesuai kebutuhan pengguna. Hasil implementasi berupa aplikasi pada tahap perancangan tersebut dapat dilihat pada Tabel 3.

16 Tampilan awal

Tabel 3 Implementasi sistem Pilihan bahasa Pilihan masukan asal citra

Crop / pemotongan

Terjemahan Indonesia

Galeri

Pengenalan karakter

Kamera

Pilihan bahasa tujuan

Terjemahan Inggris

Pengujian Berdasarkan hasil pengujian menggunakan metode black box (Khan et al. 2012) pada bagian implementasi di atas, dapat disimpulkan bahwa seluruh fungsi

17 pada aplikasi yang dibangun berjalan dengan baik sesuai yang direncanakan pada bagian analisa kebutuhan dan desain. Berikut hasil pengujian menggunakan metode black box dapat dilihat pada Tabel 4. Tabel 4 Pengujian sistem menggunakan metode black box No. Nama fungsi Hasil pengujian 1 Memilih bahasa asal Berhasil 2 Mengambil citra melalui kamera dan memotongnya Berhasil 3 Mengambil citra melalui galeri Berhasil 4 Menampilkan teks hasil OCR Berhasil 5 Mengubah teks hasil OCR Berhasil 6 Memilih bahasa tujuan Berhasil 7 Menterjemahkan teks hasil OCR ke bahasa tujuan Berhasil 8 Me-reset aplikasi Berhasil Pada bagian pengujian, selain pengujian fungsi sistem menggunakan metode black box, dilakukan pula pengujian untuk mengetahui besarnya akurasi pengenalan karakter yang dihasilkan pada aplikasi yang dibangun serta untuk mengetahui pengaruh dari intensitas cahaya, kemiringan citra karakter, dan kabur tidaknya citra dalam pengenalan karakter pada citra. Oleh karena itu, diperlukan beberapa skenario untuk memanipulasi citra agar dapat diuji untuk mengetahui pengaruh dari intensitas cahaya, kemiringan citra dan kabur tidaknya citra. Adapun skenario pengujian untuk lebih lengkapnya dan contoh pengujian pengenalan karakter dapat dilihat pada Tabel 5 dan Tabel 6. Pengujian

Intensitas Cahaya

Fokus

Tabel 5 Skenario pengujian Kategori Kamera Terang Lampu putih 15W (jarak lampu kurang dari 20cm) Normal Lampu putih 15W (jarak lampu + 2 meter) Redup

Lampu kuning 10W

Fokus Kabur / Blur

Menunggu fokus Langsung ambil tanpa menunggu fokus

0°

Kemiringan

30° 60°

Posisi kamera sejajar dengan citra karakter Posisi kamera miring 30° dengan citra karakter Posisi kamera miring 60° dengan citra karakter

Galeri Brightness = 50 (Microsoft office picture manager) Brightness = 0 (Microsoft office picture manager) Brightness = -50 (Microsoft office picture manager) Langsung Gaussian blur 1,5px (Adobe imageready) Rotate 0° Rotate 30° Rotate 60°

18 Tabel 6 Contoh pengujian karakter Cina (sederhana) No Skenario Citra OCRed teks Terjemahan Kamera Galeri Kamera Galeri Indonesia / Inggris 1 Normal Geser / Slide 2 Sangat Geser / terang Slide 3 Redup Geser / Slide 4 Blur Geser / Slide

Akurasi 6/6 6/6 6/6 3/6

5

Miring 30°

-

0

6

Miring 60°

-

0

7

Vertikal

Geser / Slide

6/6

Dari skenario pengujian dan contoh pengujian dalam pengenalan karakter di atas yang dilakukan pada masing-masing bahasa dengan karakter nonlatin, maka diperoleh akurasi pengenalan karakter pada masing-masing bahasa dengan masing-masing skenario seperti pada Tabel 7 dengan rincian hasil pengujian yang terdapat pada Lampiran 1. No . 1 2 3 4 5 6 7

Pengujian Normal Sangat terang Redup Miring 30° Miring 60° Blur / kabur Vertikal

Tabel 7 Akurasi pada masing-masing skenario Bahasa Cina Jepang Korea Rusia Thailand 100 96 92.05 93.39 93.75 78.3 77.3 82.5 85.35 88.5

Rata-rata akurasi 95.03 82.39

95 5 0 61.7

84 28.7 0 54.5

83.75 15.84 0 45.45

85 67.91 8.5 52.25

83.75 43.42 8.34 62.28

86.3 32.17 3.36 55.35

90.8

94

48.85

-

-

77.88

Berdasarkan tabel 7, dapat disampaikan bahwa akurasi terbaik pengenalan karakter adalah 95.03% yaitu ketika kondisi pencahayaan normal dengan kemiringan 0° dan citra tidak kabur atau blur. Akurasi pengenalan karakter sedikit menurun ketika pencahayaan dibuat sangat terang maupun redup dan pada

19 pengujian karakter dengan penulisan secara vertikal pada bahasa Cina dan Jepang, tetapi hal tersebut tidak berlaku pada karakter Korea. Akurasi juga akan menurun tajam ketika citra dimiringkan maupun dibuat kabur karena proses pengenalan karakter pada citra tidak invariant terhadap kemiringan walaupun pada tahap line finding terdapat fungsi untuk skewing / memiringkan karakter pada citra. Akurasi pada pengujian citra kabur atau blur juga menurun cukup tajam karena proses removing noise menggunakan metode unsharp mask yaitu dengan cara mengurangi nilai citra asli dengan citra yang sudah melalui tahap smoothing. Oleh sebab itu, jika citra asli yang digunakan sudah dalam keadaan kabur, tentunya akan lebih sulit untuk menemukan outline pada karakter yang diuji. Adapun contoh pengujian penerjemahan karakter secara online menggunakan Microsoft Translator dapat dilihat pada Tabel 8.

No.

Bahasa

1

Cina

2

Jepang

3 4 5

Korea Rusia Thailand

Tabel 8 Contoh pengujian penerjemahan Terjemahan Hasil pengenalan karakter Indonesia Inggris Geser Slide Area memancing Toilet Peringatan Terima kasih

Fishing area Toilet Warning Thank you

Evaluasi Pada tahap evaluasi usability ini diberikan sejumlah task atau tugas berupa kuesioner yang sudah dipersiapkan sebelumnya kepada pengguna saat berinteraksi dengan sistem. Bentuk dari lembar kuesioner dan tanggapan dari para responden terdapat pada Lampiran 2. Kuesioner dirancang menggunakan bahasa yang mudah dimengerti oleh pengguna. Klasifikasi penarikan kesimpulan berdasarkan rata-rata nilai evaluasi kuesioner terdapat pada Tabel 9. Tabel 9 Klasifikasi penarikan kesimpulan hasil evaluasi usability Nilai Kesimpulan <20% Sangat tidak setuju bahwa aplikasi sangat mudah dipahami dan dimengerti > 20% dan < 40% Tidak setuju bahwa aplikasi sangat mudah dipahami dan dimengerti > 40% dan < 60% Ragu-ragu bahwa aplikasi sangat mudah dipahami dan dimengerti > 60% dan < 80% Setuju bahwa aplikasi sangat mudah dipahami dan dimengerti > 80% Sangat setuju bahwa aplikasi sangat mudah dipahami dan dimengerti Berdasarkan kuesioner di atas, dilakukan evaluasi usability terhadap penilaian 5 responden. Adapun persentase penilaian tiap responden didapat

20 𝑛𝑖𝑙𝑎𝑖 ℎ𝑎𝑠𝑖𝑙 𝑘𝑢𝑒𝑠𝑖𝑜𝑛𝑒𝑟

dengan perhitungan, x 100%. Berikut penilaian evaluasi 𝑛𝑖𝑙𝑎𝑖 𝑚𝑎𝑘𝑠𝑖𝑚𝑎𝑙 usability menggunakan kuesioner pada tiap responden terdapat pada Tabel 10. Tabel 10 Evaluasi usability Penilaian No. Responden SS S RR TS 1 Pertama 5 20 2 Kedua 5 13 7 3 Ketiga 14 10 1 4 Keempat 2 18 5 5 Kelima 6 15 4 Rata-rata penilaian tiap responden (%)

STS

Nilai (%) 84 78.4 90.4 77.6 81.6 82.4

Pada tabel evaluasi usability di atas dapat disampaikan bahwa pada ratarata nilai evaluasi usability menggunakan kuesioner adalah 82.4% yang berarti aplikasi yang dibangun pada penelitian ini yaitu aplikasi Android penerjemah bahasa nonlatin dengan pengenalan citra karakter sangat mudah dimengerti dan sangat mudah untuk dipelajari dalam penggunaanya.

SIMPULAN DAN SARAN Simpulan Pada penelitian ini menghasilkan aplikasi Android untuk pengenalan citra karakter nonlatin dengan Tesseract library. Dari pengujian terhadap 650 data uji citra yang terdiri dari 5 bahasa (Cina sederhana, Jepang, Korea, Rusia, dan Thailand), sistem mampu mengenali citra karakter nonlatin dengan akurasi terbaik sebesar 95.03% pada kondisi pencahayaan normal dengan kemiringan 0°, serta mampu menerjemahkannya ke dalam bahasa Indonesia dan Inggris. Pengujian pada citra yang divariasikan pada intensitas cahaya, kemiringan, blur atau kabur tidaknya citra, dan penulisan secara vertikal pada bahasa yang mendukung penulisan secara vertikal, menunjukkan bahwa faktor-faktor tersebut dapat menurunkan tingkat akurasi pengenalan karakter. Hasil pengujian usability responden mendapatkan nilai sebesar 82.4%, hal ini menunjukkan bahwa aplikasi Android yang dibangun sangat mudah dipelajari dan dimengerti oleh pengguna. Saran Sistem aplikasi pengenalan citra karakter nonlatin yang dibangun masih memiliki kekurangan, sehingga diperlukan adanya pengembangan dan perbaikan agar sistem menjadi lebih baik. Beberapa tahapan pengenalan pola yang perlu diperbaiki yaitu pada bagian line finding agar lebih invariant terhadap kemiringan karakter pada citra serta perbaikan pada bagian removing noise agar menjadi lebih tangguh dalam mengenali citra dalam keadaan kabur atau blur.

21

DAFTAR PUSTAKA Fisher R, Perkins S, Walker A, Wolfart E. 2003. Gaussian Smoothing. Alertbox [Internet]. [diunduh 2015 Februari 01]. Tersedia pada http://homepages.inf.ed.ac.uk/rbf/HIPR2/gsmooth.htm. Goodman S. 2014. Machine Translation – Google Translate vs Bing Translator. Linnworks [Internet]. (2014 Januari 15 [diunduh pada 2015 maret 1]). Tersedia pada http://blog.linnworks.com/google-bing-translate/. Khan M, Khan F. 2012. A Comparative Study of White Box, Black Box and Grey Box Testing Techniques. International Journal of Computer Science and Applications. 3:12-15.doi:10.14569/IJACSA.2012.030603. Nielsen J. 2012. Usability 101: Introduction to Usability. Nielsen Norman Group [Internet]. (2012 januari 4 [diunduh 2014 Desember 01]). Tersedia pada http://www.nngroup.com/articles/usability-101-introduction-to-usability/. Putra D. 2004. Binerisasi Citra Tangan dengan Metode Otsu. Jurnal Teknologi Elektro. 3(2). Rubin J, Chisnell D. 2008. Handbook of Usability Testing : How to Plan, Design, and Conduct Effective Test. Indianapolis (US): Wiley Publishing Inc. Shi-zhong D. 2009. The Choice of Traditional vs. Simplified Character in US Classroom. Di dalam: Charles C, Shelly R, Lily R, Nydia L, Jennifer L, Max S, Jean Z, Rae Z, editor. US-China Education Review; 2009 Desember; Illinois, Amerika Serikat. Illinois(US): David Publishing Company. hlm: 67-73. Smith R. 2007. An Overview of the Tesseract OCR Engine. ICDAR '07: Proceedings of the Ninth International Conference on Document Analysis and Recognition II; 2007 Sept 23-26; Curitiba, Brasil. Washington DC (US): IEEE Computer Society. hlm 629-633.

22

LAMPIRAN Lampiran 1 Pengujian pengenalan karakter dan terjemahannya Pengujian citra karakter bahasa Cina (sederhana) Citra OCRed teks No Skenario Kamera Galeri Kamera Galeri 1. Normal

Terjemahan Indonesia Inggris

2/2

Sangat terang Redup Blur

2. .

Akurasi

1/2 1/2 Buka

Open

2/2

Miring 30° Miring 60°

0

Normal 7 Sangat terang

4/4

Redup

4/4

Blur

2/4


0

4/4

Bagus sekali

Very good

0 0

Vertikal

4/4

3.

Normal 7

6/6

.

Sangat terang Redup

6/6

Blur

Geser

Slide

6/6 3/6

23 Lanjutan No

4. .

Skenario

.

OCRed teks Kamera Galeri


0

Miring 60°

0

Vertikal

6/6

Normal 7 Sangat terang Redup

2/2 1/2 2/2 Api

Fire

1/2

Miring 30°

0

Miring 60° Normal 7

0

Sangat terang

4/4

Redup

4/4

Blur

2/4

4/4

Kartun

6.

Akurasi

Miring 3 30°

Blur

5.

Citra Kamera Galeri

Cartoon

Miring 30°

0

Miring 60°

0

Vertikal

2/4

Normal

Air soda

Soda water

6/6

24 Lanjutan No

7.

Skenario



Akurasi

Sangat terang

6/6

Redup

6/6

Blur

4/6

Miring 30°

1/6

Miring 60°

0

Vertikal

6/6

Normal

2/2

Sangat terang

1/2

Redup

2/2

Blur

8.

Citra Kamera Galeri

Air

Water

2/2


0

Normal

4/4

Sangat terang

4/4

Redup

4/4

0

Beijing

Beijing

Blur

2/4

Miring 30°

0

25 Lanjutan No

9.

Skenario

Kamera

Citra Galeri



Akurasi

Miring 60°

0

Vertikal

4/4

Normal 7

6/6

Sangat terang

5/6

Redup

6/6

Blur

3/6

Miring 30°

Bahasa mandarin

Mandar 0 in

Miring 60°

0

Vertikal

5/6

10. Normal 7

4/4

Sangat terang

2/4

Redup

4/4 Listrik

Electric

Blur

2/4

Miring 30°

0

26 Lanjutan No

Skenario

Citra Kamera Galeri



Miring 60°

0

Vertikal

4/4

Pengujian citra karakter bahasa Jepang Citra OCRed teks No Skenario Kamera Galeri Kamera Galeri 1. Normal


Blur

.

Akurasi 2/2

Sangat terang Redup

2.

Akurasi

2/2 1/2 Anjing

Dog

1/2


0


9/10

Redup

10/10

Blur

10/10

Miring 30°

0

5/10

Area memancing

Fishing area

4/10

Miring 60°

0

Vertikal

8/10

27 Lanjutan Citra Galeri



No

Skenario

3.

Normal 7

6/6

Sangat terang

6/6

Redup

6/6

Blur

3/6

Kamera

Akurasi

.

Miring 30°

4. .

Hentikan

Stop it

4/6

Miring 60°

0

Vertikal

6/6

Normal 7

6/6

Sangat terang

5/6

Redup

6/6

Blur

3/6

Miring 30°

Pada hari libur

On holiday

3/6

Miring 60°

0

Vertikal

6/6




No

Skenario

5.

Normal

10/10

Sangat terang

5/10

Redup

10/10

Blur

2/10

Miring 30°

6.

Kamera

Permisi

Excuse me

Akurasi

3/10

Miring 60°

0

Vertikal

10/10

Normal

10/10

Sangat terang

7/10

Redup

10/10

Blur

4/10

Miring 30°

restoran

Restau- 0 rant

Miring 60°

0

Vertikal

10/10




No

Skenario

7.

Normal 7

6/6

Sangat terang

6/6

Redup

6/6

Blur

3/6

Kamera

Akurasi

.

Saya

I

Miring 30°

3/6

Miring 60°

0

Vertikal

6/6

8.

Normal 7

2/2

.

Sangat terang Redup

1/2

Blur

9.

1/2 Rumah

Home

1/2

Miring 30°

0

Miring 60°

0

Normal 7

4/4

. Sangat terang

Sushi

Sushi

4/4

Redup

4/4

Blur

3/4

30 Lanjutan No

Skenario

Citra Kamera Galeri



Akurasi

Miring 30°

0

Miring 60°

0

Vertikal

4/4

10. Normal 7 . Sangat

7/10 7/10

terang Redup

4/10

Blur

6/10

Miring 30°

Menara tokyo

Tokyo tower

5/10

Miring 60°

0

Vertikal

6/10

Pengujian citra karakter bahasa Korea Citra OCRed teks No Skenario Kamera Galeri Kamera Galeri 1. Normal


Akurasi 5/6

Sangat terang Redup

6/6 5/6 Ikan

Fish

Blur

2/6

Miring 30°

0

31 Lanjutan No

2. .

Skenario

Kamera

Citra Galeri



Miring 60°

0

Vertikal

5/6

Normal 7

4/4

Sangat terang

2/4

Redup

2/4

Blur

2/4 Lagu

3. .

Akurasi

Song

Miring 30°

0

Miring 60°

0

Vertikal

0

Normal 7

6/6

Sangat terang

6/6

Redup

6/6

Blur Kantor pos Miring 30°

Post office

1/6 1/6

Miring 60°

0

Vertikal

4/6

32 Lanjutan Citra Kamera Galeri



No

Skenario

4.

Normal 7

7/8

Sangat terang

4/8

Redup

7/8

.

Blur Miring 30°

Selamat pagi

Good mornin g

Akurasi

5/8 0

Miring 60°

0

Vertikal

2/8

5.

Normal 7

6/6

.

Sangat terang

6/6

Redup

3/6

Blur

6/6 Toilet

6.

Toilet

Miring 30°

1/6

Miring 60°

0

Vertikal

6/6

Normal

3/4

Sangat terang

Toko buku

Book store

2/4

33 Lanjutan No

7.

Skenario

Citra Kamera Galeri



Akurasi

Redup

4/4

Blur

1/4

Miring 30°

2/4

Miring 60°

0

Vertikal

0

Normal 7

4/4

Sangat terang Redup

4/4

Blur

2/4

.

4/4

Kami

8.

We

Miring 30°

1/4

Miring 60°

0

Vertikal

0

Normal 7

6/8

. Sangat terang Redup Blur

Aku cinta kamu sayangku

8/8 I love you my 8/8 love 4/8

34 Lanjutan No

Skenario

Citra Kamera Galeri



Akurasi

Miring 30°

0

Miring 60°

0

Vertikal

7/8

9.

Normal 7

6/6

.

Sangat terang

3/6

Redup

4/6

Blur

1/6 Sendok

Spoon

Miring 30°

0

Miring 60°

0

Vertikal

3/6

10. Normal 7

6/6

Sangat terang

6/6

Redup

6/6

Blur

Terima kasih

Thank you

3/6

Miring 30°

3/6

Miring 60°

0

35 Lanjutan No

Skenario

Citra Kamera Galeri



Vertikal

Akurasi 5/6

Pengujian citra karakter bahasa Rusia No

Skenario

1. Normal Sangat terang Redup Blur Miring 30° Miring 60°

Pengujian

Citra

OCRed teks


Kamera

12/12

Galeri Kamera

12/12

Galeri Kamera

6/12

Galeri Kamera

Akurasi

Ayolah

Come on

6/12

Galeri Kamera

8/12

Galeri Kamera

3/12

Galeri

2. .

7 Normal

Kamera

34/34

Galeri Sangat terang

Redup

Kamera Galeri Kamera

Dilarang melewati

Prohibited passing

17/34

17/34

Galeri Blur

Kamera Galeri

5/34

36 Lanjutan No

Skenario

Pengujian

Citra

OCRed teks


Akurasi

Kamera Miring 30°

21/34 Galeri Kamera

Miring 60°

3. Normal

0 Galeri

Kamera

7/8


Redup

Kamera Galeri Kamera Galeri

Blur Miring 30°

Miring 60° 4. 7Normal

8/8

Kamera

7/8 Makan malam

Dinner 6/8

Galeri Kamera

8/8 Galeri Kamera 2/8 Galeri Kamera

Peringatan

Warning

20/28


Kamera Galeri

22/28

37 Lanjutan No

Skenario

Redup

Pengujian

Citra

OCRed teks


Kamera

Akurasi

28/28

Galeri Blur

Kamera

7/28

Galeri Miring 30°

Kamera 20/28 Galeri Kamera

Miring 60° 5. 7Normal Sangat terang Redup Blur Miring 30° Miring 60° 6. Normal

0 Galeri Kamera

Kamera

6/8

Galeri Kamera

6/8

Galeri Kamera

Salju

Snow 6/8

Galeri Kamera

5/8

Galeri Kamera

0 Galeri Kamera Galeri

Sangat terang

6/8

Galeri

Kamera Galeri

8/8 Dokter

Doctor 8/8

38 Lanjutan No

Skenario Redup

Blur Miring 30° Miring 60° 7. Normal Sangat terang

Pengujian

Citra

OCRed teks


Kamera

Akurasi 7/8

Galeri Kamera

3/8

Galeri Kamera

1/8

Galeri Kamera

0

Galeri Kamera

12/12

Galeri Kamera

12/12

Galeri Kamera

Redup

12/12 Galeri

Blur

Kamera

Moskow

Moscow

6/12

Galeri Miring 30°


Miring 60° 8. 7Normal

2/12 Galeri Kamera Galeri

Pasar

Market

12/12

39 Lanjutan No

Skenario

Pengujian

Sangat terang

Kamera

Redup

Citra

OCRed teks


Akurasi 12/12

Galeri Kamera

12/12

Galeri Blur

Kamera

12/12

Galeri Miring 30°


Miring 60°

0 Galeri

9. Normal

Kamera

30/30


Redup

Kamera

30/30

Galeri Kamera

Pulau indah

Beautiful island

30/30

Galeri Kamera Blur

0 Galeri

40 Lanjutan No

Skenario

Pengujian

Citra

OCRed teks


Akurasi

Kamera Miring 30°

21/30 Galeri

Kamera Miring 60°

3/30 Galeri

10. 7 Normal

Kamera

12/12



Redup

12/12 Galeri Kamera

Blur

Berdiri

Stand 12/12

Galeri Miring 30°

Miring 60°

Kamera 8/12 Galeri Kamera 1/12 Galeri

41 Lanjutan Pengujian citra karakter bahasa Thailand Citra OCRed teks No Skenario Kamera Galeri Kamera Galeri 1. Normal

.

.

Redup

12/12

.

Halo

Hello

4/12

Miring 30°

3/12

Miring 60°

3/12

Normal 7 Sangat terang Redup

6/12 6/12 0 Jalan tol

Toll road

6/12

Miring 30°

3/12

Miring 60° Normal 7 Sangat terang Redup

0

Blur

4.

12/12 12/12

Blur

3.

Akurasi

Sangat terang

Blur

2.


Miring 30° Miring 60° Normal 7

6/6 6/6 6/6 Bintang

Star

6/6 0 0 7/8

Harimau

Tiger

42 Lanjutan No

Skenario

Citra Kamera Galeri



Akurasi

Sangat terang Redup

8/8

Blur

4/8


4/8

5.

Normal 7

6/6

.

Sangat terang

6/6

Redup

6/6

Blur

6.

.

1/6

Dijual

Sale

5/6

Miring 30°

4/6

Miring 60°

1/6

Normal

8/8

Sangat terang

4/8

Redup

8/8

Blur

7.

8/8

Pulau

Island

8/8

Miring 30°

5/8

Miring 60°

1/8

Normal 7

Tas

Bag

14/14

43 Lanjutan No

Skenario

Citra Kamera Galeri



Akurasi

Sangat terang

12/14

Redup

14/14

Blur

7/14

Miring 30°

3/14

Miring 60°

0

8.

Normal 7

12/12

.

Sangat terang

12/12

Redup

6/12

Blur

9. .

Terima kasih

Thank you

6/12

Miring 30°

9/12

Miring 60°

2/12


8/8

Redup

7/8

Blur

8/8

Perempuan

Women 5/8

Miring 30° Miring 60° 10. Normal 7 .

5/8 0 24 jam sehari

24 hours a day

8/8

44 Lanjutan Citra No

OCRed teks

Terjemahan

Skenario

Akurasi Kamera

Galeri

Kamera

Galeri

Indonesia

Inggris

Sangat terang

8/8

Redup

8/8

Blur

4/8

Miring 30°

5/8

Miring 60°

0

Lampiran 2 Lembar kuesioner dengan tanggapan responden PENGUJIAN USABILITY APLIKASI ANDROID PENERJEMAH BAHASA NON-LATIN DENGAN PENGENALAN CITRA KARAKTER

DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR 2015

Nama Lengkap : ________________________________________ Usia : ____ tahun Tempat/tanggal Lahir : ________________________________________ Jenis Kelamin : 1. Laki-laki 2. Perempuan KETERANGAN: SS= Sangat Setuju RR=Ragu-ragu STS=Sangat Tidak Setuju S=Setuju TS=Tidak Setuju Bubuhkan tanda ceklist (√) pada kolom yang nilainya paling sesuai menurut Anda. Jawaban yang jujur sangat membantu untuk keberhasilan penelitian ini. Terima kasih atas partisipasi Anda.

45 Lanjutan No

Pertanyaan SS

Aspek Learnability 1 Apakah anda berhasil menemukan aplikasi Android sebagai penerjemah bahasa nonlatin dengan pengenalan citra karakter? 2 Apakah ikon aplikasi mudah dikenali? 3 Apakah anda berhasil membuka aplikasi Android “Non-Latin Translator”? Aspek Efficiency 4 Apakah tampilan aplikasi mudah dikenali? 5 Apakah tulisan pada layar mudah dibaca? 6 Apakah komposisi warna sudah sesuai? 7 Apakah aplikasi mudah dioperasikan? Aspek Memorability 8 Apakah nama aplikasi mudah diingat? 9 Apakah fungsi aplikasi mudah diingat? 10 Apakah tombol-tombol pada aplikasi mudah dimengerti? 11 Apakah tombol-tombol pada aplikasi mudah digunakan? 12 Apakah bahasa yang digunakan mudah dimengerti? Aspek Errors 13 Apakah aplikasi dapat melakukan pemilihan bahasa asal dengan baik? 14 Apakah anda berhasil menggunakan tombol Take Image? 15 Apakah anda berhasil melakukan fungsi crop? 16 Apakah aplikasi berhasil mengambil gambar dari kamera dan galeri? 17 Apakah aplikasi dapat mengenali karakter nonlatin dengan baik? 18 Apakah aplikasi dapat melakukan pemilihan bahasa tujuan dengan baik? 19 Apakah aplikasi dapat menerjemahkan karakter nonlatin ke dalam bahasa Indonesia dan Inggris? 20 Apakah anda berhasil menggunakan tombol Reset? Aspek Satisfaction 21 Apakah anda setuju aplikasi ini cukup membantu dalam mengenali citra karakter nonlatin? 22 Apakah anda setuju aplikasi ini cukup membantu menerjemahkan teks nonlatin?

S

1

4

2

5 3

4 2 1 2

1 3 3 3

1 1 2

2 4 3

2

3

Penilaian RR TS STS

1 2

4

1

4

1

1

4

3

3 1

2 1

2

2

1

5 5 2

2

1

4

2

3

1

46 Lanjutan No 23 24 25

Pertanyaan Apakah spesifikasi aplikasi yang ditawarkan sesuai dengan kebutuhan? Apakah anda ingin menggunakan aplikasi ini pada perangkat mobile anda? Apakah anda akan menyarankan teman menggunakan aplikasi ini?

SS 1

S 2

Penilaian RR TS STS 2

1

1

3

1

2

2

47

RIWAYAT HIDUP Penulis dilahirkan di Semarang pada 30 Mei 1990 dari pasangan Bapak Purwoto dan Ibu Morita. Penulis yang merupakan lulusan dari SMA N 15 Semarang pada tahun 2008 kemudian melanjutkan studi dengan jenjang diploma Politeknik Telkom Bandung hingga pada tahun 2011 dan pada tahun 2012 melanjutkan pendidikan sebagai mahasiswa program studi Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

APLIKASI ANDROID PENERJEMAH BAHASA NON-LATIN DENGAN PENGENALAN CITRA KARAKTER ADI KIRANA WIJAYAJATI

Recommend Documents