BAB 4
IMPLEMENTAS I DAN EVALUAS I
Pada bab ini akan dijelaskan
implementasi dan pengujian hasil perancangan yang
dilakukan pada Bab 3. Perangkat lunak yang dihasilkan diimplementasikan dan diuji pada Samsung Galaxy Ace GT-S5830 yang menggunakan sistem operasi Android versi 2.3.4.
4.1
Implementasi Dari hasil analisis dan perancangan yang telah dilakukan pada Bab 3, langkah
selanjutkan dalam mengembangkan perangkat lunak ialah mengimplementasikan perangkat lunak yang dihasilkan. Implementasi aplikasi harus pada spesifikasi standard sistem yang akan dijelaskan pada subbab 4.1.1 berikut.
4.1.1
S pesifikasi Sistem Perangkat lunak yang dihasilkan diimplementasikan pada ponsel dengan sistem
operasi Android. Versi minimal Android yang dapat menjalankan perangkat lunak adalah Android 2.2, versi di bawah 2.2 tidak dapat menjalankan perangkat lunak. Selain itu ponsel juga harus memiliki koneksi internet untuk mengunduh file kor.traineddata dan memori ekternal atau sdcard harus terpasang, serta ponsel harus memiliki kamera. M emori eksternal digunakan untuk tempat penyimpanan file kor.traineddata maupun gambar-gambar yang diambil melalui fitur kamera yang terdapat pada aplikasi.
86
4.1.2
Instalasi Aplikasi Aplikasi yang sudah jadi harus diinstall terlebih dahulu ke dalam device sebelum
dapat digunakan. File yang diinstall adalah file KoreanOCR.apk yang sudah dibuild. File ini berisi keseluruhan isi project yang sudah dienkripsi. Ada beberapa cara yang dapat digunakan untuk instalasi aplikasi, yaitu sebagai berikut
1. Install melalui Eclipse Cara pertama ini biasanya digunakan oleh developer yang mengembangkan aplikasi. Device harus dihubungkan ke PC melalui cable usb maupun wireless, pastikan pengaturan USB debugging tercentang, menu ini dapat diakses di Setting Æ Application Æ DevelopmentÆ USB debugging. Setelah device dipastikan telah terhubunng, kemudian pada eclipse pilih projek yang ingin diinstall kemudian klik kanan pilih run Æ run configuration Æ Browse Application (KoreanOCR) Æ Target
Æ pilih Device Æ OK. Dengan demikian aplikasi sudah terinstall di device.
2. Install melalui ADB Push Cara kedua ini juga biasa digunakan oleh developer. Sama seperti instalasi melalui eclipse, device juga harus dihubungkan ke PC hanya saja ini menggunakan command Linux di cmd Windows. Pertama pilih startÆrunÆ cmd, kemudian ketik perintah di bawah ini: (1) cd
/platform-tools //contoh : cd C:/Android-SDK/platform-tools (2) adb push
87
//lokasi file terdapat pada folder bin projek //contoh
:
cd
C:/M y_thesis/KoreanOCR/bin/KoreanOCR.apk
/mnt/sdcard/myapplication
Langkah (1) digunakan untuk change directory ke lokasi adb, lokasi adb terletak antara direktori platform-tools atau directori tools. Perintah push digunakan untuk memasukkan file (parameter 1) ke dalam lokasi tujuan (parameter 2).
3. Install menggunakan Installer Cara ketiga ini dapat digunakan oleh siapa saja terutama para pengguna ponsel Android. Sebelumnya user harus mendownload installer yang terdapat di Android Market. File KoreanOCR.apk dicopy secara manual dan dimasukkan ke dalam memori ponsel, serta pastikan pengaturan untuk unkown sources dicentang, menu ini dapat diakses melalui SettingÆApplicationÆUnkown sources. Bagian tersebut perlu dicentang untuk aplikasi-aplikasi yang bukan berasal dari Android Market. Kemudian ikuti cara-cara installasi pada masing-masing installer.
4.1.3
Mekanisme Penggunaan Aplikasi Pada saat pertama kali aplikasi dijalankan, aplikasi akan mengunduh file
kor.traineddata terlebih dahulu apabila kor.traineddata tidak tersedia pada direktori yang telah ditentukan. Proses ini memerlukan koneksi internet.
88
Gambar 4.1 Tampilan Halaman Utama pada Proses Pengunduhan file
Apabila file yang dibutuhkan telah tersedia maka aplikasi akan langsung menampilkan halaman utama seperti tampak pada Gambar 4.1.
Gambar 4.2 Tampilan Halaman Utama Aplikasi pengenalan karakter Korea terdiri dari delapan fitur utama, yaitu menu untuk akses kamera, file browser, recognising, drawing, translate, preprocessing, dictionary dan save image . Selain fitur file browser dan kamera, keenam fitur
89
lainnya dapat diakses dengan menekan tombol menu yang terdapat pada ponsel Android.
Gambar 4.3 Layar Kamera
Layar ini merupakan halaman ketika user mengklik icon
yang terdapat
pada halaman utama. Kotak hitam putih merupakan surfacae view kamera, objek yang ingin diambil akan terlihat pada surface view ini. Surface view dapat diklik untuk memfokuskan kamera pada objek. Apabila user ingin kembali ke halaman utama, user dapat menekan tombol
atau tekan tombol
untuk mengambil gambar. Gambar
yang diambil akan ditampilkan, user dapat menekan atau tombol
untuk menyimpan gambar
untuk membatalkan gambar dan kembali ke layar surface view untuk
pengambilan gambar baru.
Apabila user menekan tombol save maka gambar akan
tersimpan dan aplikasi akan menampilkan nama file dan lokasi penyimpanan file. Setelah itu aplikasi akan kembali ke halaman utama dan menampilkan gambar yang baru saja disimpan.
90
Gambar 4.4 Tampilan Halaman File Chooser
Halaman ini dapat diakses dengan cara mengklik icon
. Halaman ini
berisi list direktori dan file yang terdapat pada memori eksternal. File yang dapat dipilih hanya file gambar dengan ekstensi .jpg, .tiff, .bmp,.png dan .gif. File dapat dipilih dengan mengklik file tersebut. Jika file telah dipilih maka aplikasi akan kembali pada halaman utama, kemudian file yang tadi dipilih akan ditampilkan.
91
(a)
(b)
Gambar 4.5 (a) Halaman Drawing sebelum draw teks (b) Halaman Drawing sesudah draw teks
Halaman ini dapat diakses dengan memilih menu drawing. Halaman ini dapat digunakan oleh user untuk menguji keakuratan aplikasi dalam mengenali karakter Korea. User dapat memasukkan teks yang ingin dikenali dengan mengetik teks tersebut pada tempat yang sudah disediakan, kemudian klik draw untuk menggambar pada canvas. User juga dapat menghapus canvas dengan mengklik tombol “Clear Canvas” dan tombol “Clear Text” untuk menghapus teks pada teks area. Pada halaman ini juga terdapat menu-menu seperti halaman utama.
92
Gambar 4.6 Submenu Image Preprocessing Layar ini merupakan submenu yang ditampilkan apabila user memilih menu image preprocessing. Submenu grayscale untuk mengubah gambar berwarna menjadi gambar dengan derajat keabuan, graussiang blur digunakan untuk melakukan blurring gambar dan otsu thresholding digunakan untuk mengubah gambar berwarna maupun grayscale menjadi gambar hitam putih dengan menerapkan algoritma Otsu.
Gambar 4.7 Alert Dialog untuk save image
93
Layar ini merupakan tampilan apabila user memilih menu save image. Aplikasi akan menampilkan alert dialog untuk memastikan bahwa user memang ingin menyimpan gambar. Jika user memilih “yes” maka gambar akan tersimpan dan aplikasi akan menginformasikan nama file dan lokasi penyimpanan file tersebut. Sebaliknya, apabila user memilih “no” maka aplikasi tidak akan melakukan penyimpanan gambar.
Gambar 4.8 Layar Halaman Dictionary
Layar ini dapat diakses dengan memilih menu Dictionary. Dalam halaman ini terdapat beberapa menu lainnya seperti yang terlihat pada gambar.
94
Gambar 4.9 Halaman Insert Word Layar ini merupakan halaman apabila user mengklik tombol “Insert a Word” pada halaman dictionary. User dapat memasukkan kata dalam bahasa Korea berserta arti kata tersebut dalam bahasa Inggris maupun bahasa Indonesia.
Gambar 4.10 Tampilan Halaman Word (s) List
95
Layar ini merupakan halaman apabila user mengklik tombol “Word (s) List” pada halaman dictionary. Halaman ini menampilkan semua kata-kata yang tersimpan dalam database beserta arti dalam bahasa Inggris dan bahasa Indonesia. Selain itu pada halaman ini juga terdapat fitur untuk searching, user dapat melakukan pencarian dengan memasukkan kata pada area yang sudah disediakan. Kata yang dimasukkan dapat berupa arti dalam bahasa Indonesia, arti dalam bahasa Inggris maupun karakter Korea. Pada halaman ini juga terdapat tiga menu lainnya seperti terlihat pada gambar di atas.
(b)
(a)
Gambar 4.11 (a) Tampilan Halaman Edit Word (b) Alert Dialog untuk penghapusan data
Gambar 4.11 (a) merupakan halaman pada saat user mengklik salah satu daftar kata pada halaman Word (s) List. Halaman ini digunakan untuk memperbarui kata
96
maupun untuk menghapus kata. Apabila user ingin menghapus data maka aplikasi akan menampilkan alert dialog seperti pada Gambar 4.11 (b) untuk memastikan bahwa user ingin menghapus data.
Gambar 4.12 Tampilan Halaman Translator
Halaman ini dapat diakses melalui menu pada halaman utama maupun tombol “Translator” pada halaman dictionary. Halaman ini digunakan untuk melakukan penerjemahan bahasa Korea ke dalam bahasa Inggris maupun bahasa Indonesia berdasarkan semantik kata. Selain itu juga ditampilkan romanisasi karakter Korea. User dapat memasukkan karakter Korea yang ingin dikenali kemudian klik tombol Display atau bisa juga menerjemahkan teks hasil pengenalan pada halaman utama. Teks hasil pengenalan tersebut akan dipassing ke halaman ini. Selain halama-halaman yang terdapat pada screen shoot di atas, aplikasi juga menyediakan fitur untuk memasukkan karakter Korea serta romanisasi karakter tersebut.
97
4.2
Evaluasi Sesuai dengan asumsi yang telah dijelaskan pada bab 3 bahwa Aplikasi hanya
mampu mengenali teks yang sifatnya ideal, yaitu teks hitam di atas latar putih atau teks putih di atas latar hitam. Oleh karena itu pada subbab ini akan dilakukan pengujian terhadap program aplikasi untuk sample gambar yang diambil menggunakan kamera yang terdapat pada aplikasi dengan memotret sebuah buku yang berjudul “Otodidak Belajar Korea” yang juga merupakan sumber penulisan skiripsi ini. Sample gambar yang diambil menggunakan kamera terdapat 27 gambar yaitu dari sample gambar 1 sampai sample gambar 27 yang terdapat pada Lampiran 2. Sample – sample tersebut berisi karakter-karakter Korea sebagai data pengujian.
Selain itu untuk menguji bahwa program aplikasi juga mampu mengenali gambar dengan teks hitam di atas latar putih sebaik mengenali teks putih di atas latar hitam seperti jurnal yang ditulis oleh Ray Smith et al (2009), maka akan dilakukan pengujian terhadap 5 sample gambar untuk teks hitam di atas latar putih dan 5 sample gambar untuk teks putih di atas latar hitam. Sample gambar ini berisi teks dengan ukuran yang sama, hanya warna latar yang berbeda. Sample dapat dilihat pada Lampiran 2 dari sample gambar 27 sampai sample gambar 36. Berikut akan dijelaskan hasil pengujian.
98
4.2.1
Evaluasi Akurasi Pengenalan Karakter
4.2.1.1 Sample Gambar 1 sampai Sample S ambar 27 Hasil pengujian sample gambar 1 sampai sample gambar 27 dapat dilihat pada Lampiran 3 untuk masing-masing data pengujian. Evaluasi akurasi pengenalan akan dilakukan per kata dan per karakter, serta waktu proses yang diperlukan. Keseluruhan hasil pengujian disajikan dalam Tabel 4.1.
Tabel. 4.1 Hasil Pengujian Sample Gambar 1 sampai Sample Gambar 37
Sample
Jumlah Kata
Jumlah Karakte r
Jumlah Kata Salah
Jumlah Karakte r Salah
Gambar 1 Gambar 2 Gambar 3 Gambar 4 Gambar 5 Gambar 6 Gambar 7 Gambar 8 Gambar 9 Gambar 10 Gambar 11 Gambar
9
25
5
10
7
19
1
1
7
17
1
1
5
20
4
5
6
19
3
3
7
23
1
1
9
27
5
7
7
20
0
0
7
23
4
8
8
24
1
1
7
20
0
0
6
19
3
3
Akurasi pengenala n Kata (%)
Akurasi pengenalan karakte r (%)
Waktu Prose s (detik)
44.44
60.00
0.09109
85.71
94.74
0.04313
85.71
94.12
0.07602
20.00
75.00
0.06211
50.00
84.21
0.07738
85.71
95.65
0.07814
44.44
74.07
0.09741
100.00
100.00
0.08489
42.86
65.22
0.06904
87.50
95.83
0.06401
100.00
100.00
0.04463
50.00
84.21
0.06456
99 12 Gambar 13 Gambar 14 Gambar 15 Gambar 16 Gambar 17 Gambar 18 Gambar 19 Gambar 20 Gambar 21 Gambar 22 Gambar 23 Gambar 24 Gambar 25 Gambar 26 Gambar 27
8
25
3
3
9
28
5
6
8
29
2
2
9
27
7
11
9
26
5
8
9
26
5
8
8
26
4
4
4
13
3
6
9
25
3
5
8
23
3
5
7
18
7
17
11
30
8
12
9
30
1
2
8
18
2
2
8
16
0
0
Total
209
6
86
62.50
88.00
0.07944
44.44
78.57
0.07083
75.00
93.10
0.06899
22.22
59.26
0.06297
44.44
69.23
0.10449
44.44
69.23
0.09486
50.00
84.62
0.05565
25.00
53.85
0.04792
66.67
80.00
0.07093
62.50
78.26
0.03031
0.00
5.56
0.0416
27.27
60.00
0.1106
88.89
93.33
0.07786
75.00
88.89
0.09883
100.00
100.00
0.06984
131
1.93753
4.2.1.2 Evaluasi Data Pengujian dengan Latar Hitam dan Putih
Gambar hasil pengujian sample gambar 28 sampai sample gambar 37 dapat dilihat pada Lampiran 3. Berikut akan disajikan tabel dan diagram dari keseluruhan hasil pengujian.
100
Tabel 4.2 Hasil Evaluasi Sample Gambar Dengan Latar Hitam S ample Jumlah Kata
Gambar 28 Gambar 29 Gambar 30 Gambar 31 Gambar 32 Total
12 9 7 10 3
41
Jumlah Karakter
Jumlah Jumlah Kata Karakt S alah er S alah
28
1
19
1
16
2
22
1
10
1
95
6
Akurasi pengenalan Kata (%)
Akurasi pengenal an karakter (%)
Waktu Proses (detik)
1 91.67
96.43
0.0846
88.89
94.74
0.08552
71.43
81.25
0.03032
90.00
95.45
0.02877
66.67
90.00
0.0515
1 3 1 1 0.28071
7
Tabel 4.3 Hasil Evaluasi Sample Dengan Latar Putih
S ample Jumlah Jumlah Jumlah Jumlah Akurasi Kata Karakter Kata Karakter pengenalan S alah S alah Kata (%)
Gambar 33 Gambar 34 Gambar 35 Gambar 36 Gambar 37
12 9 7
28 19 16
1 1 2
Akurasi pengenal an karakter (%)
Waktu Proses (detik)
1 91.67
96.43
0.0848
88.89
94.74
0.09093
71.43
87.50
0.05206
80.00
90.91
0.03184
66.67
90.00
0.05095
1 2
10
22
2
2
3
10
1
1
Total
41
95
7
7
0.31058
101
4.2.1.3 Kesimpulan Hasil Evaluasi Akurasi Pengenalan Karakter
4.2.1.3.1
Kesimpulan Hasil Evaluasi Akurasi Pengenalan Karakter Pada Sample Gambar 1 sampai Sample Gambar 27
Total karakter yang diuji untuk gambar yang dicapture dengan kamera ada sebanyak 616 karakter, karakter yang salah dikenali ada sebanyak 131 karakter. Dengan demikian dapat disimpulkan akurasi pengenalan karakter untuk sample gambar 1 sampai sample gambar 27 sebesar
hanya sebesar
616 − 131 × 100% = 78,73% . Sedangkan akurasi pengenalan kat a 616
209 − 86 × 100% = 58,85% . Hal ini dikarenakan karakter yang tidak 209
dikenali hampir tersebar merata pada setiap kata. Untuk waktu proses dapat dikatakan cukup cepat dengan rata-rata
1.93753 × 100% = 0.07176 detik . 27
Akurasi pengenalan data uji sample gambar 1 s/d sample gambar 13 (%)
120 100 80 60 40 20 0
Akurasi pengenalan data uji sample gambar 1 s/d sample data 13
Gambar 4.13 Diagram Akurasi Pengujian Sample Gambar 1 sampai Sample Gambar 13 dalam persentase
102
Akurasi pengenalan data uji sample gambar 14 s/d sample gambar 27 (%) 100 80 60 40 20 0
Akurasi pengenalan data uji sample gambar 14 s/d sample data 27
Gambar 4.14 Diagram Akurasi Pengujian Sample Gambar 14 sampai Sample Gambar 26
4.2.1.3.2
Kesimpulan Hasil Evaluasi Akurasi Pengenalan Karakter pada Sample Gambar 28 sampai Sample Gambar 37
Total kata dan karakter yang diuji pada sample gambar 28 sampai 32 dengan latar hitam sama dengan sample gambar 33 sampai sample gambar 37 yaitu 41 kata dan 95 karakter. Berikut kesimpulan untuk masing-masing kelompok data uji. 1. Sample Gambar 28 Sampai Sample Gambar 32 dengan Latar Hitam
Akurasi pengenalan kata
41 − 7 × 100% = 82.93% 41
Akurasi pengenalan karakter
95 − 7 × 100% = 92.63% 95
103
Waktu proses =
0.28071 × 1 det ik = 0.056142 detik 5
2. Sample Gambar 33 Sampai Sample Gambar 37 dengan Latar Putih
Akurasi pengenalan kata
41 − 7 × 100% = 82.93% 41
Akurasi pengenalan karakter
Waktu proses =
95 − 7 × 100% = 92.63% 95
0.31058 × 1 det ik = 0.062116 detik 5
Walaupun hasil perhitungan menunjukkan bahwa akurasi pengenalan pada gambar dengan latar belakang hitam dan putih adalah sama, namun hal tersebut tidak selalu mutlak. Berdasarkan diagram pada Gambar 4.5 memperlihatkan bahwa akurasi pengenalan untuk setiap gambar tidak semua sama, terjadi perbedaan pada sample gambar 29 & 34 dan pada sample gambar 30 & 35. Tabel 4.5 dan Tabel 4.6 juga memperlihatkan ada perbedaan karakter yang tidak dikenali, karakter yang dikenali pada gambar dengan latar hitam salah dikenali pada gambar dengan latar putih begitu juga sebaliknya. Namun hasil pengenalan gambar dengan latar hitam dan putih sangat memuaskan dengan akurasi di atas 90%.
104 100 95 90 85 80 75 70
Latar … Latar putih
gambar gambar gambar gambar gambar 27 & 32 28 & 33 29 & 34 30 & 35 31 & 36
Gambar 4.15 Diagram Evaluasi Sample Gambar 28 sampai Sample Gambar 37
Hasil Evaluasi Keseluruhan Akurasi Pengenalan Karakter (%) 100
Gambar Hasil Kamera Capture
90
Gambar Dengan Latar Hitam
80 70
Gambar Dengan Latar Putih
Gambar 4.16 Diagram Hasil Evaluasi Akurasi Pengenalan Karakter secara Keseluruhan Dengan demikian evaluasi akurasi pengenalan karakter secara keseluruhan dapat disimpulkan sebagai berikut :
Akurasi pengenalan kata =
(209 + 41 + 41) − (86 + 7 + 7 ) × 100% = 65,.64% 209 + 41 + 41
Akurasi pegenalan karakter=
(616 + 94 + 94) − (131 + 7 + 7) × 100% = 81,97% 616 + 94 + 94
Rata-rata waktu proses untuk 1 karakter = 1.93753 + 0.28071 + 0.31058 × 1 detik = 0.007246 detik 616 + 94 + 94
105
4.2.2
Evaluasi Kesalahan Aplikasi dalam Pengenalan Karakter Berdasarkan data karakter yang salah dikenali pada Lampiran 4, kesalahan
banyak terjadi karena beberapa hal berikut : 1. Komponen karakter Korea terdiri dari minimal dua simbol, seperti yang terlihat pada Tabel 2.1, Tabel 2.2 dan Tabel 2.3, simbol-simbol untuk membentuk 1 karakter hampir semua tidak saling menempel tetapi ada jarak yang memisahkan simbol-simbol tersebut. Hal tersebut yang kadang membuat aplikasi salah dalam mengenali karakter, misalnya seperti pada : a. Gambar 1 kata ke-6 : karakter 이 dikenali sebagai dua karakter terpisah 0 dan | b. Gambar 1 kata ke-8 : 기 dikenali sebagai 71
c. Gambar 13 kata ke-1 : 지 dikenali sebagai < |
2. Kebanyakan simbol-simbol karakter Korea mempunyai bentuk yang saling menyerupai a. 다 paling banyak dikenali sebagai karakter 댜 seperti pada 1) Gambar 1 kata ke-6 dan kata ke-7 2) Gambar 3 kata ke-2 3) Gambar 10 kata ke-1
106
4) Gambar 13 kata ke-3 5) Gambar 15 kata ke-16 6) Gambar 16 kata ke – 2 7) Gambar 17kata ke – 2, dan lain-lain b. Simbol ㅇ dikenali sebagai ㅁ seperti pada Gambar 28 kata ke-10 dan Gambar 33 kata ke-10 c. Simbol-simbol ㄹ,ㄷ,ㅁ,dan ㅌ saling tertukar, seperti pada Gambar 9 kata 1 dan kata 7, Gambar 12 kata 3, dan lain-lain. d. Simbol-simbol ㅣ,ㅏ,ㅑ,ㅓ dan ㅑ saling tertukar, seperti pada Gambar 16 kata 3, kata 4, kata 7, dan kata 8. e. Simbol-simbol ㅔ dan ㅒ saling tertukar, seperti pada Gambar 16 kata 2 dan Gambar 22 kata 2. f. Simbol-simbol ㅡ,ㅗ,ㅛ,ㅠ dan ㅜ saling tertukar, seperti pada Gambar 16 kata 6 dan Gambar 22 kata 3. g. Kualitas gambar akan mempengaruhi kualitas hasil binerisasi gambar. Contoh nyata dari masalah ini adalah pada sample gambar 23 di mana karakter yang dikenali hanya 1 dari keseluruhan 17 karakter. Selain gambar tersebut blur, juga dikarenakan pencahayaan pada gambar. Banyak gambar dengan gradien iluminasi yang tidak merata sehingga
107
proses binerisasi akan menghilangan informasi penting dari gambar, karena metode yang digunakan adalah metode Otsu yang menggunakan satu nilai threshold untuk keseluruhan gambar.