JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 3 NO. 1 MARET 2011
ISSN : 2086 - 4981
PERANCANGAN DAN IMPLEMENTASI SISTEM PENGENALAN GAMBAR KATA DAN BILANGAN DENGAN KELUARAN SUARA Muhammad Ilhamdi Rusydi1 Hendra Syahputra2 ABSTRACT The development of computer technology has triggered a very rapid development of a computer automation system. This system is known as computer vision. Computer vision basically work like human vision. The human eye who works as a vision sensor that sends information to the brain and eventually the object will be recognized. This principle is the cornerstone of computer vision. In this research, design and implement systems for object recognition in the form of letters or numbers, words and numbers. There are 3 main stages in the implementation of this system. The first is the process of segmentation, labeling and filtering. The second stage is the extraction of character objects made with an integral projection method. The third and final stage is matching the data with template matching method. Each character has an integral projection data or a different graphic, making it easier for the process of matching characters. Then the matching results are read and sounded by the software Indotts. Tests conducted by the treatment variations in object color, background color of the object and webcam capture variations in the distance to an object. From the result, this system has to perform recognition and reading quite well at certain limits. Object color variation did not significantly affect the output of the system. But variations of the background color of the object close to the color variation of the distance between the object and a webcam with the object greatly affects the output of the system. Keywords: Computer Automation Systems, Computer Vision, Color INTISARI Perkembangan teknologi komputer yang sangat pesat telah memicu perkembangan suatu sistem otomatisasi komputer. Sistem ini dikenal dengan computer vision. Computer vision pada dasarnya bekerja layaknya penglihatan manusia. Mata manusia yang bekerja sebagai sensor penglihatan yang akan mengirimkan informasi ke otak dan pada akhirnya objek yang dilihat akan dikenali. Prinsip inilah yang menjadi landasan pada computer vision. Pada penelitian ini dilakukan perancangan dan implementasi sistem untuk pengenalan objek berupa huruf atau angka, kata dan bilangan. Ada 3 tahapan utama dalam implememtasi sistem ini. Yang pertama adalah proses segmentasi, labelisasi dan filtering. Tahap kedua adalah ekstraksi karakter objek yang 1 2
Jurusan Teknik Elektro Universitas Andalas Jurusan Teknik Elektro Universitas Andalas
54
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 3 NO. 1 MARET 2011
ISSN : 2086 - 4981
dilakukan dengan metode integral proyeksi. Tahap yang ketiga atau terakhir adalah pencocokan data dengan metode template matching. Setiap karakter memiliki data atau grafik integral proyeksi yang berbeda sehingga memudahkan untuk proses pencocokan karakter. Lalu hasil pencocokan ini dibaca dan dibunyikan oleh software Indotts. Pengujian dilakukan dengan perlakuan variasi warna pada objek, warna latar objek dan variasi jarak tangkap webcam terhadap objek. Dari hasil penelitian, sistem ini telah dapat melakukan pengenalan dan pembacaan cukup baik pada batasan tertentu. Variasi warna objek tidak terlalu mempengaruhi keluaran dari sistem. Tapi variasi warna latar objek yang mendekati warna objek dan variasi jarak antara webcam dengan objek sangat mempengaruhi keluaran dari sistem. Kata Kunci : PENDAHULUAN
bagaimana sebuah mesin komputer dapat mengenali objek pada citra. Mata manusia adalah sistem visual yang sangat kompleks. Proses perekaman dan pengenalan objek pada mata manusia berada dalam satu sistem yang utuh, sehingga mata manusia dapat langsung mengenali dan mendefinisikan objek dan latar belakangnya, segera setelah mata menangkap dan merekam bayangan suatu citra. Maka untuk membuat suatu sistem visual mesin (machine vision), hasil perekaman alat optik membutuhkan proses pengolahan terlebih dahulu [2]. Meskipun pengenalan objek sangat terasa mudah dilakukan ketika menggunakan sistem indra manusia dengan penglihatan manusia, tetapi automatisasi pengenalan objek menggunakan komputer memiliki berbagai macam proses untuk mengenali sebuah objek.
Kemajuan teknologi dan informasi pada abad ini berkembang begitu pesat. Dan semua itu terjadi dilatarbelakangi oleh keinginan manusia untuk terus maju dan membuat kegiatan manusia lebih mudah dilakukan. Dalam melakukan kegiatan seharihari baik itu kegiatan pribadi maupun kegiatan yang berhubungan dengan pekerjaan, saat sekarang ini telah banyak dibantu oleh hasil dari kemajuan teknologi dan informasi itu sendiri. Sehingga dalam beberapa aktifitas manusia hanya perlu menekan beberapa tombol atau hanya dengan bersuara, maka apa yang ia inginkan dilakukan oleh alat-alat yang menjadi pengganti tangan, kaki atau pikiran kita. Computer vision, yang merupakan istilah dalam proses pengambilan keputusan mengenai kondisi fisik sebenarnya dari sebuah objek, berkaitan mengenai penglihatan yang didapat dari sensor seperti kamera atau yang lainnya [1]. Bidang computer vision memiliki perkembangan yang sangat berarti jika dilihat dari pencapaian yang didapatkan para peneliti sampai saat ini. Salah satu aplikasi pengembangan teknologi berkaitan dengan computer vision adalah
Pengenalan objek layaknya mata ini mengilhami para peneliti untuk mengembangkan aplikasi komputer untuk automatisasi pengolahan citra dalam pengenalan objek. Implementasi dari teori yang berhubungan dengan hal ini dibutuhkan setidaknya sebuah mesin komputer dan kamera sebagai sensor. Kamera digunakan untuk menangkap gambar objek yang ada di depannya. Komputer
55
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 3 NO. 1 MARET 2011 digunakan sebagai suatu mesin yang dapat mengolah data gambar dari kamera dan pada akhirnya mengenali gambar objek yang ada di depannya. Tahapan penting dalam proses pengenalan gambar objek, yaitu pengenalan gambar objek secara off line dengan memanfaatkan ciri atau fitur yang ada pada gambar objek tersebut [1].
ISSN : 2086 - 4981
telah dilakukan perekaman untuk bunyi dari huruf-huruf tersebut. Berdasarkan penelitian ini dikembangkanlah aplikasi lebih lanjut mengenai pengenalan citra huruf dan angka. Jika dalam penelitian sebelumnya berhasil mengenal image huruf yang mengandung satu karakter saja dan angka yang dikenali tersebut dibunyikan dengan menggunakan suara yang sudah ada dalam basis data, maka pada penelitian ini dilakukanlah pengembangan dimana huruf yang dikenali dalam 1 frame tidak hanya 1 huruf saja, tapi beberapa huruf sehingga membentuk kata. Dan dalam pembunyiannya digunakan software Indotts. Indotts adalah perangkat lunak untuk mengubah teks menjadi suara dalam bahasa Indonesia yang dibuat oleh Dr.Arry Ahmad Arman, seorang dosen ITB yang telah melakukan penelitian selama hampir 10 tahun untuk membuat database diphone untuk pengucapan teks dalam bahasa Indonesia [4].
Karakteristik gambar objek yang dimasukkan digunakan sebagai pembanding dengan karakteristik gambar objek yang tersimpan pada database sehingga dari proses tersebut dapat dikenali gambar objek apa saja yang diinput-kan oleh pengguna. Proses perbandingan ciri/fitur gambar objek yang di-input-kan dengan ciri/fitur gambar objek yang ada pada database dinamakan dengan proses template matching. Telah cukup banyak penelitian dan tulisan tentang pengenalan objek oleh sistem komputer. Salah satunya adalah Willy Sutama [3], dalam penelitiannya yang berjudul “Pengenalan Huruf dengan Metode Integral Proyeksi” yang membahas tentang pengenalan huruf alfabet. Proses awal pengenalan huruf ini adalah pengambilan citra huruf dengan menggunakan webcam. Setelah itu huruf diproses dengan pengolahan citra melalui sebuah komputer sehingga didapatkan ciri atau fitur bentuk huruf tersebut. Fitur tersebut kemudian dimatching-kan dengan huruf yang ada di database. Sebelumnya telah dilakukan pengenalan fitur atau ciri dari masing-masing huruf alfabet dengan menghasilkan nilai tertentu yang kemudian disimpan di database sebagai pembanding untuk pengenalan huruf yang diinput-kan. Hasil dari proses template matching ini akan ditampilkan dan dikeluarkan dalam bentuk audio yang sebelumnya
Penelitian ini beberapa tujuan dalam setiap tahap yang dilaluinya. Pada tahap pertama adalah untuk dapat melakukan pengolahan citra pada gambar huruf dan angka sehingga didapatkan ciri atau fitur bentuk dari gambar huruf atau angka tersebut. Tujuan keduanya adalah dapat melakukan pembandingan antara data gambar objek huruf atau angka yang ditangkap webcam dengan data gambar objek huruf atau angka yang ada pada sistem. Sistem dapat menampilkan huruf atau angka yang terdapat dalam citra. Penelitian ini juga bertujuan untuk melakukan analisa pengearuh perbedaan warna objek dengan warna latar objek serta pengaruh perubahan jarak objek dan kamera terhadap kualitas kinerja sistem. Pada akhirnya system dapat
56
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 3 NO. 1 MARET 2011 melakukan pembunyian bacaan dari kata atau bilangan yang ditangkap kamera.
2.
Batasan tersebut adalah :
3.
1. Jenis kamera yang digunakan adalah kamera tunggal jenis webcam iSlim 310 VGA Video. 4.
2. Objek berupa huruf alfabet kapital dan angka menggunakan font Arial Rounded MT Bold dengan ukuran font adalah 72
5.
3. Gambar huruf atau angka yang menjadi objek, antara huruf atau angka yang satu dengan yang lain tidak boleh bersambung. 4. Warna latar gambar objek kata atau bilangan adalah homogen, begitu juga warna objek kata atau bilangan pada gambar tersebut.
ISSN : 2086 - 4981
Warna dari objek huruf atau teks dan adalah homogen, begitupula dengan warna latar yang juga homogen. Objek huruf memiliki ukuran dan font yang sama serta tidak bersambung antara huruf yang satu dengan yang lainnya. Antara objek dengan webcam memiliki rentang jarak tertentu. Objek huruf dari teks yang akan ditangkap webcam dengan yang tersimpan didalam sistem memiliki karakteristik yang sama, dan akan diperlakukan sama dalam proses pengenalan objek dan pengolahan citra.
Sistem ini membutuhkan beberapa tahapan sebelum diimplementasikan, tahapan tersebut adalah : 1. Tahapan dimulai dengan proses capture atau pengambilan gambar huruf atau susunan huruf yang membentuk kata oleh webcam yang terhubung ke komputer. Yang ditangkap oleh webcam adalah frame-frame yang kemudian disimpan di memori buffer kamera. 2. Hasil capture tadi kemudian diproses dengan tahapan pengolahan citra yaitu segmentasi. Dalam tahap ini dilakukan pemisahan terhadap daerah atau bagian tertentu sehingga didapat bentuk huruf angka yang di-input-kan. 3. Selanjutnya dilakukan proses pengolahan citra berikutnya yaitu pemfilteran, dengan pemfilteran akan diberikan label pada masing-masing objek pada koordinat piksel, dimana objek yang berbeda akan memiliki label yang berbeda pula. Pemfilteran ini bertujuan untuk menghilangkan noise atau bagian-bagian tertentu pada objek. 4. Dari hasil pemfilteran tadi dilakukan pendeteksian ciri/fitur
5. Gambar objek kata atau bilangan di-input-kan ke komputer melalui kamera dengan jarak tertentu. 6. Proses pengenalan huruf/angka antara yang di-input-kan dengan data huruf/angka yang ada disistem menggunakan template matching. 7. Pembunyian dari teks ke suara dilakukan oleh software Indotts. 8. Penelitian ini menggunakan bahasa pemograman Microsoft Visual Basic 6.0 Version untuk membangun sistem pengolahan citra. PENDEKATAN PEMECAHAN MASALAH Berdasarkan batasan masalah yang telah dijabarkan maka objek penelitian yang digunakan dalam penelitian ini terdiri dari beberapa kondisi, yaitu : 1. Objek berupa gambar huruf alfabet kapital dan angka yang ditangkap oleh webcam.
57
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 3 NO. 1 MARET 2011 bentuk dari satu persatu gambar huruf . Disini digunakan metode integral proyeksi. 5. Hasil dari pendeteksian ciri/fitur bentuk huruf demi huruf, kemudian di-matching-kan dengan hasil pendeteksian karakteristik huruf yang tersimpan didalam sistem 6. Sebelumnya sudah dilakukan proses capture, segmentasi, filtering dan pendeteksian karakteristik terhadap gambar masing-masing huruf sehingga didapat data karakteristik hurufhuruf tersebut yang kemudian disimpan sebagai data gambar query didalam sistem. 7. Jika dalam proses pe_matchingan didapat kemiripan antara data dari masukan dengan data yang tersimpan didalam sistem, maka informasi ini akan ditampilkan dalam bentuk teks. 8. Dengan software Indotts keluaran berupa teks ini diolah menjadi menjadi bentuk suara, sehingga pembacaan dari kata yang di-input-kan dapat didengar melalui speaker. 9. Analisa terhadap keluaran sistem dilakukan dengan cara membandingkan gambar huruf penyusun kata yang ditangkap webcam dengan informasi hasil pembacaan yang di-output-kan oleh komputer melalui speaker. Tahapan-tahapan di atas, secara garis besarnya terhubung seperti yang terdapat pada gambar 1.
ISSN : 2086 - 4981
Data gambar
Gambar
Kamera
Capture
Segmentasi
Pelabelan dan Filtering
Ekstrakasi karakteristik citra
Ekstrakasi karakteristik citra Template matching
output
Analisa
Gambar 1. Tahapan Kerja Sistem Program yang dirancang dalam penelitian ini terbagi atas 4 (empat) algoritma pokok, yaitu: 1. Algoritma segmentasi citra berdasarkan metode bilevel luminance thresholding. Algoritma ini bertujuan memisahkan antara objek dengan latar (background). 2. Algoritma pelabelan dan filtering objek. Pelabelan dan filtering objek bertujuan untuk menghilangkan noise terhadap objek yang tidak diinginkan. 3. Algoritma integral proyeksi dari objek huruf atau angka penyusun kata atau bilangan. 4. Algoritma pencocokan (matching) antara grafik integral proyeksi huruf penyusun teks yang ditangkap webcam dan objek huruf yang telah disimpan dalam sistem.
58
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 3 NO. 1 MARET 2011
ISSN : 2086 - 4981
8. Tombol „integral proyeksi‟, berfungsi untuk melakukan proses integral proyeksi dan menampilkan gambar hasil integral proyeksi.
HASIL DAN PEMBAHASAN Data dan Analisa Tahapan pengambilan data dan tahapan pengenalan kata atau bilangan memiliki guide user interface seperti yang dilihatkan pada gambar 2 dan gambar 3. Keterangan mengenai gambar tersebut diberikan yang berupa fungsi dari setiap bagian tampilan.
9. Tombol „keluar‟, berfungsi untuk keluar dari program.
Gambar 3. FormTampilan Awal Sistem Pengenalan Kata dan Bilangan Gambar 2. Tampilan Awal Visualisasi Pengambilan Data
Keterangan : 1. Tampilan video hasil tangkapan
Keterangan :
dari webcam
1. Tampilan video yang ditangkap oleh webcam
2. Tombol „capture’, yang berfunfsi
2. Tombol „capture‟, yang berfungsi untuk mengambil dan menyimpan 1 buah frame dari video.
3. Gambar
3. Gambar 1 buah frame yang telah diambil sebagai input.
4. Tampilan
untuk mengambil 1 buah frame dari video frame yang telah diambil sebelumnya yang dijadikan sebagai gambar input. gambar „tampilkan gambar input‟, berfungsi untuk menampilkan 1 buah frame yang telah di-capture sebelumnya.
4. Tombol „tampilkan input‟, yang berfungsi untuk menampilkan 1 buah frame yang telah dicapture sebelumnya.
5.
5. Gambar hasil pengolahan citra berupa proses segmentasi dan filtering
Gambar hasil pengolahan citra berupa segmentasi dan filtering.
6. Tombol
„segmentasi dan filtering’, berfungsi untuk melakukan proses pengolahan citra berupa segmentasi dan filtering.
6. Tombol „segmentasi dan filtering ‟, yang berfungsi untuk melakukan proses segmentasi dan filtering.
7. Menunjukkan jumlah huruf atau
angka yang gambar objek
7. Menunjukkan jumlah huruf atau angka yang terdeteksi dari gambar objek
59
terdeteksi
dari
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 3 NO. 1 MARET 2011 8. Menunjukan hasil pengenalan
ISSN : 2086 - 4981
atas susunan beberapa huruf dengan memvariasikan jarak antara objek dengan webcam.
objek 9. Tombol „pencocokan‟, berfungsi
untuk melakukan proses pencocokan antara data gambar input dengan data gambar huruf atau angka yang di-database
7. Pengenalan dan pembacaan objek berupa bilangan yang terdiri atas susunan beberapa angka dengan memvariasikan warna objek. Warna yang dicobakan adalah hitam, merah, hijau dan biru.
10. Tombol
„ucapkan‟, berfungsi untuk malakukan pembacaan terhadap teks hasil pencocokan.
8. Pengenalan dan pembacaan objek berupa bilangan yang terdiri atas susunan beberapa angka dengan memvariasikan jarak antara objek dengan webcam.
11. Tombol „grafik integral proyeksi‟,
berfungsi untuk menampilkan gambar integral proyeksi huruf atau angka dari objek gambar kata atau bilangan. 12. Tombol „keluar‟, yang berfungsi
9. Pengenalan dan pembacaan objek berupa kata yang terdiri atas susunan beberapa huruf dengan memvariasikan warna latar objek.
untuk keluar dari program. Pada implementasi sistem pengenalan kata atau bilangan ini ada beberapa skenario : 1. Pengujian pengaruh jarak tangkap antara webcam dengan objek terhadap % luas piksel objek.
10. Pengenalan dan pembacaan objek berupa bilangan yang terdiri atas susunan beberapa angka dengan memvariasikan warna latar objek.
2. Penentuan nilai threshold untuk segmentasi dan nilai batas luas objek untuk filtering
Untuk skenario percobaan yang kedua, diujikan pada citra kata dan bilangan pada objek berwarna hitam dengan latar warna putih.
3. Pengenalan dan pembacaan objek yang terdiri atas satu karakter huruf atau angka dengan memvariasikan warna objek. Warna yang dicobakan adalah warna hitam, merah, hijau dan biru.
Untuk skenario percobaan yang melakukan wariasi warna objek yaitu skenario percobaan nomor 3, 5 dan 7, warna objek yang digunakan adalah warna hitam atau RGB(0,0,0), warna merah atau RGB(255,0,0), warna hijau atau RGB(0,255,0) dan warna biru atau RGB(0,0,255), yang kesemua citra memiliki warna latar yang sama yaitu warna putih atau RGB(255,255,255).
4. Pengenalan dan pembacaan objek yang terdiri atas satu karakter huruf atau angka dengan memvariasikan jarak antara objek dengan webcam. 5. Pengenalan dan pembacaan objek berupa kata yang terdiri atas susunan beberapa huruf dengan memvariasikan warna. Warna yang digunakan adalah hitam, merah, hijau dan biru.
Untuk skenario percobaan yang memvariasikan jarak tangkap webcam yaitu pada skenario percobaan nomor 4, 6 dan 8, dilakukan penambahan jarak sebesar 1 cm, 2 cm dan 3 cm dari jarak normal, dan juga dilakukan
6. Pengenalan dan pembacaan objek berupa kata yang terdiri
60
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 3 NO. 1 MARET 2011 pengurangan jarak sebesar 1 cm, 2 cm dan 3cm dari jarak normal. Jarak normal adalah jarak antara webcam dengan objek pada saat pengambilan data, dalam penelitian ini adalah 23 cm. Pada masingmasing percobaan ini citra dengan objek berwarna hitam dengan latar berwarna putih.
ISSN : 2086 - 4981
dengan objek mempengaruhi % luas piksel objek. Semakin jauh jarak antara webcam dengan objek maka % luas piksel objeknya semakin kecil. Dan sebaliknya, semakin jauh jarak antara webcam dengan objek maka % luas piksel objeknya semakin besar. Penentuan Nilai Threshold untuk Segmentasi dan Penentuan Nilai Batas Luas Objek untuk Filtering
Dan untuk skenario percobaan variasi warna latar objek, objeknya berwarna hitam dan variasi warna latarnya adalah RGB(255,255,255), RGB(220,220,220), RGB(185,185,185) dan RGB(150,150,150).
Dalam penelitian ini, penentuan nilai threshold ditentukan dengan pengujian nilai threshold sebesar 90, 95, 100, 105, 110, 115, 120, 125, 130 dan 135 (Tabel 2). Gambar objek yang akan ditentukan nilai threshold-nya adalah gambar kata dan bilangan dengan objek berwarna hitam dan latar berwarna putih. Pengujian dilakukan dengan mengambil salah satu nilai threshold untuk pengambilan data masing-masing karakter huruf dan angka, lalu data yang didapat digunakan untuk pengujian implementasi sistem dengan nilai threshold yang sama.
Hasil pengenalan pada percobaan-percobaan diatas dibunyikan oleh software Indotts untuk mendapatkan keluaran suara. Tabel 1 menunjukkan data perubahan luas piksel suatu objek ketika jarak objek dan kameradibuat bervariasi. Pengujian ini menetapkan jarak 23 cm menjadi jarak normal objek terhadap kamera. Setelah itu objek digeser-geser sepanjang sumbu normal kamera. Terdapat 2 pergeseran yang mendekatkan jarak mereka dan 3 pergeseran yang menambah jarak antara objek dan kamera.
Sistem disini diujicobakan untuk mengenali 25 contoh teks yang terdiri dari 15 contoh kata dan 10 contoh bilangan. Dengan cara yang sama dilakukan pengujian untuk masing-masing nilai threshold. Dan nilai threshold yang memiliki kesalahan paling kecil, inilah nilai threshold yang akan digunakan pada sistem.
Tabel 1. Pengaruh perubahan luas piksel objek terhadap perubahan jarak kamera terhadap objek. % luas piksel Jarak (cm) objek 21 19,76 % 22 18,4 % 23 (normal) 17,5 % 24 16,23 % 25 14,95 % 26 14,06 %
Tabel 2. Perubahan nilai kesalahan terhadap perubahan nilai threshold. Nilai threshold 90 95 100 105 110
Dari data-data yang didapatkan bisa diketahui bahwa perubahan jarak antara webcam
61
Kesalahan 28% 28% 24% 24% 24%
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 3 NO. 1 MARET 2011 115 120 125 130 135
ISSN : 2086 - 4981
767 piksel² (Gambar 3). Maka sebaiknya penentuan nilai batas luas objek harus sedikit lebih kecil dari nilai ini. Dan dalam penelitian ini diambil nilai 500 sebagai nilai batas luas piksel objek.
8% 20% 24% 20% 20%
Dari hasil perhitungan % kesalahan tadi, maka didapatkan bahwa nilai pengujian pada nilai threshold 115 yang memiliki kesalahan paling kecil. Dan nilai threshold inilah yang akan digunakan pada proses segmentasi dalam implementasi sistem ini selanjutnya.
Gambar 4. Luas Piksel Objek huruf ‘I’
Penentuan Nilai Batas Objek untuk FIltering
Luas Pengenalan dan Pembacaan Input dengan Variasi Warna Objek
Penentuan nilai batas luas objek ini berguna untuk proses filtering yang nantinya berfungsi untuk menghilangkan noise. Objek yang luasnya kurang dari nilai batas luas ini akan dianggap sebagi noise dan untuk kemudian akan dihilangkan. Penentuan nilai batas luas objek ini dengan mempertimbangkan luas masingmasing karakter huruf dan angka. Dengan pertimbangan ini diketahui bahwa huruf I adalah karakter yang memiliki luas paling kecil.
Dalam percobaan ini variasi warna yang digunakan adalah hitam, merah, hijau dan biru serta terdapat 36 objek karakter yang diuji, yeng terdiri atas 26 huruf alfabet kapital dari A sampai Z dan 10 angka dari 0 sampai 9. Masing-masing karaketer dilakukan pengujian sebanyak 3 kali untuk masingmasing warna hitam, merah hijau dan biru. Data mengenai pengaruh warna terhadap keberhasilan sistem ini dapat dilihat pada Tabel 3
Sebelumnya telah diketahui sistem ini akan diujicobakan pada objek dengan variasi jarak, dan dari pengujian tentang pengaruh jarak tangkap webcam terhadap % luas piksel objek sebelumnya, sehingga jarak tangkap webcam juga akan mempengaruhi % luas piksel objek. Maka untuk menentukan batas luas minimal yang dianggap sebagai objek, dilakukan penghitungan luas karakter huruf I pada jarak tangkap webcam terjauh yaitu pada jarak 26 cm.
Tabel
3.
Warna Objek Hitam Merah Hijau Biru
Tingkat keberhasilan sistem dalam 4 macam warna objek. Keberhasilan 100% 99,07% 100% 100%
Untuk hasil pengenalan bilangan dengan warna hitam, hijau dan biru berhasil dengan baik. Sedangkan pada bilangan berwarna merah hanya terjadi kesalahan pada bilangan „451768‟ yang
Dengan menggunakan pemrograman visual basic 6, didapatkan luas karakter huruf I pada jarak 26 cm adalah sebesar
62
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 3 NO. 1 MARET 2011 terbaca oleh sistem „451766‟ dan pada bilangan „783465‟ yang terbaca menjadi „763465‟. Kesalahan terjadi sekali untuk masing-masing bilangan tadi dari 3 kali pengujian.
Komponen Warna R G B 255 255 255 220 220 200 185 185 185 150 150 150
Kesalahan pada pembacaan bilangan dengan warna merah ini bisa disebabkan oleh intensitas cahaya objek yang ditangkap webcam tidak terlalu baik, sehingga proses segmentasi untuk memisahkan piksel objek dengan piksel latar tidak sesuai harapan. Akibatnya data hasil integral proyeksinya tidak seperti yang diinginkan.
ISSN : 2086 - 4981
Kesalahan 13,33 % 53,33 % 71,11 % 100%
Dari hasil pengujian diatas dapat dikatakan bahwa saat warna RGB latar objek diset mendekati warna RGB objek maka semakin besar kesalahan pengenalan sistem dan sistem hanya dapat bekerja dengan baik pada warna objek dan warna latar objek yang sama dengan warna yang digunkan saat pengambilan data.. Ini karena nilai threshold untuk proses segmentasi hanya berlaku untuk kondisi warna yang sama.
Pengenalan dan Pembacaan Input dengan Variasi Jarak Objek dengan Kamera Pada skenario percobaan data ini, diambil data besar kesalahan sistem dalam mengenali objek ketika jarak objek dan kamera divariasikan dari jarak normalnya (23 cm). Terdapat kesalahan yang semakin memburuk ketika jarak benda semakin mendekat ataupun menjauh dari kamera.
Secara umum dapat dikatakan bahwa sistem dapat bekerja dengan baik pada kondisi dan parameter yang sama dengan saat pengambilan data untuk data induk sistem pengenalan dan pembacaan kata dan bilangan.
Tabel 4. Tingkat kesalahan sistem pada berbagai macam perubahan jarak
KESIMPULAN Berdasarkan analisa terhadap hasil percobaan yang didapat, maka dapat diambil beberapa simpulan sebagai berikut :
Jarak (cm) 20 21 22 24 25
Kesalahan 86,67 % 30% 30% 0% 70%
1. Perubahan jarak tangkap webcam ke objek dari jarak normal berpengaruh terhadap % luas piksel objek. 2. Perlakuan variasi warna terhadap objek huruf/angka didapatkan % kesalahan pembacaan sebesar 0 % pada warna hitam, hijau dan biru, dan 0,93 % pada warna merah. Terlihat bahwa variasi warna sangat kecil pengaruhnya terhadap hasil keluaran sistem.
Dari data hasil percobaan diatas (Tabel 4), sistem dapat bekerja dengan baik hanya pada kondisi penambahan jarak 1 cm, sedangkan untuk kondisi jarak yang lain sistem tidak dapat mengenali bilangan dengan baik. Pengenalan dan Pembacaan Input dengan Variasi Warna Latar Objek
3. Perlakuan variasi jarak terhadap objek huruf/angka didapatkan %
63
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 3 NO. 1 MARET 2011 kesalahan sebesar 0,93 % pada penambahan 1 cm; 20,37 % pada penambahan 2 cm; 48,15 % pada penambahan 3 cm; 0 % pada pengurangan jarak 1 cm; 4,63 % pada pengurangan 2 cm dan 25 % pada pengurangan jarak 3 cm dari jarak normal. Semakin besar atau semakin kecil jarak antara webcam dengan objek dari jarak normal maka makin besar kesalahan yang terjadi.
ISSN : 2086 - 4981
pada pengurangan 2 cm dan 86,67 % pada pengurangan jarak 3 cm dari jarak normal. Semakin besar atau semakin kecil jarak antara webcam dengan objek dari jarak normal maka makin besar kesalahan yang terjadi. 8. Perlakuan variasi warna latar objek didapatkan % kesalahan untuk RGB(255,255,255) sebesar 13,33 % pada gambar kata dan 0 % pada gambar bilangan, untuk RGB(220,220,220) sebesar 53,33 % pada gambar kata dan 0 % pada gambar bilangan, dan untuk RGB(185,185,185) sebesar 71,11 % pada gambar kata dan 30 % pada gambar bilangan. Untuk variasi warna latar objek, semakin mendekati warna objek maka kesalahan yang terjadi makin besar.
4. Perlakuan variasi warna pada objek kata didapatkan % kesalahan sebesar 13,33 % pada warna hitam; 2,2 % pada warna merah; 6,67 % pada warna hijau dan 8,89 % pada warna biru. Terlihat bahwa variasi warna sangat kecil pengaruhnya terhadap hasil keluaran sistem. 5. Perlakuan variasi jarak terhadap objek kata didapatkan % kesalahan sebesar 6,67 % pada penambahan 1 cm; 13,33 % pada penambahan 2 cm; 26,67 % pada penambahan 3 cm dan 66,67 % pada pengurangan 1 cm dari jarak normal. Semakin besar atau semakin kecil jarak antara webcam dengan objek dari jarak normal maka makin besar kesalahan yang terjadi.
9. Sistem dapat bekerja cukup baik pada kondisi yang sama dengan saat pengambilan data untuk data induk sistem.
DAFTAR PUSTAKA [1] Munir, Renaldi. 2004. Pengolahan Citra Digital dengan Pendekatan Algoritmik. Informatika : Bandung. [2] Sigit, Riyanto,dkk. 2005. Step by Step Pengolahan Citra Digital. Yogyakarta : Andi
6. Perlakuan variasi warna pada objek bilangan didapatkan % kesalahan sebesar 0 % pada warna hitam, hijau dan biru, dan 6,67 %pada warna merah. Terlihat bahwa variasi warna sangat kecil pengaruhnya terhadap hasil keluaran sistem.
[3] Sutama, Willy. 2008. Pengenalan Huruf dengan Metode Integral Proyeksi. Tugas Akhir, Jurusaan Teknik Elektro Universitas Andalas : Padang
7. Perlakuan variasi jarak terhadap objek bilangan didapatkan % kesalahan sebesar 0 % pada penambahan 1 cm; 70 % pada penambahan 2 cm; 30 % pada pengurangan jarak 1 cm; 30 %
[4] Arman, Arry Akhmad. 2002. Konversi dari Teks ke Fonem. ITB:Bandung [
64