BAB I PENDAHULUAN
1.1. Pendahuluan Sejak awal penemuan teknologi komputer sebagai lompatan mutakhir dalam dunia ilmu pengetahuan, komputer telah banyak berperan dalam membantu manusia dalam melakukan berbagai kerja yang membutuhkan banyak komputasi yang kompleks, kecepatan, akurasi serta berulang-ulang. Komputer telah banyak berperan dalam membantu manusia, namun ada banyak hal pula yang tidak dapat dilakukan oleh sistem komputer. Oleh karena itu, berbagai metode terus dibangun sejalan dengan kemajuan pemikiran manusia untuk
memecahkan
masalah
baru
yang
terus
muncul
dan
dapat
dikomputerisasikan. Banyak bermunculan alat-alat teknologi yang mendukung piranti komputer sehingga
kemampuan komputer semakin banyak. Komputer juga dilengkapi
dengan sistem basis data dimana manusia dapat menyimpan, menghapus, mengubah data.
Hal ini menjadikan komputer mempunyai nilai lebih
dibandingkan dengan alat teknologi lainnya. 1.2. Latar Belakang Permasalahan Teknologi komputer semakin berkembang terutama digunakan untuk penyimpanan dokumen-dokumen atau data-data yang berharga.
Pemasukan
data-data ke dalam komputer biasanya dilakukan dengan pengetikan data-data tersebut dengan bantuan keyboard. Hal ini akan memakan waktu dan tenaga terutama bila data yang dimasukan ada banyak jumlahnya. Apalagi bila data-data dalam komputer tersebut hilang yang berarti data-data yang hilang tersebut harus dilakukan pengetikan ulang . Oleh karena itu, dibuat program OCR ( Optical Character Recognotion ), diharapkan hanya dengan melakukan scan document printed kemudian secara otomatis komputer akan membawa gambar tersebut
1
menjadi file text *.txt melalui program OCR ini. Hal ini dimaksudkan bila dalam bentuk file text data tersebut dapat diolah kembali. Program ini dimaksudkan agar memudahkan user untuk mengolah data ke dalam komputer. 1.3. Rumusan Masalah Dalam skripsi ini akan dibuat program OCR yang mampu mengubah gambar ke dalam bentuk teks. Proses citra dari bentuk file bitmap yang belum diolah ke bentuk file text menggunakan metode pattern matching. 1.4. Batasan Masalah Mengingat banyaknya perkembangan yang dapat ditemukan pada permasalahan ini , maka perlu adanya batasan-batasan yang jelas tentang apa yang dibuat dan diselesaikan dalam program OCR ini.
Batasan-batasan tersebut
sebagai berikut : 1. Citra berisi karakter tercetak bukan handwriting, tidak mengandung gambar melainkan hanya berisi teks saja. 2. Citra harus bebas noise. 3. Citra hanya hitam putih. 4. Default font yang digunakan adalah Courier dan Times New Roman tidak mengandung underline, bold, italic dan ukuran min 10 pt max 16 pt. 5. Posisi karakter satu dengan yang lain tidak boleh bertumpukan atau karakter satu dengan yang karakter lainnya tidak boleh menyambung. 6. Type citra hanya *.bmp 1.5. Tujuan Penulisan Adapun tujuan dari pembuatan Tugas Akhir dengan judul Pengenalan Karakter Tercetak Dengan Metode Pattern Matching adalah
Bagi Mahasiswa
1. Mengimplementasikan ilmu (teori-teori) yang telah diterima selama di bangku perkuliahan.
2
2. Sebagai syarat untuk menyelesaikan program studi di Fakultas Teknik, Jurusan Teknik Informatika, Universitas Kristen Duta Wacana. 3. Mendapatkan masukan tentang berbagai permasalahan yang umumnya di hadapi dalam membuat suatu program.
Bagi Universitas
1. Agar
universitas
dapat
mengkaji
kemampuan
mahasiswa
dalam
mengimplementasikan ilmu yang telah diberikan dalam perkuliahan. 2. Penyiapan tenaga terdidik yang lebih berpotensi dan siap untuk memasuki dunia kerja. 1.6. Hipotesis Dengan metode pattern matching maka file gambar yang berisi teks tersebut dapat dikenali sebagai karakter tercetak atau bukan. Metode pattern matching menggunakan perbandingan antar data citra yang dicocokan dengan data citra karakter yang ada di database.
Perbandingan dilakukan dengan
membandingkan nilai piksel-piksel antar citra . 1.7. Spesifikasi Sistem Scan Gambar DATABASES Data huruf Data Kamus
Bandingkan Program OCR
File text (*.txt) Gambar 1.1 Gambaran Kerja Sistem (Input, Proses, Output)
3
1.7.1. Kemampuan Kerja Sistem Sistem dapat : 1. Menscan gambar (*.bmp ) lihat pada Gambar 1.1. 2. Mengubah citra ke dalam bentuk grayscale 3. Melakukan scan tiap baris jika ada pixel yang hitam berarti memuat teks. Bila pixel tidak ada yang hitam berarti tidak memuat teks. 4. Melakukan scan tiap-tiap kolom masing-masing baris sehingga terpecah menjadi huruf-huruf. Huruf-huruf tersebut disimpan dalam matrik. 5. Membandingkan matrik-matrik tersebut dengan data huruf yang ada di database. Caranya dengan menscale matrik tersebut sesuaikan yang ada di database kemudian menguji apakah pada matrik tersebut mempunyai banyak nilai pixel yang sama. Jika ya maka simpan dan tampilkan huruf tersebut. 6. Mengecek kata-kata tersebut dengan database kamus apakah kata-kata tersebut ada dalam database. Kata-kata yang ada dengan yang tidak ada didatabase diberi warna yang berbeda 7. Setelah selesai di uji menyimpan kedalam file text (*.txt) 1.7.2. Hardware dan Software Tugas Akhir Pengenalan Karakter Tercetak Dengan Metode Pattern Matching ini dapat dikatakan berhasil jika para user sudah merasa puas dan terbantu dengan adanya program ini, hal ini berarti program ini telah memberikan daya guna yang baik untuk semua pihak. 1. Spesifikasi hardware yang digunakan dalam pembuatan program : 9 Processor Intel Pentium III 500 Mhz 9 RAM 512 Mb 9 VGA 64 Mb 2. Spesifikasi software yang digunakan dalam pembuatan program : 9 Sistem Operasi Windows XP 9 Delphi 6 3. Sedang spesifikasi hardware minimal untuk implementasi :
4
9 Processor Intel Pentium II 500 Mhz 9 RAM 64 Mb 9 VGA 32 Mb 1.8. Metodologi Metodologi yang digunakan dalam pelaksanaan tugas akhir ini adalah : 1. Penelitian pustaka •
Dilakukan dengan mempelajari buku-buku yang mendukung proses pelaksanaan tugas akhir.
•
Dilakukan dengan mempelajari teori-teori dan mencari informasi yang diperoleh dari internet yang mendukung pelaksanaan tugas akhir.
2. Penelitian laboratorium •
Dalam hal ini penelitian dilakukan dengan cara mencoba sendiri program yang dibuat secara berulang-ulang sampai program tersebut berjalan baik.
•
Program diuji cobakan kepada user untuk mengetahui apakah user dalam memakai program tersebut membingungkan ?
1.9. Jadwal Kerja Jadwal dalam pembuatan program sebagai berikut : KEGIATAN No
1 2
Proposal
3 4 5 6
Perancangan Sistem
Analisa Sistem Pembuatan Program Implementasi Program
MINGGU KE1
2
3
4
5
●
●
●
●
●
●
●
●
6
7
8
9
10
11
12
13
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
14
● ●
Penulisan Laporan
●
5
●
1.10. Sistematika Penulisan Penulisan tugas akhir ini dibagi menjadi 5 bab dimana masing-masing bab mempunyai objektif yang berbeda. Sebagai pengantar Bab I membahas mengenai latar belakang masalah, batasan masalah, tujuan penulisan, metode penulisan, serta sistematika penulisan yang digunakan. Dalam pengimplementasian tugas akhir ini diperlukan landasan berpikir sebagai acuan tugas akhir ini, maka Bab II landasan Teori akan menjelaskan secara singkat teori yang dipakai dalam pemisahan karakter, pengenalan pola karakter. Bab III merupakan perancangan program dimana bab ini memberikan gambaran mengenai rancangan program yang dibuat berdasarkan teori-teori yang digunakan. Bab IV implementasi program yang merupakan pernerapan dari teoriteori yang berupa algoritma pemrograman. Sebagai penutup penulisan tugas akhir ini maka Bab V berisi dari kesimpulan dari hasil uji coba program. Bab ini juga berisi saran-saran bagi pengembangan program Optical Character Recognotion tersebut berserta metode yang digunakan dalam pembuatan program tersebut .
6