JURNAL SAINS DAN SENI POMITS Vol. 1, No. 1, (2013) 1-8
SISTEM KONVERSI DOKUMEN IDENTITAS INDIVIDU MENJADI SUATU TABEL Muhammad Mushonnif Junaidi dan Nurul Hidayat Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief Rahman Hakim, Surabaya 60111 Email:
[email protected] Abstrak— Pada Tugas Akhir ini telah dibuat sistem konversi dokumen identitas individu menjadi suatu tabel, yaitu sebuah sistem yang mampu mengkonversi citra dokumen menjadi karakter-karakter digital yang tersusun ke dalam sebuah tabel. Dokumen yang digunakan adalah dokumen yang memiliki format baku, seperti eKTP/SIM. Sistem ini digunakan untuk memudahkan entri data pada dokumen secara otomatis menjadi suatu tabel. Pembacaan karakter demi karakter menjadi suatu tabel adalah berdasar koordinat yang telah ditentukan sesuai bentuk dokumen. Pembuatan sistem ini menggunakan algoritma Learning Vector Quantization (LVQ) dalam mengenali karakter pada dokumen tersebut. Citra dokumen didapatkan dengan menggunakan scanner sehingga dokumen berbentuk format .jpg. Kemudian dilakukan tahap konversi citra untuk membedakan karakter dan latar belakangnya. Citra karakter kemudian disegmentasi dan dinormalisasi menjadi 10x18 piksel untuk didapatkan cirinya sebagai masukan algoritma LVQ. Berdasarkan hasil pengujian dari 25 dokumen eKTP/SIM, sistem dengan algoritma LVQ ini mampu mengenali karakter pada citra dokumen eKTP dengan ratarata akurasi sebesar 62.51%. Sedangkan pada dokumen SIM, sistem mampu mengenali karakter dengan rata-rata akurasi sebesar 91.87%. Kata Kunci—Konversi Dokumen, eKTP, SIM, Learning Vector Quantization, Koordinat, Tabel.
I. PENDAHULUAN
P
ERKEMBANGAN teknologi telah memberikan dampak yang signifikan bagi ilmu pengetahuan dan kehidupan manusia. Teknologi dibuat dalam rangka mempermudah bahkan mempercepat pekerjaan, yang dahulunya menggunakan cara manual berganti menjadi otomatis. Salah satunya adalah perkembangan dibidang pengenalan pola (pattern recognition). Pengenalan pola merupakan suatu ilmu untuk mengklasifikasikan atau menggambarkan sesuatu berdasarkan pengukuran kuantitatif fitur (ciri) atau sifat utama dari suatu objek. Penelitian mengenai pengenalan pola telah banyak dilakukan, diantaranya dalam bidang biometrika. Biometrika yaitu sistem pengenalan berdasarkan bentuk fisik dan perilaku manusia yang memiliki karakteristik tertentu. Selain biometrika terdapat juga pengenalan objek atau selain dari manusia. Sebagai contoh pengenalan objek dalam
bentuk karakter (huruf), tulisan tangan, dan benda-benda disekitar. OCR (Optical Character Recognition) adalah salah satu area studi dalam pengenalan pola, yaitu sistem pengenalan karakter berupa huruf, angka, maupun simbolsimbol. OCR dapat dimanfaatkan untuk mengkonversi image yang mengandung teks hasil cetak mesin atau printer menjadi file dokumen berupa teks biasa. Sehingga informasi yang terkandung di dalam suatu image dapat diambil tanpa melalui proses pengetikan ulang. Hal ini karena pola-pola huruf dalam image dikenali dan dicocokkan sesuai basis pengetahuannya. Pemanfaatan OCR sebagai solusi pengenalan karakter dalam suatu image, dapat juga dikembangkan ketahap penyimpanan hasil pengenalan, ke dalam data berbentuk tabel. Dokumen yang telah dikonversi menjadi image, akan melalui proses OCR, dan hasilnya dikelompokkan dalam tabel sesuai field-field yang ada. Oleh karena itu, diperlukan suatu dokumen yang standar untuk menyimpan data dalam bentuk tabel misalnya, kartu identitas berupa eKTP, SIM, STNK, dan lain-lain. Kartu identitas yang standar akan memiliki field-field yang sama dan memudahkan dalam mengelompokkan data. Oleh karena itu, dalam tugas akhir ini dibuat perangkat lunak yang dapat mengkonversi dokumen identitas individu berupa e-KTP/SIM sehingga hasil outputnya berupa karakter yang disusun dalam sebuah tabel. Metode yang digunakan dalam pengenalan karakter pada citra dokumen adalah metode Learning Vector Quantization. Pemilihan metode ini berdasar penelitian yang menggunakan algoritma LVQ oleh Ronny, dkk, dengan input suatu gambar karakter dari 5 jenis font, menyimpulkan dengan banyaknya data pelatihan akan menghasilkan akurasi yang baik. Pada 4 data pelatiha menghasilkan akurasi 59.7%, 8 data pelatihan menghasilkan akurasi 69.5%, dan 12 data pelatihan tingkat akurasi pengenalannya sebesar 76%. Selain itu metode ini dipilih untuk menunjukkan tingkat keefektifan penggunaan LVQ dalam mengenali karakter dari sebuah dokumen identitas eKTP/SIM. Untuk membatasi ruang lingkup pembahasan permasalahan maka ditentukan beberapa batasan sebagai berikut: 1. Dokumen identitas yang digunakan adalah e-KTP/SIM yang dikeluarkan oleh Pemerintah Republik Indonesia yang masih berlaku. 2. Dokumen e-KTP/SIM yang digunakan harus bebas dari kerusakan, baik cetak maupun cacat penggunaan.
1
JURNAL SAINS DAN SENI POMITS Vol. 1, No. 1, (2013) 1-8 3.
4.
Citra dokumen eKTP/SIM diambil secara manual menggunakan mesin scanner dan dipotong (crop) bagian yang tidak dibutuhkan jika ada. Sistem konversi dokumen identitas individu menjadi suatu tabel diimplementasikan menjadi sebuah program dengan bahasa pemrograman Visual C#. II. DASAR TEORI
A. Dokumen Identitas Dokumen identitas merupakan suatu dokumen yang memuat informasi identitas (jati diri) seseorang sebagai tanda keanggotaan suatu perkumpulan, perusahaan, instansi, dsb. Beberapa contoh dokumen identitas yang umum bagi masyarakat adalah KTP dan SIM. KTP atau Kartu Tanda Penduduk adalah kartu bukti diri bagi setiap penduduk dalam wilayah Republik Indonesia. KTP diwajibkan bagi setiap penduduk yang berumur diatas 17 tahun dan masa berlakunya adalah 5 tahun. Sedangkan SIM adalah kartu yang dikeluarkan oleh Polri kepada seseorang yang telah memenuhi persyaratan administrasi, jasmani dan rohani, serta pemahaman berlalu lintas sesuai jenis kendaraan. Golongan SIM berdasarkan Pasal 82 UU No. 22 Tahun 2009 diantaranya : SIM A, SIM B1, SIM B2, SIM C, dan SIM D. B. Optical Character Recognition Optical Character Recognition (OCR) merupakan sistem yang dapat mengenali karakter baik cetak maupun tulisan tangan. Untuk mengenali karakter dalam sebuah dokumen, maka dokumen harus diubah menjadi citra digital terlebih dahulu menggunakan mesin scanner. Pengenalan karakter seperti ini merupakan metode penganalan offline atau tidak secara langsung. Pengenalan secara langsung dengan metode online dilakukan dengan tulisan tangan secara real time. Secara umum tahap pengenalana karakter secara offline adalah sebagai berikut :
2
panjang M dan lebar N dinyatakan dengan bentuk matriks yang berukuran M x N sebagai berikut : f (0,0 ) f (1,0 ) f ( x, y ) = .... f (M − 1)
f (0,1) f (1,1) ....
.... .... ....
f (M − 1,1) ....
f (0, N − 1) f (1, N − 1) .... f (M − 1, N − 1)
Pengolahan citra digital adalah pemrosesan citra, khususnya dengan menggunakan komputer, menjadi citra yang kualitasnya lebih baik. Pengolahan citra dilakukan untuk memperbaiki kualitas citra agar mudah diinterpretasi oleh manusia atau mesin (dalam hal ini komputer). Operasioperasi yang dilakukan di dalam pengolahan citra banyak jenisnya, antara lain konversi citra segmentasi dan scalling. 1. Inverting Inverting atau bisa disebut citra negatif adalah pengolahan citra dengan menampilkan warna citra yang berlawanan dengan warna aslinya.
𝑓(𝑥, 𝑦)′ = 255 − 𝑓(𝑥, 𝑦)
2. Grayscalling Grayscalling adalah teknik yang digunakan untuk mengubah citra berwarna (RGB) menjadi citra yang memiliki nilai keabuan (dari hitam menuju putih). Pengubahan dari citra berwarna ke bentuk grayscale mengikuti aturan berikut :
𝑠=
𝑟+𝑔+𝑏 3
dengan : S = Nilai intensitas citra grayscale r = Nilai intensitas warna merah dari citra asal g = Nilai intensitas warna hijau dari citra asal b = Nilai intensitas warna biru dari citra asal 3. Binerisasi Citra Binerisasi citra merupakan proses merubah citra ke dalam bentuk biner (0 dan 1). Dengan merubah ke bentuk biner, citra hanya akan mempunyai 2 warna yakni, hitam dan putih. Thresholding digunakan untuk mengatur jumlah derajat keabuan yang ada pada citra. Dengan adanya thresholding maka derajat keabuan bisa diubah sesuai keingin dengan persamaan berikut : 𝑎 , 𝑓(𝑥, 𝑦) < 𝑇 𝑓(𝑥, 𝑦)′ = � 1 𝑎2 , 𝑓(𝑥, 𝑦) ≥ 𝑇
Gambar 1 Tahap Sistem OCR Offline
C. Pengolahan Citra Digital Merupakan proses pengubahan citra dari fungsi kontinu menjadi fungsi diskrit. Citra yang dihasilkan dari proses ini disebut sebagai citra digital. Secara umum, citra digital berbentuk persegi empat dengan dimensi ukurannya dinyatakan oleh panjang dan lebar. Misal suatu citra dengan
dengan : 𝑓(𝑥, 𝑦)′ = Nilai intensitas yang baru 𝑓(𝑥, 𝑦) = Nilai intensitas yang lama T = Nilai Threshold 4. Segmentasi Segmentasi adalah teknik untuk memisahkan objek yang diinginkan dari objek lain. Dalam pengenalan objek pada suatu citra maka segementasi dilakukan dengan momotong area objek yang akan diproses dan dipisahkan dari latar belakangnya.
JURNAL SAINS DAN SENI POMITS Vol. 1, No. 1, (2013) 1-8 5. Normalisasi Normalisasi (scalling) adalah merubah ukuran suatu citra. Ukuran citra dari proses sebelumnya dinormalkan supaya memiliki ukuran yang sama. Ukuran yang sama ini akan diproses dan dijadikan masukan untuk algoritma LVQ. D. Ekstraksi Ciri Ekstraksi ciri bertujuan untuk mendapatkan karakteristik suatu karakter yang membedakannya dari karakter lain. Citra hasil segementasi yang ukurannya telah dinormalkan kemudian diektraksi cirinya dengan menandai piksel-piksel dengan nilai tertentu. Dalam penelitian ini ditandai piksel putih (0) dan piksel hitam (1). E. Learning Vector Quantization Learning Vector Quantization (LVQ) adalah suatu metode untuk melakukan pembelajaran pada lapisan kompetitif yang terawasi. Suatu lapisan kompetitif akan secara otomatis belajar untuk mengklasifikasikan vektorvektor input. Kelas-kelas yang didapatkan sebagai hasil dari lapisan kompetitif ini hanya tergantung pada jarak antara vektor-vektor input. Jika 2 vektor input mendekati sama, maka lapisan kompetitif akan meletakkan kedua vektor tersebut ke dalam kelas yang sama. Beberapa notasi yang digunakan dalam algoritma ini adalah : x : vektor pelatihan (x1, ..., xj, ..., xn) T : kategori atau kelas yang benar untuk vektor pelatihan wj : vektor bobot untuk unit luaran ke-j (w1j, .., wij, .., wnj) cj : kategori atau kelas hasil komputasi oleh unit luaran j ||x – wj|| : jarak Eucledian antara vektor masukan dengan unit luaran Adapun langkah-langkah dari algoritma LVQ adalah sebagai berikut : Langkah 1 : Inisialisasi vektor referensi dan learning rate Langkah 2 : Selama kondisi berhenti bernilai salah, kerjakan a, b, dan c berikut: a. Untuk setiap vektor x, kerjakan point 1 dan 2 berikut: 1. 2.
Temukan J sehingga ||x – wj|| minimum Update wj dengan mengikuti rumus: Jika T = cj maka wj = wj + α[x - wj] Jika T ≠ cj maka wj = wj - α[x – wj]
3 Tabel 1 Data Proses
Nama Data Citra Invert
Tipe Data blob
Keterangan Data ini berupa citra hasil konversi dari citra asli menjadi citra negatif.
Citra Grayscale
blob
Data ini berupa citra hasil konversi dari citra negatif menjadi citra grayscale. Data ini berupa citra hasil konversi dari citra grayscale menjadi citra biner.
Citra Biner
blob
Titik Koordinat
int
Data ini berupa posisi (x,y) baris karakter dari dokumen eKTP/SIM yang akan diproses.
Citra segmentasi
blob
Area scalling
blob
Data ini berupa citra hasil segementasi karakter pada citra dokumen eKTP/SIM. Data ini berupa citra hasil proses scalling karakter yang sudah disegmentasi.
Data ekstraksi ciri
double
Data ini berupa nilai piksel hidup di masing-masing area scalling dan menghasilkan matrik data dengan nilai 1 dan 0 (matrik biner).
3. Data Luaran Data luaran pada sistem ini berupa karakter digital hasil pengenalan oleh algoritma Learning Vector Quantization (LVQ) yang dikelompokkan dalam sebuah tabel. b. Gambaran Sistem Secara Umum Sistem ini terdiri dari beberapa proses dalam mengkonversi dokumen ke dalam suatu tabel : 1. Proses akuisisi citra dokumen identitas, berupa citra digital yang diambil menggunakan scanner atau kamera digital secara manual dan disimpan dalam media penyimpanan.
b. Kurangi learning rate c. Periksa kondisi berhenti III.
PERANCANGAN SISTEM
a. Perancangan Data 1. Data Masukan Data msukan dalam sistem ini adalah citra dokumen eKTP/SIM dalam format .jpg, yang bisa didapatkan dari hasil scanning menggunakan mesin scanner atau bisa juga dengan mengambil gambar menggunakan kamera sehingga data berbentuk digital. 2. Berikut adalah data proses dalam sistem konversi dokumen identitas individu menjadi suatu tabel : Gambar 2 Proses Akuisis Citra Dokumen Identitas
JURNAL SAINS DAN SENI POMITS Vol. 1, No. 1, (2013) 1-8 2. Proses Konversi Citra Konversi citra merupakan proses untuk mengolah citra masukan sehingga dapat dibedakan antara objek dan latar belakangnya. Beberapa langkah konverci citra diantaranya, inverting, grayscalling, dan binerisasi citra. Pada Gambar 2 menampilkan urutan dari proses konversi citra pada NIK eKTP. Terlihat perbedaan masing-masing citra, dari citra asli sampai menjadi citra biner sehingga dapat dibedakan antara objek karakter (warna putih) dan latar belakangnya (warna hitam).
4
8. Proses Penyimpanan Proses menyimpan hasil pengenalan karakter dari dokumen identitas yang diproses dan dikelompokkan dalam bentuk tabel.
(a) (b) (c) (d) Gambar 3 Proses Konversi Citra. (a) Citra Asli, (b) Citra Negatif, (c) Citra Grayscale, (d) Citra Biner.
3. Proses Menentukan Koordinat Objek Untuk dapat menyusun barisan karakter dari dokumen ke dalam suatu tabel maka ditentukan koordinat sesuai format dokumen yang dipakai. Penentuan koordianat dilakukan dengan trial-error atau mengukur dan mecoba posisi yang tepat dalam area dokumen. 4. Proses Segmentasi Proses memotong objek pada citra dokumen sesuai area masing-masing. Segementasi dilakukan pada proses pelatihan dan pengujian karakter. Gambar 3 berikut menunjukkan contoh proses segmentasi karakter pada NIK. Gambar 5 Flowchart Pelatihan (a) dan Flowchart Proses Pengujian (b)
IV. HASIL DAN PENGUJIAN
Gambar 4 Contoh Proses Segmentasi
5. Proses Normalisasi Proses ini dilakukan untuk mendapatkan ukuran citra hasil segementasi selalu sama. Ukuran yang dipakai dalam sistem adalah 10x18 piksel yang selanjurnya diproses untuk diektraksi cirinya. 6. Proses Ekstraksi Ciri Merupakan proses-proses yang dilakukan untuk mendapatkan ciri dari citra karakter yang terdapat pada dokumen identitas yang diperoses. Ciri dari citra karakter tersebut dibutuhkan untuk pemrosesan algoritma LVQ. 7. Proses tahap JST Terdiri dari 2 proses yang dilakukan, yaitu : a. Proses pelatihan (training), yaitu proses melatih sistem dengan masukan yang ada sehingga mampu mengenali apabila diberi masukan yang baru. b. Proses pengujian (testing), yaitu proses pencocokan atau membandingkan ciri masukan baru dengan ciri yang ada pada referensi yang sebelumnya sudah dilatih kepada sistem.
Perangkat yang digunakan dalam pengujian sistem terdiri dari beberapa perangkat keras dan perangkat lunak. Perangkat keras yang digunakan yaitu komputer dengan Prosesor Intel Core i3 2.13 GHz, Memory 4 GB DDR3, dan Hard Disk 298 GB. Sedangkan perangkat lunak yang digunakan adalah Sistem Operasi Windows 8.1 Pro 32-bit dan perangkat lunak Microsoft Visual Studio C# 2010. a. Pengujian Tahap Akuisisi Menghasilkan dokumen dalam bentuk citra digital dengan menggunakan scanner. Berikut hasil scanning yang sesuai dengan kebutuhan sistem.
(a)
(b)
Gambar 6 Hasil Scanning Dokumen. (a) eKTP, (b) SIM A
JURNAL SAINS DAN SENI POMITS Vol. 1, No. 1, (2013) 1-8 b. Pengujian Tahap Pra-pengolahan 1. Pengujian Proses Konversi Citra Pengujian proses konversi citra bertujuan untuk mengetahui bahwa citra dokumen yang sudah diload ke dalam sistem sudah dapat dibedakan antara objek dan latar belakangnya. Proses yang dilakukan dengan merubah citra asalm menjadi citra negatif, citra grayscale, dan terkahir citra biner. Gambar menunjukkan citra yang sudah dibedakan antar objek karakter (warna putih) dan latar belakangnya (warna hitam).
5
3. Pengujian Proses Normalisasi Pengujian proses scalling bertujuan untuk mengetahui bahwa sistem telah menormalisasi ukuran citra hasil segmentasi. Gambar 10 berikut menunjukkan bahwa cutra telah melalui proses noralisasi.
Gambar 10 Citra Segmentasi dan Citra Normal (a)
4. Pengujian Proses Ekstraksi Ciri Dari hasil normalisasi ukuran 10x18 piksel maka tiap piksel ditandai dengan angka 1 dan 0. Untuk piksel berwarna hitam ditandai angka 1 dan piksel berwarna putih ditandai angka 0. Tabel 1 berikut adalah hasil ekstraksi ciri dari gambar 8 (d), tentunya setelah melewati proses scalling.
(b)
Tabel 2 Tabel Matrik Biner Ekstraksi Ciri Gambar 7 Hasil Konversi Citra. (a) eKTP, (b) SIM A.
2. Pengujian Proses Segmentasi a. Segmentasi Data Pelatihan Pengambilan citra karakter secara manual dengan seleksi kursor. Gambar 8 berikut adalah hasil seleksi citra karakter pada data pelatihan.
(a)
(c)
(b)
(d)
Pada basisdata hasil ekstraksi ciri membentuk 180 kode biner yang disebut dengan matrik data. Matrik data ini disusun dari Tabel 2 sebagai berikut : 100000000000000001100000000000000000 111111111111111000111111111111111100 111111111111111100111111111111111100 111111111111111100111111111111111100 111111111111111100111111111111111100
c. Pengujian Tahap JST
Gambar 8 Hasil Segmentasi pada Data Data Pelatihan. (a) Kararkter NIK, (b) Karakter Non-NIK, (c) – (d) Karakter SIM.
b. Segmentasi Data Pengenalan Pengambilan citra karakter secara otomatis oleh sistem. Gambar 9 berikut adalah hasil segmentasi citra karakter oleh sistem.
1. Pengaruh Learning Rate Learning rate dalam algoritma LVQ merupakan konstanta yang digunakan untuk mencari bobot. Rumus untuk mencari bobot dalam algoritma LVQ adalah sebagai berikut: 𝑤𝑗 = 𝑤𝑗 ∓ 𝛼�𝑥 − 𝑤𝑗 � dengan: Wj adalah bobot ke-𝑗 X adalah vektor pelatihan α adalah learning rate
Gambar 9 Hasil Segmentasi 3 Karakter NIK
Untuk mengetahui pengaruh alpha terhadap akurasi maka sistem dilatih dengan memasukkan nilai epoh sama dan apha berbeda-beda. Nilai alpha yang dipilih sebagai uji coba adalah 0.01, 0.05, 0.1, 0.5, 1. Sistem akan diuji pada masing-masing proses dengan nilai alpha bervariasi dan epoh 100.
JURNAL SAINS DAN SENI POMITS Vol. 1, No. 1, (2013) 1-8 Tabel 3 Pengujian nilai apha berbeda pada field NIK eKTP
Dokumen eKTP
Field NIK
0.01
Epoh Maks. 100
0.05 0.1
100 100
100 100
0.5 1
100 100
100 100
Alpha
Akurasi (%)
Tabel 4 Pengujian nilai apha berbeda pada field Nomor SIM
Field Nomor
0.01
Epoh Maks. 100
Akurasi (%) 23,08
0.05
100
15,38
0.1
100
7.69
0.5
100
7,69
1
100
7,69
Alpha
Pada Tabel 4 dilakukan pengujian dokumen SIM pada field Nomor dengan nomor 630715540336 dan menghasikan akurasi sedikit berbeda dan naik dengan nilai alpha semakin kecil. 2. Pengaruh Epoh Untuk mengetahui pengaruh epoh terhadap akurasi maka sistem dilatih dengan memasukkan nilai alpha sama dan epoh berbeda-beda. Nilai alpha yang dipilih sebagai uji coba adalah 1000, 500, 100, 50, 10. Sistem akan diuji pada masing-masing proses dengan nilai epoh bervariasi dan alpha 0.01. Tabel 5 Pengujian nilai epoh berbeda pada field NIK
Dokumen eKTP
Alpha
Field NIK
0.01 0.01 0.01 0.01 0.01
Epoh Maks. 1000 500 100 50 10
Akurasi (%) 100 100 100 100 90.91
Pada Tabel 5 dilakukan pengujian dokumen eKTP pada field NIK dengan nomor 3525200407630001 dan diadapatkan akurasi semakin baik dengan nilai epoh tinggi. Tabel 6 Pengujian nilai apha berbeda pada field Nomor SIM
Dokumen SIM
Alpha
Epoh Maks.
Field Nomor “630715540336”
0.01 0.01 0.01 0.01 0.01
1000 500 100 50 10
Pada Tabel 6 dilakukan pengujian dokumen SIM pada field Nomor dengan nomor 630715540336 dan diadapatkan akurasi semakin baik dengan nilai epoh tinggi.
100
Pada Tabel 3 dilakukan pengujian dokumen eKTP pada field NIK dengan nomor 3525200407630001 dan diadapatkan akurasi mencapai 100% .
Dokumen SIM
6
Akurasi (%) 23,08 7.69 7.69 7,69 7,69
3. Pengaruh Nilai Ambang Untuk mengetahui pengaruh nilai ambang (threshold) terhadap akurasi, maka sistem dilatih dengan memasukkan nilai ambang sama atau berbeda-beda. Nilai ambang sama ditetapkan dengan nilai 128 untuk semua field dan nilai ambang berbeda dipilih berdasar tingkat akurasi terbesar pada nilai ambang pilihan untuk masing-masing field. Tabel 7 Pengujian nilai ambang sama pada masing-masing field eKTP
Dokumen eKTP 3525100407630001 Ahmad Luthfi Pongangan Rejo 001 003 Pongangan Manyar
Nilai Ambang 128 128 128 128 128 128
Akurasi (%) 100 33.33 41.67 100 25.53 100
Tabel 8 Pengujian nilai ambang berbeda pada masing-masing field eKTP
Dokumen eKTP 3525100407630001 Ahmad Luthfi Pongangan Rejo 001 003 Pongangan Manyar
Nilai Ambang 77 113 132 104 103 84
Akurasi (%) 100 100 64 100 35.29 100
Tabel 9 Pengujian nilai ambang sama pada masing-masing field SIM
Dokumen SIM 630715540336 A Ahmad Luthfi DS Pongangan Rejo RT1 RW 3
Nilai Ambang 128 128 128 128
Akurasi (%) 60.87 100 100 100
Tabel 10 Pengujian nilai ambang berbeda pada masing-masing field SIM
Nilai Akurasi Ambang (%) 630715540336 156 100 A 138 100 Ahmad Luthfi 113 100 DS Pongangan Rejo RT1 RW 3 119 100 Tabel 7 s/d Tabel 10 menunjukkan pengaruh nilai ambang terhadap tingkat akurasi pengenalan. Dokumen SIM
4. Pengujian LVQ Pengujian LVQ bertujuan untuk mengetahui akurasi algoritma LVQ dalam sistem konversi dokumen identitas individu menjadi suatu tabel ini. Dengan mempertimbangkan pengaruh nilai alpha dan epoh terhadap akurasi, sistem akan diuji dengan menggunakan alpha sebesar 0.01 dan epoh sebanyak 1000.
JURNAL SAINS DAN SENI POMITS Vol. 1, No. 1, (2013) 1-8 Pada tahap pengujian ini, sistem akan diuji dengan dokumen eKTP dan SIM yang berbeda-beda dan pada field yang lebih banyak. Tabel 11 Pengujian pengenalan field Nama eKTP
Sebenarnya
Pengenalan
BRINOTNBLNDO
8.7
33.33
MANGARAN
MYYRAN
28.57
SIDOKUMPUL
SIJUKUMPUV
70
MUHAMAD YASIR BURHAN
MJFTAMAU YASIC LUHHAN
10.81
Tabel 16 Pengujian pengenalan field Kecamatan eKTP
14.81
Tabel 12 Pengujian pengenalan field NIK eKTP
Sebenarnya
Pengenalan
Akurasi (%)
3525100407630001
3525100407630001
100
3525106309710001
3525106309710001
100
3515130404630004
3515130404630004
100
3509170412810001
3509170412810001
100
1221131607830003
1221131607830003
100
Tabel 13 Pengujian pengenalan field eKTP
BINGIN BENDO DUSUN PATEMON KRAMAT LANGON IV 10
PLLTVNVN
BINGINBENDO
58.82
PONGANGAN REJO PONGANGAN REJO
PONGANGAN
Akurasi (%) 25.53 35.29
FATROLLAH
Sebenarnya
Pengenalan
PONVNGAN
FATHOLAH
NURUL HIDAYAT
Sebenarnya
PONGANGAN
62.07
AZIFATUL ANIFAH
Tabel 15 Pengujian pengenalan field Kel/Desa eKTP
Akurasi (%)
AHMALY L LVTHFI AZIFATUL ATN F AFI NLJRLVL FXTEVAYA
AHMAD LUTHFI
7
Pengenalan
Akurasi (%)
PUNGANVN REX
41.67
ALNVNGAN REY
8.33
BRINCTIN FT NDU
8.33
DUSUN PATELN
78.26
KRAMA LANUON IV JJ
32.26
Tabel 14 Pengujian pengenalan field RT/RW eKTP
Sebenarnya
Pengenalan
001 003
001 003
Akurasi (%) 100
001 003 003 001
OO1 O03 OO3 OQT
50 16.67
002 004
QO2 J3
18.18
002 007
O3 JO7
0
Sebenarnya
Pengenalan
MANYAR
MANYAR
Akurasi (%) 100
MANYAR
VANYAP
66.67
TAMAN
TAMAN
100
AJUNG
YUNC
0
GRESIK
GRESIK
100
Pada Tabel 11 s/d Tabel 16 untuk field Nama, NIK, Alamat, RT/RW, Kel/Desa, Kecamatan masing-masing untuk 25 dokumen eKTP menghasilkan rata-rata pengenalan sebesar 71.31%, 100%, 46.36%, 53.21%, 36.14%, dan 68.04%. Rata-rata keseluruhan pengenalan sebesar 62.51%. Tabel 17 Pengujian pengenalan field Nama SIM
Sebenarnya
Pengenalan
Akurasi (%)
AHMAD LUTHFI
AHMAD LUTHFI
100
AHMAD LUTHFI JOKO WAHYONO CAHYO MUHAMAD YASIR BURHAN NURUL WIJI SRI UTAMI
AHMAD LUTHFI JOKO WAHYONO CAHYO MUHAMAD YASIR BURHAN NURUL WIJI SRI UTAMI
100 100 100 100
Tabel 18 Pengujian pengenalan field Nomor SIM
Sebenarnya
Pengenalan
630715540336
630715540336
Akurasi (%) 100
630715540731
630715540731
100
780915540395
780915540395
100
830715540825
830715540825
100
710115531414
710115531414
100
Tabel 19 Pengujian pengenalan field Jenis SIM
Sebenarnya
Pengenalan
A
A
Akurasi (%) 100
C
C
100
A
A
100
C
C
100
C
C
100
JURNAL SAINS DAN SENI POMITS Vol. 1, No. 1, (2013) 1-8 Tabel 20 Pengujian pengenalan field Alamat SIM
Sebenarnya
Pengenalan
Akurasi (%)
DS PONGANGAN REJO RT1 RW3 DS PONGANGAN REJO RT1 RW3
DS PONGANGAN 100 REJO RT1 RW3 DS FONGANGAN 95.24 REJO RT1 RW3 DS DS RANDUAGUNG RANDUAGUNG 100 RT3 RW3 RT3 RW3 DS KRAMAT DS KRAMAT 100 LANGON IV 10 LANGON IV 10 BRINGIN BENDO NHINGTN BL 64.71 TAMAN NOC T AMAN Pada Tabel 17 s/d Tabel 20 untuk field Nama, Nomor, Jenis, Alamat masing-masing untuk 25 dokumen SIM menghasilkan rata-rata pengenalan sebesar 90.92%, 88.95%, 98.66%, dan 88.97%. Rata-rata keseluruhan pengenalan sebesar 62.51%. V.
KESIMPULAN
Berdasarkan analisis terhadap hasil pengujian yang telah dilakukan terhadap sistem konversi dokumen identitas individu menjadi suatu tabel menggunakan algoritma Learning Vector Quantization, maka dapat diambil beberapa kesimpulan sebagai berikut: 1. Proses-proses yang dilakukan sebelum karakter pada citra dokumen dapat dikenali adalah proses konversi citra, proses segmentasi, proses normalisasi, dan proses ekstraksi ciri. 2. Penentuan nilai ambang (threshold) sangat berpengaruh pada akurasi yang didapatkan masing-masing field dokumen. Nilai ambang yang digunakan untuk dokumen eKTP sebesar 126 dan untuk dokumen SIM sebesar 170. 3. Karakter pada dokumen SIM lebih mudah dikenali daripada karakter pada dokumen eKTP. Dilihat dari bentuk fisik karakter dokumen SIM memiliki huruf yang tegas dan jelas serta minim noise pada latar belakang. Sedangkan pada dokumen eKTP karakter lebih kecil dan kadang berhimpit satu sama lain sehingga sulit dikenali. 4. Metode Learning Vector Quantization lebih baik dalam mengenali karakter dokumen SIM dengan rata-rata pengenalan dari 25 dokumen SIM untuk beberapa field sebesar 91.87% sedangkan pada dokumen eKTP akurasinya sebesar 62.51%. 5. Sitem mampu mengkonversi citra dokumen eKTP/SIM menjadi karakter sesuai dengan field-field yang dikehendaki dan dikelompokkan ke dalam suatu tabel.
8 DAFTAR PUSTAKA
[1] Putra, D. 2009. “Pengolahan Citra Digital”. Yogyakarta : Penerbit Andi. [2] Hartanto, S., Sugiharto, A., Endah, S.N. 2012. “Optical Character Recognition Menggunakan Algoritma Template Matching Correlation” . Semarang : Undip [3] Rohwana, Ulir. 2013.”Pengenalan Tulisan Huruf Latin Bersambung Secara Real Time Menggunakan Algoritma Learning Vector Quantization”. Surabaya: Institut Teknologi Sepuluh Nopember. [4] Ronny, Rahman, S., Munir, A. 2012. “Pengenalan Karakter Dengan Segmentasi Citra dan Algoritma Learning Vector Quantization”. Makassar : STMIK Kharisma [5] Gonzales, RC. Woods, RE. 2002. “Digital Image Processing”. New Jersey : Prentice Hall, Inc. [6] Fausett, L. 1994. “Fundamentals of Neural Networks: Architectures, Algorithms, and Applications”. Prentice Hall International.Inc [7] Asworo.2010. “Comparison Between Kohonen Neural Network Method and Learning Vector Quantization in The Online Handwriting Recognition System”. Institut Teknologi Sepuluh Nopember, Surabaya. [8] KKPS. 2009. BERSERI “Belajar Menulis Benar, Rapi, dan Indah” untuk siswa kelas satu, dua, dan tiga Sekolah Dasar. Bandung.