IDENTIFIKASI KARAKTER PLAT NOMOR KENDARAAN MENGGUNAKAN EKSTRAKSI FITUR ICZ DAN ZCZ DENGAN METODE KLASIFIKASI K-NN
RADEN PUTRI AYU PRAMESTI
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Identifikasi Karakter Pada Plat Nomor Kendaraan Menggunakan Ekstraksi Fitur ICZ dan ZCZ dengan Metode Klasifikasi K-NN adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Juni 2013 R. Putri Ayu Pramesti NIM G64104011
ABSTRAK R. PUTRI AYU PRAMESTI. Identifikasi Karakter Pada Plat Nomor Kendaraan Menggunakan Ekstraksi Fitur ICZ dan ZCZ dengan Metode Klasifikasi K-NN. Dibimbing oleh MUSHTHOFA. Plat nomor merupakan kode unik yang terdiri dari susunan huruf dan nomor. Setiap kendaraan memiliki satu plat nomor yang dijadikan sebagai kode identitas dari kendaraan itu sendiri. Karena plat nomor bersifat unik sehingga sering digunakan untuk keperluan pencatatan seperti di area parkir. Untuk memudahkan pencatatan plat maka dibuatlah identifikasi karakter plat nomor kendaraan secara otomatis yang menggunakan input berupa gambar plat nomor. Klasifikasi K-NN dan ekstraksi ciri ICZ dan ZCZ digunakan dalam identifikasi karakter. Ekstraksi ciri ICZ dan ZCZ mendapatkan ciri dengan menghitung koordinat centroid dan membagi citra ke dalam n zona yang sama besar kemudian menghitung rata-rata jarak centroid terhadap keseluruhan piksel. Akurasi identifikasi per karakter yang dihasilkan dengan menggunakan zona berjumlah 14 dan ektraksi ciri ICZ adalah 97.00% sedangkan akurasi dengan menggunakan ektraksi ciri ICZ+ZCZ adalah 98.17%. Akurasi indentifikasi per plat nomor kendaraan menggunakan ekstraksi ciri ICZ+ZCZ tanpa toleransi kesalahan adalah72.31% dan 89.23% untuk toleransi kesalahan sebanyak 1. Kata kunci: ICZ, identifikasi plat nomor, K-NN, zone based feature extraction, ZCZ
ABSTRACT R. PUTRI AYU PRAMESTI. License Plate Identification Using ICZ and ZCZ Feature Extraction and K-NN as the Classifier. Supervised by MUSHTHOFA. License plate is a unique code consisting of letters and numbers arrangement. Each vehicle has a license plate that serve as the identity code of the vehicle itself. Since license plates are unique, it often used for recording, such as in the parking area. The character identification characters on the license plates are made automatically using the input in the form of license plate images to facilitate the recording process. K-NN classification and feature extraction ICZ and ZCZ used in the identification of character identification. ICZ and ZCZ feature extraction obtain features by computing the character centroids and divide the image into n equal zones then computing the average distance from the character centroid to every pixel in the image. The character identification accuracy using 14 zones and ICZ are 97.00% while using ICZ+ZCZ feature extraction are 98.17%. The license plate identification accuracy using feature extraction plates ICZ+ZCZ are 72.31% for zero tolerance and 89.23% for one fault tolerance. Keywords: ICZ, K-NN, license plate identification, Zone based feature extraction, ZCZ
IDENTIFIKASI KARAKTER PLAT NOMOR KENDARAAN MENGGUNAKAN EKSTRAKSI FITUR ICZ DAN ZCZ DENGAN METODE KLASIFIKASI K-NN
RADEN PUTRI AYU PRAMESTI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Ilmu Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
Judul Skripsi : Identifikasi Karakter Pada Plat Nomor Kendaraan Menggunakan Ekstraksi Fitur ICZ dan ZCZ dengan Metode Klasifikasi K-NN Nama : R. Putri Ayu Pramesti NIM : G64104011
Disetujui oleh
Mushthofa, SKom, MSc Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan ke hadirat Allah Subhanahu Wa Ta’ala atas segala limpahan rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan skripsi yang Identifikasi Karakter Pada Plat Nomor Kendaraan Menggunakan Ekstraksi Fitur ICZ Dan ZCZ Dengan Metode Klasifikasi K-NN. Shalawat dan salam senantiasa tercurah kepada Rasulullah shalallahu ‘alaihi wasallam. Penulis sadar bahwa tugas akhir ini tidak akan terselesaikan tanpa bantuan dari berbagai pihak. Pada kesempatan ini, penulis ingin mengucapkan terima kasih kepada: 1 Orang tua tercinta Bapak Soegandhi Soeriawidjaya, MTA dan Ibu Evi Sopia, kakak penulis R. Inten Prameswasri serta suami penulis Ade Budiman atas segala do’a, dukungan, dan kasih sayang yang tiada henti. 2 Bapak Mushthofa SKom MSc selaku dosen pembimbing tugas akhir. Terima kasih atas kesabaran dan dukungan dalam penyelesaian tugas akhir ini. 3 Aditya Riansyah Lesmana yang telah memberikan data yang dibutuhkan penulis dalam penyusunan skripsi. 4 Teman-teman Ilkomerz Angkatan 5 atas kebersamaannya. 5 Sri Rahayu Natasia dan Silvia Rahmi yang selalu memberikan dukungan dan semangat kepada penulis. 6 Rekan-rekan satu bimbingan, Rizkina, Intan, Rahmi dan Hafhara atas bantuan dan kerjasamanya selama bimbingan. Penulis menyadari bahwa dalam penulisan tugas akhir ini masih terdapat banyak kekurangan dan kelemahan dalam berbagai hal karena keterbatasan kemampuan penulis. Penulis berharap adanya masukan berupa saran dan kritik yang bersifat membangun dari pembaca demi kesempurnaan tugas akhir ini. Semoga tugas akhir ini bermanfaat.
Bogor, Juni 2013 R. Putri Ayu Pramesti
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
2
Manfaat Penelitian
2
Ruang Lingkup Penelitian
2
TINJAUAN PUSTAKA
2
Pengolahan Citra Digital
2
Grayscale Image
3
Edge Detection
3
Image Segmentation
3
Canny Detection
3
Metode Ekstraksi Zoning
4
K-Nearest Neighbour
5
METODE
5
Pengumpulan Data
5
Praproses Citra
7
Deteksi Tepi
7
Segmentasi Citra
8
Ekstraksi Ciri
8
Klasifikasi Menggunakan K-NN
10
Evaluasi dan Hasil
11
Lingkungan Pengembangan Sistem
11
HASIL DAN PEMBAHASAN
11
Pengumpulan Data
11
Praproses Citra
12
Deteksi Tepi
12
Segmentasi Citra
13
Normalisasi Citra
14
Ekstraksi Ciri
14
Klasifikasi Citra
15
Pengujian Per Karakter
16
Pengujian Per Plat
19
SIMPULAN DAN SARAN
21
Simpulan
21
Saran
21
DAFTAR PUSTAKA
22
LAMPIRAN
24
RIWAYAT HIDUP
32
DAFTAR TABEL 1 2 3
Persentase akurasi pengujian karakter dengan zona berjumlah 5 Persentase akurasi pengujian dengan variasi zona Perbandingan akurasi pengenalan karakter dengan klasifikasi K-NN dan backpropagation (Lesmana 2012) Akurasi identifikasi karakter dengan metode ICZ+ZCZ dan klasifikasi K-NN Contoh kesalahan deteksi plat nomor
4 5
16 16 17 17 20
DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Citra RGB (kiri) dan grayscale (kanan) Skema metode penelitian Contoh gambar hasil pengumpulan data Gambar grayscale dari plat nomor (kiri) dan hasil deteksi tepi Canny (kanan) Hasil segmentasi citra plat nomor Contoh pembagian zona citra Ilustrasi koordinat centroid pada ekstraksi ciri ICZ (kiri) dan ZCZ (kanan) Perhitungan jarak dengan ICZ (kiri) dan ZCZ (kanan) Data karakter Hasil deteksi Canny Hasil dilasi Pelabelan karakter 0 (nol) Hasil segmentasi citra Hasil normalisasi citra Ilustrasi pembagian zona Karakter 8 yang gagal teridentifikasi Karakter tetangga terdekat citra karakter 8 Kedekatan hasil ekstraksi ciri Perbandingan akurasi deteksi per plat Contoh plat yang gagal teridentifikasi
3 6 7 7 8 9 9 10 12 12 13 13 14 14 15 18 18 19 20 21
DAFTAR LAMPIRAN 1 Pola karakter ekstraksi ciri ICZ+ZCZ 2 Akurasi identifikasi karakter dengan menggunakan ekstraksi ciri ICZ+ZCZ 3 Hasil deteksi karakter menggunakan ekstraksi ciri ICZ+ZCZ dengan 14 zona 4 Contoh karakter yang gagal teridentifikasi 5 Hasil deteksi plat nomor
23 26 24 28 29
PENDAHULUAN Latar Belakang Plat nomor merupakan kode unik yang terdiri atas susunan huruf dan nomor. Setiap kendaraan memiliki satu plat nomor yang dijadikan sebagai kode identitas dari kendaraan itu sendiri. Karena plat nomor dari setiap kendaraan bersifat unik, plat nomor sering digunakan dalam setiap pencatatan identitas kendaraan untuk berbagai macam keperluan seperti pencataan di tempat parkir. Karena jumlah kendaraan di Indonesia semakin meningkat dibutuhkan suatu aplikasi yang bisa mendeteksi dan mengenali plat nomor kendaraan secara otomatis dan cepat sehingga dapat memudahkan dalam pencataan plat nomor kendaraan yang masuk dan keluar dari area parkir. Aplikasi ini merupakan pengenalan pola sinyal digital yang terdapat pada gambar plat nomor kendaraan. Terdapat beberapa tahapan dalam proses pengenalan plat nomor kendaraan. Input citra plat nomor diubah dahulu menjadi citra biner, kemudian dilakukan segmentasi untuk memisahkan objek karakter dengan background. Setelah itu, tiap karakter dari plat nomor disegmentasi dan masing-masing karakter dilakukan ekstraksi ciri. Kemudian, dilakukan klasifikasi tiap karakter satu per satu dengan menggunakan metode klasifikasi tertentu. Sampai saat ini telah dilakukan banyak penelitian mengenai hal ini dan masih terus dikembangkan untuk mencari metode terbaik dalam memecahkan permasalahan. Salah satu penelitian mengenai pengenalan karakter pada plat nomor kendaraan adalah penelitian Kocer dan Cevik (2011) yang melakukan pengenalan plat nomor dengan ektraksi ciri berbasis vektor dan klasifikasi jaringan saraf tiruan, akurasi yang didapat adalah 95.36%. Selain itu, Lesmana (2012) juga melakukan pengenalan plat nomor dengan input gambar digital yang diambil dari depan atau belakang kendaraan secara lurus. Gambar diekstraksi menggunakan Image Centroid and Zone (ICZ), kemudian diolah dan diklasifikasi menggunakan metode klasifikasi jaringan saraf tiruan backpropagation. Akurasi yang didapat dari penelitian ini belum begitu baik, yaitu 55.50% untuk deteksi terhadap 65 buah plat nomor dan 84.06% untuk pendeteksian masing-masing karakter. Oleh karena itu, penelitian ini dilakukan menggunakan metode klasifikasi K-NN. Ekstraksi ciri yang digunakan adalah ICZ dan ICZ+ZCZ (Zone Centroid Zone) seperti mengacu pada penelitian yang telah dilakukan oleh Mulia (2012) yang melakukan pengenalan aksara Sunda menggunakan metode ekstraksi ciri ICZ, ZCZ, dan gabungan keduanya. Penelitian sebelumnya juga telah melakukan pengenalan tulisan tangan India dengan menggunakan zone based feature extraction akurasi yang didapat yaitu 94.70 % (Rajashekararadhya dan Ranjan 2008). ICZ+ZCZ merupakan ektraksi ciri hasil penggabungan ekstraksi ciri ICZ dan ZCZ. Perbedaan ICZ dan ZCZ terletak pada penentuan koordinat centroid. Koordinat centroid pada algoritme ICZ dilakukan sebelum citra dibagi terhadap beberapa zona, sedangkan pada ekstraksi ciri ZCZ dilakukan pembagian zona terlebih dahulu sebelum menghitung koordinat centroid. Penggabungan hasil ekstraksi ciri dua algoritme ini diharapkan bisa menambah ciri dari suatu citra. Penelitian ini mencoba menggabungkan metode ekstraksi ciri ICZ dan ICZ+ZCZ
2
dengan metode klasifikasi K-NN untuk melihat keberhasilan dari kedua metode tersebut dan mendapatkan jumlah zona yang terbaik dalam pengenalan plat nomor.
Tujuan Penelitian 1 2 3
Tujuan dilakukannya penelitian ini adalah untuk: Menentukan metode ekstraksi ciri yang paling efektif di antara ICZ dan ICZ+ZCZ dalam pengenalan karakter plat nomor kendaraan. Menentukan jumlah zona yang paling baik untuk pengenalan karakter pada plat nomor kendaraan. Mengetahui kinerja dari metode klasifikasi K-Nearest Neighbor (K-NN) dalam melakukan pengenalan plat nomor kendaraan per karakter dan per plat.
Manfaat Penelitian Manfaat penelitian ini adalah untuk mempermudah dan mempercepat proses pencatatan plat nomor kendaraan yang masuk ke suatu area parkir sehingga antrian dan human error dalam pengetikan diharapkan akan berkurang.
Ruang Lingkup Penelitian 1 2 3 4 5
Ruang lingkup dari penelitian ini terbatas pada: Plat nomor yang dikenali hanya plat nomor dengan format standar (bukan format TNI/POLRI). Data yang diolah berasal dari citra dengan format JPEG. Karakter yang dikenali adalah huruf alphabet kapital (A sampai Z) dan angka (0 sampai 9). Pemotretan plat dilakukan tepat dari depan atau belakang kendaraan secara lurus. Hanya bagian plat nomor yang akan digunakan sebagai data yang diteliti.
TINJAUAN PUSTAKA Pengolahan Citra Digital Citra merupakan suatu fungsi kontinu dari intensitas cahaya dalam bidang dua dimensi. Dengan proses sampling dan kuantisasi, fungsi kontinu dari citra dirubah menjadi fungsi diskret. Aplikasi ini menerapkan beberapa proses pengolahan citra.
3 Grayscale Image Pada citra berwarna satu nilai pixel terdiri atas 3 layer yaitu red, green, dan blue. Rentang nilai dari tiap layer berkisar antara 0-255. Sedangkan pada citra grayscale representasi citranya bernilai sama untuk tiap layer. Citra yang dihasilkan dari proses grayscale berupa citra abu-abu. Citra grayscale sangat berbeda dari citra biner karena citra biner merupakan citra yang hanya memiliki dua variasi nilai, yaitu gelap dengan nilai piksel 0 dan terang dengan nilai piksel 255 (Shapiro dan Stockman 2001), sedangkan citra grayscale warnanya beragam yang merupakan rentang antara putih dan hitam. Perbandingan gambar RGB dan hasil konversinya ke citra grayscale dapat dilihat pada Gambar 1.
Gambar 1 Citra RGB (kiri) dan grayscale (kanan)
Edge Detection Edge detection adalah operasi yang bertujuan untuk mereduksi citra dan hanya menampilkan tepi dari citra itu sendiri (Baxes 1984). Deteksi ini dilakukan dengan cara menemukan perbedaan yang signifikan antara satu piksel dan piksel tetangganya. Deteksi ini dilakukan secara vertikal dan horizontal. Perbedaan proses antara deteksi tepi vertikal dan horizontal hanya terletak pada filter yang digunakan.
Image Segmentation Segmentasi merupakan proses mengklaster citra menjadi beberapa bagian objek sehingga akan memudahkan untuk mengidentifikasi objek yang bermakna dari suatu citra (Deng et al. 1999). Ada dua pendekatan umum dalam melakukan segmentasi citra, yaitu pendekatan discontinuity dan pendekatan similarity. Pendekatan discontinuity mempartisi citra berdasarkan perubahan intensitas cahaya secara tiba-tiba, sedangkan pendekatan similarity membagi citra berdasarkan kesamaan sifat-sifat tertentu (region based).
Canny Detection Algoritma deteksi tepi Canny dikenal sebagai algoritma yang optimal dalam melakukan pendeteksian tepi (Acharya dan Ray 2005). Ada beberapa tahapan dalam deteksi tepi Canny, yaitu: 1 Smoothing: Menghilangkan noise dengan efek blurring 2 Finding gradient: Menandai tepi dari gambar yang memiliki nilai magnitute yang besar
4
3 4
Non-maximum suppression: Menghilangkan nilai-nilai yang tidak maksimum Double thresholding: Dua buah threshold dipilih untuk menentukan jalur tepi
Metode Ekstraksi Zoning Sampai saat ini ada banyak metode ekstraksi ciri yang digunakan. Beberapa metode ekstraksi ciri yang sering digunakan ialah template matching dan unitary transform zoning. Zoning merupakan salah satu metode ekstraksi ciri yang populer dan sederhana yang digunakan dalam ekstraksi fitur. Metode ekstraksi zoning akan membagi citra menjadi beberapa zona yang berukuran sama, untuk kemudian dari setiap zona akan diambil cirinya. Ada beberapa algoritme untuk metode ekstraksi ciri zoning, di antaranya metode ekstraksi ciri jarak metrik ICZ (image centroid and zone), metode ekstraksi ciri jarak metrik ZCZ (zone centroid and zone), dan metode ekstraksi ciri gabungan ICZ + ZCZ. Ketiga algoritma tersebut menggunakan citra digital sebagai input dan menghasilkan fitur untuk klasifikasi dan pengenalan sebagai output-nya. Berikut merupakan tahapan dalam proses ekstraksi ciri ICZ, ZCZ dan ICZ+ZCZ (Rajashekararadhya dan Ranjan 2008) . Algoritme 1: Image Centroid and Zone (ICZ) berdasarkan jarak metrik. Tahapan Hitung centroid dari citra masukan 1 2 Bagi citra masukan ke dalam n zona yang sama 3 Hitung jarak antara centroid citra dengan masing-masing piksel yang ada dalam zona 4 Ulangi langkah ke 3 untuk setiap piksel yang ada di zona 5 Hitung rata-rata jarak antara titik-titik tersebut Ulangi langkah-langkah tersebut untuk keseluruhan zona 6 7 Hasilnya adalah n fitur yang akan digunakan dalam klasifikasi dan pengenalan Algoritma 2: Zone Centroid Zone (ZCZ) berdasarkan jarak metrik. 1 Bagi citra masukan ke dalam sejumlah n bagian yang sama 2 Hitung centroid dari masing-masing zona 3 Hitung jarak antara centroid masing-masing zona dan piksel yang ada di zona 4 Ulangi langkah ke 3 untuk seluruh piksel yang ada di zona Hitung rata-rata jarak antara titik-titik tersebut 5 6 Ulangi langkah 3-7 untuk setiap zona secara berurutan 7 Hasilnya adalah n fitur yang akan digunakan dalam klasifikasi dan pengenalan Algoritme 3: ICZ+ZCZ berdasarkan jarak metrik. 1 Hitung centroid dari citra masukan 2 Bagi citra masukan ke dalam sejumlah n bagian yang sama 3 Hitung jarak antara centroid citra dengan setiap piksel yang ada dalam zona 4 Ulangi langkah 3 untuk semua piksel yang ada dalam zona 5 Hitung jarak rata-rata antara titik-titik tersebut
5 6 7 8 9 10 11
Hitung centroid tiap zona Hitung jarak antara centroid zona dengan setiap piksel yang ada dalam zona Ulangi langkah 7 untuk semua piksel yang ada dalam zona Hitung jarak rata-rata antara titik-titik tersebut Ulangi langkah 3-9 untuk semua zona secara berurutan Hasilnya akan didapatkan 2n ciri untuk klasifikasi dan pengenalan
K-Nearest Neighbour K-NN merupakan algoritme dalam klasifikasi yang mengklasifikasikan hasil kueri instance yang baru berdasarkan mayoritas kategori pada k tetangga terdekat (Manning et al. 2008). Secara umum ada beberapa tahap dalam proses klasifikasi K-NN. Pertama nilai k yang merupakan jumlah tetangga terdekat yang akan menentukan kueri baru masuk ke kelas mana ditentukan. Kemudian, k tetangga terdekat dicari dengan cara menghitung jarak titik kueri dengan titik training. Setelah mengetahui jarak masing-masing titik training dengan titik kueri, kemudian lihat nilai yang paling kecil. Ambil k nilai terkecil selanjutnya lihat kelasnya. Kelas yang paling banyak merupakan kelas dari kueri baru. Dekat atau jauhnya jarak titik dengan tetangganya bisa dihitung dengan menggunakan Euclidean distance. Euclidean distance direpresentasikan sebagai berikut (Deza dan Deza 2009): (
)
√∑
(
)
(1)
D(a,b) merupakan jarak antara vektor a yang merupakan titik yang telah diketahui kelasnya dan b berupa titik baru dari matriks berukuran d dimensi. Jarak antara vektor baru dengan titik-titik training dihitung dan diambil k buah vektor terdekat. Titik baru diprediksi masuk ke kelas dengan klasifikasi terbanyak dari titik-titik tersebut.
METODE Untuk dapat melakukan penelitian yang baik, diperlukan sebuah metode penelitian yang baik serta terencana. Skema penelitian yang akan dilakukan dapat dilihat pada Gambar 2.
Pengumpulan Data Citra yang digunakan merupakan hasil tangkapan kamera handphone dengan resolusi sebesar 5 MP (Lesmana 2012), pengambilan citra dilakukan dengan kondisi plat nomor berhadapan lurus dengan kamera sekitar 0˚. Citra yang dikumpulkan harus memperhatikan jumlah kemunculan masing-masing karakter, dimana sebaran frekuensinya merata untuk setiap karkter. Hal tersebut dilakukan agar data latih yang dimiliki dapat lebih akurat untuk setiap karakter yang ada. Contoh citra hasil pengumpulan data bisa dilihat pada Gambar 3.
6
Mulai
Pengumpulan Data
Citra
Praprosesing
Pengujian Per Karakter
Ekstraksi Ciri ICZ
Pengujian Per Plat
Ekstraksi Ciri ICZ+ZCZ
Ekstraksi Ciri ICZ+ZCZ
K-Fold Cross Validation Data Uji
Data Latih
Data Latih
Data Uji
Klasifikasi K-NN
Klasifikasi K-NN
Evaluasi & Hasil Akhir
Selesai
Gambar 2 Skema metode penelitian
7
Gambar 3 Contoh gambar hasil data
pengumpulan
Praproses Citra Praproses dilakukan agar citra plat nomor bisa diekstraksi. Gambar plat nomor yang didapat dari hasil pengumpulan data merupakan gambar RGB. Gambar tersebut kemudian dirubah mencadi citra grayscale agar proses komputasi bisa lebih efisien. Proses perubahan citra RGB menjadi grayscale dapat menggunakan rumus (Zailah 2012): Piksel = 0.2989 * R + 0.5870 * G + 0.1140 * B R, G, dan B merupakan intensitas dari masing-masing warna merah, hijau, dan biru pada citra. Setelah dilakukan konversi citra RGB ke grayscale, citra dibersihkan dari noise dengan menggunakan median filter.
Deteksi Tepi Deteksi tepi dilakukan untuk mendapatkan tepi dari tiap karakter yang ada pada citra. Deteksi tepi yang digunakan dalam penelitian ini adalah deteksi tepi Canny. Contoh hasil dari proses deteksi tepi menggunakan Canny pada plat nomor dapat dilihat pada Gambar 4.
Gambar 4 Gambar grayscale dari plat nomor (kiri) dan hasil deteksi tepi Canny (kanan) Agar hasil dari deteksi tepi bisa lebih baik dan tidak memunculkan tepi yang tidak penting, pada saat proses deteksi digunakan satu parameter yang akan menjadi batas atau threshold dalam pendeteksian.
8
Segmentasi Citra Agar karakter pada citra plat nomor bisa dikenali satu per satu, segmentasi harus dilakukan pada citra masukan. Selain itu, segmentasi dilakukan agar bisa mengeliminasi objek-objek yang tidak diperlukan. Hal ini dilakukan dengan cara melakukan segmentasi citra berdasarkan area. Objek yang memiliki citra yang terhubung akan dianggap sebagai satu area. Pada penelitian ini, untuk mendeteksi piksel-piksel yang terhubung digunakan metode 8-connected. Tiap area yang didapat kemudian dihitung luasnya. Kemudian, luas area tersebut dibandingkan dengan batas minimum luas area. Jika luas area lebih dari batas minimum maka area tersebut akan diaggap sebagai satu karakter. Contoh hasil segmentasi citra plat nomor bisa dilihat pada Gambar 5.
Gambar 5 Hasil segmentasi citra plat nomor Citra di atas memiliki ukuran yang sama karena dilakukan resize pada masing-masing citra hasil proses segmentasi.
Ekstraksi Ciri Pada tahapan ini akan dilakukan proses ektraksi untuk mendapatkan fitur yang akan digunakan dalam klasifikasi dan pengenalan. Metode ektraksi ciri yang digunakan dalam penelitian ini adalah variasi algoritme metode zoning, yaitu Image Centroid and Zone (ICZ) dan gabungan dari ICZ dan Zone Centroid and Zone (ZCZ). Sebelum proses ekstraksi dilakukan, dimensi dari setiap karakter harus berukuran sama. Koordinat centroid dari n buah titik (x1,y1) sampai (xn,yn) dihitung dengan rumus sebagai berikut:
dimana, Xc = Centroid koordinat x Yc = Centroid koordinat y xn = Koordinat x dari pixel ke-n yn = Koordinat y dari pixel ke-n pn = Nilai pixel ke-n
9 Citra plat nomor akan dibagi menjadi beberapa bagian sama besar. Pada penelitian ini digunakan jumlah zona sebanyak 5, 10, 14, 15, 20, dan 25. Untuk mencari jarak antara centroid dan koordinat piksel digunakan metode Euclidean. Gambar 6 adalah contoh pembagian zona pada citra karakter huruf B.
Gambar 6 Contoh pembagian zona citra Metode ekstraksi ciri ICZ dan ZCZ menggunakan rumus yang sama dalam menghitung centroid. Perbedaan antara ICZ dan ZCZ terletak pada perbedaan alur dari algoritme proses ekstraksi. Pada metode ICZ perhitungan nilai centroid dari citra dilakukan sebelum citra dibagi ke dalam beberapa area yang sama besar sehingga nilai centroid pada proses ekstraksi ICZ hanya ada satu, sedangkan pada metode ektraksi ZCZ perhitungan centroid dilakukan setelah citra dibagi ke dalam beberapa daerah yang sama besar. Perhitungan centroid pada metode ekstraksi ZCZ akan menghasilkan sejumlah nilai centroid, banyak nilai centroid tergantung pada jumlah daerah pembagian citra. Pada Gambar 7 dapat dilihat hasil pencarian koordinat centroid pada algoritme ICZ dan ZCZ.
Gambar 7 Ilustrasi koordinat centroid pada ekstraksi ciri ICZ (kiri) dan ZCZ (kanan) Setelah mendapatkan koordinat centroid, tahapan selanjutnya pada ekstraksi ciri ICZ ialah perhitungan jarak pada tiap piksel di suatu zona terhadap koordinat centroid citra karakter, kemudian dihitung rata-rata jaraknya. Hal ini dilakukan untuk keseluruhan zona yang ada pada citra. Nilai rata-rata inilah yang merupakan
10
ciri citra hasil ektraksi ICZ. Untuk ekstraksi ciri ZCZ, setiap piksel yang ada pada suatu zona dihitung jaraknya dengan koordinat centroid di zonanya. Setelah itu dihitung rata-rata jarak keseluruhan piksel di zona tersebut terhadap koordinat centroid. Hal ini dilakukan untuk keseluruhan zona yang ada pada citra. Rata-rata jarak untuk setiap zona inilah yang merupakan ciri hasil ekstraksi ZCZ. Visualisasi perhitungan jarak pada ekstraksi ciri ICZ dan ZCZ bisa dilihat pada Gambar 8.
Gambar 8 Perhitungan jarak dengan ICZ (kiri) dan ZCZ (kanan) Pada metode ekstraksi ICZ+ZCZ fitur yang dihasilkan sejumlah 2n. Hal ini disebabkan oleh perhitungan centroid dan jarak antara tiap titik piksel dan centroid dilakukan sebanyak dua kali, yaitu sebelum citra dibagi ke dalam sejumlah daerah yang sama besar dan setelah citra dibagi ke dalam sejumlah daerah yang sama besar.
Klasifikasi Menggunakan K-NN K-NN merupakan metode klasifikasi citra dengan cara menghitung kedekatan antara titik baru dengan titik training yang telah diketahui kelasnya. Kelas yang ada dalam pengenalan plat nomor ini ada 36 kelas (26 huruf dan 10 angka). Secara umum ada dua tahapan dalam proses klasifikasi K-NN yaitu menentukan tetangga terdekat dan menentukan kelas berdasarkan tetangga terdekat. Dalam proses klasifikasi sebelumnya harus ditentukan dahulu nilai k, yaitu jumlah tetangga terdekat yang akan dilihat kelasnya untuk menentukan kelas terbanyak yang merupakan kelas dari titik baru. Nilai k akan sangat berpengaruh pada akurasi hasil klasifikasi. Nilai k yang terlalu kecil akan menyebabkan ketidakstabilan hasil, sedangkan nilai k yang terlalu besar akan menyebabkan bias (Kozma 2008). Nilai k pada penelitian ini adalah 1, 3, 5, dan 7.
11 Evaluasi dan Hasil Tahap ini merupakan tahap terakhir untuk mengevaluasi kekurangan dan kelebihan dari metode yang digunakan. Hal tersebut dilihat dari perbandingan hasil klasifikasi citra dengan nomor polisi aslinya. Hasil yang tidak sesuai maupun sesuai dicatat untuk menentukan seberapa besar akurasi dari metode ini. Untuk menghitung akurasi dapat menggunakan rumus: a u asi b na
N
b na
: Jumlah citra yang berhasil terdekteksi : Jumlah data yang diuji.
Lingkungan Pengembangan Sistem Proses pengerjaan penelitian ini menggunakan perangkat keras dan perangkat lunak dengan spesifikasi sebagai berikut: Perangkat keras berupa notebook: Processor Intel Pentium Core2Duo @1.99GHz, RAM kapasitas 2 GB, Harddisk kapasitas 250GB, Monitor dengan resolusi 1280 × 800 piksel. Perangkat lunak berupa: Sistem operasi Microsoft Windows 7 Service Pack 1. Aplikasi pemrograman Matlab R2008.
HASIL DAN PEMBAHASAN Pengumpulan Data Dalam penelitian ini, data yang diperlukan adalah citra dari plat nomor kendaraan. Data yang digunakan merupakan data yang diambil dari proses pemotretan sebanyak 100 plat mobil kendaraan. Dari 100 buah plat nomor kendaraan, kemudian diambil potongan karakter yang mewakili seluruh kelas yaitu huruf sebanyak 26 dan angka sebanyak 10, jadi keseluruhan karakter ada 36. Untuk masing-masing karakter diambil sebanyak 50 citra, artinya kita akan mendapatkan citra karakter sebanyak 1800 buah. Citra tersebut nantinya akan digunakan sebagai data uji dan data latih. Contoh data karakter dapat dilihat pada Gambar 9.
12
Gambar 9 Data karakter
Praproses Citra Tidak semua citra yang didapat dari hasil pengumpulan data berkualitas baik, terkadang karena pencahayaan dan lain-lain kualitas citra menjadi kurang baik dan terdapat noise. Hal ini sebaiknya tidak terjadi, karena dengan adanya noise akurasi pendeteksian karakter akan berkurang. Oleh karena itu, sebelum dilakukan ekstraksi ciri, terlebih dahulu dilakukan reduksi noise dengan menggunakan filter median. Langkah pertama yang dilakukan adalah mengubah citra RGB menjadi citra grayscale untuk mempercepat komputasi. Kemudian dilakukan reduksi noise dengan median filter. Filter median dipilih karena merupakan metode yang cocok untuk menghilangkan noise berupa salt & paper. Median filter yang digunakan dalam penelitian ini adalah matriks dua dimensi dengan batas matriks 3 × 3. Nilai piksel akan diubah menjadi nilai tengah dari piksel tersebut dibandingkan dengan delapan piksel tetangganya yang telah diurutkan.
Deteksi Tepi Proses deteksi tepi dilakukan dengan menggunakan metode Canny. Nilai threshold yang terlalu rendah akan menyebabkan garis yang bukan tepi dari objek muncul, sedangkan nilai threshold yang terlalu tinggi akan menyebabkan sebagian dari objek menghilang sehingga nilai 0.5 dipilih sebagai threshold untuk deteksi tepi. Pada tahap ini, citra yang dihasilkan berupa citra biner yang merepresentasikan garis tepi untuk setiap objek. Garis tepi inilah yang memisahkan objek yang diperlukan dengan objek lainnya. Contoh hasil deteksi menggunakan metode Canny bisa dilihat pada Gambar 10.
Gambar 10 Hasil deteksi Canny Untuk menyatukan garis-garis dari karakter yang mungkin terputus karena proses deteksi yang kurang sempurna, maka hasil dari deteksi tepi akan dilakukan proses dilasi. Proses ini akan mengubah gambar karakter menjadi lebih tebal. Hasil dari dilasi terlihat pada Gambar 11.
13
Gambar 11 Hasil dilasi
Segmentasi Citra Setelah melalui proses deteksi tepi menggunakan Canny’s dg d t ction, kemudian citra disegmentasi untuk memisahkan objek-objek yang akan diamati. Dalam penelitian ini, objek yang diamati adalah karakter huruf dan angka yang terdapat pada plat nomor. Dalam hal ini perlu identifikasi mana simbol yang merupakan huruf, angka, dan yang bukan merupakan keduanya. Proses ini dilakukan dengan menggunakan metode 8-connected. Setiap piksel yang terhubung akan diberi label yang sama dengan memperhatikan 8 piksel tetangganya. Proses ini dilakukan satu per satu untuk setiap piksel yang ada pada citra hasil deteksi tepi sehingga akan terbentuk kelompok piksel dengan masing-masing label yang berbeda. Setelah terbentuk kelompok piksel berdasarkan label, panjang dan lebar untuk masing-masing kelompok akan dihitung. Untuk mengetahui apakah kelompok piksel tersebut adalah suatu karakter angka dan huruf atau bukan, dilakukan seleksi kondisi berdasarkan panjang dan lebar dari kelompok piksel tersebut dengan kondisi: Jika (40 < panjang < 105) dan (20 < lebar < 100) Maka kelompok piksel = karakter Kelompok piksel yang memenuhi kondisi diatas akan diprediksi sebagai suatu karakter. Permasalahan yang muncul dengan melakukan pelabelan menggunakan 8-connected adalah pada saat pelabelan untuk karakter-karakter tertentu yang memiliki lebih dari satu tepian yang tidak terputus. Contohnya karakter 0 (nol), pada saat pelabelan karakter tersebut akan memliki dua kelompok label yang berbeda, karena secara visual karakter 0 (nol) terdiri atas dua buah elips yang terpisah. Bisa dilihat ilustrasinya pada Gambar 12.
Gambar 12 Pelabelan karakter 0 (nol) Setiap karakter yang memiliki karakteristik seperti angka 0 (nol) akan mengalami permasalahan yang sama. Untuk mengatasi hal tersebut, dilakukan pemeriksaan posisi masing-masing label. Apabila suatu label ada dalam area label yang lain, label tersebut akan dijadikan satu. Dengan begini, maka masing-masing label akan mewakili karakter yang teridentifikasi pada citra plat kendaraan. Contoh hasil segmentasi bias dilihat pada Gambar 13.
14
Gambar 13 Hasil segmentasi citra Citra yang telah melalui proses segmentasi telah terpisah per karakter dengan ukuran yang beragam sesuai dengan ukuran karakternya masing-masing.
Normalisasi Citra Gambar citra yang dihasilkan pada proses segmentasi memiliki ukuran yang berbeda-beda, oleh karena itu diperlukan proses normalisasi agar ekstraksi ciri menjadi konsisten. Proses normalisasi ini dilakukan dengan cara menyamakan ukuran citra tiap karakter menjadi 150 × 150 piksel. Setiap karakter akan diubah menjadi ukuran tersebut secara paksa sehingga bentuk dari karakter menjadi tidak proporsional, akan tetapi karena proses ini dilakukan pada setiap citra sehingga tidak akan merusak informasi yang diperlukan. Gambar hasil normalisasi terlihat pada Gambar 14.
Gambar 14 Hasil normalisasi citra
Ekstraksi Ciri Metode yang digunakan untuk ektraksi ciri dalam penelitian ini ada dua, yaitu ekstraksi ciri ICZ dan ICZ+ZCZ. Untuk ektraksi ciri dengan metode ICZ tahapan yang pertama adalah dengan menghitung centroid dari citra karakter hasil segmentasi. Kemudian citra karakter tersebut dibagi ke dalam n bagian yang sama. Nilai n pada penelitian ini 5, 10, 14, 15, 20, dan 25. Nilai-nilai yang dipilih tersebut merupakan bilangan kelipatan 5. Hal ini dilakukan untuk memudahkan penelitian, sedangkan nilai 14 dipilih karena dalam penelitian Lesmana (2012), 14 merupakan jumlah zona yang menghasilkan akurasi paling baik. Gambar 15 merupakan ilustrasi pembagian zona pada citra. Citra masukkan kemudian dibagi kedalam sejumlah zona yang sama. Akan diilustrasikan pembagian citra ke dalam 14 zona yang sama. Setelah citra dibagi ke dalam n bagian yang sama, untuk setiap piksel berwarna putih yang ada di masing-masing zona dihitung jaraknya terhadap centroid dengan menggunakan jarak Euclid, kemudian dihitung rata-rata jarak tiap piksel dengan koordinat centroid yang ada di zona tersebut. Hal ini dilakukan terhadap keseluruhan zona pada citra karakter tersebut. Nilai rata-rata inilah merupakan ciri dari karakter tersebut. Hasil dari perhitungan ini akan berjumlah n ciri. Pembagian jumlah yang tepat akan sangat berpengaruh terhadap proses identifikasi.
15
Gambar 15 Ilustrasi pembagian zona Berbeda dengan metode ICZ, ekstraksi ciri dengan menggunakan metode ICZ+ZCZ akan menghasilkan ciri berjumlah 2n. ICZ+ZCZ merupakan penggabungan ciri yang dihasilkan oleh perhitungan ciri menggunakan metode ICZ dan metode ZCZ. Untuk mendapatkan ciri dengan menggunakan metode ZCZ yang pertama kali dilakukan adalah dengan membagi citra ke dalam n buah zona, kemudian untuk masing-masing zona dihitung koordinat centroid-nya, sehingga koordinat centroid pada algoritme ZCZ berjumlah sama dengan pembagian zona. Kemudian untuk masing-masing piksel yang ada di zona tersebut dihitung jaraknya terhadap koordinat centroid. Setelah itu, dihitung rata-rata jarak untuk setiap zona. Nilai inilah yang merupakan hasil ekstraksi ciri menggunakan metode ZCZ. Kemudian hasil ekstraksi ciri ZCZ ini digabungkan dengan hasil perhitungan dengan menggunakan metode ICZ. Hasilnya merupakan ekstraksi ciri dengan metode ICZ+ZCZ. Pola karakter dengan menggunakan ekstraksi ciri ICZ+ZCZ dapat dilihat pada Lampiran 1.
Klasifikasi Citra Pada proses ini terlebih dahulu dilakukan pembagian data latih dan data uji terhadap seluruh citra karakter yang berjumlah 1800 citra. Masing-masing karakter yang berjumlah 36 diwakili oleh 50 citra. Data latih diambil 40 citra untuk masing-masing karakter, dan sisanya 10 citra masing-masing karakter merupakan data uji. Pembagian data uji dan data latih ini menggunakan K-Fold Cross Validation dengan k bernilai 5. Hasilnya berupa 5 variasi data latih dan data uji. Untuk setiap data latih akan terbentuk matriks berukuran n × 1440. Nilai n merupakan jumlah zona yang ditentukan dalam ekstraksi ciri, sedangkan data latih akan terbentuk matriks berukuran n × 360. Jumlah kelas dalam klasifikasi citra ini berjumlah 36 sesuai dengan karakter yang ada. Matriks yang terbentuk tersebut merupakan matriks ciri masing-masing karakter yang disatukan secara berurutan sehingga memudahkan dalam penentuan grup. Grup merupakan label kelas untuk masing-masing baris matriks dari data latih. Label ini dibutuhkan dalam proses klasifikasi dengan menggunakan K-NN. Grup yang terbentuk berupa matriks dengan ukuran 1 × 1440.
16
Pengujian Per Karakter Pengujian karakter dilakukan dengan K-NN. Untuk pengujian pertama, akan dilakukan dengan menggunakan input hasil ekstraksi ciri dengan zona berjumlah 5. Pengujian ini dilakukan dengan menggunakan nilai k atau tetangga terdekat berjumlah 1, 3, 5, dan 7. Pengujian menggunakan 5 variasi data uji dan data latih yang telah dihasilkan pada proses K-Fold Cross Validation. Pengujian ini menghasilkan nilai akurasinya berbeda-beda. Berikut tabel akurasi yang didapat pada pengujian karakter hasil ekstraksi ciri dengan zona berjumlah 5. Dari Tabel 1 terlihat bahwa hasil pengujian karakter dengan 1 tetangga terdekat menghasilkan rata-rata akurasi paling tinggi yaitu 84.56%. Maka, untuk percobaan selanjutnya hanya akan dilakukan dengan nilai k berjumlah 1. Tabel 1 Persentase akurasi pengujian karakter dengan zona berjumlah 5 Fold 1 2 3 4 5 Rata-rata
Jumlah tetangga terdekat 1
3
5
7
89.44% 87.78% 85.56% 78.33% 81.67% 84.56%
87.78% 85.56% 83.33% 77.78% 78.33% 82.56%
85.83% 81.67% 80.28% 75.28% 74.72% 79.56%
85.28% 77.78% 77.50% 73.89% 72.50% 77.39%
Selanjutnya dilakukan percobaan yang sama dengan zona yang berbeda yaitu 10, 14, 15, 20, dan 25. Akurasi identifikasi karakter dengan menggunakan ekstraksi ciri ICZ pada masing-masing pembagian zona dapat dilihat pada Lampiran 2. Rata-rata akurasi dari percobaan dengan variasi zona tersebut terlihat pada Tabel 2. Tabel 2 Persentase akurasi pengujian dengan variasi zona Zona 5 10 14 15 20 25
Rata-rata akurasi 84.56% 95.17% 97.00% 94.33% 93.06% 93.24%
17 Dari hasil percobaan tersebut terlihat bahwa akurasi dengan jumlah zona berjumlah 14 menghasilkan nilai tertinggi yaitu 97.00%. Kemudian pada Tabel 3 akan terlihat perbandingan akurasi untuk zona 14 dengan hasil penelitian Lesmana (2012) yang menggunakan klasifikasi backpropagation dalam pengenalan karakter plat nomor. Tabel 3 Perbandingan akurasi pengenalan karakter dengan klasifikasi K-NN dan backpropagation (Lesmana 2012) Fold
1 2 3 4 5 Rata-rata 1)
Metode klasifikasi K-NN
Backpropagation1)
96.39% 97.78% 97.78% 96.67% 96.39% 97.00%
82.77% 91.67% 85.55% 78.88% 87.77% 85.32%
Sumber: Lesmana(2012)
Perbandingan pengenalan karakter plat nomor menggunakan zona yang sama, namun klasifikasi yang berbeda menunjukkan bahwa klasifikasi K-NN lebih baik dibandingkan dengan klasifikasi backpropagation (Lesmana 2012) dalam pengenalan karakter plat nomor kendaraan, rata-rata akurasi yang didapatkan dengan menggunakan klasifikasi K-NN adalah 97.00% sedangkan rata-rata akurasi dengan menggunakan klasifikasi backpropagation (Lesmana 2012) adalah 85.32%. Untuk meningkatkan akurasi, selanjutnya akan dilakukan pengujian dengan menggunakan metode ekstraksi yang berbeda yaitu metode ekstraksi ICZ+ZCZ. Akurasi untuk identifikasi karakter dengan menggunakan metode ICZ+ZCZ dengan menggunakan zona 14 dan 1 tetangga terdekat bisa dilihat pada Tabel 4. Tabel 4 Akurasi identifikasi karakter dengan metode ICZ+ZCZ dan klasifikasi K-NN Fold 1 2 3 4 5 Rata-rata
Akurasi 98.06% 98.61% 98.33% 98.33% 97.50% 98.17%
Hasil yang didapatkan pada pengujian karakter dengan menggunakan metode ICZ+ZCZ lebih baik dibandingkan dengan ICZ. Metode ICZ mencapai
18
rata-rata akurasi 97.00% sedangkan metode ICZ+ZCZ mencapai rata-rata akurasi 98.17%. Hasil deteksi untuk masing-masing karakter bisa dilihat pada Lampiran 3. Pada pengujian per karakter beberapa karakter gagal teridentifikasi dengan benar. Kesalahan identifikasi ini sebagian besar terjadi karena ciri khas dari karakter yang mirip dengan karakter lain dan hasil deteksi tepi yang kurang baik. Proses resize sendiri tidak berpengaruh signifikan terhadap pendeteksian, karena masing-masing karakter hasil resize tidak mengalami perubahan ciri khas dari suatu karakter. Contohnya untuk identifikasi karakter 8, salah satunya teridentifikasi sebagai karakter O. Pada Gambar 16 terlihat karakter 8 yang teridentifikasi sebagai karakter O.
Gambar 16 Karakter 8 yang gagal teridentifikasi Untuk identifikasi karakter digunakan nilai 1 sebagai jumlah tetangga terdekat sehingga karakter atau citra yang merupakan tetangga paling dekat dan dianggap sebagai kelas dari citra angka 1 ini dapat dilihat. Pada Gambar 17 ditunjukkan citra karakter O yang merupakan citra yang memiliki jarak terdekat dengan citra karakter 8 yang gagal teridentifikasi tersebut.
Gambar 17 Karakter tetangga terdekat citra karakter 8 Apabila dilihat kedua citra tersebut memang jauh berbeda. Akan tetapi, klasifikasi K-NN telah menunjukkan bahwa citra pada Gambar 17 adalah citra yang ekstraksi cirinya paling mendekati citra pada Gambar 16. Kemudian, dilihat pula tetangga terdekat kedua dari karakter 8 yang salah teridentifikasi, ternyata tetangga terdekat keduanya adalah karakter 8. Agar dapat diketahui kedekatan hasil ekstraksi ciri karakter 8 yang gagal teridentifikasi dengan kedua tetangga terdekatnya, maka harus dilihat pola ekstraksi ciri dari ketiga citra tersebut. Pola ekstraksi ciri dari kedua citra tersebut bisa dilihat pada Gambar 18.
19 250
Nilai Piksel
200 150 8 100
O N
50 0 1
3
5
7
9
11 13 15 17 19 21 23 25 27 Urutan piksel
Gambar 18 Kedekatan hasil ekstraksi ciri Terlihat dari Gambar 18 bahwa grafik N yang merupakan hasil ektraksi ciri karakter 8 yang diamati lebih dekat jaraknya dengan karakter O dibandingkan dengan karakter 8 yang merupakan kelas yang sebenarnya.
Pengujian Per Plat Berbeda dengan pengujian per karakter, pengujian per plat tidak menggunakan data hasil K-Fold tapi menggunakan keseluruhan hasil dari ekstraksi ciri dengan menggunakan zona berjumlah 14. Pengujian dilakukan pada citra plat nomor kendaraan secara utuh. Plat yang digunakan dalam proses pengujian ini menggunakan 65 citra plat kendaraan. Hasil akurasi yang akan didapat tentu saja akan lebih kecil dibandingkan dengan pengujian karakter. Karena pada kenyataannya apabila dalam pengujian terdapat satu saja karakter yang salah teridentifikasi, maka hasil identifikasi karakter akan dianggap salah secara keseluruhan. Diagram perbandingan akurasi identifikasi per plat hasil ekstraksi ICZ menggunakan K-NN dibandingkan dengan akurasi pengenalan plat nomor dengan ektraksi ciri ICZ+ZCZ dan klasifikasi KNN dapat dilihat pada Gambar 19. Sama seperti pengujian per karakter, hasil yang didapatkan pada pengujian per plat menunjukkan bahwa identifikasi karakter plat nomor kendaraan mencapai akurasi yang lebih tinggi dengan menggunakan ekstraksi ciri ICZ+ZCZ dibandingkan dengan hasil ekstraksi ciri ICZ saja. Setelah dilakukan pengujian terhadap 65 citra tersebut ternyata terdapat 18 pengujian dengan hasil identifikasi yang salah untuk ekstraksi ciri ICZ+ZCZ, hasilnya dapat dilihat pada Lampiran 4. Akurasi yang didapat dalam pengujian plat nomor menggunakan ekstraksi ciri ICZ+ZCZ adalah 72.31%. Pengujian yang dilakukan dengan menggunakan hasil ekstraksi ciri ICZ mendapatkan akurasi sebesar 52.31%.
20
100%
89.23%
90% 80%
83.08% 72.31%
Akurasi
70% 60%
52.31%
50%
ICZ+ZCZ
40%
ICZ
30% 20% 10% 0% 0 Kesalahan
< 2 Kesalahan Kesalahan
Gambar 19 Perbandingan akurasi deteksi per plat Pada proses pengujian plat terdapat kesalahan identifikasi yang hanya disebabkan oleh satu karakter. Padahal pada kenyataannya terkadang untuk kepentingan tertentu kesalahan satu buah karakter bisa ditoleransi, seperti halnya untuk kepentingan kepolisian. Oleh karena itu, diperhitungkan pula akurasi pengujian plat yang kesalahannya kurang dari atau sama dengan satu. Untuk pengujian plat hasil ekstraksi ciri ICZ+ZCZ yang kesalahannya kurang dari atau sama dengan satu akurasinya mencapai 89.23%. Dengan kata lain, pada pengujian 65 buah plat hanya terdapat 7 kesalahan identifikasi. Sedangkan pengujian dengan menggunakan hasil ekstraksi ciri ICZ dengan tolerasi sebanyak 1, mencapai akurasi tertinggi sebanyak 83.08%. Kesalahan pada identifikasi plat nomor bukan saja karena klasifikasi yang tidak akurat akan tetapi juga karena gagal pada saat proses segmentasi, sehingga beberapa simbol yang seharusnya dikenali sebagai karakter tidak masuk ke dalam proses klasifikasi. Kesalahan identifikasi plat nomor pada pengujian ini dapat dilihat pada Tabel 5. Tabel 5 Contoh kesalahan deteksi plat nomor Plat
Hasil deteksi
F1034HB B1003WFB B8375NW F1745GP F8766AJ
F1034H8 Q1DD9 3375NW F3697AU 7WJ
Pada pengujian plat nomor F8766AJ terlihat kesalahan dengan jelas. Pada plat nomor tersebut seharusnya teridentifikasi jumlah karakter sebanyak 7, namun pada proses segmentasi hanya dikenali 3 karakter. Hal ini terjadi karena kualitas
21 pencahayaan yang buruk dan kondisi platnya sendiri yang kurang baik. Telihat pada Gambar 20 Contoh dari plat nomor kendaraan yang gagal teridentifikasi.
Gambar 20 Contoh plat yang gagal teridentifikasi
SIMPULAN DAN SARAN Simpulan Dari penelitian yang telah dilakukan untuk mendeteksi karakter pada plat nomor kendaraan menggunakan ekstraksi ciri ICZ dan ICZ+ZCZ dengan metode klasifikasi K-NN dapat disimpulkan sebagai berikut: 1 Pada penelitian pendeteksian plat nomor kendaraan ini telah berhasil menggunakan metode K-NN sebagai metode klasifikasi 2
Dari beberapa zona yang diuji coba, yaitu 5, 10, 14, 15, 20, dan 25. Akurasi tertinggi untuk pengenalan karakter dengan ektraksi ciri ICZ adalah pembagian zona sebanyak 14 yaitu 97.00%, sedangkan akurasi terendah dihasilkan dengan pembagian zona sebanyak 5 yaitu 84.56%
3
Pengenalan karakter dengan pembagian zona sebanyak 14 yang menggunakan ekstraksi ciri ICZ+ZCZ dan metode klasifikasi K-NN mencapai rata-rata akurasi 98.17%
4
Akurasi dalam pengenalan 65 buah plat nomor kendaraan menggunakan ekstraksi ciri ICZ dan klasifikasi K-NN mencapai 52.31% sedangkan dengan menggunakan ekstraksi ciri ICZ+ZCZ dan klasifikasi K-NN mencapai 72.31%
5
Akurasi untuk pengenalan plat nomor kendaraan menggunakan ekstraksi ciri ICZ dan metode klasifikasi K-NN dengan toleransi kesalahan sebanyak 1 adalah 83.08% sedangkan dengan menggunakan ekstraksi ciri ICZ+ZCZ dan klasifikasi K-NN adalah 89.23%
6
Ekstraksi ciri ICZ+ZCZ menghasilkan akurasi yang lebih tinggi dalam pengenalan per karakter dan per plat dibandingkan dengan ekstraksi ciri ICZ
7
Metode klasifikasi K-NN menghasilkan akurasi yang lebih tinggi dibandingkan dengan backpropagation (Lesmana 20120) dalam pengenalan per karakter dengan kondisi pengambilan citra lurus terhadap kamera
Saran Untuk terus mengembangkan penelitian ini perlu dilakukan saran sebagai berikut:
22
1 2 3
Dapat dilakukan pendeteksian plat menggunakan metode ekstrasi fitur dan klasifikasi lainnya untuk meningkatkan akurasi Menambahkan foto-foto plat nomor kendaraan lain dengan variasi posisi pengambilan data citra yang lebih banyak untuk proses pengujian Dapat dikembangkan dengan aplikasi pendeteksi plat nomor untuk membangun suatu sistem pencatatan plat nomor dengan berbagai kebutuhan yang terintegrasi oleh metode pendeteksian karakter pada plat nomor
DAFTAR PUSTAKA Acharya T, Ray AK. 2005. Image Processing Principles and Applications. New Jersey (USA): John Wiley and Sons Inc. Baxes AG. 1984. Digital Image Processing. New Jersey (USA): Prentice Hall. Deng Y, Manjunath BS, Shin H. 1999. Color image segmentation. IEEE Computer Society Conference On. 2:446-451. Deza MM, Deza L. 2009. Encyclopedia of Distances. New York City (US): Springer. Kocer HE, Cevik. 2011. Artificial neural network based vehicle license plate recognition. Science Direct Procedia Computer Science. 3:1033-1037. Lesmana AR. 2012. Identifikasi karakter pada plat nomor kendaraan menggunakan zone based feature extraction dengan metode klasifikasi backpropagation [skripsi]. Bogor (ID): Institut Pertanian Bogor. Manning CD, Raghavan P, Schutze H. 2009. An Introduction to Information Retrieval. Cambridge (GB): Cambridge University. Mulia I. 2012. Pengenalan aksara Sunda berbasis citra menggunakan metode support vector machine [skripsi]. Bogor (ID): Institut Pertanian Bogor. Rajashekararadhya SV, Ranjan PV. 2008. Efficient zone based feature extraction algorithm for handwritten numeral recognition of four popular south indian scripts. Journal of Theoretical and Applied Information Technology. 4(12):1171-1181. Shapiro L, Stockman G. 2001. Computer Vision. New Jersey (US): Prentice Hall. Zailah W, Hannan MA, Mamun AA. 2012. Image acquisition for solid waste bin level classification and grading. Journal of Applied Sciences Research. 8(6): 3092-3096.
23 Lampiran 1 Pola karakter ekstraksi ciri ICZ+ZCZ
Pola karakter 0
Pola karakter 1
Pola karakter 2
Pola karakter 3
Pola karakter 4
Pola karakter 5
Pola karakter 6
Pola karakter 7
Pola karakter 8
Pola karakter 9
Pola karakter A
Pola karakter B
Pola karakter C
Pola karakter D
Pola karakter E
24
Lampiran 1 Lanjutan
Pola karakter F
Pola karakter G
Pola karakter H
Pola karakter I
Pola karakter J
Pola karakter K
Pola karakter L
Pola karakter M
Pola karakter N
Pola karakter O
Pola karakter P
Pola karakter Q
Pola karakter R
Pola karakter S
Pola karakter T
25
Lampiran 1 Lanjutan
Pola karakter U
Pola karakter V
Pola karakter W
Pola karakter X
Pola karakter Y
Pola karakter Z
26
Lampiran 2 Akurasi identifikasi karakter dengan menggunakan ekstraksi ciri ICZ+ZCZ Zona =5
Zona=10 k=1
k=3
k=5
k=7
Rata-Rata
k=1
Fold 1
89.44%
87.78%
85.83%
85.28%
86,30%
Fold 1
96.11%
Fold 2
87.78%
85.56%
81.67%
77.78%
81,67%
Fold 2
96.67%
Fold 3
85.56%
83.33%
80.28%
77.50%
80,37%
Fold 3
95.56%
73.89%
75,65%
Fold 4
94.17%
Fold 4
78.33%
77.78%
75.28%
Fold 5
81.67%
78.33%
74.72%
72.50%
75,18%
Fold 5
93.33%
Rata-Rata
84.56%
82.56%
79.56%
77.39%
79,83%
Rata-Rata
95.17%
Zona=20
Zona=15
Zona=14
k=1
k=1
k=1 Fold 1
95.83%
Fold 1
96.67%
Fold 2
95.83%
Fold 2
95.00%
97.78%
Fold 3
94.72%
Fold 3
95.56%
Fold 4
96.67%
Fold 4
91.67%
Fold 4
92.22%
Fold 5
96.39%
Fold 5
93.61%
Fold 5
94.44%
97.00%
Rata-Rata
94.33%
Rata-Rata
94.78%
Fold 1
96.39%
Fold 2
97.78%
Fold 3
Rata-Rata
Zona=25 k=1 Fold 1
96.67%
Fold 2
95.83%
Fold 3
96.11%
Fold 4
92.22%
Fold 5
93.89%
Rata-Rata
94.94%
27 Lampiran 3 Hasil deteksi karakter menggunakan ekstraksi ciri ICZ+ZCZ dengan 14 zona
0 1 2 3 4 5 6 7 8 9 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
47 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 49 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 50 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 48 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 1 0 0 48 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0
0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 48 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 45 0 0 1 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 48 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 49 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0 0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 48 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 49 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 49 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 49 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 48 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 50 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 0 0 0 0 0 2 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 49 0 1 0 0 0 0 0 0
0 0 0 2 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 49 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 49 0 0 0 0 0 0
2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 0 0 0 0 0
0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 0 0 0 0
0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 48 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 48 0 0
0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 49 0
0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50
28
Lampiran 4 Contoh karakter yang gagal teridentifikasi Karakter
Tetangga terdekat
Pola
Pola tetangga terdekat
29 Lampiran 5 Hasil deteksi plat nomor No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
Plat B1559QB F1090DI B1591BFS F1225HV B8765UU F1337GS F55AM B1880KKO F1320CZ B1192POT F1589KM F3323BL Z2515TK B1063KEO B1950NFN B1444MQ DK298AY B1664ZR B1710RFY F1760BW F1235DE F1806A B54TYA B457UTY B1633ZFB B7044UR F1834CS F1794H B2228LL B1459MH B1163FY F1644HG F1206CS F1575CJ B1731SFR F1761CT B560XV B1868BOD F1549BM B8966VD F1504FQ F1697AU
Hasil deteksi B450GB F1090UI 1V8Y8FS F122BHV B8765UU F133788 F55AM B188KKO F1328C B1192P0T 1589KM F3323BL Z2515TK B063KEO B1950NFN B1444MQ 0298AY B664ZR B1710RY P17608W F1235DE F1806A B54TYA B457UTY B1633ZFB B7044UR F1834CS F1794H B2228LL B1459MH B1163FY F1644HG F1206CS F1575CJ B1731SFR F1761CT B560XV B1868BOD F1549BM B8966VD F1504FQ F3697AU
30
Lampiran 5 Lanjutan No 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65
Plat F1034HB G8409AP F1015AC B1202TJC F1622NL F1139HI B1506OH F1745GP F1512BI B8375NW F212AX F1877CU F601DY F1490GJ F1440CG B2833XY F1804CN F1504CE F1580CV F1600D F8766AJ B1822UKB B1003WFB
Hasil deteksi F1034H8 G8409AP F1015AC B1202TJC F1622NL F1139HI B1506OH F17450P F1512BI 8375NW F212AX F1877CU F601DY F1490GJ F1440CG B2833XY F804CN F15004CE F1580CV F1600D 7WJ B1822UKB Q1DD9
Total hasil deteksi benar dengan kesalahan 0 = 47 Total hasil deteksi dengan kesalahan <2 = 58 Akurasi kesalahan 0 = 72.31% Akurasi kesalahan < 2 = 89.23%
31
RIWAYAT HIDUP Penulis bernama lengkap Raden Putri Ayu Pramesti, lahir di Ciamis, Jawa Barat pada tanggal 8 September 1988. Penulis merupakan bungsu dari dua bersaudara dari pasangan Bapak Soegandhi Soeriawidjaya, MTA dan Ibu Evi Sopia. Penulis lulus dari SMA Negeri 1 Ciamis pada tahun 2006. Kemudian penulis melanjutkan pendidikannya di Program Studi D3 Teknik Informatika, Universitas Padjadjaran Bandung dan lulus pada tahun 2009. Pada tahun 2010, penulis mulai bekerja di Badan Pengkajian dan Penerapan Teknologi dan pada tahun yang sama kemudian kembali melanjutkan pendidikan di Program Sarjana Alih Jenis Ilmu Komputer Insititut Pertanian Bogor, Fakultas Matematika dan Ilmu Pengetahuan Alam.