SEMINAR NASIONAL SAINS DAN TEKNOLOGI – IV Hotel Marcopolo, Bandar Lampung, 29 – 30 November 2011 PENERAPAN METODE CONTENT BASED IMAGE RETRIEVAL UNTUK OTOMATISASI PEMBUATAN PASPOR Suhendro Y. Irianto Jurusan Teknik Iinformatika, Fakutas Ilmu Komputer, IBI Darmajaya Jalan . Z.A . Pagar Alam No,93, Bandar Lampung, Lampung
[email protected] ABSTRACT This paper describes the use of face image to identify the originilty of one’s pasport as there is no one has exactly the same face with others. The work explores content based image retriieval technique to build an automatically pasport system fast and accurate. In adition to build the system, System Development Life Cycle method was used. This research was caaried out by using more than 10,000 face images collected from Immigration Class I of the Lampung Province. Content Based Image Retrieval used in this work consis of two algorithms,namely face detection and second face recognition. The experiment shows that the effectiveness of face detection in the range of 0.55 to 0.65 in term of precision. More over in this work, all images (face images) used are in JPEG format as JPEG save more space without losing much quality compared to the original images. Key words: CBIR, SDLC, Pasport, Face detection, Recognition
PENDAHULUAN Latar Belakang Perkembangan teknologi informasi khususnya telah memberikan manfaat dan membantu manusia dalam kehidupan sehari-hari. Namun kemajuan yang pesat di bidang teknologi informasi jugi membawa dampak ariable bagi kehidupan manusia, (Irianto, 2010). Salah satu contoh manfaat teknologi informasi kususnya bidang pengolahan citra atau image ariable g, adalah untuk mencegah terjadinya pembuatan identitas seseorang (KTP atau Paspor) palsu. Banyak sekali terjadi pemalsuan paspor (Aspal) yang digunakan untuk tindakan kejahatan seperti teroris,penipuan, dan korupsi, sebagai contoh adalah kasus Gayus dengan paspor palsunya.
ISBN 978-979-8510-34-2 Prosiding : Seminar Nasional Sains & Teknologi – IV Hotel Marcopolo, Bandar Lampung, 29-30 November 2011 “Peran Strategis Sains & Teknologi dalam Membangun Karakter Bangsa“
Prosiding : Seminar Nasional Sains & Teknologi – IV “Peran Strategis Sains & Teknologi dalam Membangun Karakter Bangsa“
BAGIAN I
Kasus paspor palsu selama ini masih dapat dibuat, karena pencarian data masih berdasarkan teks atau text based retrieval. Disamping untuk mencegah pemalsuan paspor, masih banyak kegunaan bidang image processing ini seperti untuk menentukan atau deteksi pelaku tindak ariable lainya, terosirs, perbuatan asusila, dan lain–lain. Sistem pembuatan paspor sangat penting sekali karena banyak sekali kejahatan yang berskala internasional terjadi karena mudahnya membuat paspor ari (aspal), hal dikarenakan belum digunakannya primary key yang tidak dapat di-hack. Dengan menggunakan wajah sebagi kunci yang sangat unik dan tidak dapat dipalsukan, maka diharapkan tidak akan terjadi pemalsuan paspor, karena tidak ada di dunia ini dua ornag yang memunyai wajah 100% sama. Penelitian ini dikerjakan untuk mencoba menjawab pertanyaan “Bagaimana memanfaatkan CBIR berbasis citra wajah untuk membuat paspor yang akurat dan cepat”. Tujuan dari penelitian ini adalah untuk membuat sistem pembuatan paspor yang cepat, akurat dan unik. Salah satu konstribusi dari penelitian yang telah dikerjakan akan membantu pembuatan paspor yang cepat dan akurat akan sangat berguna sekali bagi kantor Imigrasi dalam menentukan apakah paspor yang dipegang sesorang merupakan paspor asli tapi palsu atau aspal.
Sistem Informasi Dinyatakan oleh Sutanta (Sutanta, 2004) Informasi merupakan hasil pengolahan data sehingga menjadi bentuk yang penting bagi penerimanya dan mempunyai kegunaan sebagai dasar dalam pengambilan keputusan. Hal itu dapat dirasakan akibatnya secara langsung saat itu juga secara tidak langsung pada saat mendatang. Untuk memperoleh informasi, diperlukan adanya data yang akan diolah dan unit pengolah. Sementara itu Sistem informasi adalah adalah suatu sistem di dalam suatu organisasi yang mempertemukan kebutuhan pengolahan transaksi harian, mendukung operasi, bersifat manajerial. Serta kegiatan strategi dari organisasi dan menyediakan pihak luar tertentu dengan laporan–laporan yang di perlukan (Jogyanto, 2005).
142
Seminar Nasional Sains & Teknologi – IV Hotel Marcopolo, Bandar Lampung, 29 – 30 November 2011
Prosiding : Seminar Nasional Sains & Teknologi – IV “Peran Strategis Sains & Teknologi dalam Membangun Karakter Bangsa“
BAGIAN I
Pencarian citra berbasis isi (Content Based Image Retrieval) Content-based image retrieval adalah mencari citra yang mirip dari suatu database berdasarkan fitur-fitur tertentu secara otomatis, (el Bimbo, 1998). Fitur-fitur yang digunakan dalam CBIR antara lain histogram warna, bentuk, dan tekstur (Smeulders, 2000: Inoune, 2004). Teknik pencarian gambar berbasis isi atau CBIR telah banyak menjadi
aria penelitian para ahli dan praktisi baik
perorangan, instusi, dan perusahaan. Database citra banyak digunakan dalam bidang medis, citra satelit, album foto keluarga. Blobworld (Carson et al., 2002) dan PictoSeek Geveres et al., 2000) merupakan contoh dari penggunaan database yang digunakan untuk pencarian citra berbasis isi. Pencarian citra berdasarkan isi telah dengan dikerjakan dengan contoh atau dengan query by example atau QBE (Inoune, 2004). (JPEG) JPEG adalah standar format citra yang sampai saat masih dipakai secara luas baik di Internet maupun alat-alat lain. Terdapat beberapa macam mode telah diperkenalkan oleh Wallace (Wallace, 1991) antara lain mode baseline, lossless, progrssive, dan hirarchical. Sementara itu mode yang paling terkenal adalah mode baseline, di dalam mode ini citra dibagi dalam blok-blok matrik 8X8 dan setiap blok ditransformasikan dengan menggunakan discrete cosine transform (DCT). Menurut Wallace (1991), Algoritmaa JPEG baseline untuk kompresi citra dapat dijelaskan sebagai berikut: (a) pixel awal dari citra dibagi dalam blok-blok matrik 8 x 8 , Bi, yang jumlahnya setiap blok 64 pixel dimana setiap pixel mempunyai nilai dengan kisaran nilai integer dari [0, 2p – 1] samai dengan [-2p-1, 2p-1 -1], (b) setiap blok pixel ( Bi ) diproses dengan Discrete Cosine Transform function 2D yang menghasilkan Blok DCT ( Bi* ), dimana satu koefisien DC coefficient dan 63 koefisien AC , dapat dihitung dengan rumus: F(u, v)
7 1 7 (2x 1)u π (2y 1)v π )cos( ) C(u)C(v)f( x, y) cos( 4 x 0y 0 16 16
Seminar Nasional Sains & Teknologi – IV Hotel Marcopolo, Bandar Lampung, 29 – 30 November 2011
143
Prosiding : Seminar Nasional Sains & Teknologi – IV “Peran Strategis Sains & Teknologi dalam Membangun Karakter Bangsa“
BAGIAN I
dengan keterangan u, v berariasi tergantung arah baris dan kolom, C(u), C(v) = 1
2
for u, v = 0, (c) kuantitasi setiap elemen yang jumlahnya 64 dkerjakan
dengan rumus: FQ
int
Round
F(u,v) Q(u,v)
dan (d) selanjutnya urutan Zigzag dimplementasikan pada koefisien DCT.
METODE PENELITIAN System Developmental Life Cycle Penelitian ini menggunakan metoda penelitian pengembangan (developmental research). Sistem pengembangan yang digunakan dalam penelitan ini addalah dengan Metoda Waterfall Softare Development Life Cycle (Pressman, 2005). Gambar 1 menjelaskan tahapan dalam membangun sistem pembuatan paspor.
Gambar 1. System development life cycle
Ground truth Dalam penelitian ini dibuat database wajah lengkap dengan captionya. Database wajah yang akan dibuat terdiri dari lebih dari 5.000 wajah yang akan dikumpulkan dari kantor imigrasi dan instansi pemerintah lainya.
Pengumpulan data Data dikumpulkan dengan tiga cara, yaitu studi lapangan,dokumentasi, dan wawancara. Data utama untuk penelitian adalah berupa citra wajah yang didapat dari Kantor Imigrasi Kelas I Provinsi Lampung.
144
Seminar Nasional Sains & Teknologi – IV Hotel Marcopolo, Bandar Lampung, 29 – 30 November 2011
BAGIAN I
Prosiding : Seminar Nasional Sains & Teknologi – IV “Peran Strategis Sains & Teknologi dalam Membangun Karakter Bangsa“
Matching citra wajah Matching gambar dalam penelitian adalah dengan menghitung histogram dari koefisien DCT gambar input atau image query dan gambar yang ada dalam database, koefisien kedua citra gambar dihitung selesihnya dengan rumus Eucldien distance (Swain dalam Irianto, 2006).
d (I, M)
n j
min
(I j , M j ) n j 1
M
j
Dimana d adalah selisih jarak antara citra input dan citra dalam database, I adalah koefisien citra input dan M adalah koefisien citra dalam database.
HASIL DAN PEMBAHASAN Pembuatan database dan algoritma pembuatan paspor Dalam penelitian ini digunakan satu database citra wajah sebanyak 2.000 yang diperoleh dari kantor imigrasi dan kelurahan. Data juga diambil dari beberapa kelurahan di Bandar Lampung, yaitu kelurahan Gedong meneng dan kelurahan Rajabasa. Dalam pembuatan paspor ada dua tahapan yang dikerjakan adalah deteksi wajah. Langkah yang pertama bertujuan untuk melokasi daerah (region) wajah agar lebih akurat dalam matching wajah, sedangkan langkah yang kedua adalah matching atau pencarian wajah seseorang untuk menentukan apakah seseorang sudah pernah membuat paspor atau belum.
Teknik deteksi daerah wajah Algoritma dari metoda yang diterapkan dalam penelitian ini adalah dengan mengexplore fitur-fitur yang ada dalam koefisien DCT, dimana setiap koefisien merupakan suatu vektor yang mengandung energi untuk membangung suatu histogram dalam proses matching selama proses pencarian dan pengenalan citra wajah dari database. Urutan atau algoritma teknik ini dijelaskan dalam Gambar 2 dan Gambar 3 sebagai berikut. Gambar 1 menjelaskan bagaimana
Seminar Nasional Sains & Teknologi – IV Hotel Marcopolo, Bandar Lampung, 29 – 30 November 2011
proses
145
Prosiding : Seminar Nasional Sains & Teknologi – IV “Peran Strategis Sains & Teknologi dalam Membangun Karakter Bangsa“
BAGIAN I
alogaritma deteksi citra wajah, sedangkan Gambar 2 merupakan contoh snapshot deteksi wajah dalam pembuatan paspor.
Gambar 2. Algorithma deteksi citra wajah
Gambar 3. Snapshot deteksi daerah wajah untuk pembuatan paspor
Teknik matching citra wajah Image query pada face recognition dapat diambil dari proses face detection atau dapat diambil tanpa proses face detection. Data bese yang dapat diambil pada aplikasi ini maksimum dapat mencapai 2.000 citra dapat diperbesar sampai dengan batas maksimal tipe data
ariable yang digunakan. Sebelum proses DCT
proses pembacaan piksel warna image query dan image database dilakukan, setelah didapat hasil DCT langkah selanjutnya yaitu proses iDCT yang menghasilkan matrik 8 x 8. Proses pembacaan piksel warna, DCT dan DCT
146
Seminar Nasional Sains & Teknologi – IV Hotel Marcopolo, Bandar Lampung, 29 – 30 November 2011
BAGIAN I
Prosiding : Seminar Nasional Sains & Teknologi – IV “Peran Strategis Sains & Teknologi dalam Membangun Karakter Bangsa“
dilakukan secara bersama dan terus-menerus (looping) sampai dengan data base citra terakhir.
Gambar 4. Algoritma pengenalan citra wajah
Seminar Nasional Sains & Teknologi – IV Hotel Marcopolo, Bandar Lampung, 29 – 30 November 2011
147
Prosiding : Seminar Nasional Sains & Teknologi – IV “Peran Strategis Sains & Teknologi dalam Membangun Karakter Bangsa“
BAGIAN I
Citra yang menjadi calon citra query adalah citra yang terdiri dari wajah dan background. Proses face recognition untuk ekspresi wajah akan lebih akurat dilakukan jika citra query-nya hanya citra wajah saja. Untuk memperoleh citra wajah saja diperlukan langkah-langkah pada gambar 4 algoritma face detection. Proses skin detection atau proses mendeteksi warna kulit dapat dilakukan dengen mengubah warna citra dari ruang RGB ke ruang YcrCb. Setelah proses skin detection selesai dilakukan proses selanjutnya adalah mengubah warna citra menjadi hanya dua warna yaitu warna hitam dengan nilai decimal 0 dan warna putih dengan nilai decimal 255. Hal ini dilakukan untuk mempermudah proses edge detection atau deteksi tepi. Warna hitam untuk warna background dan warna putih untuk warna kulit manusia. Kelemahan dari metode seperti ini adalah jika warna background sama dengan warna kulit manusia maka proses face detection tidak akan menghasilkan citra yang hanya terdiri dari citra wajah saja. Proses edge detection ini dilakukan dari sisi kiri citra menuju ke kanan, dari sisi atas citra menuju sisi bawah citra, dari sisi kanan citra menuju sisi kiri citra dan dari sisi bawah citra menuju sisi atas. Porsesnya menggunakan if… then rule artinya jika proses edge detection dari sisi atas menuju sisi atas sudah mendapati warna putih maka proses akan berpindah pada edge detection sisi lain sampai dengan selesai. Gambar 4 contoh snapshot hasil proses face detection, sedangkan Gambar 5 contoh snapshot face recognition.
Gambar 5. Snapshot face recognition pembuatan paspor
148
Seminar Nasional Sains & Teknologi – IV Hotel Marcopolo, Bandar Lampung, 29 – 30 November 2011
BAGIAN I
Prosiding : Seminar Nasional Sains & Teknologi – IV “Peran Strategis Sains & Teknologi dalam Membangun Karakter Bangsa“
Dari peneitian dihasilkan bahwa efektifitas face recognition dengan teknik CBIR berkisar antara 60-80% dalam hal precision. Percision adalah jumlah citra yang relevan (mirip) dibagi dengan jumlah database.
KESIMPULAN DAN SARAN Beberapa kesimpulan yang dapat diambil dari hasil penelitian pengenalan wajah (face recognition) bohong kali ini adalah bahwa citra JPEG dengan ukuran file yang jauh lebih kecil, tidak mengurangi informasi yang ditampilkan. Didalam algoritma yang dipakai dalam penelitian, fitur–fitur wajah dan bukan wajah juga diterapkan sehingga menghasilkan hasil yang cukup akurat. Deteksi wajah pada citra atau face detection dapat diperoleh hasil yang baik cukup dan akurat dalam mengurangi terjadingya paspor ganda, Kelemahan-kelemahan dalam penelitian ini menjadi pertimbangan penulis untuk mengemukakan saran-saran untuk penelitian selanjutnya antara lain: untuk face detection dapat menggunakan metode lain selain edge detection seperti menggunakan Fuzzy Logic atau Neural Network untuk seluruh ruang warna dan many face, sedangkan untuk meningkatkan efektivitas retrieval diperlukan penambahan jumlah database citra wajah baik citra wajah normal maupun citra wajah bohong, membangun proses face recognition secara real time dan menggabungkan teknik pengenalan ini dengan teknik lain dalam mengenali tindak kebohongan seseorang seperti menggabungkan dengan Poligraf dan Handy Truster.
DAFTAR PUSTAKA Carson. C, S. Belongie, H. Greenspan, and J. Malik, Blobworld. 2002. Image Segmentation Using Expectation- Maximization and its Application to Image Querying. IEEE Trans. Pattern Anal. Machine Intell. Vol. 24, No. 8. pp. 1026–1038. Inoue. M and Naonori U. 2005. Retrieving Lightly Annotated Images using Image Similarities. SAC’05. March 13-17, Santa Fe, New Mexico, USA.
Seminar Nasional Sains & Teknologi – IV Hotel Marcopolo, Bandar Lampung, 29 – 30 November 2011
149
Prosiding : Seminar Nasional Sains & Teknologi – IV “Peran Strategis Sains & Teknologi dalam Membangun Karakter Bangsa“
BAGIAN I
Irianto, S. 2010. Sistem Pencarian Citra Wajah Untuk Pengenalan Pelaku Kejahatan Dengan Teknik Content Based Image Retrieval. Prosiding Seminar Nasional SATEK III. Universitas Lampung. Lampung. pp 212-218 Irianto, S., Jiang, J. and Ipson, S.S. 2006. An Efficient Image Retrieval Through DC Feature Extraction. Iasted International Conference On Circuits. Signals and Systems. San Francisco. Irianto,Y.S. and Jiamin, J. 2006. Region Growing Approach For Image Indexing and Retrieval on Compress Domain. Proceedings Of The International Symposium Compimage. Coimbra, Portugal. pp. 213-218. Jogyanto. 2005. Analisis dan Desain Sistim Informasi; Pendekatan Tersetruktur, Andi Offset. Yogyakarta. pp.123-126. Pressman, S. Roger. 2005. Software Engineering. McGraw. Hill. International Edition. pp.23-25. Smeulders, A., M. Worring, S. Santini, A. Gupta and R. Jain. Content-based image retrieval at the end of the early years. IEEE Transactions on Pattern Matching and Machine Intelligence. Vol.22. No. 12. 2000. pp 1349-1379. Sutanta, E. 2004. Sistem Informasi Manajemen. Graha Ilmu Jogyakarta. pp.45-50. Wallace. K. G. 1991. The JPEG still picture compression standard communications of the ACM. Special Issue On Digital Multimedia Systems. Vol 34. Issue 4. pp.30-44.
150
Seminar Nasional Sains & Teknologi – IV Hotel Marcopolo, Bandar Lampung, 29 – 30 November 2011