Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015
7
Korelasi Jarak Wajah Terhadap Nilai Akurasi Pada Sistem Pengenalan Wajah Menggunakan Stereo Vision Camera
Edy Winarno*), Wiwien Hadikurniawati**) Teknik Informatika, Universitas Stikubank E-Mail: *
[email protected], **
[email protected] Abstrak Dalam sistem pendeteksian dan pengenalan wajah, penentuan jarak dan lokasi wajah merupakan penelitian yang terus dikembangkan dalam dalam visi komputer seperti robotika dan sistem navigasi. Estimasi jarak obyek wajah dapat ditentukan dengan menggunakan perhitungan yang dapat dilakukan menggunakan stereo vision camera. Penelitian ini mengembangkan sebuah sistem deteksi dan pengenalan wajah yang dibangun menggunakan sebuah sistem face tracking dan distance estimation dengan menggunakan stereo vision camera. Penelitian ini menggunakan sebuah stereo vision camera yang memiliki 2 buah lensa (right-left) yang digunakan untuk mengukur estimasi jarak terhadap obyek wajah. Hasil dari penelitian menunjukkan bahwa ada korelasi jarak wajah terhadap nilai akurasi pengenalan wajah. Pada jarak antara wajah dengan kamera sekitar 100–200 cm memiliki tingkat akurasi pengenalan wajah antara 90,23% – 97,97 %. Untuk jarak antara dari 200-500 cm dapat dapat menghasilkan tingkat akurasi pengenalan wajah sekitar 36.84% – 86.84% Kata kunci: Pengenalan wajah, distance estimation, stereo vision camera, akurasi pengenalan.
1.
PENDAHULUAN
Diantara bidang ilmu yang menggunakan pengolahan citra dan visi komputer yang saat ini banyak dikembangkan adalah sistem deteksi dan pengenalan wajah manusia. Sistem deteksi wajah merupakan sebuah cara untuk mengenali wajah dari manusia baik pada gambar diam ataupun gambar bergerak seperti video realtime yang diambil dari sebuah kamera atau webcam [1,2,3]. Pendeteksian wajah biasanya menggunakan algoritma yang mampu mengklasifikasikan wajah manusia. Dengan perangkat input image capture seperti kamera dan scanner dapat memungkinkan penelitian di bidang computer vision untuk dijadikan sebagai sistem visual. Salah satu bidang yang saat ini banyak dikembangkan adalah sistem deteksi wajah manusia. Dalam sistem pendeteksian dan pengenalan wajah, penentuan jarak dan lokasi wajah merupakan sebuah penelitian tersendiri yang merupakan pengembangan untuk dapat digunakan selanjutnya dalam kemajuan visi komputer seperti robotika dan
ISBN: 979-26-0280-1
sistem navigasi [5,6]. Estimasi jarak obyek wajah dapat ditentukan dengan menggunakan perhitungan yang dapat dilakukan menggunakan stereo vision camera [7]. Untuk mengukur estimasi jarak obyek wajah dapat dilakukan menggunakan perhitungan jarak proyeksi dari gambar 2 dimensi menjadi gambar 3 dimensi menggunakan 2 buah titik lensa pada stereo vision camera. Pada penelitian ini dikembangkan sebuah sistem deteksi dan pengenalan wajah yang dibangun menggunakan sebuah sistem face tracking dan distance estimation dengan menggunakan stereo vision camera yang berfungsi sebagai alat tracking wajah manusia sekaligus sebagai alat deteksi secara realtime untuk mengetahui lokasi atau jarak obyek terhadap kamera [8]. Pada penelitian ini digunakan sebuah stereo vision camera yang memiliki 2 buah lensa (right-left) yang dapat digunakan untuk mengukur estimasi jarak terhadap obyek wajah. Hasil perhitungan jarak merupakan titik 3D (3Dimension) yang merupakan rekonstruksi atau perhitungan proyeksi 2D (2Dimension)
8
Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015
menggunakan 2 titik lensa (kiri dan kanan) terhadap obyek wajah. Pada langkah selanjutnya dilakukan penambahan sebuah sistem pengenalan wajah (face recognition) seseorang untuk mengetahui identitas seseorang secara tepat dan memiliki akurasi yang tinggi sehingga dapat digunakan untuk menentukan identitas seseorang tersebut. Sistem pengenalan wajah yang dikembangkan dilakukan dengan membandingkan database wajah yang telah disimpan dan dilakukan pelatihan kemudian dilakukan komparasi dengan data wajah pengujian sehingga akan ditemukan kecocokan dan kemiripan yang akan menentukan identitas seseorang tersebut. Pada bagian ekstraksi fitur menggunakan Principal Component Analysis (PCA), sedangkan pada bagian klasifikasi menggunakan metode Euclidean distance.
2. USULAN METODE Model secara umum dari penelitian ini dapat ditunjukkan pada Gambar 1.
Gambar 1. Gambaran Umum Sistem Penelitian ini merupakan sebuah sistem deteksi wajah dan pengenalan wajah yang dilengkapi dengan estimasi jarak wajah antara wajah yang terdeteksi dengan kamera. Pengenalan wajah dilakukan dengan menggunakan Principal Component Analysis (PCA) pada bagian ekstraksi, dan menggunakan Euclidean distance pada bagian klasifikasi. Pengenalan wajah dilakukan dengan membandingkan data pelatihan citra wajah yang disimpan dalam basis data citra wajah dibandingkan dengan data uji citra wajah. 2.1. Face tracking Penelitian ini menggunakan model Haar Cascade Classifier [9] untuk melokalisir posisi wajah yang tertangkap oleh stereo vision camera seperti yang ditunjukkan pada Gambar 2.
Gambar 2. Stereo vision camera Pada proses ini dilakukan pelacakan citra wajah dengan menandai area wajah dengan ukuran yang berlainan berdasarkan titik pusat posisi wajah yang ditemukan oleh classifier. Pada proses ini dilakukan preprocessing menggunakan proses cropping, RGB-Gray, resizing, dan contrastbrightness adjustment menggunakan histogram equalization[10]. Metode preprocessing ini digunakan untuk meningkatkan ketajaman gambar supaya dapat mengantisipasi adanya variasi iluminansi cahaya yang digunakan. 2.2. Distance estimation Citra wajah yang telah diproses pada bagian face tracking kemudian diproses pada bagian distance estimation untuk menentukan jarak antara wajah dengan kamera secara realtime. Pemrosesan pada bagian ini menggunakan sebuah stereo vision camera dengan dua buah lensa yang berfungsi sebagai penangkap citra wajah dan untuk menentukan titik 3D hasil proyeksi pada kedua lensa kameranya. Metode yang digunakan untuk menentukan jarak wajah dengan kamera menggunakan metode stereo triangulation [11,12]. Penelitian ini menggunakan metode pengambilan gambar yang dilakukan oleh 2 buah titik lensa untuk mengetahui proyeksi gambar dari 2 sudut yang berbeda, sehingga bisa ditentukan perhitungan untuk mengetahui estimasi jarak obyek yang dicari. Model pengambilan gambar pada stereo vision camera yang digunakan pada penelitian ini ditunjukkan pada Gambar 3.
Gambar 3. Penentuan jarak pada distance estimation [8]
ISBN: 979-26-0280-1
Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015
Distance estimation merupakan pengukuran estimasi jarak antara obyek wajah yang telah terdeteksi menggunakan stereo vision camera yang digunakan. Jika pada kamera stereo vision memiliki 2 buah lensa camera (C, C’) untuk menangkap gambar obyek pada titik yang sama yaitu pada titik S, sedangkan lokasi titik pada 2 posisi yaitu titik A dan A’ pada frame gambar adalah proyeksi dari titik S pada frame camera, F adalah panjang fokus lensa (focal length) stereo vision camera yang digunakan, a merupakan jarak antara titik tengah dengan masing-masing kamera atau a=T/2, dan selisih jarak antara garis A dan A’ dengan garis sumbu normal kamera dinyatakan dengan disparitas U dan U, maka untuk menentukan jarak Z yang merupakan jarak antara kamera dengan obyek wajah yang ditangkap dapat dijelaskan seperti pada persamaan (1) [8]. (1) 2.3 Face recognition Tiga tahap utama dalam proses pengenalan wajah adalah preprocessing, feature extraction dan classification. Tiga bagian ini dapat dijelaskan pada Gambar 4.
Gambar 4. Blok diagram face recognition 2.3.1 Preprocessing Pada bagian preprocessing ini meliputi resizing ukuran citra wajah yang telah dideteksi menjadi ukuran piksel 160x160, proses resizing ini digunakan untuk membuang daerah selain wajah sehingga hanya bagian wajah saja yang akan diproses. Kemudian dilakukan proses perubahan dari gambar RGB ke grayscale, dan digunakan proses histogram equalization untuk memperbaiki kualitas citra input agar memudahkan proses pengenalan tanpa menghilangkan informasi utamanya. Pada bagian akhir dari preprocessing ini dilakukan proses contrast-brightness adjustment dan beberapa model pengolahan citra yang lain
ISBN: 979-26-0280-1
9
untuk meningkatkan ketajaman gambar dan untuk mengantisipasi adanya variasi iluminansi yang akan muncul pada saat penangkapan citra wajah. 2.3.2 Feature Extraction Pada bagian ekstraksi fitur pada sistem pengenalan wajah ini akan digunakan metode PCA. PCA digunakan sebagai metode untuk ekstraksi ciri dan representasi data yang banyak diterapkan dalam teknik pengenalan pola. Informasi yang relevan dari data yang disimpan selanjutnya dilakukan tahap penghitungan eigenvalue dan eigenvector dari citra wajah keseluruhan maupun dari elemen wajah. 2.3.3 Classification Pada bagian Classification digunakan metode Euclidean Distance untuk menentukan tingkat kemiripan antar fitur untuk menghasilkan pengenalan wajah yang lebih optimal. Hipotesa awal dari penelitian ini akan menghasilkan sebuah model Face Recognition yang handal karena didukung dengan penggunaan Euclidean Distance sebagai klasifikasi yang akan mempengaruhi terhadap kualitas identifikasi wajah. 2.4 Output Output yang dihasilkan dalam penelitian ini adalah sebuah model pengembangan dan penggabungan dari beberapa model framework baru dari face tracking, distance estimation dan face tracking, yang memiliki kecepatan tinggi dalam pendeteksian wajah, mampu mengenali atau mengidentifikasi obyek wajah yang terdeteksi menggunakan stereo vision camera.
3. HASIL DAN PEMBAHASAN 3.1 Pembahasan pada face tracking Pada bagian face tracking dilakukan beberapa proses pendeteksian wajah yang diawali dengan proses image acquisition menggunakan stereo vision camera, kemudian dilakukan pencarian terhadap citra wajah yang telah ditangkap menggunakan metode Haar cascade classifier, dan selanjutnya dilakukan pengolahan citra wajah yang telah terdeteksi menggunakan metode preprocessing sehingga akan menghasilkan informasi citra wajah yang siap digunakan untuk diproses pada bagian face recognition. Proses akuisisi citra wajah dilakukan menggunakan stereo vision camera dan menghasilkan 2 buah citra yaitu pada bagian
10
Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015
kiri dan kanan. Kedua citra wajah hasil penangkapan pada bagian kiri dan kanan menggunakan stereo vision camera ini selanjutnya akan diproses pada bagian preprocessing. Hasil dari pemrosesan kedua citra wajah pada bagian kiri dan kanan ini nanti selanjutnya yang akan digunakan untuk mengetahui wajah siapa saja yang dikenali pada bagian face recognition dan untuk menentukan jarak antara wajah dengan kamera pada bagian distance estimation. Contoh hasil akuisisi citra wajah pada bagian face tracking menggunakan stereo vision camera dapat dilihat pada Gambar 5.
Gambar 5. Hasil deteksi pada bagian face tracking 3.2 Pembahasan pada distance estimation Distance estimation merupakan pengukuran jarak antara wajah dengan kamera menggunakan rumus yang telah dijelaskan pada persamaan (1). Percobaan dilakukan dengan melakukan pengukuran jarak wajah antara 50-650 cm. Hasil percobaan diperoleh dari perbandingan jarak yang diukur secara manual dan hasil perhitungan yang dihasilkan oleh bagian distance estimation ini. Hasil dari pengukuran jarak wajah dapat dilihat pada Tabel 1. Tabel 1. Hasil pengukuran pada distance estimation Distance (cm) 50 100 150 200 250 300 350 400 450 500 550 600 650
Estimated Distance (cm) 51.00 101.00 149.40 197.40 246.00 294.30 341.60 388.40 435.15 481.00 526.90 571.20 616.20
ISBN: 979-26-0280-1
3.3 Pembahasan pada feature extraction Metode PCA yang digunakan pada penelitian ini dapat menghasilkan hasil ekstraksi ciri dari citra wajah yang sebelumnya diproses pada tahap preprocessing. Contoh citra wajah yang diambil dari preprocessing dengan ukuran 160x160 piksel dapat ditunjukkan pada Gambar 6.
Gambar 6. Citra hasil preprocessing Dalam proses PCA yang dilakukan pada penelitian ini, sekumpulan citra wajah yang telah diproses pada bagian wavelet direpresentasikan dalam sebuah vektor ciri yang merupakan matriks berukuran m x n. Vektor ciri dari beberapa citra wajah diperoleh dengan cara merangkaikan kolomkolom pada setiap citra wajah menjadi sebuah vektor kolom. Kolom kedua dirangkaikan setelah kolom pertama, dilanjutkan dengan kolom ketiga dan seterusnya hingga hanya terdapat satu kolom. Kolom tersebut merupakan sebuah kolom panjang yang memiliki panjang sesuai dengan jumlah piksel pada sebuah citra wajah tersebut ( i x j ). Setiap kolom panjang yang merupakan representasi dari sebuah citra wajah kemudian diatur bersebelahan dengan citra wajah – citra wajah lainnya yang telah tersusun menjadi vektor kolom juga. Banyaknya kolom yang berjajar merupakan jumlah citra wajah yang digunakan pada penelitian ini. Matriks baru yang telah dihasilkan dari proses tersebut tersusun menjadi sebuah matriks m x n. Pada pemrosesan menggunakan PCA, citra wajah diproses menggunakan tahapantahapan yang dilakukan pada PCA dan selanjutnya dilakukan proses pembelajaran atau training pengenalan wajah. Citra wajah yang telah disimpan selanjutnya dilakukan tahap penghitungan eigenvalue dan eigenvector dari citra wajah keseluruhan maupun dari elemen wajah. Pada tahap ini dilakukan proses lokalisasi elemen wajah. Sifat simetri wajah dapat digunakan membantu proses PCA ini. Setiap eigenvector memiliki nilai yang sama seperti
11
Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015
citra asli dan dapat dilihat sebagai sebuah gambar. Eigenvector ini merupakan covariance matriks dan disebut sebagai eigenface. Nilai dari eigenvector semua citraakan disimpan sebagai gambar eigenfaces. 3.4 Pembahasan pada classification Metode klasifikasi yang digunakan pada sistem pengenalan wajah pada penelitian ini menggunakan Euclidean distance. Pada identifikasi wajah, Euclidean distance digunakan untuk membandingkan citra wajah yang diambil oleh kamera dengan citra wajah yang telah diproses dan disimpan dalam database. Euclidean distance digunakan untuk menguji dan mengetahui perbedaan terkecil antara citra pengujian dan citra hasil training, sehingga pada tahap ini dapat dilakukan pengenalan wajah dengan menguji citra wajah yang digunakan. Hasil perbedaan terkecil dari perbandingan antara fitur pengujian dan fitur hasil pelatihan akan menentukan identitas wajah. 3.5 Pengujian akurasi pengenalan wajah Pengujian akurasi pengenalan wajah dilakukan untuk mengetahui tingkat akurasi pengenalan wajah dalam mengenali wajah orang. Pengujian ini dilakukan dengan menggunakan ekstraksi fitur PCA. Pada bagian klasifikasi digunakan metode Euclidean distance. Pengujian dilakukan terhadap 36 orang yang berbeda dengan pengambilan pose untuk disimpan dalam database wajah tiap orang adalah antara 10 pengambilan citra wajah untuk masing-masing orang sebagai data trainingnya. Pengujian dilakukan pada masing-masing wajah dilakukan sebanyak 10 kali berdasarkan pose pengambilan yang berbeda-beda. Pengujian dilakukan dengan membandingkan tingkat akurasi pengenalan wajah (recognition rate). Pengujian akurasi pengenalan wajah pada citra dilakukan untuk mengetahui hasil akurasi pengenalan wajah. Berikut ini adalah tabel hasil pengujian akurasi pengenalan wajah untuk masing-masing orang seperti ditunjukkan pada Tabel 2.
ISBN: 979-26-0280-1
Tabel 2. Hasil pengukuran akurasi wajah pada 36 orang dengan masing-masing 10 pose pengujian (dalam %) No 1 2 3 4 5 6 7 8 9 10 Rerata
Pose Normal Miring kiri Miring kanan Putar kiri Putar kanan Menunduk Mendongak Ekspresi senang Ekspresi sedih Ekspresi terkejut
Akurasi 100.00 97.22 97.22 94.44 97.22 97.22 94.44 97.22 94.44 91.67 96.11
Berdasarkan hasil penelitian yang telah dilakukan dapat diketahui bahwa tingkat akurasi pengenalan wajah pada citra wajah akan menghasilkan tingkat akurasi yang berbeda-beda tergantung dari masing-masing ekspresi wajah. Citra wajah yang diproses menggunakan Euclidean distance memiliki tingkat akurasi pengenalan wajah tertinggi sekitar 96,11%. 3.6 Korelasi antara jarak wajah dengan akurasi pengenalan wajah Dari hasil pengujian pada akurasi pengenalan wajah dan pengukuran jarak wajah dapat dibuat sebuah korelasi hubungan antara keduanya. Korelasi ini menjelaskan tentang tingkat akurasi pengenalan wajah pada sistem pengenalan wajah menggunakan metode PCA-Euclidean terhadap estimasi jarak wajah (distance estimation) yang dilakukan pada penelitian ini. Hasil pengujian yang telah dilakukan pada penelitian dapat menghasilkan sebuah tabel yang menjelaskan hubungan antara jarak wajah dengan akurasi pengenalan wajah seperti yang ditunjukkan pada Tabel 3. Tabel 3. Korelasi antara estimasi jarak (wajah-kamera) dengan akurasi pengenalan wajah Distance (meter) 0.60 0.70 0.75 0.80 0.90 1.00 1.25 1.50 1.75 2.00 2.50 3.00 3.50 4.00 4.50 5.00
Recognition Rate (%) 99.91 99.49 99.26 99.02 98.52 97.97 96.42 94.62 92.55 86.84 78.95 71.05 65.79 52.63 47.37 36.84
12
Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015
Dari di atas dapat diketahui jika pada jarak yang relatif dekat antara 0.6 - 1.0 meter akan menghasilkan rata-rata akurasi pengenalan wajah yang cukup tinggi yaitu sekitar 99%. Pada jarak antara wajah dengan kamera sekitar 1.0 – 2.0 meter memiliki tingkat akurasi pengenalan wajah antara 90.23% – 97.97 %. Untuk jarak lebih dari 2.0 – 5.0 meter dapat diketahui tingkat akurasi pengenalan wajah antara 36.84% – 86.84%.
4. KESIMPULAN Penelitian yang telah dilakukan ini menghasilkan sebuah model tentang sistem deteksi wajah, pengenalan wajah dan pengukuran jarak wajah yang dapat bekerja dengan baik dan mampu menghasilkan akurasi pengenalan wajah yang tinggi serta estimasi jarak wajah yang maksimal. Jarak ideal untuk menghasilkan sebuah pengenalan wajah yang akurat adalah antara 50-350 cm. Pada jarak yang relatif dekat antara 60-100 cm dapat menghasilkan rata-rata akurasi pengenalan wajah sekitar 99%. Pada jarak antara wajah dengan kamera sekitar 100–200 cm memiliki tingkat akurasi pengenalan wajah antara 90,23% – 97,97 %. Untuk jarak lebih dari 2,0 – 5,0 meter dapat dapat menghasilkan tingkat akurasi pengenalan wajah sekitar 36.84% – 86.84%.
5. REFERENSI [1] Yang, M., 2002, Detecting faces images: A survey, IEEE Transactions on Pattern Analysis and Machine Inteligence, vol. 24 no. 1, pp.34 [2] Zhao, X., Hui, Y., 2009, Face Tracking Based on Fusion Skin Color Model and Optical Flow Algorithm, International Conference on Wireless Networks and Information Systems Issue Date:December 2009 pp. 89-92 [3] Martinez-Gonzalez, A. N., & AyalaRamirez, V., 2011, Real Time Face Detection Using Neural Networks. In Artificial Intelligence (MICAI), 2011 10th Mexican International Conference on (pp. 144-149). IEEE. [4] Wei, W., Zhang, Y., Lin, Z., 2009, Illumination Invariant Multi-pose Face Tracking, Fifth International Conference on Image and Graphics.
ISBN: 979-26-0280-1
[5] Lamża, A., Wróbel, Z., Dziech, A., 2013, Depth Estimation in Image Sequences in Single-Camera Video Surveillance Systems, Multimedia Communications, Services and Security Communications in Computer and Information Science, Vol. 368, pp 121-129 [6] Joglekar, A., Joshi, D., Khemani, R., Nair, S., Sahare, S., 2011, Depth Estimation Using Monocular Camera, (IJCSIT) International Journal of Computer Science and Information Technologies, Vol. 2 (4) , 1758-1763 [7] Saxena, A., Schulte, J., Andrew, Y., 2007, Depth Estimation using Monocular and Stereo Cues, International Joint Conferences on Artificial Intelligence (IJCAI). [8] Winarno, E., Harjoko, A., Arymurthy, A., M., Winarko, E., 2014, Development of Face Recognition System and Face Distance Estimation Using Stereo Vision Camera, Journal of Theoretical and Applied Information Technology, Vol. 67 No.3, ISSN: 1992-8645, pp. 652-657. [9] Viola and Jones, 2001, "Rapid object detection using a boosted cascade of simple features", Computer Vision and Pattern Recognition. [10] Winarno, E., Harjoko, A., Arymurthy, A., M., Winarko, E., 2014, Improved Real-time Face Recognition Based On Three Level Wavelet Decomposition – Principal Component Analysis, Journal of Computer Science 10 (5): 844-851, 2014, [11] Holzmann, C., & Hochgatterer, M., 2012, Measuring distance with mobile phones using single-camera stereo vision. In Distributed Computing Systems Workshops (ICDCSW), 32nd International Conference on (pp. 88-93). IEEE. [12] Budiharto, W., Santoso, A., Purwanto, D., & Jazidie, A. (2011). Multiple moving obstacles avoidance of service robot using stereo vision. TELKOMNIKA (Telecommunication Computing Electronics and Control), 9(3), 433-444.