JURNAL INFORMATIKA HAMZANWADI Vol. 2 No. 1, Mei 2017, hal. 81-90
ISSN: 2527 - 6069
PENERAPAN PCA DAN K-NN UNTUK MENINGKATKAN NILAI AKURASI PENGENALAN WAJAH Yahya1, Indra Gunawan2, Bambang Harianto3 1,2,3 Universitas Hamzanwadi
[email protected]
Abstrak Proses pengenalan wajah membutuhkan algoritma dan metode yang tepat didalam meningkatkan daya jelajah dan tingkat akurasi dari suatu masalah yang diteliti. Peningkatan daya jelajah dan akurasi, disamping metode yang digunakan, dibutuhkan suatu algoritma atau langkah-langkah sistematis dalam proses penyelesaiannya. Pada kasus ini, dicoba untuk meningkatkan daya jelajah dengan meningkatkan nilai akurasi terhadap pengenalan wajah berdasarkan nilai jarak menggunakan kombinasi “nearest neighbour classification” dengan Principal Component Analysis, dimana hasil penelitian berdasarkan paper review tahun 2013 diketahui bahwa akurasi yang diperoleh menggunakan Principal Component Analysis dan K_nearest Neighbor menggunakan ORL Database mencapai 90.50 %. Pada penelitian ini dilakukan peningkatan nilai akurasi penggunaan metode K_Nearest Neighbor dan Principal Component Analysis (PCA) berdasarkan perhitungan nilai jarak terdekat menggunakan dataset dari ORL Database. Kata kunci: Nearest Neighbor Clasification, Principal Component Analysis, Datasets, Accurasy, Euclidean Distance.
PENDAHULUAN Banyak metode yang sudah dikembangkan oleh para peneliti seperti beberapa jenis teknologi biometrik antara lain : pengenalan wajah (face recognition), pengenalan suara (voice recognition) dan pengenalan tulisan tangan (handwriting recognition). Metode-metode pengenalan wajah untuk mengidentifikasi dan verifikasi wajah dapat dilakukan dengan beberapa cara, antara lain : metode Eigenface, metode Neural Networks, metode Fisherfaces, metode Elastic Bunch Graph Matching, metode Template matching, dan metode Geometrical feature matchi. Proses pengenalan wajah membutuhkan cara dan metode yang tepat didalam meningkatkan daya jelajah dan tingkat akurasi dari suatu masalah yang diteliti. Peningkatan daya jelajah dan akurasi, disamping metode yang digunakan, dibutuhkan suatu algoritma atau langkah-langkah sistematis dalam proses penyelesaiannya. Pada kasus ini, dicoba untuk meningkatkan daya jelajah dan akurasi pengenalan wajah menggunakan kombinasi KNN dengan Principal Component Analysis (PCA). Hal ini dilakukan karena adanya perbaikan dalam meningatkan akurasi menggunakan PCA dengan menggunakan nilai pendekatan “Euclidean Distance”, 81
Yahya, Indra Gunawan, Bambang Harianto
dimana hasil penelitian sebelumnya berdasarkan paper review tahun 2013 adalah menghasilkan akurasi 90.50%[5] dengan menggunakan ORL database. Peningkatan akurasi pengenalan wajah dapat dilakukan dengan berbagai cara seperti peningkatan akurasi dengan memperhatikan nilai koefisien (k), peningkatan akurasi dengan memperhatikan nilai jarak terdekat. Peningkatan akurasi dengan menggunakan nilai jarak terdekat dapat dilakukan dengan banyak cara antara lain : Correlation, Euclidean Distance, Cosine, Cityblock, Mahalinobis, Mahalinobis Cosine, dll. Dalam penelitian ini, dilakukan peningkatan nilai akurasi pengenalan wajah menggunakan kombinasi PCA + K_NN berdasarkan nilai jarak terdekat menggunakan metode “Euclidean Distance” untuk mendapatkan nilai akurasi yang lebih tinggi dari 90.50%.
Riset atau penelitian merupakan sebuah aktifitas yang terstruktur, membutuhkan pemikiran yang sistematis untuk memecahkan suatu masalah, memperbaiki algoritma atau metode penyelesaian dari berbagai macam kasus, mengembangkan hasil yang sudah ada untuk terus melakukan perbaikan. Riset atau penelitian tidak mutlak mengukur kuantitas penelitian, namun lebih menekankan pada sejauh mana kontribusi yang telah dan bisa dilakukan dalam meningkatkan perbaikan. Besar kecilnya hasil riset atau penelitian tergantung pada penggunaan algoritma atau metode, ketepatan dalam pengambilan keputusan (metode atau algoritma) dan ke-akuratan data yang digunakan. Semakin banyak data yang digunakan dan dijadikan sebagai dasar dalam melakukan penelitian, maka semakin baik hasil riset yang akan didapatkan[11]. Pada dasarnya, penelitian itu muncul karena manusia
selalu ingin tahu sehingga bisa
mendorongnya untuk bertanya dan juga mencari jawaban dari pertanyaan tersebut. Penelitian sering diidentikkan dengan beberapa hal antara lain: proses pengumpulan informasi dan pengumpulan data, kajian dokumentasi, studi pustaka, perubahan produk, perubahan metode atau cara, perubahan algoritma, pengembangan metode, dan lain sebagainya. Dari beberapa konsep di atas, maka ditarik definisi riset atau penelitian adalah : -
Penelitian merupakan suatu proses yang dilakukan secara sistematis dengan cara melakukan pengumpulan data, pengolahan data dan melakukan analisis terhadap data.
-
Penelitian merupakan suatu proses ilmiah yang didalamnnya mencakup sifat intensif dan formal yang disebabkan karena adanya ikatan terkait dengan urutan, aturan dan cara 82
PENERAPAN PCA DAN K-NN UNTUK MENINGKATKAN NILAI AKURASI PENGENALAN WAJAH
penyajian supaya menghasilkan sesuatu yang baik untuk kemajuan ilmu pengetahuan dalam upaya meningkatkan kehidupan. Pengenalan wajah (Face Recognition) telah menjadi wilayah penelitian yang populer. Dalam penelitian pengenalan wajah menggunakan visi komputer (Computer Vision) dan merupakan salah satu aplikasi yang paling sukses dari analisis gambar dan pengertian. Karena masalah face recognition ini, maka tidak hanya peneliti dari disiplin ilmu komputer saja yang tertarik didalamnya, akan tetapi ahli saraf dan psikolog pada akhirnya melalukan penelitian yang sama sehingga memberikan warna yang sangat bervariasi[12]. Penelitian dalam face recognition, dapat diarahkan pada beberapa bagian antara lain : -
Pengakuan dari gambar wajah luar ruangan.
-
Pengakuan dari gambar wajah non-frontal.
-
Memahami mengapa laki-laki lebih mudah untuk mengenali daripada perempuan.
-
Pemahaman yang lebih besar dari efek faktor demografi terhadap kinerja.
-
Pengembangan metode statistik yang lebih baik untuk memahami kinerja.
-
Mengembangkan model yang lebih baik untuk memprediksi kinerja identifikasi pada galeri yang sangat besar.
-
Pengaruh algoritma dan sistem pelatihan terhadap kinerja kovariat.
-
Integrasi model morphable menjadi kinerja pengenalan wajah.
Kerangka Pemikiran
83
Yahya, Indra Gunawan, Bambang Harianto
METODE PENELITIAN Tahapan-tahapan Penelitian Penelitian yang dilakukan merupakan penelitian eksperimen dengan menggunakan tahapan-tahapan penelitian : Studi Literatur (Studi literatur digunakan untuk mendapatkan pengetahuan tentang pengolahan citra diantaranya pre-procecing, ektrasi fitur dan klasifikasi atau identifikasi dan mendapatkan informasi-informasi penelitian sebelumnya tentang pengenalan wajah yang sudah dilakukan). Design Penelitian (Design penelitian merupakan bagian dari proses jalannya penelitian yang akan dilakukan dalam pengembangan system). Tahapan-tahapan rangkaian design penelitian yang akan dilakukan sebagai berikut : 1) Pengumpulan Data (Pada bagian pengumpulan data, dijelaskan tentang bagaimana data
penelitian diperoleh, darimana data diperoleh dalam penelitian ini, jenis data yang digunakan apakah data primer dan data sekunder. Data primer adalah data yang diperoleh melalui pengamatan langsung atau hasil penelitian terhadap studi objek sedangkan data sekunder adalah data yang diperoleh dari pihak lain atau instansi terkait, dengan kata lain menggunakan data yang telah ada. Database yang digunakan terbagi menjadi 40 bagian dengan masing-masing bagian terdiri dari 10 gambar sehingga jumlah keseluruhan gambar adalah 400 gambar). 2) Pengolahan awal data (Pada bagian ini, data yang telah diperoleh dari berbagai sumber
ataupun data yang diproleh dari satu sumber, akan dibagi menjadi beberapa kelompok, tiap kelompok terdiri dari 10 data dengan 10 posisi yang berbeda. Untuk memudahkan membaca data yang digunakan, maka seluruh data yang berupa gambar dibuat dalam bentuk “.pgm”. Tiap-tiap bagian dibagi menjadi 2 bagian yaitu sebagai data training dan sebagian lagi menjadi data testing, dengan komposisi: 30% sebagai data training dan 70% data testing, 40% data training dan 60% sebagai data testing, 50% data training dan 50% data testing, 60% sebagai data training dan 40% sebagai data testing). 3) Penentuan metode yang digunakan (Metode yang digunakan untuk mengolah data yang
diperoleh dari data publik yang diaktegorikan sebagai data sekunder adalah metode Klasifikasi Nearest Neighbor dan Principal Component Analysis. Klasifikasi Nearest Neighbor dalam penentuan komponen terdekat dapat dilakukan dengan menggunakan berbagai cara antara lain : CityBlock, Correlation, Covariance, Mahalinobis CityBlock, Mahalinobis Euclidean, Hellinger, Canberra, Czekanowski, Euclidean Distance dan Mahalinobis Cosine). 84
PENERAPAN PCA DAN K-NN UNTUK MENINGKATKAN NILAI AKURASI PENGENALAN WAJAH
4) Eksperimen dan Pengujian Metode (Eksperimen dan pengujian metode dilakukan beberapa
kali dan mengacu pada pengolahan awal data. Eksperimen dilakukan sebanyak 4 kali dan penelitian ini, penulis menfokuskan perhitungan jarak terdekat dengan menggunakan satu cara yaitu : EUC(Euclidean Distance). Hasil eksperimen dijadikan sebagai bahan dalam melakukan analisa dan pembahasan.
Pengumpulan Data Kegiatan dalam penelitian tidak akan terlepas dari keberadaan data yang merupakan bahan baku informasi untuk memberikan gambaran spesifik mengenai obyek penelitian. Data adalah fakta empirik yang dikumpulkan oleh peneliti untuk kepentingan memecahkan masalah atau menjawab pertanyaan penelitian. Data penelitian dapat berasal dari berbagai sumber yang
dikumpulkan dengan menggunakan berbagai teknik selama kegiatan penelitian
berlangsung. Proses pengumpulan data dan informasi merupakan tahap awal dari penelitian yang dilakukan. Suatu penelitian tidak akan bisa dilakukan apabila data yang digunakan tidak sempurna. Data yang digunakan dalam penelitian ini adalah data sekunder yaitu data yang diperoleh atau dikumpulkan peneliti dari berbagai sumber yang telah ada (peneliti sebagai tangan kedua). Data sekunder dapat diperoleh dari berbagai sumber seperti Biro Pusat Statistik (BPS), buku, laporan, jurnal, dan lain-lain. Penelitian ini menggunakan data publik yang dapat diakses oleh siapapun yang ingin melakukan penelitian. Data yang digunakan diambil dari ORL Database. Dataset yang diambil dari “ORL Database” terdiri dari 40 kelompok gambar wajah, tiap kelompok terbagi menjadi 10 gambar wajah dengan berbagai posisi, sehingga diperoleh gambar wajah yang digunakan sebanyak 400 gambar yang digunakan untuk melakukan penelitian. Keseluruhan gambar wajah ini, akan dibagi menjadi data training dan data testing sesuai dengan komposisi yang telah ditetapkan dan akan digunakan dalam proses pengolahan data[18].
Metode yang diusulkan Metode yang akan diusulkan dalam penelitian ini menggunakan metode PCA (Principal Component Analysis) untuk proses ekstrak fitur dan metode klasifikasi K-NN yang digunakan untuk melakukan proses klasifikasi data sehingga diperoleh nilai akurasi yang diinginkan. 85
Yahya, Indra Gunawan, Bambang Harianto
Metode pengukuran ini bertujuan untuk menentukan tingkat akurasi dalam proses pengenalan wajah yaitu melalui proses ekstraksi gambar dengan Principal Component Analysis sampai dengan proses klasifikasi menggunakan K_Nearest Neighbor menggunakan tahapan-tahapan sebagai berikut: 1) Data gambar wajah diambil dari Olivetti Research Laboratorium (ORL) Database. 2) Wajah diambil dengan beberapa variasi yang terdiri dari seluruh training image. Dataset wajah yang digunakan terdiri dari 40 kelompok gambar wajah dengan masing-masing 10 variasi. 3) Proses preprocessing bertujuan merubah RGB to Grey (merubah data gambar ke bentuk keabuan). 4) Lakukan proses crooping (pemotongan) yang bertujuan untuk memotong bagian-bagian gambar/latar/background jika ada gambar yang tidak diperlukan. 5) /Melakukan partisi dataset baik ORL database, dengan cara membagi data menjadi dua yaitu data trainning dan data testing. Pada penelitian ini penentuan tingkat akurasi pengenalan. 6) Melakukan ekstraksi gambar wajah dengan algoritma PCA.
Tools yang digunakan Proses pengolahan gambar untuk mendapat data numeric pada penelitian ini, menggunakan program Mathlab. Untuk mengekstraksi gambar menggunakan kombinasi PCA + K_NN yang sudah disediakan pada toolbox. Toolbox yang dipakai dalam penelitian ini menggunakan PhD Toolbox dari Vitomir Struc tahun 2012, dimana toolbox ini hanya digunakan untuk membantu mendapat data antara matrik yang satu dengan yang lain, dengan komposisi PCA+K_NN+Euc.
HASIL PENELITIAN DAN PEMBAHASAN Hasil Pengujian Metode yang digunakan dalam dalam penelitian terhadap pengujian data menggunakan metode PCA untuk ekstraksi fitur dan metode K_Nearest Neighbor (KNN) menggunakan Euclidean Distance sebagai klasifikasi pada ORL database untuk mencari nilai kedekatan fitur training dan testing.
86
PENERAPAN PCA DAN K-NN UNTUK MENINGKATKAN NILAI AKURASI PENGENALAN WAJAH
1) Menggunakan 30% data training dan 70% data testing. Pengujian yang dilakukan dengan menggunakan 30% yang dijadikan sebagai data training (120 gambar) dan 70% (280 gambar) yang dijadikan sebagai data testing dari 400 gambar yang dijadikan datasets, memperoleh hasil 85.36%. 2) Menggunakan 40% data training dan 60% data testing. Pengujian yang dilakukan dengan menggunakan 40% yang dijadikan sebagai data training (160 gambar) dan 60% (240 gambar) yang dijadikan sebagai data testing dari 400 gambar yang dijadikan datasets, memperoleh hasil 88.33%. 3) Menggunakan 50% data training dan 50% data testing. Pengujian yang dilakukan dengan menggunakan 50% yang dijadikan sebagai data training (200 gambar) dan 50% (200 gambar) yang dijadikan sebagai data testing dari 400 gambar yang dijadikan datasets, memperoleh hasil 91.00%. 4) Menggunakan 60% data training dan 40% data testing. Pengujian yang dilakukan dengan menggunakan 60% yang dijadikan sebagai data training (240 gambar) dan 40% (160 gambar) yang dijadikan sebagai data testing dari 400 gambar yang dijadikan datasets, memperoleh hasil 95.63%.
a. Rekapitulasi akurasi hasil pengujian Tingkat Akurasi yang diperoleh
Jenis Percobaan
PCA+KNN+ Euc
3 image trainning, 7 image test 4 image trainning, 6 image test Database 5 image trainning, 5 image test 6 image trainning, 4 image test
85.36% 88.33% 91.00% 95.63%
ORL
b. Pembahasan Dari data hasil pengujian yang dilakukan terhadap 2 kelompok pengujian dengan melakukan 4 kali percobaan, dapat dilakukan beberapa analisa terhadap hasil yang diperoleh. Analisa yang dilakukan terhadap beberapa hal antara lain : hasil pengujian data menggunakan ORL Database. Hasil pengujian dengan mengambil input dataset dari ORL Database, memberikan beberapa gambaran : 87
Yahya, Indra Gunawan, Bambang Harianto
1) Pengujian yang dilakukan dengan menggunakan algoritman PCA + KNN + Euc diperoleh hasil sebagai berikut :
3 images data training dan 7 images data testing
menghasilkan akurasi sebesar 85.36%, 4 images data training dan 6 images data testing menghasilkan 88.33%, 5 images data training dan 5 images data testing menghasilkan 91.00%, 6 images data training dan 3 images data testing menghasilkan 95.63%. 2) Semakin besar dataset yang dijadikan sebagai data training, maka data testing akan berkurang. Apabila data training semakin diperbanyak, maka nilai akurasi cenderung akan semakin besar. Hal ini dibuktikan dengan nilai akurasi yang diperoleh. Dari hasil pengujian menggunakan ORL dataset, maka dapat disimpulkan bahwa nilai akurasi tertinggi dihasilkan oleh kombinasi algoritma PCA + KNN + Euc dengan 60% data training sebesar 95.63%.
KESIMPULAN Dari hasil pengolahan datasets berupa gambar menggunakan KNN dan PCA, dapat ditarik beberapa kesimpulan antara lain : 1) Semakin banyak dataset yang digunakan sebagai data training, maka nilai akurasi yang dihasilkan cenderung semakin besar. 2) Tingkat akurasi yang dihasilkan dalam penelitian menggunakan Principal Component Analysis yang dikombinasikan KNN + Euc dengan mencapai 95.63%. 3) Penggunaan PhD Toolbox, untuk menghitung tingkat akurasi belum bisa dipecahkan oleh peneliti kasus ini, namun hanya berfungsi sebagai alat untuk melakukan ekstraksi dalam usaha menemukan nilai terdekat berdasarkan metode jarak yang ditentukan. Saran Mengingat tingkat akurasi tertinggi yang peroleh menggunakan metode PCA + KNN dengan metode hitung jarak terdekat mencapai 95.63%, maka disarankan : a. Penggunaan algoritma PCA + KNN + Euc, dapat digunakan untuk aplikasi pengenalan wajah. b. Pengenalan wajah (face recognition), masih mempunyai titik lemah apabila menggunakan kombinasi algoritma yang digunakan dalam penelitian ini, sehingga perlu peningkatan performance yang lebih baik dengan menggunakan komponen-komponen, metode-metode dan algoritma yang lain. 88
PENERAPAN PCA DAN K-NN UNTUK MENINGKATKAN NILAI AKURASI PENGENALAN WAJAH
c. Penggunaan PhD Toolbox yang direkomendasikan oleh Vitonir Struc, dapat digunakan untuk mendapatkan nilai ekstraksi gambar agar perhitungan nilai jarak terdekat dapat dilakukan, untuk mendapatkan nilai akurasi perlu adanya kajian yang lebih mendalam, karena peneliti dalam hal ini tidak mendapatkan solusi yang sesuai dengan yang diharapkan.
DAFTAR PUSTAKA [1] [2] [3] [4]
[5] [6]
[7] [8] [9] [10] [11]
[12]
[13] [14] [15]
[16]
F. T. Ui, “Sistem pengenalan..., Sepritahara, FT UI, 2012,” 2012. “Cohen, Moris R., and Ernest Nagel. 1939. An Introduction to Logic and Scientific Method. New york: Harcourt,” p. 1939, 1939. S. Bayu, A. Hendriawan, and R. Susetyoko, “Penerapan Face Recognition Dengan Metode Eigenface Dalam Intelligent Home Security.” D. A. N. Jaringan, S. Tiruan, H. Zayuman, I. Santoso, and R. R. Isnanto, “yaitu vektor eigen dari matriks ( X * X t ) dengan menggunakan vektor eigen dari matriks ( X t * X ),” pp. 1–7. O. Camps and S. Narasimhan, “PCA-based Object Recognition.” F. Damayanti, A. Z. Arifin, and R. Soelaiman, “PENGENALAN CITRA WAJAH MENGGUNAKAN METODE TWO-DIMENSIONAL LINEAR DISCRIMINANT,” vol. 5, no. 3, pp. 147–156, 2010. C. Digital and L. Belakang, “Pengenalan wajah menggunakan analisis komponen utama (,” pp. 1–4. W. Zhao and A. Rosenfeld, “Face Recognition : A Literature Survey AND,” vol. 35, no. 4, pp. 399–458, 2003. E. Pca, “Sistem Pengenalan Wajah Secara Real-Time,” vol. 7, no. 2, pp. 179–184, 2013. Y. Zana, R. M. Cesar-Jr, R. Feris, and M. Turk, “Local approach for face verification in polar frequency domain,” Image Vis. Comput., vol. 24, no. 8, pp. 904–913, Aug. 2006. N. Krisandi, B. Prihandono, and N. Bayes, “ALGORITMA k - NEAREST NEIGHBOR DALAM KLASIFIKASI DATA HASIL PRODUKSI KELAPA SAWIT PADA PT . MINAMAS,” vol. 02, no. 1, pp. 33–38, 2013. T. Basics, P. C. Analysis, V. R. Procedure, A. Illustration, V. Redundancy, P. Component, O. Solutions, N. F. Analysis, P. O. Inventory, M. Instrument, M. Adequate, S. Size, S. A. S. Program, T. Data, T. P. Factor, P. Factor, T. Var, C. Principal, C. Analysis, I. Extraction, F. Solution, R. Solution, C. F. Scores, F. Scores, and F. Description, “Introduction : The Basics of Principal Component Analysis,” pp. 1–56. M. S. El-bashir and I. Technology, “Face Recognition Using Multi-Classifier,” vol. 6, no. 45, pp. 2235–2244, 2012. D. Pandit, K. S. Vishwavidyalaya, and A. Mathematics, “Different distance based PCA + LDA fusion Technique for Face recognition,” pp. 1–8. M. A. Kashem, N. Akhter, S. Ahmed, M. Alam, and I. Ntroduction, “Face Recognition System Based on Principal Component Analysis ( PCA ) with Back Propagation Neural Networks ( BPNN ),” vol. 2, no. 6, pp. 1–10, 2011. P. Miller and J. Lyle, “The Effect of Distance Measures on the Recognition Rates of PCA and LDA Based Facial Recognition Digitial Image Processing.”
89
Yahya, Indra Gunawan, Bambang Harianto
[17] R. Beveridge, D. Bolme, M. Teixeira, and B. Draper, “The CSU Face Identification Evaluation System User ’ s Guide : Version 5 . 0,” pp. 1–29, 2003. [18] B. A. B. Iii, “Bab iii metodologi penelitian 3.1 .,” pp. 1–6. [19] K. Kepemilikan and K. Bemotor, “Penerapan algoritma k-nearest neighbor untuk penentuan resiko kredit kepemilikan kendaraan bemotor,” vol. 1, no. 1, pp. 65–76, 2013.
90