Prosiding Seminar Nasional Ilmu Komputer 2013 Jurusan Ilmu Komputer FMIPA Unnes, 23 November 2013
Algoritma Pengenalan Ekspresi Wajah Menggunakan Wavelet Neural Networks Z. Abidin Jurusan Ilmu Komputer, Fakultas MIPA, Universitas Negeri Semarang Kampus Sekaran Gunungpati, Semarang, 50229 E-mail :
[email protected]
Abstrak Ekspresi atau mimik adalah salah satu bentuk komunikasi nonverbal yang merupakan hasil dari satu atau lebih gerakan atau posisi otot pada wajah serta dapat menyampaikan keadaan emosi dari seseorang kepada orang yang mengamatinya. Melalui ekspresi wajah, maka dapat dipahami emosi yang sedang bergejolak pada diri individu. Ekspresi wajah merupakan salah satu karakteristik perilaku. Penggunaan sistem teknologi biometrika dengan karakteristik ekspresi wajah memungkinkan untuk mengenali mood atau emosi seseorang. Komponen dasar sistem analisis ekspresi wajah adalah deteksi wajah, ekstraksi data wajah, dan pengenalan ekspresi wajah. Metode integral projection digunakan untuk sistem dekteksi wajah. Berdasarkan hasil analisis dan pembahasan untuk menentukan arsitektur yang optimal, dilakukan inisialiasi parameter dan beberapa parameter dilakukan variasi. Dari percobaan awal ditentukan jumlah neuron pada wavelet layer adalah 13, dengan jumlah epoch = 500, target error = 0,01, dan learning rate 0.25, menghasilkan MSE = 0,106463, dengan durasi masa training adalah 38,1543 detik. Tingkat pengenalan ekspresi wajah masih sangat rendah yaitu sebesar 15,0235% dengan rincian sbegai berikut. Jumlah citra training data set yang berhasil dikenali adalah 20 dari 140 citra (14,29%), sementara citra testing data set yang berhasil dikenali adalah 12 dari 73 citra (16,44%). Kata kunci Ekspresi Wajah, Transformasi Wavelet, Wavelet Neural Network 1. PENDAHULUAN Ekspresi atau mimik adalah salah satu bentuk komunikasi nonverbal yang merupakan hasil dari satu atau lebih gerakan atau posisi otot pada wajah serta dapat menyampaikan keadaan emosi dari seseorang kepada orang yang mengamatinya. Ekspresi wajah mengungkapkan pikiran yang sedang melintas pada diri seseorang. Sebagai contoh, sebuah senyum mengungkap keramah-tamahan dan kasih-sayang; mengangkat alis mata menunjukkan ekspresi heran; mengernyitkan dahi menunjukkan ketakutan dan kegelisahan. Semua emosi dan berbagai macam tingkah manusia diekspresikan dalam emosi yang berbeda yang tergambar di wajah [9]. Paul Ekman, seorang psikolog Amerika juga menyatakan bahwa manusia mempunyai ekspresi wajah yang universal [4]. Saat ini teknologi biometrika telah banyak sekali digunakan. Teknologi biometrika diterapkan dengan menggunakan karakteristik pembeda (distinguishing traits). Secara umum karakteristik pembeda itu sendiri
ISBN 978-602-14724-4-6
dibedakan menjadi 2, yaitu karakteristik fisiologis atau fisik, dan karakteristik perilaku. Ekspresi wajah merupakan salah satu karakteristik perilaku. Penggunaan sistem teknologi biometrika dengan karakteristik ekspresi wajah memungkinkan untuk mengenali mood atau emosi seseorang. Pengenalan ekspresi wajah berbasis komputer sendiri merupakan salah satu bidang ilmu yang selalu aktif dikaji sepanjang waktu. Beberapa metode pengenalan ekspresi wajah telah banyak dikembangkan. Beberapa penelitian yang telah dilakukan dan yang berkaitan dengan ekspresi wajah diantaranya dilakukan oleh Lekshmi dan Sasikumar [11], yang melakukan analisis ekspresi wajah dengan menggunakan metode Gabor Wavelet Transform (GWT) dan DCT, serta jaringan Radial Basis Function (RBF) digunakan sebagai classifier. Bashyal dan Venayagamoorthy [3], melakukan pengenalan ekspresi wajah dengan menggunakan Gabor wavelet dan LVQ. Kulkarni [10], mengembangkan sistem cerdas pengenalan mood menggunakan database yang besar denga sistem committee neural network. Deng et al. [6], mengembangkan sebuah penelitian yang membandingkan metode bank tapis gabor lokal dan global dengan pendekatan PCA+LDA. Ma dan Khorasani [14] melakukan penelitian dengan menggunakan 2-D discrete cosine transform (DCT) dan jaringan syaraf feedforward dengan satu layer tersembunyi. Abidin dan Harjoko [1] melakukan penelitian dengan menggunakan fisherface sebagai ekstraksi ciri dan backpropagation neural network sebagai classifier. Beberapa penelitian yang disebutkan di atas hampir semuanya menggunakan neural network (NN) yang dikombinasikan beberapa metode. Faktor kunci penggunaan NN adalah karena sifatnya yang mampu melakukan pembelajaran dan generalisasi, pemetaan nonlinear, dan komputasi paralel [7]. Pada umumnya pendekatan pemecahan masalah menggunakan NN membutuhkan sejumlah neuron. Selain itu, NN kadang terjebak pada sebuah lokal minimum error sehingga tingkat konvergensi jaringan menjadi lambat. Menurut Abiyev dan Kaynak [2] untuk mengatasi kelemahan yang dimiliki NN, pendekatan yang sesuai adalah dengan fungsi wavelet yang diterapkan pada struktur NN. Fungsi wavelet disini digunakan sebagai fungsi aktivasi pada lapisan tersembunyi dari NN. Kombinasi antara neural networks dan wavelet menghasilkan model hybrid yang dikenal dengan dengan wavelet neural networks (WNN). Sampai saat ini masih sedikit artikel yang membahas secara rinci berkaitan dengan WNN untuk pengenalan pola, beberapa diantaranya adalah Lin [11], Yonghui dan Rui [16]. Kebanyakan dari penelitian yang ada adalah
147
Prosiding Seminar Nasional Ilmu Komputer 2013 Jurusan Ilmu Komputer FMIPA Unnes, 23 November 2013
penggunaan transformasi wavelet untuk melakukan dekomposisi dan ekstraksi ciri. Berdasarkan uraian di atas, dalam penelitian ini dapat dirumuskan permasalahan sebagai berikut: (1) Bagaimana menentukan model wavelet neural networks yang optimal? (2) Berapa persen tingkat akurasi yang dihasilkan dari pendekatan metode yang diusulkan dalam mengidentifikasi ekspresi wajah sebuah citra? Beberapa hal yang menjadi batasan masalah dalam penelitian ini adalah: citra yang digunakan adalah citra ekspresi wajah, citra yang digunakan adalah citra static single person, di mana dalam citra tersebut hanya terdapat satu objek saja, posisi wajah yang digunakan dalam penelitian ini frontal, dan tidak terhalang sebagian oleh objek lain, dengan latarbelakang yang seragam atau tidak terdiri banyak variasi warna, pengenalan wajah tidak bergantung pada struktur wajah, budaya, etnis, warna kulit, umur, dan jenis kelamin. 2. METODOLOGI PENELITIAN 2.1 Analisis dan Kebutuhan Sistem Masalah yang akan diselesaikan adalah pengenalan ekspresi wajah yang dilakukan dengan mengenali pola dari citra wajah. Ekspresi yang akan dikenali adalah ekspresi netral plus 6 ekspresi dasar wajah yaitu: senang, sedih, marah, terkejut, takut dan jijik. Setiap citra direpresentasikan dalam bentuk matriks, di mana baris dan kolom menunjukkan sebuah titik pada citra serta kesesuaian nilai elemen matriks mengidentifikasikan level pada titik tersebut [8]. Representasi citra dalam bentuk matriks memiliki dimensi yang besar, sehingga proses komputasi membutuhkan waktu proses yang lama sehingga diperlukan reduksi dimensi matriks untuk meminimalisir waktu proses. Dalam penelitian ini digunakan transformasi wavelet untuk mereduksi dimensi. Pengenalan ekspresi wajah didasari pada pengenalan pola dengan menggunakan jaringan syaraf wavelet (Wavelet Neural Networks / WNN). Proses pengenalan ekspresi wajah dilakukan dengan membandingkan citra input dengan citra yang telah dilatih oleh sistem. Secara garis besar, penelitian ini terdiri dari beberapa tahap yaitu: 1) Proses dokumentasi citra digital dari database JAFFE. Citra yang digunakan untuk penelitian ini dikelompokkan menjadi 2 bagian yakni citra untuk pelatihan (training data set) dan citra query (testing data set). Data citra diperoleh dari database JAFFE [13] yang terdiri dari 213 gambar ekspresi wajah dari 10 subyek wanita Jepang. Setiap subyek berpose 3 sampai 4 untuk 6 ekspresi wajah + 1 netral. Setiap gambar memiliki format *.tiff, dengan mode warna grayscale dan memiliki ukuran 256×256 piksel. Rincian pembagian data citra yang akan digunakan untuk pelatihan dan pengujian dapat dilihat pada Tabel 1. Pembagian data citra mengikuti pola penelitian sebelumnya[1]. Tabel 1. Rincian pembagian data citra Jumlah Citra Latih Jumlah Citra Uji Total Citra 140 73 213 148
2) Pre-Processing Citra Tahap pre-processing citra diawali dengan otomatisasi deteksi wajah, yaitu dengan mendeteksi daerah wajah dan melakukan normalisasi ukuran. Proses deteksi wajah menggunakan metode integral projection yaitu dengan menjumlahkan piksel perbaris dan perkolomnya. Kemudian menentukan titik-titik minimum lokal untuk menentukan batas wajah [1]. Citra yang berhasil dideteksi tadi dinormaliasi ukurannya menjadi 130×114 piksel. Selanjutnya dilakukan histogram equalization untuk melakukan perluasan kontras citra, serta masking untuk menutup bagian sudut-sudut citra sehingga mengurangi variasi yang timbul pada bagian -bagian tersebut. Berikutnya melakukan dekomposisi wavelet menggunakan beberapa keluarga wavelet yaitu wavelet Haar, Daubechies(2), dan Coiflet(1). Data akan didekomposisi pada level 3.
Gambar 1. Ilustrasi proses dekomposisi citra Setelah melalui proses dekomposisi, dimensi citra akan berubah seperti pada Tabel 2. Tabel 2. Dimensi citra dari tiap level dekomposisi Level Dekomposisi Dimensi Citra 0 (Original) 130 × 114 1 65 × 57 2 33 × 29 3 17 × 15 proses dekomposisi merupakan proses pengolahan data (sinyal) dengan teknik downsampling menggunkan transformasi wavelet. Pada proses ini terjadi pemisahan sinyal frekuensi tinggi yang dapat dianggap sebagai noise (dalam transformasi wavelet dinamakan koefisien detail (cD) dan frekuensi rendah (dalam transformasi wavelet dinamakan koefisien approksimasi (cA)). Bagian sinyal yang akan digunakan adalah koefisien aproksimasi, karena bagian koefisien detil merupakn noise yang menyertai sinyal. 3) Proses pelatihan untuk citra training data set. 4) Pengujian sistem pengenalan ekspresi wajah baik untuk citra training data set maupun citra query. 2.2 Perancangan Sistem Dalam penelitian ini akan dibuat sistem pengenalan ekspresi wajah menggunakan program MATLAB R2009a. Citra yang digunakan untuk tahap awal adalah citra statis yang terdiri dari satu orang, dengan background homogen. Citra yang digunakan berasal dari database JAFFE. Tahapan dalam perancangan sistem pengenalan ekspresi wajah ini adalah sebagai berikut. ISBN 978-602-14724-4-6
Prosiding Seminar Nasional Ilmu Komputer 2013 Jurusan Ilmu Komputer FMIPA Unnes, 23 November 2013
1)
2)
Sub sistem registrasi / input citra Pada sub sistem ini, terdiri dari sistem deteksi, preprocessing, dan ektraksi ciri, serta penyimpanan di ciri citra ekspresi wajah ke dalam database. Mulamula citra dimasukkan ke sistem, kemudian dilakukan deteksi wajah dengan menggunakan metode integral projection. Jika wajah berhasil ditemukan, selanjutnya dilakukan proses normalisasi ukuran, histogram equalization, masking, serta transformasi wavelet. Hasil dari transformasi wavelet tersebut disimpan ke dalam database. Jika wajah tidak ditemukan, maka masukkan citra ekspresi wajah yang lain. Sub sistem pelatihan wavelet neural networks (WNN) Citra training data set yang telah disimpan di database selanjutnya diolah dengan menggunakan sistem pelatihan WNN. Struktur arsitektur jaringan syaraf tiruan merujuk pada arsitektur yang diusulkan oleh Veitch [15]. Layer terdiri dari 3, yaitu input layer, wavelet layer, dan output layer. Fungsi aktivasi yang digunakan pada input-wavelet layer adalah fungsi Mexican-hat yang merupakan bentuk turunan kedua dari fungsi Gaussian. Pemilihan fungsi ini didasarkan pada penelitian yang telah dilakukan oleh Lin [12], bahwa fungsi Mexican-hat terdiri dari satu parameter sehingga proses pengontrolan dapat dilakukan dengan mudah. Sekilas proses pelatihan sama seperti jaringan syaraf tiruan backpropagation, yang membedakan adalah fungsi aktivasi pada layer tersembunyi menggunakan fungsi wavelet, sehingga layer tersembunyi tersebut diberi istilah wavelet layer. Bobot pelatihan disimpan dan nantinya digunakan pada tahap proses pengenalan ekspresi wajah. Keluarga wavelet didefinisikan seperti pada persamaan berikut [5].
dengan adalah skala dan adalah translasi. Fungsi Mexican-hat diekspresikan oleh persamaan berikut. Oleh karena itu, fungsi aktivasi neuron wavelet ke -j dengan input data ke-i direpresentasikan sebagai berikut.
3)
Gambar 2. Struktur WNN yang diusulkan oleh Veitch [15] 2.3 Perancangan antarmuka Antarmuka merupakan media interaksi antara sistem dengan pengguna. Perancangan antarmuka dilakukan untuk membangun sistem yang user friendly sehingga akan memberikan kemudahan kepada pengguna sistem. Antarmuka sistem ini juga digunakan untuk melakukan pengujian dari metode pendekatan yang digunakan. Sistem pengenalan ekspresi wajah yang akan dikembangkan terdiri dari 3 form/figure yaitu figure untuk melakukan input citra ekspresi wajah, figure untuk melakukan pembelajaran / pelatihan WNN, dan figure pengenalan. 3. HASIL DAN PEMBAHASAN 3.1 Pengukuran Evaluasi Unjuk Kerja Sistem Pengukuran evaluasi unjuk kerja dari sistem pengenalan ekspresi wajah, digunakan dua parameter, yaitu recognition rate. Recognition rate adalah perbandingan antara jumlah wajah yang berhasil dikenali ekspresinya dengan benar dengan jumlah seluruh wajah yang ada. 3.2 Pengaruh Transformasi Wavelet Terhadap Unjuk Kerja Sistem Jaringan Saraf Tiruan Proses pelatihan dilakukan sebanyak 6 kali dengan melakukan perubahan terhadap parameter jaringan syaraf tiruan. Parameter jumlah neuron hidden yang akan diujicoba adalah 13, dan 60. Sedangkan untuk learning rate dipilih nilai 0,75 dan 0,25. Target error akan diset dengan 0,01 dan jumlah maksimum epoh adalah 500. Hasil pengujian dengan melakukan variasi parameter terhadap jaringan syaraf tiruan dapat dilihat pada Tabel 3, 4, dan 5.
Sub Sistem Pengenalan Ekspresi Wajah Langkah terakhir setelah dilakukan proses pelatihan dan penyimpanan bobot adalah proses pengenalan. Pada sub sistem pengenalan, konsepnya sama seperti pada sub sistem registrasi, yang dilanjutkan dengan sistem feedforward, dimana pada proses feedforward digunakan bobot jaringan syaraf tiruan wavelet hasil dari pelatihan WNN. Keluaran WNN selanjutnya dibandingkan dengan target.
ISBN 978-602-14724-4-6
149
Prosiding Seminar Nasional Ilmu Komputer 2013 Jurusan Ilmu Komputer FMIPA Unnes, 23 November 2013
Tabel 3. Hasil pengujian dengan transformasi Haar wavelet Hasil
Jml NH
MSE
Waktu (detik)
Berhasil Dikenali CL CNL 20 10
%
5
0,25
0,121648
16,5528
5
0,75
0,114036
15,4571
20
12
14,085 15,0235
13
0,25
0,106463
38,1543
20
12
15,0235
13
0,75
0,113557
37,7224
20
12
15,0235
Tabel 4. Hasil pengujian dengan transformasi Daubechies(2) wavelet Hasil
Jml NH
MSE
Waktu (detik) 15,9672 15,5666
Berhasil Dikenali CL CNL 20 11 20 12
%
5 5
0,25 0,75
0,122336 0,112008
13
0,25
0,110575
38,095
20
12
14,554 15,0235 15,0235
13
0,75
0,108597
37,3738
20
11
14,554
Tabel 5. Hasil pengujian dengan transformasi Coiflet(1) wavelet Hasil
Jml NH
MSE
Waktu (detik)
5
0,25
0,121404
16,1267
13 5
0,75 0,25
0,112717 0,105287
15,585 39,0004
20 20
11 10
13
0,75
0,105511
37,991
20
10
4. KESIMPULAN Berdasarkan hasil analisis dan pembahasan yang telah dilakukan, dapat ditarik beberapa kesimpulan, yaitu untuk menentukan arsitektur yang optimal, dilakukan inisialiasi parameter dan beberapa parameter dilakukan variasi. Dari percobaan awal ditentukan jumlah neuron pada wavelet layer adalah 13, dengan jumlah epoch = 500, target error = 0,01, dan learning rate 0.25, menghasilkan MSE = 0,106463, dengan durasi masa training adalah 38,1543 detik. Tingkat pengenalan ekspresi wajah masih sangat rendah yaitu sebesar 15,0235% dengan rincian sbegai berikut. Jumlah citra training data set yang berhasil dikenali adalah 20 dari 140 citra (14,29%), sementara citra testing data set yang berhasil dikenali adalah 12 dari 73 citra (16,44%). DAFTAR PUSTAKA [1] Abidin, Z, dan Harjoko, A., 2012, A Neural Network based Facial Expression Recognition using Fisherface. International Journal of Computer Applications, 59,11, 30-34. [2] Abiyev, R.H., dan Kaynak, O. 2008. Identification and Control of Dynamic Plants Using Fuzzy Wavelet Neural Networks. IEEE International Symposium on Intelligent Control. San Antonio, Texas, USA, September 3-5, 1295-1301. [3] Bashyal, S., dan Venayagamoorthy, G.K., 2007, Recognition of Facial Expressions Using Gabor Wavelets and Learning Vector Quantization, Engineering Application of Artificial Intelligence. http://dx.doi.org/10.1016/j.engappai.2007.11.010, 2007, diakses 2 Januari 2010.
150
Berhasil Dikenali CL CNL 20 11
% 14,554 14,554 14,085 14,085
[4] Dalgleish, T., dan Power, M. 1999. Handbook of Cognition and Emotion. John Wiley & Sons Ltd,New York. [5] Daubechies, I., 1992, Ten Lectures on Wavelets, Society for Industrial and Applied Mathematics, Philadelphia: SIAM. [6] Deng, H.B., Jin, L.W., Zhen, L.X., dan Huang, J.C., 2005, A New Facial Expression Recognition Method Based On Local Gabor Filter Bank and PCA plus LDA, International Journal of Information Technology, 11, 11, 86 96. [7] Fausett, L. 1994, Fundamentals of Neural Networks: Architectures, Algorithms, and Applications. Prentice-Hall. New Jersey. [8] Gonzalez, R.C., dan Woods, R.E., 2008, Digital Image Processing, 3rd ed., Prentice-Hall Inc., New Jersey. [9] Herlina, 2010, Isyarat Wajah (Facial Sign), Handout, Jurusan Psikologi UPI, Bandung, http://file.upi.edu/Direktori/A%20%20FIP/JUR.%20PSIKOLO GI/196605162000122%20-%20HERLINA/IPTM9%20FACIAL %20SIGN.pdf, diakses 20 Oktober 2010. [10] Kulkarni, S.S., 2006, Facial Image Based Mood Recognition Using Committee Neural Networks, Thesis, Department of Biomedical Engineering University of Akron. [11] Lekshmi V., P., dan Sasikumar, M., 2008, A Neural Network Based Facial Expression Analysis using Gabor Wavelets, World Academy of Science, Engineering and Technology, Vol. 42, 563 567.
ISBN 978-602-14724-4-6
Prosiding Seminar Nasional Ilmu Komputer 2013 Jurusan Ilmu Komputer FMIPA Unnes, 23 November 2013
[12] Lin, C.J., 2006, Wavelet Neural Networks with a Hybrid Learning Approach. Journal of Information Science and Engineering, Vol. 22, 1367 1387. [13] Lyons, M., Akamatsu, S., Kamachi, M., dan Gyoba, J., 1998, Coding Facial Expression with Gabor Wavelet, World Academy of Science, Engineering and Technology, 42, 563 567. [14] Ma, L. dan Khorasani, K., (2004), Facial Expression Recognition Using Constructive Feedforward Neural Network, IEEE Transactions on Systems, Man, and Cybernetics, Vol. 3, No. 34, 1588 1595. [15] Veitch, D, (2005), Wavelet Neural Networks and their application in the study of dynamical systems, Disertasi, University of York: UK. [16] Yonghui Pan, dan Rui Fan. 2012. A Wavelet Neural Networks License Recognition Algorithm and Its Application. Journal of Computer, Vol 7, No. 7, 1583 1590.
ISBN 978-602-14724-4-6
151