Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15November2014
ISSN: 1979-911X
RESPON POSE ROBOT BERBASIS EMOSI WAJAH 2D MENGGUNAKAN METODE NAIVE BAYES Fajar Hermawanto1, Surya Sumpeno2, Mauridhi Hery Purnomo 3 Jurusan Teknik Elektro, Fakultas Teknologi Industri, ITS SURABAYA e-mail :
[email protected],
[email protected],
[email protected],
1,2,3
ABSTRACT Technology field of robotics is stillan interesting topic to be studied. One of the interesting things that the interaction between robots with human sare the limitations of the robotis notable to recognize human emotion sandex pressing emotion in the form of the pose. The introduction of one human emotions by recognizing facial emotions. In this study, will presenton the robot pose respons to facial emotionuser. In recognizing facial emotion usersuse the webcam, then the face is recognized using the Violaand Jones. 2D facial features have been obtained subsequent feature extraction one. Feature extraction method used is Hu Moments which will generate7(direction) value foreac extraction are use dasattributesin classification of 2D facial emotions. Classification for facial emotion recognitionusing Naïve Bayes method. In this study the use of Naïve Bayes method gives an accuracy of up to 90%. Keywords: robot, emotion, face, webcam, 2dimensional, Violaand Jones, HuMoments, NaïveBayes. PENDAHULUAN Penelitian dalam bidang robotika masih dianggap menarik sampai saat ini, terbukti berbagai metode telah berkembang baik dalam bidang algoritma maupun sistem mekaniknya. Dalam perkembangan bidang algoritma biasanya diterapkan untuk mendapatkan suatu kesetabilan prilaku agar pergerakkan robot lebih terkendali. Berbagai macam sensor digunakan untuk dapat merespon segala sesuatu yang mungkin bisa memberikan suatu input terhadap robot untuk mendapatkan informasi tentang keadaan lingkungan disekitar robot. Robot telah banyak mengambil peranan penting dalam rutinitas sehari-hari, di tempat-tempat umum seperti rumah, supermarket, rumah sakit, kantor dan sebagainya. Robot harus mampu berinteraksi dengan warga umum dan untuk menggunakannya. Hal ini menimbulkan pertanyaan penting tentang bagaimana suatu robot mampu dapat berinteraksi dengan cara alami, intuitif dan menyenangkan. Untuk menjawab pertanyaan ini, robot harus mampu mengenali emosi manusia sehingga dapat memberikan lingkungan yang ramah. Tanpa mengenali emosi, maka akan sangat sulit bagi robot untuk berinteraksi dengan manusia secara alami (Zhang S., Zhao X, 2012). Manusia berbagi emosi dengan orang lain menggunakan ekspresi wajah. Telah terbukti bahwa emosi marah, sedih, kebahagiaan, jijik, penghinaan dan kejutan memiliki ekspresi wajah yang khas (M. Minsky, 2006 ). Munculnya kemampuan manusia untuk mengenali ekspresi wajah adalah sejak awal yaitu sejak lahir (P. Ekman, 2004). Menyalahkan, mencela serta pujian dapat dipahami dari ekspresi wajah orang dalam bentuk tersenyum dan mengerutkan kening wajah. Artinya, bahwa umpan balik manusia dapat diakui secara efektif dari ekspresi wajah. Tidak seperti biometrik lainnya, pengenalan wajahadalah non-invasif, dan tidak membutuhkan kontak fisikantara individudengan sistem, menjadikan hal tersebut sebagaibiometrik.Sistem dasar pengenalan wajahdapat dibagi menjadiempat langkah: deteksiwajah, gambarpra-pengolahan, ekstraksi ciri danpengecekan(J. Fagertun, 2005). Tidak mudah untuk dapat mendeteksi wajah , wajah membentu kkelas yang samadarisetiap objek danfiturnya, seperti mata, mulut, hidung dan dagu, memiliki, secara umum memiliki konfigurasigeometrisyang sama.Gambar wajah ditangkap kamera akan di pra prosessinguntuk mengatasivariasiiluminasi(Y. Gang, L. Jiawei, L. Jiayu, M. Qingli and Y. Ming, 2009 ). Ekstraksi fituradalah proses di manasuatu modelgeometrisatauvectorialdiperolehdengan mengumpulkankarakteristik yang pentingpada wajah (R. Padilla, C. F. F. Costa Filho and M. G. F. Costa, 2012). Metode yang paling banyak digunakan dalam mendeteksi wajah yaitu dengan menggunakan metode Cascade yang ditemukan oleh Viola dan Jones (Viola, P. and Jones, M, 2001 ). Cascade adalah metode yang menggunakan pendekatan seperti pada pohon bercabang dimana setiap simpul merupakan klas yang dirancang untuk memfilter antara gambar wajah dan bukan wajah. C-143
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15November2014
ISSN: 1979-911X
Penelitian dalam menentukan klasifikasi emosi wajah telah banyak dilakaukan dengan beberapa metode, salah satunyan dengan menggunakan metode naïve bayes .JaringanBayesadalah caraintuitifdan efisienuntuk modeldistribusibersama yang cocokuntuk klasifikasi. Bahkan, metode naïve bayessebenarnyametode yang singkat dimanasemua nodehanya terhubungke nodekelas yaitu tidak ada hubungan antaraciri denganmodel (A. Aitor, Hageloh. F, Sande. Koen, Valenti. R, 2005). Pada penelitian kali ini diteliti tentang respon pose robot terhadap ekspresi dari wajah manusia. Berdasarkan sifat ilmiah dasar pada manusia bahwa setiap manusia akan memahami ekspresi wajah dari orang lain . Ekspresi wajah yang beremosi tersebut secara otomatis akan dimengerti oleh robot melalui webcam yang selanjutnya akan dikenali dengan menerapakan salah satu cabang ilmu yaitu computer vision proses klasifikasi emosi menggunakan metode naive bayes. respon pose robot adalah pose emosi yang mempresentasikan emosi dari wajah pengguna . METODE PENELITIAN Ekspresi wajah memberikan petunjuk penting tentang emosi. Beberapa cara telah dikemukakan untuk mengelompokkan keadaan emosi manusia. Ciri yang digunakan biasanya berdasarkan posisi spasial lokal atau perpindahan titik tertentu dan wilayah pada wajah. Salah satu cara yang dapat digunakan untuk menangkap ekspresi wajah adalah dengan mengamati pergerakan otot-otot utama wajah. Secara garis besar, aplikasi pengenalan emosi ini terdiri dari dua bagian, yaitu bagian pengenalan emosi dan sintesa pose ekspresi pada robot. Sistem ini diwujudkan ke dalam suatu perangkat lunak (program) menggunakan bahasa pemrograman. Secara umum pembuatan program ini mengikuti alur sesuai yang ditunjukkan pada Gambar 1. Alat dan bahan yang digunakan dalam penelitian ini adalah sebagai berikut : 1. Hardware yang terdiri dari : 1) Robot Bioloid Premium Kit Tipe A ; 2) Kamera Webcam Logitech C170; 3) Laptop Core i3; 4) Kabel USB to Serial . 2. Softwareyang terdiri dari : 1) Microsoft Visual C++ 2008 Express; 2) Library OpenCV 2.4.5; 3) Robo Plus; 4) ZIGBEE_SDK_Win32_v1_02. Adapun tahapan dalam penelitian ini adalah sebagai berikut :
Gambar 1. Alur Tahapan Penelitian Pengambilan Data, pengenalan wajah merupakan langkah pertama dalam pembangunan sistem pengenalan emosi wajah. Informasi yang diterima untuk mengenali wajah sangat rentan oleh derau, kecerahan lingkunan/iluminasi, cacat kamera (Turk M., A.P Pentland, 2001.,Yang M, 2002). Detektor wajah menggunakan metode Paul Viola dan Michael Jones . Penggolong Riam Haar, prinsip kerja dari penggolong riam haar jika ada sebuah citra detektor menguji tiap lokasi citra dan mengklasfikasikannya sebagai wajah atau bukan wajah. Klasifikasi dimisalkan sebuah skala tetap untuk wajah, yaitu 50 x 50 piksel. Jika wajah pada citra lebih besar atau lebih kecil dari piksel tersebut, penggolong berjalan beberapa kali untuk mencari wajah pada gambar tersebut. C-144
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15November2014
Gambar 2.
ISSN: 1979-911X
Fitur haar Viola dan Jones
Penggolong menggunakan data yang tersimpan pada file XML, untuk memutuskan mengklasifikasikan tiap lokasi citra. Fitur yang dipakai Viola dan Jones menggunakan bentuk gelombang Haar. Bentuk gelombang Haar adalah sebuah gelombang kotak, pada 2 dimensi gelombang kotak adalah pasangan persegi bersebelahan, 1 terang dan 1 gelap. Haar ditentukan oleh pengurangan piksel rata-rata daerah gelap dari piksel rata-rata daerah terang. Jika perbedaan diatas ambang fitur tersebut dikatakan ada. Kata riam pada penggolong berarti penggolong total terdiri atas penggolong yang lebih sederhana yang diaplikasikan secara subsekuen ke ROI (Budiarto W., Purwanto D2012). Proses pengenalan fitur emosi wajah difokuskan pada area mulut, mata kanan dan alis kanan, mata kiri dan alis kiri. Tahap pertama dengan mengenali area wajah selanjutnya memisahkan area mulut , mata kanan dan alis kanan, mata kiri dan alis kiri.
Gambar 3.Deteksi wajah dan SetROI Fitur wajah yang terdiri mulut, mata kanan / alis kanan, mata kiri / alis kiri dipisahkan secara terpisah. Setiap citra akan memberikan nilai yang dapat dijadikan atribut pada tahap klasifikasi emosi wajah. Deteksi tepi dilakukan untuk mendapatkan kontur pada masing fitur wajah. Pada gambar 4 fitur wajah diberikan operasi deteksi tepi canny untuk mendapatkan fitur citra wajah.
Gambar 4. Deteksi Tepi ( Canny ) Ekstraksi Ciri dengan HuMoments, salah satu carapaling sederhana untukmembandingkan duakonturadalahdengan menghitungmomenkontur. Iniadalah saat yang tepat untuk penyimpangan singkat ketepat apasaatini. Loosely mengatakan, momentmerupakan karakteristikkotordari C-145
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15November2014
ISSN: 1979-911X
penghitungan konturdengan mengintegrasikan atau menjumlahkansemuapiksel dari kontur. Secara umum,kitakita definisikan(p, q) sebagaikontur n
m p , q = ∑ I ( x, y ) x p y q i =1
……………………………………………………….......…………………(1) Berikutpadalahx-orderdanqadalahy-order, dimanaorderberarti dayakomponenyang sesuai diambil dan ditampilkan hanya dalam jumlah. Penjumlahansemuapiksellebihdaribataskontur dilambangkan dengan ndalam persamaan1 . Kemudianberikutsegerabahwa jikapdanqkeduanyasama dengan nol, makamomenm00sebenarnya hanyapanjang piksel darikontur. Saatperhitunganmomentdijelaskanbeberapa karakteristikdasardarikonturyang dapat digunakan untuk membandingkanduakontur. Namun,momenyang dihasilkan dariperhitungantidak memberikan perbandingan yang terbaik dalam kasus-kasus yang praktis. Secara khusus,orang akanseringingin menggunakanmomennormal sehingga benda-benda daribentuk yang sama tetapi ukuran yang berbeda memberikan nilai yang sama. Demikian pula, saat-saatsederhanadaribagian sebelumnyatergantung pada sistem koordinatyang dipilih, yang berarti bahwaobjektidak cocokdengan benarjika mereka diputar. Sebuah central moment pada dasarnyaadalahsama denganmomentskecuali bahwa nilai-nilai x n dan yang digunakan dalam formula tergeser oleh nilai rata-rata: μ p , q = ∑ I ( x, y )( x − xavg ) p ( y − yavg ) q i=0 normalized moments adalah sama dengan central moment kecuali bahwa mereka semua dibagi dengan ………………………………………………….……(2) μ p , q m00: appropriate powerdari
η p,q =
( p + q )/ 2 +1
m00Hu invariant moments adalahkombinasilineardarimomenpusat.Caranya adalah dengan Akhirnya, ……………………………………………………………………………...(3) menggabungkanmomenpusatnormalisasiyang berbeda, sehinggamemungkinkan untukmembuat fungsiinvariantmewakiliaspek yang berbedadaricitra dalamcara yanginvarian,skala, rotasi, danrefleksi (Bradski G, Kaehler A, 2008). MenghitungmomenHudarimomenpusat ditunjukkanpada persamaan 4 . h1 = η20 +η02 h2 = (η20 −η02 )2 + 4η112 h3 = (η30 −η12 )2 + (3η21 −η03 )2 h4 = (η30 +η12 )2 + (η21 +η03 )2 h5 = (η30 − 3η12 )(η30 +η12 )((η30 +η12 )2 − 3(η21 +η03 )2 ) + (3η21 −η03 )(η21 +η03 )(3(η30 +η12 )2 − (η21 +η03 )2 )
……………………………………………...(4) h6 = (η20 −η02 )((η30 +η12 )2 − (η21 +η03 )2 ) + 4η11 (η30 +η12 )(η21 +η03 ) h7 = (3η21 −η03 )(η21 +η03 )(3(η30 +η12 )2 − (η21 +η03 )2 ) + (η30 − 3η12 )(η21 +η03 )(3(η30 +η12 )2 − (η21 +η03 )2 )
Robot Bioloid Premium Tipe A, robot Bioloid merupakan robot jenis humanoid dengan penggerak 18 motor servo. Robot ini mampu mewakili ekspresi dalam bentuk pose dengan terbatas pada ekspresi wajah, karena tidak ada manipulator yang berfungsi sebagai salah satu organ seperti halnya pada wajah manusia. CM-530 sebagai pusat kontrol robot , pada modul ini juga terdapat pin komunikasi serial Transmitter / TX dan Receiver/RX. Emosi robot pada penelitian ini hanya berbentuk dari pose badan robot berdasarkan pada pose emosi manusia. Masalah yang dihadapi pada pembentukan pose emosi robot ini adalah keleluasaan gerak dari setiap motor penggerak pada robot. Robot bioloid tersusun dari 18-DOF atau tersusun dari 18 derajat kebebasan sebagai penyusun gerak kaki, badan, tangan. Tahap Pelatihan, nilai – nilai hasil dari ekstraksi ciri fitur wajah beremosi selanjutnya disimpan dalam bentuk *.csv. File *.csv ini merupakan data matrik yang akan digunakan pada proses pengenalan emosi. Sebelum proses pengenalan perlu dilakukan proses pelatihan, yang bertujuan untuk mendapatkan perbedaan kelas pada setiap emosi wajah yang ingin dikenali. Pada setiap kelas emosi digunakan 30 citra wajah beremosi, sehingga total data yang digunakan pada proses pelatihan adalah 150 data. Metode klasifikasi yang digunakan pada penelitian ini adalah Metode Naïve Bayes. C-146
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15November2014
ISSN: 1979-911X
PEMBAHASAN Pada proses ekstraksi ciri setelah didapatkan deteksi tepi selanjutnya adalah ekstraksi fitur dari ketiga citra yaitu mulut, mata kanan/alis kanan, mata kiri/alis kiri. Metode ekstraksi fitur menggunakan Moment Hu, setiap citra akan didapatkan tuju nilai . Total nilai dari ketiga citra sebanyak dua puluh satu nilai digunakan sebagai atribut dalam klasifikasi.
Gambar 5 Grafik perbandingan hasil ekstraksi ciri lima emosi dasar Grafik hasil ekstraksi fitur wajah beremosi pada Gambar 5 dengan lima emosi dasar menunjukkan nilai yang berbeda. Jarak perbedaan nilai fitur pada setiap emosi memiliki karakteristik dimana emosi marah memiliki jarak yang paling jauh dengan emosi senang. Urutan nilai hasil ekstraksi cirri dari yang terkecil adalah terkejut, senang, sedih, netral, marah.Pengujian pengenalan emosi wajah menggunakan data pelatihan sebanyak 250 data, setiap kelas emosi terdiri dari 50 data dan setiap kelas diambil dari 5 orang citra wajah yang berbeda. Data pengujian sebanyak 50 data, setiap kelas emosi terdiri dari 10 data dan setiap kelas diambil dari 5 orang citra wajah yang berbeda. Setelah emosi wajah dikenali proses selanjutnya adalah mengirimkan data perintah secara serial (RS232) ke sistem kontrol robot. Pada sistem kontrol robot terdapat dua bagian program yang pertama program untuk membuat serangkaian gerak dalam beberapa step. Setiap pose emosi dibuat dalam beberapa step tersendiri dan tidak berhubungan dengan proses perubahan pose dengan pose emosi yang lainnya. Program yang kedua berfungsi untuk membaca sistem komunikasi serial dengan laptop, data setiap emosi akan difungsikan sebagai kondisi dalam program ini akan menentukan pernyataan atau pose emosi pada step motion pada bagian program yang pertama. KESIMPULAN Dari proses perancangan, implementasi dan pengujian dapat diambil beberapa kesimpulan sebagai berikut: 1. Metode Viola dan Jones merupakan metode sangat baik yang berfungsi untuk mencari posisi wajah pada citra untuk menentukan fitur wajah. 2. Metode HuMoments merupakan metode ekstraksi ciri yang baik untuk membedakan kontur fitur wajah beremosi . 3. Metode HuMoments menghasilkan 7 (tuju) nilai pada setiap fitur dan sangat baik digunakan sebagai atribut pada klasifikasi Naïve Bayesuntuk pengenalan emosi wajah. 4. Pembentukan pose emosi pada robot tidak sepenuhnya bisa mengekpresikan seperti pada emosi manusia karena terbatas oleh jumlah derajat kebebasan pada tubuh robot. UCAPAN TERIMA KASIH Terima kasih kepada pembimbing Prof. Ir. Mauridhi Hery Purnomo, M. Eng.,Ph.D dan Dr. Surya Sumpeno, ST., M.Sc . Teman – teman Dosen Program Studi Teknik Informatika Politeknik Gorontalo, Mahasiswa Program Studi Teknik Informatika Politeknik Gorontalo. C-147
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta,15November2014
ISSN: 1979-911X
DAFTAR PUSTAKA A. Aitor, Hageloh. F, Sande. Koen, Valenti. R, “Automatic facial emotion recognition”, Universiteit van Amsterdam, 2005. Bradski G, Kaehler A. “ Learning OpenCV”. Published by O’Reilly Media, Inc , 1005 Gravenstein Highway North, Sebastopol, CA 95472, 2008. Budiarto W., Purwanto D. “ Robot Vision – Teknik Membangun Robot Masa Depan”. 2012 . J. Fagertun, 2005. Face Recognition. Master Thesis, Technical University of Denmark (DTU). M. Minsky, The Emotion Machine. NY, USA: Simon&Schuster, 2006. P. Ekman, Emotions Revealed: Recognizing Faces and Feelings to Improve Communication and Emotional Life. Holt Paperbacks, 2004. R. Padilla, C. F. F. Costa Filho and M. G. F. Costa, “Evaluation of Haar Cascade Classifiers Designed for Face Detection”, World Academy of Science, Engineering and Technology 64, 2012. Turk M., A.P Pentland. “ Face Recognition using eigensfaces”. IEEE Conference on Computer Vision and Pattern Recognition, 1991. Viola, P. and Jones, M. Rapid object detection using boosted cascade of simple features. IEEE Conference on Computer Vision and Pattern Recognition, 2001. Y. Gang, L. Jiawei, L. Jiayu, M. Qingli and Y. Ming, “Illumination Variation in Face Recognition: A Review”, IEEE Second InternationalConference on Intelligent Networks and Intelligent Systems (ICINIS2009), pp. 309-311. Zhang S., Zhao X, (2012), “Speech Emotion Recognition Using an Enhanced Kernel Isomap for Human-Robot Interaction”, International Journal of Advanced Robotic Systems, Vol. 10.
C-148