1
Klasifikasi Pose Afektif Manusi dari Optical Motion Capture Aang P. Dyaksa, Surya Sumpeno, dan Muhtadin Jurusan Teknik Elektro, Fakultas Teknologi Industri, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief Rahman Hakim, Surabaya 60111 E-mail: surya[at]ee.its.ac.id dan muhtadin[at]ee.its.ac.id,
Abstrak—Dalam pembuatan film animasi, teknologi motion capture (MoCap) sering digunakan untuk merekonstruksi gerakan manusia. Salah satu teknologi motion capture adalah penggunaan Optical Motion capture. Rekonstruksi gerakan manusia yang didapat selanjutnya dipetakan untuk menggerakkan karakter dimensi tiga. Pada proses rekonstruksi gerakan manusia, ada beberapa parameter yang mempengaruhi kualitas dari hasil luarannya. Untuk mendapatkan hasil yang baik diperlukan beberapa pengaturan, di antarannya berupa pengaturan tata letak kamera dan pengaturan marker yang dipasang pada aktor. Setelah proses perekaman, hasil gerakan yang direkam perlu diperbaiki karena hilangnya marker atau terjadi kesalahan identifikasi marker. Luaran dari penelitian ini adalah Human Motion Database (HMDB) berupa gerakan berekspresi dari 4 emosi dasar yaitu marah, takut, senang dan sedih. Database yang terbentuk dievaluasi dengan melakukan proses klasifikasi dan validasi menggunakan metode, Naive Bayes, k-NN, dan Support Vector Machine (SVM). Hasil dari klasifikasi tertinggi didapatkan dengan SVM yaitu dengan nilai akurasi prediksi sebesar 90,62% kemudian k-NN (k=1) 86,67% dan Naive Bayes sebesar 65,00%.
tersebut diperagakan oleh robot, maka robot dapat berinteraksi dengan manusia menggunakan gerakan berekspresi. Untuk mendapatkan hasil proses motion capture yang baik, diperlukan percobaan untuk mengetahui parameter yang berpengaruh dalam proses perekaman mulai sebelum kalibrasi hingga proses mapping BVH ke karakter dimensi tiga. Selain itu, pelaksanaan motion capture ini diperlukan referensi standard operational procedure (SOP). Sebagai langkah pertama untuk mengarah ke komputasi afeksi, diperlukan Human Motion Database (HMDB) dalam file BVH yang berkaitan dengan gerakan berekpresi. Database yang menjadi referensi pada penelitian ini adalah The Bodily Expressive Action Stimulus Test (BEAST) [2]. Pada BEAST terdapat sebuah database citra dari pose manusia yang sedang berpose dengan ekspresi emosi dasar yaitu marah, senang, sedih dan takut. Penelitian [2] menjadi acuan untuk membentuk sebuah database gerakan berekspresi dalam file berdimensi tiga.
Kata Kunci—Optical Motion capture, Human Motion Database, gerakan beremosi.
A. Tahapan Persiapan Area Tangkap Hal pertama yang harus ditentukan adalah tata letak kamera. Tata letak kamera adalah bagaimana penataan dan peletakan kamera agar mendapatkan ruang tangkap yang optimal. Penataan kamera diilustrasikan pada Gambar 1. Penataan kamera dapat dilakukan dengan cara penataaan segi enam. Penataan segi enam berarti letak kamera berada di setiap sudut segi enam. Segi enam yang dibentuk memiliki jarak kurang lebih 3 meter (R2) dari titik pusat. Sedangkan area tangkap dibatasi kurang lebih 1,5 meter (R1) dari titik pusat. Hal berikutnya adalah penentuan tinggi dari tripod. Tinggi dari tripod yang digunakan kurang lebih 2,2 meter (7 feet). Pertimbangannya adalah tinggi aktor rata-rata 170 cm dan apabila sedang melambaikan tangan ke atas tinggi maksimumnya adalah kurang lebih 2,2 meter (lihat Gambar 2).
I. PENDAHULUAN
P
roduksi film animasi di Indonesia saat ini kurang berkembang. Salah satu penyebabnya karena teknologi yang mendukung pembuatan animasi belum berkembang. Hal ini terlihat dari gerakan animasi yang kaku dan kurang alami. Sebagai contohnya yaitu pada gerakan-gerakan dasar manusia seperti berjalan, berlari, melompat atau menggerakkan anggota badan. Untuk menciptakan animasi dengan hasil yang alamiah dapat digunakan teknologi penangkap gerak atau motion capture (MoCap). Sistem MoCap terbagi menjadi 3 jenis yaitu magnetic, mechanic, dan optical. Diantara ketiga sistem tersebut sistem optical dinilai memiliki akurasi yang paling tinggi dan memberikan keleluasaan dalam bergerak [1]. Potensi lain pada hasil dari motion capture yang berupa gerakan berekpresi dapat digunakan sebagai langkah awal untuk penelitian komputasi afeksi. Komputasi afeksi berkaitan dengan interaksi manusia dengan komputer. Dan berkaitan dengan hal tersebut, tidak menutup kemungkinan bahwa robot bisa terinteraksi dan mengekspresikan emosi dengan gerakan. Namun untuk mencapai hal tersebut dibutuhkan penelitian yang menghasilkan gerakan berekspresi. Apabila gerakan
II. DESAIN DAN IMPLEMENTASI PENELITIAN
B. Tahapan Kalibrasi Kamera Kalibrasi kamera dilakukan untuk membuat referensi dimensi tiga relatif untuk setiap kamera sehingga masingmasing kamera memiliki referensi tersendiri dalam ruang dimensi tiga relatif terhadap kamera lain. Kalibrasi kamera digunakan untuk mendapatkan referensi dimensi tiga relatif antara titik origin koordinat dunia (world coordinate) dengan koordinat kamera.
2
Gambar 1. Ilustrasi penangkap gerak dan tata letak kamera
Hal ini dilakukan dengan mengunakan wand-base calibration dari perangkat Optitrack [3]. Wand atau tongkat yang digunakan adalah tongkat khusus bernama Optiwand[4] dengan 3 marker yang berada di ujungnya. Optiwand memiliki fungsi untuk mengkalibrasi ruang tangkap dari masing-masing kamera, sehingga digunakan untuk menentukan seberapa luas area tangkap dari proses perekamanan gerak (motion capture) ini. Selain itu juga digunakan perangkat lain untuk mengkalibrasi terkait penyelarasan koordinat kamera dengan koordinat dunia menggunakan Calibration Square. Perangkat Calibration Square digunakan sebagai acuan atau referensi untuk setiap kamera menentukan titik origin (titik 0,0,0) dan orientasi sumbu x, y, dan z. C. Tahapan Kalibrasi Skeleton Setelah dilakukan kalibrasi kamera, proses selanjutnya adalah kalibrasi skeleton atau kerangka. Kalibrasi skeleton adalah penyamaan persepsi terhadap marker yang ada pada aktor. Marker pada aktor adalah representasi kerangka dari tubuh manusia, sehingga perubahan posisi marker diartikan juga sebagai gerak anggota tubuh dari aktor itu sendiri. Kalibrasi skeleton dimulai dengan menempelkan marker pada aktor (yang sudah memakai suit khusus) dengan menggunakan pola pemasangan yang sesuai dengan Gambar 2. Setiap aktor yang akan memperagakan gerakan diminta untuk melakukan T-pose, yaitu melakukan pose dengan berdiri tegak dan kedua tangan lurus ke samping. Hal ini dilakukan oleh masingmasing aktor, karena bisa saja posisi dari masing-masing aktor bisa sedikit berubah walaupun menggunakan pola pemasangan yang sama. Adanya perbedaan bisa terjadi karena perbedaan postur tubuh baik dari segi tinggi badan, lebar bahu maupun dari berat badan. D. Tahapan Penangkapan Gerak Proses penangkapan gerak dilakukan di area tangkap sesuai dengan hasil kalibrasi kamera. Dalam proses ini marker pada tubuh aktor akan tracking oleh software ARENA [3] dan direpresentasikan menjadi sebuah rag doll atau armature yang dapat dilihat menjadi sebuah tubuh manusia. Yang perlu diperhatikan aktor harus berada dalam area tangkap agar gerakan yang dilakukan dapat terekam dengan baik. Apabila ada salah satu anggota tubuh rag doll (disebut segmen) berwarna merah maka, marker pada segmen tersebut tidak terbaca dan mengakibatnya gerakan pada segmen tersebut tidak sesuai dengan gerakan aktor. Apabila berwarna kuning,
Gambar 2. Peletakan dan nama marker
maka ada beberapa marker yang tidak terbaca namun masih ada kemungkinan gerakan segmen sama dengan gerakan aktor. Hasil rekaman dalam proses ini berupa data marker yang akan digunakan sebagai inputan proses selanjutnya yaitu proses perbaikan trajectory. E. Tahapan Perbaikan Hasil Penangkapan Gerak Pada saat proses perekaman, setiap perpindahan marker akan direkam dan akan di-trajectory lintasan marker tersebut dalam koordinat x, y, dan z. Trajectory adalah pembuatan grafik lintasan perpindahan koordinat untuk masing-masing marker dalam koordinat kartesian dari tiap frame atau satuan waktu. Hasil dari proses perekaman kerap kali terjadi error yang mengakibatkan gerakan yang ditangkap menjadi tidak beraturan, tidak wajar atau kasar. Error ini bisa terjadi oleh beberapa hal baik dari faktor luar maupun kesalahan pengguna. Error-error tersebut dapat diperbaiki dari trajectory masing-masing marker. Permasalahan yang kerap terjadi adalah tidak terbacanya marker dan direpresentasikan adanya jeda atau hole dari trajectory marker tersebut. Error lain yang terjadi adalah terjadinya ripple pada sebuah trajectory marker. Terlihat dengan adanya perpindahan posisi yang dari sebuah marker, pada grafik trajectory terlihat lonjakan pada salah satu atau beberapa sumbu koordinat. Error selanjutnya adalah tertukar pembacaan marker satu dengan marker yang lain, sehingga mengakibatkan tertukarnya segmen atau anggota tubuh yang bergerak. Hal ini dapat diperbaiki dengan melakukan penukaran pembacaan marker pada frame dimana marker tersebut tertukar. Setelah dilakukan perbaikan marker, data rekaman gerak dapat di-export menjadi file BVH. Setelah didapatkan file BVH, dapat dilakukan proses retargeting pada karakter dimensi tiga. F. Tahapan Pembuatan Database Dalam proses perekaman, seorang aktor diminta untuk memperagakan beberapa gerakan berekspresi. Gerakan berekspresi yang diperagakan ada 4 macam, yaitu gerakan ekspresi senang (HAPPY), sedih (SAD), takut (FEAR), dan marah (ANGRY). Penentuan 4 ekspresi ini berdasarkan pada literartur [2] dimana literartur tersebut membuat dan melakukan validasi bentuk ekspresi yang ada pada gerak
3
Gambar 3. Pemilihan pose berdasarkan BEAST (a) Ekspresi senang; (b) ekspresi marah; (c) ekspresi sedih; (d) ekspresi takut.
tubuh manusia saat bereaksi terhadap emosi tertentu. Untuk penyusunan data, nama file yang disimpan memiliki format sebagai berikut: “Nama-aktor_Jenis-Ekspresi_Urutanperagaan.bvh”. Dengan catatan, karakter “_” tidak digunakan. Sehingga saat perekaman aktor dengan ekspresi senang (disingkat HA) pada urutan peragaan ke 01, nama file menjadi “AktorHA01.bvh”. Penyusunan hasil perekaman akan ditata berdasarkan nama, jenis emosi dan urutan peragaan untuk masing-masing hasil perekaman. G. Tahapan Klasifikasi Gerak Berekspresi Dalam tahapan ini, dilakukan proses klasifikasi emosi dari gerakan yang telah dihasilkan oleh proses perekaman. Proses klasifikasi dibutuhkan sebuah himpunan data yang berasal dari database dan dilakukan proses ekstraksi fitur terlebih dahulu. Setelah didapatkan fitur-fitur selanjutnya dapat dilakukan proses klasifikasi. Proses klasifikasi ini akan divalidasi atau dievaluasi kemampuan prediksi dengan memberikan data testing baik menggunakan data training itu sendiri maupun menggunakan data testing yang telah disiapkan. 1) Pemilihan Pose Tahapan klasifikasi gerakan berekspresi membutuhkan data set berupa file BVH. Data BVH yang berupa gerakan dengan durasi kurang lebih 5 detik dengan frame per second 100fps. Artinya dalam 5 detik gerakan terdapat kurang lebih 500 frame pose. Dalam proses klasifikasi ekspresi ini, masing-masing BVH diambil 1 pose/frame gerakan. Data tersebut akan menjadi data training untuk proses klasifikasi. Penentuan pose untuk data training dilakukan berdasarkan pose yang ada pada database pose yang ada pada penelitian [2], sebagai contoh lihat pada Gambar 3. 2) Pemilihan Data Testing Data testing adalah data yang diguanakan untuk mengevaluasi hasil dari klasifikasi menggunakan perangkat lunak Weka. Data testing adalah data pose yang pemilihan posenya berdasarkan survei yang dilakukan oleh penulis. Dalam survei, penulis menyertakan gambar pose yang menjadi kandidat data pose yang akan dijadikan data testing.
3) Ekstraksi Fitur Untuk melaksanakan klasifikasi harus didapatkan fiturfitur yang dapat dijadikan sebagai pembeda antara data dari kelas emosi satu dengan data yang berada dikelas emosi yang berbeda. Ekstraksi fitur dilakukan dari file BVH. Pada file BVH terdapat 2 bagian [5] yaitu bagian struktur hirarki dan bagian motion frame. Karena objek yang akan dikalsifikasi adalah berupa pose, maka pada bagian motion hanya ada 1 frame yang akan dijadikan sebagai fitur atau penciri. Pada file BVH, channel yang ada adalah channel translasi dan channel rotasi. Untuk channel translasi hanya terdapat pada joint root, dimana joint root dari BVH yang dihasilkan adalah joint hip. Baik kedua channel yang ada yaitu translasi dan rotasi merupakan nilai terhadap masing-masing sumbu x, y, z. Untuk translasi adalah berupa perbedaan nilai koordinat x, y, dan z antara letak hip dengan titik origin. Sedangkan untuk channel rotasi berarti nilai rotasi terhadap masing-masing sumbu x, y, dan z. Fitur atau penciri ini adalah data nilai untuk masing-masing channel ada pada setiap joint yang ada. Header/nama untuk dari masing-masing kolom dari CSV mewakili channel sesuai dengan struktur dari BVH. Di kolom terakhir pada file CSV ditambahkan 1 kolom yang memberikan informasi bahwa data pada baris tersebut termasuk kelas ekspresi yang mana. 4) Proses Klasifikasi Proses klasifikasi ini akan dilakukan menggunakan alat bantu Weka. Weka adalah alat bantu penambangan data yang yang telah dilengkapi dengan beberapa metode klasifikasi seperti Naive Bayes, k-NN, dan Support Vector Machine (SVM). Untuk masing-masing metode klasifikasi dilakukan proses validasi. Proses validasi dilakukan dengan cross validation dengan 10 folds. Setelah didapatkan hasil validasi yaitu berupa matrik konfusi, metrik kinerja dari proses klasifikasi dianalisa sebagai bahan pengujian pada penelitian ini. III. HASIL PERCOBAAN Pengujian pada tugas akhir ini dibagi menjadi 2 bagian yaitu pengujian kalibrasi kamera dan pengujian klasifikasi ekspresi. Pengujian kalibrasi kamera dilakukan untuk mengetahui pengaruh faktor cahaya pada area tangkap yang digunakan dengan hasil kalibrasi kamera. Setelah dilakukan percobaan dapat dianalisa pengaruh dari cahaya pada proses kalibrasi kamera. Sedangkan pengujian klasifikasi ekspresi dilakukan untuk mengevaluasi data yang dibentuk dari database ekspresi yang mana merupakan salah satu luaran dari tugas akhir ini. Sehingga dengan adanya pengujian yang telah dilakukan didapatkan kesimpulan dari pelaksanaan tugas akhir ini. A. Pengujian Kalibrasi Kamera Pengaturan parameter pada kamera sangat variatif bergantung pada kondisi ruangan, apakah tertutup dari sinar matahari atau tidak. Parameter yang ada pada kalibrasi kamera ini adalah treshold, exposure, dan intensity. Perbedaan kondisi ini akan berbeda dalam mengatur parameter tersebut. Untuk kondisi siang hari, proses kalibrasi tidak bisa dilakukan karena cahaya matahari dominan oleh gelombang inframerah
4
Tabel 1. Matrik konfusi klasifikasi dengan fitur posisi skeleton Data prediksi Hasil klasifikasi
Data aktual
Marah Takut Senang Sedih
Marah 35 0 3 1
Takut 0 39 1 4
Senang 3 0 35 0
Sedih 2 1 1 35
Tabel 2. Matrik konfusi klasifikasi dengan fitur posisi Hasil klasifikasi
Data aktual
Marah Takut Senang Sedih
Data prediksi Marah 36 0 3 2
Takut 0 38 1 2
Senang 3 1 35 1
Sedih 1 1 1 36
Tabel 3. Tabel perbandingan nilai akurasi Data training Menggunakan atribut translasi Tanpa menggunakan atribut translasi
Nilai akurasi 90,00 % 90,62 %
2) Pengujian Data Testing Untuk proses pengujian ini, dilakukan perubahan dari penggunaan proses validasi/prediksi dengan mengubah data testing yang digunakan. Pada penelitian ini, pengujian dilakukan dengan cara dua tipe data testing, data testing menggunakan data training dan data testing yang sudah disiapkan. Data testing yang disiapkan adalah data testing dari frame yang berbeda dengan data training, yaitu hanya 40 instance yang masing-masing kelas memilik 10 instances. Untuk proses validasi yang digunakan menggunakan metode yaitu menggunakan metode 10-fold cross validation. Berikut adalah hasil dari proses pengujian. Tabel 4. Matrik konfusi klasifikasi menggunakan data training Hasil klasifikasi Marah
Data aktual
B. Pengujian Klasifikasi Pose Pengujian klasifikasi ekspresi emosi dilakukan untuk memvalidasi data yang diperoleh selama proses penangkapan data. Data motion capture berupa file BVH yang telah dikelompokkan berdasarkan kelas ekspresi masing-masing. Dari tiap-tiap data BVH, diambil 1 frame yang merepresentasikan ekspresi yang sedang diperagakan. Penentuan dari frame yang diambil berdasarkan pose yang paling mirip dengan pose yang terdapat pada BEAST [2] sebagai acuan. Frame yang dipilih menjadi instances yang mewakili masing-masing file BVH tersebut. Data dari frame yang berupa nilai rotasi masing-masing join di ubah menjadi bentu coma seperated file (csv). Dari 160 bvh didapatkan 160 instances dengan kelas emosi memiliki 40 instances. Untuk selanjutnya data tersebut menjadi data training yang digunakan untuk proses klasifikasi. Dalam penelitian ini, terdapat beberapa variable yang dijadikan dalam proses pengujian. Variabel yang dijadikan sebagai pembanding adalah adanya perbedaan data training, data testing yang dipakai, dan metode klasifikasi yang dipakai. Selain itu perlu ada analisa hasil klasifikasi untuk masingmasing kelas, sehingga dapat dihitung metrik kinerja pada setiap kelas. 1) Pengujian Data training Atribut data training berjumlah 56, terdiri dari 3 atribut translasi dan 53 atribut rotasi. Atribut ini yang akan dijadikan sebagai fitur dalam proses klasifikasi. Dari struktur BVH yang dihasilkan,terdapat nilai atribut berupa nilai koordinat letak dari bvh tersebut. Dan nilai koordinat dari letak tersebut memiliki nilai yang berbeda untuk masing-masing pengambilan data. Sehingga untuk menyamakan kondisi untuk masing-masing file BVH tersebut, nilai koordinat tersebut diabaikan.
Dari hasil proses klasifikasi yang tercantum pada Tabel 1 dan Tabel 2, dari matrik konfusi memberian hasil predikisi yang berbeda. Dari dua matrik konfusi dapat dicari nilai akurasi dari proses klasifikasi (Tabel 3).
Takut Senang Sedih
Data prediksi Marah
Takut
Senang
35 0 3 1
0 39 1 4
3 0 35 0
Sedih
2 1 1 35
Tabel 5. Matrik konfusi klasifikasi menggunakan data testing Hasil klasifikasi Marah
Data aktual
sehingga banyak noise yang ditangkap saat proses kalibrasi. Hal ini terlihat saat dilakukan proses blocking bad segment (noise) pada saat kalibrasi. Pada saat kalibrasi terlihat bahwa setelah diblok, noise tetap ada karena letaknya berubah-ubah. Sehingga blocking noise hanya akan menambah area yang diabaikan. Sehingga apabila semakin banyak area yang diblok maka saat proses perekaman di area tersebut akan diabaikan walaupun ada marker di area tersebut.
Takut Senang Sedih
Data prediksi Marah
Takut
Senang
8 0 0 0
1 10 1 1
1 0 9 0
Sedih
0 0 0 9
Dari Tabel 6 hasil akurasi dari penggunaan data training untuk data validasi/prediksi adalah 90,00% sedangkan untuk data testing yang berbeda memiliki akurasi sebesar 90,00%. Tabel 6. Tabel Nilai akurasi penggunaan data validasi Data validasi Data training Data testing disiapkan
Nilai akurasi 90,00 % yang
90,00 %
3) Pengujian Metode Klasifikasi Pada pengujian selanjutnya, dilakukan pengujian untuk menguji metode klasifikasi mana yang menghasilkan nilai akurasi yang paling tinggi. Untuk metode klasifikasi yang akan digunakan adalah metode klasfikasi Naive Bayes, KNN (K=1) dan SVM. Untuk metode evaluasi yang
5 digunakan adalah metode 10-folds cross validation. Dan untuk data yang digunakan adalah data training dengan atribut translasi. Untuk hasil pengujian dapat dilihat pada Tabel 7, Tabel 8, dan Tabel 9.
True Negative dibandingkan dengan jumlah data yang ada, atau dengan persamaan (1) sebagai berikut:
Tabel 7. Matrik konfusi klasifikasi menggunakan Naive Bayes
Sedangkan untuk nilai Precision, Sensitivity, dan Specificity dapat dihitung dengan menggunakan persamaan (2), (3), dan (4) berdasarkan penelitian [6]:
Hasil klasifikasi
Data aktual
Marah Takut Senang Sedih
Data prediksi Marah
Takut
Senang
34 5 7 16
1 27 4 5
3 4 25 2
Sedih
𝐴=
2 4 3 18
𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 (𝜌) = 𝑃𝑟𝑒𝑐𝑖𝑠𝑠𝑖𝑜𝑛 (π) =
Tabel 8. Matrik konfusi klasifikasi menggunakan k-NN (k=1) Hasil klasifikasi
Data aktual
Marah Takut Senang Sedih
Data aktual
Marah Takut Senang Sedih
𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦 =
Data prediksi Marah
Takut
Senang
33 0 1 5
0 38 1 2
5 2 36 2
Sedih
2 0 1 32
Tabel 9. Matrik konfusi klasifikasi menggunakan SVM Hasil klasifikasi
𝑇𝑃+𝑇𝑁
Data prediksi Marah
Takut
Senang
35 0 3 1
0 39 1 4
3 0 35 0
Sedih
2 1 1 35
Dari ketiga tabel Tabel 7, Tabel 8 dan Tabel 9 dapat dibandingkan akurasi dari masing-masing metode klasifikasi yang digunakan. Pada tabel 10 adalah perbandingan nilai akurasi dari masing-masing nilai akurasi untuk ketiga metode klasifikasi. Tabel 10. Tabel nilai akurasi prediksi Metode klasifikasi Naive bayes KNN (K=1) SVM
Nilai akurasi 65,0 % 86,87 % 90,62 %
Dari hasil perbandingan akurasi ketiga metode pada Tabel 10, nilai akurasi paling tinggi didapatkan apabila menggunakan metode klasifikasi SVM dengan nilai akurasi sebesar 90,62% dan untuk metode k-NN (k=1) memiliki nilai akurasi sebesar 86,87%. Sedangkan untuk metode klasifikasi Naive Bayes memilik nilai akurasi sebesar 65,0%. Dari hasil ini nilai akurasi prediksi paling tinggi didapatkan apabila menggukan metode klasifikasi SVM. 4) Metrik Kinerja Kelas Emosi Dari Tabel 10, yaitu matriks konfusi dari hasil validasi/prediksi dengan menggunakan metode klasifikasi SVM dapat dibandingkan bahwa tiap kelas memiliki nilai akurasi yang berbeda. Akurasi tiap kelas dapat dihitung dengan membandingkan nilai True Positive (TP) ditambah
(1)
𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁
𝑇𝑃
(2)
𝑇𝑃+𝐹𝑁 𝑇𝑃
(3)
𝑇𝑃+𝐹𝑃 𝑇𝑁
(4)
𝑇𝑁+𝐹𝑃
Hasil untuk masing-masing persamaan akurasi, Precision, Specificity dan Sensitivity terdapat pada Tabel 11. Tabel 11. Metrik Kinerja Kelas Emosi Kelas Emosi Marah Takut Senang Sedih
Akurasi (%) 94,37 96,87 94,37 95,62
Precision (%) 87,80 92,68 89,74 92,31
Sensitivity (%) 90,0 95,0 87,5 90,0
Specificity (%) 95,83 97,50 96,67 97,50
Dari hasil perhitungan akurasi pada Tabel 11, prediksi dengan nilai akurasi paling tinggi terdapat pada kelas emosi takut dengan nilai akurasi sebesar 96,87%. Untuk kelas emosi senang dengan nilai akurasi sebesar 94,37% , kelas emosi marah dengan nilai akurasi sebesar 94,37% dan kelas emosi sedih dengan nilai akurasi sebesar 95,62%. Kelas takut memiliki nilai specifity paling tinggi sebesar 97,50% yaitu kemampuan klasifikasi untuk membedaan data yang bukan dari kelas takut diantara semua data selain kelas takut. Sedangkan untuk sensitivity tertinggi adalah dari kelas takut yaitu sebesar 95% yaitu kemampuan metode klasifikasi dalam mendapatkan informasi yang sesuai (TP) jika dibandingkan dengan jumlah semua data kelas takut yang diprediksi bukan sebagai kelas takut (TP ditambah dengan FN). Selain itu, kelas takut juga memiliki nilai precision paling tinggi sebesar 92,68% yaitu kemampuan memprediksi kelas takut dengan benar diantara jumlah prediksi data terhadap kelas takut. Kelas marah paling sulit dibedakan, berdasarkan metrik kinerja (Tabel 11) dengan nilai precission dan specificity lebih rendah dibandingkan lainnya yaitu 87,80% dan 95,83% (lihat Tabel 11). IV. KESIMPULAN DAN SARAN A. Kesimpulan Penelitian ini menghasilkan human motion database (HMDB) gerakan berekpresi. Gerakan ekpresi yang diperagakan berupa emosi marah, takut, senang dan sedih.
6 Dari database yang dihasilkan dipilih pose untuk masingmasing peragaan berdasarkan penelitian BEAST. Pada proses pengujian didapatkan beberapa hasil analisis yaitu sebagai berikut: 1. Hasil dari proses perekaman gerak dipengaruhi oleh faktor cahaya matahari yang ada pada ruangan. 2. Data training dengan fitur posisi pusat skeleton tidak terlalu berpengaruh terhadap nilai akurasi, data training tanpa fitur posisi pusat skeleton memiliki nilai akurasi prediksi 90,62% sedangkan tanpa fitur tersebut nilai akurasinya 90,00%. 3. Metode SVM memiliki nilai akurasi prediksi paling tinggi selama proses pengujian yaitu sebesar 90,62% dibandingkan dengan metode k-NN (k=1) 86,87% dan Naive Bayes hanya 65,00%. 4. Kelas emosi takut memiliki nilai precission tertinggi dibanding kelas yang lainnya 92,68%, sedangkan untuk kelas sedih 92,31%, kelas senang 89,74% dan kelas marah 87,80%. B. Saran Untuk pengembangan lebih lanjut mengenai tugas akhir ini, penulis memberikan saran: 1. Kamera yang digunakan menggunakan pre-proses dengan algoritma tertentu, dalam penelitian selanjutnya pre-proses pada kamera dapat dikembangkan agar didapat hasil yang lebih optimal. 2. Proses perekaman gerak lebih baik dilakukan di ruang tertutup sehingga tidak bergantung pada kondisi cahaya didalam ruangan. 3. Untuk penelitian selanjutnya proses klasifikasi dapat dikembangkan tidak hanya dari himpunan data yang berupa pose, tapi juga berupa himpunan data gerakan. DAFTAR PUSTAKA [1] Guerra-Filho, Gutemberg B. “Optical Motion capture: Theory and Implementation”. In RITA, Volume XII, Chapter 2, 2005. [2] De Gelder, B. & Van den Stock, J. (2011). The Bodily Expressive Action Stimulus Test (BEAST). Construction and validation of a stimulus basis for measuring perception of whole body expression of emotions. Frontiers in Psychology 2:181. [3] OptiTrack Natural Point Inc. Natural Point Inc. http://www.naturalpoint.com/optitrack/. Diakses pada tanggal 15 Maret 2013. [4] Part & Accessories: Suits & Markers. Natural Point Inc. http://www.naturalpoint.com/optitrack/products/suits-markers/ diakses pada tanggal 28 April 2013. [5] Meredith, M. and S.Maddock. Motion capture File Formats Explained. Department of Computer Science, University of Sheffield, United Kingdom. [6] Parikh Rajul, Annie Mathai, Shefali Parikh, G Chandra Sekhar, and Ravi Thomas. Understanding and using sensitivity, specificity and predictive values. Indian J Ophthalmol. 2008 Jan-Feb; 56(1): 45–50. United Stated.