BAB 2 Landasan Teori
Pengenalan manusia secara otomatis menggunakan mesin merupakan masalah yang menantang dan telah menjadi banyak perhatian selama beberapa tahun terakhir. (Jawad, Syed, dan Farrukh, 2008). Agar mesin dapat mengenali manusia, maka mesin harus mendapatkan sebuah informasi biometric dari manusia tersebut. Informasi biometric tersebut dapat berupa DNA, bentuk telinga, bentuk wajah, bentuk sidik jari, suara, retina mata, bentuk pembuluh nadi, dan Iris mata (Anil, Arun, dan Salil, 2004). Informasi biometric tersebut akan diambil dengan menggunakan sensor pada mesin. Kemudian informasi tersebut diproses oleh mesin, sehingga mesin akan mengenali manusia dengan informasi biometric dari manusia tersebut. Pengenalan manusia secara otomatis sendiri sudah banyak diteliti jauh sebelum tahun 1990 dan telah banyak yang sudah meneliti pengenalan manusia secara otomatis menggunakan informasi wajah, sehingga saat ini sudah banyak penemuan metodemetode untuk mengenali wajah manusia. Namun dari semua metode yang ada, terdapat kelebihan dan kekurangan pada masing-masing metode tersebut.
2.1 Pengenalan Wajah Manusia Pada bab sebelumnya, sudah dibahas bahwa kemampuan mesin dalam mengenali wajah manusia tidak secepat yang dilakukan oleh manusia. Seorang manusia dapat mengenali beberapa wajah manusia dengan penerangan cahaya yang berbeda, ekspresi wajah dan luka pada wajah. Kemampuan manusia inilah yang kemudian diteliti dan dikembangkan teorinya, sehingga teori-teori inilah yang nantinya akan diterapkan pada mesin sehingga mesin akan memiliki kemampuan yang mendekati manusia. Kemampuan manusia dalam pengenalan suatu objek didukung peranan jaringan syaraf otak, dimana jaringan syaraf otak ini melakukan proses pembelajaran serta penyimpanan akan hal-hal yang berhubungan dengan objek tersebut (Agnes, Andrew, Nizar, 2014). Dari pernyataan tersebut dapat dilihat bahwa mesin harus mempunyai kemampuan untuk melakukan proses pembelajaran dan penyimpanan
5
6 akan hal-hal yang berhubungan dengan objek yang akan dikenali, dalam hal ini objek tersebut adalah wajah manusia yang akan dikenali.
Tahapan-tahapan yang berlangsung pada sistem pengenalan wajah manusia adalah sebagai berikut:
a. Image Processing Tahapan ini bertujuan untuk mereduksi dimensi dari gambar agar proses pengenalan wajah manusia dapat berlangsung lebih cepat. Dengan Image Processing ini ukuran gambar yang diperoleh dari sensor berupa kamera dapat diperkecil, namun informasi yang ada pada gambar tersebut tetap terjaga
b. Learning Dalam tahapan ini gambar yang sudah dikompresi tersebut dipelajari dan dikenali oleh mesin, sehingga mesin akan dapat mengenali wajah manusia dari gambar tersebut.
2.1.1
Image Processing Tahapan Image Processing ini bertujuan untuk mengecilkan ukuran gambar yang
diperoleh dari kamera. Semakin baik resolusi kamera yang digunakan maka semakin baik juga kualitas gambarnya. Namun penggunaan resolusi kamera yang besar akan membuat ukuran gambar yang diperoleh menjadi besar, sehingga ukuran gambar yang besar ini akan membuat proses pembelajaran dan pengenalan menjadi lebih lama, sehingga dibutuhkan Image Processing agar kualitas gambar tetap terjaga namun ukuran gambar lebih kecil dan proses pengenalan wajah menjadi lebih cepat. Ada beberapa algoritma yang ditawarkan untuk mereduksi dimensi dari sebuah gambar. Algoritma tersebut antara lain: A. Linear Discriminant Analysis Linear Discriminant Analysis (LDA) telah berhasil digunakan sebagai teknik mereduksi dimensi untuk banyak masalah, seperti speech recognition,
7 face recognition, dan pengambilan informasi multimedia (Yu, Yang, 2001). LDA mereduksi gambar dengan cara mencari matriks W untuk memaksimalkan nilai perbandingan antara matriks penyebaran antar kelas (Sb) dan matriks penyebaran dalam kelas (Sw). B. Principal Component Analysis Principal Component Analysis merupakan metode statistika yang digunakan untuk mereduksi / mengurangi dimensi input tanpa kehilangan informasi penting dari input. Dalam PCA, seluruh dataset yang dimiliki akan diproyeksikan kedalam subspace yang berbeda untuk mendapatkan arah (component) yang memaksimalkan variance dari dataset yang dimiliki. Secara umum penyelesaian PCA dilakukan dalam 4 tahap yaitu : 1. Input data (m x n), dimana m : jumlah pixel dan n : jumlah citra atau sampel. 2. Preprocessing PCA dengan melakukan standarisasi dan mencari covariance atau correlation matrix. 3. Proses
PCA
dengan
menggunakan
EVD
(Eigen
Value
Decomposition) atau SVD (Singular Value Decomposition). 4. Output yang merupakan data hasil transformasi (m x k), dimana m : jumlah pixel dan k : jumlah principal component.
2.1.2
Learning Jaringan syaraf tiruan merupakan suatu jaringan syaraf yang dibentuk
berdasarkan jaringan syaraf manusia menggunakan program komputer. Jaringan syaraf tiruan juga dapat dikatakan sebagai otak buatan yang berusaha untuk mensimulasikan proses pembelajaran pada otak manusia. Pada otak dan jaringan syaraf manusia, neuron merupakan bagian pemroses terkecil. Pada neuron terdapat dendrit, sinapsis, nukleus, dan akson. Dendrit merupakan bagian yang menerima rangsangan. Rangsangan yang diterima akan diberikan pada nukleus. Respon dari nukleus akan disampaikan kepada neuron lain melalui akson. Bagian yang menerima respon tersebut disebut sebagai sinapsis.
8 Jaringan syaraf tiruan juga terdiri dari neuron tiruan. Neuron tiruan ini dapat berfungsi seperti neuron pada manusia. Permodelan dari neuron tirun dapat digambarkan dengan gambar berikut.
Gambar 2.1 Contoh Jaringan Saraf Tiruan
Jika disetarakan dengan neuron pada manusia maka p merupakan rangsangan, weight (W) dan bias (b) merupakan sinapsis, dan a merupakan hasil respon dari rangsangan yang nantinya dapat disalurkan menggunakan akson. Secara matematik neuron tiruan dapat dituliskan sebagai berikut. . . . . . . . . . . . . . . .(1) . . . . . . . . . . . . . . . .(2) Pada neuron tiruan, nilai W dan b dapat diatur. Dengan menemukan nilai W dan b yang tepat neuron dapat digunakan untuk beberapa tujuan yang khusus dengan melihat hubungan antara input dan output. Untuk menemukan nilai W dan b yang tepat dapat dilakukan dengan menggunakan learning rule. Berdasarkan metodenya learning rule dibedakan menjadi dua yaitu supervised learning dan unsupervised learning. Pada dasarnya supervised learning merupakan metode dimana mencari nilai W dan b dengan menentukan target yang akan dicapai sebelumnya, sedangkan pada unsupervised learning, target dari proses pembelajaran tidak ditentukan. a. Supervised Learning Supervised learning rule memiliki sekumpulan hubungan input dengan target yang ingin dicapai secara matematik dapat dituliskan dalam persamaan berikut. {p1, t1} , {p2, t2} , …, {pn, tn}
9 Dimana (pn) merupakan input ke jaringan syaraf dan (tn) merupakan target atau output yang diinginkan. Ketika input diberikan pada jaringan, output dari jaringan akan dibandingkan dengan target. Kemudian learning rule digunakan untuk menetukan W dan b dari jaringan dengan tujuan agar output dari jaringan dapat sedekat mungkin dengan target. Jarak antara output jaringan dengan target digunakan sebagai pengukuran error dan digunakan untuk memperbaiki parameter dari jaringan. Metode learning rule ini sangat sering digunakan karena dapat dipakai dalam pembelajaran yang bersifat alami. Dalam metode ini dibutuhkan sekumpulan input dan pola output yang disebut training set.
b. Unsupervised Learning Metode unsupervised learning, W dan b diatur hanya berdasarkan respon terhadap input pada jaringan yang diberikan. Tidak ada target output. Kebanyakan algoritma yang digunakan pada metode ini menggunakan operasi pengelompokan. Jaringan belajar mengelompokan pola input dalam beberapa kelas. Ini berguna dalam aplikasi seperti penghitungan vector. Dalam unsupervised learning respon yang diinginkan tidak diketahui sehingga, informasi error yang dihasilkan tidak dapat digunakan untuk memperbaiki sifat jaringan. Karena tidak ada informasi yang dapat menetuka benar atau salah dari respon yang dihasilkan, pembelajaran dilakukan dengan observasi respons terhadap input yang tidak diketahui. Jaringan harus mampu menemukan dengan sendirinya kemungkinan adanya pola, aturan, dan perbedaan. Ketika menemukan hal tersebut jaringan akan mengatur parameter dari jaringan. Feedback atau umpan balik menjadi pusat dari metode learning ini. Metode ini dapat memahami atau mengenali pola dari yang terjadi dari hubungan sebab-akibat.
10 2.2 Pengenalan Wajah menggunakan Image Compression dan Artificial Neural Network Pengenalan wajah merupakan salah satu masalah yang menantang dan up to date, karena tidak ada teknik yang menghasilkan solusi yang kuat untuk semua situasi (Jawad, Syed dan Farukh, 2008). Jawad, Syed dan Farukh (2008) mengatakan bahwa pengenalan wajah dibagi menjadi 4 tahap, yaitu input, pre-process, classifier, dan output. Berikut ini blok diagram dari tahap-tahap pengenalan wajah menggunakan Image Compression dan Artificial Neural Network.
Gambar 2.2 Tahap-tahap Pengenalan Wajah menggunakan Image Compression dan Artificial Neural Network. Sumber: A MATLAB based Face Recognition System Using Image Processing and Neural Networks. (Jawad, Syed dan Farukh, 2008)
Teknik yang digunakan dalam penelitian sebelumnya oleh Jawad, Syed dan Farukh (2008) adalah sebagai berikut two dimensional discrete cosine transform (2DDCT) untuk mengompresi gambar wajah dan Self-organizing maps (SOM) untuk mengklasifikasi apakah input gambar sudah ada atau belum di dalam database. Pada penelitian sebelumnya, mula-mula objek yang akan dikenali diambil gambarnya sebanyak lima buah gambar untuk dimasukkan ke dalam database. Pengambilan gambar tersebut menggunakan kamera digital Canon Powershot S3 IS 6.0 megapixel dengan ukuran gambar 1200 × 1600 pixels (2.0 megapixels). Adapun pada penelitian tersebut batasan-batasannya antara lain, pencahayaan yang sama untuk semua kondisi pengambilan gambar database, warna cerah digunakan
11 untuk latar belakang, posisi wajah tegak lurus dan menghadap kamera, dan toleransi untuk memiringkan atau memutar kepala sebesar 20 derajat. Setelah itu gambar yang diambil akan diproses terlebih dahulu menggunakan Adobe Photoshop CS2 untuk mengatur tingkat warna dan saturasi serta mengatur brightness dan contrast ke skala yang sama untuk setiap gambar, juga desaturating 24 bit RGB menjadi 8 bit grayscale, dan menyimpannya ke format JPEG. Gambar yang sudah diambil, selanjutnya dikompresi menggunakan teknik 2D-DCT dengan memanfaatkan MATLAB Image Processing Toolbox untuk mengurangi ukuran gambar dari 512 × 512 pixels menjadi 8 × 8 pixels. Setelah dikompresi melalui teknik 2D-DCT, gambar hasil kompresi akan menjadi input untuk dilatih menggunakan artificial neural network dengan teknik Self Organizing Map atau juga sering disebut Kohonen Map. Metode ini merupakan salah satu proses unsupervised learning, dimana belajar untuk mendistribusikan sejumlah pola tanpa ada informasi atau target (Jawad, Syed, dan Farukh, 2008). Proses pembelajaran dengan metode ini dimaksudkan agar mesin dapat mengenali serta mengelompokan 25 gambar wajah yang telah dikompresi menjadi lima kelas, berdasarkan wajah kelima orang yang telah diambil gambarnya.
Gambar2.3 Image Database setelah dilatih menggunakan Self-Organizing Map. Sumber: A MATLAB based Face Recognition System Using Image Processing and Neural Networks. (Jawad, Syed dan Farukh, 2008)
12
Gambar 2.4 Gambar yang belum dilatih. Sumber: A MATLAB based Face Recognition System Using Image Processing and Neural Networks. (Jawad, Syed dan Farukh, 2008)
Kemudian pada saat pengujian menggunakan gambar baru yang tidak ada dalam database gambar tersebut mesin dapat mengenali hingga 81,36 % setelah dilatih sebanyak 850 kali perulangan.
2.3 A Direct LDA Algorithm for High-Dimensional Data – with Application to Face Recognition Linear Discriminant Analysis telah berhasil digunakan sebagai teknik pengurangan dimensi untuk beberapa kasus, antara lain speech recognition, face recognition,dan pengambilan informasi multimedia(Yu, Yang, 2001).Tujuan dari LDA adalah untuk mencari matriks W sehingga perbandingan antara ScatterBetween Matrix (Sb) dan Scatter Within Matrix (Sw), sesuai dengan persamaan berikut.
W = arg max
WS bW T WS wW T
Dalam system pengenalan wajah, banyak teknik yang sudah ditawarkan. Di antara teknik-teknik tersebut yang paling menonjol adalah pendekatan two stage PCA+LDA (Yu, Yang, 2001).
W = WLDAWPCA Inti dari algoritma direct LDA solution terletak pada ide diagonalisasi simultan, sama seperti pada algoritma LDA yang tradisional. Algoritma direct LDA mencoba mencari matriks yang secara simultan mendiagonalisasi Sw dan Sb, sesuai dengan persamaan:
WS wW T = I ,
WS bW T = Λ
13 Dimana
adalah matriks diagonal dengan elemen diagonalnya disusun
menurun. Ide dari algoritma ini adalah untuk menghilangkan null space dari matriks Sb yang berisi informasi yang tidak penting, dan menjaga null space dari matriks Sw yang berisi informasi yang bersifat diskriminatif. Hal ini dapat dilakukan dengan mendiagonalisai Sb terlebih dahulu setelah itu mendiagonalisasi Sw.
Gambar 2.5 Cara Kerja Algoritma Direct LDA
Dapat dilihat dari gambar 2.5 mula-mula matriks Sb didiagonalisasi, kemudian nullspace dari matriks Sb yang sudah didiagonalisasi dibuang dan mengubah diagonalnya menjadi 1 sehingga berubah menjadi matriks identitas (I). Kemudian matriks Sw didigonalisasi sehingga memperoleh matriks Dw yang merupakan matriks subspace gambar dalam LDA. Percobaan pengenalan wajah menggunakan algoritma direct LDA dilakukan pada gambar wajah dari Olivetti-Oracle Research Lab (ORL). Dataset dari ORL terdiri dari 400 gambar wajah tampak depan, yang merupakan 10 gambar wajah dari 40 individu yang berbeda, dengan variasi pose, pencahayaan, ekpresi, serta aksesoris. Gambar dari setiap wajah berukuran 92 x 112 pixels, dengan level keabuan dari 0 sampai dengan 255. Percobaan dilakukan dengan memilih secara acak 5 gambar wajah setiap orang untuk dilatih dan 5 gambar lainnya untuk di-testing. Adapun hasil dari percobaan tersebut diperoleh persentase pengenalan sebesar 90,8% tanpa ada proses dimentionality reduction. Dengan adanya proses dimensionality reduction rata-rata pengenalan menjadi 86,6%.
14