PAPER ID : 102 Perbandingan Unjuk Kerja Pengenalan Wajah Berbasis Fitur Local Binary Pattern dengan Algoritma PCA dan Chi Square Eko Wahyudi1), Hendra Kusuma2), Wirawan3) 1,2,3)
Jurusan Teknik Elektro ITS, Surabaya 60111
1)
email:
[email protected]
Abstrak – Algoritma pengenalan wajah dapat dibedakan menjadi 2 bagian yaitu dengan pendekatan fitur dan pendekatan penampilan. Pada makalah ini akan dibahas teknik pengenalan wajah dengan pendekatan fitur berdasarkan Local Binary Pattern (LBP) dengan berbagai variasi pencahayaan. Pada prinsipnya metoda ini akan mengekstrasi fitur wajah dalam bentuk kode-kode biner yang diperoleh dari proses binary derivatives. Kode-kode ini kemudian akan dijadikan ftur berdasarkan histogram kode-kode tersebut. Gabungan Proses LBP dan Histogram Equalization (HE) akan meningkatkan tingkat pengenalan wajah walaupun citra input wajah mempunyai berbagai variasi pencahayaan.Uji coba dilakukan pada database wajah Yale B yang terdiri citra-citra gray scale dari 10 orang dengan variasi pencahayaan yang berbeda. Algoritma pengenalan wajah yang akan dibandingkan unjuk kerjanya adalah algoritma PCA (Principal Componen Analysis) yang berfungsi untuk mereduksi fitur LBP dan metode Chi Square dimana 2 buah distribusi histogram dari citra test dan training akan dibandingkan. Hasil uji coba menunjukkan metode Chi Square lebih baik dibandingkan LBP-PCA dengan akurasi mencapai 100% untuk ukuran window sebesar 11x11. Kata Kunci: Local Binary Pattern,PCA, Histogram Equalization, Chi Square.
dalam makalah ini akan diusulkan suatu metode untuk mengekstrasi fitur wajah, yaitu dengan LBP Normal. Metode ini akan merubah citra ke dalam bentuk citra LBP sehingga variasi pencahayaan pada citra wajah orang yang sama dapat dihilangkan. LBP juga akan mengekstrasi citra tersebut kedalam fitur vektor sehingga pengenalan wajah menjedi lebih akurat.
Gambar 1. Citra-citra wajah yang sama dengan pencahayaan yang berbeda (Yale B Face Database)
2. Struktur Sistem Pengenalan Wajah Sistem pengenalan wajah merupakan sistem pengenalan pola (pattern recognition) yang terdiri dari 4 modul , 4 modul tersebut antara lain :
1. PENDAHULUAN Proses pengenalan wajah dipengaruhi oleh dua faktor variabilitas , yaitu variabilitas extra-personal dan intra-personal. Variabilitas extra-personal timbul karena proses pengenalan wajah dilakukan pada wajah yang berbeda. Sedangkan variabilitas intra-personal adalah variasi yang muncul pada wajah yang sama [1]. Salah satu faktor variabilitas intra-personal timbul karena adanya variasi pencahayaan. Variasi pencahayaan ini disebabkan oleh sumber cahaya atau intensitas cahaya yang berbeda. Hal ini memberikan perbedaan yang sangat berarti seperti dapat dilihat pada gambar 1. gambar wajah yang berasal data base Yale B. Untuk mengatasi permasalahan tersebut,
Modul akuisisi data/sensor, melalui modul ini akan didapatkan citra wajah dari para pengguna. Modul pemrosesan awal (preprocessing), modul ini akan mengekstrak bagian wajah (facial region) kemudian menormalisasi terhadap ukuran, rotasi serta pencahayaan (photometric normalization). Modul ekstraksi fitur, modul ini bertujuan untuk mendapatkan satu set fitur yang berasal dari bagian wajah yang telah ternormalisasi, dimana satu set fitur tersebut berasal dari bagian wajah yang telah ternormalisasi menggunakan LBP. Modul pencocokan (matching), modul ini akan mencocokkan fitur-fitur yang telah diperoleh dari citra wajah yang diinputkan terhadap template/model yang ada di database sistem. Hasil dari prosedur pencocokan ini akan digunakan untuk pengambilan keputusan tentang identitas pengguna.
Struktur sistem pengenalan wajah dibagi menjadi 2 tahap yaitu tahap enrollment/registrasi dan tahap pengenalan pada sistem pengenalan wajah. Pada tahap enrollment akan dibentuk model atau Template berdasarkan vektor-vektor fitur LBP yang terekstrak
dari sejumlah citra training atau citra wajah pemakai. Kemudian Template-template ini disimpan dalam suatu basis data. Sedangkan pada tahap pengenalan sistem akan memberikan output berupa identitas
wajah di basis data yang paling mirip dengan citra test dengan menguji kemiripan fitur vektor (feature vector) dari citra test dan training [2]. Struktur sistem pengenalan wajah ini dapat dilihat pada gambar 2.
Gambar 2. Diagram fungsional sistem pengenalan wajah. Bagian atas merupakan tahap registrasi/enrollment sedangkan bagian bawah merupakah tahap pengenalan.
3. LOCAL BINARY PATTERN Local Binary Pattern (LBP) adalah deskriptor tekstur yang dapat juga digunakan untuk mewakili wajah, karena gambar wajah dapat dilihat sebagai sebuah komposisi micro-texture-pattern yaitu suatu operator non parametrik yang menggambarkan tata ruang lokal citra. LBP didefinisikan sebagai perbandingan nilai biner piksel pada pusat citra dengan 8 nilai piksel disekelilingnya. Misal pada sebuah citra berukuran 3x3, nilai biner pada pusat citra dibandingkan dengan nilai sekelilingnya. Nilai sekelilingnya akan bernilai 1, jika nilai piksel pusat lebih kecil dan bernilai 0 jika nilai biner pusat lebih besar. Setelah itu, menyusun 8 nilai biner searah jarum jam atau sebaliknya dan merubah 8 bit biner kedalam nilai decimal untuk menggantikan nilai piksel pada pusat.[3]
Gambar 3. Local Binary Pattern (LBP)[3]
Nilai desimal dari 8 bit dari ( LBP code ) dapat dinyatakan dalam persamaan berikut:
LBPP,R 𝑥c , yc =
𝑝−1 𝑝=0 s
𝑔p − g c 2p
(1)
Dan fungsi s(x) didefinisikan sebagai berikut: s 𝑥 =
1, 𝑥 ≥ 0 0, 𝑥 < 0
(2)
Gambar 4. Citra-citra hasil operasi Local Binary Pattern (LBP) yang menunjukkan ketahanan LBP terhadap variasi pencahayaan
Fungsi (1) bertujuan untuk menghilangkan variabilitas yang disebabkan oleh iluminasi kontras sehingga citra wajah dengan berbagai variasi pencahayaan akan mendapatkan output yang hampir mirip. Dengan melakukan ekstrasi piksel menggunakan LBP, maka didapatkan suatu nilai matrik baru yang akan dirubah kesuatu histogram untuk memperoleh fitur vektor wajah.
4. HISTOGRAM EQUALIZATION (HE) Histogram equalization merupakan suatu metode penyesuaian kontras menggunakan histogram dari citra wajah. Nilai histogram equalization didapatkan dengan cara memperlebar puncak dan memperkecil titik minimum dari histogram citra supaya penyebaran nilai piksel pada tiap citra merata (uniform), sehingga memperbaiki kekontrasan citra secara keseluruhan. Proses ini bekerja dengan cara meyebarkan hargaharga intensitas piksel yang sering terjadi secara merata pada citra[4]. Seperti ditunjukkan pada Gambar 5.
𝑇 = [𝑇1 , 𝑇2 , … , 𝑇𝑃 ]
Gambar 5. Histogram equalization [5]
HE yaitu pemetaan nonlinear monotonik yang membagi nilai intensitas piksel pada citra input. Hal ini terkait dengan distribusi kecerahan semua nilai pada citra. Teknik ini sering digunakan dalam perbandingan citra karena efektif dalam meningkatkan detail dan koreksi. Secara umum, histogram Equalization menyebabkan kontras citra meningkat karena dynamic range mengalami peregangan dengan distribusi kepadatan dari citra dibuat sama. Secara umum, Histogram Equalization dapat didefinisikan 𝑛𝑖 sebagai berikut, jika probabilitas p(i) = . Yaitu 𝑁 histogram dari I(x.y) pada kehadiran suatu piksel dengan gray level i, dimana i = 0, 1, ...., k-1 dan ni merupakan jumlah piksel pada I(x,y) dengan harga gray level i. Maka mapping dari suatu harga intensitas dinyatakan , i menjadi inew dinyatakan sebagai[4]: inew
i 0
k 1
ni k 1 i 0 p(i) N
adalah menentukan dan mempertahankan komponen – komponen dari sekumpulan citra yang mempunyai distribusi maksimum. PCA digunakan untuk mendapatkan vektor-vektor atau disebut juga sebagai principal component yang dapat memberikan informasi tentang variance maksimum database wajah. Setiap principal component merupakan representasi dari suatu kombinasi linier dari semua citra-citra wajah training yang sudah dikurangi dengan mean citra. Gabungan dari citra wajah inilah yang dinamakan eigenface. Eigenface-eigenface ini adalah merupakan fitur dari suatu citra wajah yang akan dikenali. Hal umum yang dilakukan pada teknik PCA adalah dengan menyusun citra training kedalam sebuah matrik. Dengan mendefinisikan terlebih dahulu citra wajah berukuran (Nx x Ny) dikonversi kedalam sebuah matrik satu kolom (T) dengan ukuran (N x 1) dimana ukuran dari N = (N x x Ny) yang kemudian disusun menjadi training set berukuran (N x P). P adalah jumlah dari citra-citra training.
(3)
Persamaan (3) mendefinisikan bahwa suatu mapping dari harga-harga intensitas piksel original, yaitu dari 0-255 menuju domain 0-1. Oleh Karena itu untuk menghasilkan harga piksel pada domain original, harga inew harus di skala ulang. Transformasi distribusi intensitas piksel suatu citra wajah menjadi distribusi yang merata (uniform) telah terbukti meningkatkan unjuk kerja pengenalan wajah jika dibandingkan dengan tanpa pemrosesan awal citra wajah.
5. PRINCIPAL COMPONEN ANALYSIS (PCA) Principal Component Analysis (PCA) adalah teknik reduksi dimensi yang umum digunakan pada aplikasi pemrosesan citra. Prinsip dasar dari algoritma PCA
(4)
Mean Face merupakan rata-rata aritmetika dari vektor-vektor citra training pada setiap titik piksel dan berukuran (P x 1). Mean
1
T =P
𝑃 𝑖=1 𝑇𝑖
(5)
Mean subtracted image merupakan pengurangan citra training dari mean face. Mean subtracted image merupakan matrik yang berukuran (P x 1) Mean subtracted Φ = 𝑇 −
T
(6)
Difference Matrix merupakan matrik yang berasal dari semua vektor citra training yang sudah dikurangi dengan mean dan berukuran (NxP) . Difference Matrix 𝐴 = Φ1 , Φ2 , … , Φ𝑃
(7)
Pada metoda Eigenface, perhitungan eigenvector tidak diperoleh secara langsung dari matrik (N x N) melainkan melalui matrik (P x P), dimana P merupakan jumlah dari citra-citra wajah. Eigenvector matrik (N x N) diperoleh dari eigenvector-eigenvector matrix (P x P) tersebut kerena jika eigenvector dicari langsung menggunakan matrik (N x N) akan sangat sulit untuk dikerjakan karena ukuran matrik yang sangat besar (computational complexity) [6]. Covariance Matrix Y = AT . A =
𝑃
TT T 𝑖=1 𝑖 𝑖
(8)
6. CHI SQUARE Chi Square digunakan sebagai classifier dalam ruang fitur. Pengujian pengenalan wajah dilakukan dengan cara menguji kemiripan dari 2 buah distribusi, yaitu distribusi dari histogram citra test dan distribusi dari histogram citra-citra training. Prinsip dasar Chi Square adalah dengan menghitung nilai minimum dari ratarata 2 histogram citra untuk menentukan kemiripan dari 2 citra wajah. 𝑥 2 𝑆, 𝑀 =
𝑆𝑖 −𝑀𝑖 2 𝑖 𝑆 +𝑀 𝑖 𝑖
(9)
Untuk daerah spatial dapat dihitung dengan menjumlahkan i (bin dari histogram) dan j (region citra). Dengan membagi wajah kedalam daerah atau region yang lebih kecil diharapkan dapat memberikan informasi yang lebih banyak dari citra wajah jika dibandingkan tanpa membagi citra wajah menjadi beberapa region. Sebagai contoh, pada suatu citra wajah daerah mata akan memberikan banyak informasi dibanding region yang lainnya[7]. 𝑥
2
𝑤
𝑆, 𝑀 =
𝑗𝑖
𝑤𝑗
(𝑆𝑖,𝑗 −𝑀 𝑖.𝑗 )2 𝑆𝑖,𝑗 +𝑀 𝑖,𝑗
(10)
Dimana wj adalah bobot untk setiap region j.
7. HASIL P E R C O B A A N DAN PEMBAHASAN Pada penelitian ini dilakukan eksperimen untuk membandingkan unjuk kerja dari metoda PCA dan CHI SQUARE dalam proses pengenalan wajah berbasis fitur LBP. Percobaan dilakukan dengan menggunakan database wajah Yale B [8]. Terdapat 10 wajah subyek dalam database Yale B dan setiap subyek pada database ini mempunyai 60 citra wajah dengan kondisi pencahayaan yang berbeda sehingga memiliki total 600 citra. Citra wajah untuk setiap class (orang) dapat dilihat pada gambar 6. Citra-citra subyek dalam database Yale B dibagi dalam 5 subset berdasarkan keekstriman percahayaan, masing– masing subset terdiri dari 12 citra. Citra sample dari masing – masing subset ditunjukkan pada gambar 7. Untuk pembelajaran digunakan subset 1 yaitu citracitra wajah yang mempunyai pencahayan yang relatif normal, menggunakan dua metoda yaitu Principal Component Analysis (PCA) dan Chi Square. Sampel dari citra training di tunjukkan gambar 7 (A). Sebelum pembelajaran dan proses pengenalan wajah, dilakukan ekstraksi fitur pada semua citra dengan metoda yang diusulkan yaitu LBP. Area wajah terlebih dahulu dibagi menjadi daerah yang lebih kecil dengan jumlah region (5x5) sampai (11x11). Selanjutnya dirubah kedalam histogram LBP yang
digabungkan menjadi satu untuk dijadikan satu fitur yang mewakili citra wajah, sehingga didapat vektor fitur histogram dari setiap citra wajah. Sebelum percobaan dimulai, semua citra dinormalisasi crop dengan ukuran 130 x 150. Sedangkan untuk pengujian digunakan 480 citra-citra wajah dengan berbagai variasi pencahayaan yang terbagi dalam 4 Subset yaitu sabset 2, subset 3, subset 4, dan subset 5 seperti pada gambar pada gambar 7 (B). Sebelum percobaan semua citra test, terlebih dahulu dilakukan ekstraksi fitur dengan LBP untuk mendapat fitur vektor histogram dari setiap citra test dengan variasi blok yang berbeda dan mengetahui pengaruh jumlah blok atau region dalam proses pengenalan citra. Pada percobaan pertama, fitur vektor histogram dari setiap blok yang berbeda dijadikan input dari algoritma PCA dengan dimensi fitur sebesar 60, 80, dan 100, dan pada percobaan kedua dijadikan input Chi Square. Akurasi Pengenalan (φ) dengan 120 kali percobaan untuk setiap subset diperoleh dengan rumus sebagai berikut, Akurasi (𝜑) =
𝑇𝑒𝑠𝑡 𝑦𝑎𝑛𝑔 𝐵𝑒𝑟 ℎ𝑎𝑠𝑖𝑙 𝐽𝑢𝑚𝑙𝑎 ℎ 𝑃𝑒𝑟𝑐𝑜𝑏𝑎𝑎𝑛
× 100%
(11)
Pada gambar 8 ditunjukkan bahwa dengan melakukan ekstrasi fitur dengan menggunakan LBP dapat memperbaiki tingkat pengenalan (recognition rate) wajah. Dengan pengekstrasian fitur wajah dengan LBP akan didapatkan informasi yang lebih detail jika dibandingkan dengan hanya menganggap sebuah citra sebagai fitur vektor tunggal. Pada percobaan berikutnya penggunaan Histogram Equalization juga dapat memperbaiki tingkat pengenalan wajah. Dengan melakukan normalisasi pencahayaan pada citra wajah didapatkan pencahayaan yang hampir merata pada citra wajah sehingga akan meningkatkan tingkat pengenalan wajah terutama untuk tingkat pencahayaan yang kurang (subset 5). 8. KESIMPULAN Hasil percobaan menunjukkan bahwa pengenalan wajah menggunakan metode Chi Square lebih baik jika dibandingkan dengan metode eigenspace PCA. Pada metode Chi Square tingkat pengenalan (recognition rate) berbanding lurus dengan jumlah blok atau region. Tingkat pengenalan yang paling baik ada pada region yang paling besar yaitu region (11x11) sebesar 100% untuk subset 2, 99,2% untuk subset 3, 83,3% untuk subset 4, dan 50%untuk subset 5. Dengan cara mengekstraksi fitur wajah menggunakan metode LBP, yang diterapkan pada ruang eigen (eigenspace) mampu meningkatkan akurasi tingkat pengenalan wajah. Dari hasil percobaan didapatkan bahwa proses pengenalan menggunakan PCA mengalami peningkatan jika input yang digunakan
adalah fitur LBP. Tingkat pengenalan ada pada jumlah blok atau region (9x9) sebesar 99% untuk subset 2, 83% untuk subset 3, 56% untuk subset 4, dan 23%untuk subset 5. Dengan menggabung teknik Histogram Equalization (HE) dengan Ekstrasi fitur LBP, yaitu citra diproses dengan Histogram Equalization kemudian diekstrasi fitur menggunakan LBP yang diterapkan pada metode PCA ternyata mampu memperbaiki akurasi pengenalan dibandingkan dengan hanya diekstrasi fitur menggunakan LBP, terutama pada citra-citra dengan pencahayaan kurang yaitu pada subset 5. Dari hasil percobaan didapatkan Untuk subset 2 tidak mengalami peningkatan, untuk subset 3 rata – rata penambahan tingkat pengenalan wajah sebesar 4%, Subset 4 sebesar 7% dan subset 5sebesar 10%. Sedangkan pada metode Chi Square penggunaan teknik HE mengurangi tingkat pengenalan pada wajah terutama pada subset 5.
Gambar 6. 10 Citra wajah dari Yale B database
DAFTAR REFERENSI [1] Ming-Hsuan Yang, David J. Kriegman, Narendra Ahuja. Detecting Faces in Images: A Survey. IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 24, no. 1, pp.34–58, Jan 2002. [2] Hendra Kusuma, Wirawan, Djoko Purwanto, “Single Scale Retinex dan Histogram Remapping untuk perbaikan recognition rate pada Eigenspace-based Face Recognition”, Seminar on Intelligent Technology and Its applications, Oktober 2010. [3] Timo Ahonen, Abdenour Hadid,and Matti Pietik¨ ainen, “Face Description with Local Binary Pattern:Application to Face Recognition”, vol. 28 no. 12, pp. 2037-2041, December 2006. [4] Vitomir ˇStruc, Janez ˇZibert, Nikola PaveˇSi´C, “Histogram Remapping as a Preprocessing Step for Robust Face Recognition”, Issue 3, Volume 6, March 2009. [5] Soong-Der Chen, Abd. Rahman Ramli, “ Minimum Mean Brightness Error Bi-Histogram Equalization in Contrast Enhancement”, IEEE Transactions on Consumer Electronics, Vol. 49, No. 4, NOVEMBER 2003. [6] Hendra Kusuma, Wirawan, “Appearance-based Face Recognition dengan menggunakan PrincipalComponent Analysis (PCA) dan Nearest Mean Classifier”,2008. [7] Guillaume Heusch, Yann Rodriguez and S´ ebastien Marcel, “Local Binary Pattern as an Image Preprocessing for Face Authentication” IDIAP Research Institute, Martigny, 2006.
Gambar 7. (A) Contoh Citra-citra untuk pengujian, (B) Contoh Citra-citra untuk pembelajaran
20
23
100 56 76 53 76 100 56 53 86 99 43 63 8899 43 63 87 99 63 43
100 58 75 54
82 99 56
83 99
21
23
55
48 10 23
48
1122
40
10 23
60
48
80
56
83 99
93
93
93
(ϕ) Akurasi Pengenalan (%)
100
0 60
80
100
60
PCA
80
100
60
LBP+PCA
80
100
60
HE+PCA
80
100
HE+LBP+PCA
Jumlah Eigenvecktor yang digunakan (%), Metoda Pengenalan Subset 2
Subset 3
Subset 4
Subset 5
5X5
6X6
7X7
8X8
9X9
41.7
100 99.2 80.0 61.7
100 95.0 74.2
42.5
100 95.8 73.3
65.8 35.8
21.7
25.0
55.0
99.2 93.3
99.2 87.5
55.8
99.2 87.5
40.0 16.7
100.0 80.0 60.0 40.0 20.0 0.0
99.2 74.2
(ϕ) Akurasi Pengenalan (%)
Gambar 8. Hasil uji coba pengenalan wajah dengan metoda PCA pada Region ( 9 X 9 )
10 X 10 11 X 11
Ukuran Window Chi Square Subset 2
Subset 3
Subset 4
Subset 5
50.0
40.8
100 99.2 83.3
70.0
100 92.5
77.5 44.2
31.7
69.2
100 97.5
100.0 94.2
59.2 28.3
40.0
99.2 85.8
55.8 19.2
17.5
60.0
43.3
80.0
99.2 90.0
100.0 100.0
75.0
(ϕ) Akurasi Pengenalan (%)
Gambar 9. Hasil uji coba pengenalan wajah dengan metoda Chi Square
20.0 0.0 5X5
6X6
7X7
8X8
9X9
10 X 10
11 X 11
Ukuran Window Chi Square Subset 2
Subset 3
Subset 4
Subset 5
Gambar 10. Hasil uji coba pengenalan wajah dengan metoda Chi Square dengan preprosesing Histogram Equalization