Konferensi Nasional Sistem dan Informatika 2011; Bali, November 12, 2011
KNS&I11-022
DETEKSI WAJAH MENGGUNAKAN GMDH POLYNOMIAL NEURAL NETWORK DAN NONLINEAR PRINCIPAL COMPONENT ANALYSIS Anditya Arifianto, Sriyani Violina, dan Setyorini Fakultas Informatika Institut Teknologi Telkom, Bandung
[email protected],
[email protected], dan
[email protected] ABSTRACT The face is one part that has a very important role in human life. Through face recognition techniques, a variety of information can be obtained. Despite having a very important role in face recognition system, face detection received less attention in research community. Whereas before we could get any information from a face, first of all the face itself needs to be obtained in advance. Face detection system provides many challenges and difficulties that must be faced that there are diverse variations caused by the appearance of the face on the image, also the complexity of the background image. In this paper, the polynomial GMDH Neural Network (PNN) method is used to detect the occurrence of faces in an image. PNN will divide the local region on multiscale sliding windows into two classes, namely the face and not the face by using the input image data that has been through the reduction process to reduce the computational complexity dimensions using Nonlinear PCA. Classification was done using soft-classification. From the test results, it can be known that PNN GMDH network and the level of reduction NLPCA resulting system result in an accuracy of 99.87% for training data and accuracy of 81,96% for testing data. Keywords: Face detection, Nonlinear PCA, GMDH, Polynomial Neural Network.
1. Pendahuluan Sebagai salah satu anggota tubuh yang pertama kali dilihat setiap kali bertemu seseorang, wajah memiliki peran penting dalam kehidupan manusia. Karena melalui karakteristik unik dari wajah, kita bisa mendapatkan banyak informasi seperti identitas seseorang, umur, jenis kelamin, hingga ekspresi, emosi, watak, dan kepribadian seseorang. Seorang manusia mampu melakukan proses pengumpulan informasi pengenalan wajah tersebut karena manusia dibekali kecerdasan dan pengetahuan yang tertanam di dalam otak. Kemampuan dari manusia tersebut dapat diadopsi ke dalam sebuah komputer dengan pendekatan konsep learning[41]. Dengan pendekatan konsep learning, sebuah program komputer dapat mempelajari karakteristik dari data-data yang diberikan kemudian mampu menggeneralisasikannya ke dalam bentuk pengetahuan. Pengetahuan inilah, yang kemudian digunakan untuk pengambilan keputusan terhadap permasalahan yang belum pernah dipelajari sebelumnya. Karena itu, sangat dimungkinkan dibuatnya sistem pengenalan wajah yang memiliki kemampuan seperti manusia. Sistem pengenalan wajah manusia memiliki aplikasi yang luas di bidang keamanan dan antarmuka komputer dengan manusia[5]. Suatu sistem pengenalan wajah yang komplit terdiri dari beberapa modul: face detection/location, facial feature extraction, dan face identification. Meskipun memiliki peran yang sangat penting dalam sistem pengenalan wajah, deteksi wajah kurang mendapat perhatian dalam komunitas riset hingga akhir-akhir ini[13]. Padahal sebelum kita bisa mendapatkan berbagai informasi dari sebuah wajah, pertama-tama perlu kita dapatkan dulu wajah tersebut. Di sinilah fungsi deteksi wajah digunakan. Sistem deteksi wajah memberikan banyak tantangan dan kesulitan yang harus dihadapi yang disebabkan karena terdapat keberagaman variasi penampakan wajah pada citra, juga kompleksitas dari latar belakang citra. Dalam tugas akhir ini, diusulkan suatu metode untuk melakukan pendeteksian wajah berdasarkan citra yang diberikan dengan menggunakan Polynomial Neural Network (PNN). Metode ini dipilih karena PNN termasuk dalam algoritma Group Method of Data Handling (GMDH) yang merupakan jaringan saraf tiruan yang adaptif atau dapat mengatur dirinya sendiri (self-orginizing)[14] dan merupakan jaringan saraf tiruan yang sangat bagus untuk digunakan dalam permasalahan klasifikasi. Untuk menemukan wajah manusia pada suatu citra, PNN akan membagi region lokal pada multiscale sliding windows menjadi dua kelas, yaitu bagian wajah dan bukan wajah. Input dari PNN adalah binomial proyeksi dari citra lokal pada subspace fitur yang didapat dari hasil Nonliear Principal Component Analysis (NLPCA). NLPCA sebagai generalisasi non linier dari standar linier Principal Component Analysis (PCA) merupakan suatu metode belajar unsupervised atau tidak terbimbing yang merupakan suatu metode untuk mengefisiensikan representasi suatu kumpulan sample point dengan mereduksi dimensi pola citra sehingga didapat representasi padat dan mengurangi kompleksitas saat learning dan testing.
2. Tujuan Tujuan dari pembuatan makalah ini ialah sebagai berikut: 1) Menerapkan algoritma GMDH-PNN untuk membangun sistem deteksi wajah menggunakan pra-proses NLPCA, 142
Konferensi Nasional Sistem dan Informatika 2011; Bali, November 12, 2011
KNS&I11-022
2) Membandingkan performansi yang dihasilkan GMDH-PNN saat menggunakan pra-proses NLPCA dan saat menggunakan pra-proses PCA, 3) Menunjukkan bahwa sistem deteksi wajah menggunakan gabungan GMDH-PNN dengan pra-proses NLPCA lebih baik daripada gabungan GMDH-PNN dengan pra-proses PCA.
3. Gambaran Umum Sistem Sistem deteksi wajah yang akan dibangun di sini diawali dengan pembangunan Nonlinear PCA untuk mereduksi dimensi dari data untuk selanjutnya menjadi input pada modul GMDH-PNN. Modul GMDH-PNN kemudian akan membangun jaringan yang menghasilkan keputusan apakah data input-an adalah wajah atau bukan. Untuk memperoleh jaringan yang memberikan hasil keputusan terbaik, perlu dilakukan beberapa observasi pada sistem, yaitu: 1) Tingkat reduksi data yang optimal yang dapat memberikan akurasi terbaik sistem. 2) Kriteria penghentian proses training. 3) Kombinasi, jumlah, dan struktur data latih. Jaringan hasil proses pelatihan akan diujikan pada data test dan data training berupa citra berukuran 20 x 20 yang sudah berlabel wajah atau bukan untuk mengukur performansi dari jaringan. Jaringan dengan tingkat akurasi tertinggi akan diujikan untuk mendeteksi wajah pada data citra berukuran minimal 100 x 100 menggunakan proses image shifting.
4. Data Perancangan data meliputi perancangan dataset training dan dataset testing. Dataset training berisi citra berukuran 20x20 piksel yang digunakan dalam proses training jaringan GMDH-PNN. Dataset testing berisi citra berukuran minimal 100 x 100 piksel yang digunakan pada proses pengujian untuk mencari citra wajah yang ada di dalamnya. Data citra untuk dataset training diambil dari database dari foto mahasiswa baru IT Telkom tahun 2008, 2009, dan 2010; database foto IMM, database foto MUCT, dan database foto UPC. Setiap citra asli disegmentasi secara manual di bagian wajah dengan bentuk potongan persegi berisi mata hidung dan mulut. Selanjutnya citra diperkecil hingga mencapai resolusi 20 x 20 piksel. Pra-pemrosesan manual ini dilakukan dengan menggunakan tool Adobe® Photoshop® CS3.
5. Dasar Teori 5.1 GMDH Polynomial Neural Network PNN merupakan salah satu algoritma bertipe GMDH yang termasuk dalam jenis “self-organizing” network atau yang biasa disebut jaringan yang membentuk sendiri pola jaringannya. PNN merupakan Jaringan Saraf dimana setiap neuronnya disebut Partial Description (PD). Output dari setiap PD diperoleh dengan menggunakan beberapa tipe perhitungan orde polinom seperti persamaan linier, persamaan kuadrat, bahkan persamaan kubik dari variabel input. PNN dapat dipandang sebagai sebuah generalisasi klasifikasi linier yang menggunakan input tidak hanya dari pengukuran fitur dari pola input, tapi juga polinomial dari pengukuran tersebut. Ivakhnenko membuat neuron menjadi unit yang lebih kompleks dengan menampilkan fungsi transfer polinomial. Interkoneksi antara lapisan neuron disederhanakan, dan algoritma otomatis untuk desain struktur dan penyesuaian bobot neuron dikembangkan. Neuron GMDH-PNN memiliki 2 input dan output-nya merupakan kombinasi kuadratik dari kedua input sehingga jaringan GMDH-PNN membentuk sebuah kombinasi polinom dari komponen input[7]. 5.2 Nonlinear Principal Component Analysis Nonlinear Principal Analysis (NLPCA) umumnya dipandang sebagai generalisasi non linier dari PCA standar. NLPCA mengeneralisasi Principal Component dari bentuk awal garis lurus menjadi bentuk kurva (non linier). Dengan demikian, subspace pada ruang data asli yang digambarkan oleh semua komponen non linier juga akan berbentuk kurva (melengkung). Pada dasarnya, Nonlinear PCA dibentuk oleh dua buah jaringan saraf terbimbing (supervise) yang merepresentasikan fungsi pemetaan nonlinier G dan H sebagai proses encode dan decode saat reduksi dimensi[25].
Gambar 1. Arsitektur Jaringan Encoder dan Decoder NLPCA 143
Konferensi Nasional Sistem dan Informatika 2011; Bali, November 12, 2011
KNS&I11-022
Meskipun secara keseluruhan jaringan ini merupakan jaringan supervised, namun pada jaringan yang merepresentasikan fungsi G, target output T tidak diketahui, sedangkan pada jaringan yang merepresentasikan fungsi H, target output Y diketahui, namun input T tidak diketahui. Karena itu pelatihan terbimbing secara langsung sebenarnya tidaklah dimungkinkan. Untuk mengatasi hal ini, dapat diperhatikan bahwa T untuk output G dan input H adalah sama. Mengkombinasikan dua jaringan secara berurutan sehingga G dapat secara langsung memberi input kepada H, maka didapatlah sebuah jaringan yang input dan output-nya diketahui. Secara spesifik, Y adalah input dari G dan merupakan target output pada H. Karena itu kombinasi jaringan harus dilatih untuk menghasilkan mapping identitas YY’. Karena itu pelatihan terbimbing dapat diaplikasikan pada jaringan. Pelatihan untuk mempelajari mapping identitas ini disebut self-supervised backpropagation atau auto-asosiasi.
Gambar 2. Arsitektur Jaringan Autoassociative Neural Network Dari bentuk jaringan auto-asosiatif memiliki tiga hidden layer. Layer mapping berguna untuk memodelkan fungsi G, bottleneck layer merepresentasikan fitur T, dan layer demapping digunakan untuk memodelkan fungsi H. Karena jumlah neuron yang lebih sedikit pada layer bottleneck daripada layer output, maka neuron bottleneck harus merepresentasikan atau mengenkode informasi dari input bagi layer berikutnya untuk merekonstruksi input. Jika pada saat pelatihan jaringan menemukan solusi yang dapat diterima, representasi yang baik dari input pasti tersedia di layer bottleneck. Hal ini menyiratkan bahwa kompresi data yang dilakukan oleh jaringan bottleneck dapat membuat neuron pada hidden layer untuk merepresentasikan ciri yang signifikan dalam data. Jaringan Syaraf auto-asosiatif merupakan jaringan Multi-layer Perceptron yang melakukan suatu pemetaan identitas, yang berarti bahwa output dari jaringan tersebut diharapkan seidentik mungkin dengan input jaringan. Namun di tengahtengah jaringan terdapat sebuah lapisan neuron (hidden layer) yang bekerja sebagai bottleneck tempat dimana reduksi dimensi data dilakukan. Lapisan bottleneck inilah yang menghasilkan nilai-nilai komponen yang diinginkan (score).
6. Skenario Pengujian Sebelum proses pengujian, dilakukan proses observasi untuk mendapatkan tingkat reduksi dan struktur jaringan terbaik GMDH-PNN. Terdapat 4 dataset yang dilatih dengan proses siklus melatih satu dataset, menguji jaringan terhadap data test, mengubah dataset dengan menambahkan atau mengganti data latih sehingga menjadi dataset baru untuk siklus berikutnya. Jaringan terbaik yang dihasilkan adalah jaringan yang dilatih menggunakan dataset 3 dengan tingkat reduksi 15 komponen. Dari hasil observasi, setiap jaringan hasil pelatihan akan diujikan pada dataset masing-masing dan sebuah dataset gabungan untuk mendapatkan tingkat akurasinya. Proses pengujian ini dilakukan dengan cara memberi input jaringan berupa data citra 20 x 20 untuk mengklasifikasikannya sebagai citra wajah atau bukan. Nilai akurasi dapat dihitung dengan persamaan: (1) Hasil klasifikasi dikatakan benar apabila nilainya mendekati nilai target yang diinginkan. Dalam paper ini, digunakan nilai threshold sebesar 0.5. Apabila nilai keluaran kurang dari threshold, maka diklasifikasikan masuk ke dalam kelas label 0 (bukan wajah), dan sebaliknya jika nilai keluaran lebih dari atau sama dengan threshold maka hasilnya diklasifikasikan masuk ke dalam kelas dengan label 1 (wajah). Untuk setiap dataset dengan kriteria penghentian yang sama, akan dibandingkan tingkat akurasi antara jaringan hasil reduksi dimensi menggunakan PCA dan NLPCA. Jaringan dengan akurasi terbaik akan digunakan untuk tahap pengujian menggunakan proses image shifting. Jaringan terbaik yang diambil didapatkan dengan menghitung kualitas sebuah jaringan. Kriteria pemilihan jaringan dapat dirumuskan dengan: 144
Konferensi Nasional Sistem dan Informatika 2011; Bali, November 12, 2011
KNS&I11-022
(2) f ek ef a
: nilai kualitas jaringan : error klasifikasi total : error klasifikasi kelas wajah : bilangan kecil menghindari pembagian dengan 0, a = 0,01
Pada proses deteksi wajah menggunakan image shifting, performansi sistem deteksi wajah dihitung berdasarkan akurasi wajah terdeteksi pada data testing yang dihitung menggunakan rumus:
(3) Kemudian sebagai skor tambahan, dihitung pula skor False Positive Rate sebagai Error Rate sistem deteksi wajah yang dihitung menggunakan rumus: (4)
R : False Positive Rate (berbentuk pecahan) Numfd : total false positive rate dalam sebuah datatest Total examine : total pencarian wajah (shifting image) yang dilakukan dalam sebuah dataset
7. Hasil Pengujian Dari pengujian jaringan dengan mengklasifikasikan citra masukan sebagai citra wajah dan bukan terhadap jaringan yang dilatih menggunakan reduksi dimensi PCA dan jaringan yang dilatih menggunakan NLPCA, didapat perbandingan akurasi sebagai berikut: Dataset 1
Gambar 3. Grafik Perbandingan Akurasi Dataset 1 Kriteria Pemberhentian RMSE Validasi Dataset 2
Gambar 4. Grafik Perbandingan Akurasi Dataset 1 Kriteria Pemberhentian RMSE Validasi+Training
Gambar 5. Grafik Perbandingan Akurasi Dataset 2 Kriteria Pemberhentian RMSE Validasi Dataset 3
Gambar 6. Grafik Perbandingan Akurasi Dataset 2 Kriteria Pemberhentian RMSE Validasi+Training
Gambar 7. Grafik Perbandingan Akurasi Dataset 3 Kriteria Pemberhentian RMSE Validasi
Gambar 8. Grafik Perbandingan Akurasi Dataset 3 Kriteria Pemberhentian RMSE Validasi+Testing
145
Konferensi Nasional Sistem dan Informatika 2011; Bali, November 12, 2011
KNS&I11-022
Dataset 4
Gambar 10. Grafik Perbandingan Akurasi Dataset 4 Kriteria Pemberhentian RMSE Validasi+Training
Gambar 9. Grafik Perbandingan Akurasi Dataset 4 Kriteria Pemberhentian RMSE Validasi
Grafik-grafik di atas menunjukkan tingkat akurasi jaringan terhadap input data yang diberikan (garis vertikal) untuk setiap tingkat reduksi dimensi yang dilakukan (garis horizontal). Garis hitam merupakan tingkat akurasi yang dihasilkan jaringan menggunakan data latih yang direduksi dimensinya oleh NLPCA, dan garis abu-abu menunjukkan tingkat akurasi jaringan dengan reduksi dimensi oleh PCA. Dari hasil akurasi keempat dataset dapat diperlihatkan bahwa akurasi jaringan menggunakan pra-pemrosesan mereduksi dimensi menggunakan NLPCA hampir selalu lebih baik daripada jaringan menggunakan pra-pemrosesan PCA untuk tingkat reduksi dimensi yang sama. Hal ini dikarenakan NLPCA dengan kemampuan fungsi nonlinier-nya mampu menarik subspace elemen wajah dengan lebih baik dan lebih efisien daripada fungsi linier yang dimiliki PCA. Reduksi dimensi dengan NLPCA mampu menarik elemen subspace lebih baik dengan tingkat reduksi lebih rendah daripada PCA. Tabel 1. Tabel Kualitas Jaringan GMDH-PNN Dengan Reduksi Dimensi NLPCA Dengan Kriteria Pemberhentian RMSE Validasi Dataset 1 Jml Komp 20
Dataset 2
Akurasi
Kualitas
99.46
0.0294
Jml Komp 20*
19
98.65
0.0141
18
99.44
17
98.77
16 15
Dataset 3
Akurasi
Kualitas
98.38*
0.0091*
Jml Komp 20
19
97.62
0.0072
0.0263
18
97.66
0.0154
17
97.36
98.79
0.0161
16
99.32
0.0244
15
14
98.77
0.0167
14
13*
99.49*
0.0312*
12
98.14
0.0122
11
98.42
10
98.53
Dataset 4
Akurasi
Kualitas
98.01
0.0098
Jml Komp 20
19*
98.46*
0.0123*
19*
0.0065
18
97.69
0.0078
18
98.47
0.0099
0.0065
17
98.25
0.0094
17**
98.66**
0.0097**
97.3
0.0074
16
97.56
0.0075
16
97.62
0.0083
97.95
0.0088
15
98.33
0.0116
15
96.80
0.0067
97.17
0.0065
14
97.21
0.0073
14
96.82
0.0064
13
96.15
0.0051
13
98.08
0.0090
13
97.41
0.0086
12
96.47
0.0060
12
97.19
0.0067
12
96.78
0.0068
0.0125
11
96.86
0.0066
11
96.93
0.0068
11
96.38
0.0053
0.0156
10
96.02
0.0051
10
97.95
0.0103
10
96.13
0.0060
Akurasi
Kualitas
98.16
0.0111
98.52*
0.0112*
Tabel 2. Tabel Kualitas Jaringan GMDH-PNN Dengan Reduksi Dimensi NLPCA Dengan Kriteria Pemberhentian RMSE Validasi+Training Dataset 1 Jml Komp
Akurasi
20***
Dataset 2 Kualitas
Jml Komp
Akurasi
99.86***
0.1996***
20
19
99.60
0.1248
18
99.12
17
Dataset 3 Kualitas
Jml Komp
Akurasi
99.65
0.0500
20
19**
99.81**
0.0833**
0.0345
18
99.63
99.51
0.0666
17
16
99.70
0.1427
15
99.58
14 13
Dataset 4 Kualitas
Jml Komp
Akurasi
Kualitas
99.63
0.0999
20
99.37
0.0500
19***
99.87***
0.1664***
19*
99.62*
0.0908*
0.0714
18
99.37
0.0370
18
99.31
0.0286
99.31
0.0147
17
99.26
0.0400
17
99.52
0.0625
16
99.22
0.0357
16
99.61
0.0555
16
99.46
0.0357
0.1110
15
98.90
0.0250
15***
99.87***
0.1664***
15
99.52
0.0476
99.53
0.0454
14***
99.72***
0.1664***
14
99.68
0.0908
14
99.54
0.0500
99.74
0.0999
13
99.18
0.0217
13
99.31
0.0476
13**
99.73**
0.0714**
146
Konferensi Nasional Sistem dan Informatika 2011; Bali, November 12, 2011
Dataset 1
Dataset 2
KNS&I11-022
Dataset 3
Dataset 4
12
99.00
0.0263
12
97.99
0.0110
12
98.96
0.0222
12
98.70
0.0192
11
98.95
0.0217
11
99.29
0.0286
11
99.78
0.0714
11
99.14
0.0303
10
99.58
0.0476
10
99.29
0.0256
10
99.29
0.0303
10
97.51
0.0106
Pada tabel di atas, pada setiap dataset, kolom dengan tanda (*) menunjukkan jaringan yang memberikan kualitas terbaik di dataset tersebut dan kolom dengan tanda (**) menunjukkan jaringan yang memberikan akurasi klasifikasi tes tertinggi di dataset tersebut. Tabel dataset yang tidak memiliki kolom dengan tanda (**) menunjukkan bahwa jaringan yang memberikan akurasi tertinggi di dataset tersebut juga memberikan nilai kualitas tertinggi. Berdasarkan hasil perhitungan kriteria error klasifikasi jaringan terhadap dataset masing-masing, dapat disimpulkan bahwa jaringan menggunakan pelatihan dataset 3 memiliki tingkat akurasi tertinggi sebesar 99,87% pada saat NLPCA mereduksi dimensi pada tingkat 19 komponen dengan kriteria pemberhentian iterasi menggunakan RMSE validasi+training. Namun jika dilihat dari segi nilai kualitas, terdapat 4 jaringan yang memiliki kualitas yang baik (nilai kualitas>0.1, ditandai dengan tanda (***)): dataset1-pc20, dataset2-pc14, dataset3-pc19, dan dataset3-pc15. Keempat arsitektur jaringan terbaik yang diperoleh tersebut kemudian akan dibandingkan pada proses deteksi wajah menggunakan image shifting. Pengujian performansi Sistem Deteksi Wajah dilakukan pada dataset testing dengan total 13 data citra. Total citra wajah yang terdapat dalam data test sebanyak 61 citra wajah. Setiap jaringan akan diujikan untuk mengukur akurasi dan menghitung rata-rata kesalahan yang dilakukan pada pendeteksian datatest. Pengujian dilakukan menggunakan image shifting dengan ukuran blok citra (window) 43 piksel dan pergeseran piksel (shifting) sebesar 3 piksel. Untuk keseluruhan citra datatest, total pemeriksaan yang dilakukan adalah sebanyak 171.784 pemeriksaan. Dari proses observasi nilai threshold terbaik menggunakan jaringan dataset1, pc20, didapatkan hasil sebagai berikut: Tabel 3. Tabel Observasi Threshold Threshold
Num Miss Face
Face Detect Rate
Num False Positive
F > 0.5
26
57,37%
39
Average False Positive 3
0.5 < F ≤ 1.5
26
57,37%
39
3
1/3505
0.85 < F ≤ 1.15
25
60,65%
38
3
1/3579
31
3
1/4189
0.95 < F ≤ 1.05
29
52,45%
False Positive Rate 1/3505
Proses observasi menunjukkan bahwa nilai threshold yang semakin mendekati nilai target, yaitu 1, memberikan tingkat akurasi deteksi wajah yang lebih baik. Namun nilai threshold yang terlalu mendekati nilai target memberikan tingkat akurasi yang kurang bagus. Hal ini dikarenakan proses penentuan apakah suatu blok citra merupakan wajah atau bukan menjadi lebih ketat dan kurang fleksibel. Dari pengujian Sistem Deteksi Wajah menggunakan GMDH Polynomial Neural Network dan NLPCA pada 13 citra data test, dihasilkan performansi Sistem Deteksi Wajah sebagai berikut: Tabel 4. Tabel Performansi Sistem Deteksi Wajah Dengan Window 43 px Net Dtset1, pc20 Dtset2, pc14 Dtset3, pc 19 Dtset3, pc 15
Num Miss Face 24 15 22 13
Face Detect Rate 60,655% 75,409% 63,934% 78,688%
Num False Positive 38 36 54 17
Average False Positive 3 3 4 1
False Positive Rate 1/4521 1/4772 1/3181 1/10105
Dari pengujian empat jaringan di atas, dapat dilihat bahwa jaringan Dataset 3, 15 pc memberikan akurasi pengujian tertinggi yaitu 78,688% dengan false positive rate terendah yaitu 1/10105.
147
Konferensi Nasional Sistem dan Informatika 2011; Bali, November 12, 2011
KNS&I11-022
Tabel 5. Tabel Performansi Jaringan Dataset 3, 15 pc Dengan Window 43 px No. Cit ra 1 2 3 4 5 6 7
Jumlah Wajah Dalam Citra
Jumlah Wajah T erdeteksi
Jumlah False Posit ive
6 5 7 5 4 15 4
4 4 5 4 3 11 3
0 2 2 0 0 2 0
No. Citra 8 9 10 11 12 13
Jumlah Wajah Dalam Cit ra
Jumlah Wajah T erdet eksi
Jumlah False Posit ive
5 3 4 0 2 1
5 3 3 0 2 1
0 1 3 2 3 2
Total
61
48
17
Pengujian dilanjutkan dengan menguji Sistem Deteksi Wajah menggunakan Image Shifting dengan ukuran window lebih dari satu: 41, 43, dan 45 piksel. Total pemeriksaan yang terjadi adalah sebanyak 349.347 pemeriksaan. Hasil performansi Sistem Deteksi Wajah dapat ditunjukkan pada tabel berikut: Tabel 6. Tabel Performansi Sistem Deteksi Wajah Dengan Multiple Window 41, 43, dan 45 px Net Dtset1, pc20
Num Miss Face 11
Face Detect Rate 81.967%
Num False Positive 54
Average False Positive 4
False Positive Rate 1/9704
Tabel 7. Tabel Performansi Jaringan Dataset1-pc20 Dengan Multiple Window 41,43, dan 45 px No. Cit ra 1 2 3 4 5 6 7
Jumlah Wajah Dalam Cit ra
Jumlah Wajah T erdet eksi
Jumlah False Posit ive
6 5 7 5 4 15 4
5 4 5 4 4 11 2
4 3 5 2 3 11 0
No. Jumlah Wajah Jumlah Wajah Jumlah False Cit ra Dalam Cit ra T erdet eksi Posit ive 7 4 2 0 8 5 5 3 9 3 3 3 10 4 4 5 11 0 0 4 12 2 2 5 13 1 1 6 Total 61 29 52
Dapat diperhatikan bahwa pengujian dengan ukuran window lebih dari satu dapat meningkatkan akurasi deteksi wajah. Hal ini dikarenakan ruang pencarian wajah menjadi lebih luas terhadap luas penampang pencarian sehingga pencarian lebih bisa menyesuaikan terhadap berapapun ukuran wajah di dalam citra sehingga pencarian menjadi lebih akurat. GMDH-PNN telah menunjukkan kemampuannya dalam mengklasifikasikan citra menjadi kelas wajah dan bukan wajah dengan cukup baik yang ditunjukkan dengan akurasi pengujian yang mencapai 81,967%. Dalam sebuah citra, rata-rata sistem deteksi wajah melakukan kesalahan deteksi sebanyak 3 kali. Meskipun tingkat akurasi deteksi wajah cukup rendah, namun dapat diperlihatkan bahwa jumlah false positive yang terjadi juga cukup sedikit. Citra wajah yang gagal terdeteksi oleh system rata-rata merupakan citra wajah yang terotasi, menggunakan kacamata yang terlalu gelap, terhalang, atau mengalami kondisi pencahayaan yang buruk dan resolusi yang buruk. Beberapa citra wajah yang tidak terdeteksi bisa terjadi dikarenakan citra wajah terpenuhi oleh proses pelatihan sistem atau data latih yang kurang banyak dan kurang bervariasi[4]. Tingkat akurasi deteksi yang rendah lebih dikarenakan kurangnya data latih dan siklus pelatihan yang dilakukan. Penambahan data latih yang lebih bervariasi, baik dengan cara menambah data baru atau mengolah data latih lama sehingga menjadi data baru, dan penambahan siklus pelatihan untuk meng-update data latih non wajah dimungkinkan untuk membuat system menjadi lebih adaptif terhadap citra wajah.
8. Kesimpulan 1) Dari hasil pengujian skenario, dapat ditarik kesimpulan bahwa NLPCA memberikan performansi yang lebih baik dalam menjaga keefektifitasan data reduksi dibandingkan dengan reduksi dimensi menggunakan PCA pada tingkat reduksi yang sama yang ditunjukkan dengan memberikan tingkat akurasi klasifikasi yang lebih baik hingga 4,5% dengan rata-rata perbedaan akurasi hingga 1,10%. 2) Tingkat reduksi dimensi data wajah menggunakan NLPCA yang dapat memberikan hasil yang optimal untuk proses deteksi wajah adalah sebesar 16 -20 komponen. 3) Proses learning GMDH Polynomial Neural Network mampu menghasilkan jaringan yang optimal, pada saat pelatihan menggunakan dataset 2 dengan tingkat reduksi dimensi pada 19 komponen dan kriteria pemberhentian dengan RMSE validasi+training, sehingga mampu melakukan klasifikasi citra wajah dan non wajah dengan akurasi testing hingga 99,87%. 4) Gabungan metode NLPCA sebagai pra-pemrosesan dan GMDH Polynomial Neural Network sebagai classifier mampu melakukan pendeteksian wajah dalam datatest dengan memberikan akurasi tertinggi pada proses deteksi 148
Konferensi Nasional Sistem dan Informatika 2011; Bali, November 12, 2011
KNS&I11-022
wajah menggunakan jaringan dataset 3 dengan reduksi dimensi 15 komponen yang memberikan akurasi testing 78,688% dan False Positive Rate 1/6871 pada deteksi dengan window 43px, dan akurasi testing 81.967% pada deteksi dengan multiple window 41,43,45 px.
Daftar pustaka [1] [2]
[3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23]
[24]
[25] [26] [27]
Aksyonova, T. I., Volkovich, V. V., and Tetko, I. V. (2003). Robust Polynomial Neural Networks In QuantativeStructure Activity Relationship Studies, Systems Analysis Modelling Simulation Vol. 43, No. 10 , 1331-1339. Al-Shaban, S. A., Al-Faysale, M. S., and Al- Neami, A. Q. (2010). Non- Linear Principal Component Analysis Neural Network for Blind Source, Research Journal of Applied Sciences, Engineering and Technology 2(2) , 180190. Bodyanskiy, Y., Vynokurova, O., and Pliss, I. (2009). Hybrid GMDH–neural network of computational intelligence, Kharkiv, Ukraine: Control Systems Research Laboratory, Kharkiv National University of Radio and Electronics. Brimblecombe, P. (2005). Face Detection using Neural Networks. Surrey: Meng Electronic Engineering School of Electronics and Physical Sciences, University of Surrey. Chellappa, R., Willson, C., and Sirohey, S. (1995). Human and machine recognition of faces: a survey, IEEE. Dehuri, S., Ghosh, A., and Cho, S.-B. (2008). Particle Swarm Optimised Polynomial Neural Network For Classification: A Multi-Objective View, Int. J. Intelligent Defence Support Systems, Vol. 1, No. 3 , 225-253. Elder IV, J. F., and Brown, D. E. (1992). Induction and Polynomial Networks, Charlottesville, VA: Institute for Parallel Computation and Department of Systems Engineering University of Virginia. Elizondo, D. A., Passow, B. N., Birkenhead, R., and Huemer, A. (2007). Dimensionality Reduction and Microarray data, Principal Manifolds for Data Visualization and Dimension Reduction (pp. 297-312), Springer. Farlow, S. (1984). Selforganizing Methods in Modelling: GMDH Type Algorithms, Marcher Dekker , 1-24. Foka, A. (1999). Time Series Prediction using Evolving Polynomial Neural Networks, Control Systems Centre Department of Electrical Engineering and Electronics. Ghazali, R., Hussain, A., Liatsis, P., and Tawfik, H. (2007). The Application Of Ridge Polynomial Neural Network To Multi-Step Ahead Financial Time Series Prediction, Neural Comput and Applic (2008) 17 , 311-323. Girard, S., and Iovleff, S. (2007). Auto-Associative Models, NLPCA, Manifolds and Projection Pursuit, Principal Manifolds for Data Visualization and Dimension Reduction (pp. 205-222), Springer. Huang, L.-L., Shimizu, A., Hagihara, Y., and Kobatake, H. (2002). Face detection from cluttered images using a polynomial neural network, Elsevier BV . Ivakhnenko, A. G. (1971). Polynomial Theory of Complex Systems, Institute of Electrical and Electronics Engineers, Inc., USA. Ivakhnenko, A. G. (n.d.). (1995). Self-Organization of Neuronet with Active Neuron Effect of Nuclear Test Explosions Forecasting, System Analysis Modelling Simulation. Ivakhnenko, A. (n.d.). (1995). Self-Organization of Neural Networks with Active Neurons, Pattern Recognition and Image Nalysis v.4 no.2 , 185-196. Ivakhnenko, A. (1968). The Group Method of Data Handling: A Rival of Method of Stochastic Approximation, Soviet Automatic Control vol.13 no.3 , 43-55. Ivakhnenko, A. (1995). The Review of Problems Solved by Algorithms of the Group method data handling, Pattern Recognition and Image Analysis Vol.5, No.4 , 527-535. Kerschen, G. and.-C. (2001). Non-Linear Generalization Of Principal Component Analysisfrom A Global To A Local Approach, Journal of Sound and Vibration (2002) 254(5), , 867-876. Kerschen, G., and Golinval, J.-C. (2004). Feature extraction using auto-associative neural networks, Smart Mater. Struct. 13 , 211-219. Kim, D., and Park, G.-T. (2007). Advanced self-organizing polynomial neural network, Neural Comput and Applic Springer-Verlag London, 16:443–452. Kim, S., and Lee, M. H. (2000). A polynomial fuzzy neural network for modeling and control, Artif Life Robotics, 4:162-166. Kondo, T., and Ueno, J. (2007). Multi-Layered GMDH-Type Neural Network Self-Selecting Optimum Neural Network Architecture And Its Application To 3-Dimensional Medical Image Recognition Of Blood Vessels, International Journal of Innovative Computing, Information and Control Volume 4, Number 1, 175-187. Kondo, T., and Ueno, J. (2006). Revised GMDG-Type Neural Network Algorithm With A Feedback Loop Identifying Sigmoid Function Neural Network, International Journal of Innovative Computing, Information and Control Volume 2, Number 5, 985-996. Kramer, M. A. (1991). Nonlinear Principal Component Analysis Using Autoassociative Neural Network, AIChE Journal Vol. 37, No. 2 , 233-243. Kruger, U., Zhang, J., and Xie, L. (2007). Developments and Applications of Nonlinear Principal Component Analysis – a Review, Principal Manifolds for Data Visualization and Dimension Reduction (pp. 1-44). Springer. Lemke, F., and Muller, J.-A. (2000). Self-Organizing Data Mining Based On GMDH Principle, Dresden, Germany. 149
Konferensi Nasional Sistem dan Informatika 2011; Bali, November 12, 2011
[28] [29] [30] [31]
[32] [33] [34]
[35]
[36] [37]
[38] [39] [40] [41] [42] [43] [44]
[45]
KNS&I11-022
Lemke, F., and Müller, J.-A. (1997). Self-Organizing Data Mining for a Portfolio Trading System, 212-26: Journal of Comp.Intelligence, 5, No.3. Madala, H. R., and Ivakhnenko, A. G. (1994). Inductive Learning Algorithms for Complex Systems Modeling, USA: CRC Press. Oh, S.-K., Kim, D.-W., and Park, B.-J. (2001). A Study on The Optimal Design of Polynomial Neural Networks Structure. The Trans. of the Korean Institute of Electrical Engineers vol 49d, no 3 , 365-396. Park, H.-S., Park, B.-J., Kim, H.-K., and Oh, S.-K. (2004). Self-Organizing Polynomial Neural Networks Based on Genetically Optimized Multi-Layer Perceptron Architecture. International Journal of Control, Automation, and Systems, vol. 2, no. 4 , 423-434. Rowley, H. A., Baluja, S., and Kanade, T. (1998). Neural Network-Based Face Detection, IEEE Transactions On Pattern Analysis And Machine Intelligence, VOL. 20, NO. 1 , 23-38. Sahoolizadeh, A. H., Heidari, B. Z., and Dehghani, C. H. (2008). A New Face Recognition Method using PCA,LDA and Neural Network. International Journal of Computer Science and Engineering , 2-4. Schetinin, V. (2011). Polynomial Neural Networks Learnt to Classify EEG Signals, Crema, Italy: NIMIA-SC2001 - 2001 NATO Advanced Study Institute on Neural Networks for Instrumentation, Measurement, and Related Industrial Applications: Study Cases. Scholz, M. (2007). Analysing periodic phenomena by circular PCA, Proceedings of the Conference on Bioinformatics Research and Development BIRD’07, LNBI Vol. 4414 (pp. 38–47). Berlin Heidelberg: SpringerVerlag. Scholz, M., and Vigario, R. (2002). Nonlinear PCA a new hierarchical approach, ESANN'2002 proceedings European Symposium on Artificial Neural Networks (pp. 439-444). Bruges, Belgium: d-side public. Scholz, M., Fraunholz, M., and Selbig, J. (2007). Nonlinear Principal Component Analysis Neural Network : Models and Applications, Principal Manifolds for Data Visualization and Dimension Reduction (pp. 45-68). Springer. Scholz, M., Kaplan, F., Guy, C. L., and Kopka, J. (2005). Nonlinear PCA a missing data approach, Bioinformatics Vol.21 no.20 , 2887-2895. Sherrod, P. H. (2010). DTREG, www.dtreg.com: http://www.dtreg.com, diakses 26 Agustus 2010. Sung, K.-K., and Poggio, T. (1998). Example-Based Learning for View-Based Human Face Detection, IEEE Transactions On Pattern Analysis And Machine Intelligence, VOL. 20, NO. 1, 39-51. Suyanto. (2007). Artificial Intelligence Searching, Reasoning, Planning, and Searching, Bandung. Takane, Y. (1995). Nonlinear PCA by Neural Network Models, McGill University. Vasechkina, E., and Yarin, V. (2001). Evolving polynomial neural network by means of genetic algorithm: some application examples, Marine Hydrophysical Institute of National Academy of Sciences, Ukraine. Wang, X., Li, L., Lockington, D., Pullar, D., and Jeng, D.-S. (2005). Self-Organizing Polynomial Neural Network for Modelling Complex Hydrological Processes, Department of Civil Engineering, The University of Sydney, Sydney, Australia. Yang, M.-H., Kriegman, D. J., and Ahuja, N. (2002). Detecting Faces in Images: A Survey, IEEE Transactions On Pattern Analysis And Machine Intelligence, VOL. 24, NO. 1 , 34-56.
150