BAB II LANDASAN TEORI
3.1 Tinjauan Pustaka Beberapa penelitian yang berhubungan dengan penelitian ini dirangkum dalam table berikut :
Tabel 2.1 Tinjauan Pustaka Penelitian No.
Penelitian
Deskripsi
1.
(Patel, Lal,
Penelitian ini mengusulkan sistem untuk
Kavanagh, &
mendeteksi kelelahan pada pengemudi
Rossiter, 2010)
kendaraan. Penelitian ini menggunakan teknik segmentasi kulit dan diuji dengan menggunakan video rekaman (tidak real time atau offline).
5
6 2
(Królak &
Penelitian ini mengusulkan sistem kontrol
Strumiłło, 2011)
untuk mengendalikan komputer dengan menggunakan eye tracking dan eye blink detection. Penelitian ini menggunakan menggunakan metode template matching. Sistem ini diuji oleh 49 responden dan mencapai tingkat keakuratan sebesar 99%.
3
(Pimplaskar,
Penelitian ini mengusulkan sistem eye
Nagmode, &
tracking secara real time untuk mendeteksi
Borkar, 2013)
kantuk pada pengendara kendaraan dengan metode yang dikembangkan sendiri. Sistem ini dijalankan pada 25-30 frame per detik. Sistem ini mencapai tingkat keakuratan sebesar 97.67%.
7 4
(Han, Yang, Kim,
Penelitian ini mengusulkan pencegahan
& Gerla, 2012)
Computer Vision Syndrome pada pengguna Mobile Device. Aplikasi mobile yang diusulkan melacak tingkat berkedip pengguna. Untuk deteksi kedipan mata menggunakan template matching. Deteksi kedipan mata dilakukan secara dinamis terhadap perubahan posisi antara responden dengan mobile device.
5
(Mohammed &
Penelitian ini mengusulkan suatu kontrol
Anwer, 2014)
untuk mengendalikan panggilan masuk pada handphone dengan menggunakan kedipan mata. Untuk mendeteksi kedipan mata menggunakan perhitungan jumlah piksel pada daerah mata yang dideteksi. Tingkat keakuratan mencapai 98% dan 100% untuk jarak 35cm.
8 6
(Polatsek, 2013)
Penelitian ini mengusulkan metode deteksi kedipan mata untuk mencegah Computer Vision Syndrome, yaitu: Histogram Backprojection dan Inner Movement Detection (berdasarkan KLT Tracker). Metode Inner Movement Detection memiliki tingkat akurasi yang lebih baik dibanding dengan metode Histogram Backprojection.
7
(Desai, 2012)
Penelitian ini mengusulkan sistem deteksi kewaspadaan untuk mendeteksi kelelahan pada pengendara kendaraan dengan menggunakan EOG (Electrooculogram) dan EEG (Electroencephalogram). Sistem ini berhasil dibuat dengan biaya rendah (low cost).
9 8
(Horng, Chen,
Penelitian ini mengusulkan sistem deteksi
Chang, & Fan,
kelelahan pada pengemudi. Untuk mendeteksi
2004)
posisi mata terbuka atau tertutup menggunakan perhitungan pikselpada daerah bola mata yang telah dideteksi. Pengujian dilakukan dengan menggunakan 4 video dan tingkat akurasi mencapai 88.9%.
9
(Chau & Betke,
Penelitian ini mengusulkan sistem Human
2005)
Computer Interface untuk membantu orangorang yang memiliki cacat fisik dalam menggunakan komputer. Sistem ini menggunakan template matching untuk bagian mata terbuka dengan menghitung normalisasi koefisien korelasi. Sistem ini mencapai tingkat akurasi 95,3%.
10 10
(Victor, Kosasih, &
Penelitian ini mengusulkan suatu sistem yang
Klara, 2009)
mengendalikan mouse komputer menggunakan mata dengan tujuan untuk membantu orang-orang dengan cacat fisik. Sistem ini menggunakan metode Lucas Kanade untuk melakukan tracking pergerakan mata dan kedipan mata. Sistem ini memiliki akurasi kedipan mata : 90% untuk mata kiri dan 75% untuk mata kanan.
Beberapa penelitian yang terkait dengan deteksi kedipan mata telah banyak dilakukan sebelumnya untuk berbagai macam tujuan, antara lain: mendeteksi kelelahan pada pengendara kendaraan(Patel, Lal, Kavanagh, & Rossiter, 2010), mengendalikan komputer(Królak & Strumiłło, 2011), mengendalikan panggilan masuk pada telepon genggam (Mohammed & Anwer, 2014), dan pencegahan Computer Vision Syndrome pada pengguna mobile device(Han, Yang, Kim, & Gerla, 2012) ataupun komputer(Polatsek, 2013). Berbagai jenis metode juga telah diterapkan pada penelitian sebelumnya, antara lain: metode template matching pada
daerah
mata(Królak
backprojection(Polatsek,
&
2013),
Strumiłło, dan
metode
2011),
metode
histogram
Centre
Aligned
Movement
Detection(Polatsek, 2013). Yang membedakan penelitian ini dengan penelitianpenelitian sebelumnya adalah metode untuk eye blink detection menggunakan Background Subtraction. Metode Background Subtraction sudah banyak diterapkan sebelumnya untuk kepentingan lain seperti: mendeteksi aktifitas pekerja dalam sebuah perusahaan dan mendeteksi arus lalu lintas di jalan raya.
11 Namun metode Background Subtraction belum pernah diterapkan sebelumnya untuk mendeteksi kedipan mata. Aplikasi eye blink detection ini menggunakan library OpenCV dan berbasis C++.
3.2 Dry Eye Permukaan mata terus-menerus dialiri dengan air mata yang berguna untuk menjaga kebahasan mata, melindungi dari infeksi, dan membantu penyembuhan luka. Kondisi yang menunjukkan bahwa mata mengalami kekeringan adalah kualitas atau kuantitas air mata menjadi tidak normal sehingga mengakibatkan kerusakan permukaan okular, iritasi mata atau gangguan penglihatan(Singapore National Eye Centre, n.d.). Mata kering dipengaruhi oleh beberapa faktor eksternal dan internal (Rosenfield, 2011), yaitu: 1.
Environmental factors producing corneal drying: cuaca kering atau berangin, penggunaan AC atau kipas angin, danudara yang berdebu.
2.
Reduced blink rate: Saat menggunakan VDT tingkat berkedip berkurang. Ketika mata berkedip, air mata membuat permukaan mata menjadi lembab dan membasuh debu. Sebuah penelitian yang disebutkan dalam (Rosenfield, 2011) membandingkan tingkat berkedip saat bersantai, membaca buku dan membaca teks pada VDT. Saat bersantai tingkat berkedip rata-rata adalah 22 per menit. Namun saat membaca buku 10 per menit dan selama melihat VDT itu hanya 7 per menit.
3.
Incomplete blinking: Hal ini terjadi ketika bekerja dengan menggunakan komputer. Mengacu pada studi yang menunjukkan bahwa incomplete
12 blinking mungkin juga penyebab Computer Vision Syndrome (Rosenfield, 2011). 4.
Increased corneal exposure: Terkait dengan tinggi sudut pandangan yang bisa mengakibatkan peningkatan laju penguapan air mata sehingga cepat membuat mata menjadi kering.
5.
Age and gender: Pada umumnya mata kering meningkat sesuai dengan pertambahan usia, dan lebih sering dialami oleh wanita daripada pria.
6.
Systemic diseases and medications: Penyakit seperti arthritis, alergi atau penyakit tiroid dapat menyebabkan pengeringan mata. Mata kering juga memiliki hubungan dengan berbagai obat sistemik termasuk diuretik, antihistamin, psikotropika, dan antihipertensi.
7.
Contact lens wear: Memakai lensa kontak mengubah tingkat berkedip secara signifikan. Penyebabnya merupakan iritasi dengan lensa atau air mata lebih tidak stabil.
8.
Ocular conditions: mata kering mungkin akibat dari disfungsi kelenjar yang memproduksi air mata film.
3.3 Pengolahan Citra Digital Pengolahan citra digital (Digital Image Processing) adalah sebuah disiplin ilmu yang mempelajari tentang teknik-teknik mengolah citra. Citra yang dimaksud disini adalah gambar diam (foto) maupun gambar bergerak atau video (yang berasal dari webcam). Sedangkan digital disini mempunyai maksud bahwa pengolahan citra/gambar dilakukan secara digital menggunakan komputer. Secara matematis, citra merupakan fungsi kontinyu (continue) dengan intensitas cahaya pada bidang dua dimensi. Agar dapat diolah dengan komputer
13 digital, maka suatu citra harus dipresentasikan secara numerik dengan nilainilaidiskrit. Representasi dari fungsi kontinyu menjadi nilai-nilai diskrit disebut digitalisasi citra(Pambudi & Simorangkir, 2012).
3.3.1 Computer Vision Terminologi lain yang berkaitan erat dengan pengolahan citra digital adalah computer vision atau machine computer. Pada hakikatnya, computer vision mencoba meniru cara kerja visual manusia (Human Vision). Human Vision sesungguhnya sangat kompleks, manusia melihat obyek dengan indera penglihatan (mata) lalu obyek citra diteruskan ke otak untuk diinterpretasi sehingga manusia mengerti obyek apa yang tampak dalam pandangan matanya. Hasil interpretasi ini mungkin digunakan untuk mengambil suatu keputusan. Sebagaimana layaknya mata dan otak, computer vision adalah suatu sistem yang mempunyai kemampuan untuk menganalisis obyek secara visual, setelah data obyek yang bersangkutan dimasukkan dalam bentuk citra. Proses-proses dalam computer visiondibagi dalam 3 (tiga) aktifitas: • Memperoleh atau mengakuisisi citra digital, proses ini bisa disebut juga sebagai proses image preprocessing. • Melakukan teknik komputasi untuk memproses atau memodifikasi data citra berupapiksel. • Menganalisis dan menginterpretasi citra menggunakan hasil pemrosesan untuk tujuan tertentu, misalnya memandu robot, mengontrol peralatan, memantau manufaktur dan lain-lain.
14 Pengolahan citra merupakan proses awal (preprocessing) pada computer vision, sedangkan pengenalan pola merupakan proses untuk menginterpretasi citra. Teknik-teknik di dalam pengenalan pola memainkan peranan penting dalam computer vision untuk mengenali objek (Pambudi & Simorangkir, 2012).
3.3.2 Haar-Like Feature Penelitian mengenai deteksi dan pengenalan wajah teknologi computer vision telah banyak dilakukan, salah satunya adalah menggunakan Haar-Like Feature(Mustafa, Min, & Zhu, 2014). Haar-Like Feature yang dikenal sebagai Haar Cascade Classifier merupakan rectangular (persegi) features, yang memberikan indikasi secara spesifik pada sebuah gambar atau image. Ide dari Haar-Like Feature adalah untuk mengenali obyek berdasarkan nilai sederhana dari fitur tetapi bukanmerupakan nilai piksel dari image obyek tersebut. Metode ini memiliki kelebihan yaitu komputasinya sangat cepat, karena hanya bergantung pada jumlah piksel dalam persegi bukan setiap nilai piksel dari sebuah image. Metode ini merupakan metode yang menggunakan statistical model (classifier). Pendekatan untuk mendeteksi objek dalam gambar menggabungkan empat konsep utama (Pambudi & Simorangkir, 2012): • Training data • Fitur segi empat sederhana yang disebut fitur Haar. • Integral image untuk pendeteksian fitur secara cepat. • Pengklasifikasi bertingkat (Cascade classifier) untuk menghubungkan banyak fitur secaraefisien.Cascade classifier adalah sebuah rantai stage
15 classifier, dimana setiap stage classifier digunakan untuk mendeteksi apakah didalam image sub window terdapat obyek yang diinginkan (object of interest). Stage classifier dibangun dengan menggunakan algoritma
adaptive-boost
mengkombinasikan
(AdaBoost).
performance
banyak
Algoritma weak
classifier
tersebut untuk
menghasilkan strong classifier. Weak classifier dalam hal ini adalah nilai dari Haar-Like Feature. Jenis AdaBoost yang digunakan adalah Gentle AdaBoost. Template informasi Haar Cascade disimpan dalam file dengan format XML (Mustafa, Min, & Zhu, 2014).
3.3.3 Format File XML (Extensible Markup Language) XML (Extensible Markup Language) adalah sebuah bahasa markup yang digunakan untuk memuat, mengatur, dan menjelaskan informasi. XML dapat digunakan sebagai wadah untuk setiap informasi yang dapat direpresentasikan secara tekstual. XML terdiri dari elemen sebagai container untuk setiap bagian potongan data dalam dokumen. Elemen yang mengandung unsur-unsur lain atau teks memiliki tag pembuka dan penutup,dan elemen kosong yang ditulis dengan tag tunggal(Gamble, 2011). Sebagian besar dokumen XML mudah dibaca oleh manusia: mudah untuk membedakan data, tag awal dan tag penutup dan untuk mendapatkan beberapa ide tentang bagaimana data terstruktur. Dokumen XML memiliki tree structure danroot element yang berisi semua elemen lainnya(Gamble, 2011).
16 OpenCV menyimpan template informasi Haar Cascade dalam bentuk format file XML.
3.3.4 Citra Grayscale Citra Grayscale merupakan citra digital yang hanya memiliki satu nilai kanal pada setiap pixelnya, dengan kata lain nilai bagian RED = GREEN = BLUE. Nilai tersebut digunakan untuk menunjukkan tingkat intensitas. Warna yang dimiliki adalah warna dari hitam, keabuan, dan putih. Tingkatan keabuan di sini merupakan warna abu dengan berbagai tingkatan dari hitam hingga mendekati putih (Putra, 2010).
3.3.5 Citra Biner Citra biner adalah citra digital yang hanya memiliki dua kemungkinan nilai pixel yaitu hitam dan putih. Citra biner juga disebut sebagai citra B&W (black and white) atau citra monokrom. Hanya dibutuhkan 1 bit untuk mewakili nilai setiap pixel dari citra biner. Citra biner seringkali muncul sebagai hasil dari proses pengolahan seperti segmentasi, pengambangan, morfologi, ataupun dithering(Putra, 2010).
3.3.6 Face Detection Pengenalan wajah adalah tugas yang biasa dilakukan manusia secara mudah dan rutin dalam kehidupan sehari-hari. Sehingga muncul minat yang sangat besar untuk membuat agar pengenalan wajah dapat dilakukan oleh sistem komputer dalam pengolahan gambar digital otomatis. Sistem
17 pengenalan wajah pertama dikembangkan oleh Takeo Kanade pada tahun 1973 (Li & Jain, 2011). Sistem pengenalan wajah adalah salah satu metode identifikasi biometrik dari individu dengan fitur wajah. Selama dekade terakhir, pengenalan wajah telah menjadi penelitian umum di bidang visual mesin dan juga salah satu aplikasi yang sukses dari pengolahan gambar yang memainkan peran penting dalam banyak aplikasi saat ini. Contoh aplikasi yang menerapkan sistem pengenalan wajah adalah: otentikasikeamanan untuk membuat akses ke sistem perbankan, smart card, hiburan dan lainlain(Tofighi, Khairdoost, Monadjemi, & Jamshidi, 2014).Secara umum, sistem deteksi wajah dalam penelitian yang dilakukan oleh Tofighi et al. (2014) terdiri dari bagian-bagian berikut: • Mendeteksi wajah dari input video • Fitur ekstraksi untuk menentukan identitas wajah dalam video • Perbandingan dengan gambar yang direkam dalam database dan mengidentifikasi wajah Pengenalan wajah adalah masalah pengenalan pola visual, di mana wajah direpresentasikan sebagai objek tiga dimensi yang dipengaruhioleh pencahayaan, pose, ekspresi dan faktor lainnya, perlu diidentifikasi berdasarkan gambar yang diperoleh. Aplikasi tertentu membutuhkan tingkat keamanan yang lebih tinggi dengan menggunakan gambar tiga dimensi (kedalaman jangkauan) atau gambar optikdi luar spektrum visual (Li & Jain, 2011). Sistem pengenalan wajah mendeteksi wajah dari latar belakang atau background(Li & Jain, 2011).
18 Metode
viola-jonesmerupakan
sebuah
metode
yang
sesuaiuntukpendeteksianobjek padacitrayangbersifatasimetris(jumlahpersebaranantaraobjekyangdicaridan bukan objek tidak seimbang). Metode ini menggunakan 3 hal utama dalam melakukan pendeteksian objek(Viola & Jones, 2004), yaitu: 1. Features: klasifikasi citra gambar dilakukan berdasarkan nilai dari sebuah fitur 2. Algoritma AdaBoost: memilih fitur spesifik yang akan digunakan dan mengatur nilai ambang (threshold) 3. Cascade Classifier: meningkatkankecepatan pendeteksian obyek dengan memfokuskan pada daerah citra yang berpeluang Metode
viola-jones
cukup
efektif
untuk
diterapkan
pada
pendeteksian wajah. Setelah wajah terdeteksi maka akan dilanjutkan dengan pendeteksian area mata.
3.3.7 Eye Detection Deteksi mata merupakan langkah pengolahan yang diperlukan untuk banyak algoritma pengenalan wajah. Koordinat kedua mata diperlukan untuk normalisasi geometris yang tepat sebelum recognition atau pengenalan. Selain itu, mata juga berfungsi sebagai titik referensi untuk menemukan fitur penting lainnya seperti wajah, hidung dan mulut. Deteksi mata merupakan hal yang diteliti dengan baik untuk masalah pengenalan wajah yang dibatasiterhadap jarak, pencahayaan, dan variasi pose yang terbatas(Heflin, Scheirer, Rocha, & Boult, 2011).
19 Posisi mata pada gambar wajah ditemukan atas dasar ketergantungan geometri tertentu yang dikenal untuk wajah manusia. Aturan tradisional proporsi menunjukkan wajah dibagi menjadi enam kotak yang sama, dua kali tiga. Menurut aturan ini, lokasi mataterletak sekitar 0,4 dari atas kepala ke mata.Wilayah mata diekstrak dari citra wajah dan digunakan sebagai template untuk pelacakan mata lebih lanjut dengan cara pencocokan pola (template matching). Ekstraksi wilayah mata dilakukan hanya pada inisialisasi sistem dan dalam kasus-kasus ketika prosedur deteksi wajah diulang (Królak & Strumiłło, 2011). Wilayah mata diekstrak dari wajah menggunakan asumsi bahwa terletak diantara 1/6 bagian atas dan 2/5 dari seluruh daerah wajah (Patel, Lal, Kavanagh, & Rossiter, 2010). Wilayah mata ini dibagi menjadi dua bagian mata yaitu mata kiri dan mata kanan. Hal ini dilakukan dengan membagi wilayah gambar mata yang diambil secara vertikal dari tengah. Iris diekstraksi dengan memanfaatkan fakta bahwa wilayah iris adalah fitur gelap mata dibandingkan dengan daerah sekitarnya. Daerah mata yang diekstraksi diubah menjadi citra biner sehingga iris dapat divisualisasikan dengan jelas dibandingkan dengan daerah sekitarnya. Iris selanjutnya diekstraksi menggunakan teknik proyeksi horizontal dan vertikal yang digunakan untuk mengekstrak daerah wajah awal.
3.3.8 Eye Blink Detection Deteksi kedipan mata atau Eye Blink Detection memiliki berbagai kegunaan misalnya deteksi kelelahan pengemudi, pemantauan pengguna untuk pencegahan mata kering, membantu orang cacat untuk berinteraksi
20 dengan komputer atau face detection liveness(Drutarovsky & Fogelton, 2015). Kedipan mata didefinisikan denganmenutup dan membuka kembali kelopak mata dengan cepat. Mata tertutup parsial disebut berkedip tidak lengkap. Kedipan mata pada umumnya berlangsung dari 150 sampai 300ms. Jadi kamera standar dengan 25-30 frame per detik (fps) cukup untuk melakukan monitoring kedipan mata(Drutarovsky & Fogelton, 2015). Tingkat kedipan mata atau Eye Blink Rate (EBR) dipengaruhi oleh faktor lingkungan, jenis kegiatan dan karakteristik individu(Remeseiro, Fernández, & Lira, 2015). Sistem deteksi kelelahan didasarkan pada penilaian tingkat kedipan mata atau EBR.Peningkatan tingkat berkedip menunjukkan peningkatan rasa kantuk(Patel, Lal, Kavanagh, & Rossiter, 2010).
2.3.9 Background Subtraction Background subtraction adalah teknik yang digunakan untuk menghasilkan daerah foreground (citra biner yang berisi piksel dari objek bergerak dalam Region of Interest) dengan menggunakan kamera statis. Background subtraction menghitung daerah foreground dengan melakukan pengurangan antara frame dan model latar belakang (background), yang mengandung
bagian
statis
dari
suatu
ROI
(Region
of
Interest)(KaewTraKulPong & Bowden, 2001). Pemodelan latar belakang terdiri dari dua langkah utama, yaitu : background initialization dan background update. Pada langkah pertama, menghitung latar belakang dari model yang diinisialisasi, sedangkan pada
21 langkah kedua model diperbarui untuk beradaptasi dengan kemungkinan perubahan dalam ROI (Region of Interest). Setiap piksel latar belakang dimodelkan dengan campuran distribusi K Gaussian (nilai K = 3 sampai 5)(KaewTraKulPong & Bowden, 2001). Algoritma Gaussian Mixture Model untuk background subtraction terus dikembangkan (Zivkovic, 2004), dimana waktu pemrosesan yang cepat, jumlah komponen Gaussian disesuaikan per piksel,dan segmentasi yang membaik(Zivkovic & van der Heijden, 2006). Dan pada library OpenCV, metode ini disajikan dalam BackgroundSubtractorMOG2.