UNIVERSITAS INDONESIA
PERBANDINGAN PELACAKAN WAYANG DENGAN MENGGUNAKAN MSER DAN MSER EFISIEN
SKRIPSI
ANETA NPM.0806339036
FAKULTAS TEKNIK PROGRAM STUDI TEKNIK KOMPUTER UNIVERSITAS INDONESIA DEPOK 2012
Perbandingan pelacakan..., Aneta, FT UI, 2012
UNIVERSITAS INDONESIA
PERBANDINGAN PELACAKAN WAYANG DENGAN MENGGUNAKAN MSER DAN MSER EFISIEN
SKRIPSI Diajukan sebagai syarat untuk memperoleh gelar Sarjana.
ANETA NPM.0806339036
FAKULTAS TEKNIK PROGRAM STUDI TEKNIK KOMPUTER UNIVERSITAS INDONESIA DEPOK 2012
Perbandingan pelacakan..., Aneta, FT UI, 2012
iii Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
iv Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
UCAPAN TERIMA KASIH Puji syukur saya panjatkan kepada Tuhan Yang Maha Esa, karena atas berkat dan rahmat-Nya, saya dapat menyelesaikan skripsi ini. Penulisan skripsi ini dilakukan dalam rangka memenuhi salah satu syarat untuk mencapai gelar Sarjana Tekik Jurusan Teknik Komputer pada Fakultas Teknik Universitas Indonesia. Saya menyadari bahwa, tanpa bantuan dan bimbingan dari berbagai pihak, dari masa perkuliahan sampai pada penyusunan skripsi ini, sangatlah sulit bagi saya untuk menyelesaikan skripsi ini. Oleh karena itu, saya mengucapkan terima kasih kepada: 1. Ir. Dodi Sudiana, M.Eng, selaku dosen pembimbing yang telah menyediakan waktu, tenaga, dan pikiran untuk mengarahkan saya dalam penyusunan skripsi ini; 2. orang tua dan keluarga saya yang telah memberikan bantuan dukungan material dan moral; 3. Prof. Dr.Eng. Drs. Benyamin Kusumoputro M.Eng., atas ilmu yang telah diberikan mengenai pemrograman linier; 4. Ir. Endang Srimingsih, atas pengetahuang yang telah diberikan oleh beliau tentang taknik dijital; 5. Dhian Widya S.Si., M.Kom, atas pengetahuan yang diberikan mengenai aljabar linier; 6. pihak The MathWorks Inc. yang telah banyak membantu dalam usaha memperoleh data yang saya perlukan; 7. M. Adhitya Akbar, atas dukungan moral dan bantuan yang telah diberikan, serta kelapangan waktu untuk berbagi pengetahuan; 8. Teman-teman yang tidak dapat saya sebutkan namanya satu per satu yang telah banyak membantu saya dalam menyelesaikan skripsi ini. Akhir kata, saya berharap Tuhan Yang Maha Esa berkenan membalas segala kebaikan semua pihak yang telah membantu. Semoga skripsi ini membawa manfaat bagi pengembangan ilmu. Depok, 25 Juni 2012
v Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Penulis
vi Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
ABSTRAK
Nama
: Aneta
Program Studi
: Teknik Komputer
Judul
: Perbandingan Pelacakan Wayang dengan Menggunakan MSER dan MSER Efisien
Wayang adalah seni kuno dari Indonesia bentuk,
seperti
wayang
yang memiliki begitu banyak
orang, wayang golek,
dan wayang
kulit. Biasanya, wayangdigunakan untuk tampil di panggung dan memiliki latar belakang suara gamelan. Saat ini, wayang masih ada di Indonesia, apakah itu untuk pertujukan
atau
hanya
pajangan
yang
bagus dalam
kotak kaca.
Wayang memiliki begitu banyak karakter dalam cerita, dan itu sulit bagi kita untuk mengingat setiap nama karakter wayang. Akan menjadi mudah jika ada sistem untuk mengenali mereka, sehingga kita tidak perlu tahu nama masingmasing untuk karakter wayang. Tulisan ini diusulkan untuk membuat sistem pengenalan untuk wayang menggunakan 2 algoritma populer, MSER (Maximally Stable Extermal Region) dan MSER efisien. Dalam makalah ini, diusulkan untuk membandingkan algoritma
tersebut pada
PC dengan
video
wayang
yang
dimasukkan secara offline. Meskipun secara waktu komputasi MSER efisien lebih unggul daripada MSER biasa, namun ketika masuk ke dalam tahap pelacakan, MSER biasa justru lebih unggul daripada MSER efisien karena ia tidak mengolah sebagian level abu-abu pada citra sebagaimana MSER efisien, melainkan seluruh level keabu-abuan. Kata kunci: Computer vision, video processing, object detection, object recognition, wayang, MSER, PCA-SIFT, feature detection, stable region.
vii Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
ABSTRACT Name
: Aneta
Study Program
: Computer Engineering
Title
: Comparison of Wayang Recognition between Using MSER and Efficient MSER
Wayang is an ancient art from Indonesia that has so many forms, such as wayang orang, wayang golek, and wayang kulit. Usually, wayang is used for performing on a stage and it has background sound of gamelan. Nowadays, wayang still exists in Indonesia, whether it’s for perfoming or only a nice display in a glass box. Wayang has so many characters in its story, and it’s difficult for us to remember each name of wayang characters. It will be easy if there is a system to recognize them, so we don’t need to know each name to wayang characters. This writing is proposed to make a recognition system for wayang using 2 popular algorithms, MSER (Maximally Stable Extermal Region) and efficient MSER. In this paper, the writer proposed to compare those algorithms in a PC which video of wayang is processed offline.Although efficient MSER has more advantage in computing time, the regular MSER makes greater detection than efficient MSER because regular MSER doesn’t compute several gray level like efficient MSER, but all gray level. Key words: Computer vision, video processing, object detection, object recognition, wayang, MSER, PCA-SIFT, feature detection, stable region.
viii Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
DAFTAR ISI
HALAMAN SAMPUL ........................................................................................... I HALAMAN JUDUL ............................................................................................ II HALAMAN PERNYATAAN ORISINALITAS . ERROR! BOOKMARK NOT DEFINED. HALAMAN PENGESAHAN .............. ERROR! BOOKMARK NOT DEFINED. UCAPAN TERIMA KASIH ................................................................................V HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASITUGAS AKHIR UNTUK KEPENTINGAN AKADEMIS .. ERROR! BOOKMARK NOT DEFINED. ABSTRAK ......................................................................................................... VII ABSTRACT ...................................................................................................... VIII DAFTAR ISI ........................................................................................................ IX DAFTAR GAMBAR ......................................................................................... XII DAFTAR TABEL ............................................................................................ XIV BAB 1 PENDAHULUAN .................................................................................... 1 1.1. LATAR BELAKANG ............................................................................... 1 1.2. RUMUSAN MASALAH ........................................................................... 3 1.3. TUJUAN PENELITIAN............................................................................ 3 1.4. BATASAN MASALAH ............................................................................ 3 1.5. METODE PENELITIAN .......................................................................... 4 1.6. SISTEMATIKA PENULISAN.................................................................. 4 BAB 2 LANDASAN TEORI ............................................................................... 6 2.1. WAYANG ................................................................................................. 6 2.2. MSER ........................................................................................................ 8 2.3. PCA-SIFT .................................................................................................. 8
ix Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
2.4. OBJECT TRACKING ............................................................................... 9 2.3.1. DETEKSI OBYEK ....................................................................... 10 2.3.2. PELACAKAN OBYEK ................................................................ 12 2.3.3. IDENTIFIKASI OBYEK .............................................................. 13 2.5. COMPUTER VISION ............................................................................. 14 2.6. SELF ORGANIZING MAP .................................................................... 17 2.7. VIDEO ..................................................................................................... 18 BAB 3 METODOLOGI PELACAKAN WAYANG DENGAN MENGGUNAKAN MSER DAN MSER EFISIEN .............................. 20 3.1. RANCANGAN KERJA PROGRAM ...................................................... 20 3.1.1. DESKRIPSI .................................................................................. 20 3.1.2. DIAGRAM ALIR CARA KERJA PROGRAM ........................... 21 3.2. ALGORITMA YANG DIGUNAKAN .................................................... 22 3.2.1. MSER ............................................................................................ 22 3.2.2. MSER EFISIEN ............................................................................ 23 3.2.3. PCA-SIFT ..................................................................................... 24 3.3. SELF ORGANIZING MAP .................................................................... 25 3.4. SPESIFIKASI PERANGKAT KERAS DAN PERANGKAT LUNAK .. 25 3.4.1. PERANGKAT KERAS ................................................................ 25 3.4.2. PERANGKAT LUNAK ............................................................... 26 BAB 4 HASIL PENGUJIAN DAN ANALISA ................................................. 28 4.1. HASIL PENGUJIAN ............................................................................... 28 4.1.1. WAKTU KOMPUTASI UNTUK TIAP ALGORITMA .............. 28 4.1.2. TINGKAT KEAKURATAN PENDETEKSIAN WAYANG PADA TIAP ALGORITMA ......................................................... 30 4.1.3. TINGKAT KEAKURATAN PENGENALAN WAYANG ......... 34 4.2. ANALISA ................................................................................................ 39 4.2.1. ANALISA WAKTU ..................................................................... 39 4.2.2. ANALISA TINGKAT KEAKURATAN PENDETEKSIAN WAYANG .................................................................................... 39 4.2.3. TINGKAT KEAKURATAN PENGENALAN WAYANG ......... 40
x Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
BAB 5 PENUTUP............................................................................................... 42 5.1. KESIMPULAN ....................................................................................... 42 5.2. SARAN .................................................................................................... 42 REFERENSI ........................................................................................................ 44 LAMPIRAN 1 DOKUMENTASI ...................................................................... 46 LAMPIRAN 2 DETAIL INFORMASI ............................................................. 49
xi Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
DAFTAR GAMBAR
Gambar 2. 1 Wayang Kulit [11].............................................................................. 7 Gambar 2. 2 State Diagram Dari Pelacakan Obyek Dari Video [3] ..................... 10 Gambar 2. 3 Flow Chart Deteksi Obyek[3] .......................................................... 11 Gambar 2. 4 Flow Chart Pelacakan Obyek Penting [3] ........................................ 12 Gambar 2. 5 Flow Chart Identifikasi Obyek [4] ................................................... 13 Gambar 2. 6 Pengumpulan Pixel Pada Sensor Ccd. Ccd Mengerjakan Fungsi Shift Elektron, Sementara Sensor Cmos Mengubah Elektron Menjadi Tegangan Berbasis Per-Pixel. Hanya Sensor Cmos Yang Memiliki Fungsi RowSelect. [3]................................................................................................... 15 Gambar 2. 7 Organisasi Memori Dan Aliran Data Pada Processing Board [4] ... 16 Gambar 3. 1 Diagram Umum Cara Kerja Program............................................... 21 Gambar 3. 2 Diagram Alir Cara Kerja Program ................................................... 21 Gambar 3. 3 Pc Yang Digunakan Untuk Membuat Sistem .................................. 26 Gambar 4. 1waktu Penjalanan Program Untuk Tiap Algoritma Dalam Menit ..... 29 Gambar 4. 2 Grafik Persentase Perbandingan Tingkat Keberhasilan Ekstraksi Fitur Mser Pada Tiap Frame Di Tiap Video ............................................. 32 Gambar 4. 3 Grafik Perbandingan Tingkat Pendeteksian Dari Algoritma Pca-Sift Berdasarkan Pada Hasil Ekstraksi Fitur Dari Mser Dan Mser Efisien Pada Video, Dalam %. ....................................................................................... 34 Gambar 4. 4 Grafik Banyak Keypoint Terdeteksi Pada Mser .............................. 35 Gambar 4. 5 Grafik Banyak Keypoint Pada Mser Efisien (0-60) ......................... 35 Gambar 4. 6 Grafik Banyak Keypoint Terdeteksi Pada Mser Efisien (61-120) ... 36 Gambar 4. 7 Banyak Keypoint Terdeteksi Pada Mser Efisien (121-180)............. 36 Gambar 4. 8 Grafik Keypoint Terdeteksi Pada Mser Efisien (181-240) .............. 37
xii Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Gambar 4. 9 Bentuk Topologi Som Berukuran 20x20 ......................................... 37 Gambar 4. 10 Perbandingan Peta Bobot Som Hasil Pembelajaran Dari Tiap Algoritma Mser Biasa (A), Mser Efisien Dengan Level Abu-Abu 0-60 (B), 61-120 (C), 121-180 (D), Dan 181-240 (E) .............................................. 38
xiii Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
DAFTAR TABEL Tabel 4. 1 waktu penjalanan program untuk tiap algoritma dalam menit ............. 29 Tabel 4. 2 tingkat keberhasilan ekstraksi fitur MSER pada video 1.avi ............... 30 Tabel 4. 3 tingkat keberhasilan ekstraksi fitur MSER pada video 2.avi ............... 30 Tabel 4. 4 tingkat keberhasilan ekstraksi fitur MSER pada video 3.avi ............... 31 Tabel 4. 5 tingkat keberhasilan ekstraksi fitur MSER pada video 4.avi ............... 31 Tabel 4. 6 tingkat keberhasilan ekstraksi fitur MSER pada video 5.avi ............... 32 Tabel 4. 7 tingkat pendeteksian dari algoritma PCA-SIFT berdasarkan pada hasil ekstraksi fitur dari MSER dan MSER efisien pada video, dalam %. .. 33 Tabel 4. 8 recognition rate dari tiap algoritma dengan ANN yang sama .............. 34
xiv Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
BAB 1 PENDAHULUAN 1.1. LATAR BELAKANG Wayang (secara literal berarti bayangan) adalah warisan kebudayaan Indonesia yang perlu dilestarikan. Wayang sendiri dulunya adalah lembaran bergambar yang diceritakan oleh dalang dalam sebuah pertujukan untuk menuturkan cerita bagi penontonnya. Kemudian wayang berkembang tidak hanya dalam bentuk lembaran, tetapi dalam bentuk boneka berupa lembaran pipih terbuat dari kulit. Persis seperti pertunjukan boneka, wayang adalah figur dalam cerita yang dapat digerakkan oleh dalang. Kini, wayang tidak hanya monoton dalam bentuk lembaran kulit pipih bergambar, tetapi juga dalam bentuk boneka tangan, bahkan diperankan langsung oleh manusia. Karakternya bukan hanya karakter yang ada dalam cerita, tetapi juga figur orang-orang penting zaman sekarang. Dari segi cerita pun terjadi perkembangan. Kalau ketika itu cerita yang dipertontonkan adalah cerita klasik seperti Mahabarata dan Ramayana, maka yang dipertontonkan sekarang ini kebanyakan adalah kejadian teladan sehari-hari. Salah satu cara untuk melestarikan seni wayang adalah dengan mengadakan pertunjukan wayang. Sayangnya, tidak semua orang Indonesia mengetahui semua karakter dalam cerita pewayangan yang berlatarkan kisah Mahabarata atau Ramayana. Hanya tokoh-tokoh yang terkenal saja yang diketahui, seperti Gatotkaca dan Arjuna, padahal tokoh dalam wayang jumlahnya mencapai ratusan. Untuk itu, penulis bermaksud untuk memperkenalkan tokoh-tokoh tersebut kepada orang-orang yang turut menonton pertunjukan wayang tetapi kurang mengetahui siapa saja lakon dalam pertunjukan tersebut. Untuk mengenalkan tokoh-tokoh wayang ini kepada orang banyak, dimanfaatkan teknologi computer vision, di mana komputer dapat mempelajari citra dijital dalam bentuk video. Direncanakan, input dari system ini adalah video rekaman dari pertunjukan wayang, dan menghasilkan output berupa hasil identifikasi. Konsep dari computer vision ini mirip seperti sistem syaraf manusia, hanya saja yang melakukan proses berfikir bukan manusia, tetapi komputer. Tentulah ada perbedaan susunan sistem syaraf manusia dengan komputer.
1 Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Komputer memiliki sensor yang sedikit dibandingkan dengan manusia, tetapi kecepatan komputasinya mengalahkan manusia. Dengan kemampuan komputasi yang tinggi inilah, komputer kemudian dimodifikasi sedemikian rupa sehingga seakan-akan berpikir seperti cara manusia berpikir. Ilmu yang merekayasa komputer agar bisa berpikir seperti manusia itulah yang kemudian disebut sebagai Artificial Intelligence (AI). Perkembangan AI tidak hanya sebatas bagaimana komputer bisa berpikir, tetapi juga bisa “melihat”, “merasakan”, dan “mendengar” dengan memasang berbagai macam sensor seperti sensor suara, getara, tekanan, panas, dan cahaya. Salah satu kemampuan yang terus dikembangkan dari AI adalah kemampuan untuk “melihat”, yang kemudian disebut dengan computer vision. Computer vision ini menggunakan algoritma AI digabungkan dengan image processing atau pengolahan citra. Dalam hal ini, pengolahan citra adalah hal yang penting karena informasi yang didapatkan oleh komputer itu sendiri berasal dari citradijital. Karakteristik penting yang tertanam pada desain sistem pengolahan citra adalah tingkat signifigan dari level testing dan eksperimen yang normalnya dibutuhkan sebelum sampai pada solusi yang bisa diterima. Karakteristik ini mengimplikasikan bahwa kemampuan untuk merumuskan pendekatan dan solusi bentuk dasar yang cepat biasanya memainkan peranan penting dalam mereduksi biaya dan waktu yang diperlukan untuk sampai pada implementasi yang baik. [5] Dalam riset ini, dijabarkan rancangan penelitian terhadap 2 algoritma populer dalam computer vision dan image processing, yaitu MSER, MSER efisien, dengan algoritma AI berupa PCA-SIFT (Principal Component Anaysis-Scale Invariant Feature Transform) dan SOM (Self Organized Map) untuk mengenali obyek dengan struktur yang unik, yaitu wayang. Sebelumnya, sudah banyak tulisan tentang mengenali obyek dengan menggunakan algoritma-algoritma ini seperti Juan dan Gwun [6] dan Donoser [1], tetapi obyek yang dikenali biasanya adalah wajah, buah, plat mobil, botol, dan obyek-obyek umum lainnya. Dalam riset ini digunakan wayang sebagai obyek yang dikenali dengan harapan agar kebudayaan tradisional khas Indonesia ini
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
dapat lebih lestari. Sumber data yang akan diambil dari riset ini berupa video pertunjukan wayang.
1.2. RUMUSAN MASALAH Seperti yang dijelaskan pada latar belakang, akan digunakan algoritma yang digunakan dalam computer visison
untuk mengenali wayang sebagai obyek
targetnya. Metodologi yang diajukan dalam tulisan ini adalah bagaimana perbandingan waktu dan recognition rate antara pelacakan wayang dengan MSER dibandingkan dengan menggunakan MSER efisien, ditambah dengan algoritma PCA-SIFT sebagai deskriptornya. Output dari deskriptor PCA-SIFT kemudian diolah dalam algoritma jaringan neural buatan, yaitu SOM. 1.3. TUJUAN PENELITIAN Tujuan dari penelitian ini adalah untuk membandingkan cara kerja 2 buah algoritma yang digunakan untuk mendeteksi wayang, yaitu MSER dan MSER efisien. Hal yang dapat membedakan wayang dengan obyek lain di sekitarnya adalah corak dari wayang itu sendiri, dapat berupa hiasan batik pada pakaiannya atau ornamen pada kepalanya. Hal yang dibandingkan adalah kecepatan dan ketepatan obyek yang diidentifikasi.
1.4. BATASAN MASALAH Seni rupa wayang yang ada di Indonesia ini ada banyak jumlah dan jenisnya. Untuk itu, penulis perlu membatasi lingkup penelitian yang dikerjakan. Wayang yang digunakan untuk sistem ini adalah seluruh wayang yang tampil pada video pementasan wayang. Video yang digunakan untuk menguji kehandalan berdurasi 20 hingga 50 menit dengan meampilkan 30 buah karakter wayang, sedangkan untuk menguji recognition rate digunakan video dengan durasi 3 menit dengan menampilkan 3 buah karakter wayang. Video ini adalah video yang murni hanya menampilkan wayang saja. Karakter bergerak lain seperti manusia dan alat musik sudah dihilangkan dari video input. Untuk input video, penulis menganggap tidak ada noise apapun pada video yang dijadikan input. Format video yang digunakan oleh penulis adalah .avi
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
dengan seluruh proses input dilakukan secara offline (tidak menggunakan koneksi internet). Adapun batasan spesifikasi hardware dan software dapat dilihat di bab 3, bagian 3.3.
1.5. METODE PENELITIAN Metode penelitian yang digunakan dalam penulisan seminar ini adalah studi literatur. Studi literatur dilakukan untuk mendapatkan latar belakang masalah untuk merumuskan solusi dari masalah tersebut. Selain itu, studi literatur juga sangat diperlukan untuk mendapatkan latar keilmuan dan teknis dalam pengembangan sistem yang akan dibuat. Selain menggunakan studi literatur, riset ini juga mengacu pada riset dari Matas dkk. [7] (untuk MSER), Donoser dan Bischof [4] (untuk MSER efisien), dan Yan Ke dan Sukthankar [10] (untuk PCA-SIFT).
1.6. SISTEMATIKA PENULISAN Sistematika dari penulisan seminar ini adalah sebagai berikut: a) Bab 1 Pendahuluan Bab Pendahuluan ini berisi Latar Belakang, Tujuan Penulisan, Batasan Penulisan, dan Sistematika Penulisan. b) Bab 2 Landasan Teori Bab 2 ini memberikan pengantar mengenai berbagai teori yang digunakan dalam perancangan sistem, yang terdiri dari bahasan mengenai wayang, MSER, object tracking, computer vision, dan software yang penulis gunakan dalam penyusunan program, yaitu MATLAB®. c) Bab 3 Metodologi Pelacakan Wayang dengan Menggunakan MSER Dibandingkan dengan MSER Efisien Bab 3 membahas mengenai rancang bangun salah satu bagian dari sistem bantuan penderita buta warna yang berisi Rancangan Cara Kerja Program, Diagram Alir Program, algoritma yang digunakan, dan spesifikasi perangkat keras dan lunak. d) Bab 4 Hasil Pengujian dan Analisa
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Bab
4
iniberisitentanghasilpengujiansistempelacakan
yang
sudahdibuat, disertaidengantabeldangrafik.Adapunanalisaberisitentanganalisadaripenguj iansistemtersebut. e) Bab 5 Penutup Bab 5 berisi penutup dari penulisan skripsi ini, terdri dari kesimpulan dan saran dari penelitian yang sudah dilakukan.
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
BAB 2 LANDASAN TEORI 2.1. WAYANG Wayang adalah salah satu kesenian yang berusia lebih dari 10 abad di Indonesia. Wayang (dalam bahasa jawa artinya bayangan) dapat ditemukan di pulau Jawa dan Bali. Pertunjukan wayang pada zaman dulu seperti pertunjukan boneka di zaman sekarang. Ada tokoh buatan yang dilakonkan oleh si penggerak wayang, untuk mewakili tokoh dalam cerita yang sedang disampaikan. Wayang adalah salah satu kesenian yang sangat tua di Indonesia. Prasasti berupa lempengan tembaga dari Jawa Tengah; Royal Tropical Institute, Amsterdam, contoh prasasti ini dapat dilihat dalam lampiran buku Claire Holt Art in Indonesia: Continuities and Changes,1967 terjemahan Prof.Dr.Soedarsono (MSPI-2000-hal 431). Tertulis sebagai berikut: Dikeluarkan atas nama Raja Belitung teks ini mengenai desa Sangsang, yang ditandai sebagai sebuah tanah perdikan, yang pelaksanaannya ditujukan kepada dewa dari serambi di Dalinan. Lagi setelah menghias diri dengan cat serta bungabunga para peserta duduk di dalam tenda perayaan menghadap Sang Hyang Kudur. “Untuk keselamatan bangunan suci serta rakyat” pertunjukan (tontonan) disakilan. Sang Tangkil Hyang sang (mamidu), si Nalu melagukan (macarita) Bhima Kumara, serta menari (mangigal) sebagai Kicaka; si Jaluk melagukan Ramayana; si Mungmuk berakting (mamirus) serta melawak (mebanol), si Galigi mempertunjukkan Wayang (mawayang) bagi para Dewa, melagukan Bhimaya Kumara. [17] Wayang kulit di Indonesia mengambil cerita wayang terkenal dari India, yaitu Mahabarata dan Ramayana. Kini, pertunjukan wayang telah banyak bentuk dan variasinya, antara lain wayang orang dan wayang golek (boneka). Cerita yang ditampilkan pun bukan lagi merupakan cerita utuh dari Mahabarata maupun Ramayana, melainkan sepenggal kisah tentang Mahabarata atau Ramayana, dan itu pun biasanya sudah dimodifikasi sesuai dengan situasi kondisi tempat pementasan wayang tersebut.
6 Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
UNESCO, lembaga yang membawahi kebudayaan dari PBB, pada 7 November 2003 menetapkan wayang sebagai pertunjukkan bayangan boneka tersohor dari Indonesia, sebuah warisan mahakarya dunia yang tak ternilai dalam seni bertutur (Masterpiece of Oral and Intangible Heritage of Humanity). Sebenarnya, pertunjukan boneka tak hanya ada di Indonesia. Banyak negara memiliki pertunjukkan boneka. Namun, pertunjukkan bayangan boneka (Wayang) di Indonesia memiliki gaya tutur dan keunikkan tersendiri, yang merupakan mahakarya asli dari Indonesia. Dan untuk itulah UNESCO memasukannya ke dalam Daftar Warisan Dunia pada tahun 2003. Ketika agama Hindu masuk ke Indonesia dan menyesuaikan kebudayaan yang sudah ada, seni pertunjukkan ini menjadi media efektif menyebarkan agama Hindu, dimana pertunjukkan wayang menggunakan cerita Ramayana dan Mahabharata. Demikian juga saat masuknya Islam, ketika pertunjukkan yang menampilkan “Tuhan” atau “Dewa” dalam wujud manusia dilarang, munculah boneka wayang yang terbuat dari kulit sapi, dimana saat pertunjukkan yang ditonton hanyalah bayangannya saja, yang sekarang dikenal sebagai wayang kulit [16].
Gambar 2. 1 Wayang kulit [11]
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
2.2. MSER Konsep MSER (Maximally Stable Extremal Regions) dipelopori oleh Matas dkk [7] MSER merupakan kumpulan dari wilayah berbeda yang di deteksi dari citra gray scale. Semua wilayah ini didefinisikan sebagai property extermal dari fungsi intensitas dalam wilayah dan diatas batas luarnya. MSER memiliki sifat yang membentuk kemampuan superiornya sama stabil dengan detector local. MSER tertutup dalam transformasi geometri kontinu dan invariant terhadap perubahan intensitas. Lebih jauh lagi, MSER mendeteksi skala yang berbeda. Pohon komponen adalah struktur yang memperbolehkan deteksi MSER dalam sebuah citra, dan sebagai tambahan, menyusun dasar dari pelacakan MSER. Pohon komponen telah digunakan oleh Couprie dkk untuk implementasi pemisahan batas yang efisien. Pohon komponen adalah pohon yang berakar dan saling terhubung dan bisa dibangun untuk citra apapun dengan nilai pixel berasal dari rangkaian yang digunakan secara total. Tiap cabang dari pohon merepresentasikan wilayah yang terkoneksi dalam input citra Iin. Proses ini menghasilkan struktur data yang menyimpan area dari tiap komponen terkoneksi sebagai fungsi intensitas. Gabungan dari 2 komponen dapat dilihat sebagai eksistansi terminasi dari komponen yang lebih kecil dan penyisipan dari semua pixel komponen yang lebih kecil ke yang lebih besar. Kemudian, level intensitas yang merupakanlokal minima dari tingkat perubahan fungsi area dipilih sebagai threshold yang menghasilkan MSER. Sebagai output, MSER direpresentasikan sebagai posisi dari lokal intensitas minimum (atau maksimm) dan sebuah threshold.
2.3. PCA-SIFT SIFT terdiri dari 4 tahapan utama: deteksi ekstrem ukuran ruang, lokalisasi keypoint,
penetapan
orientasi,
dan
descriptor
keypoint,
tahap
pertama
menggunakan fungsi DoG (Difference of Gaussian) untuk mengidentifikasi titik perhatian penting, yang invariant terhadap orientasi dan skala. DoG lebih banyak digunakan daripada fungsi Gaussian itu sendiri untuk meningkatkan kecepatan komputasi. [8] ( 2.1)
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Pada awalnya, titik penting yang berpotensi diidentifikasi dengan meninjau citra pada lokasi dan skala. Hal ini dapat diimplementasikan secara efektif dengan membangun piramid Gaussian dan mencari puncak lokal (disebut sebagai keypoint) dalam rangkaian citra DoG. Pada tahap kedua, kandidat keypoint dilokalisasi ke akurasi sub-pixel dan dieliminasi apabila diketahui bahwa ia tidak stabil. Tahap ketiga, orientasi dari tiap keypoint diidentifikasi berdasarkan pada bidang citra lokal. Orientasi yang ditetapkan, skala, dan lokasi dari tipa keypoint memungkinkan SIFT untuk membangun tampilan kanonik untuk keypoint yang invariant terhadap peruahan yang mirip. Tahap terakhir adalah membangun descriptor citra lokal (local image descriptor) untuk tiap keypoint, berdasarkan pada gradient citra pada ketetanggaan lokalnya. Tahap terakhir dari algoritma SIFT membangun representasi untuk tiap keypoint berdasarkan pada bidang dari pixel dalam ketetanggaan lokalnya. perlu dicatat bahwa bidang tersebut telah dipusatkan sekitar lokasi keypoint, diputar pada dasar orientasi dominannya dan diskalakan pada ukuran yang pantas. Tujuannya adalah untuk membuat descriptor pada bidang tersebut menjadi kompak, sangat khas, dan tangguh pada perubahan warna dan sudut pandang kamera. PCA (Principal Component Analysis) adalah teknik standar untuk reduksi dimensi dan telah digunakan untuk berbagai permaslahan computer vision, termasuk diantaranya yaitu seleksi fitur, pengenalan obyek, dan pengenalan wajah. Meskipun PCA memiliki kekurangan seperti asumsi distribusi Gaussian dan keterbatasan kombinasi orthogonal linear, PCA tetap digunakan karena metodenya yang simpel.
2.4. OBJECT TRACKING Biasanya, tiap sistem pelacakan visual selalu dimulai dengan deteksi pergerakan. Deteksi pergerakan digunakan untuk memisahkan antara obyek bergerak yang koresponden dengan latar belakangnya. Proses awal dari deteksi pergerakan adalah menangkap citra lewat kamera video. Tahap deteksi pergerakan termasuk beberapa langkah pengolahan citra (seperti mengubah citra menjadi gray-scale dan smoothing, mengurangi resolusi citra dengan teknik citra resolusi
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
rendah, pembedaan frame, operasi morfologi, dan pelabelan). Langkah sebelum pemrosesan diperlukan untuk mengurangi noise citra agar pelacakan menjadi lebih akurat. Teknik smoothing didapatkan dengan menggunakan filter median. Citra beresolusi rendah digunakan dalam 3 frame yang berurutan untuk menghilangkan gerakan palsu di latar belakang, kemudian pembedaan fframe digunakan pada frame tersebut untuk mendeteksi obyek yang sedang bergerak dalam adegan tersebut. Proses berikutnya adalah mengaplikasikan operasi morfologi seperti erosi dan dilatasi sebagai filter untuk mengurangi noise yang tersisa di obyek bergerak. Pelabelan kemudian diaplikasikan untuk menandai tiap obyek bergerak yang berbeda dengan label yang berbeda-beda. Tahap berikutnya adalah melacak obyek bergerak. Pada tahap ini, digunakan teknik pencocokan blok untuk mengikuti hanya obyek bergerak yang menarik diantara obyek bergerak lain pada latar belakang. Blok-blok tersebut didefinisikan dengan membagi frame citra menjadi bagiat persegi yang tidak saling tumpangtindih. Bagian terakhir adalah identifikasi obyek. Untuk ini, kami menggunakan informasi spatial dan warna dari obyek yang diikuti sebagai fitur citra. Saat ada obyek baru muncul dalam adegan, obyek tersebut akan diikuti dan diberi label.
Deteksi Obyek
Pelacakan Obyek
Identifikasi Obyek
Gambar 2. 2 state diagram dari pelacakan obyek dari video [3]
2.3.1. DETEKSI OBYEK Kemampuan kerja dari sistem pengawasan dan keamanan otomatis bergantung pada kemampuannya dalam mendeteksi obyek bergerak dalam area yang sedang diawasi. Aksi beruntun berikutnya, seperti pelacakan, analisa
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
pergerakan, atau mengidentifikasi obyek, memerlukan ekstrasi yang akurat dari objek latar depannya, membuat obyek bergerak menjadi bagian yang krusial dari sistem tersebut. Untuk menentukan apakah obyek tersebut adalah latar depan atau tidak, harus ada model untuk intensitas background. Model ini haruslah dapat menangkap dan menyimpan informasi latar belakang yang diperlukan. Perubahan apapun, yang disebabkan oleh obyek baru, harus dideteksi oleh model ini, sepert halnya wilayah latar belakang yang berubah, seperti daun-daun di pohon atau bendera yang tertiup angin, harus diidentifikasi sebagai latar belakang. MULAI
Menangkap 3 frame yang berurutan
Frame ƒ(a-1)
Frame ƒ(a)
Frame ƒ(a+1)
Mengubah citra menjadi gray-scale
smoothing
Mengubah resolusi citra menjadi lebih kecil
Pembedaan frame
Perbedaan citra d(k-1)
Perbedaan citra d(k+1)
Operasi AND
Dilatasi
Erosi
Pelabelan Citra
SELESAI
Gambar 2. 3 flow chart deteksi obyek[3]
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
2.3.2. PELACAKAN OBYEK Setelah deteksi objek selesai, masalah untuk menstabilkan korespondensi antar mask obyek dalam frame yang berurutan pun muncul. Mengawali pelacakan, memperbarui pelacakan, dan mengakhiri pelacakan adalah hal yang harus diperhatikan dalam pelacakan obyek. Sangat penting untuk mendapatkan informasi pelacakan yang benar. Proses pelacakan dapat di pertimbangkan sebagai wilayah asosiasi mask antara frame yang berurutan sementara dan memperkirakan lintasan obyek tersebut dalam bidang citra ketika ia sedang bergeran dalam sebuah adegan. MULAI
Menemukan area obyek dari frame sebelumnya
Menemukan area obyek dari frame sekarang
Membuat blok pada frame sebelumnya
Membuat blok pada frame sekarang
Menemukan nilai korelasi maksimum = Corrmax
Corrmax > Th1 ?
ya
Blok selaras
tidak
Blok tidak selaras
Menghitung banyaknya blok yang selaras = Nblok
Nblok > Th2 ?
Bukan obyek penting
Obyek penting
SELESAI
Gambar 2. 4 flow chart pelacakan obyek penting [3]
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
2.3.3. IDENTIFIKASI OBYEK Indentifikasi obyek adalah langkah terakhir dari video tracking. Dalam hal ini, yang dilakukan adalah ekstrasi fitur dari deteksi obyek. Ada 2 hal yang biasa digunakan sebagai fitur, yaitu informasi warna dan spasial dari obyek tersebut. MULAI
Mengekstrak fitur dari obyek yang dilacak
Informasi spasial dari obyek yang dilacak
Informasi warna dari obyek yang dilacak
Apakah antrian pengecekan fitur kosong?
ya
Merekam fitur sebaga obyek inisial
Mencari kemiripan paling maksimal dari antrian fitur
Smax > Th1 ?
Menyimpan fitur sebagai obyek baru
Merekam fitur dari dari obyek sama seperti obyek yang memiliki Smax
SELESAI
Gambar 2. 5 flow chart identifikasi obyek [4]
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
2.5. COMPUTER VISION Pengolahan citra dan computer vision tidaklah berawal dari frame dari frame buffer. Sistem penglihatan tertanam membutuhkan pertimbangan seluruh alur pencitraan real-time dari pengambilan citra sampai hasil akhir, termasuk operasioperasi yang akan diaplikasikan pada citra tersebut. Hanya dengan mengerti alur dan langkah-langkah yang mempengaruhi tiap bagian,computer vision dapat dioptimalkan proses, disipkan pemrosesan dan disimpan di tempat yang optimal, dan dipisahkan datanya sebelum terjadi kerugian komputasi yang tidak diperlukan. Biasanya, pengolahan citra dan computer vision memerlukan pertimbangan kemampuan aplikasi, kecepatan, disipasi daya, dan ukuran dari sistem itu sendiri. Untuk mendukung hal tersebut, diperlukan perangkat-perangkat keras yang diperlukan untuk mendukung sistem tersebut. Perangkat keras tersebut antara lain: a) Sensor Sensor adalah alat yang digunakan untuk mengukur atau mendeteksi kondisi dunia nyata, seperti pergerakan, panas, atau cahaya, dan mengubah kondisi tersebut menjadi representasi analog atau dijital. Sensor optic mendeteksi intensitas atau kecerahan dari cahaya, atau intensitas warna merah, hijau, dan biru untuk sistem warna. [17] Sensor, dulunya adalah CRT (cathode ray tube) yang ditemukan oleh Ferdinand Braun, seorang fisikawan asal Jerman. Pertama kali digunakan untuk osiloskop, kemudian teknologi ini dikembangkan menjadi televise dimana cahaya electron dipindai melewati permukaan yang peka terhadap cahaya, menghasilkan citra. Teknologi kamera dijital berhubungan langsung dan berevolusi dari teknologi perekam citra televise. Pada tahun 1951, pelopor video tape recorder(VTR) menangkap citra langsung dari kamera TV dengan mengubah informasi menjadi impuls-impuls elektrik (dijital) dan menyimpan informasi tersebut ke dalam pita magnet. Laboratorium Bing Crosby (tim riset yang dibentuk oleh Crosby dan dipimpin oleh insinyur John Mullin) menghasilkan VTR pertama dan pada 1956, VTR teknologi
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
disempurnakan dan digunakan secara missal oleh industri televisi. Baik kamera televisi/video dan kamera dijital menggunakan CCD (charged coupled device) untuk mendeteksi warna cahaya dan intensitas.[14] CCD menggunakan MOS detector cahaya untuk pengumpulan foton dan untuk menghasilkan output. Perlu dicatat bahwa muatan dipindah tanpa membuat tegangan. Hanya pada tahap menghasilkan output saja muatan diubah menjadi voltase.
Gambar 2. 6 Pengumpulan pixel pada sensor CCD. CCD mengerjakan fungsi shift elektron, sementara sensor CMOS mengubah elektron menjadi tegangan berbasis per-pixel. Hanya sensor CMOS yang memiliki fungsi row-select. [3]
b) Interkoneksi ke sensor Saat mempertimbangkan desain fitur yang berhubungan dengan interkoneksi dari sensor citra ke komputer host, ada beberapa hal yang harus diperhatikan, antara lain: a. Lebar interface, apakah interface harus parallel atau serial. b. Arah aliran data, apakah interface harus unidirectional atau bidirectional. c. Daya yang dibutuhkan. d. Integritas kabel, konektor, dan sinyal. c) Pengoperasian citra Bagian ini membahas masalah bagaimana memproses data dengan bermacam operasi dan algoritma. Kecepatan pengerjaan sebuah algoritma oleh sebuah DSP (digital signal processor) atau FPGA (field programmable gate arrays) biasanya berbeda-beda tergantung dari performa general-purpose processor (GPP/CPU). Operasi yang biasa digunakan untuk dijalankan pada hardware berkemampuan tinggi pada sistem tertanam adalah fungsi dengan level rendah yang diunakan untuk
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
pre-process citra untuk analisis pada level yang lebih tinggi dan mungkin termasuk: a. Konvolusi, filter 2D dan filter yang dapat dipisah (Gaussian, wavelet, dll.) b. Deteksi Canny edge. c. Subsampling pada interval reguler. d. Kalkulasi histogram dan orientasi pinggiran. e. Kalkulasi integral citra. f. Konversi ruang warna (RGB2GRAY, RGB2HSV) d) Komponen perangkat keras Perangkat keras yang digunakan untuk computer vision bervariasi. Mulai dari GPP hingga special-purpose microprocessor seperti ASIC (application specific integrated circuit). Perangkat keras yang dibutuhkan untuk keperluan ini antara lain: a. DSP b. FPGA c. GPU d. Smart camera chip dan board e. Memori dan tempat penyimpanan e) Organisasi processing board
Gambar 2.7Organisasi memori dan aliran data pada processing board [4]
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
2.6. SELF ORGANIZING MAP Self Organizing Map (disingkat menjadi SOM atau juga disebut SOFM/sefl organizing feature map) dikembangkan oleh seorang profesor di Filandia, Teuvo Kohonen. SOM dapat merepresentasikan data multidimensi di dimensi spasial yang lebih rendah, biasanya satu atau dua dimensi. Proses ini, mereduksi dimensi vektor, adalah awal mula teknik kompresi yang disebut sebagai kuantisasi vektor. Sebagai tambahan, teknik Kohonen membuat jaringan yang menyimpan informasi sedemikian rupa sehingga hubungan topologi apapun dalam kelompok pelatihan dapat dikelola. Salah satu aspek menarik dari SOM adalah ia dapat mengelompokkan data tanpa panduan. Training dengan panduan (seperti bacpropagation) terdiri dari 2 buah vektor yang terdiri dari vektor input dan vektor target. Pendekatan ini vektor input dihadirkan pada jaringan (biasanya jaringan multilayer feedforward) dan output-nya dicocokkan dengan vektor target. Bila berbeda, bobot dari jaringan sedikit diubah untuk mengurangi kesalahan output. Hal ini dilakukan berulang kali dengan banyak rangkaian pasangan vektr sampai jaringan tersebut memberikan output yang diinginkan. Pelatihan SOM tidak memerlukan vektor target. SOM belajar untuk mengelompokkan data pelatihan tanpa pengarahan eksternal. SOM tidak memerlukan target output yang dikhususkan seperti tipe jaringan ANN lainnya. Sebaliknya, dimana bobot simpul sesuai dengan vektor input, area kisi secara selektif dioptimalkan untuk mendekati data untuk kelas vektor input yang menjadi anggotanya. Dari distribusi awal bobot random, dan dengan banyak iterasi, SOM secara bertahap membentuk peta untuk zona yang stabil. Tiap zona secara efektif adalah penggolong fitur, jadi dapat dibayangkan bahwa gambar output adalah peta fitur dari ruang input. Pelatihan, secara umum terjadi dengan beberapa tahap dengan banyak iterasi. Berikut ini adalah tahapannya: a) Tiap bobot simpul diinisialisasi b) Sebuah vektor diambil secara acak dari rangkaian data pelatihan dan dihadirkan pada kisi-kisi.
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
c) Tiap simpul diperiksa dan dihitng bobot mana yang lebih seperti vektor input. Simpul yang menang disebut juga sebagai best matching unit (BMU). d) Jarak ketetanggaan BMU kemudian dikalkuasikan. Awalnya ukurannya besar, kemudian semakin lama semakin mengecil seiring dengan banyak iterasi. Tiap simpul yang ditemukan berada pada radius ini dianggap sebagai tetangga dari BMU. e) Tiap bobot simpul ketetanggaan kemudian diubah untuk membuatnya menjadi semakin seperti vektor input. Semakin dekat jarak sebuah simpul dengan BMU, bobot yang diubah menjadi semakin besar. f) Mengulagi langkah (b) untuk iterasi sebanyak N.
2.7. VIDEO Menurut definisi dari Computer Desktop Encyclopedia, video adalah sebutan umum untuk klip film panjang maupun pendek. Dapat juga berarti videotape VHS analog, sampai ke format dijital seperti kaset DVD atau file komputer (MWV, AVI, MPEG, DivX, MP4, dan lain-lain). Dicetuskan pada tahun 1990an, kata video diimplikasikan pada TV analog atau monitor yang digunakan untuk melihat. Sejak itu, film dapat dibuat dengan kamera perekam dijital dan dimainkan di komputer tanpa harus diubah menjadi format TV NTSC/video. Video juga berarti teknologi penangkapan dan pengiriman citra yang dikembangkan oleh industri televisi. Di Amerika utara, stadar TV analognya adalah NTSC, sementara Eropa menggunakan PAL san SECAM untuk TV analog dan DVB dan ISDB untuk TV dijital [13]. Komputer dan TV menggunakan model warna yang berbeda. Encoding signal video TV menggunakan ruang warna YUV, sementara komputer menggunakan ruang warna RGB. Uniknya, baik TV maupun komputer hanya memberikan RGB, oleh karenanya, video dalam ruang warna YUV dikonversi ke dalam RGB untuk ditampilkan.
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
BAB 3 METODOLOGI PELACAKAN WAYANG DENGAN MENGGUNAKAN MSER DAN MSER EFISIEN 3.1. RANCANGAN KERJA PROGRAM 3.1.1. DESKRIPSI Pelacakan wayang dengan menggunakan MSER dan MSER efisien menggunakan perangkat keras dan perangkat lunak yang terintegrasi dalam sebuah PC (personal computer). Dengan sistem ini, pelacakan wayang dapat langsung dipantau dan diamati langsung oleh penulis. Sistem ini akan melakukan pelacakan wayang dengan beberapa algoritma yang terintegrasi menjadi suatu kesatuan program yang menjadi computer vision. Perangkat keras yang dibutuhkan adalah sebuah PC dengan input video yang diakukan secara offline. Resolusi video yang akan digunakan untuk program ini adalah 786 x 576 pixel dengan pewarnaan ruang warna RGB. Penulis menggunakan resolusi demikian untuk mengefisienkan waktu pemrosesan tetapi tetap memperhatikan kualitas gambar yang masih nyaman dipandang mata. Sementara untuk perangkat lunaknya, penulis menggunakan MATLAB® versi 7.14 (R2012a) di Windows 7 32bit yang diinstal ke dalam PC dengan 8 buah core processor. Program tersebut menggunakan format .m file untuk mengeksekusi program. Aplikasi yang dibuat akan melakukan operasi terhadap video stream yang diambil terhadap objek (dalam hal ini adalah wayang) yang ditunjukkan oleh pengguna. Direncanakan, operasi yang dapat dilakukan dengan perangkat lunak ini antara lain adalah sebagai berikut: a) Menjalankan algoritma object tracking dengan MSER atau MSER efisien untuk mengekstrak fitur informasi yang ada pada video. b) Memberikan informasi keakuratan banyak frame yang dapat diekstrak fiturnya dengan algoritma MSER dan persentase tingkat pendeteksian berdasarkan pada hasil ekstraksi fitur dari MSER yang kemudian diolah algoritma PCA-SIFT dan SOM.
Secara umum, sistem ini dapat digambarkan seperti gambar 3.1: 20 Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Pembacaan video, handle frame by frame
Input video dari user (format: .avi)
MSER/MSER efisien + PCA SIFT + SOM
Output + label wayang
Gambar 3.1Diagram umum cara kerja program
3.1.2. DIAGRAM ALIR CARA KERJA PROGRAM MULAI
Input video wayang secara offline
Nenangkap 3 frame yang berurutan
Frame ƒ(a-1)
Frame ƒ(a)
Frame ƒ(a+1)
Identifikasi + pelabelan obyek (wayang) dengan menggunakan MSER/MSER efisien
Fitur dari obyek (wayang)
Menghasilkan deskriptor dengan PCA-SIFT
Mengolah informasi deskripto dengan SOM
Output data+video
SELESAI
Gambar 3.2Diagram alir cara kerja program
Seperti yang ditunjukkan dalam gambar 3.2 di atas, input video yang diberikan adalah video yang sudah di-download sebelumnya dari sebuah situs video yang cukup terkenal, yaitu youtube.com. Format video dari YouTube biasanya
adalah
.flv
(dikembangkan
oleh
Adobe System)
Perbandingan pelacakan..., Aneta, FT UI, 2012
atau .mp4
Universitas Indonesia
(dikembangkan oleh ISO) ketika sudah di-download. Secara defult, situs YouTube tidak memberikan link download untuk penggunanya. Oleh karena itu, digunakanlah situs perntara untuk men-download video tersebut dari YouTube. Alamat dari situ tersebut adalah http://www.keepvid.com. Situs ini memberikan kemudahan untuk mengunduh video dari YouTube dengan hanya memberikan alamat video yang dimaksud. Setelah mendapatkan video wayang, hal yang dilakukan berikutnya adalah mengubah file format video tersebut dari .mp4/.flv ke .avi. Mengapa menjadi .avi? karena MATLAB yang digunakan adalah MATLAB yang berada dalam lingkungan sistem operasi Windows, sehingga akan lebih “aman” bila menggunakan format yang sudah merupakan default dari Windosnya sendiri daripada menggunakan tambahan encoder lagi. Oleh MATLAB®, input video tersebut akan dipilah-pilah berdasarkan waktu frame untuk diidentifikasi dengan menggunakan MSER/MSER efisien. Setelah menemukan obyek (wayang), pelabelan pun dilakukan untuk menentukan apakah itu adalah obyek penting atau tidak. Barulah kemudian fitur spasial dan warna diekstrak untuk diproses pada tahap selanjutnya. Tahap berikutnya adalah pengenalan obyek (wayang) dengan menggunakan PCA-SIFT. Penulis menggunakan algoritma ini karena cara kerjanya yang ringan tetapi tetap berkemampuan maksimal sehingga tidak terlalu membebani hardware. algoritma PCA-SIFT ini kemudian akan mendeskripsikan wayang yang dipegang oleh pengguna. Kegunaan PCA-SIFT di sini adalah sebagai descriptor.
3.2. ALGORITMA YANG DIGUNAKAN Dalam menyusun program ini, ada beberapa aldortma yang akan penuulis gunakan, namun secara umum algoritma tersebut dapat dibagi menjadi 2, yaitu algoritma untuk indentifikasi obyek, yaitu MSER dan MSER efisien, dan algoritma yang berfungsi sebagai descriptor obyek, yaitu PCA-SIFT.
3.2.1. MSER MSER adalah detector yang mencari wilayah yang lebih terang atau gelap daripada sekitarnya. Pertama-tama, semua pixel diurutkan secara deret naik atau
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
turun berdasarkan nilai intensitasnya, tergantung pada tipe daerah yang akan dideteksi. Barisan pixel kemudian secara sekuensial dimasukkan ke dalam algoritma penemuan-kesatuan dan kemudian diurus struktur data bercabang seperti pohon, dimana tiap node mengandung informasi tentang ketetanggan pixel, sebagaimana sama halnya dengan informasi mengani hubungan nillai intensitas. Kemudian, node yang memenuhi kriteria yang didefinisikan kemudian dicari oleh algoritma lintas-pohon, yang dalam kasus ini harus menjadi berulang-ulang karena struktur arsitektur hardware. Fitur menarik dari algoritma ini adalah tidak adanya aritmetika dengan angka pecahan. Keuntungan lain dari penggunaan algoritma MSER adalah dapat dikomputasi dengan efisien, paling tidak untuk desktop PC biasa, dan wilyah yang akan ditemukan tidak terkungkung wilayah dan bentuk. Terlebih lagi, sangat memungkinkan untuk mengidentifikasi wilayah dengan perubahan viewpoint yang luas karena sifat ekstermal dari wilayah tersebut tidak berubah. Berikut adalah algoritma sederhana untuk MSER: Input: citra I Output: daftar wilayah extermal yang terdeteksi 1. Untuk semua pixel, diurutkan berdasarkan intensitas. 2. Menempatkan pixel pada citra 3. Memperbarui struktur komponen yang berhubungan 4. Memperbarui area untuk komponen terkoneksi yang terjadi. 5. Untuk semua komponen yang terkoneksi: menghitung minima lokal dari tingkat perubahan dari threshold stabil area terdefinisi.
3.2.2. MSER EFISIEN Tidak jauh berbeda dengan MSER biasa, MSER efisien menawarkan komputasi yang lebih cepat. Idenya berasal dari satu-satunya bagian dari pohon komponen harus dibangun dalan urutan untuk mengidentifikasi region yang akan dilacak dengan benar. Nilai keabu-abuan, yang akan dideteksi oleh MSER pada citra, digunakan untuk memaksa cakupan nilai kebau-abuan yang harus dianalisa pada frame berikutnya. Oleh karena itu, wilayah yang berhubungan hanya
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
dihitung dalam nilai keabu-abuan yang didefinisikan. Pohon komponen yang berhubungan menjadi lebih kecil dan MSER dapat dikalkulasi lebih cepat.
3.2.3. PCA-SIFT PCA SIFT digunakan untuk menjadi descriptor dalam program yang dibuat oleh penulis. Adapun algoritmanya adalah sebagai berikut [10]: 1.
pre-komputasi dari sebuah ruang eigen untuk menghasilkan gradient citra dari potongan-potongan kecil lokal.
2.
Memberikan sebuah potongan kecil, mengkomputasi gradient citra lokal.
3.
Memproyeksikan vektor gradient citra menggunakan ruang eigen untuk mendapatkan vektor fitur yang padat.
Algoritma PCA itu sendiri digunakan untuk mereduksi matriks input menjadi komponen-komponen penting yang diperlukan untuk kemudian diidentifikasi oleh algoritma descriptor SIFT. Adapun detail untuk algoritma PCA adalah sebagai berkut: 1.
Normalisasi. ( 3.2)
Dimana Xk adalah vektor kolom ke-k dari matriks X. 2.
Bangun matriks kovarian. ( 3.3)
3.
Hitung nilai eigen (E) dan vektor eigen (Q) dari matriks kovarian W.
4.
Mengurutkan nilai eigen (E) dan vektor eigen(Q) dari besar ke kecil berdasarkan urutan nilai eigen.
5.
Hitung principal component. (3.4)
6.
Transformasikan gambar ke ruang matriks. (3.5)
Matriks yang direduksi oleh PCA adlah matriks fitur hasil dari ekstrak MSER terhadap tiap frame yang terdapat pada video.
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
3.3. SELF ORGANIZING MAP SOM memiliki algoritma sebagai berikut: a) Inisialisasi bobot pada tiap simpul. Bobot ini nilainya 0 < w < 1. b) Menghitung BMU dengan menghitung jarak euklidean terkecil. Berikut adalah rumus untuk mencari jarak euklidean: (3.6)
c) Menghitung ketetanggaan BMU dengan menggunakan persamaan berikut: (3.7)
dengan
0
adalah lebat pendekatan pada waktu t0, dan
adalah konstanta
waktu. t adalah iterasi. d) Tiap simpul dalam ketetanggaan BMU (termasuk BMU itu sendiri) mengubah bobot vektornya dengan menggunkan persamaan berikut ini: (3.8)
dimana t adalah tahapan waktu dan L adalah variabel laju pembelajaran yang berkurang dengan waktu, dan V adalah vektor input. Pengurangan laju pembelajaran itu sendiri berkurang berdasarkan persamaan berikut ini. (3.9)
3.4. SPESIFIKASI PERANGKAT KERAS DAN PERANGKAT LUNAK 3.4.1. PERANGKAT KERAS Perangkat keras yang aka digunakan untuk mendesain program ini adalah PC dengan spesifikasi sebagai beikut: a) Produsen Sistem
: Intel Corporation
b) Model Sistem
: S5500BC
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
c) BIOS
: Ver: 08.00.10
d) Prosesor
: Intel(R) Xeon(R) CPU E5520 @ 2.27GHz (8
CPUs), ~2.3GHz e) Memori
: 4033MB RAM
f) Versi DirectX
: DirectX 11
g) Sistem DPI
: 96 DPI
3.4.2. PERANGKAT LUNAK Perangkat lunak yang digunakan oleh penulis untuk menjalankan program adalah sebagai berikut: a) Operating System
: Windows 7 Ultimate 32-bit (6.1, Build 7600)
(7600.win7_rtm.090713-1255) b) program untuk eksekusi: MATLAB® versi 7.14 (R2012a) c) bahasa pemrograman : matlab (m file)
Gambar 3.3PC yang digunakan untuk membuat sistem
3.5. PROSEDUR PENGUJIAN Hal-hal yang digunakan untuk menguji kehandalan sistem ini adalah sebagai berikut:
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
a. Waktu yang digunakan untuk melakukan pre-processing, proses komputasinya sendiri hingga selesai. Dibandingkan untuk masingmasing algoritma. b. Tingkat
keakuratan
pendeteksian
wayang
pada
masing-masing
algoritma. c. Untuk algoritma MSER efisien, digunakan batas tingkat keabu-abuan dalam skala 1 hingga 255 sebagai berikut: 1) 0 hingga 60 2) 61 hingga 120 3) 121 hingga 180 4) 181 hingga 240 Dengan tiap tingkatan keabu-abuan juga diukur poin a dan b. d. Detail video yang digunakan untuk pengujian a dan b berbeda. Untuk pengujian pada poin a digunakan video pada lampiran 1 dan untuk pengujian b dibunakan video pada lampiran 2. Video untuk pengujian a adalah video dengan durasi panjang dengan tujuan untuk menguji kehandalan sistem. Sedangkan untuk video b digunakan cuplikan dengan durasi video 3 menit untuk melakukan pendeteksian wayang dengan videonya terdiri dari 3 buah wayang dengan masing-masing wayang berdurasi 1 menit.
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
BAB 4 HASIL PENGUJIAN DAN ANALISA 4.1. HASIL PENGUJIAN Seluruh algoritma yang saya jelaskan pada Bab 3 di atas kemudian saya implementasikan pada PC. Hal pertama yang harus dikukan adalah mendapatkan video tentang wayang di http://www.youtube.com. Dari website tersebut saya mendapatkan 5 buah video yang menampilkan pertunjukan wayang dengan durasi yang bervariasi untuk tiap videonya. Untuk infrmasi lebih lengkap mengenai detail video yang digunakan, dapat dilihat di bagian lampiran. Keseluruhan video tersebut kemudian di-download melalui situ perantara pengambil video yang beralamat di http://www.keepvid.com, dengan cara mengetikkan link alamat video dari youtube ke keepvid. Hasil download dari keepvid berupa video dengan format kompresi .mp4. Hal yang saya lakukan berikutnya adalah mengubah format .mp4 menjadi .avi. Untuk mengubah format tersebut, digunakan sebuah freeware yang bernama FreeMake. Hal ini dilakukan untuk mempercepat komputasi dibandingkan dengan konversi dari MATLAB. Ada beberapa perubahan dalam pengujian sistem ini, yang pertama adalah ditambahkannya RAM sebesar 2GB pada PC yang digunakan. Pada awalnya, RAM yang terpasang di dalam PC tersebut hanyalah 2GB. Tujuan ditambahannya RAM adalah untuk memperlancar kinerja dari algoritma tersebut sehingga tidak terjadi bottleneck. Berikut ini adalah hasil pengujian yang dilakukan untuk mengetes algoritma seperti yang sudah dijelaskan pada Bab 3. Bagian ini terdiri dari tabel dan grafik disertai dengan penjelasan.
4.1.1. WAKTU KOMPUTASI UNTUK TIAP ALGORITMA Bagian ini khusus menampilkan data yang ada untuk pengujian waktu komputasi dari tiap algoritma. Berikut adalah tabel yang merepresentasikan hasil pengujian disertai dengan grafiknya.
28 Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Tabel 4.1waktu penjalanan program untuk tiap algoritma dalam menit
MSER efisien Nama video
MSER
1.avi 2.avi 3.avi 4.avi 5.avi Rata-rata waktu
93 125 173 167 190 149.6
G=060 99 132 160 183 256 166
G=61-120 63 88 95 105 153 100.8
G=121180 61 90 135 154 144 116.8
G=181-240 87 164 91 60 109 102.2
Gambar 4.1waktu penjalanan program untuk tiap algoritma dalam menit
Rata-rata waktu paling rendah untuk tiap algoritma didapatkan oleh MSER efisien dengan tingkat keabu-abuan 61-120, yaitu 100,8 menit. Adapun yang paling rendah adalah MSER efisien dengan tingkat keabu-abuan 0-60, yaitu 166 menit. Terjadinya perbedaan dalam waktu perhitungan ini dipengaruhi oleh komposisi histogram antar frame dalam video. Semakin rendah tingkat keabuabuan akan semakin gelap.
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
4.1.2. TINGKAT KEAKURATAN PENDETEKSIAN WAYANG PADA TIAP ALGORITMA Tingkat keakuratan pendeteksian di sini dibagi menjadi 2 bagian, yaitu banyak frame yang terdeteksi fiturnya oleh algoritma MSER dan tingkat pendeteksian berdasarkan pada hasil ekstraksi fitur dari MSER yang kemudian diolah algoritma PCA-SIFT. Tabel 4.2 berikutadalah tingkat pendeteksian berdasarkan frame pada tiap algoritma yang digunakan pada video 1.avi.
Tabel 4.2tingkat keberhasilan ekstraksi fitur MSER pada video 1.avi
Algoritma MSER
MSER efisien
G=0-60 G=61-120 G=121180 G=181240
Banyak frame yang dapat diekstrak 32630 32817 33036
Banyak frame yang tidak dapat diekstrak 406 219 422
33036 32551
Jumlah seluruh frame
Persentase keberhasilan ekstraksi
33036 33036 33036
98.77103766 99.33708681 100
0
33036
100
485
33036
98.53190459
Tabel 4.3 berikut adalah tingkat pendeteksian berdasarkan frame pada tiap algoritma yang digunakan pada video 2.avi.
Tabel 4.3tingkat keberhasilan ekstraksi fitur MSER pada video 2.avi
Algoritma MSER
MSER efisien
G=0-60 G=61-120 G=121180 G=181240
Banyak frame yang dapat diekstrak 49243 49221 49243
Banyak frame yang tidak dapat diekstrak 0 22 0
49243 49228
Jumlah seluruh frame
Persentase keberhasilan ekstraksi
49243 49243 49243
100 99.9553236 100
0
49243
100
15
49243
99.96953882
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Tabel 4.4 berikutadalah tingkat pendeteksian berdasarkan frame pada tiap algoritma yang digunakan pada video 3.avi.
Tabel 4.4tingkat keberhasilan ekstraksi fitur MSER pada video 3.avi
Algoritma MSER
MSER efisien
G=0-60 G=61-120 G=121180 G=181240
Banyak frame yang dapat diekstrak 50656 50656 50656
Banyak frame yang tidak dapat diekstrak 0 0 0
50656 50656
Jumlah seluruh frame
Persentase keberhasilan ekstraksi
50656 50656 50656
100 100 100
0
50656
100
0
50656
100
Tabel 4.5 berikutadalah tingkat pendeteksian berdasarkan frame pada tiap algoritma yang digunakan pada video 4.avi.
Tabel 4.5tingkat keberhasilan ekstraksi fitur MSER pada video 4.avi
Algoritma MSER
MSER efisien
G=0-60 G=61-120 G=121180 G=181240
Banyak frame yang dapat diekstrak 49495 49521 49563
Banyak frame yang tidak dapat diekstrak 68 42 0
49550 49523
Jumlah seluruh frame
Persentase keberhasilan ekstraksi
49563 49563 49563
99.86280088 99.91525937 100
13
49563
99.97377076
40
49563
99.91929464
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Tabel 4.6 berikut ini adalah tingkat pendeteksian berdasarkan frame pada tiap algoritma yang digunakan pada video 5.avi. Tabel 4.6tingkat keberhasilan ekstraksi fitur MSER pada video 5.avi
Algoritma MSER
MSER efisien
Banyak frame yang dapat diekstrak
81613 G=0-60 81611 G=6181613 120 G=12181613 180 G=18181608 240
Banyak frame yang tidak dapat diekstrak 0 2
Jumlah seluruh frame
Persentase keberhasilan ekstraksi
81613 81613
100 99.99754941
0
81613
100
0
81613
100
5
81613
99.99387353
Secara keseluruhan, tingkat keberhasilan ekstraksi fitur dari seluruh algoritma untuk seluruh video dapat dilihat pada grafik 4.2 di bawah ini:
Gambar 4.2Grafik persentase perbandingan tingkat keberhasilan ekstraksi fitur MSER pada tiap frame di tiap video
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Berikutnya adalah tingkat pelacakan dari algoritma PCA-SIFT berdasarkan pada hasil ekstraksi fitur dari MSER dan MSER efisien pada video. Hasil pelacakan ini berdasarkan pada fitur yang telah di ekstrak dari frame pada waktu t yang dicocokkan dengan frame pada waktu t-1. Semakin banyak tingkat kecocokan, maka semakin tinggi tingkat pelacakannya. Cara untuk mencapatkan kecocokan adalah dengan menggunakan descriptor SIFT (dengan imput matriks posisi keypoint, jarak, dan orientasi yang sudah direduksi oleh PCA), yaitu dengan menghitung matriks normalnya. Hasil dari perhitungan matriks normal dari frame awal kemudian diabndingkan dengan matriks normal pada frame berikutnya, sehingga menghasilkan kesamaan. 2 buah keypoint dinyatakan sepadan apabila ia memiliki “jarak” euklidean yang lebih kecil dari jarak batasan.
Tabel 4.7tingkat pendeteksian dari algoritma PCA-SIFT berdasarkan pada hasil ekstraksi fitur dari MSER dan MSER efisien pada video, dalam %.
96.80742 99.32091 99.28658 98.67023 98.83182
MSER efisien g=0-60 95.55377 95.55377 98.24758 97.58132 97.12584
g=61-120 96.14338 95.14086 96.11905 99.95395 97.93631
g=121-180 94.11035 99.07617 97.31588 96.26669 96.46264
g=181-240 96.18499 96.00286 94.47534 95.20856 97.7384
98.58339
96.81246
97.05871
96.64634
95.92203
video
MSER
1.avi 2.avi 3.avi 4.avi 5.avi ratarata
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Gambar 4.3grafik perbandingan tingkat pendeteksian dari algoritma PCA-SIFT berdasarkan pada hasil ekstraksi fitur dari MSER dan MSER efisien pada video, dalam %.
4.1.3. TINGKAT KEAKURATAN PENGENALAN WAYANG Setelah dilakukan pengujian mengenai kehandalan MSER dan MSER efisien, hal yang dilakukan berikutnya adalah melakukan pengenalan wayang. Pengenalan ini dilakukan dengan menggunakan metode SOM (Self Organizing Map) yang merupakan algoritma AI dengan kemampuan pembelajaran tanpa pengarahan. Data input berupa fitur hasil ekstraksi MSER yang telah direduksi informasinya dengan MSER dan didefinisikan dengan deskriptor SIFT. Sampel video yang dignakan kali ini tidak sebesar yang sebelumnya. Dalam pengenalan ini digunakan 3 buah video dengan durasi masing-masing sebesar 3 menit dengan ukuran video yang sama seperti percobaan sebelumnya. Frame rate yang digunakan adalah 25 fps. Tabel 4.8recognition rate dari tiap algoritma dengan ANN yang sama
Video
MSER
sampel 1 sampel 2 sampel 3 rata-rata
95.40851 95.61144 94.13924 95.05306
MSER efisien g=0-60 g=61-120 72.12327 89.48282 93.62278 80.91043 81.22701 71.74547 82.32435 80.71291
g=121-180 82.19734 84.79327 82.87013 83.28691
Perbandingan pelacakan..., Aneta, FT UI, 2012
g=181-240 85.36126 85.78264 82.36802 84.50397
Universitas Indonesia
Gambar 4.4Grafik banyak keypoint terdeteksi pada MSER
Gambar 4.5Grafik banyak keypoint pada MSER efisien (0-60)
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Gambar 4.6Grafik banyak keypoint terdeteksi pada MSER efisien (61-120)
Gambar 4.7Banyak keypoint terdeteksi pada MSER efisien (121-180)
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Gambar 4.8Grafik keypoint terdeteksi pada MSER efisien (181-240)
Pada gambar 4.4 hingga 4.8, banyak keypoint yang terdeteksi pada tiap algoritma MSER berbeda-beda. Adanya penurunan yang tajam pada tiap grafik sebagian besar disebabkan oleh pergantian scene pada video yang digunakan.
Gambar 4.9 bentuk topologi SOM berukuran 20x20
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
(a)
(b)
(c)
(d)
(e)
Gambar 4.10 Perbandingan peta bobot SOM hasil pembelajaran dari tiap algoritma MSER biasa (a), MSER efisien dengan level abu-abu 0-60 (b), 61-120 (c), 121-180 (d), dan 181-240 (e)
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Gambar 4.10 menunjukkan perbandingan peta bobot SOM untuk tiap algoritma. Tiap kelompok titik berwarna biru menunjukkan kelompok wayang yang serupa. Dapat dilihat bahwa 3 kelompok wayang tersebut paling jelas terpampang pada MSER biasa, disusul dengan MSER efisien dengan tingkat keabu-abuan 61-120 dan 180-240, kemudian MSER efisien dengan tingkat keabuabuan 121-180, dan yang terakhir (yang paling tidak mengelompok) adalah MSER efisien dengan tingkat keabu-abuan 0-60.
4.2. ANALISA 4.2.1. ANALISA WAKTU Untuk waktu komputasi dari pre-processing hingga menghasilkan output, MSER biasa memakan waktu yang cukup lama bila dibandingkan dengan MSER efisien dengan tingkat keabu-abuan tertentu karena MSER biasa menghitung seluruh tingkat keabu-abuan sementara MSER efisien tidak. Namun, MSER dengan tingkat keabu-abuan 0-60 memakan komputasi yang lebih lama. Hal ini bisa dikarenakan area tingkat abu-abu tersebut memang lebih banyak sehingga membutuhkan komputasi yang lebih untuk mendapatkan lokal minima yang tepat. Sebaliknya, MSER efisien dengan tingkat keabu-abuan tertinggi (181-240) menempati posisi tercepat dalam hal komputasi. Hal ini dapat terjadi karena dareah dengan tingkat keabu-abuan tersebut lebih sedikit dibandingkan dengan tingkat keabu-abuan yang lebih rendah.
4.2.2. ANALISA TINGKAT KEAKURATAN PENDETEKSIAN WAYANG Dari segi kemampuan dalam mengekstrak fitur diukur dari banyaknya frame yang berhasil diekstrak, MSER efisien dengan tingkat keabu-abuan 61-120 menempati kemampuan yang paling stabil dengan keberhasilannya mengekstrak seluruh frame yang ada pada video. Frame yang tidak dapat diekstrak biasanya adalah frame dengan pixel yang tingkat keabu-abuannya merata, maksudnya adalah didominasi dengan level abu-abu yang sama, sehingga sukar dicari lokal minimanya. Frame seperti ini memiliki tingkat keabu-abuan 61-180 sehingga hal ini sedikit menyulitkan algoritma MSER yang lain dalam mengekstrak fiturnya. Fenomena ini dapat dilihat pada gambar 4.2.
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Pada gambar 4.2 dan 4.3, dapat dilihat bahwa video 1 adalah video yang paling tidak stabil baik pada tingkat ekstraksi fitur maupun pendeteksiannya. Hal ini disebabkan karena pada video tersebut, pencahayaan yang digunakan sangat bervariasi, terutama pada bagian pergentian babak. Pencahayaan yang digunakan adalah pencahayaan yang menggunakan berbagai warna sekaligus memainkan komposisi terang-redup sehingga mempengaruhi hasil ekstrasi tiap algoritma karena tiap algoritma memeanfaatkan level keabu-abuan. Level keabu-abuan pada video 1 sangat bervariasi disebabkan oleh variasi pencahayaan yang sangat banyak sehingga mempengaruhi konversi citra ke level abu-abu. Citra dengan level abu-abu hasil konversi tersebut memiliki histogram yang variasinya banyak sehingga mempengaruhi perhitungan tiap algoritma.
4.2.3. TINGKAT KEAKURATAN PENGENALAN WAYANG Sementara dalam hal pelacakan, aljoritma MSER biasalah yang justru memiliki rata-rata keberhasilan paling tinggi di antara algoritma lainnya. Algoritma MSER biasa memproses seluruh level keabu-abuan yang terdapat pada frame video, sementara MSER efisien hanya memproses sebagian level keabuabuan. Dengan begitu, kemungkinan algoritma MSER untuk mendapatkan kepadanan antar keypoint pada frame yang berurutan jelas lebih tinggi daripada algoritma MSER efisien. Dengan begitu, terbukti dalam hal pelacakan wayang, algoritma MSER lebih efektif dibandingkan dengan MSER efisien, dengan kelemahan berupa waktu komputasi yang lebih lama dibandingkan dengan MSER efisien dengan tingkat keabu-abuan tertentu.Uniknya, ketika gambar menjadi buram, baik MSER maupun MSER efisien mengalami penurunan banyak keypoint yang dapat dilacak karena gradasi kemiringan level keabu-abuan menjadi menurun, sehingga tidak dianggap sebagai obyek penting dalam citra. Ketika sudah memasuki artificial neural network (ANN) dengan algoritma SOM yang dapat mempelajari model sendiri, ternyata hasil ekstraksi dari MSER memiliki tingkat pengenalan wayang yang lebih tingi dan lebih stabil daripada yang MSER efisien. Hal ini dikarenakan MSER biasa memberikan deteksi lokal minima yang lebih banyak daripada MSER efisien. Selain itu, terjadinya pergantian pencahayaan panggung tidak berpengaruh secara signifikan terhadap
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
pendeteksian MSER biasa, sementara hal tersebut sangat berpengaruh pada MSER efisien karena MSER efisien mendeteksi lokal minima dengan level keabu-abuan yang terbatas. Pada penelitian ini, hasil akhir yang didapatkan adalah kelompok wayang yang sudah dipelajari sebelumnya. Untuk memberikan label pada wayang berikut dengan nama wayangnya, dibutuhkan algoritma ANN tambahan seperti feedforward dan learning vector quantization (LVQ) karena SOM sendiri hanya dapat mengelompokkan wayang yang serupa, tetapi tidak untuk memberikan label pada wayang tersebut. Untuk memberikan label yang benar, diperlukan algoritma ANN yang mendapatkan supervisi, seperti feedforward dan LVQ untuk mendapatkan pelabelan yang akurat. Penelitian ini tidak sampai kepada pelabelan wayayang karena lebih dititikberatkan pada pendeteksian dari algoritma MSER dan MSER efisien dengan deskriptor dan ANN yang sama.
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
BAB 5 PENUTUP 5.1. KESIMPULAN Berikut adalah kesimpulan dari penulisanskripsi ini: 1. Penggunaan MSER memberikan tingkat pendeteksian wayang lebih tinggi dan lebih stabil bila dibandingkan dengan MSER efisien dengan tingkat keabu-abuan tertentu. 2. Menggunakan MSER efisen dapat mereduksi kecepatan komputasi hingga selisih 10 sampai 100 menit, tergantung pada jenis tingkat keabu-abuan yang diganakan pada MSER efisien. 3. Tingkat keberhasilan ekstraksi fitur dari MSER dan MSER efisien tidak jauh berbeda, yaitu sekitar 98%-100%. 4. Pada video wayang yang memiliki pencahayaan yang sangat bervariasi dapat menyebabkan sedikit penurunan pada ekstraksi fitu dan pendeteksian karena baik MSER maupun MSER efisien menggunakan hasil konversi video tersebut ke dalam citra abu-abu. 5. Ketika sudah memaski ANN, fitur yang diekstrak dari MSER biasa memmiliki tingkat pengenalan wayag yang lebih tinggi dibandingkan dengan algoritma yang lain.
5.2. SARAN
Setelah menjalani percobaan ini, disarankan untuk penelitian lebih lanjut tidak hanya menggunakan MSER dalam ruang warna gray-scale, tapi juga RGB. Hal ini dimaksudkan untuk memberikan keakuratan yang lebih tinggi dalam pendeteksian wayang. Unduk aplikasi di masa mendatang, pendeteksian wayang ini dapat ditanamkan pada divais dengan kamera seperti Google Glass, salah satu proyek kacamata augmented reality keluaran Google. Saat ini Google Glass baru dapat digunakan untuk merekam video dan mengenali wajah manusia. Diharapkan dengan adanya penelitian ini, Google Glass dapat digunakan untuk mendeteksi
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
dan memberi label pada wayang secara real time ketika penggunanya sedang menonton pertunjukan wayang.
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
REFERENSI
[1]
Bischof, M. D. (2006). Efficient Maximally Stable Extremal Region (MSER) Tracking. Institute for Computer Graphics and Vision Graz University of Technology.
[2]
Brucker, J. (2005). a Brief History of Matlab.
[3]
Butner, M. K. (2009). Hardware Considerations for Embedded Visio Systems. In S. S. Branislav Kisacanin, Embedded Computer Vision (p. 7). London: Springer.
[4]
Butner, M. K. (2009). Hardware Considerations for Embedded Vision Systems. In S. S. Branislav Kisacanin, Embedded Computer Vision (p. 23). London: Springer.
[5]
Gonzales, R. C. (2000). Image Processing Using MATLAB. Gatesmark Publishing.
[6]
Gwun, L. J. (2009). A Comparison of SIFT, PCA-SIFT and SURF. International Journal of Image Processing (IJIP) Volume(3), Issue(4).
[7]
J. Matas, O. C. (2002). Robust wide baseline stereo from maximally stable extremal regions. Proc. of British Machine Vision Conference , 384–396.
[8]
Lowe., D. (2004). Distinctive Image Features from Scale-Invariant Keypoints. IJCV, 60(2):91–110.
[9]
W. H. Press, S. A.-n. (1992). Numerical Recipes in C: The Art of Scientific Computing. Cambridge: Cambridge University Press.
[10]
Yan Ke, R. S. (2004). PCA-SIFT: A More Distinctive Representation for Local Image Descriptors, . School of Computer Science, Carnegie Mellon University; Intel Research Pittsburgh.
Website [11]
http://www.jakarta.go.id/web/uploads/files/wayang-kulit24.jpg, diambil pada 23 Oktober 2011
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
[12]
A.Firmansyah. Dasar-Dasar Pemrograman Matlab. Indonesia: IlmuKomputer.com.
[13]
answers.com. Diakses pada 4 April 2012, dari http://www.answers.com/topic/video#ixzz1qz2dMNEx
[14]
Bellis, M. (2012). Diakses pada January 4, 2012, dari About.com: http://inventors.about.com/library/inventors/bldigitalcamera.htm
[15]
Rini. (2009, august 12). Diakses pada october 23, 2011, dari Ada Apa dengan Sekolah…: http://rinilestari.multiply.com/journal/item/4?&show_interstitial=1&u=%2 Fjournal%2Fitem
[16]
Taormina. (2003, September 10). Diakses pada January 11, 2012, dari http://cmp.felk.cvut.cz/~matas/papers/presentations/mser_taormina_Sep03 .pdf
[17]
TechEncyclopedia. (2012). Technology Desktop Encyclopedia. Diakses pada January 4, 2012, dari Answers.com: http://www.answers.com/topic/sensor#ixzz1iSgTZjrd
[18]
tirtayatatamagazine. (n.d.). Retrieved october 23, 2011, dari http://tirtayatatamagazine.wordpress.com/2011/09/09/wayang/
[19]
Tjakrakembang. (2010, March 6). Wayang Indonesia. Diakses pada 30 November 2011, dari Wayang Indonesia, Masterpiece of Oral and Intangible Heritage of Humanity: http://wayang.wordpress.com/2010/03/06/sejarah-seni-pewayangan/
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
LAMPIRAN 1 DOKUMENTASI Sampel salah satu frame yang terdeteksi area MSERnya. Area berwarna hijau menunjukkan daerah MSER. Sampel 1 MSER
MSER efisien (0-60)
MSER efisien (61-120)
MSER efisien (121-180)
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
MSER efisien (181-240)
Sampel 2 MSER
MSER efisien (0-60)
MSER efisien (61-120)
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
MSER efisien (121-180)
MSER efisien (181-240)
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
LAMPIRAN 2 DETAIL INFORMASI Detail informasi video yang digunakan dalam pengujian propertes Format
1.avi AVI
2.avi AVI
Format/Info
Audio Video Interleave
Audio Video Interleave
159 MiB 22mn 1s 1 009 Kbps
File size Duration Overall bit rate Writing application Video ID Format Format/Info Format profile Format settings, ReFrames Codec ID Duration Bit rate Nominal bit rate Width Height Display aspect ratio Frame rate mode Frame rate Color space Chroma subsampling Bit depth Scan type Bits/(Pixel*Fra me) Stream size
361 MiB 32mn 49s 1 536 Kbps
3.avi AVI Audio Video Interleave 365 MiB 33mn 46s 1 513 Kbps
4.avi AVI Audio Video Interleave 358 MiB 33mn 2s 1 513 Kbps
5.avi AVI Audio Video Interleave 589 MiB 54mn 24s 1 513 Kbps
Lavf52.94.0
Lavf52.94.0
Lavf52.94.0
Lavf52.94.0
Lavf52.94.0
0 AVC
0 AVC
Advanced Video Codec
Advanced Video Codec
[email protected]
[email protected]
0 AVC Advanced Video Codec
[email protected]
0 AVC Advanced Video Codec
[email protected]
0 AVC Advanced Video Codec
[email protected]
2 frames
2 frames
2 frames
2 frames
2 frames
H264 22mn 1s 1 006 Kbps
H264 32mn 49s 1 006 Kbps
H264 33mn 46s 1 006 Kbps
H264 33mn 2s 1 006 Kbps
H264 54mn 24s 1 006 Kbps
1 517 Kbps
1 517 Kbps
1 517 Kbps
1 517 Kbps
1 517 Kbps
768 pixels 576 pixels
768 pixels 576 pixels
768 pixels 576 pixels
768 pixels 576 pixels
768 pixels 576 pixels
4:3
4:3
4:3
4:3
4:3
Variable
Variable
Variable
Variable
Variable
15.000 fps YUV
15.000 fps YUV
15.000 fps YUV
15.000 fps YUV
15.000 fps YUV
4:2:0
4:2:0
4:2:0
4:2:0
4:2:0
8 bits Progressive
8 bits Progressive
8 bits Progressive
8 bits Progressive
8 bits Progressive
0.152
0.229
0.229
0.229
0.229
158 MiB (100%)
360 MiB (100%)
360 MiB (100%)
357 MiB (100%)
588 MiB (100%)
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia
Video yang digunakan untuk testing propertes Format
test1.avi AVI
test2.avi AVI
test3.avi AVI
Format/Info
Audio Video Interleave
Audio Video Interleave
Audio Video Interleave
34.2 MiB 3mn 11s 1 497 Kbps Lavf52.94.0
30.5 MiB 3mn 11s 1 497 Kbps Lavf52.94.0
31.5 MiB 3mn 11s 1 382 Kbps Lavf52.94.0
0 AVC
0 AVC
0 AVC
Advanced Video Codec
Advanced Video Codec
Advanced Video Codec
[email protected] 2 frames H264 3mn 11s
[email protected] 2 frames H264 3mn 11s
[email protected] 2 frames H264 3mn 11s
1 340 Kbps 360 pixels 480 pixels 4:3 Variable 15.000 fps YUV 4:2:0 8 bits Progressive
1 340 Kbps 360 pixels 480 pixels 4:3 Variable 15.000 fps YUV 4:2:0 8 bits Progressive
1 340 Kbps 360 pixels 480 pixels 4:3 Variable 15.000 fps YUV 4:2:0 8 bits Progressive
0.259 30.9 MiB (91%)
0.259 30.3 MiB (100%)
0.259 31.4 MiB (100%)
File size Duration Overall bit rate Writing application Video ID Format Format/Info Format profile Format settings, ReFrames Codec ID Duration Bit rate Width Height Display aspect ratio Frame rate mode Frame rate Color space Chroma subsampling Bit depth Scan type Bits/(Pixel*Frame) Stream size
Perbandingan pelacakan..., Aneta, FT UI, 2012
Universitas Indonesia