Jurnal . ………….. Vol. XX …, No. X, Bulan 2016, XX-XX
1
Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id
Rancang Bangun Website Sebagai Media Survei Untuk Mendeteksi Salient Area Pada Video Menggunakan K-Harmonic Means Muhammad Yusuf 1), Mardhiah Fadhli, S.T., M.T. 2), YoandaAlimSyahbana, S.T., M.Sc.
3)
1 Politeknik
Caltex Riau, Pekanbaru , email:
[email protected] Caltex Riau, Pekanbaru email:
[email protected] 3 Politeknik Caltex Riau, Pekanbaru email:
[email protected]
2 Politeknik
Abstrak Layanan multimedia berupa video adalah layanan yang bergantung kepada kepuasan penonton. Seiring dengan tidak stabilnya akses internet dan mengoptimalisasikan network yang ada, layanan multimedia itu dituntut untuk menjaga kualitas video. Pada sebuah video, terdapat area yang menjadi fokus utama penonton yang disebut salient area. Jika salient area ini memiliki kualitas baik, maka penonton merasa puas dengan kualitas video dan begitu sebaliknya. Untuk mengatasi permasalahan tersebut, maka pada proyek akhir ini akan dirancang dan dibangun sebuah website sebagai media survei yang lebih fleksibel yang artinya website dapat diakses dimana saja dan tidak perlu mempertimbangkan spesifikasi dari operating system yang digunakan. Proyek akhir ini dibangun untuk memudahkan mengumpulkan data titik koordinat pada video berdasarkan sudut pandang subjektif penonton. Hasil survei dari 20 responden akan dilakukan proses clustering menggunakan algoritma K-Harmonic Means untuk mendapatkan area yang paling menarik. Ada beberapa parameter-parameter untuk menentukan salient area yaitu pada bagian wajah, teks dan objek bergerak. Hasil penelitian ini dapat digunakan untuk membantu mengumpulkan informasi salient area berdasarkan sudut pandang subjektif. Kata kunci : video, salient area, website, clustering, k-harmonic means Abstract Multimedia service such as video is a service that dependent on the audience’s satisfaction. Along with unstable internet access and optimizing the existing network, multimedia service needs to be able to maintain the quality of the video. In a video, there are many area which is a major focus for audience called Salient areas. If this areas have a good quality, the audience would be satisfied with the quality of video and vice versa. To handle the issue, this research designs and develops website as flexible survey tool which is can be accessed anywhere and does not need to consider specification of the operating system. The research is developed to simplify collecting process of video pixel coordinate based on subjective perspective of the viewer. Result from 20 respondents is clustered using K-Harmonic Means algorithm to determine salient area. Based on the result, some parameters that determine the salient are face, text, and moving object. The developed website can be used to assist collecting process of salient area from subjective perspective. Keywords : video, salient area, website, clustering, k-harmonic means
Dokumen diterima pada Hari Bulan, Tahun Dipublikasikan pada Hari Bulan, Tahun
2
M. Yusuf
1. Pendahuluan Video merupakan salah satu jenis media visual yang dapat menggambarkan suatu objek yang bergerak bersama-sama dengan suara alamiah. Pada video terdapat area yang disebut sebagai salient area. Salient area merupakan bagian pada sebuah video yang menarik perhatian dari setiap penonton atau bagian gambar-gambar yang menjadi fokus utama pada sebuah video[1]. Salah satu contohnya, dapat kita lihat pada video pidato presiden. Dimana bagian wajah presiden tersebut adalah fokus utama atau salient area pada video tersebut. Sebaliknya, jika area ini berkualitas buruk, maka video pun akan dianggap berkualitas buruk. Jadi dapat dikatakan bahwa salient area akan menentukan baik atau buruknya kualitas video tersebut. Dalam menentukan salient area sudah terdapat beberapa parameter umum seperti warna, tekstur dan pergerakan objek pada video[2]. Untuk mengatasi permasalahan tersebut, maka pada proyek akhir ini akan dirancang dan dibangun sebuah website sebagai media survei yang lebih fleksibel yang artinya website dapat diakses dimana saja dan tidak perlu mempertimbangkan spesifikasi dari operating system yang digunakan. Website dibangun untuk mendeteksi salient area pada video berdasarkan sudut pandang subjektif penonton. Website menampilkan beberapa video dan penonton diminta menggerakkan kursor ke arah area yang mereka anggap sebagai salient area. Pergerakan kursor tersebut akan direkam dan disimpan datanya sebagai informasi koordinat salient area. Hasil percobaan dari beberapa penonton akan dilakukan proses clustering menggunakan algoritma KHarmonic Means. Dari proses clustering diperoleh data dengan anggota koordinat yang paling banyak dan kemudian disimpulkan sebagai informasi salient area, karena area tersebut yang paling sering ditunjuk penonton sebagai area yang paling menarik. Dengan adanya proyek akhir ini, diharapkan dapat membantu mengumpulkan informasi salient area melalui media website berdasarkan sudut pandang subjektif. Berdasarkan latar belakang permasalahan diatas, terdapat dua tujuan pada proyek akhir ini. Pertama dapat membantu mengumpulkan informasi salient area berdasarkan sudut pandang subjektif. Kedua menganalisa informasi salient area dari setiap video menggunakan K-Harmonic Means. Informasi yang diperoleh dapat bermanfaat bagi pengembangan video codec yang akan mempertimbangkan adanya salient area. 2. Tinjauan Pustaka 2.1
Review PenelitianTerdahulu Tabel 1 Perbandingan Penelitian Terdahulu dengan Penelitian Sekarang
Perbandingan Zhu dkk (2011) Lee, Choi, & Suk (2013) Ni dkk (2014) Luo dkk (2011) Yusuf (2015) 2.2
Jenis Citra Video Image Image Video Video
Platform Aplikasi Desktop Eye Tracking Perangkat Mobile Perangkat Mobile
Hasil Pengujian subjektif diperoleh 73% level good, 14% level fair dan 13% level poor Tidak ditemukan pengaruh tone dalam color saliency Terdapat hubungan antara touch saliency dengan visual saliency Boundary (piksel-piksel yang menjadi batas) dari salient area
Website
Informasi koordinat salient area
Landasan Teori A. Video
Video merupakan gabungan gambar-gambar yang dibaca berurutan dalam suatu waktu dengan kecepatan tertentu. Video digital adalah jenis sistem video recording yang bekerja menggunakan sistem digital. Biasanya video digital direkam dalam tape, kemudian didistribusikan melalui optical disc, misalnya VCD dan DVD. Salah satu alat yang dapat
Survei Untuk Mendeteksi Salient Area Pada Video Menggunakan K-Harmonic Means
3
digunakan untuk menghasilkan video digital adalah camcorder yang digunakan untuk merekam gambar video dan audio[3]. B. Salient Area Salient area merupakan bagian pada sebuah video yang menarik perhatian dari setiap penonton atau bagian gambar-gambar yang menjadi fokus utama pada sebuah video[1]. Contohnya pada video pidato presiden, dimana bagian wajah presiden tersebut adalah fokus utama atau salient area pada video tersebut. Jika area yang menjadi fokus utama pada video ini berkualitas baik, maka penonton cenderung puas dengan kualitas video sehingga kepuasan penonton dapat terpenuhi. Sebaliknya, jika area ini berkualitas buruk, maka video pun akan dianggap berkualitas buruk. Jadi dapat kita katakan bahwa salient area akan menentukan baik atau buruknya kualitas video tersebut. Berbagai fitur telah dipertimbangkan untuk mendeteksi salient area, seperti intensitas, warna, orientasi tekstur dan gerak. C. K-Harmonic Means K-Harmonic Means merupakan salah satu contoh center-based cluster dan merupakan sebuah algoritma berbasis partisi yang menggunakan rata-rata harmonic (harmonic average) jarak dari setiap titik data ke centroid. K-Harmonic means secara signifikan meningkatkan kualitas hasil clustering yang lebih baik, dimana hasil cluster yang didapat berusaha mendekati hasil yang optimal[4]. 3. Perancangan Aplikasi berbasis website ini dibangun sebagai media survei untuk mendeteksi informasi koordinat salient area berdasarkan sudut pandang subjektif responden. Gambar 1 merupakan deskripsi umum sistem pada aplikasi yang akan dibangun. Responden menginputkan informasi data diri
Menampilkan deskripsi dan cara pendeteksian salient area
Menampilkan beberapa video
Proses seleksi data koordinat salient area
Clustering data koordinat dengan algoritma k-harmonic means
Hasil analisa informasi koordinat salient area pada video
Pendeteksian dan perekaman koordinat kursor salient area
Gambar 1 Deskripsi Umum Sistem
1.
2.
Input data diri responden : Website akan menampilkan form input data diri responden yang berisi nama lengkap, jenis kelamin, tanggal lahir, pekerjaan dan umur. Responden juga diminta untuk mengisi kuesioner terhadap kondisi penglihatan yang nantinya data tersebut akan digunakan sebagai pedoman apakah data itu bisa digunakan atau tidak. Deskripsi dan cara pendeteksian salient area : Setelah responden mengisi form data diri, maka akan berpindah pada halaman homepage yang berisi mengenai deskripsi dan cara pendeteksian tentang salient area.
4 3. 4.
5. 6.
7.
M. Yusuf
Menampilkan video : Website akan menampilkan 5 video yang memiliki format AVI, resolusi 720x486 pixel, frame rate 30 fps, durasi 12-15 detik. Pendeteksian dan perekaman koordinat kursor : Responden diminta untuk menjalankan video dan menggerakkan kursor pada area yang mereka anggap adalah fokus dari video tersebut. Koordinat dari pergerakan kursor direkam dan disimpan datanya ke dalam database sebagai informasi koordinat salient area. Seleksi data koordinat : Data-data koordinat dari hasil survei tersebut akan diseleksi. Clustering data koordinat dengan K-Harmonic Means : Dari proses clustering diperoleh data dengan anggota koordinat yang paling banyak dan kemudian disimpulkan sebagai informasi salient area, karena area tersebut yang paling sering ditunjuk penonton sebagai area yang paling menarik. Hasil analisa : Untuk memperoleh kesimpulan salient area pada video.
4. Pengujian dan Analisis 4.1
Implementasi Antarmuka Aplikasi
Form input data diri responden merupakan tampilan awal dari aplikasi. Pada form ini responden diwajibkan mengisi nama, jenis kelamin, pekerjaan, umur dan beberapa pertanyaan mengenai kondisi penglihatan. Tampilan form input data diri responden dapat dilihat pada Gambar 2.
Gambar 2 Form Input Data Diri Responden
Pada menu ini berisi 5 video yang nantinya akan dilakukan pendeteksian salient area oleh responden dengan cara menggerakkan kursor selama video sedang dijalankan. Tampilan menu video dapat dilihat pada Gambar 3.
Survei Untuk Mendeteksi Salient Area Pada Video Menggunakan K-Harmonic Means
5
Gambar 3 Menu Video
Form ini berisi video yang telah dilakukan clustering untuk mendapatkan salient area pada tiap video. Pada video tersebut terdapat titik-titik koordinat hasil clustering dengan menggunakan algoritma K-Harmonic Means. Tampilan form hasil clustering salient area pada video dapat dilihat pada Gambar 4.
Gambar 4 Form Hasil Clustering Salient Area
4.2
Clustering Titik Koordinat Gerakan Jari
Survei dilakukan untuk mendeteksi salient area berdasarkan sudut pandang subjektif responden. Pada aplikasi ini akan menampilkan 5 video dan diujikan kepada 20 responden. Setelah dilakukan survei terdapat jumlah data koordinat untuk semua frame yang diolah adalah 2070 yang dapat kita lihat pada Tabel 2.
6
M. Yusuf Tabel 2 Informasi jumlah frame setiap video
Video Video 1 Video 2 Video 3 Video 4 Video 5
Durasi 15 Detik 15 Detik 13 Detik 13 Detik 13 Detik Jumlah
Jumlah Frame 450 450 390 390 390 2070
Pengujian terhadap algoritma K-Harmonic Means dapat diujikan dengan cara mengukur validitas clustering terhadap nilai K (jumlah cluster yang digunakan). Validitas clustering berguna untuk menemukan K yang paling cocok untuk mengelompokkan data koordinat pergerakan kursor. Validitas clustering dilakukan dengan menggunakan Dunn Index (DI). Proses clustering dilakukan pada setiap frame dan menggunakan nilai K 2 dan 3. Setelah dilakukan proses clustering maka kita dapat mengukur validitas clustering sehingga diperoleh masingmasing nilai DI pada setiap nilai K. Nilai-nilai DI pada setiap K tersebut akan dibandingkan untuk mengetahui yang mana nilai DI yang terkecil. Nilai DI terkecil pada K tersebut membuktikan bahwa nilai K yang optimal untuk proses clustering data koordinat pergerakan kursor pada setiap frame yang dapat dilihat pada Tabel 3. Total seluruh frame adalah 2070 frame yang akan diolah terhadap masing-masing K. Jadi, ada 4140 kali proses clustering dan ada 4140 nilai DI. Tabel 3 Nilai K optimal pada setiap video
Video
Jumlah Frame
Video 1 Video 2 Video 3 Video 4 Video 5
450 450 390 390 390
Jumlah Frame dengan Nilai DI Terkecil K=2 K=3 193 257 210 240 213 177 314 76 190 200
K Optimal K=3 K=3 K=2 K=2 K=3
Dari pengujian k-harmonic-means yang telah dilakukan, terdapat beberapa parameterparameter untuk menentukan salient area. Diantaranya adalah wajah manusia seperti bibir atau mata, objek bergerak seperti tangan atau jari dan objek berupa tulisan atau teks. Dapat dilihat pada Gambar 5, Gambar 6, Gambar 7, Gambar 8 dan Gambar 9.
Gambar 5 Salient Area Pada Video 1
Gambar 6 Salient Area Pada Video 2
Survei Untuk Mendeteksi Salient Area Pada Video Menggunakan K-Harmonic Means
Gambar 7 Salient Area Pada Video 3
7
Gambar 8 Salient Area Pada Video 4
Gambar 9 Salient Area Pada Video 5
8
M. Yusuf
5. Kesimpulan dan Saran 5.1
Kesimpulan
Dari percobaan dan pengujian penelitian ini, ada beberapa kesimpulan, yaitu sebagai berikut: 1. Aplikasi untuk mendeteksi salient area yang telah dibangun dapat berjalan dan berfungsi dengan baik sehingga tujuan dari pembuatan aplikasi ini tercapai. 2. Algoritma k-harmonic means dapat digunakan untuk mengelompokkan area yang paling menarik perhatian para responden. 3. Aplikasi yang dibangun dapat mempermudah dalam mengumpulkan data titik-titik koordinat. 4. Informasi koordinat salient area ini dapat digunakan sebagai penelitian untuk mengukur kualitas suatu video. 5. Berdasarkan perhitungan DI (Dunn Index) diperoleh cluster terbaik adalah K = 3 untuk video 1, video 2 dan video 5. Sedangkan K = 2 untuk video 3 dan video 4. 5.2
Saran
Untuk pengembangan aplikasi ini, maka ada beberapa hal yang dapat penulis sarankan yaitu: 1. Dapat mengembangkan metode lain seperti K-Means untuk menemukan salient area pada video secara subjektif. 2. Dapat menambahkan video secara dinamis, sehingga video lain juga dapat ditemukan salient area-nya. Daftar Pustaka [1]
Luo, Y., Yuan, J., Xue, P., & Tian, Q. (2011). Salient Region Detection and its Application to Video Retargeting. Multimedia and Expo (ICME), IEEE International Conference on, 1–6.
[2]
Zhu, Y., Jacobson, N., Pan, H., & Nguyen, T. (2011). Motion-Decision Based Spatiotemporal Saliency For Video Sequences. Acoustics, Speech and Signal Processing (ICASSP), IEEE International Conference on, 1333–1336.
[3]
Wirawan, I. M. W. A. (2011). Kompresi Lossy MPEG-1 Video.
[4]
Prasetyo, E. (2014). Data Mining: Mengolah Data Menjadi Informasi Menggunakan Matlab. Yogyakarta: CV. ANDI OFFSET.
[5]
Ni, B., Xu, M., Nguyen, T. V, Wang, M., Lang, C., Huang, Z., & Yan, S. (2014). Touch Saliency : Characteristics and Prediction. Multimedia, IEEE Transactions on, 16(6), 1779–1791. Retrieved from http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6826510&isnumber= 6898894
[6]
Lee, J., Choi, K., & Suk, H. (2013). Using Eye Tracking to Investigate Saliency of Color Attributes for Digital Interfaces with Icon Matrix Arrangements, 1–10. Retrieved from http://design-cu.jp/iasdr2013/papers/1679-1b.pdf