BAB II KAJIAN PUSTAKA
2.1
Tinjauan Mutakhir Skripsi dengan judul “Frame Rate Minimum pada Video Tanpa Kompresi
Menggunakan Normalized Frame Difference Sebagai Pendeskripsi Intensitas Gerak” merupakan pengembangan dari referensi
yang
memiliki keterkaitan
dengan objek penelitian. Referensi tersebut digunakan untuk menentukan batasanbatasan masalah yang kemudian akan dikembangkan lebih lanjut pada penelitian ini. Referensi yang digunakan dalam penelitian ini merupakan penelitian serupa, dimana penulisan dari skripsi ini dikembangan dari sisi metode penyelesaian, variabel input-output dan kondisi objek untuk menyelesaikan permasalahan yang dikaji. Berikut merupakan uraian singkat dari referensi-referensi tersebut: 1. Modeling The Impact Of Frame Rate On Perceptual Quality Of Video (Jurnal Internasional Yen-Fu Ou, Tao Liu, Zhi Zhao, Zhan Ma, Yao Wang Department of Electrical and Computer Engineering, Polytechnic University, Brooklyn, NY, 2003) Pada penelitian ini frame rate yang diujikan yaitu pada 30fps, 10fps, 15fps, 7,5fps, dan 6fps, serta mengetahui besar aktivitas gerak video secara objektif digunakan algoritma Normalized Frame Difference dan Motion Vector Magnitude dengan menggunakan algoritma full search block matching. Metode subjektif tes yang digunakan pada paper adalah menggunakan Single Stimulus Continuous Quality Evaluation (SSCQE) method, untuk menentukan nilai Mean Opinion Score (MOS). Hasil akhir dari penelitian ini adalah menentukan persamaan untuk memprediksi kualitas video setelah pengurangan frame rate. 2. Kualitas Persepsi Video Pada Pra Pengolahan Menggunakan Skema Frame Rate Minimum Dan Normalized Frame Difference Sebagai Ukuran Aktivitas Gerak (Tugas Akhir L.D.Purnamasari, Departement of Electrical Engineering Udayana University, 2014). Penelitian dalam jurnal ini menggunakan metode Normalized Frame Difference
dimana penelitian tersebut dilakukan pada video dengan resolusi
5
6
QCIF dan CIF, frame rate yang diujikan adalah 25 fps, 12,5 fps, 6,25 fps, dan 3,125 fps dan subjektif tes dilakukan dengan metode Simultaneous Double Stimulus for Continous Evaluation (SDSCE) untuk menentukan nilai Mean Opinion Score (MOS). Ringkasan tinjauan mutakhir dapat juga dilihat pada Tabel 2.1 dibawah ini: Tabel 2.1 Tinjauan Mutakhir (state of the art) No. 1.
2.
Nama Penulis
Judul
Metode
Hasil
Yen-Fu Ou,
Modelling The
Metode normalized frame
Hasil dari penelitian
Tao Liu, Zhi
Impact Of Frame
difference dan metode
menyebutkan bahwa
Zhao, Zhan
Rate On
motion vector magnitude
bahwa nilai frame
Ma, Yao
Perceptual
dengan menggunakan
rate memberikan
Wang
Quality Of Video
algoritma full search
pengaruh yang
block matching algorithm.
signifikan terhadap
Menggunakan metode
persepsi kualitas
Single Stimulus
video dan
Continuous
mendefinisikan
QualityEvaluation
hubungan keduanya
(SSCQE) pada penilaian
dalam fungsi
subjektif tes.
eksponensial.
Lela Dwi Purnamasari
Kualitas Persepsi Video Pada Pra Pengolahan Menggunakan Skema Frame Rate Minimum Dan Normalized Frame Difference Sebagai Ukuran Aktivitas Gerak
Metode normalized frame difference dengan Menggunakan metode Simultaneous Double Stimulus for Continous Evaluation (SDSCE) pada penilaian subjektif tes untuk memperoleh nilai MOS.
Hasil akhir dari penelitian ini adalah menentukan persamaan untuk memprediksi kualitas video yang diujikan.
7
Pengembangan arah penelitian yang dilakukan dalam skripsi ini selain digunakannya video dengan resolusi standard
definition, yaitu persamaan
penentuan frame rate minimum terlihat secara eksplisit dimana persamaan tersebut merupakan hasil akhir yang ingin dicapai pada skripsi ini. Mengetahui hubungan antara nilai normalized frame difference minimum dengan hasil subjektif tes pada resolusi video yang lebih besar dari penelitian sebelumnya dengan demikian diketahui bagaimana jika metode ini diterapkan pada perangkatperangkat player yang digunakan saat ini.
2.2
Tinjauan Pustaka Berdasarkan pemaparan sebelumnya dapat didefinisikan teori-teori dasar
yang mendukung pembahasan dari skripsi ini. Beberapa teori dasar yaitu video digital, karakteristik video digital,
ruang warna,
frame difference, metode
normalized frame difference, dan penilaian kualitas subjektif. Berikut akan dibahas lebih lanjut mengenai teori – teori pendukung penelitian ini.
2.2.1
Konsep Dasar Video Digital Video digital adalah teknologi untuk menangkap, merekam, memproses,
mentransmisikan dan menata ulang gambar bergerak. Biasanya menggunakan sinyal elektronik, atau media digital. Jenis sistem video recording yang bekerja menggunakan sistem digital dibandingkan dengan analog dalam hal representasi videonya (Nurhayati, 2010). Video digital pada dasarnya merupakan susunan atas serangkaian frame dengan kecepatan tertentu, tergantung pada frame rate yang diberikan (dalam frame/second) yang bekerja menggunakan sistem digital yang diperoleh dari hasil direkam, kemudian diproses, dan disimpan. Representasi visual tujuan utamanya adalah agar manusia sebagai audience yang melihat merasa berada di scene (lokasi) atau ikut berpartisipasi dalam kejadian yang ditampilkan. Oleh sebab itu, suatu gambar harus dapat menyampaikan informasi spatial dan temporal dari suatu scene (Ramayanti,2009). Video digital meliputi rangkaian frame dan redundansi, masing - masing frame merupakan gambar atau citra (image) digital.
8
2.2.1.1 Redudansi Menurut Dewi (2009) dalam data video terdapat redundansi, karena ada data yang sebenarnya dapat direpresentasikan dengan data lain dalam frame yang sama atau frame lainnya. Redundansi dibagi menjadi redundansi spasial dan redundansi temporal. Redundansi spasial adalah redundansi yang terdapat dalam suatu frame yang disebabkan adanya korelasi antara sebuah piksel dengan piksel disekitarnya, seperti yang terlihat pada Gambar 2.1. Redundansi ini dimanfaatkan untuk melakukan kompresi intra frame.
Gambar 2.1 Redundansi spasial
Pada Gambar 2.1 pemberitahuan terlihat pada daerah di dalam kotak merah. Di daerah tersebut, tidak ada perubahan gerak yang signifikan dalam informasi. Dalam hal ini, ukuran kasus dapat disimpan dengan mengirimkan informasi dari bagian yang sangat kecil dari blok dan kemudian menggunakan informasi yang sama untuk daerah tertinggal di dalam perbatasan kotak merah. Sedangkan redundansi temporal adalah redundansi yang terdapat di antara sebuah frame dengan frame sebelum dan sesudahnya seperti yang terlihat pada Gambar 2.2. Hal ini disebabkan adanya piksel-piksel yang berkolerasi di antara frame-frame tersebut. Redundansi ini terutama dikarenakan banyak bagian
9
frame yang tidak berubah dibandingkan frame sebelum dan sesudahnya. Redundansi temporal dimanfaatkan untuk melakukan kompresi inter frame.
Gambar 2.2 Redundansi temporal
Dari Gambar 2.2, terlihat bahwa tidak ada banyak perbedaan antara dua frame berturut-turut, dengan kata lain, hampir semua benda stabil di antara dua frame tersebut. Dalam hal ini, saat mengirim frame yang kedua hanya bisa menyebutkan informasi terkait dibandingkan dengan frame sebelumnya dan menyimpan sejumlah besar informasi yang perlu ditransfer atau disimpan.
2.2.1.2 Rangkaian Frame Video digital pada dasarnya tersusun atas serangkaian frame. Rangkaian frame tersebut ditampilkan pada layar dengan kecepatan tertentu, tergantung pada laju frame yang diberikan dalam frame/detik. Jika laju frame cukup tinggi, mata manusia tidak dapat menangkap gambar per frame, melainkan menangkapnya sebagai rangkaian yang kontinyu. Suatu image digital direpresentasikan dengan sebuah matriks yang masing - masing elemennya merepresentasikan nilai intensitas. Jika I adalah matriks dua dimensi, I (x,y) adalah nilai intensitas yang sesuai pada posisi baris x dan kolom y pada matriks tersebut. Titik - titik dimana image disampling disebut sebagai picture elements atau sering dikenal sebagai pixel.
10
. Gambar 2.3 Rangkaian Frame
2.2.2
Karakteristik Video Digital Karakteristik video digital ditentukan oleh resolusi (resolution) atau
dimensi frame (frame dimension), kedalaman pixel (pixel depth), dan laju frame (frame rate). Karakteristik – karakteristik video digital ini digunakan untuk menentukan kualitas video dan jumlah bit yang dibutuhkan saat menyimpan maupun pentrasmisian vodeo digital tersebut. 2.2.2.1 Resolusi Resolusi video merupakan tingkat detil suatu video digital tersebut. Semakin tinggi resolusi video maka akan semakin tinggi pula tingkat detil dari video tersebut. Satuan dalam pengukuran resolusi video dogital dapat berupa ukuran fisik (jumlah garis per mm dibagi jumlah garis per inchi) ataupun dapat juga berupa ukuran video menyeluruh (jumlah garis per tinggi citra). Menurut Saputra (2013) resolusi video dapat diukur dengan berbagai cara sebagai berikut: a. Resolusi pixel Resolusi pixel merupakan perhitungan jumlah pixel dalam sebuah video digital. Sebuah video dengan tinggi N pixel dan lebar M pixel, berarti memiliki
11
resolusi sebesar M x N. Resolusi pixel akan memberikan dua buah angka integer yang secara berurutan akan mewakili jumlah pixel lebar dan jumlah pixel tinggi dari video tersebut.
Gambar 2.4 video dengan tinggi N pixel dan lebar M pixel (Rijal,2013)
Resolusi pixel juga merupakan hasil perkalian jumlah pixel lebar dan tingginya dan kemudian dibagi dengan 1 juta. Jenis resolusi pixel seperti ini sering ditemui pada kamera digital. Suatu video yang memiliki lebar 2.048 pixel dan tinggi 1.536 pixel, memiliki total pixel sebanyak 2.048 x 1.536 = 3.145.728 pixel = 3.1 mega pixel. Perhitungan lainnya menyatakan dalam satuan pixel per inchi, yang berarti banyaknya pixel yang ada sepanjang 1 inchi baris dalam video.
Gambar 2.5 Resolusi pixel (Rijal,2013)
b. Resolusi spasial Resolusi spasial menunjukkan seberapa dekat jarak setiap garis pada video. Jarak tersebut tergantung dari sistem yang menciptakan video tersebut. Resolusi spasial menghasilkan jumlah pixel per satuan panjang. Resolusi spasial dari sebuah monitor computer adalah 72 hingga 100 garis per inchi atau dalam resolusi pixel 72 hingga 100 ppi. Contoh lain yaitu video digital dengan ukuran HD beresolusi 720p, 1080p, dan 1080i, semua dengan piksel persegi. Huruf tersebut
12
menunjukkan interlaced dan progressive scanning. Jadi resolusi 720p memiliki ukuran 1280 x 720 piksel, resolusi 1080p memiliki ukuran 1920 x1080 piksel, dan resolusi 1080i memiliki ukuran 1920x1080 piksel pada frekuensi 50 HZ. c. Resolusi spectrum Sebuah video digital membedakan intensits kedalam beberapa spectrum. Video multi spectrum akan memberikan spectrum atau panjang gelombang yang lebih baik untuk menampilkan warna. d. Resolusi temporal Resolusi temporal berkaitan dengan video atau disebut juga frame rate. Suatu video merupakan kumpulan frame statis yang berupa gambar yang berurutan dan ditampilkan secara cepat. Resolusi temporal memberikan jumlah frame yang dapat ditampilkan setiap detik dengan satuan frame per second (fps). Penggunaan frame rate disesuaikan dengan aktifitas gerak dari video, untuk video dengan aktifitas gerak tinggi atau high motion perlu menggunakan frame rate yang besar, tetapi jika video dengan aktifitas gerak rendah atau low motion maka lebih cocok dan efisien menggunakan frame rate yang rendah. e. Resolusi radiometrik Resolusi ini memberikan nilai atau tingkat kehalusan video yang dapat ditampilkan dan biasanya ditampilkan dalam satuan bit. Contoh video 8 bit dan video 256 bit. Semakin tinggi resolusi radiometrik ini maka semakin baik perbedaaan intensitas yang ditampilkan.
Menurut Nurhayati (2010) berdasarkan ukuran video digital, beberapa ukuran video dari yang paling rendah hingga paling tinggi digunakan saat ini yaitu : a. SQCIF (Sub Quarter Common Intermediate Format) SQCIF merupakan salah satu jenis dari resolusi CIF, standar resolusi ini memiliki ukuran yang lebih kecil yaitu 128x96,
frame rate 30 fps. SQCIF
digunakan untuk mendukung kamera dengan resolusi yang lebih kecil dan transmisi video dengan bandwidth yang lebih rendah dan dirancang untuk menampilkan video dengan ukuran kecil seperti tampilan di handphone dan untuk video conference melalui internet.
13
b. QCIF (Quarter Common Intermediate Format) QCIF ini merupakan varian yang didukung oleh resolusi CIF, QCIF memiliki ukuran resolusi 176x144 dengan mengurangi setengah dari kedua resolusi horizontal dan vertikal dari ukuran resolusi CIF dasar. c. CIF (Common Intermediate Format) CIF adalah sebuah format standarisasi resolusi horizontal dan vertikal dalam piksel yang biasa digunakan dalam sistem video teleconference. CIF memiliki ukuran resolusi 352 x 288. CIF menggunakan frame rate 30 fps. d. SD (Standard Definition) SD (Standard Definition) memiliki kualitas gambar sedikit lebih baik dari video sebelumnya karena ukurannya lebih besar, memiliki resolusi 720x576. SD membutuhkan piksel yang kecil, dan membutuhkan frekuensi 50 Hz, namun dari segi kualitas lebih baik dari CIF. Dalam komunikasi menggunakan video resolusi SD saat ini sudah sangat banyak bahkan, video dengan SD digunakan pada saat melakukan streaming dengan didukung bandwith yang memadai. e. HD (High Definition) HD merupakan video yang secara gambaran umum beresolusi 720p, 1080p, dan 1080i, semua dengan piksel persegi. Huruf tersebut menunjukkan interlaced dan progressive scanning. Jadi resolusi 720p memiliki ukuran 1280 x 720 piksel, resolusi 1080p memiliki ukuran 1920 x1080 piksel, dan resolusi 1080i memiliki ukuran 1920x1080 piksel pada frekuensi 50 HZ .
2.2.2.2 Laju Frame (frame rate) Menurut Haslinda (2012) laju frame (frame rate) menunjukkan jumlah frame yang digambarkan tiap detik dinyatakan dalam frame/detik. Sehubung dengan laju frame ini, ada dua hal yang perlu diperhatikan, yaitu kehalusan gerakan (smooth motion) dan kilatan (flash). Kehalusan gerakan ditentukan oleh jumlah frame yang berbeda per detik. Untuk mendapatkan gerakan yang halus, video digital setidaknya harus berada pada 25 frame/detik. Kilatan ditentukan oleh jumlah berapa kali layar digambar per detik. Dengan 20 frame/detik, kilatan sudah dapat dilenyapkan.
14
Video yang berkualitas baik akan memiliki laju frame minimal 30 frame per detik, setidaknya sesuai dengan mata manusia, yang membutuhkan jumlah bit lebih tinggi. Penggunaan frame rate disesuaikan dengan motion activity dari video, untuk video dengan gerakan-gerakan cepat atau high motion
perlu
menggunakan frame rate yang besar, tetapi jika video dengan gerakan lambat atau low motion¸maka lebih cocok dan efisien menggunakan frame rate yang rendah.
2.2.2.3 Aktivitas Gerak (Motion Activity) Pada Video Menurut Peker (2001) Motion Activity digunakan untuk menggambarkan tingkat atau intensitas kegiatan, tindakan, atau gerakan pada suatu urutan video. Model sequence video diklasifikasikan dalam tiga tingkat motion activity yaitu low motion, medium motion, dan high motion seperti pada Tabel 2.2. Table 2.2 Model sequence video No. 1.
Low Motion
Medium Motion
High Motion
Video conference :
Kerumunan :
Sport :
Seseorang yang sedang
Pergerakan beberapa orang
Sebuah tembakan tajam
berbicara di depan kamera
di keramaian dengan tingkat
pada permainan football
dimana hanya terdapat
detail pergerakan yang
dimana terdapat
pergerakan kepala dan
banyak terdapat pergerakan
perpindahan pergerakan
bahu dengan detail
kamera.
pemain dan background
pergerakan yang tidak
yang sangat banyak.
banyak 2.
News :
Seni bela diri :
Car chase :
Satu atau lebih reporter
Sebuah adegan pertarungan
Sebuah adegan balap mobil
berita yang sedang
yang melibatkan beberapa
dengan kecepatan yang
berbicara kea rah kamera
orang dengan pergerakan
sangat tinggi dan detail
dimana terdapat
yang cepat.
pergerakan yang sangat
pergerakan kepala dan
banyak.
bahu. 3.
Ship:
Airport :
Kapal yang melaju dengan
Adegan beberapa orang
kecepatan rendah.
berjalan dikeramaian dan terdapat pergerakan kamera.
15
4.
Animasi : Beberapa adegan karakter animasi komputer dengan adanya pergerakan kamera
(Sumber: Yadavalli,2003)
2.2.2.4 Kedalaman Bit Menurut Rohman (2011) kedalaman bit menentukan jumlah bit yang digunakan untuk mempresentasikan tiap piksel pada sebuah frame dan dinyatakan dalam
bit/piksel.
Semakin
banyak
jumlah
bit
yang digunakan
untuk
mempresentasikan sebuah piksel, yang berarti semakin tinggi kedalaman pikselnya, maka semakin tinggi pula kualitasnya. Kedalam piksel paling rendah terdapat pada binary-value image yang hanya menggunakan 1 bit untuk tiap piksel, sehingga hanya ada dua kemungkinan bagi tiap piksel, yaitu 0 (hitam) atau 1 (putih). Nilai 1 byte (8 bit) untuk tiap piksel, diperoleh 28 atau 256 level intensitas. Kemudian video dengan kedalam 16 bit biasanya disebut video high color, dimana setiap pikselnya diwakili oleh 2 byte atau 16 bit dengan memiliki 65.356 warna. Dalam formasi bitnya, nilai merah dan biru mengambil tempat di 5 bit di kanan dan kiri. Komponen hijau memiliki 5 bit ditambah 1 bit ekstra, pemilihan komponen hijau dengan deret 6 bit dikarenakan penglihatan manusia lebih sensitif terhadap warna hijau untuk lebih jelasnya dapat dilihat pada Tabel 2.3. Dengan demikian, semakin sedikit jumlah bit yang digunakan untuk tiap piksel, maka semakin turun pula kualitas gambar. Tabel 2.3 16 Bit Truecolor
(Sumber : Rijal,2013)
16
2.2.3
Representasi Warna Dalam video digital representasi warna merupakan cara standar untuk
menspesifikasikan suatu warna tertentu dengan mendefinisikan suatu sistem koordinat 3D dan suatu ruang bagian yang mengandung semua warna yang dapat dibentuk ke dalam suatu model tertentu. Suatu warna yang dapat dispesifikasikan menggunakan suatu model akan terhubung ke suatu titik tunggal dalam suatu ruang bagian yang disefinisikannya. Pada umumnya, data video dipisahkan menjadi komponen warna (crominance) dan komponen kecerahan (luminance). Komponen tersebut dipisahkan dengan beberapa cara, yaitu RGB dan YUV.
2.2.3.1 Ruang Warna Red Green Blue (RGB) Menurut Putranto (2010) kombinasi dari komponen warna dasar yaitu merah, hijau, dan biru dapat disebut juga ruang warna. Untuk 24 bit per piksel, kisaran R, G, B bervariasi dari 0 sampai 255. Apabila R, G, B adalah semua 0 maka warna yang dihasilkan akan menjadi hitam. Jika R, G, B adalah semua 255 maka warna keluaran akan menjadi putih. Konsep ruang warna RGB ditentukan pada gambar 2.5.
Gambar 2.6 Ruang warna RGB (Rijal, 2013)
Sumbu x mewakili rentang warna biru, sumbu y mewakili rentang warna hijau dan sumbu z mewakili rentang warna merah. Seperti pada Gambar 2.6, terlihat bahwa warna hitam diwakili di asal dan warna putih diwakili di sudut lain, dimana warna merah, hijau, dan biru adalah masing masing 255. Demikian pula kita dapat mendapatkan nilai warna lain di berbagai penjuru kubus sesuai dengan nilai-nilai RGB yang berbeda.
17
Gambar 2.7 Model Warna RGB (Rijal, 2013)
2.2.3.2 Format Piksel YUV Menurut Wang (2012) sistem warna YUV adalah pengkodean warna skema untuk memisahkan komponen video ataupun gambar digital yaitu komponen kecerahan atau cahaya (luminance) dan komponen warna sinyal (chrominance). Mata manusia kurang peka terhadap variasi warna daripada intensitas variasi, jadi YUV memungkinkan pengkodean informasi cahaya (Y) bandwidth penuh dan informasi krominan (UV) setengah bandwidth atau komponen kecerahan dinyatakan dengan Y, sedangkan dua komponen warna dinyatakan dengan U dan V. Komponen luminan dapat diperlakukan sebagai skala abu-abu dari suatu RGB image. Ruang warna berbasis YUV diperoleh dari komponen RGB yang telah mengalami koreksi gamma, sehingga disebut R’G’B dengan nilai sebagai berikut: Y = 0,299R + 0,587G + 0,114B U = 0,147R - 0,289G + 0,436B = 0,492 (B-Y) V = 0,615R -0,515G - 0,100B = 0,877 (R-Y) ……………..……(2.1) Mata manusia lebih sensitif terhadap luminance daripada chrominance pada komponen gambar, itu sebabnya pada aplikasi pengkodean seperti motion estimation, suatu block dikodekan atau tidak, didasarkan pada komponen kecerahan (luminance). Dalam video coding komponen luminance dihitung untuk setiap piksel, tetapi dua komponen chrominance (U dan V) adalah rata-
18
rata dari 4 piksel, ini membagi dua jumlah data yang dikirimkan untuk setiap piksel. Menurut Sullivan (2008) notasi “A : B : C” adalah notasi yang digunakan untuk menggambarkan seberapa sering U dan V adalah sampel relative terhadap Y. 1. 4:4:4 berarti untuk setiap 2 x 2 Y piksel terdapat 4 U dan 4 V piksel, seperti pada gambar 2.8.
Gambar 2.8 YUV Sampling 4:4:4
2. 4:2:2 berarti 2:1 downsampling arah horizontal, tanpa downsampling arah vertical, dimana setiap 2 x 2 Y piksel terdapat 2 U dan 2 V. Seperti yang terlihat pada gambar 2.9
Gambar 2.9 YUV Sampling 4:2:2
3. 4:2:0 berarti 2:1 downsampling arah horizontal dan arah vertical, dimana setiap 2 x 2 Y piksel terdapat 1 U dan 1 V piksel. Seperti pada gambar 2.10.
19
Gambar 2.10 YUV Sampling 4:2:0
2.2.3.3 Kontras Gambar Menurut Peli (1990) kontras merupakan perbedaan luminance dan warna pada sebuah objek gambar. Kontras suatu video adalah distribusi piksel terang dan gelap. Video grayscale dengan nilai kontras rendah maka akan terlihat lebih gelap, terlalu terang, atau abu-abu. Video dengan kontras tinggi memiliki daerah gelap dan terang yang luas. Semakin tinggi kontras video, akan semakin tajam perbedaan antara warna-warna yang terang dan warna-warna yang gelap. Dalam persepsi visual kontras, kontras ditentukan berdasarkan perbedaan pada warna dan kecerahan pada objek atau objek lainnya dengan bidang yang sama. Karena visual manusia lebih sensitif terhadap kontras daripada warna. Perbedaan tingkat kontras pada suatu video terlihat pada Gambar 2.11, dimana derah kiri pada gambar dengan kontras yang rendah dan daerah kanan dengan kontras yang tinggi.
Gambar 2.11 Kontras gambar (http://desaindotgrafis.blogspot.com/2014)
20
2.2.4
Frame Difference Menurut Guningrat (2012) dalam melakukan proses pendeteksian objek
bergerak dan perhitungan rasio tertentu pada objek, digunakanlah suatu metode yang disebut frame difference. Frame difference (perbedaan frame) adalah teknik menghitung selisih antara dua frame di setiap posisi piksel dari suatu gambar pada video. Metode ini bisa digunakan untuk mendeteksi suatu objek yang melakukan perpindahan (bergerak). Metode ini juga dapat digunakan untuk proses perhitungan kecepatan suatu objek yang bergerak. Proses mencari objek bergerak dalam urutan frame yang dilakukan dengan menggunakan ekstraksi ciri benda dan mendeteksi objek bergerak di urutan frame. Dengan menggunakan nilai posisi objek di setiap frame, kita dapat menghitung posisi dan kecepatan objek bergerak tersebut. Persamaan untuk menggitung frame difference dapat dilihat sebagai berikut: Frame Diff = (frame p – frame i)……………………..........……….…….(2.2) Dimana frame p merupakan frame sekarang dan frame i adalah frame sebelumnya. Sebagai contoh pemanfaatan penggunaan frame difference digunakan dalam sebuah video saat menayangkan lelaki melakukan pergerakan kepala dengan latar belakang diam dan hanya terdapat sedikit gerakan tangan dan kepala seperti pada Gambar 2.12.
Gambar 2.12 Frame Difference (http://grouplab.cpsc.ucalgary.ca)
21
Menurut Barjatya (2004) block matching adalah membagi frame menjadi matriks 'makro blok' yang kemudian dibandingkan antara blok satu dengan blok sebelumnya. Sehingga akan terjadi perbedaan nilai piksel pada frame satu dengan frame selanjutnya (frame difference). Dari pernyatan tersebut maka untuk menentukan Normalized Frame Difference (NFD) nilai frame difference dalam video ditentukan dengan menghitung rata-rata perbedaan framenya. Adapun fungsi untuk menentukan rata-rata perbedaan tiap piksel dari seluruh frame yaitu Mean Absolute Difference (MAD) adalah mencari rata-rata nilai perbedaan mutlak antara frame satu dengan frame selanjutnya. MAD dapat dihitung sebagai berikut :
MAD( k )
1 MxN
M 1 N 1
C i 0
j 0
ij
Rij ……………………..........…………….(2.3)
dimana,
2.2.5
M dan N
= resolusi horisontal dan vertikal dari frame
Cij
= nilai pixel pada frame saat ini
Rij
= nilai pixel pada frame sebelumnya
k
= antar frame ke-k
Normalized Frame Difference (NFD) Menurut Yen-Fu (2013) NFD digunakan untuk menggambarkan besar
perbedaan nilai aktivitas gerak dari frame ke frame berdasarkan parameter Frame Difference (perbedaan frame). Metode ini merupakan teknik yang digunakan untuk menghitung perbedaan antara dua frame disetiap posisi piksel dari suatu gambar pada video. Apabila ada perbedaan nilai piksel pada frame, berarti ada perubahan gambar pada video. Persamaan untuk menghitung perbedaan dari intensitas gerak video yang digunakan pada penelitian Yen-Fu (2013) yaitu Mean Absolute Difference (MAD) atau biasa dikenal sebagai Frame Difference (FD) yang didefinisikan sebagai λFD. Deretan frame dengan perbedaan kontras yang tinggi cenderung memiliki frame difference yang besar meskipun dengan pergerakan yang sedikit. Oleh karena itu, besar frame difference karena adanya pergerakan harus
22
dinormalisasi untuk perataan nilai kontras menggunakan metode Normalized Frame Difference (NFD). Hal itu dilakukan agar setiap frame pada video tidak memilki perbedaan kontras yang terlalu jauh, dimana NFD didefinisikan sebagai berikut:
NFD( k )
MAD( k ) cont( k )
……….…….…………………………………………….(2.4)
Dari persamaan 2.6 cont video didefinisikan sebagai rata-rata standard deviasi dari nilai-nilai piksel pada setiap frame, dimana SD ditentukan dengan persamaan sebagai berikut : 2
P p MxN n 1 .......................................................................(2.5) SD( perframe) n 1 MxN
dimana,
cont ( k )
p
= Piksel ke-n
P
= Jumlah Piksel dalam satu frame
n
= Resolusi (MxN)
SD( j ) SD( j 1) 2
..........................................................................(2.6)
NFD hanya memproses nilai Y, karena mata manusia hanya mampu melihat gelap dan terang. Langkah-langkah algoritma Normalized Frame Difference diawali dengan menghitung selisih nilai piksel antar frame disetiap posisi pikselnya selanjutnya menjumlahkan selisih nilai piksel antar frame kemudian membagi jumlah selisih nilai piksel dengan resolusi video untuk mendapatkan nilai Mean Absolute Difference (MAD), dilanjutkan dengan menghitung nilai standar deviasi pada setiap frame dan merata-ratakannya untuk mendapatkan nilai cont, dan membagi nilai MAD dengan cont video untuk mendapatkan nilai NFD.
23
2.2.6
Tes Subyektif Simultan Double Stimulus for Continuous Evaluation (SDSCE) Metode tes yang digunakan pada penilaian ini adalah menggunakan
metode Simultan Double Stimulus for Continuous Evaluation (SDSCE) method berdasarkan rekomendasi BT.500-11 dari International Telecommunication Union - Working Group-R (ITU-R). Dalam metode ini pengamat diminta untuk mengamati video yang sedang diproses dan dibandingkan dengan video asli berdasarkan parameter-parameter sebagai berikut (ITU-R Rec. BT-500-11).
1.
Kondisi lingkungan pada saat test dilaksanakan dapat disesuaikan dengan kondisi yang ada.
2.
Sudut pandang responden terhadap garis normal vertical dan horizontal maksimum
untuk monitor CRT
3.
Brightness dari monitor minimum 200
4.
Prosedur test dilaksanakan secara simultan, dimana responden diminta mengamati dua adegan secara bersamaan, dimana salah satunya merupakan adegan video asli sebagai referensi, dan yang lainnya merupakan adegan video yang telah diproses. Responden diminta menilai adegan dari video yang telah diproses dengan mengacu pada adegan video referensi.
5.
Responden harus mendapat penjelasan mengenai kriteria penilaian, dengan mencantumkan penjelasan tertulis pada kuesioner yang digunakan. Sebelum pengamatan dimulai, responden harus mendapat penjelasan mengenai kondisi adegan yang akan dinilai
6.
Nilai numerik MOS dinyatakan dengan angka antara 1 sampai dengan 5, dengan urutan nilai standar yang digunakan adalah sebagai berikut : Nilai MOS = 1, maka nilai MOS dikatakan buruk. Nilai MOS = 2, maka nilai MOS dikatakan tidak baik. Nilai MOS = 3, maka nilai MOS dikatakan cukup baik. Nilai MOS = 4, maka nilai MOS dikatakan baik. Nilai MOS = 5, maka nilai MOS dikatakan sangat baik.
24
Dalam analisis MOS, digunakan beberapa perhitungan statistik sebagai berikut : (ITU-R Rec.BT.500-11). a. Mean score dari hasil penilaian untuk satu kategori
u jk
1 n uijk …………………………………………………....(2.7) n i 1
Dimana uijk adalah nilai dari responden ke-i untuk kategori tes-j, adegan video k dan n adalah jumlah responden. b. Standar deviasi dari setiap kategori
S jk
N
i 1
u
uijk
2
jk
n 1
………………………………………...…(2.8)
Apabila pengamatan dilakukan terhadap masing-masing satu kategori untuk satu adegan, maka nilai j dan k adalah 1.
2.2.7
Statistik Uji Korelasi Analisis korelasi adalah metode statistika yang digunakan untuk
menentukan kuatnya derajat hubungan linier antara dua variabel atau lebih. Korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik pengukuran asosiasi (measures of association). Pengukuran asosiasi merupakan istilah umum yang mengarah pada sekelompok teknik dalam statistik yang digunakan untuk mengukur kekuatan hubungan linier antara dua variabel atau di antara beberapa variabel. Salah satu aspek analisis asosiasi adalah untuk memutuskan apakah data sampel yang teramati menyediakan bukti yang cukup untuk menyimpulkan bahwa variabel-variabel dalam populasi asal sampel saling berkaitan atau berhubungan. (Sudarmo,2013). Korelasi dilambangkan dengan r dengan ketentuan nilai r tidak lebih dari harga (-1≤ r ≤ 1). Apabila korelasi bernilai negatif artinya X dan Y berkorelasi berbanding terbalik misalkan variable X semakin besar maka variable Y akan semakin kecil. Apabila korelasi bernilai positif
artinya variabel X dan Y
25
berkoerelasi berbanding lurus artinya apabila nilai X semakin besar maka nilai Y juga akan semakin besar. (Nurdiansyah,2013) Tabel 2.4 Interpretasi Koefisien Korelasi Nilai r
Interval Koefisien
Tingkat Hubungan
0,800 – 1,000
Sangat Kuat
0,600 – 0,799
Kuat
0,400 – 0,599
Cukup Kuat
0,200 – 0,399
Lemah
0,000 – 0,199
Sangat Lemah
Hubungan linear lebih dari dua variable yaitu perubahan satu variabel dipengaruhi oleh lebih dari satu variabel lain dapat. Secara fungsional Y = f (X1, X2, X3, ..., Xk) atau dalam persamaan matematis dituliskan Y = a + b1X1 + b2X2 + b3X3 + ... + bkXk. Koefisien Korelasi Linier Berganda merupakan indeks atau angka yang diigunakan untuk mengukur keeratan hubungan antara 3 variabel/lebih. Koefisien korelasi berganda dirumuskan :
ry1
ry2
r1.2
n x1 y y x1
n y
2
y n x1 x1 2
2
2
n x2 y y x1
n y
2
y n x2 x2 2
2
2
n x1 x2 x1 x2
n x
2 1
x1 n x2 x2 2
2
2
ry1 ry2 2ry1ry2 ry1.2 Ry1.2 ………………………………………(2.9) 2 1 r1.2 2
2
26
Dimana : Ry1.2
: koefisien linier 3 variabel
ry1
: koefisien korelasi y1
ry2
: koefisien korelasi variabel y2
r1.2
: koefisien korelasi variabel x1 dan x2
2.2.8
Histogram Kata histogram berasal dari bahasa Yunani: histos dan gramma. Pertama
kali digunakan oleh Karl Pearson pada tahun 1895 untuk memetakan distribusi frekuensi dengan luasan area grafis batangan menunjukkan proporsi banyak frekuensi yang terjadi pada tiap kategori. Histogram citra merupakan grafik yang menggambarkan penyebaran nilai-nilai intensitas pixel dari suatu citra atau bagian tertentu di dalam citra (Utama,2009). Definisi lain dari histogram adalah suatu grafik yang menunjukkan berapa besar jumlah piksel dari citra memiliki suatu tingkat keabuan tertentu (Ibrahim, 2011). Histogram juga dapat menunjukkan banyak hal tentang kecerahan (brightness) dan kontras (contrast) dari sebuah gambar. Secara grafis histogram ditampilkan dengan diagram batang, misal citra digital memiliki L derajat keabuan. (misalnya citra dengan kuantisasi derajat keabuan 8-bit, nilai derajat keabuan dari 0 – 255) . Histogram merupakan fungsi probabilitas dari suatu citra, dimana hiatogram pf(f) dirumuskan sebagai berikut : p( f ) ( f ( k ) )
nk …………………………..………………………………………(2.10) n
Dimana : k = 0,1,…, L-1 nk = piksel dari intensitas k n = jumlah total piksel pada skala keabuan. L = skala keabuan dari citra, biasanya 0 – 255 untuk 8 bit