ANALISIS PERBANDINGAN EFISIENSI DAN EFEKTIFITAS ANTARA CODEC H.264 DAN VP7 PADA SISTEM VIDEO CONFERENCE
MUHAMAD HAYKAL 105097003207
PROGRAM STUDI FISIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2011
ANALISIS PERBANDINGAN EFISIENSI DAN EFEKTIFITAS ANTARA CODEC H.264 DAN VP7 PADA SISTEM VIDEO CONFERENCE
Skripsi Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains
Oleh:
MUHAMAD HAYKAL 105097003207
PROGRAM STUDI FISIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2011
LEMBAR PENGESAHAN
ANALISIS PERBANDINGAN EFISIENSI DAN EFEKTIFITAS ANTARA CODEC H.264 DAN VP7 PADA SISTEM VIDEO CONFERENCE
Skripsi Duajukan untuk memenuhi Persyaratan Memperoleh Gelar Sarjana Sains pada Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta
Oleh : MUHAMAD HAYKAL 105097003207
Menyetujui, Pembimbing I
Pembimbing II
Arif Tjahjono, M. Si
Ambran Hartono, M. Si
NIP. 1975110720070 11015
NIP.19710408200212 1002 Mengetahui,
Ketua Program Studi Fisika
Drs. Sutrisno, M. Si NIP. 19590202 198203 1005
PENGESAHAN UJIAN Skripsi berjudul
“ANALISIS PERBANDINGAN EFISIENSI DAN
EFEKTIFITAS ANTARA CODEC H.264 DAN VP7 PADA SISTEM VIDEO CONFERENCE” yang ditulis oleh Muhamad Haykal dengan NIM 105097003207 telah diuji dan dinyatakan lulus dalam sidang Munaqosyah Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta pada tanggal 23 Februari 2011. Skripsi ini telah diterima sebagai salah satu syarat untuk memperoleh gelar sarjana Strata Satu (S1) Program Studi Fisika.
Jakarta, Februari 2011 Tim Penguji,
Penguji I
Penguji II
Drs. Sutrisno, M. Si
Asrul Azis, M.Sc
NIP. 19590202 198203 1005
NIP. 19510617 198503 1001 Mengetahui,
Dekan Fakultas Sains dan Teknologi
Ketua Program Studi Fisika
DR. Syopiansyah Jaya Putra, M. Sis
Drs. Sutrisno, M. Si
NIP. 19680117 200112 1 001
NIP. 19590202 198203 1005
PERNYATAAN
DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI ADALAH BENAR HASIL KARYA SAYA SENDIRI YANG BELUM PERNAH DIAJUKAN
SEBAGAI
SKRIPSI
ATAU
KARYA
ILMIAH
PADA
PERGURUAN TINGGI, LEMBAGA, ATAU INSTANSI MANA PUN.
Jakarta , 23 Februari 2011 Pembuat Pernyataan,
MUHAMAD HAYKAL 105097003207
ABSTRAK
Konferensi video adalah satu set teknologi telekomunikasi interaktif yang memungkinkan dua lokasi atau lebih untuk berinteraksi melalui transmisi video dan audio dua arah secara bersamaan. Dalam kerjanya dibutuhkan sebuah codec yang berfungsi untuk mengkompresi data video dan audio yang terkirim selama berlangsungnya konferensi video tersebut agar data yang terkirim tersebut lebih hemat sumber daya (CPU, RAM, dan bandwidth) sehingga layanan ini dapat berlangsung dengan lebih cepat dan hemat. Dalam penelitian ini dibandingkan dua jenis codec video, yaitu codec VP7 pada layanan konferensi video Skype dan codec H.264 pada Google Video Chat untuk menentukan layanan mana yang lebih cocok untuk digunakan oleh konsumen kelas menengah ke bawah. Dengan membandingkan besar konsumsi sumber daya dengan kualitas gambar yang dihasilkan oleh kedua codec tersebut, maka dapat diketahui bahwa codec H.264 lebih efektif dan efisien karena konsumsi sumber daya yang rendah dan dapat menghasilkan kualitas gambar yang cukup baik, dimana codec VP7 menghabiskan sumber daya yang jauh lebih besar hanya dengan kualitas gambar yang sedikit lebih baik. Sehingga dapat disimpulkan bahwa layanan konferensi video Google Video Chat dengan codec H.264 lebih cocok untuk digunakan oleh konsumen kelas menengah ke bawah. Kata Kunci : Konferensi Video, Codec, Kompresi dan Efisiensi Algoritmik.
i
ABSTRACT
Video conferencing is a set of interactive telecommunication technologies which allow two or more locations to interact via two-way video and audio transmission simultaneously. It requires a codec that serves to compress video and audio data sent during a video conference so that sent data is more resources efficient (CPU, RAM, and bandwidth) and the services would be more efficient. In this research, two types of video codecs is compared, namely VP7 codec on the Skype video conferencing service and H.264 codecs on Google Video Chat to determine which service is more suitable for use by lower-middle class consumers. By comparing the consumption of resources with the quality of images produced by both codecs, it’s proven that the H.264 codec is more effective and efficient because of low resource consumption and can produce a fairly good picture quality, when the VP7 codec spend much larger resources, only with slightly better picture quality. So, it can be concluded that the Google Video Chat video conference service with H.264 video codec is more suitable for use by lower-middle class consumers. Keywords : Video Conference, Codecs, Algorithmic Compression and Efficiency.
ii
KATA PENGANTAR
Puji syukur kepada Allah swt yang telah melimpahkan rahmat dan karunia serta hidayah-Nya sehingga penulis dapat menyelesaikan penulisan Tugas Akhir ini. Tugas Akhir ini diajukan untuk memenuhi tugas mata kuliah skripsi pada Program Studi Fisika Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta (UIN) dengan judul “ANALISIS PERBANDINGAN EFISIENSI DAN EFEKTIFITAS ANTARA CODEC H.264 DAN VP7 PADA SISTEM VIDEO CONFERENCE” Pada kesempatan ini penulis mengucapkan terima kasih yang sebesarbesarnya kepada: 1.
Ibunda tercinta, Dra. Astuty Muchtar, yang selalu sabar dalam membimbing dan memberi semangat dan cintanya yang tak pernah terputus sehingga penulis dapat belajar mengerti hidup ini. Serta kakak-kakak, Muhammad Iqbal dan Muhammad Fadhlan yang senantiasa mengayomi penulis hingga kini. Kepada Almarhum Papa, dr. Djonny Anwar Boer, semoga tenang Di Sana Selamanya.
2.
Bapak Arif Tjahjono, M. Si selaku pembimbing I Tugas Akhir ini. Terima kasih untuk semua saran, kritik, dan arahan yang sangat berharga, serta kesabarannya.
3.
Bapak Ambran Hartono, M. Si selaku pembimbing II. Terima kasih untuk bimbingan, masukan, serta motivasi yang telah diberikan.
4.
Bapak Sutrisno, M. Si selaku ketua Prodi Fisika UIN Jakarta. Terima kasih atas segala perhatian dan kemudahan yang diberikan.
iii
5.
Bapak Drs. Sutrisno, M. Si dan Bapak Asrul Azis, M.Sc. selaku penguji Tugas Akhir ini, terima kasih atas pertanyaan dan masukan yang telah diberikan.
6.
Kawan-kawan keluarga besar Quantum, Adit, Ardial, Bobby, Erik, Fitrah, Geary, Popay, Rio, Lulut, dan Nadia. Berkat kalian pula skripsi saya tertunda begitu lama. Sebuah penundaan yang sungguh indah. Ingat, perjuangan kita belum berakhir. Dan juga untuk 9Glow dan Boysansin.
7.
Rizmal Bachri dan Mursyallim serta kawan-kawan seperjuangan di fisika yang telah memberikan bantuan, dorongan, dan semangat dalam penyusunan Tugas Akhir ini.
8.
Para staf dosen Program Studi Fisika FST UIN Jakarta, yang telah memberikan bekal pengetahuan kepada penulis.
9.
Serta semua pihak yang telah memberikan bantuan dalam bentuk apapun, yang tidak dapat penulis sebutkan satu per satu. Penulis menyadari bahwa penulisan Tugas Akhir ini masih jauh dari
sempurna karena keterbatasan yang ada pada diri penulis, untuk itu penulis mengharapkan kritik dan saran yang membangun demi kesempurnaan Tugas Akhir ini. Jakarta, Februari 2011
Penulis Muhamad Haykal
iv
DAFTAR ISI
ABSTRAK .......................................................................................................... ...i ABSTRACT ......................................................................................................... ..ii KATA PENGANTAR ......................................................................................... .iii DAFTAR ISI........................................................................................................ ..v DAFTAR GAMBAR ........................................................................................ ...ix DAFTAR TABEL .............................................................................................. .xi
BAB I PENDAHULUAN 1.1
Latar Belakang ..........................................................................................1
1.2
Tujuan Penelitian.......................................................................................4
1.3
Pembatasan Masalah .................................................................................4
1.4
Manfaat Penelitian.....................................................................................5
1.5
Sistematika Penulisan ................................................................................5
BAB II LANDASAN TEORI 2.1
Pengertian Video Digital ...........................................................................7
2.1.1
Frame Rate .........................................................................................7
2.1.2
Aspect Ratio .......................................................................................8
2.1.3
Resolusi Spasial dan Frame Size .......................................................9
v
2.1.4
Level Bit .............................................................................................9
2.1.5
Laju Bit (Bit Rate) ............................................................................10
2.2
Konsep Dasar Video Conference ............................................................10
2.3
Coding dan Decoding ..............................................................................14
2.3.1
Pencuplikan (sampling) ..................................................................15
2.3.2
Kuantisasi .........................................................................................20
2.4
Kompresi Data .........................................................................................24
2.4.1
Teori Kompresi Data ........................................................................24
2.4.2
Pemodelan Sumber (Source Modeling) ...........................................26
2.4.3
Jenis-Jenis Algoritma Kompresi Data .............................................30
2.4.4
Algoritma Kompresi Huffman .........................................................30
2.5
Discrete Cosine Transform (DCT) ..........................................................37
2.5.1
Standar Kompresi Video ..................................................................37
2.5.2
Algoritma kompresi JPEG ...............................................................41
2.5.2
Algoritma Kompresi H.261 .............................................................43
2.5.3
Algoritma kompresi MPEG .............................................................45
2.6
Gelombang Elektromagnetik...................................................................47
2.6.1
Osilator Penghasil Gelombang Elektromagnetik .............................51
vi
BAB III METODE PENELITIAN 3.1
Waktu dan Tempat Penelitian .................................................................52
3.2
Perangkat yang digunakan ......................................................................52
3.2.1
Perangkat Keras ...............................................................................52
3.2.2
Perangkat Lunak ..............................................................................54
3.3
Tahapan Penelitian ..................................................................................57
3.3.1
Pengamatan Paket .............................................................................58
3.3.2
Pengukuran Delay.............................................................................59
3.3.3
Pengukuran Bandwidth.....................................................................61
3.3.4
Pengukuran Throughput Jaringan .....................................................61
3.3.5
Kualitas Gambar ...............................................................................62
3.3.6
Efisiensi dan Efektifitas ....................................................................62
3.4
Pengolahan Data ......................................................................................63
3.4.1
Estimasi MOS dengan standart ITU-T P.800 ..................................63
3.4.2
Estimasi MOS dengan Metode E-Model (ITU-T G.107) ................64
3.4.3
Estimasi Pengukuran Packet loss terhadap Kualitas Video .............66
BAB IV HASIL DAN PEMBAHASAN 4.1
Hasil Pengujian Codec pada PC ..............................................................68
4.2
Hasil Pengujian Codec pada Laptop .......................................................71
vii
4.3
Hasil Perhitungan Dengan Metode MPQM ............................................73
4.4
Perbandingan Penggunaan Sumber Daya Antara VP7 dan H.264 ..........75
BAB V KESIMPULAN DAN SARAN 5.1
Kesimpulan..............................................................................................81
5.2
Saran ........................................................................................................81
DAFTAR PUSTAKA ......................................................................................... 83 LAMPIRAN ......................................................................................................... 84
viii
DAFTAR GAMBAR
Gambar 2.1 Sinyal analog sebelum dan sesudah dicuplik ...................................16 Gambar 2.2 Rekonstruksi sinyal kontinyu dari sinyal diskrit ..............................17 Gambar 2.3 Aliasing frekuensi 1.1 .......................................................................18 Gambar 2.4 Berbagai jenis aliasing frekuensi ......................................................19 Gambar 2.5 Contoh dari sebuah pengkuantisasi linier .........................................23 Gambar 2.6 Distribusi pada Node 1 .....................................................................31 Gambar 2.7 Distribusi pada Node 2 .....................................................................32 Gambar 2.8 Distribusi pada Node 3 .....................................................................32 Gambar 2.9 Distribusi pada Node 4 .....................................................................32 Gambar 2.10 Distribusi pada Node 5 ...................................................................33 Gambar 2.11 Distribusi pada Node 6 ...................................................................33 Gambar 2.12 Distribusi pada Node 7 ...................................................................34 Gambar 2.13 Distribusi pada Node 8 ...................................................................34 Gambar 2.14 Motion Vector.................................................................................40 Gambar 2.15 Proses kompresi gambar diam ........................................................41 Gambar 2.16 Makroblok kompresi h.261 ............................................................43 Gambar 2.17 Kompresi MPEG ............................................................................45
ix
Gambar 2.18 Gelombang elektromagnetik ..........................................................50 Gambar 2.19 Rangkaian / Sirkuit Osilasi LC .......................................................51 Gambar 3.1 Tampilan Skype ................................................................................55 Gambar 3.2 Tampilan Google Video Chat ...........................................................56 Gambar 3.3 Bagan Alur Penelitian Perbandingan Codec Video ..........................57 Gambar 4.1 Pengambilan Data Pada Perangkat Penguji PC ................................70 Gambar 4.2 Pengambilan Data Pada Perangkat Penguji Laptop .........................73 Gambar 4.3 Grafik Perbandingan Nilai MOS ......................................................76 Gambar 4.4 Grafik Perbandingan Nilai Konsumsi CPU ......................................77 Gambar 4.5 Grafik Perbandingan Nilai Konsumsi RAM ....................................78 Gambar 4.6 Grafik Perbandingan Nilai Konsumsi Bandwidth ............................79 Gambar 4.7 Grafik Perbandingan Nilai Penggunaan Daya ..................................80
x
DAFTAR TABEL
Tabel 2.1 Kompresi Suara .....................................................................................11 Tabel 2.2 Kompresi Bandwidth ...........................................................................13 Tabel 2.3 Standar untuk konversi analog-ke-digital dari sinyal audio .................24 Tabel 2.4 Distribusi frekuensi ACDABA .............................................................31 Tabel 3.1 Spesifikasi PC dan laptop yang digunakan ...........................................53 Tabel 3.2 Spesifikasi webcam yang digunakan ....................................................54 Tabel 3.3 Keterangan Nilai MOS ..........................................................................62 Tabel 4.1 Data Pengujian Pada PC........................................................................68 Tabel 4.2 Data Pengujian Pada Laptop .................................................................71 Tabel 4.3 Rata-rata Hasil Pengujian Kedua Codec ...............................................76
xi
BAB I PENDAHULUAN
Latar Belakang Perkembangan teknologi komunikasi membawa perubahan pada proses penyampaian informasi. Bentuk informasi yang disampaikan tidak hanya audio, tetapi
juga visual.
Konferensi
video
(video conference) menggunakan
telekomunikasi audio dan video untuk membawa orang-orang di berbagai tempat mengadakan rapat bersama. Sebuah konferensi video (juga dikenal sebagai videoteleconference) adalah satu set teknologi telekomunikasi interaktif yang memungkinkan dua lokasi atau lebih untuk berinteraksi melalui transmisi video dan audio dua arah secara bersamaan. Selain pengiriman audio dan visual kegiatan pertemuan, konferensi video dapat digunakan untuk berbagi dokumen, informasi yang diperlihatkan komputer, dan papan tulis. Sistem konferensi video biasanya terdiri dari dua sistem sirkuit televisi tertutup yang terhubung melalui kabel. Contohnya adalah pada jaringan German Reich Postzentralamt (Kantor Pos) yang didirikan di kota Berlin dan di beberapa kota lainnya dari tahun 1936 ke tahun 1940. Dari masa itu hingga tahun 70-an, perkembangan teknologi konferensi video masih belum bisa menjadi pilihan utama bagi masyarakat luas karena biaya operasional-nya yang sangat tinggi karena belum ditemukan teknologi kompresi video untuk menghemat biaya operasional. Baru pada tahun 80-an, teknologi telepon digital yang menggunakan teknik kompresi menjadi mungkin.
1
Akhirnya, pada 1990-an, konferensi video berbasis Internet Protocol atau IP menjadi mungkin dan teknologi kompresi video yang lebih efisien telah dikembangkan sehingga memungkinkan desktop atau komputer pribadi yang berbasis konferensi video. Mulai tahun 2000-an, telekonferensi video sudah hadir ke tengah-tengah masyarakat luas dalam bentuk layanan gratis, web plugin dan perangkat lunak, seperti Skype, Google Chat, NetMeeting, MSN Messenger, Yahoo Messenger, SightSpeed, dan lain-lain, secara virtual bisa menghubungkan semua tempat yang memiliki koneksi internet, dengan biaya yang murah bahkan gratis, meskipun berkualitas rendah. Teknologi kompresi yang digunakan dalam konferensi video ini adalah codec. Codec merupakan kependekan kata dari compressor-decompressor atau lebih umum sebagai coder-decoder. Fungsi codec di sini adalah menyandi ulang sinyal audio dan video yang ditransmisikan agar ukurannya menjadi lebih kecil sehingga dapat lebih menghemat bandwidth dan kerja prosesor serta perangkat keras lainnya. Dengan begitu, teknologi konferensi video dapat dinikmati juga dengan biaya yang murah tanpa harus memiliki koneksi internet yang super cepat dan spesifikasi komputer yang tinggi. Oleh karenanya, menjadi sangat menarik untuk dilakukan penelitian tentang kualitas dan efisiensi kerja codec H.264 dan VP7. Dalam penelitian ini, codec video yang akan dibahas adalah codec H.264, sebuah video codec yang dikembangkan oleh Joint Video Team (JVT), sebuah tim yang terdiri dari para pengembang codec video, yaitu Video Coding Experts Group (VCEG), pengembang codec H.261 dan H.263, dengan Moving Picture
2
Experts Group (MPEG), pengembang codec MPEG, termasuk juga MP3. Codec H.264 sendiri sudah sudah menjadi standar internasional dan digunakan pada BluRay Disc, IPod Video, Youtube, Google Video Chat, dll. Untuk mengetahui kinerja codec H.264 ini dalam konferensi video, digunakan layanan Google Video Chat yang sudah menggunakan codec H.264. Google Video Chat sendiri merupakan sebuah layanan chatting yang terintegrasi dalam layanan Google Mail (Gmail). Untuk menggunakan layanan chat ini, para penggunanya hanya perlu menginstall sebuah plugin tambahan untuk web-browser tanpa perlu menginstall software lainnya. Sebagai
pembanding,
digunakan
codec
TrueMotion
VP7
yang
dikembangkan oleh On2 Technologies yang merupakan anak perusahaan dari Google. On2 mengklaim bahwa codec VP7 ini dapat melakukan kompresi yang lebih baik dari codec H.264. On2 sendiri sebelumnya telah mengembangkan beberapa codec, antara lain ; VP3, VP5, dan TrueMotion VP6. Untuk mengetahui kinerja codec VP7 ini, digunakan software Skype, sebuah software yang memungkinkan para penggunanya untuk melakukan panggilan suara (voice call) dan panggilan video (video call). Skype sudah menggunakan codec VP7 untuk layanan video call-nya sejak tahun 2005. Komponen perangkat keras (hardware) yang digunakan berupa sebuah PC dengan spesifikasi standar komputer personal yang terkoneksi ke internet yang dilengkapi dengan komponen-komponen yang dibutuhkan untuk melakukan layanan konferensi video, yaitu sebuah webcam sebagai video input, sebuah layar
3
monitor sebagai video output, sebuah mikropon sebagai audio input, dan sebuah speaker sebagai audio output.
Tujuan Penelitian Penulisan penelitian ini bertujuan sebagai sebagai berikut : 1. Membandingkan dua codec video yang cukup popular digunakan, yaitu H.264 dan VP7 berdasarkan kualitas dan efisiensi kompresi. 2. Melakukan perbandingan antara dua layanan video chatting, yaitu Skype yang menggunakan codec video VP7 dan Google Video Chat yang menggunakan codec video H.264 agar dapat menentukan layanan mana yang lebih murah dan hemat.
Pembatasan Masalah Untuk lebih mengarahkan isi dan penulisan penelitian mengenai perbandingan codec H.264 dengan VP7 pada layanan video chatting Skype dan Google Video Chat, dibuat batasan-batasan masalah, antara lain: 1. Hanya membandingkan codec video H.264/ dengan VP7 pada layanan video chatting Skype dan Google Video Chat. 2. Tidak membandingkan codec audio dari kedua layanan tersebut. 3. Hanya membandingkan kedua codec tersebut dalam hal kualitas dan efisiensi kerja codec dalam memproses sinyal video digital untuk menentukan layanan konferensi video yang lebih murah.
4
4. Melakukan perbandingan kualitas dan efisiensi kerja codec dengan software Fraps untuk mengukur frame rate video, Net Meter untuk mengukur besar bandwidth yang terpakai, dan Windows Task Manager untuk mengukur besar konsumsi CPU dan RAM.
Manfaat Penelitian Jika tujuan penelitian ini dapat tercapai, maka penelitian ini dapat memberikan manfaat sebagai berikut:
Mengetahui codec mana yang lebih baik antara codec H.264 dan VP7, dalam hal kualitas dan efisiensi kerja.
Memberikan solusi konferensi video yang lebih hemat bandwidth dan resource pada computer. Sehingga dapat lebih dimanfaatkan oleh konsumen yang tidak memiliki koneksi internet yang cepat dan spesifikasi yang tinggi.
Sistematika Penulisan Penelitian ini terdiri dari lima bab dengan rincian sebagai berikut : BAB I : Pendahuluan Merupakan inti penelitian ini yang berisikan latar belakang masalah, tujuan penelitian, batasan masalah, metodelogi penelitian dan sistematika penulisan.
5
BAB II : Landasan Teori Menjelaskan dasar teori dan teori pendukung yang berhubungan dengan teknologi konferensi video, codec H.264, codec VP7, layanan Google Video Chat dan Skype, serta pengukuran kualitas, efektifitas, dan efisiensi codec video tersebut.
BAB III : Metode Penelitian Berisi tentang waktu dan tempat penelitian, perangkat keras dan perangkat lunak yang digunakan, tahapan penelitian codec video, dan pengolahan data.
BAB IV : Hasil dan Pembahasan Berisi tentang hasil pengamatan dan pembahasan data hasil pengamatan..
BAB V : Kesimpulan dan Saran Bab in berisi tentang kesimpulan yang diperoleh dari penelitian dan saran penulis untuk pengembangan penelitian lebih lanjut.
6
BAB II LANDASAN TEORI
2.1
Pengertian Video Digital Video digital adalah jenis sistem perekam video yang bekerja
menggunakan sistem digital dibandingkan dengan analog dalam hal representasi videonya. Biasanya video digital direkam dalam tape, kemudian didistribusikan melalui optical disc, misalnya VCD dan DVD. Salah satu alat yang dapat digunakan untuk menghasilkan video digital adalah camcorder, yang digunakan untuk merekam gambar-gambar video dan audio. Biasanya sebuah camcorder akan terdiri dari camera dan recorder. Sebuah video terdiri dari beberapa element seperti frame rate, aspect ratio, resolusi spasial, level bit, dan laju bit. 2.1.1
Frame rate Ketika serangkaian gambar mati yang bersambung dimainkan dengan
cepat dan dilihat oleh mata manusia, maka gambar-gambar tersebut akan terlihat seperti sebuah pergerakan yang halus. Jumlah gambar yang terlihat setiap detik disebut dengan frame rate. Diperlukan frame rate minimal sebesar 10 fps (frame per second) untuk menghasilkan pergerakan gambar yang halus. Film-film yang dilihat di gedung bioskop adalah film yang diproyeksikan dengan frame rate sebesar 24 fps, sedangkan video yang dilihat pada televisi memiliki frame rate sebesar 30 fps (tepatnya 29.97 fps). Frame rate digunakan sebagai format standar NTSC, PAL dan SECAM yang berlaku pada negara-negara didunia.
7
2.1.2
Aspect Ratio Pixel aspect ratio menjelaskan tentang ratio atau perbandingan antara
lebar dengan tinggi dari sebuah piksel dalam sebuah gambar. Frame aspect ratio menggambarkan perbandingan lebar dengan tinggi pada dimensi frame dari sebuah gambar. Sebagai contoh, D1 NTSC memiliki pixel aspect ratio 0.9 (0.9 lebar dari 1 unit tinggi) dan memiliki pula pixel aspect ratio 4:3 (4 unit lebar dari 3 unit tinggi). Beberapa format video menggunakan frame aspect ratio yang sama tetapi memakai pixel aspect ratio yang berbeda. Sebagai contoh, beberapa format NTSC digital menghasilkan sebuah 4:3 frame aspect ratio dengan square pixel (1.0 pixel aspect ratio) dan dengan resolusi 640 x 480. sedangkan D1 NTSC menghasilkan frame aspect ratio yang sama yaitu 4:3 tetapi menggunakan rectangular pixel (0.9 pixel aspect ratio) dengan resolusi 720 x 486. Piksel yang dihasilkan oleh format D1 akan selalu bersifat rectangular atau bidang persegi, akan berorientasi vertikal dalam format NTSC dan akan berorientasi horisontal dalam format PAL. Jika menampilkan rectangular pixel dalam sebuah monitor square pixel tanpa alterasi maka gambar yang bergerak akan berubah bentuk atau mengalami distorsi. Contohnya lingkaran akan berubah menjadi oval. Tetapi bagaimanapun juga apabila ditampilkan pada monitor broadcast, gambar gerak akan ditampilkan secara benar.
8
2.1.3
Resolusi Spasial dan Frame Size Lebar dan tinggi frame video disebut dengan frame size, yang
menggunakan satuan piksel, misalnya video dengan ukuran frame 640×480 piksel. Dalam dunia video digital, frame size disebut juga dengan resolusi. Semakin tinggi resolusi gambar maka semakin besar pula informasi yang dimuat, berarti akan semakin besar pula kebutuhan memory untuk membaca informasi tersebut. Misalnya untuk format PAL D1/DV berukuran 720×576 piksel, format NTSC DV 720×480 piksel dan format PAL VCD/VHS (MPEG-1) berukuran 352×288 piksel sedangkan format NTSC VCD berukuran 320×240 piksel. 2.1.4
Level Bit Dalam dunia komputer, satuan bit merupakan unit terkecil dalam
penyimpanan informasi. Level bit atau bit depth menyatakan jumlah atau banyaknya bit yang disimpan untuk mendeskripsikan warna suatu piksel. Sebuah gambar yang memiliki 8 bit per piksel dapat menampilkan 256 warna, sedangkan gambar dengan 24 bit dapat menampilkan warna sebanyak 16 juta warna. Komputer (PC) menggunakan 24 bit RGB sedang sinyal video menggunakan standar 16 bit YUV sehingga memiliki jangkauan warna yang terbatas. Untuk itu perlu berhati-hati apabila membuat video untuk ditayangkan di TV, karena tampilan warna di layar monitor PC berbeda dengan tampilan di layar TV. Penentuan bit depth ini tergantung pada sudut pemisah antara gambar yang diterima oleh kedua mata. Sebagai contoh, pada layar datar, persepsi kedalaman suatu benda berdasarkan subyek benda yang tampak.
9
2.1.5
Laju Bit (Bit Rate) Laju bit disebut juga dengan nama laju data. Laju bit menentukan jumlah
data yang ditampilkan saat video dimainkan. Laju data ini dinyatakan dalam satuan bps (bit per second). Laju data berkaitan erat dengan pemakaian dan pemilihan codec (metode kompresi video). Beberapa codec menghendaki laju data tertentu, misalnya MPEG-2 yang digunakan dalam format DVD dapat menggunakan laju bit maksimum 9800 kbps atau 9,8 Mbps, sedangkan format VCD hanya mampu menggunakan laju bit 1,15 Mbps.
2.2
Konsep Dasar Video Conference Dalam perencanaan untuk mengimplementasikan video conference pada
Local Area Network (LAN),
perlu memperhitungkan kebutuhan bandwidth,
karena saat pengiriman video estimasi alokasi bandwidth menjadi sangat penting karena akan memakan sebagian besar bandwidth komunikasi yang ada. Sehingga teknik-teknik untuk melakukan kompresi data menjadi sangat strategis untuk memungkinkan penghematan bandwidth komunikasi. Sebagai gambaran sebuah kanal gambar (video) yang baik tanpa di kompresi akan mengambil bandwidth sekitar 9Mbps, sedangkan sebuah kanal suara (audio) yang baik tanpa di kompresi akan mengambil bandwidth sekitar 64Kbps. Dari gambaran diatas dapat diasumsikan bahwa kebutuhan minimal bandwidth yang dibutuhkan untuk mengirimkan gambar dan suara adalah sebesar 9,064 Mbps, memang akan membutuhkan bandwidth yang sangat lebar. Namun dengan teknik kompresi yang ada, sebuah kanal suara dan gambar sebelum
10
dilewatkan dalam jaringan TCP/IP akan terlebih dahulu melalui proses kompresi sehingga dapat menghemat sebuah kanal video menjadi sekitar 30Kbps dan kanal suara menjadi 6Kbps (half-duplex), artinya sebuah saluran Local Area Network (LAN) yang memiliki bandwidth sebesar 10/100 Mbps sebetulnya dapat digunakan untuk menyalurkan video dan audio sekaligus. Tentunya untuk kebutuhkan konferensi yang multiuser akan dibutuhkan multi bandwidth pula, artinya minimal sekali kita harus menggunakan kanal 32-36Kbps dikalikan dengan berapa user konferensi dilakukan dalam jaringan.
2.2.1
Kompresi Suara Pada tabel terlampir daftar beberapa teknik kompresi suara yang sering
digunakan dengan beberapa parameter yang mencerminkan kinerja dari teknik kompresi suara tersebut. Tabel 2.1 Kompresi Suara1 Kompresi
1
Kbps
MIPS
ms
MOS
G.711PCM
64
0.34
0.125
4.1
G.726 ADPCM
32
14
0.125
3.85
G.728 LD-CELP
16
33
0.625
3.61
G.729 CS-ACELP
8
20
10
3.92
G.729 x2 Encoding
8
20
10
3.27
G.729 x3 Encoding
8
20
10
2.68
Standart G*, http://www.itu.int/ITU-T/publications
11
G.729a CS-ACELP
8
10.5
10
3.7
G.723.1 MPMLQ
6.3
16
30
3.9
G.723.1 ACELP
5.3
16
30
3.65
Kolom Kbps memperlihatkan berapa lebar bandwidth yang di ambil untuk mengirimkan suara yang di kompres menggunakan teknik kompresi tertentu. MIPS (Mega Instruction Per Second) memperlihatkan berapa kebutuhan waktu pemrosesan data pada saat melakukan kompresi suara dalam juta instruksi per detik. Mili-detik (ms) adalah waktu yang dibutuhkan untuk melakukan kompresi. Mean Opinion Score (MOS) adalah nilai opini pendengar di penerima. Pada saat manusia berkomunikasi & berkonferensi menggunakan MS NetMeeting biasanya G.729 atau G.723.1 akan digunakan untuk mengkompres suara agar menghemat bandwidth saluran komunikasi pada jaringan.
Kompresi Video Pada teknik kompresi video ada dua buah standar yang umum digunakan, dalam pengiriman video melalui saluran komunikasi yang sempit, yaitu:
H.261 – biasanya menggunakan kanal ISDN dengan kecepatan p x 64Kbps, dimana p adalah 1, 2, 3, …, 30.
H.263 – di arahkan untuk mengirimkan gambar video berkecepatan rendah mulai dari 20-30Kbps ke atas.
12
Pada saat ini standar H.263 merupakan standar kompresi video yang sering digunakan dalam konferensi video melalui jaringan. Beberapa hal yang perlu di perhatikan adalah:
Jika menggunakan video hitam-putih, maka akan memakan bandwidth lebih kecil daripada jika melakukan konferensi menggunakan video berwarna.
Jika menggunakan kecepatan pengiriman frame per second (fps) video yang
rendah,
maka
akan
memakan
bandwith
yang
rendah
dibandingkan frame per second (fps) yang tinggi.
Video yang cukup baik biasanya dikirim dengan kecepatan frame per second (fps) sekitar 30 fps. Jika dikirimkan tanpa kompresi, sebuah video dengan 30 fps akan mengambil bandwidth kira-kira 9Mbps, amat sangat besar untuk ukuran kanal komunikasi data. Untuk memberikan gambaran bagaimana upaya untuk penghematan bandwidth dan rasio kompresi yang dibutuhkan, dapat dilihat pada tabel 2.2 berikut ini
Tabel 2.2 Kompresi Bandwidth2 Keterangan Orisinil, 30 fps 10fps, 20Kbps 10fps, 50Kbps
2
Rata-rata PSNR (dB) 38.51 41.75
Bitrate (Kbit/s) 9124 22.81 56.70
Rasio Kompresi 1:1 133:1 54:1
Bandwidth Video, http://www.4i2i.com/h263_video_codec.htm
13
10fps, 100Kbps 10fps, 500Kbps
43.98 48.38
112.09 505.61
27.1 6:1
Terlihat pada tabel, sebuah pengiriman video yang asli (tidak di kompres) dengan kecepatan 30 fps akan memakan bandwidth 9Mbps. Dalam pengiriman video untuk konferensi video melalui LAN, biasanya dikurangi jumlah frame yang dikirim, misalnya menjadi 10 fps. Beberapa teknik kompresi digunakan mulai dari yang paling kecil hasilnya yaitu 133:1 sampai dengan yang akan membutuhkan banyak bandwidth (500Kbps) dengan rasio kompresi 6:1. Terlihat bahwa video 10 fps hasil kompresi 133:1 dapat dikirimkan dalam kanal 23Kbps dengan rata-rata Signal To Noise Ratio 38.51dB, Tentunya jika ingin memperoleh kualitas yang lebih baik, PSNR yang lebih baik, kompresi dapat dikurangi hingga rasio 6:1 atau lebih rendah lagi.
2.3
Coding dan Decoding Salah satu kompenen yang terpenting dalam video conference adalah
peralatan codec (coder dan decoder), codec menggunakan teknik penyamplingan sinyal analog untuk dirubah menjadi sinyal digital lalu mereduksi lebar pita sinyal sesuai dengan kebutuhan. Algoritma sebagai proses pengkodean sinyal-sinyal informasi sehingga lebar pita sinyal tersebut dapat direduksi, dipakai pada alat codec ini untuk pengkompresan data yang telah didapat dari hasil sampling. Peranan encoding adalah mendefinisikan dan memanipulasi karakteristik sinyal
14
untuk merepresentasikan informasi. Decoding digunakan oleh penerima sinyal untuk mengembalikan pola-pola sinyal tersebut menjadi data aslinya. Codec (codec-decoder) melakukan encoding dan decoding. Sinyal-sinyal analog di-dijitalisasi_kan oleh codec. Piranti codec ini akan mengambil sampelsampel dari sinyal analog sebanyak 8000 kali per detik untuk menghasilkan sebuah bilangan 7 atau 8 bit. Apabila sampling yang digunakan dilakukan dengan laju yang lebih rendah, data akan hilang sedangkan apabila laju sampling-nya lebih tinggi tidak akan ada informasi tambahan apapun yang dapat diperoleh dari sinyal
analog.
Gagasan
dasar
teknik
digitasi
(digitalization)
adalah
membandingkan amplitudo sebuah sinyal analog dengan seperangkat nilai ambang yang disebut level kuantisasi. Jarak antara satu level kuantisasi ke level kuantisasi berikutnya ditetapkan secara logaritmik, karena hal ini akan menghasilkan resolusi yang lebih baik untuk sinyal-sinyal yang berdaya rendah. Representasi digital dari amplitudo sebuah sinyal analog adalah bilangan kuantisasi terdekat dengan sampel amplitudo tersebut. Sebanyak 8000 sampel amplitudo dalam setiap detik dibandingkan terhadap 256 nilai level kuantisasi yang berbeda untuk menghasilkan bilangan – bilangan digital sebanyak 8-bit. Skema ini menghasilkan bandwidth standar sebesar 64 kbps , untuk satu kanal suara. 2.3.1
Pencuplikan (sampling) adalah proses pengambilan sampel sinyal suara (tegangannya) pada
interval waktu yang
tetap. Sampling merupakan komponen penting dalam
komunikasi suara. Dimana sinyal analog diubah menjadi sinyal diskrit. Secara
15
matematis, proses sampling (pencuplikan) dapat didefinisikan sebagai hasil perkalian dari sebuah barisan gelombang berkala tak terbatas pada amplitudo 1 (dengan periode sesuai dengan periode sampling) oleh sinyal waktu kontinyu asli untuk dicuplik. Ini mengarah pada representasi waktu diskrit PAM (gelombang modulasi amplitudo) dari sinyal tersebut (Gambar 2.1).
A
t
A
t
Gambar 2.1 Sinyal analog sebelum dan sesudah dicuplik
Dari sinyal PAM, adalah mungkin untuk memperbarui suatu sinyal kontinyu. Ini diperlukan setiap kali hasil algoritma pengolahan sinyal perlu diputar ulang. Misalnya, sebuah konverter diskrit-ke-kontinu (D/C) sederhana bisa menghasilkan bukit linier yang menghubungkan setiap nilai gelombang, kemudian menyaring frekuensi tinggi yang dihasilkan oleh diskontinuitas.
16
Proses konversi analog ke digital kehilangan beberapa informasi yang terkandung dalam sinyal asli yang tidak pernah dapat dipulihkan (ini terlihat jelas pada Gambar 2.2). Hal ini sangat penting untuk memilih kecepatan sampel dan skala kuantisasi dengan benar dan tepat, karena hal ini secara langsung mempengaruhi kualitas output dari algoritma pemrosesan sinyal [A2, B1, B2].
Gambar 2.2 Rekonstruksi sinyal kontinyu dari sinyal diskrit Teorema sampling menyatakan bahwa untuk proses sinyal waktu kontinyu dengan komponen frekuensi terdiri antara 0 dan Fmax, laju sampling harus minimal 2 * Fmax . Secara intuitif, dapat dipahami dengan melihat kuantisasi dari sebuah sinusoid murni. Dalam Gambar 2.3 sinyal asli frekuensi 1,1 dicuplik pada frekuensi 1. Sinyal PAM yang dihasilkan identik dengan hasil sampling pada frekuensi 1 dari sinyal pada frekuensi 0,1. Hal ini disebut sebagai fenomena aliasing. Pada kenyataannya jika T adalah periode sampling (frekuensi radial Ωr=2π/T ): • Semua sinusoid dari frekuensi ωr + mΩr akan mempunyai representasi PAM yang sama dari frekuensi sinusoida ωr, karena cos( (ωr + m(2π/T) ) t ) dicuplik sebagai cos( (ωr + m(2π/T ) kT ) = cos(ωr kT + mk2π) = cos(ωr kT )
17
• Sinusoid dari frekuensi Ωr/2 + ωr dan Ωr/2 − ωr mempunyai representasi PAM yang sama karena: cos((Ωr /2 ± ωr )kT ) = cos(πk ± ωr kT )
(1)
= cos(πk) cos(ωr kT ) ∓ sin(πk) sin(ωr kT ) = cos(πk) cos(ωr kT ) Hal ini diilustrasikan pada Gambar 2.4 Kesimpulannya adalah bahwa ada pemetaan satu-ke-satu (1-to-1) antara sebuah sinusoida dan representasi PAM-nya yang diambil pada frekuensi Ω hanya jika sinusoid dibatasi pada jangkauan [0, Ω/2].
Gambar 2.3 Aliasing frekuensi 1.1, dicuplik pada frekuensi 1, di-wrap pada frekuensi 0,1.
18
Gambar 2.4 Berbagai jenis aliasing frekuensi
Ini juga berlaku untuk semua sinyal yang terdiri dari sinusoid campuran. Sinyal seharusnya tidak memiliki komponen frekuensi di luar rentang [0,Ω/2]. Hal ini dikenal sebagai teorema Nyquist, dan Ω = 2ω disebut tingkat Nyquist (laju sampling minimal yang diperlukan untuk sinyal dengan komponen frekuensi dalam rentang [0, ω]). Teorema Nyquist (atau Shannon) juga membuktikan bahwa adalah mungkin untuk memulihkan kembali sinyal kontinyu asli dengan tepat dari representasi PAM, jika sampling rate berada pada atau diatas tingkat Nyquist. Dapat ditunjukkan bahwa spektrum frekuensi (transformasi Fourier) dari sinyal PAM dengan frekuensi sampling Fs sama dengan spektrum frekuensi dari sinyal asli, diulang secara berkala dengan periode Fs. Spektrum sinyal fisik nyata (seperti sinyal listrik yang dihasilkan oleh mikrofon) tidak memiliki batas frekuensi yang didefinisikan dengan baik. Oleh karena itu, sebelum proses pengambilan sampel, perlu dilakukan pemotongan setiap komponen frekuensi di luar frekuensi Nyquist dengan menggunakan analog
19
„anti-aliasing‟ filter. Untuk menghindari komponen diskrit ini (tidak jelas untuk memperkirakan low-pass filter yang ideal dengan teknologi analog), konverter analog-ke-dijital pembentuk-derau oversampled yang modern (juga disebut coders sigma delta) menggunakan frekuensi sampling yang sangat tinggi (sinyal input seharusnya tidak memiliki komponen dengan frekuensi yang sangat tinggi) tetapi seharusnya filter yang menerapkan penipisan digital (subsampling) secara internal-lah yang melakukan tugas anti-aliasing sebelum sampling rate berkurang. Nilai frekuensi sampling tidak hanya menentukan lebar-pita sinyal yang ditransmisikan tetapi juga berdampak pada jumlah informasi yang akan dikirim: misalnya, pita-lebar, sinyal audio berkualitas tinggi harus dicuplik pada frekuensi tinggi, tapi ini menghasilkan jauh lebih banyak informasi dari frekuensi sampling 8.000 Hz yang biasa digunakan dalam jaringan telepon.
2.3.2
Kuantisasi Dengan dibahasnya proses sampling dalam paragraf sebelumnya, masih
belum masuk ke dalam dunia digital. Sinyal PAM pada dasarnya adalah sebuah sinyal analog karena amplitudo dari setiap gelombang masih bernilai kontinyu yang tidak dicoba untuk ukur dengan angka. Nyatanya hanya kehilangan sebagian informasi sejauh ini (bagian dari sinyal yang dicuplik di atas satu-setengah dari frekuensi sampling). Akan kehilangan lebih banyak informasi ketika akan diukur amplitudo dari masing-masing gelombang.
20
Jika dibayangkan bahwa aturan lipat digunakan untuk mengukur amplitudo sinyal PAM. Tergantung dari kelulusan atau ketepatan skala, angka yang mewakili sinyal PAM bisa lebih atau kurang tepat.,tapi tidak akan pernah tepat. Sinyal PAM dapat diwakili oleh sinyal digital dengan pulsa yang sesuai dengan nilai yang terukur, ditambah sinyal PAM dengan pulsa yang merupakan kesalahan dari proses kuantisasi. Pengkodean sinyal di mana setiap sampel analog dari sinyal PAM dikodekan dalam sebuah kata kode biner disebut representasi PCM (modulasi kode pulsa) dari sinyal. Konversi analog-ke-digital disebut kuantisasi. Dengan proses kuantisasi yang lebih tepat, kita meminimalkan amplitudo derau, tetapi kita tidak dapat menghindari masuknya beberapa kebisingan dalam proses kuantisasi (derau kuantisasi). Setelah noise kuantisasi masuk dalam sebuah percakapan atau rantai transmisi audio, kualitas-nya tidak bisa lagi ditingkatkan dengan cara apapun. Ini memiliki konsekuensi penting: misalnya, adalah suatu hal yang mustahil untuk merancang penghilang-gema digital yang bekerja pada sebuah sinyal PCM dengan rasio sinyal-ke-gema di atas rasio sinyal-ke-derau sinyal PCM.Oleh karena ada 2 sumber informasi yang hilang ketika inisiasi sinyal untuk proses digital, yaitu: Hilangnya komponen frekuensi tinggi. Derau kuantisasi. Keduanya harus diseimbangkan dengan baik dalam converter analog-kedigital (A/D) karena keduanya mempengaruhi jumlah informasi yang dihasilkan.
21
Jika kuantisasi seragam diterapkan („seragam‟ maksudnya skala dari „aturan lipat‟ adalah linier) daya dari derau kuantisasi dapat diperoleh dengan mudah. Semua ukuran langkah dari pengkuantisasi memiliki lebar D sama. Untuk pengkuantisasi seragam yang menggunakan bit N (N secara umum merupakan daya dari 2) rasio signal-to-noise dapat dicapai dalam decibel, diberikan oleh: S N R(d B) =6.02N −1.73
(2)
Sebagai contoh, pemutar CD menggunakan pengkuantisasi linier 16-bit dan SNR maksimum yang dicapai adalah 94.6 dB. Bentuk yang mengesankan ini menyembunyikan beberapa masalah: nilai maksimum yang diperoleh untuk sebuah sinyal memiliki amplitudo maksimum (misalnya, sebuah sinusoida mulai dari -32.768 ke +32.767). Nyatanya, SNR berbanding lurus dengan daya sinyal itu: kurva yang mewakili SNR terhadap daya input sinyal adalah sebuah garis lurus. Jika input dikurangi dengan 10 dB, SNR juga dikurangi dengan 10 dB. Karena masalah ini, industri telekomunikasi pada umumnya menggunakan pengkuantisasi dengan rasio SNR konstan, terlepas dari kekuatan sinyal input. Ini membutuhkan pengkuantisasi nonlinier (Gambar 2.5). Seperti yang telah diutarakan sebelumnya, frekuensi sampling dan jumlah bit yang digunakan dalam proses kuantisasi, berpengaruh. Baik pada kualitas sinyal digital dan laju informasi yang dihasilkan: beberapa kompromi perlu dibuat. Tabel 2.1 [A2] memberikan gambaran set parameter yang paling umum untuk transmisi suara dan sinyal audio (diasumsikan pengkuantisasi linear).
22
Bahkan percakapan telepon yang relatif berkualitas rendah menghasilkan bitrate sekitar 100 kbit/s setelah konversi A/D. Hal ini menjelaskan, mengapa begitu banyak pekerjaan yang telah dilakukan untuk mengurangi bitrate ini sambil menjaga kualitas asli dari sinyal digital. Bahkan skema pengkodeaan A-law atau μ-law PCM G.711 pada 64 kbit/s yang terkenal dan telah digunakan di seluruh dunia di semua mesin pengubah-digital dan dalam banyak sistem transmisi digital, dapat dilihat sebagai pengkode suara.
Gambar 2.5 Contoh dari sebuah pengkuantisasi linier. Setiap nilai milik [xi−qi/2,xi+qi/2] terkuantisasi dan diubah dalam xi. Nilai derau berkisar pada [−qi/2, +qi/2]
23
Tabel 2.3 Standar untuk konversi analog-ke-dijital dari sinyal audio
2.4
Kompresi Data Kompresi data dilakukan untuk mereduksi ukuran data atau file. Dengan
melakukan kompresi atau pemadatan data maka ukuran file atau data akan lebih kecil sehingga dapat mengurangi waktu transmisi sewaktu data dikirim dan tidak banyak banyak menghabiskan ruang media penyimpan. 2.4.1
Teori Kompresi Data Dalam makalahnya di tahun 1948, “A Mathematical Theory of
Communication”, Claude E. Shannon merumuskan teori kompresi data. Shannon membuktikan adanya batas dasar (fundamental limit) pada kompresi data jenis lossless. Batas ini, disebut dengan entropy rate dan dinyatakan dengan simbol H. Nilai eksak dari H bergantung pada informasi data sumber, lebih terperinci lagi, tergantung pada statistikal alami dari data sumber. Adalah mungkin untuk mengkompresi data sumber dalam suatu bentuk lossless, dengan laju kompresi
24
(compression rate) mendekati H. Perhitungan secara matematis memungkinkan ini dilakukan lebih baik dari nilai H. Shannon juga mengembangkan teori mengenai kompresi data lossy. Ini lebih dikenal sebagai rate-distortion theory. Pada kompresi data lossy, proses dekompresi data tidak menghasilkan data yang sama persis dengan data aslinya. Selain itu, jumlah distorsi atau nilai D dapat ditoleransi. Shannon menunjukkan bahwa, untuk data sumber (dengan semua properti statistikal yang diketahui) dengan memberikan pengukuran distorsi, terdapat sebuah fungsi R(D) yang disebut dengan rate-distortion function. Pada teori ini dikemukakan jika D bersifat toleransi terhadap jumlah distorsi, maka R(D) adalah kemungkinan terbaik dari laju kompresi. Ketika kompresi lossless (berarti tidak terdapat distorsi atau D = 0), kemungkinan laju kompresi terbaik adalah R(0) = H (untuk sumber alphabet yang terbatas). Dengan kata lain, laju kompresi terbaik yang mungkin adalah entropy rate. Dalam pengertian ini, teori rate-distortion adalah suatu penyamarataan dari teori kompresi data lossless, dimana dimulai dari tidak ada distorsi (D = 0) hingga terdapat beberapa distorsi (D > 0). Teori kompresi data lossless dan teori rate-distortion dikenal secara kolektif sebagai teori pengkodean sumber (source coding theory). Teori pengkodean sumber menyatakan batas fundamental pada unjuk kerja dari seluruh algoritma kompresi data. Teori tersebut sendiri tidak dinyatakan secara tepat bagaimana merancang dan mengimplementasikan algoritma tersebut. Bagaimana pun juga algoritma tersebut menyediakan beberapa petunjuk dan panduan untuk
25
memperoleh unjuk kerja yang optimal. Dalam bagian ini, akan dijelaskan bagaimana Shannon membuat model dari sumber informasi dalam istilah yang disebut dengan proses acak (random process).
Di bagian selanjutnya akan
dijelaskan mengenai teorema pengkodean sumber lossless Shannon, dan teori Shannon mengenai rate-distortion. Latar belakang mengenai teori probabilitas diperlukan untuk menjelaskan teori tersebut.
2.4.2
Pemodelan Sumber (Source Modeling) Bayangkan bila kita pergi ke perpustakaan dimana perpustakaan tersebut
mempunyai pilihan buku-buku yang banyak, katakanlah terdapat 100 juta buku dalam perpustakaan tersebut. Tiap buku dalam perpustakaan ini sangat tebal, sebagai contoh tiap buku mempunyai 100 juta karakter (atau huruf). Ketika anda pergi ke perpustakaan tersebut, mengambil sebuah buku secara acak dan meminjamnya. Buku yang dipilih tersebut merupakan informasi sumber yang akan dikompresi. Buku yang terkompresi tersebut disimpan pada zip disk untuk dibawa pulang, atau ditransmisi secara langsung melalui internet ke rumah anda ataupun bagaimana kasusnya. Secara matematis buku yang dipilih tersebut didenotasikan sebagai:
X = (X1, X2, X3, X4, …)
Dimana X merepresentasikan seluruh buku, dan X1 merepresentasikan karakter pertama dari buku tersebut, X2 merepresentasikan karakter kedua, dan 26
seterusnya. Meskipun pada kenyataannya panjang karakter dalam buku tersebut terbatas, secara matematis diasumsikan mempunyai panjang karakter yang tidak terbatas. Alasannya adalah buku tersebut terlalu tebal dan dapat dibayangkan jumlah karakternya terlalu banyak. Untuk menyederhanakan hal tersebut, misalkan diasumsi semua karakter dalam buku tersebut terdiri atas huruf kecil („a‟ hingga „z‟) atau SPACE. Sumber alphabet misalkan A didefinisikan merupakan kumpulan dari 27 kemungkinan nilai dari tiap karakter:
Sekarang jika seorang yang ingin merancang suatu algoritma kompresi maka sangat sulit baginya untuk mengetahui buku yang mana yang akan dipilih. Orang tersebut hanya mengetahui bahwa seseorang akan memilih sebuah buku dari perpustakaan tersebut. Dengan cara pandangnya, karakter-karakter dalam buku merupakan (Xi, i = 1, 2 , …) merupakan variabel acak yang diambil dari nilai alphabet A. Keseluruhan buku, X merupakan urutan tak berhingga dari variabel acak, makanya X merupakan suatu proses acak. Ada beberapa cara untuk menyatakan model statistik dari buku tersebut:
A.
Zero-Order Model. Tiap karakter distatistik secara bebas dari semua karakter dan 27 kemungkinan nilai dalam alphabet A dinyatakan sama seperti yang muncul. Jika model tersebut akurat, maka cara tipikal untuk membuka sebuah buku adalah seperti berikut ini (semua contoh berasal
27
dari paper Shannon “A Mathematical Theory of Communication“ di tahun 1948) xfoml rxkhrjffjuj zlpwcfwkcyj ffjeyvkcqsghyd qpaamkbzaacibzlhjqd
B.
First-Order Model. Dalam bahasa Inggris diketahui beberapa huruf muncul lebih sering dibandingkan huruf yang lain. sebagai contoh, huruf „a‟ dan „e‟ lebih umum daripada huruf „q‟ dan „z‟. Jadi dalam model ini karakter masih secara bebas terhadap satu sama lain, tetapi distribusi probabilitas dari karakter-karakter tersebut menurut distribusi statistikal urutan pertama dari teks bahasa Inggris. Teks yang secara tipikal dari model ini berbentuk seperti ini: ocroh hli rgwr nmielwis eu ll nbnesebya th eei alhenhttpa oobttva nah brl
C.
Second-Order Model. Dua model sebelumnya diasumsi menurut statistik secara bebas dari satu karakter hingga karakter berikutnya. Ini tidak begitu akurat dibandingkan dengan bahasa alami Inggris. Sebagai contoh, beberapa huruf dalam kalimat tersebut hilang. Bagaimanapun juga, kita masih
dapat menerka huruf-huruf tersebut
dengan mencarinya pada
konteks kalimat. Ini mengimplikasikan beberapa ketergantungan antara karakter-karakter. Secara alami, karakter yang saling berhubungan dekat lebih saling bergantung daripada karakter yang berhubungan jauh satu sama lainnya. Pada model ini, karakter yang ada Xi bergantung pada
28
karakter sebelumnya Xi−1, tetapi secara kondisional tidak bergantung dengan semua karakter (X1, X2, …, Xi−2). Menurut model ini, distribusi probabilitas dari karakter Xi beragram menurut karakter sebelumnya Xi−1. Sebagai contoh, huruf „u‟ jarang muncul (probabilitas = 0.022). Bagaimanapun juga, jika dinyatakan karakter sebelumnya adalah „q‟ maka probabilitas dari „u‟ dalam karakter berikutnya lebih tinggi (probabilitas = 0.995). Teks tipikal untuk model ini terlihat seperti berikut: on ie antsoutinys are t inctore st be s deamy achin d ilonasive tucoowe at teasonare fuso tizin andy tobe seace ctisbe D.
Third-Order Model. Ini merupakan pengembangan model sebelumnya. Berikut ini merupakan karakter Xi yang bergantung pada dua karakter sebelumnya (Xi−2, Xi−1) tetapi secara kondisional tidak bergantung pada semua karakter sebelumnya sebelum: (X1, X2,…, Xi−3). Pada model ini, distribusi dari Xi beragam menurut (Xi−2, Xi−1). Teks tipikal dari model ini seperti bentuk berikut ini: in no ist lat whey cratict froure birs grocid pondenome of demonstures of the reptagin is regoactiona of cre
Penyusunan kembali menjadi teks Inggris asli akan memudahkan tiap teks di atas dapat dibaca.
E.
General Model. Pada model ini, buku X
merupakan proses acak
seimbang yang berubah-ubah. Properti statistikal pada model seperti ini
29
terlalu kompleks untuk dipertimbangkan sebagai tujuan praktikal. Model ini disukai hanya dalam sudut pandang teoritikal saja.
Model A di atas merupakan kasus khusus dari model B. Model B merupakan kasus spesial dari Model C. Model C merupakan kasus spesial dari model D. Model D merupakan kasus spesial dari model E.
2.4.3
Jenis-Jenis Algoritma Kompresi Data Algoritma kompresi untuk jenis kompresi lossless (tanpa kehilangan data)
yang banyak digunakan diantaranya : Huffman, RLE, LZ77, LZ78 dan LZW. Sedangkan untuk jenis kompresi lossy (kehilangan beberapa bagian data), algoritma yang banyak digunakan antara lain: Differential Modulation, Adaptive Coding dan Discrete Cosine Transform (DCT).
2.4.4
Algoritma Kompresi Huffman Algoritma kompresi Huffman dinamakan sesuai dengan nama penemunya
yaitu David Huffman, seorang profesor di MIT (Massachusets Instuate of Technology). Kompresi Huffman merupakan algoritma kompresi lossless dan ideal untuk mengkompresi teks atau file program. Ini yang menyebabkan mengapa algoritma ini banyak dipakai dalam program kompresi. Kompresi Huffman termasuk dalam algoritma keluarga dengan variable codeword length. Ini berarti simbol individual (karakter dalam sebuah file teks sebagai contoh) digantikan oleh urutan bit yang mempunyai suatu panjang yang 30
nyata (distinct length). Jadi simbol yang muncul cukup banyak dalam file akan memberikan urutan yang pendek sementara simbol yang jarang dipakai akan mempunyai urutan bit yang lebih panjang.
Contoh praktis berikut ini menunjukkan cara kerja dari algoritma Huffman. Misalkan akan dikompresi potongan data seperti berikut ini: ACDABA
Distribusi frekuensi untuk karakter di atas seperti dalam tabel berikut ini:
Tabel 2.4 Distribusi frekuensi ACDABA Karakter
A B C D
Frekuensi 3
1
1
1
Selanjutnya dibentuk node seperti bentuk berikut ini berdasarkan frekuensi di atas, disusun mulai dari frekuensi terbesar hingga terkecil. Kemudian dibentuk pohon Huffman agar didapat kode simbol atau kode pengganti untuk karakterkarakter di atas.
A 3
B 1
C 1
D 1
Gambar 2.6 Distribusi pada Node 1
Kemudian diurutkan dari node dengan frekuensi terkecil hingga terbesar 31
B 1
C
D 1
1
A 3
Gambar 2.7 Distribusi pada Node 2
Selanjutnya dua buah node terkecil digabung membentuk satu node baru dimana frekuensinya merupakan penjumlahan dari keduanya. D 1
2 B 1
A 3
C 1
Gambar 2.8 Distribusi pada Node 3
Setelah itu diurutkan kembali berdasarkan frekuensi tiap node secara urutan menaik. D 1
A 3
2 B 1
C 1
Gambar 2.9 Distribusi pada Node 4 Kemudian dua buah node terkecil digabung menjadi satu kembali untuk membentuk node baru. A 3
3
D 1
2 B
C
1
1
Gambar 2.10 Distribusi pada Node 5 32
Setelah itu diurutkan kembali berdasarkan frekuensi tiap node secara urutan menaik. A 3
3
D 1
2 B
C
1
1
Gambar 2.11 Distribusi pada Node 6
Kemudian dua node terakhir ini digabung membentuk satu pohon tunggal yang disebut dengan pohon Huffman dengan node paling atas merupakan root.
6 A 3
3
D 1
2 B
C
1
1
Gambar 2.12 Distribusi pada Node 7
Langkah terakhir adalah memberikan label bit “0” untuk setiap sisi kiri dari pohon dan label bit “1” untuk setiap sisi kanan dari pohon.
33
6 0
1
A 3
3
0
1
D 1
2 0
1
B
C
1
1
Gambar 2.13 Distribusi pada Node 8
Karena potongan data tersebut terdiri atas 6 karakter, maka teks tersebut terdiri atas 6 byte atau 48 bit. Dengan Huffman encoding, akan dicari simbol yang paling sering muncul (dalam kasus ini adalah karakter „A‟ muncul sebanyak 3 kali). dan kemudian sebuah pohon (tree) akan dibentuk untuk menggantikan simbol dengan urutan bit yang lebih pendek. Pada kasus khusus ini, algoritma akan menggunakan tabel pengganti sebagai berikut: A = 1, B = 010, C = 011, D = 00. Jika code word dipakai untuk mengkompresi file, maka data yang telah dikompresi akan terlihat seperti berikut ini. ACDABA
10110010101
Ini berarti hanya 11 bit yang dipakai selain 48 bit, berarti rasio kompresi adalah 4 : 1 untuk file tersebut. 34
Huffman encoding dapat dioptimalkan dengan dua cara yang berbeda yaitu sebagai berikut: 1.
Adaptive Huffman Code secara dinamis mengubah code word menurut perubahan dari probabilitas dari simbol.
2.
Extended Huffman Compression dapat meng-encode grup dari simbol daripada pada melakukan encode pada simbol tunggal. Algoritma kompresi Huffman secara umum efisien dalam mengkompresi
teks atau file program. Untuk file image biasanya dipakai algoritma yang lain. Kompresi Huffman secara umum dipakai dalam program kompresi seperti PKZip, LHA, GZ, ZOO, dan ARJ. Algoritma ini juga dipakai dalam kompresi JPEG dan MPEG. Adapun bentuk algoritma dari Huffman dalam membentuk sebuah pohon biner adalah sebagai berikut:
1. Dimulai dengan penyusunan frekuensi simbol sebagai frekuensi dari pohon 2. Jika terdapat lebih dari satu pohon: a. Carilah dua pohon dengan jumlah weight yang paling kecil b. Gabungkan dua pohon tersebut menjadi satu dan mempunyai nilai setara dengan jumlah keduanya, atur salah satunya yang bernilai paling kecil sebagai child sisi kiri dan yang lainnya sebagai child sisi kanan 3. Lakukan langkah di atas hingga membentuk satu pohon biner tunggal
35
4. Untuk setiap child sisi kiri beri simbol „0‟ dan beri simbol „1‟ untuk merepresentasi child sisi kanan
2.5
Discrete Cosine Transform (DCT) Perkembangan aplikasi gambar digital telah meningkatkan kebutuhan
akan teknik kompresi gambar dan video yang standar dan efektif. Standar yang banyak digunakan adalah JPEG untuk gambar, MPEG untuk video dan H.261 untuk video teleconference. Ketiga standar tersebut menggunakan teknik dasar yang disebut Discrete Cosine Transform (DCT). Discrete Cosine Transform adalah sebuah teknik untuk mengubah sebuah sinyal kedalam komponen frekuensi dasar. Teknik ini biasanya digunakan dalam kompresi gambar dan video.
2.5.1
Standar Kompresi Video Antara tahun 80 – 90an, algoritma kompresi berbasis Discrete Cosine
Transform (DCT) dan standar internasional dikembangkan untuk mengurangi peyimpanan dan keterbatasan bandwidth yang disebabkan oleh gambar digital dan aplikasi video.Sekarang ada tiga standar berbasis DCT yang banyak digunakan dan diterima secara luas. -
JPEG (Joint Photographic Expert Group)
-
H.261 (Video codec for audiovisual service)
-
MPEG (Motion Picture Expert Group) Masing – masing standar baik untuk aplikasi yang khusus : JPEG untuk
36
kompressi gambar, H.261 untuk konferensi video, dan MPEG untuk system multimedia berkualitas tinggi. Skema kompresi standar secara sederhana adalah sebagai berikut: bagi gambar dalam 8 x 8 blok, tentukan informasi penting dari gambar yang akan dikompres, abaikan informasi yang tidak terlalu penting, dan sandikan informasi gambar yang penting dengan jumlah bit seminimal mungkin. Fungsi yang biasa digunakan antara lain:
DCT dan Zig-Zag Scanning Discrete Cosine Transform berhubungan erat dengan Discrete Fourier
Transform (FFT) dan, sehingga menjadikan data direpresentasikan dalam komponen frekuensinya. Demikian pula, dalam aplikasi pemrosesan gambar, DCT dua dimensi (2D) memetakan sebuah gambar atau sebuah segmen gambar kedalam komponen frekuensi 2D (dua dimensi nya). Untuk aplikasi kompresi video, jika variasi dalam blok cenderung rendah, kebanyakan transformasi ini akan menghasilkan representasi blok yang lebih kompak . Blok dipadatkan dalam „bin‟ dengan frekuensi yang lebih rendah yang sesuai.
Kuantisasi Kuantisasi adalah data sumber utama yang hilang dalam algoritma
kompresi image yang berbasis DCT. Kuantisasi mengurangi jumlah informasi
37
yang dibutuhkan untuk merepresentasikan frekuensi bin dengan mengkonversi amplitude dalam range tertentu mejadi satu dalam kumpulan level kuatisasi. Secara sederhana, semau standar dari semua algoritam kompresi image menggunakan kuantisasi linier dimana level dari ukuran kuantisasi adalah konstan. Kuantisasi dalam domain frekuensi mempunyai banyak keuntunagan secara langsung dalam mengkuantisasi nilai pixel. Kuantisasi dalam nilai pixel menghasilkan efek fisual yang dinamakan distorsi kontu dimana perubahan kecil amplitude dalam wilayah gradient menyebabkan perubahan peningkatan ukuran dalam rekonstruksi simpangan. Kecuali untuk DC bin, kesalahan kuantisasi untuk tiap-tiap tempat penyimpanan frekuensi rata-rata mendekati 0 untuk blok 8x8.
Entropy Coding Entropy coding adalah sebuah skema lossless kompresi berbasis pada properti statistik dari gambar atau aliran informasi yang dikompres. Meskipun entropy coding diimplementasikan secara berbeda untuk tiap-tiap standar, dasar dari skema entropy coding adalah dengan menyandikan pola yang paling sering muncul dengan jumlah bit yang paling kecil. Dengan cara ini, data dapat dimampatkan dengan faktro tambahan dari 3 atau 4. Entropy coding untuk aplikasi pemampatan video mempunyai dua proses : Zero-Length Coding (RLC) dan kode Huffman. Data RLC adalah representasi simbolik dari tempat penampung yang terkuantisasi yang memanfaatkan sepasang angka. Angka pertama merepresentasikan jumlah dari 0 yang berturutan
38
sedangkan yang kedua melambangkan jumlah dari nilai antara panjang zero-run. Sebagai contoh kode RLC(5,8) melambangkan urutan angka dari (0,0,0,0,0,8). Kode Huffman menempatkan variable panjang kode menjadi data RLC, menghasilkan variable panjang data aliran bit. Hal ini memerlukan table Huffman yang dapat di komputasi kembali yang berbasis pada properti statistic dari image (sebagaimana dalam JPEG) atau dapat kembali ditentukan kembali jika table default sedang digunakan. Dalam kasus yang lain, table yang sama digunakan untuk mendecode aliran bit data. Seperti dijelaskan diatas, pola RLC yang sering muncul disandikan dengan jumlah bit yang paling kecil. Dalam hal ini aliran digital, yang merupakan representasi digital dari image, tidak memiliki batasan atau panjang yang tetap. Informasi ini sekarang dapat disimpan atau disiapkan untuk pengiriman.
Motion Estimation Secara umum, motion video yang berurutan cenderung mempunyai hubungan erat, sehingga, pergantian gambar ditampilkan dalam waktu yang sangat cepat dalma periode waktu yang singkat. Hal ini mengakibatkan perbedaan secara aritmatika antara gambar sangat kecil. Untuk alasan ini, rasio kompresi untuk motion video yang berurutan meningkat dengan menyandikan perbedaan aritmatika diantara dua atau lebih frame yang saling berhubungan. Perkiraan motion adalah proses dimana elemen dalam gambar mempunyi korelasi terbaik dengan elemen di gambar yang lain (didepan atau dibelakang) dengan memperkirakan jumlah dari motion. Jumlah dari motion dibungkus dalam
39
vektor motion. Motion vector selanjutnya mengacu pada motion vector yang ada sebelumya.
Gambar 2.14 Motion Vector
Algoritama perkiraan motion yang efisien meningkatkan korelasi frame, dimana dapat meminimalkan pixel perbedaan aritmatik. Menghasilkan bukan hanya rasio kompresi yang tinggi tapi juga kualitas video yang didecode. Perkiraan pergerakan sesaat merupakan operasi komputansi intensif yang sulit untuk diimplementasikan secara real-time.
2.5.2
Algoritma Kompresi JPEG Algoritma JPEG dibuat untuk menghasilkan kompresi gambar film secara
efisien. Dalam penggunaan kompresi gambar film, JPEG juga sudah disesuaikan untuk penggunaan dengan gerakan video yang berurutan. Penyesuaian ini menggunakan algoritma JPEG untuk mengkompres setiap frame sendiri-sendiri pada urutan gerakan video.
40
Gambar 2.15 Proses kompresi gambar diam
Setiap bagian warna dari gambar film diperlakukan sebagai gambar yang terpisah oleh JPEG. Meskipun JPEG memungkinkan beberapa pembagian warna, gambar biasanya dibedakan dalam warna merah, hijau , biru. Atau Luminance (Y), dengan perbedaan warna biru dan merah (U=B-Y, V=R-Y). Pembagian dalam bagian warna YUV memungkinkan algorima ini untuk memanfaatkan kelemahan sensitifitas mata manusia.
JPEG membagi setiap komponen warna gambar dalam 8x8 blok pixel. DCT 8x8 diterapkan pada setiap blok. Untuk kuantisasi, JPEG menggunakan matriks. JPEG memungkinkan perbedaan matriks kuantisasi ditentukan untuk setiap bagian warna. Penggunaan matriks kuantisasi memungkinkan setiap frekuensi untuk dikuantisasi pada setiap tahapan yang berbeda. Secara umum, frekuensi yang lebih rendah pada komponen dikuantisasi menjadi tahapan yang kecil dan frekuensi tingginya menjadi tahapan yang besar. Hal ini menguntungkan karena mata manusia tidak terlalu sensitif pada frekuensi yang tinggi, tapi lebih sensitif pada frekuensi yang lebih rendah. Modifikasi pada matriks kuantisasi adalah cara yang utama untuk mengontrol kualitas dan rasio kompresi pada JPEG. Meskipun ukuran tahapan kuantisasi untuk setiap frekuensi dapat dimodifikasi, sebagian besar teknik adalah
41
untuk memperhitungkan elemen matriks bersama-sama. Tahapan terakhir dari kompresi adalah zig-zag scanning dan pengkodean entropi. Meskipun JPEG memungkinkan 2 jenis entropy coder, penerapan JPEG lebih mirip menggunakan pilihan pengkodean Huffman. Standar JPEG memungkinkan untuk menggunakan table kode Huffman yang didefinisikan sendiri. Untuk melakukan dekompres pada gambar JPEG, setiap proses ditunjukkan dalam urutan yang terbalik.
2.5.2
Algoritma Kompresi H.261 Algoritma H.261 dimaksudkan untuk diterapkan pada aplikasi Video
conferencing dan video telephony. Pada aplikasi ini, keterbatasan gerakan video menjadi bagian terpenting. Agar lebih efektif , H.261 menentukan banyak parameter system. Hanya pembagian warna YUV dengan perbandingan 4:2:0 dapat digunakan secara standar. Sebagai tambahan, H.261 hanya menggunakan 2 ukuran frame, CIF (352 x 288) dan QCIF (176 x 144). Seperti standar JPEG, setiap bagian warna gambar dibagi dalam 8 x 8 blok pixel.
Disamping
mengkodekan
setiap
blok
secara
terpisah,
H.261
mengelompokkan 4 blok Y , 1 blok U, dan 1 blok V bersama-sama dalam satu unit yang disebut makroblock. Makroblock adalah unit dasar untuk kompresi.
42
Gambar 2.16 Makroblok kompresi h.261
Untuk mengkompres setiap makroblock, standar H.261 memungkinkan kompresor untuk memilih dari beberapa pilihan kompresi. Standar H.261 hanya menentukan proses decoding dari setiap pilihan kompresi. Cara yang digunakan tidak dibakukan. Hal ini memungkinkan untuk menghasilkan produk yang berbeda dengan menggunakan cara yang berbeda efektifitasnya. Salah satu cara yang digunakan untuk mengkompres H.261 adalah sebagai berikut. Pertama, perkiraan gerakan ditunjukkan pada setiap macroblock. Karena objek dalam frame mungkin bergerak dalam arah yang berbeda, setiap macro block dapat mempunyai vektor gerakan yang berbeda. Vektor gerakan digunakan sebagai vektor pemindahan untuk mengambil sebuah macroblock dari frame yang sebelumnya untuk digunakan sebagai perkiraan. Perkiraan gerakan dalam H.261 adalah relatif pada frame yang sebelumya, dan pada pencetakan full- pixel mencapai maksimal pada +/- 15 arah vertikal dan horizontal Selanjutnya, keputusan harus dibuat untuk mengkodekan perbedaan aritmatik antara prediksi pada macroblock dan macroblock yang sebenarnya atau
43
mengkodekan macroblock dari rancangan yang dibuat. Karena perbedaan aritmatik biasanya kecil, pengkodeaan perbedaan aritmatik menghasilkan kompresi yang lebih baik. Tahapan terakhir pada proses kompresi adalah zig-zag scanning, runlength encoding dan entropy coding. Tidak seperti JPEG, H.261 menentukan table kode Huffman untuk mengkodekan entropi. Untuk melakukan decompress sebuah proses pembalikan frame H.261 dilakukan dalam urutan yang terbalik. Perkiraan gerakan tidak diperlukan karena vektor gerakan sudah termasuk dalam bit hasil kompresi. Dekompresor H.261 secara mudah menerapkan pencetakan vektor gerakan untuk menerima kembali perkiraan jika diperlukan.
2.5.3
Algoritma kompresi MPEG Algoritma kompresi MPEG dikembangkan untuk memenuhi kebutuhan
akan gambar dengan kualitas yang lebih baik dan untuk meningkatkan fleksibilitas
system
dikembangkan
lebih
yang akhir,
diperlukan MPEG
oleh dapat
system
multimedia.
meningkatkan
usaha
Karena dibalik
pengembangan algoritma JPEG dan H.261. Sebagaimana H.261, MPEG standar hanya menggunakan pemisahan komponen warna YUV dengan sampling ratio 4:2:0. Tidak seperti H.261, ukuran frame tidak dibatasi, walaupun ukuran frame 352 x 240 biasa digunakan. MPEG mengadopsi macroblock dari H.261 (4 blok Y, 1 blok U, dan 1 blok V) sebagai unit dasar kompresi. Untuk mengkompres tiap macroblock, MPEG standar mengizinkan kompresor untuk memilih dari beberapa pilihan kompresi.
44
Gambar 2.17 Kompresi MPEG
Ada lebih banyak pilihan yang tersedia dalam MPEG standar dari pada H.261. Sebagaimana H.261, MPEG standar hanya menspesifikasikan decoding pada setiap pilihan kompresi. Metode untuk memilih pilihan tersebut tidak distandardisasi, sehingga memungkinkan vendor untuk membedakan produk mereka dengan menyediakan metoda dengan biaya dan kualitas yang berbeda. Berikut ini adalah metoda yang biasa digunakan dalam kompresi MPEG. Pertama, estimasi pergerakan dilakukan pada tiap macroblock. MPEG mampu melakukan prediksi terhadap frame sebelumnya, sesudahnya atau kombinasi dari keduanya. Karena objek dalam frame tidak bergerak secara tetap dari frame ke frame, setiap macroblock dapat memiliki motion vector hingga dua buah (satu untuk frame sebelumnya dan satu lagi untuk frame sesudahnya). Untuk melakukan prediksi terhadap frame selanjutnya, harus dilakukan buffer terhadap frame ekstra.
45
Estimasi pergerakan juga dapat dilakukan hingga range yang lebih besar (hingga ± 1023) dan dengan resolusi half-pixel. Loop-filter pada H.261 tidak dimasukkan dalam MPEG karena half-pixel motion vector menyediakan fungsi yang sama. MPEG dapat melakukan prediksi yang dibentuk dari perbedaan arimatika antara macroblock sekarang dengan macroblock dari frame sebelumnya, frame selanjutnya, rata-rata antara frame sebelumnya dengan frame selanjutnya atau mengkodekan macroblock sekarang dari awal. Sebuah DCT 8x8 diaplikasikan kedalam masing-masing blok pada macroblock sekarang. MPEG menggunakan matriks (seperti JPEG) dan faktor skala untuk kuantisasi. Karena DC bin adalah yang paling penting, maka dikuantisasikan dalam 8 skala bit tetap. Karena efek visual dari kuantisasi frequency bin berbeda antara blok perkiraan dengan blok sekarang, MPEG dapat menggunakan dua matriks (masing – masing satu untuk tiap tipe). Biasanya, matriks tersebut diset sekali untuk urutan gambar dan skala kuantisasinya disesuaikan untuk mengontrol rasio kompresi. Tahap paling akhir dari kompresi adalah zig-zag scanning, run-length encoding dan entropy coding. Seperti H.261, MPEG menspesifikasikan tabel kode Huffman untuk entropy coding. Untuk mendekompres frame MPEG, setiap operasi dilakukan secara terbalik, kecuali untuk estimasi pergerakan. Karena vektor pergerakan dimasukkan dalam bit-stream yang dikompresi, dekompresor MPEG hanya cukup menerapkan vektor pergerakan untuk memprediksi frame sebelumnya maupun frame selanjutnya jika diperlukan
2.6
Gelombang Elektromagnetik
46
Gelombang
Elektromagnetik
adalah
gelombang
yang
dapat
merambat walau tidak ada medium. Energi elektromagnetik merambat dalam gelombang dengan beberapa karakter yang bisa diukur, yaitu: panjang gelombang/wavelength, frekuensi, amplitude/amplitude, kecepatan. Amplitudo adalah tinggi gelombang, sedangkan panjang gelombang adalah jarak antara dua puncak. Frekuensi adalah jumlah gelombang yang melalui suatu titik dalam satu satuan waktu. Frekuensi tergantung dari kecepatan merambatnya gelombang. Karena kecepatan energi elektromagnetik adalah konstan (kecepatan cahaya), panjang gelombang dan frekuensi berbanding terbalik. Semakin panjang suatu gelombang, semakin rendah frekuensinya, dan semakin pendek suatu gelombang semakin tinggi frekuensinya.
Energi elektromagnetik dipancarkan, atau dilepaskan, oleh semua masa di alam semesta pada level yang berbeda-beda. Semakin tinggi level energi dalam suatu sumber energi, semakin rendah panjang gelombang dari energi yang dihasilkan, dan semakin tinggi frekuensinya. Perbedaan karakteristik energi gelombang digunakan untuk mengelompokkan energi elektromagnetik.
Beberapa kaidah tentang kemagnetan dan kelistrikan yang mendukung perkembangan konsep gelombang elektromagnetik antara lain: 1. Hukum Coulomb mengemukakan : “Muatan listrik statik dapat menghasilkan medan listrik.”. 2. Hukum Biot & Savart mengemukakan : “Aliran muatan listrik (arus listrik) dapat menghasilkan medan magnet”.
47
3. Hukum Faraday mengemukakan : “Perubahan medan magnet dapat menghasilkan medan listrik”.
Berdasarkan Hukum Faraday, Maxwell mengemukakan hipotesa sebagai berikut: ”Perubahan medan listrik dapat menimbulkan medan magnet”. Hipotesa ini sudah teruji dan disebut dengan Teori Maxwell. Inti teori Maxwell mengenai gelombang elektromagnetik adalah:
a. Perubahan medan listrik dapat menghasilkan medan magnet. b. Cahaya termasuk gelombang elektromagnetik. Cepat rambat gelombang elektromagnetik (c) tergantung dari permitivitas () dan permeabilitas (μ) zat.
Menurut Maxwell, kecepatan rambat gelombang elektromagnetik dirumuskan sebagai berikut c=
1 ε oμ o
(3)
dimana, c = Cepat rambat gelombang elektromagnetik = Permitivitas, dan μ = Permeabilitas zat. Ternyata perubahan medan listrik menimbulkan medan magnet yang tidak tetap besarannya atau berubahubah. Sehingga perubahan medan magnet tersebut akan menghasilkan lagi medan listrik yang berubahubah.
48
Proses terjadinya medan listrik dan medan magnet berlangsung secara bersamasama dan menjalar kesegala arah. Arah getar vektor medan listrik dan medan magnet saling tegak lurus. Jadi gelombang elektromagnetik adalah gelombang yang dihasilkan dari perubahan medan magnet dan medan listrik secara berurutan, dimana arah getar vektor medan listrik dan medan magnet saling tegak lurus.
Vektor Medan Listrik
Vektor Medan Magnet E B
Gelombang Elektromagnetik Gambar 2.18 Gelombang elektromagnetik
E = medan listrik (menjalar vertikal) B = medan magnet (menjalar horizontal.) Gejala seperti ini disebut terjadinya gelombang elektromagnetik (gelombang yang mempunyai medan magnet dan medan listrik).
49
2.6.1
Osilator Penghasil Gelombang Elektromagnetik Gelombang
elektromagnetik
telah
diketahui
keberadaannya.
Permasalahannya dapatkah gelombang elektromagnetik diproduksi terus-menerus. Berdasarkan hukum Ampere dan hukum Faraday berhasil diketemukan bahwa rangkaian oscilasi listrik dapat menghasilkan gelombang elektromagnetik terus menerus. Frekuensi yang dihasilkan gelombang elektromagnetik disebut frekuensi resonansi. Anten i Sumber energi
Sirkuit LC Gambar 2.19 Rangkaian/sirkuit osilasi LC dihubungkan dengan sumber energi dan antena dapat menghasilkan perubahan medan listrik AC dan pada antena akan terpancar gelombang elektromagnetik
50
Prinsip ini dipakai dalam teknologi penyiaran baik gelombang TV, gelombang radar, gelombang mikro, maupun gelombang radio. Gambar 21 menunjukkan rangkaian pengirim gelombang elektromagnetik. Di sisi lain gelombang elektromagnetik yang terpancar itu dapat ditangkap melalui rangkaian penerima gelombang elektromagnetik.
BAB III METODE PENELITIAN
3.1
Waktu dan Tempat Penelitian Penelitian dilaksanakan selama 6 bulan di Pusat Pengembangan
Informatika Nuklir (PPIN), BATAN Serpong dengan alamat
Gedung 71,
Kawasan Puspiptek Serpong, Tangerang. Pusat Pengembangan Informatika Nuklir BATAN (PPIN) adalah merupakan salah satu unit kerja di Badan Tenaga Nuklir Nasional yang bertugas melaksananakan
pembangunan
dan
pengembangan
infrastruktur
jaringan
komunikasi dan sistem komputer untuk menyediakan sarana, prasarana komputasi dan fasilitas akses ke jaringan dalam lingkungan BATAN, jaringan nasional dan jaringan internasional.
3.2
Perangkat yang digunakan Dalam penelitian ini digunakan perangkat-perangkat yang terdiri dari
perangkat keras dan perangkat lunak. 51
3.2.1
Perangkat Keras Perangkat keras digunakan antara lain, seperangkat komputer personal
(PC) dan laptop dengan spesifikasi yang cukup untuk menjalankan programprogram perangkat yang dibutuhkan dan mempunyai koneksi internet yang memadai, sebuah webcam sebagai video input, layar monitor sebagai video output, mikrofon sebagai audio input, dan speaker sebagai audio output. Spesifikasi PC dan laptop yang digunakan dapat dilihat pada tabel 3.1 berikut: Tabel 3.1 Spesifikasi PC dan laptop yang digunakan Item
PC
Laptop Acer Aspire 2920
Monitor
1440 x 900 pixels
1200 x 800 pixels
RAM
4 GB (hanya terpakai 3.2 GB)
1 GB
HDD
1.5 TB
250 GB
Webcam
Prolink PCC5020
Integrated webcam
Processor
Atlhon X2 7850+ 2.80 GHz
Intel Core 2 Duo 2.0 GHz
VGA
ATI Radeon HD 5750 512 MB Intel GMA X3100 358 MB
Speaker
Sonicgear Spectra 2000 5.1
Stereo speaker
Microphone
Built-in dari webcam
On board
OS
Windows 7 Ultimate 32 Bit
Windows 7 Ultimate 32 Bit
52
Dalam penelitian yang membandingakan codec video ini, webcam menjadi salah satu perangkat keras yang paling penting. Oleh karena itu menjadi sangat penting pula untuk mengetahui spesifikasi webcam yang digunakan. Untuk perbandingan spesifikasi webcam yang digunakan dapat dilihat pada tabel 3.2 berikut.
Tabel 3.2 Spesifikasi webcam yang digunakan Fitur
3.2.2
Prolink PCC5020 Acer Aspire 2920 Webcam
Resolusi Foto
1280 x 960 pixels
640 x 480 pixels
Resolusi Video
320 x 240 pixels
640 x 480 pixels
Frame Rate
15 fps
30 fps
Built-In Mic
Iya
Tidak
Perangkat Lunak Perangkat lunak yang digunakan untuk membandingkan codec video
H.264 dengan VP7 tentu saja sudah seharusnya untuk menggunakan perangkat lunak yang meng-implementasi-kan kedua codec video tersebut yaitu Skype dan Google Video Chat. Digunakan pula perangkat lunak Fraps yang digunakan untuk menghitung frame rate dari panggilan video yang dilakukan, perangkat lunak Net Meter untuk mengetahui besar bandwidth internet yang terpakai oleh layanan panggilan video tersebut. Agar dapat menentukan kualitas dan tingkat efisiensi
53
kedua codec video tersebut. Selain itu, digunakan pula perangkat lunak Wireshark untuk mengukur nilai QoS (quality of service) dari masing-masing codec video. a. Skype Dipilihnya perangkat lunak Skype sebagai perwakilan dari codec VP7 karena perangkat lunak Skype ini sudah mulai melayani konsumennya sebagai penyedia layanan panggilan suara (voice call) gratis sejak Agustus 2003 dan memulai untuk menambahkan fitur panggilan dan konferensi video (video call & conference) sejak Januari 2006.
Gambar 3.1. Tampilan Skype
Skype sudah merambah pasar yang lebih luas, dapat digunakan pada system operasi Windows, Mac, dan Linux. Bahkan dapat digunakan pada ponsel berbasis Android, Symbian, dan juga pada iPhone. Hingga saaat ini Skype masih merupakan salah satu pilihan utama konsumen. b. Google Video Chat
54
Sedangkan dipilihnya perangkat lunak Google Video Chat sebagai perwakilan dari codec video H.264 dikarenakan perangkat lunak ini dikembangkan oleh Google yang merupakan salah satu perusahaan besar yang bergerak dalam bidang industri perangkat lunak komputer dan internet yang bermula dari sebuah mesin pencari web.
Gambar 3.2. Tampilan Google Video Chat
Google sudah banyak mengembangkan perangkat lunak yang menjadi pesaing perangkat-perangkat lunak dan layanan-layanan yang telah lama menjadi pilihan konsumen. Beberapa contohnya antar lain, Gmail (Google Mail) yang menjadi pesaing Yahoo Mail, Google Talk yang menjadi pesaing Yahoo Messenger, Google Chrome yang menjadi pesaing Internet Explorer dan Mozilla Firefox. Sebagian besar perangkat lunak yang dikembangkan oleh Google langsung menjadi pilihan alternatif konsumen karena didukung oleh nama Google
55
itu sendiri. Dapat diperkirakan pula bahwa perangkat lunak Google Video Chat ini pun dapat menjadi pesaing Skype dalam hal layanan panggilan video.
3.3
Tahapan Penelitian
56
Berikut ini merupakan bagan diagram alur dari tahap awal hingga tahap akhir dalam penelitan ini:
Gambar 3.3. Bagan Alur Penelitian Perbandingan Codec Video
Studi Literatur
Perancangan Perangkat Pengujian
Codec VP7
Codec H.264
Pengujian Efisiensi dan Efektifitas Codec
Analisis Hasil Penelitian
Kesimpulan
Pengujian Performa Codec Video
57
Pada penelitian ini akan dianalisa tentang performansi dari codec video dalam aplikasi Video Conference yaitu Google Video Chat dan Skype. Analisa yang dilakukan salah satunya adalah dengan menentukan nilai MOS (Mean Opinion Score) dan QoS (Quality of Service) dari masing-masing codec. Untuk mengetahui nilai MOS, maka beberapa pengamatan perlu untuk dilakukan. Pengamatan-pengamatan tersebut meliputi pengamatan paket, delay end to end, bandwidth, throughput jaringan serta kualitas dari gambar dengan mengukur besar frame rate pada masing-masing codec video.
3.3.1
Pengamatan Paket Pengamatan paket ini dilakukan dengan cara mengamati jumlah paket
yang dikirimkan maupun yang diterima oleh masing-masing pengguna. Yang sangat penting dalam pengamatan paket adalah adanya paket loss saat melakukan panggilan video. Karena saat terjadi paket loss gambar yang terjadi pada sisi penerima menjadi terputus – putus, paket loss disebabkan karena delay yang terlalu besar. Loss packet (kehilangan paket) terjadi ketika peak load dan congestion (kemacetan transmisi paket akibat padatnya traffic yang harus dilayani) dalam batas waktu tertentu, maka frame (gabungan data payload dan header yang di transmisikan) suara akan dibuang sebagaimana perlakuan terhadap frame data lainnya. 3.3.2
Pengukuran Delay
58
Delay merupakan salah satu permasalahan yang harus diperhitungkan karena kualitas suara dan gambar menjadi baik sangat tergantung dari waktu delay yang terjadi. Besarnya delay3 maksimum yang direkomendasikan oleh ITU-T pada G.114 untuk aplikasi suara dan gambar adalah 150 ms, sedangkan delay maksimum dengan kualitas suara dan gambar yang masih dapat diterima pengguna adalah 250 ms.
Beberapa delay yang dapat mengganggu kualitas suara dan gambar dalam Video Conference dapat dikelompokkan menjadi :
1. Propagation delay (delay yang terjadi akibat transmisi melalui jarak antar pengirim dan penerima) 2. Serialization delay (delay pada saat proses peletakan bit ke dalam circuit) 3. Processing delay (delay yang terjadi saat proses coding, compression, decompression dan decoding) 4. Packetization delay (delay yang terjadi saat proses paketisasi digital voice sample) 5. Queuing delay (delay akibat waktu tunggu paket sampai dilayani) 6. Jitter buffer ( delay akibat adanya buffer untuk mengatasi jitter)
Selain itu parameter – parameter lain yang mempengaruhi Quality of Service (QoS), antara lain: 3
Tabratas Tharom, buku pintar internet “teknis dan bisnis VoIP”, Elex media computindo
59
1. Pemenuhan kebutuhan bandwidth 2. Keterlambatan data (latency) 3. Packet loss dan desequencing 4. Jenis kompresi data 5. Interopabilitas peralatan (vendor yang berbeda) 6. Jenis standar multimedia yang digunakan
Untuk berkomunikasi dengan menggunakan teknologi Video Conference yang harus diperhatikan adalah delay, jitter dan loss packet. Jitter merupakan variasi delay yang terjadi akibat adanya selisih waktu atau interval antar kedatangan paket di penerima. Untuk mengatasi jitter maka paket data yang datang dikumpulkan dulu dalam jitter buffer selama waktu yang telah ditentukan sampai paket dapat diterima pada sisi penerima dengan urutan yang benar. Salah satu alternatif solusi permasalahan di atas adalah membangun link antar node pada jaringan dengan spesifikasi dan dimensi dengan QoS yang baik dan dapat mengantisipasi perubahan lonjakan trafik hingga pada suatu batas tertentu.
3.3.3
Pengukuran Bandwidth
60
Bandwidth adalah kecepatan maksimum yang dapat digunakan untuk melakukan transmisi data antar komputer pada jaringan IP atau internet. Dalam layanan Video Conference, penggunaan bandwidth merupakan bagian yang harus diperhitungkan sebagai parameter untuk mengukur efisiensi kerja sebuah codec. Semakin kecil bandwidth yang digunakan, maka semakin efisian pula sebuah codec yang dipakai dalam layanan Video Conference. 3.3.4
Pengukuran Throughput Jaringan Throughput adalah jumlah bit yang ditransmisikan perdetik melalui sebuah
sistem atau media komunikasi. Throughput diukur setelah transmisi data (host/client) karena suatu sistem akan menambah delay yang disebabkan processor limitations, kongesti jaringan, buffering inefficients, error transmisi, traffic loads atau mungkin desain hardware yang tidak mencukupi. Aspek utama throughput yaitu berkisar pada ketersediaan bandwidth yang cukup untuk menjalankan aplikasi. Hal ini menentukan besarnya trafik yang dapat diperoleh suatu aplikasi saat melewati jaringan. Aspek penting lainnya adalah error (pada umumnya berhubungan dengan link error rate) dan losses (pada umumnya berhubungan dengan kapasitas buffer). Throughput tergantung pada faktor-faktor berikut ini: 1. Karakteristik link : bandwidth, error rate. 2. Karakteristik node : kapasitas buffer, daya pemrosesan.
3.3.5
Kualitas Gambar
61
Kualitas gambar merupakan faktor utama yang secara langsung bisa dilihat dan didengar oleh pengguna untuk menyatakan kepuasan atas apa yang dihasilkan dari Video Conference. Ketajaman gambar dan halusnya gerakan dalam sebuah panggilan video sangat mempengaruhi nilai MOS. Oleh karena itu, pengukuran besar frame rate menjadi sangat penting di sini, karena semakin besar frame rate maka semakin halus pula motion (gerakan) pada video yang dilihat oleh pengguna. Salah satu cara yang digunakan untuk penentuan kualitas gambar adalah dengan menggunakan penilaian subyektif dari responden. Responden memberikan penilaian kualitas sebesar skala 4 sebagai Mean Opinion Score (MOS)4 atau nilai opini pendengar di penerima, sebagai berikut : Tabel 3.3 Keterangan Nilai MOS Nilai 1 2 3 4 5
3.3.6
Keterangan Kurang baik Cukup baik Baik Sangat baik Sempurna
Efisiensi dan Efektifitas Tujuan akhir dari penelitian ini adalah membandingkan efisiensi dan
efektifitas codec dalam pemakaian bandwidth dan kerja komputer. 3.4
4
Pengolahan Data
Mean Opinion Score (MOS), http://www.itu.int/ITU-T/publications
62
Dengan diperolehnya data-data yang diperlukan, maka penelitian masuk pada tahap pengolahan data. Terdapat beberapa metode yang bisa dijadikan metode pengolahan data dalam penelitian ini, di antaranya adalah :
3.4.1. Estimasi MOS dengan standart ITU-T P.8005 Metode ini merupakan metode yang digunakan untuk menentukan kualitas audio dan video dalam jaringan IP berdasar pada standart ITU-T P.800. Metode ini bersifat subjektif, karena berdasarkan pendapat orang-perorangan. Untuk menentukan nilai MOS terdapat dua cara pengetesan yaitu, conversation opinion test dan listening test. Metode MOS dirasakan kurang efektif untuk mengestimasi kualitas layanan panggilan video, hal ini dikarenakan :
a. Tidak tedapatnya nilai yang pasti terhadap parameter yang mempengaruhi kualitas layanan panggilan video. b. Setiap orang memiliki standar yang berbeda-beda terhadap suara yang mereka dengar dengan hanya melalui percakapan. c. Dibutuhkan pendapat banyak orang untuk mengestimasi nilai MOS tersebut.
5
Mean Opinion Score (MOS), http://www.itu.int/ITU-T/publications
63
3.4.2. Estimasi MOS dengan Metode E-Model (ITU-T G.107)6 E-Model
adalah
pendekatan
matematis
yang
digunakan
untuk
mementukan kualitas suara berdasarkan penyebab menurunnya kualitas video diantaranya delay dan packet loss, dalam jaringan. Nilai akhir estimasi E-Model ini disebut dengan R faktor. R faktor didefinisikan sebagai faktor kualitas transmisi yang dipengaruhi oleh beberapa parameter seperti signal to noise ratio, codec dan decodec, packet loss, dan delay. R faktor didefinisikan sebagai berikut:
(4)
Keterangan: Id
: Faktor penurunan kualitas yang disebabkan oleh pengaruh delay
If
: Faktor penurunan kualitas yang disebabkan oleh teknik kompresi dan packet loss yang terjadi
Untuk mencari nilai Id ditentukan oleh persamaan berikut:
(5)
Sedangkan untuk mencari nilai If ditentukan oleh persamaan dibawah ini:
(6)
6
Mean Opinion Score (MOS), http://www.itu.int/ITU-T/publications
64
Maka secara umum persamaan nilai estimasi R 65actor menjadi:
(7) Keterangan: R : faktor kualitas transmisi d
: delay (milli second)
H : fungsi tangga; dengan ketentuan H(x) = 0 , jika x < 0 H(x) = 1 , jika x = 0 e
: presentasi besarnya paket loss yang terjadi (dalam bentuk desimal)
Untuk mengubah estimasi dari nilai R faktor kedalam MOS (ITU-T P.800) terdapat ketentuan sebagai berikut:
a. Untuk R < 0 maka MOS = 1
Kondisi ini menerangkan apabila delay total yang dihasilakan sangat besar dan hal tersebut membuat buruk pada kualitas VoIP dan tidak diperkenankan untuk diaplikasikan bahkan mulai R < 50
b. Untuk R > 100 maka MOS = 4.5
Persamaan ini untuk menerangkan kualitas yang paling bagus dari VoIP itu sendiri karena prinsipnya nilai R maksimum hanya 94.2. Untuk realitasnya yang dipakai adalah untuk persamaan seperti di bawah ini.
c. Untuk 0 < R < 100 maka MOS = 1 + 0.035R + 7x10-6 R(R-60)(100-R)
65
3.4.3. Estimasi Pengukuran Packet loss terhadap Kualitas Video (Gambar) Untuk menentukan nilai kualitas menggunakan MPQM (Moving Picture Quality Metric) ini berdasarkan riset yang dilakukan di Universitas California Los Angeles (UCLA). Dimana dengan perhitungan antara 5 (sangat bagus) sampai 1 (jelek) untuk mengekspresikan kualitas dari gambra video yang dibroadcast. Metode ini sama dengan R-model yang biasa digunakan untuk mengukur estimasi kualitas VOIP. Rumusan dari MPQM sebagai berikut :
(8)
Dimana: Qr
: Nilai kualitas gambar video, range 0 (unusable) s/d 5 (best) (MOS)
Qe
: Kualitas dari codec yang digunakan, harga berkisar antara 3-5
R
: Parameter kalibrasi yang digunakan sebagai expresi kompleksitas dari codec untuk video & bitrate, berkisar R(high)=3 R(low)=2
PLR
: Packet loss Rate
66
BAB IV HASIL DAN PEMBAHASAN
Untuk mengetahui efisiensi dan efektifitas codec perlu dilakukan pengujian dengan membandingkan kinerja dua codec video yaitu codec VP7 yang diimplementasikan oleh perangkat lunak Skype dengan codec H.264 yang diimplementasikan oleh perangkat lunak Google Video Chat. Nilai CPU dan RAM yang terukur pada pengujian merupakan rata-rata besarnya penggunaan CPU dan RAM oleh codec video untuk memproses gambar video secara keseluruhan pada masing-masing perangkat baik PC maupun laptop. Nilai bandwidth yang terukur merupakan nilai rata-rata besar penggunaan bandwidth yang dikirimkan dari masing-masing perangkat. Nilai resolusi dan FPS merupakan besar resolusi dan jumlah rata-rata jumlah gambar per detik yang dihasilkan. Nilai MOS merupakan penilaian kualitas video secara keseluruhan dan subjektif yang tampak pada panggilan video yang diujikan. Untuk nilai FPS, resolusi video, dan nilai MOS didapat dari sisi penerima. Sedangkan untuk nilai delay dan packet loss yang terukur menunjukan bahwa kualitas transmisi data yang cukup baik karena waktu tunda yang sangat kecil dan tidak ada paket data yang hilang dalam pengirimannya. Hal ini dikarenakan jarak antara kedua sisi client yang berdekatan. Pengukuran rata-rata penggunaan CPU, RAM, dan bandwidth ditujukan agar dapat diketahui seberapa besar masing-masing codec tersebut menggunakan sumber daya pada PC dan laptop yang digunakan sebagai perangkat penguji.
67
Pengukuran rata-rata FPS dan nilai MOS bertujuan untuk mendapatkan nilai pembanding dari sisi kualitas gambar yang dihasilkan oleh codec. Nilai-nilai ini dapat dijadikan pembanding sehingga tingkat efisiensi dan efektifitas codec dapat diketahui. 4.1
Hasil Pengujian Codec pada PC Tabel 4.1 Data Pengujian Pada PC Codec
VP7
H.264
CPU
37%
16%
RAM
122 MB
113 MB
Bandwidth
640 kbps
347 kbps
Resolusi Video
320x240
320x240
Frame Rate
13 fps
10 fps
Nilai MOS
3.9
3.35
Delay & Packet Loss
15 ms & 0 %
15 ms & 0 %
Penggunaan Daya
35.15 watt
15.2 watt
Parameter
Dari hasil pengujian terlihat data yang tercatat bahwa codec video VP7 menggunakan sumber daya (CPU, RAM, dan bandwidth) lebih besar dibandingkan dengan codec video H.264. Pada perbandingan penggunaan RAM memang tidak terlihat perbedaan yang mencolok antara kedua codec video, codec VP7 mengkonsumsi RAM sebesar 122 MB dan codec H.264 sebesar 113 MB. Pengukuran RAM dilakuakan dengan mencatat penggunaan RAM yang terbaca dari Task Manager pada Windows. Nilai konsumsi RAM ini tidak mengalami
68
perubahan yang signifikan selama pengujian sehingga nilai yang dicatat adalah nilai yang tetap. Pada perbandingan penggunaan CPU, codec H.264 hanya menggunakan kerja CPU kurang dari setengah dari kerja yang dilakukan oleh codec VP7 untuk memproses video, yaitu sebesar 16% dibandingkan dengan kerja CPU pada codec VP7 yang sebesar 37%. Dikarenakan oleh nilai kerja CPU yang fluktuatif dan banyak mengalami perubahan yang cukup signifikan, maka diambil 10 data yang kemudian dirata-ratakan. Proses pengambilan data dilakukan dengan melakukan panggilan video antara perangkat penguji PC dan laptop selama 5-6 menit. Kemudian data pertama dicatat dari Task Manager pada detik ke-30 sejak panggilan video dimulai, data-data selanjutnya diambil dengan interval waktu 30 detik pula hingga didapat 10 data. 10 data kerja CPU pada codec H.264 yang tercatat adalah 11%, 14%, 17%, 16%, 13%, 18%, 21%, 23%, 14%, dan 13%. Rata-rata dari 10 data tersebut adalah 16%. Sedangkan 10 data kerja CPU pada codec VP7 yang tercatat adalah 29%, 33%, 35%, 41%, 44%, 48%, 37%, 26%, 39%, dan 38%. Rata-rata dari 10 data-data ini adalah 37%. Begitu pula pada penggunaan bandwidth, codec H.264 tercatat jauh lebih hemat bandwidth jika dibandingkan dengan codec VP7 yaitu 347 kbps dibanding 640 kbps. Data konsumsi bandwidth ini juga diambil dengan metode yang sama dengan pengambilan data kerja CPU dan merata-ratakannya. 10 data yang tercatat pada codec H.264 adalah 293.7 kbps, 313.6 kbps, 348.2 kbps, 353.5 kbps, 341.4 kbps, 282.2 kbps, 369.3 kbps, 372.1 kbps, 412.2 kbps, dan 383.8 kbps, dan rata-ratanya adalah 347 kbps. Sedangkan 10 data yang tercatat pada 69
codec VP7 adalah 583.4 kbps, 617.3 kbps, 648.5 kbps, 651.7 kbps, 676.6 kbps, 623.8 kbps, 634.2 kbps, 640.1 kbps, 652.2 kbps, dan 672.2 kbps, yang dirataratakan menjadi 640 kbps. Codec H.264 juga tercatat lebih hemat daya dibanding codec VP7, yaitu 15.2 watt berbanding 35.15 watt dari total daya sebesar 95 watt. Namun, jika dilihat dari kualitas video yang dihasilkan, memang tebukti bahwa codec VP7 menghasilkan kualitas video yang lebih baik daripada codec H.264. Hal ini dapat dilihat pula pada nilai MOS yang didapat, di mana nilai MOS pada codec VP7 beberapa angka lebih besar yaitu 3.9 dibanding pada codec H.264 yang hanya sebesar 3.35. Resolusi video yang dihasilkan adalah 320x240 piksel. Tetapi kedua codec tidak menampilkan besar frame rate maksimum yang didukung oleh webcam yaitu 15 fps. Yang dihasilkan hanya berkisar antara 10-13 fps. Hal ini disebabkan oleh kompresi yang dilakukan oleh masing-masing codec untuk menekan besar penggunaan bandwidth. Pengambilan data pada perangkat penguji PC ini dapat dilihat pada gambar 4.1.
Gambar 4.1 Pengambilan Data Pada Perangkat Penguji PC
70
4.2
Hasil Pengujian Codec pada Laptop Tabel 4.2 Data Pengujian Pada Laptop Codec
VP7
H.264
CPU
43%
23%
RAM
127 MB
116 MB
Bandwidth
1100 kbps
354 kbps
Resolusi Video
640x480
320x240
Frame Rate
15 fps
11 fps
Nilai MOS
4.5
3.5
Delay & Packet Loss
15 ms & 0%
15 ms & 0%
Penggunaan Daya
15.05 watt
8.05 watt
Parameter
Dari hasil pengujian ini terlihat hasil yang mirip dengan hasil yang didapat pada perangkat penguji sebelumnya. Codec H.264 menggunakan sumber daya yang lebih kecil daripada codec VP7 yang dapat menghasilkan kualitas video yang lebih baik dengan menggunakan sumber daya yang lebih besar. Jika diperhatikan pada penggunaan CPU, RAM, dan bandwidth kembali dapat dilihat bahwa kedua codec tersebut tidak berbeda jauh dalam penggunaan RAM, namun memiliki perbedaan yang sangat jauh dalam hal penggunaan CPU dan bandwidth. Terlihat bahwa penggunaan CPU pada codec VP7 hampir dua kali lipat lebih besar yaitu 43% daripada yang digunakan oleh codec H.264 yang hanya 23%. Metode yang sama kembali digunakan pada pengambilan data pada perangkat laptop. 10 data kerja CPU pada codec H.264 yang tercatat adalah 19%, 22%, 24%, 23%, 21%, 17%, 25%, 26%, 24%, dan 29%. Rata-rata dari 10 data 71
tersebut adalah 23%. Sedangkan 10 data kerja CPU pada codec VP7 yang tercatat adalah 33%, 36%, 32%, 41%, 45%, 49%, 51%, 48%, 47%, dan 48%. Rata-rata dari 10 data-data ini adalah 43%. Perbedaan yang lebih mencolok dapat dilihat pada pengukuran penggunaan bandwidth. Konsumsi bandwidth codec VP7 yaitu 1100 kbps hampir tiga kali lebih besar dari konsumsi codec H.264 yang hanya sebesar 354 kbps. Data konsumsi bandwidth ini juga diambil dengan metode yang sama dengan pengambilan data kerja CPU dan merata-ratakannya. 10 data yang tercatat pada codec H.264 adalah 332.5 kbps, 321.2 kbps, 347.9 kbps, 353.7 kbps, 372.8 kbps, 364.3 kbps, 358.2 kbps, 371.4 kbps, 361.3 kbps, dan 356.7 kbps, dan rata-ratanya adalah 354 kbps. Sedangkan 10 data yang tercatat pada codec VP7 adalah 973.2 kbps, 995.3 kbps, 1024.5 kbps, 1203.7 kbps, 1400.8 kbps, 1375.6 kbps, 1117.5 kbps, 1049.7 kbps, 873.9 kbps, dan 985.8 kbps, yang dirata-ratakan menjadi 1100 kbps. Codec H.264 kembali tercatat lebih hemat daya dibanding codec VP7, yaitu 8.05 watt berbanding 15.05 watt dari total daya 35 watt. Hal ini disebabkan karena codec VP7 dapat menghasilkan resolusi maksimum yang didukung oleh webcam yang dipakai pada perangkat penguji laptop ini, yaitu 640x480 piksel walaupun codec VP7 mengurangi frame rate video menjadi 15 fps dari dukungan maksimum webcam yang mencapai 30 fps. Sedangkan codec H.264 hanya menghasilkan resolusi dan frame rate sebesar 320x240 dan 11 fps untuk mengurangi konsumsi bandwidth yang memang terbukti dari hasil pengukuran di atas. Pengambilan data pada perangkat penguji laptop ini dapat dilihat pada gambar 4.2. 72
Gambar 4.2 Pengambilan Data Pada Perangkat Penguji Laptop
4.3
Hasil Perhitungan Dengan Metode MPQM Dari hasil pengujian yang sudah dipaparkan di atas, dapat dilihat bahwa
secara keseluruhan codec VP7 dapat menghasilkan kualitas video yang lebih baik daripada video yang dihasilkan oleh codec H.264 dengan membandingkan nilai MOS, frame rate, dan besar resolusi video yang merupakan parameter untuk mengukur tingkat kualitas video. Untuk mempertegas hasil ini, digunakan perhitungan kualitas video dengan metode MPQM (Moving Picture Quality Metric).
Rumus MPQM yang digunakan tersebut adalah sebagai berikut :
73
(9) Dimana: Qr
: Nilai kualitas image video, range 0 (unusable) s/d 5 (best) (MOS)
Qe
: Kualitas dari codec yang digunakan, harga berkisar antara 3-5
R
: Parameter kalibrasi yang digunakan sebagai expresi kompleksitas dari codec untuk video & bitrate, berkisar R(high)=3 R(low)=2
PLR
: Packet loss Rate
Jika dimasukan nilai-nilai yang sudah didapat sebelumnya, dapat ditentukan bahwa nilai dari Qe yang merupakan nilai kualitas codec adalah sama dengan nilai Qr yang merupakan nilai MOS karena nilai dari packet loss adalah 0. Sebelumnya ditentukan terlebih dahulu nilai rata-rata MOS masing-masing codec, yaitu :
QrVP7
= (MOSPC + MOSlaptop) / 2 = (3.9+4.5)/2 = 8.4/2 = 4.2
QrH.264 = (MOSPC + MOSlaptop) / 2 = (3.5+3.35)/2 = 6.85/2 = 3.425
(10) (11)
Jika Qr = Qe, maka dapat ditentukan bahwa nilai kualitas masing-masing codec adalah sebagai berikut :
QrVP7 = QeVP7 = 4.2 QrH.264 = QeH.264 = 3.425
(12) (13)
74
4.4
Perbandingan Penggunaan Sumber Daya Antara VP7 dan H.264 Dari hasil penghitungan di atas, terlihat bahwa codec VP7 mempunyai
nilai kualitas lebih tinggi daripada codec H.264. Namun dalam ini bukanlah untuk menentukan codec yang dapat menghasilkan kualitas yang lebih baik, tetapi menentukan codec yang lebih efektif dan efisien. Efektifitas adalah suatu ukuran yang menyatakan seberapa jauh target yang dicapai. Dimana makin besar presentase target yang dicapai, makin tinggi efektifitasnya. Target kerja dari sebuah codec adalah menghasilkan kompresi yang optimal tanpa banyak mengorbankan kualitas. Sedangkan, efisiensi adalah suatu nilai perbandingan antara hasil yang dicapai dengan kerja yang dilakukan. Dimana makin kecil kerja yang dilakukan untuk mencapai hasil yang baik, makin tinggi efisiensinya. Maka, efektifitas sebuah codec sangat bergantung pada efisiensinya. Secara logika jika sebuah codec dapat menghasilkan kualitas gambar yang sangat jernih namun menggunakan sumber daya yang berat, maka codec tersebut memiliki tingkat efisiensi yang rendah. Tetapi jika sebuah codec menghasilkan kualitas gambar yang tidak terlalu jernih namun tidak terlalu banyak mengkonsumsi sumber daya, baik itu pada komputer maupun konsumsi bandwidth-nya, maka codec ini memiliki nilai efisiensi yang lebih tinggi. Untuk mempermudah perbandingan yang dilakukan terhadap kedua codec, dicari nilai rata-rata dari hasil pengujian pada perangkat penguji PC dan laptop. Hasil rata-rata tersebut dapat dilihat pada tabel 4.3 berikut ini.
75
Tabel 4.3 Rata-rata Hasil Pengujian Kedua Codec Codec
VP7
H.264
Nilai MOS (Qr)
4.2
3.425
CPU
40%
19.5%
RAM
124.5 MB
114.5 MB
Bandwidth
870 kbps
350.5 kbps
Penggunaan Daya
50.2 watt
23.25 watt
Parameter
Dari tabel di atas, dibuatlah grafik perbandingan dari kedua codec tersebut. Gambar 4.3 ini adalah gambar grafik yang membandingkan nilai MOS dari kualitas gambar yang dihasilkan oleh kedua codec.
Nilai MOS (Qr) 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0
Nilai MOS (Qr)
VP7 H.264
Gambar 4.3 Grafik Perbandingan Nilai MOS
76
Dari gambar di atas terlihat bahwa kualitas gambar yang dihasilkan oleh codec VP7 sedikit lebih baik daripada kualitas gambar yang dihasilkan oleh codec H.264, yaitu 4.2 berbanding 3.425.
Konsumsi CPU 40% 35% 30% 25% 20%
Konsumsi CPU
15% 10% 5% 0% VP7 H.264
Gambar 4.4 Grafik Perbandingan Nilai Konsumsi CPU
Gambar 4.4 di atas adalah gambar grafik yang membandingkan nilai konsumsi CPU dari kedua codec. Pada gambar ini dapat terlihat bahwa codec H.264 jauh lebih hemat dalam penggunaan tenaga CPU, yaitu hanya sebesar 19.5% dibandingkan dengan penggunaan tenaga CPU oleh codec VP7, yaitu sebesar 40%. Dengan kecilnya penggunaan tenaga CPU, berarti penggunaan daya listrik juga lebih kecil dan konsumen masih dapat melakukan pekerjaan lain pada perangkat PC ataupun laptop mereka.
77
Konsumsi RAM (MB) 126 124 122 120 118 116
Konsumsi RAM (MB)
114 112 110 108 VP7
H.264
Gambar 4.5 Grafik Perbandingan Nilai Konsumsi RAM
Pada gambar 4.5 di atas dapat terlihat bahwa konsumsi RAM pada Google Video Chat yang menggunakan codec H.264 juga lebih kecil, yaitu hanya sebesar 114.5 MB dibandingkan konsumsi RAM pada Skype yang menggunakan codec VP7 yang mengkonsumsi RAM sebesar 124.5 MB. Dengan kecilnya penggunaan RAM berarti konsumen dapat membuka program-program lain pada komputer atau laptop mereka karena jumlah RAM yang tidak terpakai masih cukup banyak.
78
Konsumsi Bandwidth (kbps) 900 800 700 600 500 Konsumsi Bandwidth (kbps)
400 300 200 100 0 VP7 H.264
Gambar 4.6 Grafik Perbandingan Nilai Konsumsi Bandwidth
Pada gambar 4.6 di atas terlihat perbandingan nilai konsumsi bandwidth pada kedua codec. Codec H.264 terlihat jauh lebih hemat bandwidth dibandingkan dengan codec VP7. Codec H.264 hanya menggunakan bandwidth sebesar 350.5 kbps sedangkan codec VP7 menggunakan bandwidth sebesar 870 kbps. Dengan kecilnya penggunaan bandwidth, konsumen yang tidak mempunya koneksi internet yang cepat masih dapat menikmati layanan konferensi video yang disediakan oleh Google Video Chat, namun tidak bisa menggunakan layanan konferensi video Skype karena konsumsi bandwidth yang sangat besar.
79
Penggunaan Daya (watt) 60 50 40 30
Penggunaan Daya (watt)
20 10 0 VP7 H.264
Gambar 4.7 Grafik Perbandingan Nilai Penggunaan Daya
Gambar 4.7 di atas adalah gambar grafik yang membandingkan nilai konsumsi daya yang diukur dari penggunaan CPU pada kedua codec. Pada gambar ini dapat terlihat bahwa codec H.264 jauh lebih hemat dalam penggunaan daya, yaitu hanya sebesar 23.25 watt dibandingkan dengan penggunaan daya oleh codec VP7, yaitu sebesar 50.2 watt. Dengan kecilnya penggunaan daya, berarti penggunaan listrik juga lebih kecil dan konsumen dapat melakukan penghematan listrik.
80
BAB V KESIMPULAN DAN SARAN
5.1
Kesimpulan Walaupun berdasarkan penghitungan kualitas codec didapat hasil bahwa
kualitas codec H.264 di bawah codec VP7, yang dapat terlihat pada nilai MOS yaitu sebesar 3.425 berbanding 4.2, namun codec H.264 dapat melakukan memrosesan video dengan jauh lebih hemat sumber daya dibandingkan dengan codec VP7 yaitu sebesar 23.25 watt berbanding 50.2 watt pada penggunaan kerja CPU yang sebesar 19.5% berbanding 40%, sehingga codec H.264 memiliki nilai efisiensi yang lebih besar. Sehingga dapat disimpulkan pula bahwa layanan video conference Google Video Chat adalah layanan konferensi video yang lebih murah dibandingkan dengan layanan video conference Skype.
5.2
Saran Pengembangan dari penelitian perbandingan codec video ini sebaiknya
dilakukan sebagai berikut : 1. Melakukan dengan kondisi yang berbeda dan lebih umum seperti dilakukan terhadap dua client yang terpisah dengan jarak yang lebih jauh sehingga akan tercapai kondisi transmisi yang lebih umum terjadi dalam panggilan video.
81
2. Menggunakan parameter yang berbeda, baik itu jenis codec video yang berbeda
ataupun
menggunakan
codec
yang
sama
namun
diimplementasikan oleh perusahaan lainnya. 3. Membandingkan codec video dalam kondisi selain penggunaannya dalam layanan konferensi video.
82
DAFTAR PUSTAKA
Ngan, K.N., Meier, T. and, Chai, D., 1999, Advanced Video Coding : Principles and Techniques. Elsevier Science B.V. Shannon,
C.
E.,
July,
October,
1948.,
A
Mathematical
Theory
of
Communication, The Bell System Technical Journal, Vol. 27, pp. 379 − 423, 623 − 656, ITU-T Recommendation G.113 Amendment 1., 2009. Provisional Planning Values for the Wideband Equipment Impairment Factor and the Wideband Packet-Loss Robustness Factor. Kovalick, Al, 2009, Video System in an IT Environment : The Basics of Networked Media and File-Based Workflows. Elsevier Science B.V. Richardson, E. G. Iain, 2003, H.264 and MPEG-4 Video Compression: Video Coding for Next-Generation Multimedia, John Wiley and Sons. Rao, K. R., and Yip, Ping, 1990, Discrete Cosine Transform: Algorithms, Advantages, Applications, Academic Press. Tharom, Tobratas, 2002, Buku Pintar Internet : Teknik dan Bisnis VoIP, Elex Media Komputindo. http://www.4i2i.com/h263_video_codec.htm (16-11-2010 pukul 10.42 WIB) http://www.itu.int/ITU-T/publications (18-11-2010 pukul 22.45 WIB) http://lecturer.ukdw.ac.id/anton/download/multimedia4.pdf
(15-11-2010
pukul
23.31 WIB)
83
84
LAMPIRAN I DATA PENGUJIAN EFISIENSI DAN EFEKTIFITAS CODEC
Tabel Data Pengujian codec H.264 pada PC CPU (%)
Bandwidth (kbps)
1.
11
293.7
2.
14
313.6
3.
17
348.2
4.
16
353.5
5.
13
341.4
6.
18
282.2
7.
21
369.3
8.
23
372.1
9.
14
412.2
10.
13
383.8
Rata-rata
16
347
Parameter No.
85
Tabel Data Pengujian codec VP7 pada PC CPU (%)
Bandwidth (kbps)
1.
29
583.4
2.
33
617.3
3.
35
648.5
4.
41
651.7
5.
44
676.6
6.
48
623.8
7.
37
634.2
8.
26
640.1
9.
39
652.2
10.
38
672.2
Rata-rata
37
640
Parameter No.
86
Tabel Data Pengujian codec H.264 pada Laptop CPU (%)
Bandwidth (kbps)
1.
19
332.5
2.
22
321.2
3.
24
347.9
4.
23
353.7
5.
21
372.8
6.
17
364.3
7.
25
358.2
8.
26
371.4
9.
24
361.3
10.
29
356.7
Rata-rata
23
354
Parameter No.
87
Tabel Data Pengujian codec VP7 pada Laptop CPU (%)
Bandwidth (kbps)
1.
33
973.2
2.
36
995.3
3.
32
1024.5
4.
41
1203.7
5.
45
1400.8
6.
49
1375.6
7.
51
1117.5
8.
48
1049.7
9.
47
873.9
10.
48
985.8
Rata-rata
43
1100
Parameter No.
88
LAMPIRAN II Perbandingan Kualitas Gambar pada PC
Google Video Chat pada PC
Skype pada PC
89
Perbandingan Kualitas Gambar pada Laptop
Google Video Chat pada Laptop
Skype pada Laptop
90