JETri, Volume 1, Nomor 2, Februari 2002, Halaman 49-56, ISSN 1412-0372
VIDEO MPEG-1 Henry Candra Dosen Jurusan Teknik Elektro-FTI, Universitas Trisakti Abstract MPEG-1 is one of the standards to encode the information in digital signal. This standard is widely used in many application such audio, video and teleconferencing. The concept of the MPEG-1 video encoding is discussed in this paper to give better understanding to the reader of what MPEG-1 Video, and how it can be more applicable. The benefits of MPEG-1 video encoding are the file size produced is smaller than the source, the standard has been used in many applications, and also the encoding and decoding process are easy to do back and forth. Keywords: MPEG-1, audio/video, teleconferencing, encoding, decoding
1. Pendahuluan Perkembangan dunia teknologi informasi saat ini makin pesat, sehingga informasi tidak lagi hanya dalam bentuk tulisan dan gambar diam saja, tetapi bahkan menggunakan gambar bergerak yang dilengkapi suara. Perkembangan tersebut di atas juga didukung dengan perkembangan teknologi digital, sehingga saat ini telah terjadi peralihan besar-besaran dari sistem analog ke sistem digital. Proses digitalisasi ini juga berpengaruh terhadap sistem pemrosesan gambar bergerak. Sehingga format-format gambar analog pun mulai ditinggalkan dan beralih ke format gambar digital. Salah satu format gambar digital yang banyak dipakai adalah format MPEG, yang telah berkembang dari format MPEG-1 sampai dengan MPEG-7 yang masih dalam penyusunan. Format MPEG-1 menjadi salah satu standard yang dipakai untuk berbagai aplikasi seperti format MPEG-1 audio, format MPEG-1 video, dan juga teleconference. Format ini memiliki rasio kompresi yang cukup besar sehingga file dengan format ini memiliki ukuran yang sangat kecil dibanding dengan data asalnya. Format MPEG-1 video sepanjang durasi 60 menit dapat disimpan dalam media penyimpanan Compact Disc yang disebut Video CD atau VCD, sehingga sangat praktis bila dibandingkan dengan media penyimpanan lain seperti pita kaset video. Untuk dapat memahami proses pada video MPEG-1 maka terlebih dahulu perlu diketahui bebrapa konsep dasar berikut ini.
JETri, Tahun Volume 1, Nomor 2, Februari 2002, Halaman 49-56, ISSN 1412-0372
2. Proses Digitalisasi Gambar Bergerak Bentuk-bentuk tiga dimensi dari dunia nyata ditangkap oleh kamera yang menirukan proses pada mata manusia. Kamera memiliki lensa dan komponen yang peka cahaya. Sinyal yang ditangkap kamera selanjutnya diubah menjadi data digital dengan proses digitalisasi yang terdiri dari dua proses yaitu sampling dan kuantisasi. Proses sampling menggunakan ruang dua dimensi yang dibagi-bagi dalam bagian kecil yang disebut piksel. Proses kuantisasi memberikan harga integer untuk tiap piksel tersebut sesuai amplitudo dari sinyal. Suatu gambar digital dinyatakan dalam matriks, yang merupakan kumpulan dari piksel dalam urutan baris dan kolom tertentu. Piksel merupakan elemen gambar yang di dalamnya memuat informasi tentang komponen intensitas dan warna gambar. Proses sampling pada gambar bergerak dilakukan pada sumbu horisontal, vertikal, dan sumbu waktu. seperti terlihat pada gambar 1 (Poynton, 1996: 4).
Gambar 1. Proses Sampling Gambar Bergerak 3. Sistem Warna Teori Trichromatic menyatakan bahwa hampir semua warna cahaya bisa dihasilkan dari gabungan ketiga cahaya warna primer merah (Red), hijau (Green), dan biru (Blue) atau disingkat RGB (Mattison, 1994: 88). Dari teori trichromatic tersebut diturunkan beberapa sistem warna oleh Commission Internationale de L'Éclairage (CIE). Sistem warna yang dipakai pada video MPEG-1 ini adalah sistem RGB dan sistem YCbCr. Sistem warna merah (Red), hijau (Green), biru (Blue) atau RGB banyak digunakan pada komputer grafik dan sistem imaging. Merah, hijau, dan biru
50
Henry Candra, Video MPEG-1
merupakan tiga warna primer aditif dan dapat digambarkan sebagai sistem koordinat Kartesian tiga dimensi, seperti pada gambar 2 (Jack, 1996: 39). Biru
Cyan
Magenta
Putih
Hijau Hitam Merah
Kuning
Gambar 2. Gambar Kubus Warna RGB Diagonal dari kubus dengan jumlah komponen primer yang sama menghasilkan berbagai variasi tingkat keabuan. Tabel 1 terdiri dari kolom warna dan amplitudo RGB 100 % yang merupakan sinyal tes warna video (Jack, 1996: 40). Tabel 1. Kolom Warna dan Amplitudo RGB 100 % Nilai Nominal R 0 s/d 255 G 0 s/d 255 B 0 s/d 255
Putih Kuning Cyan Hijau Magenta Merah Biru Hitam 255 255 0 0 255 255 0 0 255 255 255 255 0 0 0 0 255 0 255 0 255 0 255 0
Sistem warna RGB lebih banyak dipakai untuk frame buffer grafis, karena CRT berwarna menggunakan phospor merah, hijau, dan biru untuk menghasilkan warna yang diinginkan. Sistem warna YCbCr dibuat berdasarkan rekomendasi ITU-R BT.601 (sebelumnya CCIR 601) yang dikeluarkan pada saat penentuan standart komponen video digital pada tingkat internasional (Jack, 1996: 42). Y adalah merupakan informasi hitam putih dari gambar, sedang informasi warna adalah Cb dan Cr. Nilai Y berkisar antara 16 sampai dengan 235, dan Cb dan Cr memiliki range 16 sampai dengan 240 dengan nilai 128 sebanding dengan nol. Ada beberapa format sampling untuk YCbCr yaitu 4:4:4, 4:2:2, 4:1:1, dan 4:2:0.
51
JETri, Tahun Volume 1, Nomor 2, Februari 2002, Halaman 49-56, ISSN 1412-0372
Persamaan konversi dari sistem RGB ke YCbCr (0:255) dan sebaliknya (Jack, 1996: 43): Y = 0,257R' + 0,504G' + 0,098B' + 16 Cb = -0,148R' - 0,291G' + 0,439B' + 128 Cr = 0,439R' - 0,368G' - 0,071B' + 128
(1)
R' = 1,164(Y-16) + 1,596(Cr-128) G' = 1,164(Y-16) - 0,813(Cr-128) - 0,392(Cb-128) B' = 1,164(Y-16) + 2,017(Cb-128)
(2)
Format YcbCr digunakan pada standard kompresi MPEG-1 video. Pada sistem ini diterapkan reduksi Cb dan Cr sebesar 2 : 1 pada arah vertikal dan horisontal.
4. MPEG-1 Video Encoding MPEG adalah kependekan dari Motion Picture Expert Group. MPEG-1 digunakan pada internet dan CD-ROM, Video CD, dan Video Conferencing. Data diencoding dengan kecepatan 1,5 Mbps, yang merupakan kecepatan yang dapat dicapai pada CD-ROM drive dengan kecepatan dua kali. Kecepatan ini merupakan kecepatan untuk gambar dan suara. Dari kompresi ini diharapkan dapat diperoleh kualitas gambar bergerak setara dengan video VHS. Beberapa point penting pada proses kompresi MPEG-1 adalah : skema video berdasarkan blok, beberapa gambar tertentu dikompresi dengan format JPEG, dan adanya temporal redundancy antara frame yang digunakan. Point penting tersebut dapat dijabarkan sebagai berikut: 1. Transformasi sistem warna RGB ke sistem warna YCbCr, yaitu dengan cara men-downsampling komponen chrominance Cb dan Cr. Standart untuk downsampling rate pada MPEG-1 adalah 4 : 2 : 0. 2. Dekorelasi lokal yang meliputi proses macroblock, DCT, zig-zag scan, quantizing, run length coding , dan Huffman coding. 3. Displaced Frame Difference (DFD), yang berarti bahwa tiap jenis gambar yang berbeda dikompresi dengan teknik yang berbeda. Ketiga proses yang disebutkan di atas bukan merupakan urut-urutan proses, tetapi proses yang harus dilakukan untuk kompresi MPEG-1. Jenis frame pada MPEG-1 dibagi dua jenis besar Intra Picture dan Inter Picture. Keduanya meliputi 4 jenis frame yang harus dikodekan pada
52
Henry Candra, Video MPEG-1
kompresi MPEG-1. Frame jenis pertama adalah I (Intra) frame (~1bit/piksel), merupakan gambar yang dikodekan sebagai suatu gambar diam yang berdiri sendiri. Frame jenis kedua adalah P (Predicted) frame (~0.1 bit /piksel) dikodekan relatif terhadap frame I atau P terdekat sebelumnya, menghasilkan proses prediksi ke depan (forward). P frame mengalami proses kompresi yang lebih besar dari I, dengan adanya kompensasi gerak (motion compensation). Frame jenis ketiga adalah B (Bidirectional) frame (~0.015bit/piksel) menggunakan frame I atau P terdekat baik dari sebelumnya atau sesudahnya sebagai referensi, menghasilkan prediksi dua arah (forward dan backward). Frame B memiliki kompresi terbesar dan dapat mengurangi noise karena mengambil rata-rata dari dua gambar. Frame jenis keempat adalah D (DC) frame merupakan frame yang dikodekan sebagai suatu gambar diam yang berdiri sendiri dengan hanya menggunakan komponen DC dari DCT. Frame D tidak harus selalu terdapat pada suatu sekuensial yang memuat frame jenis lain, dan jarang digunakan. Group of Pictures (GOP) adalah merupakan suatu deretan dari satu atau lebih frame yang telah terkodekan yang bertujuan untuk memudahkan proses akses atau proses edit. Sebagai contoh GOP dapat berupa deretan frame-frame IBBPBBPBBPBBI. Ada juga GOP: IBPBPBI. Semakin tinggi frekuensi dari gambar P dan B semakin rendah kualitas gambar, tetapi semakin tinggi rasio kompresinya. Nilai GOP dikonfigurasi selama proses encoding. Hal ini diperlihatkan pada gambar 3 pada halaman berikut (Jack, 1996: 460). Proses MPEG-1 encoding secara kesuluruhan diperlihatkan pada blok diagram pada gambar 4. pada halaman berikut ini. Proses ini dilakukan untuk tiap jenis frame. 4.1. RGG to YcbCr Karena sistem warna yang digunakan pada MPEG-1 adalah sitem warna YcbCr maka sistem warna RGB yang biasanya berasal dari kamera atau alat input yang lain harus dikonversi terlebih dahulu ke dalam sistem warna YcbCr dengan menggunakan persamaan 1 di atas.
53
JETri, Tahun Volume 1, Nomor 2, Februari 2002, Halaman 49-56, ISSN 1412-0372
4.2. Macroblock Setelah diperoleh sinyal informasi dalam sistem warna YcbCr maka dilakukan proses macroblock yang membagi sebuah gambar menjadi blokblok berukuran 16 x 16 (macroblock). Tiap macroblock tersebut dibagi lagi menjadi macroblock yang lebih kecil yaitu 16 piksel x 16 line. Selanjutnya macroblock yang lebih kecil ini dibagi menjadi 4 buah blok berukuran 8 piksel x 8 line. Forward Prediciton FrameDisplay Order
Frame Transmit Order
1
2
3
4
5
6
7
1
3
4
2
6
7
5
Bidirectional Prediction Intra Frame
Predicted Frame
Bidirectional Frame
Gambar 3. Contoh Deretan GOP dengan 3 Jenis Frame
RGB to YCbCr
YCbCr
MACROBLOCK
DCT
HUFFMAN CODING
RUN LENGTH CODING
QUANZATION
ZIG-ZAG SCAN
Gambar 4. Blok Diagram MPEG-1 Encoding 4.3. DCT Proses selanjutnya yaitu setiap 8 x 8 blok yang telah diperoleh diproses dengan DCT (Discrete Cosine Transform) pada arah horisontal dan vertikal (DCT dua dimensi) menghasilkan komponen koefisien frekuensi horisontal dan vertikal dari blok 8 x 8 tersebut.
54
Henry Candra, Video MPEG-1
Persamaan DCT dua dimensi dapat dilihat pada persamaan 3 berikut ini (Tekalp, 1995: 380).
S (k1 , k 2 )
N 1 4 C ( k ) C ( k ) 1 2 N2 n1 0
N 1
s(n1 , n2 ) cos( n2 0
(2n1 1)k1 ( 2n 2 1 ) cos( ) 2N 2N
(3)
di mana k1, k2, n1, n2 = 0, 1, …, N-1, dan
C (k )
1/ 2 1
untuk k
0,
untuk k yang lain
4.4. Quantizing Proses quantizing mengkuantisasi komponen koefisien frekuensi horisontal dan vertikal dari blok 8 x 8, menghilangkan komponen frekuensi tinggi yang tidak dapat dibedakan oleh mata manusia, karena makin tinggi frekuensinya makin banyak dihasilkan deretan koefisien bernilai nol. Tiap macroblock menggunakan nilai kuantisasi yang berbeda-beda. 4.5. Zig Zag Scan Zig Zag scan dilakukan mulai dengan komponen DC (frekuensi nol), dilanjutkan dengan frekuensi yang makin besar untuk mendapatkan suatu deretan linier dari koefisien frekuensi, Zig zag scan ini menghasilkan deretan koefisien yang banyak mengandung deret nol yang panjang. 4.6. Run Length Coding Deretan linier yang dihasilkan oleh zig zag scan diubah menjadi pasangan deret run, versus amplitudo. Tiap pasang deret tersebut menunjukkan jumlah koefisien nol dan diakhiri oleh amplitudo dari koefisien yang tidak nol. 4.7. Huffman Coding Sebagai proses terakhir adalah Huffman Coding untuk mendapatkan deret yang lebih pendek. Pasangan dari run dan amplitudo dikodekan dengan panjang yang berbeda-beda. Prosedur ini menghasilkan kode yang
55
JETri, Tahun Volume 1, Nomor 2, Februari 2002, Halaman 49-56, ISSN 1412-0372
singkat untuk pasangan yang sering muncul, dan kode yang lebih panjang untuk pasangan yang jarang. Demikianlah proses MPEG-1 encoding. Proses encoding ini sedikit berbeda untuk setiap jenis frame I, P, atau B. Sedang proses Decoding dari MPEG-1 tersebut dapat diperoleh dengan membalik semua proses pada encoding-nya. 5. Kesimpulan Dari uraian dan pembahasan yang telah dijelaskan panjang lebar diatas dapat diambil kesimpulan sebagai berikut : 1. MPEG-1 video merupakan salah satu format video digital yang paling banyak digunakan dalam penyimpanan data atau informasi berupa gambar bergerak. 2. Teknik MPEG-1 video sangat efektif karena dapat memperkecil ukuran file gambar bergerak yang sangat besar menjadi ukuran file yang dapat disimpan dalam media CD. 3. Proses encoding dan decoding pada MPEG-1 video sangat mudah karena proses yang satu dapat dilakukan dengan membalik proses yang lain. Daftar Pustaka 1. Jack, Keith. 1996. Video Demystified: A Handbook for The Digital Engineer, 2nd Edition, Virginia: LLH Technology Publishing. 2. Mattison, Phillip E. 1994. Practical Digital Video with Programming Examples in C,. Canada: John Wiley & Sons Inc. 3. Poynton, Charles A. 1996. Technical Introduction to Digital Video, Canada: John Wiley & Sons Inc. 4. Tekalp, A. Murat. 1995. Digital Video Processing, New Jersey: Prentice Hall.
56