DAFTAR SINGKATAN
HAS
: Human Auditory System
HVS
: Human Visual System
SVD
: Singular Value Decomposition
QIM
: Quantization Index Modulation
BER
: Bit Error Rate
MOS
: Mean Opinion Score
ODG
: Objective Difference Grade
SNR
: Signal to Noise Ratio
xii
BAB I PENDAHULUAN
1.1.
Latar Belakang Perkembangan jaringan internet dan teknologi multimedia yang tidak dapat
dihindari mengakibatkan persebaran informasi dalam format data digital menjadi lebih mudah. Setiap pengguna jaringan dapat dengan bebas mengirim, menerima, ataupun menyalin data (citra, video, dan audio) digital. Pertukaran data secara bebas ini menimbulkan masalah tentang pelanggaran atas hak cipta. Sehingga perlu adanya cara untuk menghindari pertukaran data secara bebas dengan memperhatikan aspek hak cipta dari pembuat data digital yang asli. Salah satu teknik yang dapat ditempuh untuk perlindungan hak cipta pada data digital adalah digital watermarking. Digital watermarking merupakan teknik penyisipan sebuah data watermark ke dalam data host digital sedemikian sehingga hasil penyisipan tersebut tidak dapat dideteksi oleh indera manusia. Digital watermarking memanfaatkan kelemahan pada HAS (Human Auditory System) dan HVS (Human Visual System). Karena HAS memiliki sensitivitas yang lebih dibandingan HVS, digital watermarking dengan menggunakan data digital berupa sinyal audio memiliki tantangan yang lebih dibandingkan data digital berupa citra atau video. Bila data digital berupa suara atau sinyal audio, maka proses penyisipan data watermark ke dalam data host berupa audio digital disebut dengan audio watermarking. Dalam audio watermarking, proses penyisipan data watermark dilakukan tanpa mengganggu kualitas dari file audio digital tersebut. Berbagai data watermark dapat disisipkan, sebagian besar menggunakan data watermark berupa teks karena kapasitas penyisipan dari algoritma terbatas. Bila data watermark berupa citra maka lebih mudah dikenali ketika terkena distorsi. Penyisipan data watermark baik berupa teks maupun citra ke dalam audio digital tanpa mempengaruhi kualitasnya dapat digunakan sebagai hak cipta atau bukti kepemilikan dari file audio digital tersebut. Namun, bagaimana proses penyisipan data watermark berupa citra ke dalam audio digital tanpa mempengaruhi kualitas audio digital dan batas ketahanan data watermark terhadap distorsi. Hal ini yang menjadi salah satu dasar dalam menyusun Tugas Akhir ini. 1
Pada Tugas Akhir ini, dilakukan implementasi dan analisis blind audio watermarking menggunakan SVD (Singular Value Decomposition). Metode SVD dipilih karena operasionalnya yang mudah dan efektif untuk perlindungan hak cipta pada data audio digital [10]. Dalam penelitian sebelumnya [7], data host dan data watermark yang digunakan sama-sama berupa citra. Sedangkan pada Tugas Akhir ini berbeda, data host yang digunakan berupa audio digital dan data watermark berupa citra hitam putih, dengan ukuran 32 x 32 piksel. Citra hitam putih tersebut disisipkan kedalam file audio digital. Selanjutnya dilakukan pengukuran kualitas file audio yang telah melalui sistem watermarking dengan parameter ODG, SNR, dan MOS. Untuk kualitas dari data watermark hasil ekstraksi diukur menggunakan parameter BER. Dilakukan juga pengujian
ketahanan (robustness test)
dengan memberikan beberapa serangan (attack) pada data host terwatermark. 1.2.
Perumusan Masalah Permasalahan yang dijadikan objek penelitian dalam Tugas Akhir ini yaitu :
1.
Bagaimana mengimplementasikan sistem blind audio watermarking dengan menggunakan metode SVD?
2.
Bagaimana kualitas data host dari hasil sistem blind watermarking dengan menggunakan metode SVD?
3.
Bagaimana kualitas dari data watermark hasil ekstraksi?
4.
Bagaimana hasil pengujian ketahanan (robustness test) dari sistem blind audio watermarking bila diberi beberapa macam serangan (attack)?
1.3.
Tujuan Tujuan Tugas Akhir ini antara lain sebagai berikut :
1.
Mengimplementasikan dan menganalisis sistem blind audio watermarking dengan menggunakan metode SVD.
2.
Melakukan pengujian kualitas data host dari hasil sistem blind audio watermarking dengan menggunakan metode SVD.
3.
Melakukan pengujian terhadap kualitas data watermark hasil ekstraksi.
4.
Menguji ketahanan sistem blind audio watermarking yang dibuat bila diberikan beberapa macam serangan.
2
1.4.
Batasan Masalah Adapun ruang lingkup pada Tugas Akhir ini dibatasi pada :
1.
Implementasi sistem dilakukan dengan menggunakan aplikasi Matlab versi R2014a.
2.
Data watermark yang disisipkan berupa citra hitam putih dengan ukuran 32 x 32 piksel.
3.
File audio yang digunakan sebagai data host dalam pengujian sistem hanya berjumlah 5 file audio digital.
4.
Setiap file audio digital yang diujikan merupakan audio mono 16 bit, memiliki format WAV, sampling rate 44.1 kHz, serta panjang durasi 5,94 detik.
5.
Serangan yang digunakan dalam pengujian ketahanan (Robustness) sistem yang dibuat hanya untuk serangan Noise Addition, LPF (Low Pass Filter), Linier Speed Change, MP3 Compression, dan MP4 Compression.
1.5.
Metodologi Penelitian Metode penelitian yang digunakan dalam Tugas Akhir ini mencakup hal-hal
sebagai berikut : 1.
Studi Literatur Tahapan ini bertujuan untuk mengumpulkan data dan informasi tentang watermarking secara umum, pengolahan matriks SVD, teknik penyisipan QIM, dan referensi tentang Matlab untuk membangun sistem blind audio watermarking.
2.
Analisa Masalah Pada tahap ini dilakukan analisa terhadap permasalahan berdasarkan data-data yang ada dan mencari solusi dengan berdiskusi bersama pembimbing.
3.
Perancangan dan Implementasi Sistem Memulai perancangan dan implementasi sistem blind audio watermarking berdasarkan hasil diskusi dengan pembimbing di tahap sebelumnya, dan kemudian mengimplementasikannya pada software Matlab R2014a.
4.
Pengujian dan Analisis Hasil Melakukan pengujian terhadap sistem yang telah dibuat dan melakukan analisis data hasil pengujian yang dilakukan berdasarkan parameter-parameter yang ditentukan. 3
5.
Penarikan Kesimpulan Setelah melakukan semua tahap diatas dan mendapatkan hasil analisis, maka dilakukan penarikan kesimpulan terhadap Tugas Akhir yang telah dilakukan.
1.6.
Sistematika Penulisan Secara umum sistematika penulisan buku Tugas Akhir ini adalah sebagai berikut :
BAB I PENDAHULUAN Berisi tentang latar belakang, perumusan masalah, tujuan penelitian, batasan masalah, metodologi penelitian, dan sistematika penulisan yang digunakan pada Tugas Akhir ini. BAB II DASAR TEORI Bab ini berisi tentang dasar-dasar teori yang berhubungan dengan permasalahan yang dibahas pada Tugas Akhir ini. BAB III PERANCANGAN DAN IMPLEMENTASI SISTEM Berisi tentang pembahasan perancangan desain sistem yang digunakan serta implementasinya dalam bentuk simulasi. BAB IV PENGUJIAN DAN ANALISIS SISTEM Bab ini berisi pembahasan mengenai pengujian sistem dan analisis dari hasil pengujian sistem berdasarkan parameter – parameter yang telah ditentukan sebelumnya. BAB V KESIMPULAN DAN SARAN Berisi tentang kesimpulan dan saran yang dapat diambil dari pengerjaan Tugas Akhir ini.
4
BAB II DASAR TEORI
2.1.
Digital Watermarking Watermarking adalah salah satu cabang ilmu yang mempelajari teknik
penyembunyian informasi. Terkadang teknik watermarking disebut juga sebagai sinonim dari Steganography karena sama – sama mempelajari tentang teknik penyembunyian data. Namun, terdapat perbedaan yang sangat jauh antara watermarking dan steganography. Steganography menyisipkan informasi yang tampak, namun susah (diharapkan tidak mungkin) dideteksi jika tempat penyembunyian datanya tidak diketahui. Watermark dapat dibedakan menjadi beberapa jenis, yaitu [7] : 1. Berdasarkan Robustness (ketahanan) terhadap serangan a. Fragile : watermark tidak tahan terhadap serangan. Jika suatu watermark tidak terdeteksi atau salah, maka media telah mengalami perubahan. b. Semi-fragile : watermark tahan terhadap beberapa serangan. c. Robust : watermark tahan terhadap usaha-usaha menghilangkan watermark. 2. Berdasarkan Proses Deteksi atau Ekstraksi
a. Non-blind : proses ekstraksi dan deteksi dilakukan dengan menggunakan citra asli dan juga kunci.
b. Semi-blind : pada proses deteksi dan ekstraksi dilakukan dengan menggunakan suatu kunci dan informasi watermark.
c. Blind : proses ekstraksi dan deteksi dilakukan hanya dengan menggunakan suatu kunci tertentu tanpa memerlukan informasi watermark maupun media aslinya. Digital watermarking adalah sebuah teknik dimana sebuah informasi disisipkan kedalam sebuat set host-data (citra, video, audio) dengan cara tertentu sehingga informasi tersebut tidak mengganggu penggunaan host-data secara normal dan tidak dapat dilepaskan
5
dengan cara yang biasa [1]. Sebagai contoh, jika sebuah informasi disisipkan ke dalam audio , maka telinga tidak dapat mendengar informasi tersebut. Ada beberapa syarat karakteristik untuk dapat mengoptimalkan sistem digital watermarking. Karakteristik yang harus dipenuhi tersebut antara lain [5]: 1. Percetual transcparancy : Informasi yang telah disisipkan seharusnya tidak menurunkan kualitas dari host-data yang disisipkan. Tidak boleh terdengar oleh telinga atau telihat oleh mata (imperceptible). 2. Robustness (ketahanan) : Informasi yang disisipkan harus mempunyai ketahanan terhadap berbagai jenis serangan pada watermark. Dan informasi tersebut harus dapat diterima kembali di decoder dengan benar. 3. Security (keamanan) : Informasi yang disisipkan sulit untuk dilepaskan dari hostdata bahkan setelah mengalami berbagai macam serangan. 4. Data Rate/Payload/Bit Rate : Jumlah informasi yang disisipkan. 5. Verification and Reliability : Watermark harus mampu mem-verifikasi dan menyediakan bukti yang terpercaya untuk pembuktian suatu produk. Dan masih banyak lagi yang menjadi karakteristik lain dalam watermark. Berdasarkan karakteristik tersebut, penggunaan watermark juga memiliki banyak tujuan. Tujuan penggunaan yang paling sering dilakukan antara lain : 1. Copyright Protection / proof of ownership : untuk pembuktian hak cipta sesuatu. 2. Tamper Detection : untuk mendeteksi apakah perusakan pada data asli. 3. Copy Protection : untuk mengontrol hak peng-copy an suatu data asli. 4. Finger Printing : untuk melacak file yang di-copy secara illegal. 5. Broadcast Monitoring : untuk memonitor suatu sinyal yang di broadcast. 6. Information Carrier : watermark digunakan sebagai pembawa informasi. 2.1.1.
Proses Watermarking Watermarking secara umum terdiri dari 2 jenis proses, yaitu [1]: Embedding process : Proses penyisipan informasi Extraction process : Proses pengekstraksian/ pengambilan informasi.
6
Watermark Key
Cover Signal
Embedder
Watermark Key
Transmission or Recording Water mark Signal
Water mark Signal
Extractor
Embedded data
Embedded data
Gambar 2.1 Diagram blok proses watermarking[1]
Pada gambar 2.1 diatas bisa dilihat 2 proses yang dilakukan pada watermarking. Pada proses embedder (penyisipan) terdapat 3 inti yaitu, embedded data sebagai informasi yang akan disisipkan, cover signal sebagai host-data yang akan disisipkan informasi, dan watermark key yang berfungsi sebagai kunci parameter utama pada algoritma penyembunyian data untuk menyembunyikan informasi di cover signal. Setelah proses embedder dilakukan, dihasilkan sebuah keluaran berupa sinyal yang telah disisipi informasi menggunakan watermark key, atau biasa disebut juga sebagai watermark signal. Watermark signal ini kemudian ditransmisikan atau direkam sehingga sampai pada penerima. Pada penerima akan dilakukan proses ekstraksi atau proses pengambilan data dengan menggunakan watermark key untuk pengambilan data sehingga didapatkan kembali informasi yang disisipkan tersebut. Informasi yang dihasilkan dari proses ekstraksi ini bergantung pada karakteristik watermarking yang sebelumnya sudah dijelaskan agar mendapatkan hasil informasi yang sesuai dengan informasi yang dikirimkan [1]. 2.1.2.
Audio Watermarking Audio Watermarking adalah proses watermarking yang dilakukan pada sinyal
audio. Watermarking pada sinyal audio memiliki tantangan yang lebih dibandingkan dengan watermaking pada citra atau video. Watermarking pada audio memanfaatkan kelemahan pada Human Auditory System (HAS) yang dikenal juga sebagai audio masking. Akan tetapi, HAS memiliki sensitivitas yang lebih dibandingan Human Visual System (HVS). Hal ini disebabkan karena HAS bekerja pada jarak yang cukup luas, sehingga untuk mendapatkan suara yang tidak terdengar jauh lebih sulit dibandingkan dengan gambar yang tidak terlihat[2]. 7
Berdasarkan domain penyisipannya, teknik watermarking pada audio dapat dibagi menjadi dua kelompok, yaitu teknik temporal watermarking dan teknik spectral watermarking. Temporal watermarking adalah melakukan penyisipan data pada audio host dalam domain waktu, sedangkan spectral watermarking terlebih dulu melakukan proses transformasi dari domain waktu ke dalam domain frekuensi, sehingga penyisipannya dilakukan pada elemen-elemen frekuensi. Metode audio watermarking dibagi berdasarkan domain yaitu [2]: 1)
Domain Waktu Metode ini bekerja dengan cara mengubah data audio dalam domain waktu yang
akan disisipkan watermark. Contohnya dengan mengubah LSB (Least Significant Bit) dari data tersebut. Secara umum metode ini rentan terhadap proses kompresi, transmisi dan encoding. Beberapa teknik algoritma yang termasuk dalam metode ini adalah: a)
Compressed-domain watermarking : Pada teknik ini hanya representasi data
yang terkompresi yang diberi watermark. Saat data di uncompressed maka watermark tidak lagi tersedia. b)
Bit dithering : Watermark disisipkan pada tiap LSB, baik pada representasi
data terkompresi atau tidak. Teknik ini membuat derau pada sinyal. c)
Modulasi Amplitudo : Cara ini membuat setiap puncak sinyal dimodifikasi
agar jatuh ke dalam pita-pita amplitudo yang telah ditentukan. d)
Penyembunyian Echo: Dalam metode ini salinan-salinan terputus-putus dari
sinyal dicampur dengan sinyal asli dengan rentang waktu yang cukup kecil. Rentang waktu ini cukup kecil sehingga amplitudo salinannya cukup kecil sehingga tidak terdengar. 2)
Domain Frekuensi Metode ini bekerja dengan cara mengubah konten spektral dalam domain frekuensi
dari sinyal seperti membuang komponen frekuensi tertentu atau menambahkan data sebagai derau dengan amplitudo rendah sehingga tidak terdengar. Beberapa teknik yang bekerja dengan metode ini : a)
Phase coding : Bekerja berdasarkan karakteristik sistem pendengaran
manusia yang mengabaikan suara yang lebih lemah jika dua suara datang
8
bersamaan. Data watermark dibuat menjadi derau dengan amplitudo yang lebih lemah dibandingkan amplitudo data audio lalu digabungkan. b)
Modifikasi Pita Frekuensi : Informasi watermark ditambahkan dengan cara
membuang atau menyisipkan ke dalam pita-pita (band) spektral tertentu. c)
Penyebaran spektrum : metode ini diadopsi dari teknik penyebaran spektrum
dalam telekomunikasi. d)
Frequency masking : dengan memanfaatkan kelemahan pendengaran
manusia yang tidak dapat mendengar pada frekuensi tertentu. 2.2.
Singular Value Decomposition (SVD) Singular Value Decompositon (SVD) adalah pemfaktoran dari matriks segi empat
riil atau kompleks, dan pemanfaatannya banyak dilakukan dalam pengolahan sinyal maupun statistika. SVD sendiri berbasiskan teorema aljabar linear yang menyatakan bahwa matrik segiempat A dapat didekomposisi menjadi 3 buah matriks yaitu sebuah matriks orthogonal U, sebuah matriks diagonal S, dan sebuah matriks transpose V yang orthogonal. Misalkan A adalah matriks segiempat berukuran M×N, dekomposisi nilai singular dapat dilihat melalui persamaan berikut [7] :
=
(2.1)
Dimana : U : Vektor eigen dari AAT. Matriks U adalah matrik yang orthogonal berukuran M × M. Matriks U ini dikenal sebagai matriks singular kiri. S : Matriks diagonal dari eigen matriks AAT dan ATA yang berdimensi M × N, dimana S = √ . V : Vektor eigen dari ATA. Matriks V adalah matrik yang orthogonal berukuran N × N. Matriks V ini dikenal sebagai matriks singular kanan. Misalkan ui adalah kolom-kolom matriks U dan vi adalah kolom-kolom matriks V, dengan demikian persamaan dapat ditulis [7] :
= ∑
(2.2)
Dengan : A : matriks berdimensi M × N K : rank matriks A 9
ρi : nilai singular ke-i ui : kolom matriks U ke-i vi : kolom matriks V ke-i 2.3.
Quantization Index Modulation (QIM) Metode watermarking dengan skema QIM diperkenalkan Brian Chen dan Gregory
W. Wornell pada tahun 1999. Quantization Index Modulation adalah suatu skema penyisipan watermark dengan tahapan : 1.
Memodulasi watermark dalam suatu indeks atau himpunan indeks. Hasilnya kemudian disebut dengan quantizer. [8]
2.
Mengkuantisasi sinyal host pada frekuensi tertentu dengan quantizer yang sesuai, sesuai dengan nilai watermark yang akan disisipkan pada sinyal tersebut. [8]
Misalkan sebuah watermark w yang disusun oleh sekumpulan karkater ni hendak disisipkan kesebuah sinyal y yang disusun oleh cj, menggunakan metode QIM. Maka sebelumnya harus disediakan quantizer sejumlah n, yang kemudian setiap quantizer akan diindeks sesuai dengan karakter watermark yang ada. Jika ni hendak disisipkan pada sinyal y diposisi cj, maka nilai cj akan dikuantisasi nilainya kenilai yang dirujuk oleh quantizer kei. 2.4.
Audio Digital Komputer hanya mampu mengenal sinyal dalam bentuk digital. Bentuk digital yang
dimaksud adalah tegangan yang diterjemahkan dalam bilangan biner atau binary digit (bit). Satu bit bisa merepresentasikan dua nilai, “0” dan “1” atau 8 bit, yang merepresentasikan 256 nilai. Komputer mampu mengolah bit-bit ini menjadi sebuah deretan bit, kemudian menerjemahkan deretan bit tersebut menjadi informasi yang bernilai. Komputer mengukur amplitudo pada satuan waktu tertentu untuk menghasilkan sejumlah angka. Tiap satuan pengukuran ini disebut “sample”. Analog to Digital Converter (ADC) adalah proses
mengubah amplitudo gelombang bunyi ke dalam waktu interval tertentu (sampling), sehingga
menghasilkan
representasi
digital
dari
suara.
Dalam
teknik
sampling dikenal istilah sampling rate yaitu beberapa gelombang yang diambil dalam satu 10
detik. Sebagai contoh jika kualitas CD Audio dikatakan memiliki frekuensi sebesar 44100 Hz, berarti jumlah sample sebesar 44100 per detik. Teknik sampling yang umum pada file audio seperti Nyquist Sampling Rate dimana untuk memperoleh representasi akurat dari suatu sinyal analog secara lossless, harus diambil sample pada amplitudo setidaknya pada kecepatan (rate) sama atau lebih besar 2 kali lipat dari komponen frekuensi maksimum yang akan didengar. Misalnya untuk sinyal analog dengan bandwidth 10 Hz – 5 kHz, maka sampling rate = 2 x 5 kHz = 10 kHz [4]. 2.4.1.
File WAV File WAV atau singkatan dari waveform audio format adalah suatu istilah dalam
bahasa inggris yang berarti format audio gelombang. WAV adalah format audio standar yang dikembangkan oleh Microsoft dan IBM dengan ekstensi *.wav yang memiliki komponen durasi, channel, bit depth, dan sample rate [6] : 1.
Durasi : panjang data suara yang sudah diubah ke dalam bentuk audio digital.
2.
Channel : atau kanal menyatakan banyaknya suara yang tersimpan dalam sebuah file audio. Channel terdiri dari mono dan stereo. Mono adalah tipe channel yang hanya memiliki satu buah suara saja. Sedangkan stereo adalah tipe channel yang mempunyai dua buah suara dalam sebuah file audio.
3.
Sample Rate : menunjukan besarnya frekuensi sampling yang digunakan ketika mengubah sinyal suara analog menjadi digital melalui proses ADC. Semakin besar sample rate yang digunakan file audio digital yang dihasilkan akan semakin baik kualitasnya, namun kapasitas penyimpanan yang diperlukan juga semakin besar. Beberapa file audio digital memiliki standar sampling rate. Untuk perekaman suara bicara manusia (speech) menggunakan sample rate 8000 Hz, untuk suara audio musik menggunakan sample rate 44100 Hz, dan untuk radio FM menggunakan sample rate sebesar 22500 Hz.
4.
Bit Depth : menunjukkan jumlah bit kuantisasi yang digunakan saat proses ADC. Proses kuantisasi adalah pembulatan nilai-nilai pada sinyal analog sebelum diterjemahkan ke dalam bilangan biner. Semakin besar bit depth yang digunakan, maka proses kuantisasi akan semakin baik dan error kuantisasi akan berkurang.
11
2.5.
Citra Digital Pada dasarnya citra terdiri atas 2 jenis: citra kontinu dan citra diskrit. Citra kontinu
adalah citra yang dihasilkan oleh sistem optik yang dapat menerima sinyal analog, seperti mata. Sedangkan citra digital adalah citra yang dihasilkan melalui proses digitalisasi dari citra kontinu. Citra digital merupakan hasil gambar analog dua dimensi yang kontinu dan melalui proses sampling terlebih dahulu. Data yang dihasilkan dapat bersifat optik yaitu foto, bersifat analog yaitu sinyal-sinyal video (gambar yang terdapat pada monitor televisi), atau dapat bersifat digital yang dapat langsung disimpan dalam pita magnetik. Citra digital dapat didefinisikan sebagai fungsi dua variabel, f(x,y), dimana x dan y adalah koordinat spasial dan intensitas citra pada koordianat tersebut diwakili oleh nilai f(x,y). Hal tersebut diilustrasikan pada Gambar 2.2. Kotak terkecil yang memilki satu nilai intensitas f(x,y) disebut piksel[7].
Gambar 2.2 Sistem koordinat citra digital[3]
2.5.1.
Citra Hitam Putih Citra hitam putih atau citra biner adalah citra dimana piksel-pikselnya hanya
memiliki dua buah nilai intensitas yaitu bernilai 0 dan 1, dimana 0 menyatakan warna latar belakang (background) dan 1 menyatakan warna tinta/objek (foreground). Setiap piksel pada citra hitam putih direpresentasikan dengan 1 bit[3]. Contoh sebuah citra hitam putih seperti pada Gambar 2.3.
Gambar 2.3 Citra hitam putih[3]
12