PENDAHULUAN Latar Belakang Perkembangan teknologi jaringan dan teknik kompresi data audio mempermudah penyalinan dan penyebaran data audio secara ilegal (Alfatwa 2006). Perkembangan teknologi informasi internet dan multimedia digital menyebabkan perlindungan hak cipta menjadi sebuah permasalahan yang penting. Teknik digital watermarking dianggap sebagai solusi yang efektif untuk mengatasi permasalahan ini (Ma et al. 2008). Digital watermarking dilakukan untuk menyisipkan watermark pada data digital sehingga dapat melindungi hak ciptanya. Watermark merepresentasikan informasi mengenai pencipta atau pemilik resmi data digital. Watermark dapat berupa logo perusahan atau tanda tangan. Watermarking dilakukan sedemikian sehingga tidak merusak data aslinya dan diharapkan orang yang membuka data tidak menyadari adanya watermark. Proses ekstraksi akan menghasilkan kembali watermark yang telah disisipkan. Watermark ini dibandingkan dengan watermark pemilik hak cipta untuk membuktikan hak ciptanya (Alfatwa 2006). Pada penelitian ini, digunakan dua watermark, yaitu sinyal audio Region of Interest (ROI) dan sebuah citra biner berupa logo. Kedua watermark pada awalnya digabung dan dienkripsi kemudian disisipkan ke dalam komponen yang dihasilkan dari proses lift wavelet transform (LWT) sebanyak beberapa level terhadap host audio. Proses ekstraksi dilakukan dengan menggunakan metode fast-fixed point Independent Component Analysis (FastICA). Metode ICA digunakan untuk melakukan pemisahan sinyal audio tercampur. Data audio yang mudah tersebar juga dapat mengalami kerusakan. Meskipun terjadi kerusakan pada watermarked audio, ekstraksi watermark harus menghasilkan watermark yang sama dengan watermark aslinya. Penggunaan metode pada penelitian ini dapat melokalisasi kerusakan yang terjadi pada watermarked audio. Tujuan Tujuan penelitian ini adalah: 1 mengetahui cara kerja watermarking menggunakan teknik penggabungan ROI audio dan citra biner sebagai watermark,
2 mengetahui cara kerja lokalisasi kerusakan pada watermarked audio, 3 membuktikan keunggulan teknik ini dalam perlindungan hak cipta dan lokalisasi kerusakan, dan 4 melakukan analisis uji ketahanan pada teknik ini. Ruang Lingkup Data yang digunakan dalam penelitian ini adalah audio dan citra. Audio yang akan disisipi watermark merupakan monoaudio dengan format *.wav yang jika dibaca menggunakan MATLAB akan menghasilkan matriks berukuran 65536×1 dengan sample rate 44100 Hz. Citra yang digunakan adalah citra dengan ukuran 5 KB dan dimensi citra 243×341 pixel. Analisis uji ketahanan dilakukan dengan melakukan resampling, requantizing, lowpass filtering, white noising pada watermarked audio, dan pengubahan format audio menjadi *.mp3. Resampling dilakukan dengan mengubah sample rate pada watermarked audio menjadi 22050 Hz, 42000 Hz, 43000 Hz, 45000 Hz, dan 46000 Hz. Requantizing dilakukan dengan mengubah bits per sample menjadi 8 bit, 24 bit, dan 32 bit. White noise yang akan diberikan pada watermarked audio adalah sepanjang 0.008018 detik.
TINJAUAN PUSTAKA Watermarking Watermarking merupakan bentuk dari steganografi. Steganografi adalah ilmu yang mempelajari cara menyembunyikan suatu data pada data lain. Watermarking merupakan suatu cara untuk menyembunyikan atau menanamkan data atau informasi tertentu ke dalam data digital lain yang tidak diketahui kehadirannya oleh indera manusia dan mampu menghadapi proses-proses pengolahan sinyal digital sampai pada tahap tertentu (Supangkat et al. 2000). Data atau sinyal digital yang akan disisipkan watermark disebut host data, sedangkan data yang sudah disisipkan watermark disebut watermarked data. Watermarking memiliki beberapa tujuan antara lain (Supangkat et al. 2000): 1
Tamper-proofing Watermarking digunakan sebagai alat identifikasi atau indikator yang menunjukkan data digital (host) telah mengalami perubahan dari aslinya. 1
2
Feature location Watermarking digunakan sebagai alat identifikasi isi dari data digital pada lokasi-lokasi tertentu, misalnya penamaan objek tertentu dari beberapa objek yang lain pada suatu citra digital.
3
Annotation atau caption Watermarking digunakan sebagai keterangan tentang data digital itu sendiri.
4
Copyright-Labeling Watermarking digunakan menyembunyikan label hak cipta.
untuk
Gambar 1 merupakan contoh sederhana penyisipan watermark pada citra. Citra disisipi watermark dengan menggunakan sebuah kunci sehingga watermark hanya dapat diekstraksi oleh pihak yang sah dan watermark tidak dapat dihapus oleh pihak yang tidak sah. Gambar 2 merupakan proses verifikasi watermark yang terdiri dari ekstraksi watermark dan pembandingan watermark. Proses ekstraksi dapat menyertakan atau tidak menyertakan citra asal dengan menggunakan kunci yang dimiliki. Setelah watermark dari citra yang diuji berhasil diekstrak, watermark tersebut dibandingkan dengan watermark asli (Munir 2004).
Lifting Wavelet Transform (LWT) Lifting scheme wavelet transform dikembangkan pada tahun 1994 oleh Wim Sweldens. Implementasi lifting scheme lebih cepat daripada implentasi wavelet klasik. Lifting scheme tidak memerlukan array sementara dalam proses kalkulasi (in-place computation). Inversi pada lifting scheme mudah dilakukan (Chen). Salah satu fitur wavelet dalam pemrosesan sinyal dan kompresi adalah rekonstruksi sempurna. Algoritme wavelet memiliki rekonstruksi sempurna jika IWT(WT(D))=D di mana IWT adalah Inverse Wavelet Transform dan WT adalah Wavelet Transform. Algoritme wavelet paling sederhana yang menghasilkan rekonstruksi sempurna adalah algoritme wavelet Haar (Kaplan 2003). Tujuan dari LWT adalah menghasilkan koefisien vektor perkiraan dan koefisien vektor detil. Tiga langkah forward LWT adalah: 1 Split, yaitu pembagian data menjadi dua, elemen-elemen berindeks ganjil dan elemen-elemen berindeks genap, 2 Predict, yaitu prediksi elemen ganjil dari elemen genap, dan 3 Update, yaitu lanjutan dari fase predict untuk menentukan nilai elemen genap. Di sisi lain, langkah inverse LWT (ILWT) merupakan kebalikan dari forward LWT, yaitu undo update, undo predict, dan merge (Chen).
Gambar 1
Penyisipan Watermark pada Citra (Munir 2004).
Peak Signal to Noise Ratio (PSNR) PSNR adalah ukuran kesamaan pada citra yang dikalkulasi dengan mengukur selisih pixel antara citra asli dan citra lain. PSNR direpresentasikan dalam decibel (dB). Nilai PSNR berkisar dari 0 sampai tak hingga. Nilai 0 diberikan pada citra-citra yang tidak memiliki kesamaan dan nilai tak hingga diberikan untuk citra yang identik. Semakin tinggi perbedaan antara kedua citra, maka nilai PSNR semakin berkurang (Mulopulos et al. 2003). Berikut ini merupakan rumus perhitungan PSNR: PSNR = 20 × log10(255/ sqrt (MSE)).
Gambar 2 Verifikasi Watermark pada Citra (Munir 2004).
Mean Squared Error (MSE) digunakan untuk mengukur kinerja dari algoritme kompresi yang lossy atau irreversible pada citra. Citra asli dibandingkan dengan citra terdekompresi dengan memeriksa selisih nilai 2
pixelnya. Citra identik akan memiliki nilai MSE 0 dan citra yang saling berbeda akan memiliki nilai MSE yang besar (Mulopulos et al. 2003). Perhitungan MSE diberikan oleh rumus berikut: MSE =
,
di mana M×N adalah ukuran citra, I(x,y) adalah pixel citra asli, dan I’(x,y) adalah pixel citra terdekompresi. Region of Interest (ROI) ROI merupakan bagian dari sinyal asli yang mengandung informasi yang sangat penting. Biasanya, ROI dapat menunjukkan informasi hak cipta. Pada bidang militer, ROI dapat merupakan bagian dari informasi latar belakang rahasia yang tidak boleh diketahui oleh musuh (Ma et al. 2008). Signal to Noise Ratio (SNR) SNR digunakan untuk mengukur kualitas watermarked audio. Definisi dari SNR diberikan sebagai berikut: SNR = 10 × log10
,
di mana Y merupakan host audio dan y merupakan watermarked audio (Ketcham dan Vongpradhip 2007).
register. Jika posisi bit berada di ujung register, maka isi akan keluar dari register. Posisi bit pada ujung yang lain akan dibiarkan kosong kecuali ada input baru yang masuk ke dalam register. Fungsi linear dari bit-bit tunggal hanyalah XOR dan inverse-XOR, dengan demikian, LFSR merupakan shift register yang input bitnya dibangkitkan dari proses XOR beberapa bit dari keseluruhan nilai shift register. Isi dari shift register biasanya berupa bilangan biner, yaitu angka 1 dan angka 0. Pergeseran isi bisa ke kanan atau ke kiri berdasarkan bagaimana perancangannya (Anonim). Bit-bit pada posisi tertentu dalam shift register dipilih dan dikombinasikan menggunakan fungsi tertentu seperti pada Gambar 3. Hasil kombinasi ini akan dijadikan sebagai input baru pada shift register. Fungsi ini disebut feedback function. Nilai awal LFSR disebut seed. Operasi LFSR adalah deterministik, aliran nilai yang dihasilkan oleh register benar-benar ditentukan dari state yang sebelumnya. Karena register memiliki jumlah kemungkinan state yang terbatas, maka akan terjadi cycle yang berulang. LFSR dengan fungsi feedback yang dipilih dengan baik akan menghasilkan rangkaian bit acak dan memiliki cycle yang panjang.
Teori Chaos dengan Persamaan Logistik Teori chaos berasal dari teori sistem yang memperlihatkan kemunculan yang tidak teratur atau acak namun deterministik, artinya dimungkinkan membangkitkan nilai-nilai chaos dengan kepastian. Teori chaos sangat peka terhadap perubahan kecil nilai awal. Perubahan kecil dapat memberikan hasil yang sangat berbeda. Salah satu fungsi chaos sederhana adalah persamaan logistik yang biasa dipakai dalam ekologi untuk simulasi pertumbuhan spesies dalam ekosistem. Fungsi chaos dalam watermarking digunakan untuk membangkitkan bilangan acak. Persamaan logistik dinyatakan sebagai berikut:
Gambar 3 Operasi LFSR. Independent Component Analysis (ICA)
Linear Feedback Shift Register (LFSR)
Sinyal audio tercampur dapat terjadi pada kehidupan sehari-hari di mana terjadi pembicaraan antara dua orang atau lebih, misalnya percakapan yang terjadi pada pesta. Indera pendengaran seseorang akan melakukan pengolahan sinyal tercampur untuk mendapatkan sinyal suara yang diinginkan. Teknik pemisahan sinyal dengan kondisi parameter-parameter yang tidak diketahui disebut separasi buta (Gunawan 2005). Gambar 4 menunjukkan proses pencampuran sinyal suara.
LFSR memiliki dua bagian utama, yaitu shift register dan feedback function. Shift register berfungsi untuk menggeser isi register ke posisi yang berdekatan di dalam
ICA merupakan suatu metode penemuan kembali sekelompok sinyal bebas s dari campuran sinyal-sinyal x di mana proses pencampurannya tidak diketahui. Prinsip dari
di mana merupakan parameter control dan merupakan nilai awal (Munir et al. 2007).
3
algoritme ini adalah menghitung matriks campuran A dari sinyal secara implisit sehingga ditemukan kembali sinyal yang diinginkan.
Gambar 7 . Gambar 5, Gambar 6, dan Gambar 7 dapat memperjelas penggunaan metode ICA. Gambar menunjukkan sumber suara s1 dan s2. Proses pencampuran dengan matriks A menghasilkan sinyal tercampur x1 dan x2 pada gambar berikutnya. Gambar berikutnya lagi menunjukkan sinyal yang berhasil dipisahkan dengan menggunakan metode ICA. Sinyal yang dihasilkan mirip dengan sumber sinyal aslinya.
Sinyal yang Sudah Dipisahkan dengan Metode ICA (Gunawan 2005).
METODE PENELITIAN Metode penelitian dilakukan dalam beberapa tahapan. Tahapan pertama adalah penentuan perangkat lunak yang akan digunakan untuk mengimplementasikan watermarking. Tahapan kedua adalah penyiapan berkas data, yaitu audio yang akan disisipi watermark dan citra yang akan menjadi watermark. Tahapan ketiga adalah penyisipan watermark. Pada tahap ini, ada beberapa subtahap yang harus dilalui, yaitu pembangkitan ROI audio, pembangkitan dan enkripsi citra biner, enkripsi dua watermark, post-processing, dan penyisipan. Tahapan keempat adalah ekstraksi watermark. Tahapan terakhir adalah analisis uji ketahanan. Spesifikasi Perangkat Lunak 1
Gambar 4
Proses Pencampuran Sinyal Suara (Gunawan 2005).
2 3 4
Sistem operasi Windows Professional MATLAB 7.0.1 Audacity 1.2.6 Total Video Converter 3.01
XP
SP2
Penyiapan Berkas Data Host audio yang digunakan adalah 4.wav. 4.wav memiliki sample rate 44100 Hz dan bits per sample 16 bit. Panjang dari 4.wav adalah 65536.
Gambar 5
Sinyal Asli s1 dan s2 (Gunawan 2005).
Gambar 6
Sinyal Tercampur x1 dan x2 (Gunawan 2005).
Logo yang digunakan sebagai watermark adalah LogoIPB.gif. Ukuran datanya adalah 5 KB dan dimensi citra pixel. Gambar 8 menunjukkan citra yang akan digunakan sebagai watermark.
Gambar 8
Citra yang Digunakan sebagai Watermark. 4
Gambar 9 Proses Penyisipan Watermark Diadaptasi dari Ma et al. (2008). Penyisipan Dua Watermark Gambar 9 menunjukkan proses penyisipan kedua watermark. Dari host audio, dibangkitkan ROI audio. Citra watermark dikonversi menjadi citra biner berukuran satu dimensi kemudian dienkripsi menggunakan teori chaos. Setelah itu ROI audio dan citra biner terenkripsi dicampur dengan menggunakan matriks pencampur A dan barisan m. Hasil campuran diubah dalam bentuk biner (Wbinary). Dilakukan proses LWT pada host audio. Proses ini menghasilkan koefisien vektor perkiraan CA dan koefisien vektor detil CD. CA dan Wbinary dicampur menggunakan matriks B dan menghasilkan sw1 dan sw2. Kemudian sw1 dan CD digunakan untuk melakukan proses ILWT dan menghasilkan watermarked audio.
hak cipta, misalnya logo atau tanda tangan. Karena citra yang ada belum berbentuk citra biner, citra dikonversi terlebih dahulu menjadi citra hitam putih dengan nilai threshold tertentu. Setelah itu, citra diubah ukurannya menjadi yang setara dengan . Citra dua dimensi ini dikonversi lagi menjadi citra satu dimensi . dipetakan dari nilai {1,0} menjadi {+1,-1}. Barisan chaotic (Chaos) sepanjang dibangkitkan untuk mengenkripsi .( ) digunakan pada persamaan logistik dan berguna sebagai key 1. , , dipetakan menjadi {+1, -1} dengan nilai threshold 0,5. Setelah itu , , dienkripsi menjadi , .
1 Pembangkitan ROI Audio
3 Enkripsi Dua Watermark
ROI audio sepanjang dibangkitkan dari host audio yang memiliki panjang lebih besar dari , , . Pembangkitan ROI audio dapat diambil dari bagian host audio mana saja, misalnya di depan, di tengah-tengah, atau pun di belakang. Gambar 10 merupakan contoh plot sinyal suara. Daerah yang dibatasi dengan garis merah merupakan ROI audio yang dibangkitkan.
Barisan bilangan biner acak dibangkitkan dengan menggunakan LFSR. Barisan ini disebut barisan . Kedua watermark dan m digabung menggunakan metode pencampuran linear instantaneous. Matriks pencampur A berukuran 2×3 di mana , , tidak ada yang bernilai 0, dan tiap barisnya berjumlah satu (Ma et al. 2008).
4 Post-Processing
Gambar 10 Seleksi ROI Audio. 2 Pembangkitan dan Enkripsi Citra Biner Citra yang digunakan sebagai watermark merupakan citra biner yang merepresentasikan
Kemudian V dikalikan dengan parameter α dan dikonversi ke integer menjadi dan kunci disimpan untuk proses ekstraksi. α yang digunakan sebesar 128 (Ma et al. 2008). Bilangan negatif pada V’ dipetakan menjadi bilangan positif dan nkey digunakan sebagai penanda nilainilai negatif V’ untuk digunakan pada proses ekstraksi. V’ dikonversi ke dalam bentuk biner seperti berikut: 5
Gambar 11 Proses Ekstraksi Watermark Diadaptasi dari Ma et al. (2008).
di mana
, , dan . Nilai α ditentukan sedemikian sehingga K yang dihasilkan akan membuat panjang Vbin menjadi (1/2)p panjang host audio di mana p merupakan jumlah level yang digunakan pada proses dekomposisi audio menggunakan LWT. Kemudian dipetakan dari {1,0} menjadi dengan barisan nilai {+1,-1}. merupakan watermark yang akan disisipkan dan mengandung informasi audio ROI dan citra biner. 5
Proses Penyisipan
Dilakukan proses LWT sebanyak p level pada host audio. Proses ini akan menghasilkan koefisien vektor perkiraan CA1 dan koefisien vektor detil CD. Vektor CA1 dan Wbin digabung menggunakan metode pencampuran linear instantaneous. Matriks pencampur B berukuran 2x2 di mana , , tidak ada yang bernilai 0, dan tiap barisnya berjumlah satu (Ma et al. 2008).
dan CD digunakan pada proses ILWT sebanyak p level untuk membentuk watermarked audio. Sedangkan disimpan sebagai key 3. Ekstraksi Dua Watermark Gambar 11 menunjukkan proses ekstraksi watermark. Pada watermarked audio dilakukan proses LWT untuk mendapatkan . Setelah itu didapatkan SW dengan menggabungkan dan key 3.
Untuk mendapatkan kembali sinyal estimasi dan yang telah dicampur dengan matriks B, digunakan metode FastICA. Setelah itu dipetakan dari {+1,-1} menjadi {1,0} untuk mendapatkan . dikonversi menjadi bentuk integer V’. V didapatkan dengan menggunakan kunci vkey, V . sehingga didapatkan WW kembali.
Sinyal estimasi dan didapatkan dengan menggunakan metode FastICA lagi. Dengan demikian, ROI audio telah berhasil didapatkan. Untuk mendapatkan kembali citra biner C, Chaos dibangkitkan dengan menggunakan key 1. dan nilai-nilainya dipetakan dari {+1,-1} menjadi {1,0}. Citra satu dimensi ini kemudian dikembalikan menjadi citra C berukuran . Analisis Uji Ketahanan Watermarked audio diberi serangan menggunakan Audacity atau MATLAB kemudian dilakukan ekstraksi watermark. Watermark yang dihasilkan dari audio yang diserang akan dibandingkan dengan watermark yang dihasilkan dari audio yang tidak diserang. Jenis serangan yang dilakukan antara lain resampling, requantizing, lowpass filtering, white noising pada watermarked audio, dan pengubahan format audio menjadi *.mp3. Resampling dilakukan dengan mengubah sample rate pada watermarked audio. Sample rate yang akan digunakan adalah 22050 Hz, 42000 Hz, 43000 Hz, 45000 Hz, dan 46000 Hz. Requantizing dilakukan dengan mengubah bits per sample menjadi 8 bit, 24 bit, dan 32 bit. White noise yang akan diberikan pada watermarked audio adalah sepanjang 0.008018 detik.
6