Seminar Nasional Inovasi Dan Aplikasi Teknologi Di Industri 2017 ITN Malang, 4 Pebruari 2017
ISSN 2085-4218
PERANCANGAN DAN ANALISIS AUDIO WATERMARKING BERBASIS TEKNIK MODULASI DIGITAL DENGAN PENGKODEAN KONVOLUSI Augiska Muliansyahputra 1), Briliant Hadi Akbar 2), Gelar Budiman 3) 1),2),3 )
Fakultas Teknik Elektro, Universitas Telkom Bandung Jl. Telekomunikasi No. 1 Bandung Email :
[email protected]
Abstrak . Perkembangan teknologi informasi menyebabkan penyebaran data digital berjalan sangat pesat. Di balik kemudahan mendapatkan segala jenis informasi digital, terdapat suatu masalah terhadap kepemilikan hak cipta dari informasi tersebut, contohnya dalam industri multimedia. Karya-karya multimedia, khususnya dalam industri musik yang berkaitan dengan audio digital, dengan mudahnya dicopy-paste, direkam ulang, dan diedarkan kembali dengan mengganti nama pemilik asli dengan nama pembajak. Salah satu cara untuk menghadapi masalah pembajakan karya khususnya dalam industri musik adalah dengan teknik audio watermarking. Audio watermarking merupakan suatu teknik penyisipan informasi dalam bentuk data digital ke dalam suatu file audio dengan tujuan sebagai penanda keaslian dari file audio tersebut. Dalam penelitian ini akan dirancang suatu skema audio watermarking berbasis teknik modulasi digital, dengan merepresentasikan bit informasi ke dalam bentuk lain, dalam hal ini suatu code sequence. Code sequence yang digunakan harus diketahui saat proses embedding dan ekstraksi. Dalam skema ini terdapat rangkaian convolutional code dan interleaver yang digunakan sebagai error correction code. Pengujian sistem dilakukan melalui beberapa parameter penilaian seperti SNR, ODG, BER, dan SSIM. Skema audio watermarking dalam penelitian ini mendapatkan range nilai SNR 35 dB hingga 52 dB dan tingkat deteksi 100% tanpa serangan. Kata kunci: perlindungan hak cipta, audio watermarking, M-ary, code sequence, pengkodean konvolusi
1. Pendahuluan Dewasa ini, saat teknologi informasi berkembang sangat pesat, hampir semua data telah berbentuk digital. Mulai dari data sederhana seperti buku referensi kuliah, tugas-tugas kuliah, hingga data penting seperti perjanjian kontrak saham perusahaan pasti memiliki data dalam bentuk digital. Apalagi dengan kehadiran internet, digital sudah dijadikan suatu ranah untuk kebutuhan komersil, contohnya dalam industri multimedia. Masalah yang sering terjadi dalam industri ini baik dalam skala perorangan sampai skala perusahaan adalah kasus pembajakan hak cipta (copyright piracy). Dikarenakan penyebaran pada internet yang begitu cepat, karya-karya multimedia khususnya dalam industri musik yang berkaitan dengan digital audio dengan mudahnya dicopy-paste, direkam ulang, dan diedarkan kembali dengan mengganti nama pemilik asli dengan nama pembajak. Sebenarnya, kegiatan pembajakan di indutri musik sangat sulit untuk dihentikan. Ketika suatu karya diunggah ke internet, dengan mudahnya karya tersebut akan menyebar luas tanpa pengawasan. Oleh karena itu, dibutuhkan suatu cara untuk menghadapi masalah pembajakan karya khususnya dalam industri musik, salah satunya dengan menggunakan teknik audio watermarking. Audio watermarking merupakan suatu teknik penyisipan informasi ke dalam suatu sinyal host (host media) yang berbentuk file audio tanpa mengganggu keaslian dari audio tersebut. Informasi yang disisipkan dapat berupa bit, teks, citra, atau audio dalam bentuk lain. Informasi yang disisipkan harus unik, agar informasi dalam suatu audio tidak sama dengan informasi dalam audio lain. Dalam audio watermarking, terdapat berbagai macam teknik penyisipan diantaranya modifikasi LSB, phase coding, spread spectrum, echo hiding, dan lain-lain. Secara umum, ada 2 kriteria yang harus dipenuhi dalam audio watermarking [1]. Pertama, informasi yang disisipkan harus tahan terhadap berbagai serangan (robustness), dengan parameter pengukuran berupa nilai Bit Error Rate (BER). Kedua, hasil proses watermarking harus menjaga kualitas audio asli (perceptual quality) dengan parameter pengukuran berupa nilai dari Mean Opinion Score (MOS). Itu berarti, informasi yang disisipkan ke file audio harus tidak terdeteksi oleh indera pendengaran manusia (Human Auditory System/HAS). Pada penelitian ini dilakukan perancangan dan analisis audio watermarking berbasis teknik modulasi digital dengan pengkodean konvolusi. Teknik modulasi digital merupakan suatu teknik B17.1
Seminar Nasional Inovasi Dan Aplikasi Teknologi Di Industri 2017 ITN Malang, 4 Pebruari 2017
ISSN 2085-4218
untuk mentransmisikan sinyal dengan merepresentasikan bit informasi ke dalam bentuk lain agar dapat bekerja pada suatu medium. Ini merupakan dasar yang digunakan dalam skema audio watermarking pada penelitian ini yaitu mengubah satu atau sekelompok bit menjadi suatu code sequence (spreading data) menggunakan Pseudorandom Noise (PN) code, sebelum disisipkan ke host audio. Code sequence yang digunakan harus diketahui saat proses embedding dan ekstraksi. Dalam skema ini juga terdapat rangkaian convolutional code dan interleaver yang digunakan sebagai error correction code. Contoh untuk penggunaan spreading data menjadi suatu pseudo sequence dalam melakukan modulasi watermark dipaparkan pada penelitian [2] dan penggunaan pengkodean konvolusi dipaparkan pada penelitian [3], [4] dan [5]. Pada penelitian [5], skema watermarking berhasil mendapatkan nilai Signal to Noise Ratio (SNR) diatas 20 dB. Pada proses ekstraksi akan digunakan Euchlidean distance dan cross correlation pada demodulasi dan Viterbi decoder pada dekonvolusi untuk mencari apakah bit yang diperoleh memiliki korelasi yang tinggi terhadap bit informasi sebelum disisipkan. Dengan menggabungkan metode-metode tersebut, skema audio watermarking ini diharapkan dapat meningkatkan nilai robustness dan imperceptibility dari sistem dengan bukti Bit Error Rate (BER) mendekati 0, Structural Similarity (SSIM) Index mendekati 1, dan Signal to Noise Ratio (SNR) diats 20 dB. 2. Dasar Teori 2.1.1 Convolutional Code (CC) Convolutional code adalah suatu jenis pengkodean yang dilakukan dengan cara melakukan konvolusi terhadap urutan bit-bit informasi masukan secara kontinu dan menghasilkan sebuah urutan bit output (codeword) yang kontinu. Dengan menggunkan konvolusi, codeword yang dihasilkan tergantung dengan bit input saat itu dan bit-bit input sebelumnya. Oleh karena itu, proses ini membutuhkan suatu memori (shift register) dengan panjang tertentu [6]. Convolutional code diwakili dengan 3 parameter yaitu n, k, dan K. n merupakan jumlah bit output yang ingin dihasilkan tiap k input, dan K adalah constraint length dimana encoder mempunyai K-1 elemen memori. Dalam convolutional code dikenal juga Rc = k/n yang disebut sebagai coding rate (laju pengkodean) yang menyatakan jumlah bit data input per bit yang ingin dikodekan. Pada shift register, proses konvolusi dilakukan dengan membuat dua buah adder modulo-2 yang melakukan operasi XOR. Output yang dihasilkan dari dua buah adder ini akan diswitch antar satu dan lainnya untuk mendapatkan suatu urutan kode [6]. Contoh rangkaian convolutional code ditunjukkan pada Gambar 1, yang memiliki K= 3 dan Rc = ½.
Gambar 1. Convolutional encoder dengan K=3 dan Rc=1/2 [4] Pada Gambar 2 ditunjukkan suatu state diagram yang menggambarkan rangkaian convolutional code di Gambar 1. Setiap node menunjukkan isi dari shift register tepat sebelum dimasukkannya bit input. Bit input yang bernilai “0” dan “1” direpresentasikan dengan garis yang menghubungkan setiap node, dengan garis tebal mewakili bit “0” dan garis putus-putus mewakili bit “1”. Sebagai contoh dengan asumsi initial state 00, bit input 11010 akan menghasilkan output sequence 1101010010 [7].
B17.2
Seminar Nasional Inovasi Dan Aplikasi Teknologi Di Industri 2017 ITN Malang, 4 Pebruari 2017
ISSN 2085-4218
Gambar 2. State diagram untuk encoder pada Gambar 1 [7] Convolutional code juga bisa direpresentasikan dengan trellis diagram yang memperhatikan transisi tiap proses. Trellis diagram menggambarkan bit input dengan panah-panah dari satu node menuju node lainnya, dimana tiap panah mengandung suatu output sequence tersendiri. Pada Gambar 3 ditunjukkan suatu trellis diagram yang merepresentasikan state diagram dalam Gambar 2.
Gambar 3. Trellis diagram untuk encoder pada Gambar 1 [7] 2.1.2 PN Code Pseudorandom Noise code (PN code) merupakan suatu kode dengan suatu urutan bit data yang terlihat random namun bersifat periodik. PN code mempunyai 2 level, yaitu polar (bit -1 & 1) dan nonpolar (bit 0 & 1). Secara umum, PN code dapat diklasifikasikan menjadi 2 jenis [8]; yaitu linear dan non-linear. Kode linear dibangkitkan dengan mengkombinasikan keluaran feedback shift register dalam fungsi yang tetap (biasanya bermudulo 2. Sedangkan kode non-linear diperoleh dengan melakukan feedback shift register sebagai fungsi waktu. PN code mempunyai autokorelasi yang tinggi sehingga dapat dimanfaatkan untuk sinkronikasi. Sifat-sifat yang harus dimiliki oleh PN code adalah sebagai berikut [9] : 1. Harus berbeda antara satu dengan yang lain, tetapi yang digunakan pada sisi pengirim dan penerima harus sama untuk mendapatkan kembali sinyal data infromasi. 2. Harus berbentuk acak, tetapi memiliki pola tertentu. 3. Cross correlation antara dua kode yang berbeda harus bernilai kecil. 4. Kode harus mempunyai periode yang panjang. 2.1.3 Spreading Spreading merupakan suatu proses penyebaran atau penambahan panjang sequence data yang menghasilkan bit-bit keluaran sesuai dengan kode yang digunakan. Data masukan menentukan deretan sequence manakah yang menjadi keluaran dari kode. Dalam penelitian ini, data masukan tidak dikalikan dengan kode, hanya menentukan kode yang akan dipakai. Kode tersebut harus diketahui di sisi pengirim dan penerima untuk melakukan despreading yang akan mengambil kembali data masukan awal. 3. Pembahasan 3.1 Perancangan Sistem Dalam penelitian ini akan dibuat suatu sistem audio watermarking dengan data sisipan berupa citra biner (black and white). Skema dari audio watermarking ini menggunakan teknik modulasi digital, dengan merepresentasikan bit informasi ke dalam suatu code sequence, dan menggunakan pengkodean konvolusi. Perancangan sistem dibagi menjadi dua tahap yaitu proses penyisipan B17.3
Seminar Nasional Inovasi Dan Aplikasi Teknologi Di Industri 2017 ITN Malang, 4 Pebruari 2017
ISSN 2085-4218
informasi ke dalam host audio dan proses ekstraksi untuk mengambil kembali informasi sisipan dari host audio. Secara umum, skema audio watermarking yang akan dilakukan adalah seperti pada diagram alir dalam Gambar 4.
Gambar 4 Diagram alir skema audio watermarking 3.1.1 Proses Embedding Embedding adalah suatu proses penyisipan informasi berbentuk data watermark ke dalam host audio. Dalam penelitian ini, informasi yang ingin disisipkan berupa citra biner. Skema embedding pada penelitian ini dipaparkan pada Gambar 5. Citra biner akan diolah terlebih dahulu (preprocessing) sebelum nantinya dihasilkan suatu data watermark yang merepresentasikan citra biner tersebut.
Gambar 5 Diagram alir proses embedding
Berikut adalah tahapan-tahapan pada proses embedding watermark ke dalam host audio : 1. Informasi berupa citra digital biner (black and white) berbentuk 2 dimensi diubah (reshape) menjadi 1 dimensi. 2. Dalam bentuk 1 dimensi, data watermark memasuki blok convolutional code dengan rate ½ yang berarti 1 bit input menghasilkan 2 bit output dengan mengikuti aturan pada trellis diagram yang digunakan. 3. Dilakukan proses blok interleaving pada bit sequence yang akan melakukan pengacakan pada bit-bit tersebut dan menghasilkan bit sequence baru . 4. Bit sequence yang berbentuk bit-bit biner akan dimodulasi dengan mengelompokkan bit-bit biner tersebut menjadi bilangan desimal sesuai dengan M-ary yang digunakan dan menghasilkan sequence desimal C. 5. digunakan sebagai kode orthogonal yang berbentuk matriks Ncode x Ncode. Penentuan kolom PN code yang akan digunakan didasari oleh pemilihan kunci, dengan ketentuan kunci = [1:M-ary] sehingga menghasilkan PN code dengan ukuran panjang kunci dikali Ncode. B17.4
Seminar Nasional Inovasi Dan Aplikasi Teknologi Di Industri 2017 ITN Malang, 4 Pebruari 2017
6. 7.
8. 9.
ISSN 2085-4218
(Contoh : Ncode = 512, kunci = [1:4], kode orthogonal yang digunakan adalah PN code dengan ukuran 512 x 4) PN code kemudian melalui filter psikoakustik agar watermark yang dihasilkan tidak terasa oleh indera pendengaran manusia. Sequence desimal C dipetakan (spreading) ke dalam PN code sesuai dengan bilangan desimal yang dikandungnya ditambah 1. Sebagai contoh, bilangan desimal 0 akan digantikan oleh PN code kolom pertama, bilangan desimal 1 akan digantikan oleh PN code kolom kedua, dan seterusnya. Proses spreading menghasilkan data sequence C’ dengan ukuran panjang dari sequence desimal C dikali Ncode. C’ akan dikali scaling factor ( ) membentuk . Hasil proses embedding berupa watermarked audio didapatkan dari hasil dijumlahkan dengan host audio S melalui persamaan (1). (1)
Watermarked audio di penerima akan dibandingkan dengan file host audio awal, sehingga dapat diketahui nilai perceptual quality menggunakan pengukuran parameter SNR dan MOS. Terdapat parameter-parameter yang harus disepakati antara pengirim dan penerima dalam skema audio watermarking ini, diantaranya rate dan trellis yang digunakan dalam pengkodean konvolusi, jumlah baris dan kolom yang digunakan dalam interleaver, kode orthogonal yang digunakan dalam modulasi, dan nilai alfa yang digunakan sebagai scaling factor. Parameter tersebut harus diketahui pada penerima untuk melakukan proses ekstraksi watermark. 3.1.2 Proses Ekstraksi Proses ekstraksi adalah proses untuk mengambil data watermark yang telah disisipkan ke dalam host audio pada proses embedding. Skema ekstraksi pada penelitian ini dipaparkan pada Gambar 6.
Gambar 6. Diagram alir proses ekstraksi Dalam penelitian ini, tidak dilakukan serangan pada watermarked audio. Berikut adalah tahapantahapan pada proses ekstraksi watermark dari watermarked audio : 1. Watermarked audio y dideteksi dengan despreading dan menghasilkan bit sequence . Proses pendeteksian dilakukan dengan dua cara, yaitu : a. Euclidean distance Pendeteksian dengan mencari jarak terdekat dari watermarked audio sequence ke kode yang digunakan (PN code). Secara matematis, Euclidean distance ditunjukkan dalam persamaan (2). (2)
B17.5
Seminar Nasional Inovasi Dan Aplikasi Teknologi Di Industri 2017 ITN Malang, 4 Pebruari 2017
ISSN 2085-4218
b. Cross Correlation Pendeteksian dengan mencari hubungan tertinggi antara watermarked audio sequence dengan kode yang digunakan (PN code), dengan mengalikan secara kontinu bit-bit dari kedua sequence tersebut dan dicari nilai maksimumnya. Pendeteksian akan menghasilkan sequence desimal sesuai dengan nomor kolom dalam kode yang terdeteksi. 2. Sequence desimal akan didemodulasi dengan merepresentasikan bilangan desimal tersebut menjadi bilangan biner kembali sesuai dengan M-ary yang digunakan dan menghasilkan bit sequence . 3. Deinterleaver akan mengembalikan urutan dari bit sequence menjadi sesuai dengan interleaver yang digunakan pada proses embedding. 4. Dekonvolusi akan dilakukan oleh Viterbi decoder dengan pendekatan menggunakan algoritma Viterbi. Dekonvolusi ini digunakan untuk mengubah yang merupakan codeword dari informasi menjadi bit-bit informasi sebenarnya . Watermark yang diperoleh dalam proses ekstraksi akan dibandingkan dengan file watermark awal, sehingga dapat diketahui nilai robustness menggunakan pengukuran parameter BER dan SSIM. 3.2 Analisis Sistem Pada penelitian ini host audio yang digunakan adalah file audio berformat .wav dengan durasi menyesuaikan panjang dari watermark hasil preprocessing. Data yang disisipkan berupa citra digital black and white beresolusi 20x20 piksel. Setelah watermark disisipkan ke dalam host audio, langsung dilakukan proses ekstraksi pada watermarked audio tanpa melalui serangan. Penelitian ini menggunakan beberapa nilai parameter, diantaranya nilai Ncode yang digunakan adalah 512, dan nilai M-ary yang digunakan adalah 2, 4, dan 8. Pada demodulasi juga menggunakan dua cara (lihat 2.1.2), pertama menggunakan Euclidean distance dan kedua menggunakan cross correlation. Tabel 1 menunjukkan nilai pengukuran terbaik yang didapat dari masing-masing Ncode pada penelitian ini. Tabel 1 Tabel nilai pengukuran terbaik untuk masing-masing Ncode Ncode
M-ary
Batas nilai alfa
Tipe Demod
SNR
ODG
BER
SSIM
512
2
0.000531
1
52.5872
0.1498
0
1
512
2
0.00163
2
42.8289
0.0943
0
1
512
4
0.000991
1
47.0673
0.1216
0
1
512
4
0.00154
2
43.2347
0.0909
0
1
512
8
0.000945
1
47.8087
0.1220
0
1
512
8
0.00326
2
37.0530
-0.0130
0
1
Tabel 1 menunjukkan kisaran batas minimum nilai alfa yang dapat digunakan dalam skema audio watermarking pada penelitian ini untuk menghasilkan parameter penilaian terbaik. Semakin besar nilai alfa, nilai SNR dan ODG akan semakin memburuk, sedangan nilai BER dan SSIM akan semakin membaik. Dalam skema ini, parameter penilaian terbaik didapatkan saat M-ary bernilai 2 dengan demodulasi Euclidean distance yang menghasilkan SNR bernilai 52.5872, ODG bernilai 0.1498, BER bernilai 0 dan SSIM bernilai 1. 4. Kesimpulan 1. Terdapat batas minimum nilai alfa sehingga saat proses deteksi watermark menghasilkan nilai BER 0 dan nilai SSIM 1 tanpa melalui serangan. 2. Nilai alfa yang digunakan sangat berpengaruh kepada parameter pengukuran. Semakin besar nilai alfa, nilai SNR dan ODG yang dihasilkan akan semakin buruk, namun nilai BER dan SSIM akan yang dihasilkan akan semakin baik. B17.6
Seminar Nasional Inovasi Dan Aplikasi Teknologi Di Industri 2017 ITN Malang, 4 Pebruari 2017
ISSN 2085-4218
3. Tipe demodulasi Euclidean distance dapat mendeteksi watermark dengan nilai alfa lebih kecil dibandingan demodulasi cross correlation untuk memperoleh nilai BER 0 dan nilai SSIM 1. 4. Dengan analisis yang dilakukan, harus dicari nilai Ncode, M-ary, alfa, dan tipe demodulasi yang digunakan untuk menghasilkan semua nilai parameter pengukuran terbaik. Ucapan Terima Kasih Terima kasih kepada Allah SWT yang telah memperlancar penelitian ini, kepada Ayah, Ibu, dan Pak Gelar yang telah membantu dan mendukung penulis dalam menyelesaikan penelitian ini. Semoga penelitian ini bisa berguna untuk penulis sendiri dan orang lain yang berhubungan dengan topik pada penelitian ini. Daftar Pustaka [1] M. M. Alsalami, Mikdam A. T.; Al-Akaidi, “DIGITAL AUDIO WATERMARKING: SURVEY,” pp. 12–13. [2] M. K. Pandey, G. Parmar, and R. Gupta, “Audio watermarking by spreading echo in time domain using pseudo noise gray sequence,” 2015 Int. Conf. Ind. Instrum. Control. ICIC 2015, no. Icic, pp. 740–743, 2015. [3] G. Budiman, A. B. Suksmono, and D. H. Shin, “A multicarrier modulation audio watermarking system,” in International Conference on Electrical Engineering and Informatics (ICEEI), 2015. [4] E. K. Rosita, Suwadi, and A. Ansori, “Implementasi Convolutional Code dan Viterbi Decode pada DSK TMS320C6416T,” vol. 2, no. 1, 2013. [5] X. Da-Wen, W. Rang-Ding, and B. Ji-Long, “A Blind Audio Watermarking Algorithm Based on Convolutional Code,” in 8th International Conference on Signal Processing, 2006. [6] E. K. Adiyanto, “Tugas Akhir : Perbandingan Performansi Convolutional Code dengan Convolutional Turbo Code,” Universitas Mercu Buana, 2009. [7] A. J. Viterbi, CDMA: Principles of Spread Spectrum Communications. Addison Wesley Longman Inc., 1995. [8] Dixon, R.C., "Spread Spectrum System", John Wiley & Sons, 1976. [9] Tataq Ajie R. and Y. Moegiharto, “Studi Perbandingan Kinerja Direct Sequence Spread Spectrum Code Division Multiple Acces (DS-SS CDMA) dengan Kode Penebar Walsh, Gold, dan Kasami,” Politeknik Elektronika Negeri Surabaya.
B17.7