Compressed Sensing untuk Sinyal Audio dengan Sensor Jamak Muhammad Ibnu Bahrurrahim : 2207100562 Bidang Studi Telekomunikasi Multimedia Jurusan Teknik Elektro – FTI, Institut Teknologi Sepuluh Nopember Kampus ITS, Keputih - Sukolilo, Surabaya 60111
ABSTRAK Teknik kompresi data (sinyal) telah banyak dipakai untuk mengefisiensikan penyimpanan dan pengiriman suara atau gambar pada komputer atau ponsel. Teknik baru yang disebut sebagai CS (compressed sensing) tidak memerlukan pencuplikan koefisien dominan secara adaptif karena semua komponen sama pentingnya dan basisnya bersifat overcomplete, dapat diambil yang manapun asal batas minimum jumlah cuplikan terpenuhi untuk rekonstruksi sinyal. Teori CS (Compressed Sensing) memerlukan generalisasi dari hubungan waktu-frekuensi supaya prinsip ketidak pastian tetap berlaku. Perencanaan CS (Compressed sensing) sinyal audio dengan sensor jamak meliputi penempatan sensor audio menggunakan sensor jamak, proses pengukuran dan pengambilan data serta pengolahan data yang berisi perencanaan dan pembuatan sistem kompresi dan rekonstruksi. Parameter yang diukur dalam pengujian meliputi dua hal yaitu pengujian SDR (Signal to Distortion Ratio) untuk perbandingan sinyal asli dengan sinyal rekonstruksi sehingga dapat ditentukan MSE (Mean Square Error) yang menyatakan kinerja dari pengkodean. Hasil dari rekonstruksi menunjukkan bahwa semakin banyak sampling k yang diambil berarti nilai kompresi semakin kecil sehingga nilai SDR (Signal to Distortion Ratio) semakin besar dan rata – rata error pengkodean MSE (Mean Square Error) semakin kecil. Teknik CS (Compressed Sensing) berhasil merekonstruksi sinyal kompresi bahkan dengan mengambil sampling terkecil dari sinyal asli. Kata kunci: CS (Compressed Sensing), sampling, BP (Basis Pursuit). 1.
PENDAHULUAN Metoda CS (compressed sensing) mengambil komponen dominan dari suatu sistem basis yang bersifat overcomplete, dimana ada banyak sekali kemungkinan memilih basis yang sesuai untuk menyatakan suatu sinyal. Oleh karena itu perlu kendala tambahan agar solusi bisa ditemukan, yakni sinyal yang direkonstruksi dianggap bersifat sparse. Metoda CS memerlukan dua buah basis pada saat
melakukan pencuplikan atau sensing, yaitu sparsity basis Ψ dan projection basis Φ. Tingkat koherensi kedua basis menentukan batas minimum banyaknya cuplikan untuk merekonstruksi suatu sinyal secara eksak. Pada Tugas Akhir ini permasalahan yang dibahas adalah kompresi dan rekonstruksi sinyal audio dengan sensor jamak, dimana setiap sensor memiliki data yang berbeda bergantung dari konfigurasi sensor dan hasil rekaman. Tujuan dari kompresi sensing adalah untuk memperkecil kapasitas sinyal tetapi mempunyai hasil rekonstruksi yang mirip dengan sinyal aslinya. Rekonstruksi yang digunakan menggunakan algoritma yang melibatkan operasi linier programming atau sering dikenal dengan BP (basis pursuit). Metode rekonstruksi BP (Basis Pursuit) bertujuan untuk merekonstruksi sinyal audio terkompres menjadi sinyal audio semula. 2. DASAR TEORI 2.1. Konsep Compressed Sensing Compressed sensing merupakan teknik kompresi baru yang dikembangkan dengan prinsip tidak memerlukan pencuplikan koefisien dominan secara adaptif karena semua komponen sama pentingnya, dapat diambil yang manapun asal batas minimum jumlah cuplikan terpenuhi. Basis yang dipakai bersifat overcomplete, dimana ada banyak sekali kemungkinan memilih basis yang sesuai untuk menyatakan suatu sinyal. Oleh karena itu perlu kendala tambahan agar solusi bisa ditemukan, yakni sinyal yang direkonstruksi dianggap bersifat sparse. Ada dua transformasi penting dalam pencuplikan kompresif, yaitu sparsity transform dan projection transform. Transformasi pertama dipakai untuk mencari komponen sparse dari sinyal, sedangkan yang kedua dipakai dalam operasi pengukuran atau pengamatan. Algoritma yang digunakan adalah lossy compression, dimana proses kompresi data dilakukan dengan menghilangkan sebagian data akan tetapi hasil rekonstruksinya mendekati sinyal aslinya. 2.2 Tahap Kompresi Sinyal audio x(t) disampling dengan nyquist ke dalam blok N sample. masing–masing blok terdiri dari Nx1 vektor Xk, dimana k bergantung dengan waktu. sample vektor xk dapat di rumuskan : xk = ΨXk
(1)
1
dimana Ψ adalah matrik NxN yang sama pada fungsi dasar Ψi (t), dan Xk adalah vektor matrik Nx1. Pada sensor kita melakukan pengukuran M non-adaptiv linier untuk Xk, dimana M<< N, hasilnya M x 1 vektor yk, proses pengukuran ini dapat ditulis : yk = Φkxk
( 2)
dimana Φk adalah MxN matrik yang merepresentasikan proses pengukuran. Untuk proses kompres sensing pada network, Φk dan Ψ digunakan untuk rekontruksi menggunakan sebuah matrik dengan pemilihan element secara acak. Proses pengukuran dapat di lihat pada gambar 1.
Gambar 1 Proses pengukuran compressed sensing menggunakan random Gaussian Dari gambar diatas matrik vektor Mx1 atau disimbolkan merupakan hasil pengukuran dari perkalian matrik MxN dengan matrik Nx1, dimana nilai K<M≤N. Maka akan diperoleh sub matrik Mx1. Sehingga dapat disimpulkan jika semakin sedikit cuplikan yang diambil semakin efisien data yang dikompresi tetapi memiliki nilai error yang lebih besar jika dibandingkan dengan cuplikan yang banyak. 2.3 Tahap Rekonstruksi Setelah tahap kompresi di ukur kemudian diproses untuk direkonstruksi. Rekonstruksi melibatkan sinyal hasil kompresi sensing untuk dikembalikan menjadi sinyal aslinya yaitu vektor Xk. Konstruksi algoritma utama yang digunakan : BP (Basis Pursuit). Rekonstruksi BP dapat dicari dengan persamaan berikutnya. = argmin|| ||1 s.t = ψ
SDR
=
Nilai distorsi ratio merupakan penjumlahan dari sinyal asli dibagi dengan selisih sinyal rekonstruksi dengan sinyal asli. Kinerja dari rekonstruksi sinyal dilihat dari sinyal kesalahan (error) rata-rata atau MSE (Mean Square Error) masing-masing, yang dinyatakan sebagai:
& MSE = "# !! $ ,e(N) = S(N)-%(N)
menyatakan sinyal rekonstruksi. Semakin kecil nilai e(n), maka secara obyektif hasil rekonstruksi semakin baik. Nilai MSE yang besar menandakan terjadinya distorsi yang besar pada sinyal dengan cara mengurangkan sinyal asli dengan sinyal rekonstruksi. 3.
SENSOR JAMAK Sumber suara dianggap omnidirectional dan tidak ada refleksi, sinyal penerima pada sensor akan terdapat delay terhadap sinyal asli z(t) pada sumber. xl(t) = α1z(t –τl)
' =
( )
(8)
dimana * adalah jarak antara sumber dengan lsensor, dengan c adalah kecepatan suara (sekitar 344m/s pada 21 derajat calcius). asumsi model sumber, redaman l-sensor dihitung : + =
,-(.
2
(7)
dimana α1 dan τl adalah berturut-turut redaman dan delay dari l sensor. Gambar 2 menunjukkan contoh set up dengan 4 mikropon. delay dari l sensor dihitung dari :
(3)
(4)
Dengan begitu BP berusaha untuk mendapatkan solusi dengan mencari l1 norm yang paling kecil. Sinyal K-sparse dapat dengan tepat dikembalikan dengan kompresi sinyal yang mempunyai probabilitas yang tinggi hanya dengan menggunakan M CK log (N) pengukuran Gaussian. Pada proses ini BP menyediakan sebuah koefisien untuk masing masing fungsi dasar dari Ψ. Untuk mencari SDR (Signal to distortion Ratio) dari sinyal kompresi dengan sinyal asli dapat dirumuskan sebagai berikut.
(6)
S(N) menyatakan sinyal asli dan %&(N)
dimana || . || 1 adalah norm l1 pada umumnya ln norm didefinisikan sebagai :
=
(5)
Gambar 2 Set Up 4 sensor dari sumber z(t) Keterangan : X1(t) = Sensor1, d1 = Jarak sumber Z(t) dengan sensor 1 X2(t) = Sensor2, d2 = Jarak sumber Z(t) dengan sensor 2 X3(t) = Sensor3, d3 = Jarak sumber Z(t) dengan sensor 3
(9)
X4(t) = Sensor4, d4 = Jarak sumber Z(t) dengan sensor 4
merepresentasikan sinyal input sebelum dilakukan proses kompresi.
3.
3.2 Proses Rekonstruksi Rekonstruksi seperti dijelaskan gambar 4. dilakukan dengan tahapan sebagai berikut :
PERANCANGAN DAN IMPLEMENTASI SISTEM 3.1 Proses Kompresi Proses kompresi seperti dijelaskan gambar 3 sebagai berikut: 1. Sinyal audio yang akan diolah pada tahap kompresi adalah sinyal X(t) yang periodik terhadap waktu. Terdapat beberapa sinyal X(t) yang akan dikompresi sebanyak length (Xt). 2. Mula–mula sinyal audio dengan basis vektor yang mempunyai renggangan pada basis PSI(Ψ). 3. Dari basis vektor tersebut dilakukan proses sampling terhadap basis PHI(Φ) menghasilkan suatu sinyal terkompres. Pada proses sampling tersebut, terjadi pengurangan jumlah sinyal renggangan terhadap sinyal basis PHI(Φ). 4. Hasil pengurangan dari element nya memiliki ukuran yang jauh lebih kecil, hal tersebut dikarenakan tidak keseluruhan data di sample, melainkan hanya sebagian data saja.
Gambar 4 Tahap rekonstruksi 1.
2.
3.
Gambar 3 Tahap kompresi Sedangkan pada tahap rekonstruksi sinyal terkompres akan direkonstruksi menggunakan algoritma Basis Pursuit untuk mencari nilai selisih terkecil dari sinyal asli, sehingga menghasilkan sinyal rekonstruksi, yang mana sinyal rekonstruksi
4.
5.
Sinyal yang akan di rekonstruksi adalah sinyal hasil kompresi x. Vektor yang teramati menunjukkan jumlah cuplikan sebanyak Ksparse dari sinyal asli. Mencari vektor renggangan x dalam kawasan DCT melalui optimisasi P1 (BP) yaitu min ||x||. Optimisasi ini memiliki arti pilihlah vektor x paling renggang dalam basis PSI (Ψ) yang dapat menjelaskan hasil pengamatan X. Rekonstruksi dilakukan dengan menyusun kembali sinyal X dari vektor basis terpilih. Optimasi ini dapat dilakukan dengan Basis Pursuit yaitu mencari selisih nilai terkecil dengan sinyal aslinya. Sinyal berhasil di rekonstruksi, parameter yang diukur SDR (Signal to Distortion Ratio) dan MSE (mean square error) atau selisih error hasil pengkodean terhadap sinyal asli. Program selesai.
3
3.3 Skenario Pengambilan Data 1. Pengukuran skenario 1 untuk konfigurasi jarak yang sama.
1.
Tabel 1. Pengukuran skenario 1 Waktu Level suara Jenis Sinyal mikropon (ms) (dB) 1 1.92 -7.45 Sinus 2 1.92 -6.29 f= 1 KHz fs= 8 KHz 3 1.93 -13.8 level= 0 dB 4 1.93 -13.5 1 1.92 -7.5 Wicara 2 1.92 -6.4 fs= 8KHz 3 1.93 -13.9 level= 0 dB 4 1.93 -13.5
X2(t) X3(t)
d3
d2
z(t) d4 d1 X1(t) X4(t)
2.
Gambar 5 Konfigurasi sensor, jarak sama, sudut sama Rancangan ini menggunakan 4 mikropon / ,/ ,/ 0 dan /, yang disusun pada jarak sama dari sumber yaitu 60 cm dengan sudut sama antar sensor 90º. 2. Pengukuran skenario 2 untuk konfigurasi jarak yang berbeda.
X3(t)
X4(t)
d3 d4
X2(t) d2
z(t)
d1 X1(t)
Gambar 6 Konfigurasi sensor, jarak beda, sudut beda. Keterangan : (t) = 0º (t) = 315º 0 (t) = 225º , (t) = 135º
* * *0 *,
= 30 cm = 50 cm = 60 cm = 40 cm
4. ANALISA DAN PEMBAHASAN Pengambilan data untuk sistem sensor jamak dilakukan dengan dua skenario. Sumber suara yang digunakan dalam pengambilan data yaitu sinyal sinus dan sumber suara wicara. Hasil pengambilan data sebagai berikut : 4
Pengukuran skenario 1 untuk konfigurasi jarak yang sama.
Pengukuran skenario 2 untuk konfigurasi jarak yang berbeda. Tabel 2. Pengukuran skenario 2 Waktu Level suara Jenis Sinyal mikropon (ms) (dB) 1 1.06 -1.5 Sinus 2 1.64 -3.2 f= 1 KHz fs= 8 KHz 3 1.92 -6.6 level=0 dB 4 1.32 -6.8 1 1.05 -1.6 Wicara 2 1.64 -3.3 fs= 8KHz 3 1.92 -6.6 level=0 dB 4 1.32 -6.9
Dari hasil pengukuran di atas data sinyal akan digunakan untuk proses kompresi dan rekonstruksi. Perbedaan level suara yang ditangkap mikropon disebabkan karena posisi mikropon berbeda dan besarnya level suara yang ditangkap mikropon juga bergantung dari pola radiasi sumber suara. Sedangkan waktu tunda di udara juga berbeda karena jarak sumber suara terhadap mikropon berbeda. Sinyal terekam diambil sepanjang N=128 untuk mengurangi proses komputasi yang berat, untuk proses kompresi tidak semua data sepanjang N dilakukan pencuplikan, tetapi hanya beberapa cuplikan saja sebanyak k. Jumlah cuplikan k menunjukkan prosentase kompresi.
k 2 8 26
Tabel 3. Prosentase kompresi Kapasitas Kompresi Sebelum Sesudah (%) (Byte) (Byte) 128 2 98 128 8 92 128 26 80
4.1 Pengujian Skenario 1 1. Sinyal Sinus Rekonstruksi menggunakan algoritma basis pursuit dari pengujian diatas mampu merekonstruksi sinyal sinus dengan baik meskipun
pada sampling paling sedikit dari suatu sinyal. Pada proses kompresi 98% pengambilan sampling sebanyak 2 dari 128, sinyal pada mic1 memiliki nilai SDR 2.274612 dB dan MSE sebesar 0.014924. akan tetapi jumlah error pengkodean masih tinggi, sehingga pengambilan sampling 2 belum cukup untuk menampilkan sinyal sepanjang 128. Pada pengujian diatas dilakukan pengambilan sampling lagi dengan k=8 sampling dari 128, sehingga data hasil pengujian kompresi 92% sudah mampu merekonstruksi sinyal dengan SDR 5.454671 dB dan MSE 0.007176. seperti ditunjukkan gambar 8 dan 9.
Gambar 8. SDR sinyal sinus skenario 1
Gambar 11. MSE sinyal wicara skenario 1 4.2 Pengujian Skenario 2 1. Sinyal Sinus Dari pengujian diatas dapat dianalisa bahwa untuk pengambilan sampling sebanyak k=2 pada mic1 belum bisa merekonstruksi sinyal asli. Sehingga SDR dari pengujian k=2 sangat kecil sebesar 1.766501 dB dan MSE sebesar 0.050831. Sedangkan pada pengambilan sampling k=8 juga masih belum bisa menunjukan hasil rekonstruksi yang baik. Tetapi pada sampling k=26 maka hasil rekonstruksi sinyalnya baik dengan memiliki SDR 11.506249 dB dan MSE sebesar 0.003363 pada mic1, tetapi memiliki kapasitas yang lebih besar dibanding dengan pengambilan sinyal sampling yang sedikit. Hasil pengujian SDR dan MSE sinyal sinus skenario 2dapat diamati pada gambar 12 dan 13.
Gambar 9. MSE sinyal sinus skenario 1 2. Sinyal Wicara Sumber sinyal suara tidak dibangkitan dari matlab, tetapi sumber suara rekaman kata “compressed sensing” yang kemudian direkam dengan konfigurasi skenario 1. Hasil dari pengujian untuk sampling k=2 memiliki nilai SDR yang kecil sebesar -0.396236 dB pada mic1 dan MSE sebesar 0.016259. Hal ini menunjukkan bahwa rekonstruksi sinyal tidak berhasil. Sedangkan untuk sampling k=26 memiliki SDR sebesar 8.133197 dB. Rekonstruksi dengan sampling k=26 mampu menampilkan bentuk sinyal sesuai dengan MSE sebesar 0.002281. hasil nya ditunjukkan pada gambar 10 dan 11.
Gambar 10. SDR sinyal wicara skenario 1
Gambar 12. SDR sinyal sinus skenario 2
Gambar 13. MSE sinyal sinus skenario 2 2. Sinyal Wicara Pada pengambilan sampling k=2 memiliki nilai SDR yang kecil 0.045666 dB dan MSE sebesar 0.011506. Hasil ini belum bisa merekonstruksi sinyal, bahkan sinyal rekonstrksi sangat jauh berbeda dengan sinyal aslinya. Proses iterasi dilanjutkan dengan pengambilan sampling sampai k=26 sinyal baru bisa direkonstruksi sudah sesuai dengan sinyal asli dengan SDR 11.506249 sebesar dB dan MSE sebesar 0.003363. Hasil pengujian SDR dan MSE dapat diamati pada gambar 14 dan 15. 5
[4]
[5]
[6] Gambar 14. SDR sinyal wicara skenario 2 [7]
[8]
[9] Gambar 15. MSE sinyal wicara skenario 2
5. 1.
2.
3.
KESIMPULAN Semakin banyak sampling k yang diambil pada proses kompresi berarti nilai kompresi semakin kecil sehingga nilai SDR (Signal to Distortion Ratio) semakin besar dan rata – rata error pengkodean MSE (Mean Square Error) semakin kecil. Dari pengujian yang sudah dilakukan dengan skenario 1 dan skenario 2 diperoleh data sinyal yang berbeda. Hal ini dipengaruhi oleh jarak yang berbeda dan posisi penempatan sensor yang berbeda. Semakin jauh jarak mikropon dengan sumber semakin kecil intensitas suara yang diterima dengan asumsi tidak terjadi refleksi suara. Dengan melakukan kompresi sebesar 92 % untuk sinyal sinus dan 80% untuk sinyal wicara, hasil rekonstruksi dengan basis pursuit pada teknik compressed sensing bisa menampilkan sinyal asli dengan SDR yang besar dan MSE yang kecil. Penggunaan metode BP (basis pursuit) dapat merekonstruksi sinyal dengan baik bahkan hanya dengan melakukan sampling terkecil
DAFTAR PUSTAKA
[1]
[2]
[3]
6
Antony Griffin and Panagiotis Tsakalides,2008, ”Compressed sensing of Audio signals using multiple sensors”, Proc. 16th European Signal Processing Conference (EUSIPCO '08), Lausanne, Switzerland. Bayu S. Andriyan,2008, "Memahami Penginderaan Kompresif dengan MATLABTM", ITB, Bandung. Brandstein M, Ward D,2001, "Microphone Array", Cambridge MA,USA, London, UK.
[10]
[11]
[12] [13]
[14] [15]
D.Donoho,2006, “Compressed Sensing,” IEEE Transaction Information Theory,Vol.52. Husni I, M. Syukron. Haikal.,2001, “Audio Sampling”,
Kinsler L E, Frey A R, Coppens A.B and Sanders J.V.,1982, “Fundamentals of Acoustics”, Third edition, John Wiley & Sons, New York, pp. 120-121 Lain McCowan,2004, "A Microphone Array Tutorial", Queensland University of Technology, Australia. Santoso Tri Budi, Huda Miftahul, “Operasi Dasar Pada Sinyal”, Politeknik Elektronika Negeri Surabaya, Surabaya. Santoso Tri Budi, Huda Miftahul, “Proses Perekaman Dan Pengeditan Sinyal Wicara”, Politeknik Elektronika Negeri Surabaya, Surabaya. Steven W. Smith, 1998, “The Scientist and Engineer's Guide to Digital Signal Processing”, California. Universitas Kristen Duta Wacana,2008, “Multimedia”, Universitas Kristen Duta Wacana, pp 1-2. Yarwood T.M, 1953, “Acoustics”, Macmillan and Co, London. Ze Nian Li, Mark S. Drew, 2004, “Fundamentals of Multimedia”, Pearson Prentice Hall, USA. Zwicker, Eberheart,1999, "Psychoacoustics: Facts and Models", Springer, Berlin. BIODATA PENULIS
Muhammad Ibnu Bahrurrahim, dilahiran di Tulungagung, 13 Juni 1985. Penulis menyelesaiakan pendidikan di SMAN 1 Kauman Tulungagung pada tahun 2004. Setelah menamatkan pendidikan di jenjang SMA, penulis melanjutkan studi nya di JurusanTeknik Elektronika Politeknik Elektronika Negeri Surabaya dan lulus pada tahun 2007. Tidak puas hanya dengan gelar Diploma, penulis akhirnya melanjutkan pendidikan dengan masuk di Jurusan Teknik Elektro Institut Teknologi Sepuluh Nopember melalui program Lintas Jalur pada tahun mengambil bidang studi Telekomunikasi Multimedia.