Makalah Seminar Tugas Akhir PENINGKATAN KUALITAS SINYAL SUARA MENGGUNAKAN PEMODELAN MIKROFON DENGAN METODE KONVOLUSI DAN DEKONVOLUSI Anjar Widyatama1, Achmad Hidayatno2, Ajub Ajulian Zahra2 Abstract Microphone is a device used to convert voice signals into electrical signals. The resulting sound quality is affected by one type of microphone used. Microphone that has an element of good quality would have a frequency response better. This is certainly the desire of everyone to get a good sound quality in the use of a microphone. With the microphone modeling will be helpful to get the sound quality according to the characteristics of the desired type of microphone. In testing the microphone modeling using the principles of convolution and dekonvolusi a voice signal. Frequency response characteristics of the microphone is a microphone which depends the type of microphone itself. Microphone modeling software done in Matlab programming. Signal microphone catches the sound characteristics of the original search dekonvolusi method. Original character is then performed to obtain the signal convolution modeling results. Improving the quality of voice signal can be measured using the MSE and SNR parameters. Testing is done by varying the parameters of frequency sampling and depth of bits that are expected to know the effects. Results of testing showed the existence of signal quality modeling results that can approach the quality of the reference microphone recording using a microphone input, although different types. Research shows that the method of convolution and dekonvolusi can improve the quality of modeling results, so the signal modeling results can be in accordance with the wishes of users. Keywords: modeling, microphone, convolution, dekonvolusi, matlab
suatu metode pemodelan mikrofon dengan memanfaatkan mikrofon berkualitas biasa sehingga mampu menghasilkan keluaran yang mendekati mikrofon berkualitas baik.
I 1.1
PENDAHULUAN Latar Belakang Perkembangan teknologi yang semakin pesat telah banyak membawa pengaruh dalam berbagai bidang kehidupan. Termasuk di dalamnya penggunaan sinyal digital untuk pengolahan sinyal suara. Suara manusia yang ditangkap oleh mikrofon menghasilkan sinyal listrik yang dapat diolah lagi menjadi sinyal suara. Sinyal analog hasil tanggapan dari mikrofon, dapat dilakukan pengolahan secara digital. Masalah yang seringkali muncul adalah suara yang dihasilkan pengeras suara hasil dari tanggapan mikrofon, tidak sesuai dengan yang diharapkan. Hal ini tentu berimbas pada efektifitas dari informasi yang akan disampaikan, sehingga memungkinkan terjadinya kesalahan pemahaman oleh penerima informasi tersebut. Selain itu kualitas suara yang dihasilkan sangat bergantung dengan material penyusun mikrofon, semakin baik jenis material penyusun dan teknologi yang digunakan, maka suara yang berhasil ditangkap oleh mikrofon akan semakin baik. Kualitas mikrofon biasanya berbanding lurus dengan harga produksinya. Harga yang mahal pada mikrofon berkualitas baik, tentu menjadi penghambat bagi pengguna untuk memanfatkannya dalam kebutuhan perekaman suara. Kebanyakan pengguna lebih mementingkan harga dibandingkan dengan kualitas dalam pemilihan jenis mikrofon yang akan digunakan, sedangkan mikrofon dengan harga yang terjangkau belum tentu dapat menghasilkan kualitas yang setara dengan mikrofon mahal. Untuk mengatasi masalah tersebut, diperlukan
1.2
Tujuan Tujuan dari Tugas Akhir ini adalah meningkatkan kualitas sinyal suara menggunakan program pemodelan mikrofon untuk mendapatkan keluaran sinyal suara mikrofon sesuai dengan pemodelan jenis-jenis mikrofon yang digunakan dengan metode konvolusi dan dekonvolusi. 1.3
Pembatasan Masalah Pembatasan masalah pada penulisan tugas akhir ini sebagai berikut : 1. Mikrofon yang digunakan terdiri dari tiga buah mikrofon yang masing-masing dapat bertindak sebagai mikrofon sumber maupun mikrofon model. 2. Proses pemodelan dalam tugas akhir ini dikerjakan dalam domain frekuensi, karena konvolusi dan dekonvolusi dalam domain waktu merupakan perkalian dan pembagian dalam domain frekuensi 3. Mikrofon acuan adalah Shure SM-58 dengan label “mic B”. 4. Tanggapan impuls masing-masing mikrofon diperoleh melalui pemberian impuls sehingga dapat diperoleh tanggapan impulsnya. 5. Sinyal suara yang digunakan sebagai sumber, merupakan data file hasil rekaman suara mono dengan format audio (*.wav) dari sebuah sumber suara yang diatur nilai parameternya.
_______________________________________________________ 1
Mahasiswa Teknik Elektro Undip Dosen Teknik Elektro Undip
2
1
6. Proses pemberian impuls dan perekaman dilakukan di ruang kamar yang memiliki respon akustik baik. 7. Pengujian dilakukan dengan pengolahan data file hasil rekaman suara menggunakan pemrograman Matlab sesuai dengan parameter yang digunakan. 8. Pemodelan mikrofon ini tidak akan mengubah hasil tanggapan mikrofon yang bersifat fisik, misalnya kepekaan dalam frekuensi tertentu maupun luas daerah tanggapan mikrofon.
Unit sample h(n) memberikan seluruh informasi yang dibutuhkan untuk menentukan tanggapan bagi setiap masukan seperti pada Gambar 2.2. Secara umum dengan mengetahui tanggapan impuls suatu sistem, maka dapat dilakukan perhitungan terhadap keluaran yang dihasilkan, untuk berbagai macam kemungkinan masukan. [ 9 ]
II 2.1
Sinyal masukan x(n) masuk ke dalam sistem linear yang mempunyai tanggapan impuls h(n) menghasilkan sinyal keluaran y(n) seperti pada persamaan 2.1. y n x n hn
Gambar 2.1 Konvolusi pada sistem linear.
LANDASAN TEORI Pengolahan Sinyal Digital Pengolahan Sinyal Digital (PSD) adalah sebuah metode untuk memproses sinyal analog menggunakan teknik matematis untuk melakukan transformasi atau mengambil informasi pada domain digital. PSD telah digunakan untuk menyelesaikan permasalahan dalam berbagai bidang aplikasi seperti komunikasi, pencitraan medis, radar dan sonar, telepon, TV digital, faksimil, multimedia dan lain sebagainya. Ada beberapa alasan mengapa digunakan PSD pada suatu sinyal analog. Suatu sistem digital terprogram memiliki fleksibilitas dalam merancang-ulang operasioperasi PSD hanya dengan melakukan perubahan pada program yang bersangkutan, sedangkan proses merancang-ulang pada sistem analog biasanya melibatkan rancang-ulang perangkat keras, uji coba dan verifikasi agar dapat bekerja seperti yang diharapkan. Sinyal digital dapat disimpan pada media magnetik tanpa mengalami pelemahan atau distorsi data sinyal yang bersangkutan. Dengan demikian sinyal tersebut dapat dipindah-pindahkan serta diproses secara offline di laboratorium. Implementasi digital sistem pemrosesan sinyal lebih murah dibandingkan secara analog. Hal ini disebabkan karena perangkat keras digital lebih murah, atau mungkin karena implementasi digital memiliki fleksibilitas untuk dimodifikasi. Proses pengolahan sinyal digital, diawali dengan proses pencuplikan (sampling) sinyal masukan yang berupa sinyal kontinyu seperti pada Gambar 2.2. Proses tersebut mengubah representasi sinyal yang tadinya berupa sinyal kontinyu menjadi sinyal diskret menggunakan suatu unit Analog to Digital Converter (ADC). Pencuplikan dilakukan setiap satu satuan waktu yang disebut dengan waktu cuplik. Bagian kuantisasi akan merubah hasil cuplikan tersebut menjadi beberapa level nilai. Dunia digital hanya terdapat dua simbol untuk merepresentasikan informasi sinyal digital yaitu 0 atau 1.
xk hn k
............................. 2.1
k
Dengan, y(n) : Sinyal keluaran x(n) : Sinyal masukan h(n) : Sinyal impuls Jika x(n) adalah sinyal dengan panjang N, yaitu dari 0 sampai N-1, dan h(n) adalah sinyal dengan panjang M, yaitu dari 0 sampai M-1, maka konvolusi terhadap x(n) dan h(n) menghasilkan y(n) dengan panjang N+M-1, yaitu dari 0 sampai N+M2. Suara sebenarnya terdiri dari gelombang audio yang terdiri dari beberapa komponen frekuensi. Dalam domain waktu, komponen frekuensi tidak dapat dibedakan satu sama lain sehingga tidak dapat dipisahkan. Sedangkan dalam domain frekuensi, komponen-komponen frekuensi dapat dibedakan sehingga dapat dipisahkan satu sama lain. [1] Konvolusi Fast Fourier Transform (FFT) menggunakan prinsip bahwa perkalian pada domain frekuensi berkaitan erat hubungannya dengan konvolusi dalam domain waktu. Masukan ditransformasikan ke dalam domain frekuensi menggunakan Discrete Fourier Transform (DFT), kemudian dikalikan dengan tanggapan impuls, dan selanjutnya keluaran yang dihasilkan kemudian dikembalikan ke domain waktu menggunakan Inverse Discrete Fourier Transform (IDFT). Dengan menggunakan algoritma FFT, proses perkalian pada domain frekuensi dapat lebih cepat dibanding dengan konvolusi dalam domain waktu. Hasil perhitungan yang diperoleh adalah sama, yang membedakan hanya kedalaman perhitungan menjadi lebih singkat dengan menggunakan algoritma yang lebih efisien. Dengan alasan tersebut, maka konvolusi FFT dapat disebut dengan high-speed convolution. [ 9 ] Konvolusi pada domain waktu dapat dinyatakan sebagai perkalian dalam domain frekuensi seperti pada persamaan seperti pada persamaan 2.2.
2.2 Konvolusi dan Dekonvolusi 2.2.1 Konvolusi Konvolusi adalah satu cara matematis untuk mengkombinasikan dua sinyal untuk membentuk sinyal baru. Sistem Linear Time Invariant (LTI) dapat disifati dengan tanggapan unit sample-nya h(n).
2
Y f X f H f ..................................... 2.2 Dengan, Y[f] : Sinyal keluaran domain frekuensi X[f] : Sinyal masukan domain frekuensi H[f] : Sinyal impuls domain frekuensi
2.3.1.2 Mikrofon Condenser Pada mikrofon condenser, gelombang suara menggerakkan diafragma dalam medan listrik untuk membentuk sinyal listrik. Pergerakan diafragma sangat kecil sehingga dibutuhkan daya tambahan yang disebut dengan phantom power untuk menguatkan sinyal listrik yang sangat kecil. Setiap kondenser memiliki sirkuit elektronik aktif, sehingga membutuhkan baterai untuk mengoperasikannya. Desain mikrofon jenis ini memiliki kepekaan yang tinggi dan tanggapan yang lembut untuk jangkaun frekuensi yang lebar.
Sinyal keluaran Y[f] diperoleh dengan cara mengalikan sinyal masukan X[f] terhadap sinyal impuls H[f]. Salah satu hal yang membuat FFT lebih unggul dibandingkan dengan konvolusi tradisional adalah perkalian yang sederhana untuk memperoleh hasil keluaran dari suatu sistem. Untuk memperoleh sinyal keluaran dalam bentuk domain waktu maka diperlukan Inverse FFT untuk mengubah Re Y[f] dan Im Y[f] menjadi sinyal keluaran y(n).
2.3.2 Pola Pengarahan Pola pengarahan mikrofon memperlihatkan variasi kepekaan sejauh 3600 di sekitar mikrofon, dengan mengasumsikan bahwa posisi 00 berada di depan mikrofon. Ada berbagai macam jenis pola pengarahan mikrofon, diantaranya: 2.3.2.1 Mikrofon Omnidirectional Mikrofon omnidirectional mampu menghasilkan tanggapan 3600, sehingga cocok digunakan ketika menginginkan efek ruangan yang akan diperoleh. Mikrofon dengan pola pengarahan ini dapat menangkap sumber suara dari berbagai arah. Pola pengarahan omnidirectional ditunjukkan seperti pada Gambar 2.3.
2.2.2 Dekonvolusi Sinyal keluaran y(n) merupakan hasil konvolusi dari sinyal masukan x(n) terhadap tanggapan impuls h(n). Jika diketahui sinyal keluaran y(n) dan tanggapan impuls h(n) pada suatu sistem, maka dapat dicari sinyal masukan x(n) dengan metode dekonvolusi. Proses Dekonvolusi pada domain waktu dapat dinyatakan sebagai pembagian dalam domain frekuensi seperti pada persamaan seperti pada persamaan 2.3. Yf ........................................... 2.3 Xf Hf Dengan, Y[f] : Sinyal keluaran domain frekuensi X[f] : Sinyal masukan domain frekuensi H[f] : Sinyal impuls domain frekuensi Sinyal masukan X[f] diperoleh dengan cara membagi sinyal keluaran Y[f] dengan sinyal impuls H[f]. Untuk memperoleh sinyal keluaran dalam bentuk domain waktu maka diperlukan Inverse FFT untuk mengubah Re Y[f] dan Im Y[f] menjadi sinyal keluaran y(n).
Gambar 2.2 Mikrofon Omnidirectional.
2.3.2.2 Mikrofon Unidirectional Mikrofon unidirectional peka terhadap bunyi yang datang dari arah tertentu, namun kurang peka terhadap arah yang lainnya. Jenis paling umum adalah mikrofon kardioid yang peka pada arah 00 namun berkurang kepekaannya ketika pada posisi 1800. Pola pengarahan unidirectional ditunjukkan seperti pada Gambar 2.4.
2.3
Mikrofon Mikrofon didesain untuk mengkonversi satu bentuk dari daya akustik ke daya elektrik. Mikrofon mempunyai dua kategori dasar, yaitu mikrofon dynamic dan mikrofon condenser. 2.3.1 Kategori Mikrofon[8] 2.3.1.1 Mikrofon Dynamic Pada mikrofon dynamic, gelombang suara menggerakkan diafragma pada suatu medan magnet untuk menghasilkan sinyal listrik yang sama dengan gelombang suara akustik yang berhasil ditangkap. Sinyal dari elemen dinamis dapat dipergunakan secara langsung, tanpa membutuhkan komponen tambahan seperti catu daya dari baterai. Mikrofon jenis ini dapat langsung digunakan tanpa harus membutuhkan catu daya tambahan.
Gambar 2.3 Mikrofon Unidirectional.
2.3.2.3 Mikrofon Bidirectional Mikrofon jenis ini mempunyai tanggapan yang kuat pada 00 (depan) dan 1800 (belakang) namun tanggapan lemah pada kedua sisinya 900. Biasanya digunakan untuk merekam dua sumber yang berhadapan satu sama lain, ataupun digunakan untuk teknik perekaman secara stereo.
3
yaitu suatu fungsi (m file) yang disediakan oleh Mathwork. Karakteristik Matlab antara lain: - Bahasa pemrogramannya didasarkan pada matriks (baris dan kolom). - Dapat diubah ke bahasa C menggunakan Matlab Compiler.
2.3.3 Loudness Tingkat kenyaringan beberapa sumber bunyi seperti pada Gambar 2.4.
2.6 Metode Pengukuran Perbandingan Hasil 2.6.1 Mean Square Error (MSE) MSE adalah salah satu cara yang dapat digunakan untuk menghitung tingkat kesamaan dua buah sinyal. Pada prinsipnya MSE menghitung seberapa besar pergeseran data yang dihitung antara sinyal suara satu dengan yang lainnya.
ei Yi Yi ............................................. 2.4
MSE
Gambar 2.4 Tingkat kenyaringan sumber bunyi.
1 n 2 ei ...................................... 2.5 n i 1
Dengan, MSE n
Fluktuasi dari tekanan udara yang dihasilkan oleh sumber bunyi, berubah di atas dan di bawah dari tekanan udara normal. Hal inilah yang menjadi tanggapan telinga manusia. Perubahan tekanan yang besar akan menghasilkan bunyi yang lantang.
: Mean square error : panjang size : Selisih sinyal
ei Yi
: Sinyal suara acuan
2.3.4 Penggunaan Mikrofon Ada berbagai macam merek dan versi mikrofon dipasaran. Hal ini tentu membutuhkan kejelian bagi konsumen untuk memilih sesuai kebutuhan. Pemilihan jenis mikrofon disesuaikan dengan jangkauan frekuensi suara yang akan ditangkap.
Yi
: Sinyal suara pembanding
Metode MSE merupakan ukuran kontrol kualitas yang dapat digunakan untuk mengetahui kualitas dari hasil pengujian. Nilai ei dalam penulisan tugas akhir ini diperoleh dari selisih antara sinyal suara acuan terhadap sinyal suara yang akan dibandingkan. Nilai MSE yang semakin kecil menunjukkan bahwa kedua buah sinyal memiliki tingkat kesamaan yang semakin tinggi.
2.4
Tanggapan Impuls Mikrofon Salah satu yang membuat hasil keluaran dari mikrofon berbeda satu sama lain adalah Tanggapan impuls yang dimiliki masing-masing mikrofon seperti pada Gambar 2.5.
2.6.2
Signal to Noise Ratio (SNR)
Metode SNR yang dimaksud dalan tugas akhir ini berkaitan erat hubungannya dengan Peak Signal to Noise Ratio (PSNR). Metode PSNR dapat digunakan untuk mengukur perbandingan sinyal satu dengan sinyal yang lainnya. Namun SNR yang dimaksud dalam penulisan tugas akhir ini adalah metode yang digunakan untuk mengukur perbandingan sinyal acuan terhadap selisih kedua buah sinyal.
Gambar 2.5 Contoh hasil tanggapan impuls dari dua jenis mikrofon dalam domain waktu.
Untuk mendapatkan tanggapan impuls yang baik diperlukan suatu ruangan yang mampu mengurangi gangguan seperti derau atau gema, sehingga dapat memperoleh hasil perekaman dengan kualitas yang baik.
MAX I2 ....................... 2.9 SNR 10 log10 MSE
2.5
Matlab Matlab singkatan dari Matrix Laboratory, merupakan bahasa pemrograman yang dikembangkan oleh the Mathwork, Inc. Bahasa pemrograman ini banyak digunakan untuk perhitungan numerik keteknikan, komputansi simbolik, visualisasi, grafis, analisis data matematis, statiska, simulasi, pemodelan, dan desain Graphical User Interface (GUI). Pada matlab tersedia tool yang dikenal dengan toolbox,
Dengan, SNR
MAX MSE
2 I
: Signal to Noise Ratio (dB) : Sinyal suara acuan : Mean Square Error
Nilai MAX I2 dalam penulisan tugas akhir ini adalah sinyal suara acuan yang akan dibandingkan.
4
Nilai SNR yang semakin besar menunjukkan bahwa kedua buah sinyal memiliki tingkat kesamaan yang semakin tinggi.
3.1.2 Penentuan Kedalaman Bit Kedalaman bit yang dapat digunakan dalam perancangan perangkat lunak pemodelan mikrofon adalah 8 bit, 16 bit, dan 32 bit.
III PERANCANGAN DAN IMPLEMENTASI SISTEM Perancangan sistem pemodelan mikrofon dimulai dengan pembuatan diagram alir secara umum seperti pada Gambar 3.1. Masing-masing prosedur dapat dijabarkan lagi melalui diagram alir yang lebih rinci dalam pembahasan selanjutnya.
3.1.3 Penentuan Mikrofon Masukan Untuk memperoleh tanggapan sumber suara suara diperlukan informasi mengenai tanggapan impuls dari mikrofon masukan yang digunakan. 3.1.4 Penentuan Mikrofon Keluaran Untuk memperoleh karakter hasil pemodelan diperlukan informasi mengenai tanggapan impuls dari mikrofon keluaran yang digunakan. 3.2 Pemanggilan data 3.2.1 Perekaman Suara Masukan Perekaman suara masukan dilakukan dengan memberi masukan suara pada sistem. Keluaran dari sistem tersebut disimpan sebagai hasil rekaman. 3.2.2 Penentuan File Suara Masukan Penentuan file suara masukan dilakukan dengan pemilihan file yang telah disimpan dalam direktori khusus. Hasil rekaman juga dapat dipilih sebagai suara masukan. 3.3
Penentuan Tanggapan Sumber Suara Tanggapan sumber suara adalah tanggapan suara yang belum dipengaruhi oleh tanggapan impuls mikrofon masukan. Metode yang dapat dilakukan adalah melakukan proses dekonvolusi pada karakter suara hasil keluaran mikrofon terhadap tanggapan impuls mikrofon itu sendiri. 3.4
Penentuan Tanggapan Pemodelan Mikrofon Tanggapan pemodelan mikrofon adalah tanggapan sumber suara suara yang sudah dipengaruhi oleh tanggapan impuls mikrofon keluaran. Metode yang dapat dilakukan adalah melakukan proses konvolusi pada tanggapan sumber suara suara terhadap tanggapan impuls mikrofon keluaran itu sendiri.
Gambar 3.1 Diagram alir program utama.
Sistem dimulai secara berturut-turut adalah prosedur penentuan parameter, perekaman suara masukan, penentuan file suara masukan, penentuan tanggapan sumber suara, dan penentuan tanggapan pemodelan. 3.1 Penentuan Parameter Pada perancangan sistem ini prosedur penentuan parameter terdiri dari beberapa sub prosedur yaitu penentuan frekuensi cuplik, kedalaman bit, mikrofon masukan dan mikrofon keluaran yang digunakan sebagai parameter kontrol terhadap hasil pemodelan mikrofon. Perbedaan pengaturan parameter diharapkan dapat menganalisis secara detail pengaruh masing-masing parameter.
3.5
Penentuan Perbandingan Hasil Hasil pemodelan mikrofon yang diperoleh dapat diketahui sejauh mana kualitasnya dengan cara mencari perbandingan hasil tersebut dengan tanggapan sumber suara. Selanjutnya dua buah file tersebut akan dicari perbandingan kesalahan menggunakan metode MSE dan SNR.
3.1.1 Penentuan Frekuensi Cuplik Frekuensi cuplik yang dapat digunakan dalam perancangan perangkat lunak pemodelan mikrofon adalah 8 KHz, 44,1 KHz, dan 96 KHz.
IV 4.1
PENGUJIAN DAN ANALISIS Program Simulasi Simulasi program menggunakan bahasa pemrograman matlab 7.6 (R2008a). GUI digunakan sebagai antar muka antara senarai program dan pengguna program. Tampilan program utama
5
mempunyai beragam menu untuk melakukan proses pemodelan mikrofon seperti Gambar 4.1.
4.2.3 Pengujian Tanggapan Sumber Suara Tanggapan sumber suara merupakan sinyal suara masukan yang telah dihilangkan tanggapan impuls mikrofon penangkapnya. Sinyal suara masukan mengalami proses dekonvolusi untuk bisa mendapatkan tanggapan sumber suara. Berdasarkan hasil pengujian didapatkan hasil seperti pada tabel 4.3. Tabel 4.3 Nilai size , ukuran, dan waktu proses hasil penentuan tanggapan sumber suara dari mikrofon A.
Gambar 4.1 Tampilan program utama.
Program utama terdapat berbagai pilihan menu yang terdiri dari penentuan parameter, rekam suara, cari file, karakter asli sumber, pemodelan dan hasil pemodelan. Sinyal suara tanggapan sumber suara jika diputar ulang akan terdengar persamaan kemiripan ketika parameter frekuensi cuplik dan kedalaman bit diubah. Hal ini dikarenakan sumber yang digunakan adalah sama, sehingga tanggapan suara yang dihasilkan merupakan tanggapan sumber suara sebelum diberi pengaruh tanggapan impuls mikrofon. Pengujian serupa juga dilakukan terhadap mikrofon B dan C.
4.2 Pengujian Sistem 4.2.1 Pengujian Tanggapan impuls Mikrofon Dalam pengujian ini menggunakan tiga buah mikrofon dengan merk Dynamic Microphone dengan label “mic A”, merk Shure SM-58 dengan label “mic B”, dan Philips DM-902 dengan label “mic C”. Berdasarkan hasil pengujian terhadap mikrofon A, B, dan C didapatkan hasil nilai size seperti pada tabel 4.1. Tabel 4.1
Hasil nilai size tanggapan impuls mikrofon A, B, dan C.
4.2.4 Pengujian Hasil Pemodelan Mikrofon Hasil pemodelan mikrofon merupakan sinyal tanggapan sumber suara yang telah dipengaruhi oleh tanggapan impuls mikrofon pemodelannya. Sinyal tanggapan sumber suara mengalami proses konvolusi untuk bisa mendapatkan hasil pemodelan.
Tanggapan masing-masing frekuensi mikrofon A, B, dan C yang berbeda satu sama lain bergantung pada frekuensi cuplik dan kedalaman bit yang digunakan.
4.2.4.1 Keluaran mikrofon A Sinyal tanggapan sumber suara dari mikrofon A, B, dan C mengalami proses konvolusi terhadap tanggapan impuls mikrofon A. Berdasarkan hasil pengujian didapatkan hasil seperti pada tabel 4.4.
4.2.2 Pengujian File Suara Masukan Masing-masing mikrofon diberi masukan sumber suara yang sama sehingga nantinya dapat dibandingkan keluaran hasil pemodelannya. Setiap hasil rekaman yang berupa sinyal mono dilakukan perubahan pada parameter frekuensi cuplik dan kedalaman bit yang digunakan. Berdasarkan hasil pengujian didapatkan hasil seperti pada tabel 4.2.
Tabel 4.4
Nilai size , ukuran, dan waktu proses hasil pemodelan dengan menggunakan mikrofon masukan A dan keluaran A.
Tabel 4.2 Nilai size dan ukuran hasil rekaman file suara masukan menggunakan mikrofon A.
Pengujian serupa juga dilakukan terhadap mikrofon B dan C sebagai masukan. Pengujian serupa mikrofon B dan C.
juga
dilakukan
terhadap
4.2.4.2 Keluaran mikrofon B Sinyal tanggapan sumber suara dari mikrofon A, B, dan C mengalami proses konvolusi terhadap tanggapan impuls mikrofon B. Berdasarkan hasil pengujian didapatkan hasil seperti pada tabel 4.5.
6
Tabel 4.5
Nilai size , ukuran, dan waktu proses hasil pemodelan dengan menggunakan mikrofon masukan A dan keluaran B.
Pengujian serupa juga dilakukan mikrofon B dan C sebagai masukan.
1.
Nilai MSE Nilai MSE terkecil, untuk masing-masing frekuensi cuplik dan kedalaman bit, diperoleh ketika pemodelan menggunakan mikrofon keluaran yang sama dengan mikrofon masukannya. Semakin kecil nilai MSE maka semakin kecil pula kesalahan pada proses pemodelan tersebut. Sedangkan untuk sinyal dengan mikrofon masukan yang berbeda dengan keluarannya, nilai MSE tidak terlampau jauh selisihnya dengan nilai terkecilnya. Gambar 4.2 menunjukkan grafik MSE antara hasil pemodelan menggunakan masukan mikrofon A, B, dan C dibandingkan dengan hasil rekaman sumber menggunakan mikrofon A.
terhadap
4.2.4.3 Keluaran mikrofon C Sinyal tanggapan sumber suara dari mikrofon A, B, dan C mengalami proses konvolusi terhadap tanggapan impuls mikrofon C. Berdasarkan hasil pengujian didapatkan hasil seperti pada tabel 4.6.
Mic A
Nilai size , ukuran, dan waktu proses hasil pemodelan dengan menggunakan mikrofon masukan A dan keluaran C.
2.00000E-04
2.36457E-04
2.27030E-04
Mic B
1.91231E-04 1.56916E-04
1.53694E-04
MSE
Tabel 4.6
Grafik MSE Pemodelan Mic A 2.50000E-04
Mic C
1.43044E-04
1.50000E-04
1.00000E-04 4.84129E-05 4.83683E-05 4.68342E-09 4.56563E-09 2.44584E-05 4.24077E-07 4.12908E-07 3.80198E-08 4.59898E-09 4.22533E-07 4.09486E-07 9.66298E-062.45848E-09 2.34331E-09 9.25550E-063.65819E-09 1.65559E-09 2.22562E-116.85824E-12 7.05344E-08 2.80881E-08
5.00000E-05
0.00000E+00
8KHz-8bit 8KHz-16bit 8KHz-32bit 44,1KHz8bit
44,1KHz16bit
44,1KHZ32bit
96KHz-8bit
96KHz16bit
96KHz32bit
Parameter
Gambar 4.2 Grafik MSE pemodelan “mic A”.
Pengujian serupa juga dilakukan mikrofon B dan C sebagai masukan.
Nilai MSE hasil pemodelan menggunakan masukan mikrofon A jauh lebih kecil dibandingkan dengan menggunakan masukan mikrofon B dan C. Grafik MSE menunjukkan hasil pemodelan akan lebih meyerupai hasil rekaman, jika selama pemodelan menggunakan mikrofon masukan sama dengan mikrofon keluarannya. Pengujian serupa juga dilakukan terhadap pemodelan mikrofon B dan C sebagai masukan.
terhadap
4.3 Analisis 4.3.1 Proses Pemodelan Kualitas proses pemodelan mikrofon dapat diukur dengan cara membandingkan sinyal hasil pemodelan dengan sinyal hasil rekaman. Metode yang dipilih untuk membandingkan antara sinyal hasil pemodelan dengan sinyal hasil rekaman adalah MSE dan SNR. Berdasarkan hasil pengujian didapatkan hasil seperti pada tabel 4.7. Tabel 4.7
2.
Nilai SNR Nilai SNR terbesar, untuk masing-masing frekuensi cuplik dan kedalaman bit, diperoleh ketika pemodelan menggunakan mikrofon keluaran yang sama dengan mikrofon masukannya. Semakin besar nilai SNR maka semakin kecil pula kesalahan pada proses pemodelan tersebut. Sedangkan untuk sinyal dengan mikrofon masukan yang berbeda dengan keluarannya, nilai SNR tidak terlampau jauh selisihnya dengan nilai terkecilnya. Gambar 4.3 menunjukkan grafik SNR antara hasil pemodelan menggunakan masukan mikrofon A, B, dan C dibandingkan dengan hasil rekaman sumber menggunakan mikrofon A.
Perbandingan nilai MSE dan SNR hasil pemodelan mikrofon dengan Fs=8 KHz.
Grafik SNR Pemodelan Mic A Mic A 100.00000
89.22660
90.00000
Mic B
84.11420
80.00000
Mic C 63.68200 63.89040 60.88310 60.99370
SNR (dB)
70.00000 60.00000 50.00000 40.00000
27.74110
30.00000 23.67700 20.00000
61.95600
53.07220 49.07340 41.29880 41.43510 41.39890 41.28300 27.92860
15.72570 16.03750
14.74570 14.03334
65.39920 60.96210
51.78860
15.63600 13.85510
20.73910
20.74310
10.00000
Pengujian serupa juga dilakukan frekuensi cuplik 44,1 KHz dan 96 KHz.
terhadap
0.00000 8KHz-8bit
8KHz16bit
8KHz32bit
44,1KHz- 44,1KHz- 44,1KHZ8bit 16bit 32bit
96KHz8bit
96KHz16bit
96KHz32bit
Gambar 4.3 Grafik SNR pemodelan “mic A”.
7
Parameter
1.40000E-02
Nilai SNR hasil pemodelan menggunakan masukan mikrofon A lebih besar dibandingkan dengan menggunakan masukan mikrofon B dan C. Grafik SNR menunjukkan hasil pemodelan akan lebih meyerupai hasil rekaman, jika selama pemodelan menggunakan mikrofon masukan sama dengan mikrofon keluarannya. Pengujian serupa juga dilakukan terhadap pemodelan mikrofon B dan C sebagai masukan.
Grafik MSE Perbandingan Kualitas mic A terhadap mic B 1.26556E-02
1.26486E -02
1.26487E-02
1.27023E -02
1.26925E-02
1.26927E -02
1.27021E-02
1.26927E -02
1.26927E-02
mic B vs mic B-AB
1.20000E-02 1.00000E-02
mic B vs mic A
MSE
8.00000E-03 6.00000E-03 4.00000E-03 2.00000E-03
6.38028E-04 8.27897E-06
0.00000E+00 8KHz8bit
8KHz16bit
8.45028E-06
8KHz32bit
1.50441E-04
4.71632E-10
1.29600E -04
3.79271E-10
44,1KHz- 44,1KHz44, 8bit 16bit 1KHZ32bit
4.96978E-07
96KHz8bit
4.95290E -07
96KHz16bit
96KHz32bit
parameter
Gambar 4.5 Grafik MSE peningkatan kualitas “mic A” terhadap “mic B”.
4.3.2 Hasil Pemodelan Mikrofon acuan yang digunakan adalah mikrofon Shure SM-58 dengan label “mic B”. Shure SM-58 dipilih karena mempunyai tanggapan suara yang cukup baik dibandingkan kedua mikrofon yang lainnya, sehingga untuk menentukan seberapa besar peningkatan kualitas hasil pemodelan mikrofon perlu dilakukan perbandingan. 4.3.2.1 Peningkatan Kualitas Hasil Pemodelan Mikrofon A Skema pengukuran peningkatan kualitas mikrofon A terhadap mikrofon acuan (“mic B”) dilakukan dengan 2 tahap seperti Gambar 4.4.
Grafik SNR Perbandingan Kualitas mic A terhadap mic B
80.00000
72.97010 73.91670 mc B vs mic B-AB
70.00000
SNR (dB)
60.00000 50.00000
mic B vs mic A
42.74280 42.75760
40.00000
30.52150 30.43260
30.00000 20.00000 10.00000
18.58210
17.93480 11.65460 -1.33078
-1.33011
-1.33012
-1.34129
-1.34035
-1.34035
-1.34153
-1.34035
-1.34035
0.00000 -10.00000
8KHz8bit
8KHz16bit
8KHz32bit
44,1KHz- 44,1KHz- 44,1KHZ- 96KHz8bit 16bit 32bit 8bit
96KHz16bit
96KHz32bit
parameter
Gambar 4.6 Grafik SNR peningkatan kualitas “mic A” terhadap “mic B”.
4.3.2.2 Peningkatan Kualitas Hasil Pemodelan Mikrofon C Skema pengukuran peningkatan kualitas mikrofon C terhadap mikrofon acuan (“mic B”) dilakukan dengan 2 tahap seperti Gambar 4.7.
Gambar 4.4 Skema pengukuran peningkatan kualitas “mic A” terhadap “mic B”.
Tahap pertama adalah membandingkan hasil rekaman langsung mikrofon A dan B. Tahapan selanjutnya adalah membandingkan hasil rekaman langsung mikrofon B terhadap hasil pemodelan yang menggunakan mikrofon A sebagai masukan dan mikrofon B sebagai keluaran. Tabel 4.8 menunjukkan hasil pengujian MSE dan SNR mikrofon A dan mikrofon ancuan.
Gambar 4.7 Skema pengukuran peningkatan kualitas “mic C” terhadap “mic B”.
Tahap pertama adalah membandingkan hasil rekaman langsung mikrofon C dan B. Tahapan selanjutnya adalah membandingkan hasil rekaman langsung mikrofon B terhadap hasil pemodelan yang menggunakan mikrofon C sebagai masukan dan mikrofon B sebagai keluaran. Tabel 4.9 menunjukkan hasil pengujian MSE dan SNR mikrofon C dan mikrofon ancuan (“mic B”).
Tabel 4.8 Perbandingan nilai MSE dan SNR hasil pemodelan “mic B” (acuan) terhadap “mic A”.
Tabel 4.9 Perbandingan nilai MSE dan SNR hasil pemodelan “mic B” (acuan) terhadap “mic C”.
Berdasarkan hasil pengukuran dapat dibuat grafik perbandingan kualitas mikrofon. Grafik perbandingan MSE dan SNR seperti Gambar 4.5 dan 4.6. Berdasarkan hasil pengukuran dapat dibuat grafik perbandingan kualitas mikrofon. Grafik perbandingan MSE dan SNR seperti Gambar 4.8 dan 4.9.
8
1.80000E-02
1.63234E-02
1.63235E- 02
1.63591E-02
1.63518E-02
1.63518E-02
1.62903E-02
1.62826E-02
1.62827E-02
mic B vs mic B-CB
1.40000E-02 1.20000E-02
MSE
dari 1,26927E-02 menjadi 3,7927E-11 dan nilai SNR naik dari -1,34035 dB menjadi 73,91670 dB pada perbandingan pemodelan mikrofon A terhadap mikrofon B (acuan). Sedangkan nilai MSE turun dari 1,63518E-02 menjadi 1,35221E-11 dan nilai SNR naik dari -2,43690 dB menjadi 68,39580 dB pada perbandingan pemodelan mikrofon C terhadap mikrofon B (acuan). 4. Semakin tinggi nilai frekuensi cuplik dan kedalaman bit maka kualitas suara akan semakin jernih dan jelas, namun kapasitas media penyimpanan menjadi semakin besar. Ukuran file hasil pemodelan untuk frekuensi cuplik 96 KHz dan kedalaman 32 bit adalah 7.436 KB. 5. Tanggapan impuls mikrofon A, B, dan C berdasarkan grafik yang berbeda satu sama lain berpengaruh terhadap tanggapan suara hasil pemodelan mikrofon.
Grafik MSE Perbandingan Kualitas mic C terhadap mic B 1.62476E-02
1.60000E-02
mic B vs mic C
1.00000E-02 8.00000E-03 6.00000E-03 4.00000E-03 2.00000E-03
4.24450E-04
6.10603E-06
6.02047E- 06
1.07253E-04
1.44225E-09
1.35221E- 09
1.53796E- 04
5.31291E-05
5.31260E-05
0.00000E+00
8KHz8bit
8KHz16bit
8KHz32bit
44,1KHz- 44,1KHz8bit 16bit
44, 1KHZ32bit
96KHz8bit
96KHz16bit
96KHz32bit
parameter
Gambar 4.8 Grafik MSE perbandingan kualitas “mic C” terhadap “mic B”. Grafik SNR Perbandingan Kualitas mic C terhadap mic B
80.00000
68.11580
70.00000
68.39580 m ic B vs m icB-CB
SNR (dB)
60.00000
m ic B vs m ic C
50.00000 40.00000
31.84370
31.90500
30.00000
22.45280
19.40440
10.00000
-2.43448
-2.43425
-2.43427
-2.43652
22.45310
17.83870
20.00000 13.42470 -2.43690
-2.43690
-2.41854
-2.41849
-2.41849
0.00000 -10.00000
8KHz-8bit
8KHz16bit
8KHz32bit
44,1KHz- 44,1KHz- 44,1KHZ8bit 16bit 32bit
96KHz8bit
96KHz16bit
96KHz32bit
parameter
5.2
Saran Adapun saran yang dapat diberikan sehubungan dengan pelaksanaan penelitian ini adalah: 1. Pemodelan seperti ini akan lebih mudah penggunaanya ketika proses ini sudah bisa dilakukan oleh sebuah modul PSD khusus, sehingga penggunaanya akan lebih sederhana namun tetap menghasilkan kualitas suara yang baik. 2. Jenis mikrofon yang digunakan dapat diperbanyak, sehingga dapat dihasilkan berbagai macam jenis pemodelan mikrofon.
Gambar 4.9 Grafik SNR perbandingan kualitas “mic C” terhadap “mic B”.
Berdasarkan hasil pengujian kualitas hasil pemodelan mikrofon A dan C, grafik memperlihatkan nilai MSE untuk mikrofon hasil pemodelan jauh lebih kecil nilainya dibandingkan dengan hasil rekaman langsung. Nilai MSE yang semakin kecil, menunjukkan terjadinya peningkatan kualitas yang sangat signifikan setelah dilakukan pemodelan mikrofon. Nilai SNR untuk mikrofon hasil pemodelan jauh lebih besar nilainya dibandingkan dengan hasil rekaman langsung. Nilai SNR yang semakin kecil, menunjukkan terjadinya peningkatan kualitas yang sangat signifikan setelah dilakukan pemodelan mikrofon.
DAFTAR PUSTAKA [1] Amri, Syaiful. 2009. Implementasi Adaptive Noise Cancellation (ANC) Menggunakan TMS320C5402 pada Perangkat Telepon Genggam. Semarang: Universitas Diponegoro [2] Atmaja, Bagus Tri. 2009. ”Pengolahan Sinyal Akustik”. http://bagustris.blogspot.com Diakses 2009 [3] Bayhaki, Achmad. 2009. Penekanan Derau Secara Adaptif pada Pengenalan Ucapan Kata. Semarang: Universitas Diponegoro. [4] Putra, Agfianto Eko. 2008. ”Kelebihan Pemrosesan Sinyal Digital”. http://agfi.staff.ugm.ac.id, Diakses 30 April 2009 [5] Sahar, Rizal Ali. 2009. Acoustic Echo Cancellation Menggunakan Algoritma NLMS (Normalized Least Means Square). Semarang: Universitas Diponegoro. [6] Selik, Melissa and Richard Barahiuk. 2007. ”Properties of Convolution” . The Connexions Project.
V 5.1
PENUTUP Kesimpulan Dari hasil peneilitian dan pembahasan dapat disimpulkan bahwa: 1. Nilai MSE terkecil dan SNR terbesar diperoleh ketika pemodelan menggunakan mikrofon keluaran yang sama dengan masukannya. Nilai MSE terkecil adalah 1.67367E-11 diperoleh ketika pemodelan menggunakan keluaran dan masukan mikrofon C, sedangkan nilai SNR terbesar adalah 89.2266 dB diperoleh ketika pemodelan menggunakan keluaran dan masukan mikrofon A. 2. Kualitas sinyal suara hasil pemodelan mikrofon dapat dikatakan meningkat jika hasil tanggapan mikrofon A dan C (model) semakin mendekati mikrofon B (acuan). 3. Peningkatan kualitas suara hasil pemodelan mikrofon dapat diukur berdasarkan hasil perbandingan nilai MSE yang semakin kecil dan nilai SNR yang semakin besar. Nilai MSE turun
9
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
Setiawan, Dwi. 2009. “Pengolahan Sinyal Digital”. http://setiawan.blog.uns.ac.id Diakses 18 Oktober 2009. Shure. 2006. ”A Shure Educational Publication: Microphone Techniques for Recording”, http://shure.com. Diakses tanggal 28 Mei 2009. Smith, Steven W. 1997. “The scientist & engineer guide to PSD”. California Technical Publishing. Sudarmo, Bambang. 2009. Penggunaan Tapis Adaptif dalam Proses Editing Suara pada Pembuatan Film Layar Lebar. Semarang: Universitas Diponegoro. Tanudjaja, Harlianto. 2007.“Pengolahan Sinyal Digital & Sistem Pemrosesan Sinyal”. Yogyakarta: Penerbit ANDI. Valentino, Mark. 2009. “Microphone Handbook“. http://scribd.com Diakses 24 Juni 2009. Wikipedia. 2009. “Mean Squared Error”. http://wikipedia.com Diakses 18 Oktober 2009. Wikipedia. 2009. “Peak Signal to Noise Ratio”. http://wikipedia.com Diakses 24 November 2009.
BIODATA PENULIS Anjar Widyatama (L2F005514). Lahir di Semarang, 17 Juli 1987. Menempuh pendidikan dasar di SD N Petompon 07, SMP N 3, dan SMA N 3 Semarang. Pada tahun 2005 melanjutkan studi strata satu di Teknik Elektro Universitas Diponegoro Semarang, konsentrasi Elektronika Telekomunikasi. Aktif diberbagai kegiatan akademik maupun non akademik, diantaranya HME, BEM FT, assisten praktikum Sistem Telekomunikasi dan Teknik Digital. Menyetujui, Dosen Pembimbing I
Achmad Hidayatno, S.T. , M.T. NIP. 19691221 199512 1 001 Dosen Pembimbing II
Ajub Ajulian Zahra, S.T. , M.T. NIP. 19710719 199802 2 001
10