BAB II TINJAUAN PUSTAKA
2.1.
Bunyi Sumber bunyi adalah semua benda yang bergetar dan menghasilkan bunyi yang merambat melalui medium atau zat perantara. Gelombang bunyi terdiri dari molekul-molekul yang bergetar merambat ke segala arah, molekul-molekul
itu
berdesakan
dibeberapa
tempat,
sehingga
menghasilkan wilayah tekanan tinggi atau perapatan (compression), tapi ditempat lain merenggang (rarefaction), sehingga menghasilkan wilayah tekanan rendah. Gelombang bertekanan tinggi dan rendah secara bergantian bergerak melalui medium atau zat penghantar berupa udara, gas, zat cair dan zat padat. Dengan prinsip tersebut gelombang ini termasuk gelombang longitudinal. (Tipler, Paul A. 1998)
Gambar 2.1. Sebuah ilustrasi bagaimana bunyi dapat terdengar telinga manusia
8
Gambar 2.1 merupakan ilustrasi dari proses perambatan gelombang bunyi melalui medium udara. Sumber bunyi dihasilkan oleh sumber suara yaitu speaker yang berfungsi sebagai osilator (penghasil getaran). Pada medium udara terjadi proses peregangan dan perapatan pada partikel-partikel dimedia udara, proses itu terjadi dengan sangat cepat dan semakin lama bunyi dari sumber akan diterima oleh pendengar dengan menggetarkan membran yang ada pada telinga manusia.
2.1.1. Laju Bunyi Laju dari sembarang gelombang mekanik (transversal dan longitudinal), bergantung pada sifat-sifat inersial medium (yang menyimpan energi kinetik) dan sifat-sifat elastik medium (yang menyimpan energi potensial) yang diformulasikan secara matematis ;
√
√
dimana (untuk gelombang transversal) τ adalah tegangan dalam dawai dan μ adalah kerapatan linear dawai. Jika medium adalah udara dan gelombang adalah longitudinal, kita dapat menebak bahwa sifat inersial, berkaitan dengan μ, adalah kerapatan volume ρ udara. Ketika gelombang melewati udara, energi potensial berkaitan dengan perapatan (compression) dan perenggangan (rarefaction) volume elemen molekul-molekul udara. Sifat-sifat yang menentukan kelanjutan dimana
9
suatu elemen medium berubah volumenya ketika tekanan (gaya per satuan luas) pada elemen tersebut berubah disebut modulus Bulk (B) dengan satuan Pascal (Pa).
⁄
Di sini
ΔV
/V adalah perubahan fraksi dalam volume yang dihasilkan oleh
perubahan Δp. Satuan SI untuk tekanan adalah N/m2, yang diberi nama khusus, Pascal (Pa). Dari persamaan 2-2 dapat kita lihat bahwa satuan untuk modulus Bulk (B) juga Pascal (Pa). Tanda Δp dan ΔV selalu berlawanan. Ketika kita meningkatkan tekanan pada elemen (Δp positif), volumenya menurun (ΔV negatif). Kita menyertakan tanda negatif dalam persamaan 2-2 sehingga B selalu bilangan positif. Sekarang gantikan B untuk τ dan ρ untuk μ dalam persamaan 2-1, maka menghasilkan.
√
dimana : v = kecepatan atau laju bunyi di udara (m/s) B = modulus Bulk (Pa) ρ = densitas (kg/m3)
10
Setiap zat penghantar gelombang bunyi memiliki laju perambatan yang berbeda-beda bergantung pada sifat zat tersebut (Halliday, D. resnick, R. walker, J. 2010). Dapat dilihat pada tabel 2.1 dibawah ini.
Tabel 2.1 laju bunyi berdasarkan mediumnya Medium
Laju Bunyi
Udara Udara (0 ºC) Helium Hidrogen Air Air laut Besi Gelas Plastik Aluminium Kayu keras
340 331 1.005 1.300 1.440 1.560 5.000 4.500 2.680 5.100 4.000
2.1.2. Spektrum Bunyi Frekuensi audio (audio frequency) merujuk sebagai getaran periodik yang frekuensinya dapat didengar oleh rata-rata manusia. Frekuensi-frekuensi yang dapat didengar oleh manusia disebut audio atau sonik. Range frekuensi yang umumnya dapat didengar berkisar dari 20 Hz sampai 20.000 Hz. Frekuensi-frekuensi di atas 20.000 Hz sampai 20 MHz disebut ultrasonik (ultrasonic) gelombang ini sering digunakan untuk pemeriksaan kualitas produksi di dalam industri. Di bidang kedokteran, gelombang ini digunakan untuk diagnosis dan pengobatan, karena mempunyai daya tembus jaringan yang sangat kuat. sedangkan frekuensi-frekuensi di bawah 20 Hz disebut infrasonik (infrasonic).
11
Gambar 2.2. Spektrum bunyi
Penting untuk diingat bahwa kata “bunyi” (sound) mengacu kepada sebuah fenomena perambatan gelombang pada sebuah medium, sedangkan kata “suara” (voice) mengacu kepada bunyi yang dihasilkan dari organ tubuh manusia, yaitu membran getar pada organ-organ bicara manusia. Kata “audio”, “sonik", “audiosonik”, dan “akustik” secara umum diartikan sebagai jangkah frekuensi (frequency range) dari spektrum bunyi yang dapat dideteksi / didengar oleh manusia, walaupun sebenarnya kata “akustik” (acoustic) sendiri merupakan suatu inter-disiplin ilmu yang mempelajari bunyi. (Tipler, Paul A. 1998)
2.1.3. Pitch Pitch berhubungan dengan sensasi perubahan frekuensi pada bunyi oleh pendengar (manusia) pitch sangat dekat hubungannya dengan frekuensi, tetapi keduanya sebenarnya berbeda. Frekuensi ialah sebuah objek, suatu konsep ilmiah, sedangkan pitch subjektif. Pitch hanya sebuah persepsi subjektif pendengar (manusia) yang menyatakan suatu bunyi itu tinggi atau rendah. Makin tinggi frekuensi (dalam besaran fisika), maka manusia akan menyatakan bahwa pitch dari bunyi tersebut makin tinggi, terkadang
12
juga dinyatakan bahwa bunyi itu semakin melengking. Gelombang bunyi sendiri tidak mempunyai pitch. Istilah pitch hanya dipakai bila gelombang bunyi yang didengar hanya terdiri dari satu buah frekuensi tunggal. Jika istilah pitch dipakai dalam sebuah sumber bunyi dengan frekuensi tidak tunggal (seperti alat musik dan suara manusia), maka istilah pitch mengacu pada perubahan frekuensi dasarnya (frekuensi fundamental). Frekuensi (f) gelombang bunyi menyatakan berapa banyaknya osilasi yang terjadi selama waktu tertentu, biasanya dalam satu detik. Frekuensi diekspresikan dalam banyaknya siklus per detik dengan satuan ukur dalam Hertz (Hz). Lima Hz diartikan sebagai osilasi lima siklus penuh (sempurna) per-detik. Kebalikan dari frekuensi, yaitu periode (T). Periode suatu gelombang diartikan sebagai berapa lamanya waktu yang dibutuhkan untuk melakukan sebuah osilasi sempurna.
dimana f ialah frekuensi dalam Hz dan T ialah periode dalam detik. (Raymond A. Serway dan John W. Jewett, Jr. 2011). Terdapat hubungan matematis sederhana antara panjang gelombang (λ), periode (T), dan frekuensi (f), yaitu kecepatan atau laju (v). Karena kecepatan ialah jarak dibagi oleh waktu, maka dapat kita turunkan suatu persamaan :
13
atau dengan mengganti T dengan f, maka didapat :
dimana : v = kecepatan atau laju gelombang (m/s) λ = panjang gelombang (m) T = periode gelombang (s) f = frekuensi gelombang (Hz)
2.1.4. Loudness Loudness berhubungan dengan sensasi perubahan amplitudo pada bunyi oleh si pendengar (manusia). Loudness sangat dekat hubungannya dengan intensitas bunyi (I), tetapi keduanya sebenarnya berbeda. Intensitas ialah sebuah objek, suatu konsep ilmiah, sedangkan loudness subjektif. Loudness hanya sebuah persepsi subjektif pendengar (manusia) yang menyatakan suatu bunyi itu besar atau kecil. Makin besar intensitas (dalam besaran fisika), maka manusia akan menyatakan bahwa loudness dari bunyi tersebut makin besar, terkadang juga dinyatakan bahwa bunyi itu semakin bising. Berdasarkan teori gelombang, amplitudo (ym) dari suatu gelombang adalah besar
dari
perpindahan
maksimum
elemen-elemen
dari
posisi
14
kesetimbangannya ketika gelombang melewati posisi tersebut. Pada ym, Subskrip m menandakan maksimum. Karena ym adalah magnitudo, maka ym selalu kuantitas positif, Amplitudo gelombang tidak mempengaruhi laju (v) gelombang, yang berarti juga tidak mempengaruhi frekuensi (f) dan panjang gelombang (λ). (Raymond A. Serway dan John W. Jewett, Jr.2011).
2.2.
Hydrophone Hydrophone adalah perangkat elektronika yang digunakan untuk menangkap bunyi di bawah air. Bunyi yang dihasilkan berbentuk gelombang
suara
kemudian
diubah
menjadi
sinyal
audio
yang
diterjemahkan dalam bentuk data yang terukur. Komponen utama dari hydrophone ini adalah piezoelektrik yang berfungsi sebagai pengubah gelombang suara menjadi sinyal audio.
Gambar 2.3. hydrophone SQ26-H1
15
Gambar 2.3 merupakan gambar hydrophone profesional dengan teknologi yang tinggi dan harga yang mahal. Transduser yang digunakan memiliki jangkauan frekuensi dari audiosonik sampai ultrasonik yaitu 20 Hz sampai 50 kHz. menggunakan kabel penghubung yang rendah noise dan bebas oksigen dengan panjang 10 meter sangat memungkinkan kabel ini menjadi media yang tepat sebagai konduktor untuk penunjang teknologi tranduser dari perangkat hydrophone tersebut. Data yang didapat dari tranduser akan di simpan oleh handy recorder dengan menggunakan micro memory card (MMC).
Gambar 2.4. spesifikasi hydrophone SQ26-H1
16
Gambar 2.4 merupakan spesifikasi dari hydrophone yang akan digunakan dalam proses pengambilan contoh suara. Mempunyai spesifikasi yang tinggi sehingga memungkinkan untuk melakukan pemrosesan suara dengan baik. Tedapat banyak jenis hydrophone yang diproduksi oleh Cetacean Research Technology salah satunya jenis transduser SQ26 yang digunakan dalam penelitian ini. Sedangkan H1 adalah jenis handy recorder yang diproduksi oleh perusahaan tersebut.
Gambar 2.5. fitur dan fungsi dari handy recorder Zoom H1
17
handy recorder pada gambar 2.5 merupakan alat perekam dari pengaplikasian piezoelektrik SQ26 yang dirancang khusus untuk pendukung perangkat piezoelektrik tersebut. Fitur-fitur yang tersedia pada handy recorder adalah prosedur standar untuk melakukan proses perekaman seperti tombol power (on/off), record (start/stop), volume (+,-), speaker internal, low cut (on/off), screen indicator dan lain-lain. Setelah data diterima dan direkam oleh handy record, data tersebuat akan tersimpan pada micro memory card (MMC). (Cetacean Research Technology).
2.3.
Lumba-lumba Lumba-lumba adalah mamalia laut yang sangat cerdas, sistem alamiah yang melengkapi tubuhnya sangat kompleks sehingga banyak teknologi yang terinspirasi dari lumba-lumba. Salah satu contoh adalah sistem yang digunakan untuk berkomunikasi dan menerima rangsang yang dinamakan sistem Sound Navigation And Ranging (SONAR), sistem ini digunakan untuk lumba-lumba bernavigasi pada kondisi normal maupun kondisi gelap (kedalaman laut), menghindari serangan predator, mencari makan dan para ilmuan percaya SONAR pada lumba-lumba dapat merangsang sistem saraf otak manusia. Teknologi ini juga diterapkan dalam pembuatan radar kapal selam. Ada banyak jenis lumba-lumba yang hidup di sungai dan laut seluruh dunia salah satunya jenis lumba-lumba hidung botol (Tursiops truncatus) mamalia yang termasuk kedalam Ordo Cetacea dan Famili Delphinidae. Yang hidup berkelompok dalam kesehariannya untuk mencari makan dan beraktivitas. Lumba-lumba yang lebih kecil dan
18
berbadan lebih ramping hidup di perairan lepas pantai, sedangkan yang lebih besar memiliki badan dan kepala yang lebih tegap dan hidup di perairan dalam. Paruhnya cukup pendek dengan rata-rata 40 buah gigi pada setiap rahangnya. Panjang tubuhnya mencapai 4 m dengan berat 150650 kg. Punggungnya berwarna abu-abu kebiruan atau abu-abu kecoklatan yang dilengkapi sirip punggung setinggi 23 cm. Sementara bagian perut, dada dan lehernya berwarna putih atau abu-abu pucat. Lumba-lumba jenis ini memiliki intelegensi yang tinggi terbukti dari kemampuannya untuk dilatih dengan cepat dalam melakukan prosedur-prosedur rumit seperti gerakan akrobat dengan hanya memperhatikan beberapa contoh yang diberikan. Dan juga sering menampik air dengan menggunakan ekornya dan melompat sampai ketinggian beberapa meter dari permukaan laut lalu mereka mengikuti gelombang ombak atau gelombang yang ditimbulkan oleh kapal laut. (Destari, Ayu. 2007).
Gambar 2.6. Lumba-lumba hidung botol (Tursiops truncatus).
19
2.3.1. Tingkah Laku Lumba-lumba Mamalia laut melakukan berbagai macam gerakan dan tingkah laku yang berhubungan dengan kehidupannya. Tingkah laku lumba-lumba ini sangat beragam, mulai dari yang sangat jelas terlihat sampai yang sangat jarang dilakukan, namun dapat dipelajari beberapa jenis tingkah laku dari lumbalumba sehingga bisa mengartikan tingkah laku tersebut. (Siahainenia, S. R. 2010). Berikut adalah tingkah laku lumba-lumba : A. Bow riding adalah gerakan lumba-lumba berenang mengikuti gerakan kapal. B. Aerials adalah Gerakan lumba-lumba melompat sangat tinggi, salto, berbalik dan berputar di udara. C. Stationary adalah lumba-lumba diam tidak melakukan pergerakan. D. Travelling adalah Gerakan lumba-lumba membentuk kelompok dalam kegiatan mencari mangsa dan pergerakan untuk migrasi. E. Lobtailing adalah Gerakan mengangkat fluks ke luar permukaan air dan memukul-mukulkan ke permukaan air. F. Feeding adalah Kegiatan yang dilakukan ketika sedang mencari makan, biasanya ditandai adanya schooling ikan di dekat lumbalumba. G. Avoidance adalah Gerakan lumba-lumba yang menghindar dari kapal.
20
2.3.2. Komunikasi Lumba-lumba Lumba-lumba tidak memiliki pita suara dan jarang terlihat mengeluarkan gelembung ketika menghasilkan suara untuk berkomunikasi. suara lumbalumba dapat dikelompokan menjadi tiga jenis yaitu klik (ekolokasi), siulan dan lengkingan/dengkuran. Suara ini digunakan untuk berkomunikasi, melacak lingkungan sekitar dan berkembang biak (intraseksual). suara ini berasal dari sistem hidungnya. Setiap tipe suara yang dihasilkan lumbalumba bervariasi yaitu siulan (0,8-24 kHz), lengkingan (2-2,8 kHz) biasanya suara ini keluar ketika lumba-lumba sedang tertekan dan emosi, yang ketiga adalah klik suara untuk melacak gaung, beberapa penelitian berpendapat berbeda pada range frekuensi yang digunakan lumba-lumba untuk berekolokasi ada yang mengatakan 0,2-150 kHz (Simmonds et al., 2004) dan ada juga yang menyatakan ekolokasi pada lumba-lumba hanya pada frekuensi ultrasonik yaitu 20-150 kHz. Proses pembuatan suara didalam air yang dilakukan lumba-lumba yaitu menggunakan kantung udaranya untuk membuat suara. Kantung kecil ini berada di bawah lubang udara. Ketika mereka keluar permukaan untuk mengambil napas, mereka mengambil sejumlah udara yg akan masuk ke lubang udara mereka. Udara yg dihirup ini akan mengisi kantung dan menyebabkan tekanan untuk membuat suara, artinya kantung itu berfungsi sebagai resonator. Mereka membuat suara dari pergeseran udara belakang dan depan diantara kantung udaranya.
21
Gambar 2.7. proses pemancaran dan penerimaan suara lumba-lumba.
Gambar 2.8. anatomi kepala lumba-lumba
Lumba-lumba berkomunikasi dengan sesama jenisnya atau dengan spesies lain dengan berbagai cara terutama dalam bentuk sinyal akustik. Suara lumba-lumba berada pada kisaran frekuensi 200 Hz sampai 150 KHz. (W.L, Wiltlow. Arthur N. Popper. Richard R. Fay. 2000).
22
2.3.3. Ekolokasi Ekolokasi merupakan lacak gaung yang menjadi sensor utama lumbalumba karena akustik merupakan sarana yang paling efektif dan efisien untuk
berkomunikasi
pada
lingkungan
perairan.
Lumba-lumba
mentransmisikan sinyal akustik pada bagian kepala (melon) dan menerima pantulannya dari rahang bawah. Pantulan tersebut memungkinkan lumbalumba untuk mengetahui bentuk, ukuran, tekstur dan jarak dari obyek. Hal ini sangat berguna sebagai alat navigasi, untuk mencari mangsa dan menghindar dari predator. Suara dengan durasi, panjang gelombang, amplitudo, frekuensi, interval dan pola suara yang berbeda ditransmisikan untuk tujuan yang berbeda pula. Karakter dari suara yang dihasilkan lumba-lumba dapat digunakan sebagai teknik untuk terapi bagi anak-anak yang memiliki masalah psikis maupun keterbelakangan mental atau individu autistik dan untuk penderita stroke. Ekolokasi yang digunakan lumba-lumba sama seperti sistem SONAR yang memungkinkan lumba-lumba berkomunikasi saat malam hari atau pada kedalaman tertentu ketika cahaya tidak terjangkau. Saat ekolokasi lumbalumba mengeluarkan bunyi klik gelombang ultrasonik sekitar 40 sampai 150 kHz dengan rentan waktu 50 sampai 138 mikrodetik secra berurutan. (W.L, Wiltlow. Arthur N. Popper. Richard R. Fay. 2000).
23
Gambar 2.9. ekolokasi pada lumba-lumba
2.4.
Sinyal Dan Sistem Konsep dan ide mengenai sinyal dipergunakan dan memainkan peran penting di berbagai bidang seperti elektronika, komunikasi, penerbangan, biomedis, sistem produksi dan distribusi energi, sistem kendali, serta pengolahan suara / bunyi. Sinyal adalah fenomena dari lingkungan yang terukur atau terkuantisasi, sementara sistem adalah bagian dari lingkungan yang menghubungkan sinyal dengan sinyal lainnya atau dengan kata lain merespon sinyal masuk dengan menghasilkan sinyal keluaran. Pada dasarnya semua suara audio, baik vokal maupun bunyi tertentu merupakan suatu bentuk dari getaran. Ini menandakan semua audio memiliki bentuk gelombangnya masing-masing. Umumnya bentukan gelombangnya disebut dengan sinyal analog. Sinyal analog bekerja dengan mentransmisikan suara dalam bentuk gelombang kontinu. Dua parameter atau karakteristrik terpentig yang dimiliki oleh isyarat analog adalah amplitudo dan frekuensi. Isyarat analog biasanya dinyatakan dengan gelombang sinus, mengingat gelombang sinus merupakan dasar untuk semua bentuk isyarat analog. Hal ini didasarkan kenyataan bahwa
24
berdasarkan analisis fourier, suatu sinyal analog dapat diperoleh dari perpaduan sejumlah gelombang sinus. Dengan menggunakan sinyal analog, maka jangkauan transmisi data dapat mencapai jarak yang jauh, tetapi sinyal ini mudah terpengaruh oleh noise. Gelombang pada sinyal analog yang umumnya berbentuk gelombang sinus memiliki tiga variabel dasar, yaitu amplitudo, frekuensi dan fasa. 1. Ampitudo merupakan ukuran tinggi rendahnya tegangan dari sinyal analog. 2. Frekuensi adalah jumlah gelombang sinyal analog dalam satuan detik. 3. fasa adalah besar sudut dari sinyal analog pada saat tertentu.
Gambar 2.10. sinyal analog
Sinyal digital merupakan hasil teknologi yang dapat merubah sinyal menjadi kombinasi urutan bilangan 0 dan 1 (juga dengan biner), sehingga tidak mudah terpengaruh oleh noise, proses informasinyanya pun mudah, cepat dan akurat, tetapi transmisi dengan siyal digital hanya mencapai jarak jangkau pengiriman data yang relatif dekat. Biasanya sinyal ini juga dikenal dengan sinyal diskrit. Sinyal yang mempunyai dua keadaan ini biasa disebut dengan bit. Bit merupakan istilah khas pada sinyal digital. Sebauah bit dapat beupa nol (0) atau satu.
25
Gambar 2.11. sinyal digital
Sinyal digital merupakan bentuk sampling dari sistem analog. Digital pada dasarnya dikodekan dalam bentuk biner (hexa). Besarnya nilai suatu sistem digital dibatasi oleh lebarnya atau jumlah bit (bandwidth). Sinyal digital memiliki berbagai keistimewaan yang unik, yang tidak dapat ditemukan pada teknologi analog, yaitu : 1. Mampu mengiriman informasi dengan kecepatan cahaya yang dapat membuat informasi dapat dikirim dengan kecepatan tinggi. 2. Penggunaan
yang
berulang-ulang
terhadap
informasi
tidak
mempengaruhi kualitas dan kuantitas informasi itu sendiri. 3. Informasi dapat dengan mudah diperoses dan dimodifikasi kedalam berbagai bentuk. 4. Dapat memproses informasi dalam jumlah yang sangat besar dan mengirimnya secara interaktif.
Didalam menyimpan, menampilkan dan mengolah sinyal audio pada komputer, sinyal analog harus melalui proses digitasi. Proses tersebut melalui dua tahap, yaitu sampling dan kuantisasi. Proses tersebut sering disebut dengan konversi analog ke digital (A/D). (Dewi P, Silvia. 2011).
26
Gambar 2.12. pengolahan sinyal analog menjadi sinyal digital
2.4.1. Sampling Sinyal suara merupakan sinyal yang tidak terbatas dalam domain waktu (finite time interval). Suara lumba-lumba akan menghasilkan sinyal analog yang terus kontinu. Untuk keperluan pemrosesan dalam transformasi fourier maka sinyal suara harus di bentuk dalam potongan-potongan waktu yang terbatas (infinite time interval) dengan proses sampling. Sampling merupakan proses merepresentasikan sinyal waktu kontinu (sinyal analog) dengan sinyal tercecah pada sumbu waktu diskrit. Sebagai contoh sinyal kontinu x(t) pada domain waktu sebagai sinyal diskrit x[n] dengan mengambil nilai x(t) pada interval nTs. Frekuensi sampling didapatkan dari persamaan fs = 1/Ts. Apabila range kisaran (amplitudo) bervariasi secara cepat, diperlukan Ts lebih kecil untuk mendapatkan aproksimasi yang tepat untuk x(t).
27
Gambar 2.13. bentuk sinyal sinus asli
Gambar 2.14. bentuk sinyal sinus yang telah di sampling
Gambar 2.15. proses pencuplikan suara
28
Gambar 2.13 memperlihatkan bentuk sinyal sinus asli dan gambar 2.14 memperlihatkan bentuk sinyal sinus yang sudah di sampling melalui proses pencuplikan sinyal seperti terlihat pada gambar 2.15. untuk mendapatkan sinyal waktu diskrit yang mampu mewakili sifat sinyal aslinya, proses sampling harus memenuhi teorema sampling atau syarat Nyquist. Bahwa banyaknya sampling (sampling frekuensi = fs) yang dilakukan untuk suatu sinyal analog paling sedikit harus sebesar dua kali frekuensi tertinggi sinyal analog. Misalnya, untuk sinyal suara (voice grade) yang mempunyai spektrum frekuensi tertinggi 4 kHz, maka frekuensi sampling yang diperlukan adalah 2 x 4000 = 8000 Hz. Atau secara matematis dapat ditulis :
Dimana : fs = frekuensi sinyal sampling fi = sinyal informasi yang akan di sampel
apabila frekuensi sinyal sampling tidak sesuai dengan teori nyquist, dimana frekuensi sampling (fs) minimum adalah dua kali frekuensi sinyal analog dimana akan dikonversi (fi), maka akan terjadi fenomena aliasing proses sampling pada sinyal hasil sampling. (Dewi P, Silvia. 2011).
29
sinyal berfrekuensi tinggi
dicuplik pada frekuensi yang kurang tepat
kelihatan seperti ini
sinyal berfrekuensi rendah
Gambar 2.16. fenomen aliasing
Disebut aliasing karena frekuensi tertentu terlihat sebagai frekuensi yang lain (menjadi alias dari frekuensi lain). Dari beberapa keterangan pada gambar 2.16 dapat disimpulkan bahwa teorema sampling sangat diperlukan dan sangat diperhatikan saat mengubah suatu sinyal analog menjadi diskrit. Teorema sampling diciptakan agar pembacaan data analog dan diskrit jangan ada yang hilang karena proses aliasing, tetapi untuk frekuensi sampling kritis yaitu dua kali bandwidth sinyal, performansi dari hasil sampling masih belum memenuhi indeks performansi secara umum. Untuk dapat mendapatkan hasil yang sampling secara baik, maka frekuensi sampling tidak sekedar dua kali bandwidth sinyal. beberapa kriteria dalam menentukan frekuensi sampling : 1. Frekuensi sampling yang diambil harus menyebabkan sinyal yang tersampling memiliki indeks performansi minimal 85% dari sinyal asli. 2. Frekuensi sampling yang diambil berada sekitar 15-20 kali frekuensi maximum sinyal.
30
3. Untuk satu kali rise time, ada sekitar 4-10 sample.
2.4.2. Kuantisasi Kuantisasi adalah proses representasi nilai sampel sinyal menjadi bilangan biner. Representasi sampel dalam bentuk sinyal pulsa dengan amplitudo proposional terhadap sinyal yang disampel. Proses representasi ini disebut dengan Pulse Amplitude Modulation (PAM). Amplitudo dari setiap pulsa PAM dibulatkan ke n-bit bilangan bulat terdekat. Jumlah bit per sampel yang digunakan untuk merepresentasikan sampel menentukan jumlah level analog yang dapat direpresentasikan. Apabila digunakan 8 bit per sampel maka akan terdapat representasi 256 (28) level yang berbeda. Sinyal digital terdiri dari suatu blok dari n-bit, dimana setiap bit angka menunjukan amplitudo sinyal aslinya. Karena adanya proses kuantisasi ini, maka sinyal hasil proses balik dari diskrit (digital) ke kontinu (analog) hanya mendekati sinyal aslinya. Proses ini disebut dengan error kuantisasi.
Gambar 2.17. proses kuantisasi
31
Kuantisasi melakukan pengelompokan pada selang-selang (interval) tertentu. Besarnya selang kuantisasi ini disebut juga dengan istilah step size. Berdasarkan besarnya step size dapat dibedakan dua jenis kuantisasi, yaitu : 1. Kuantisasi seragam adalah interval kuantisasi sama besar. 2. Kuantisasi tak seragam adalah interval kuantisasi tidak sama besar.
(a)
(b) Gambar 2.18. (a) kuantisasi seragam ; (b) kuantisasi tak seragam
32
Banyaknya selang (inverval) bergantung pada banyaknya bit yang akan digunakan untuk proses penyandian. Jika konverter A/D n-bit maka jangkauan sinyal analog akan dikuantisasikan (dikelompokan) menjadi sejumlah 2n selang (interval). Pada gambar 2.18 diperhatikan ilustrasi kuantisasi sinyal analog menjadi 16 selang (n-4).
Gambar 2.19. kuantisasi sinyal analog menjadi 16 selang (interval)
Banyaknya jumlah bit yang akan digunakan untuk proses penyandian akan menetukan banyaknya jumlah selang kuantisasi. Semakin besar n maka semakin besar pula jumlah selang (interval) yang digunakan. Hal ini juga berarti besar selang (interval) semakin kecil. Semakin kecil selang
33
interval, maka proses pemodulasian akan semakin teliti, sehingga sinyal yang diperoleh semakin mendekati sinyal aslinya. (Dewi P, Silvia. 2011)
2.4.3. Coding Untuk proses pentransmisian melewati jalur transmisi yang diganggu noise maka keluaran dari proses kuantisasi bentuknya harus disesuaikan dengan kondisi kanal. Proses konversi yang diperlukan disebut encoding (pengkodean). Encoding menyatakan batas spesifikasi tempat antara elemen dua buah karakter. Bentuk yang mungkin adalah kode biner. Kode biner hanya menggunakan elemen 0 dan 1 untuk tiap karakter yang disebut bit (binary digital). (Dewi P, Silvia. 2011)
2.5.
Sekilas MATLAB Matlab adalah singkatan dari matrix laboratory, merupakan bahasa pemrograman yang dikembangkan oleh The Mathwork Inc. yang hadir dengan fungsi dan karakteristik yang berbeda dengan bahasa pemrograman lain yang sudah ada lebih dahulu seperti Delphi, Basic maupun C++. Matlab merupakan bahasa pemrograman level tinggi yang dikhususkan untuk kebutuhan komputasi teknis, visualisasi dan pemrograman seperti komputasi matematik, analisis data, pengembangan algoritma, simulasi, pemodelan dan grafik-grafik perhitungan. Pada awalnya Matlab dibuat untuk memberikan kemudahan mengakses data matrik. Beberapa kelebihan Matlab jika dibandingkan dengan program lain seperti Fortran, dan Basic adalah :
34
Mudah dalam memanipulasi struktur matriks dan perhitungan berbagai operasi matriks yang meliputi penjumlahan, pengurangan, perkalian, invers dan fungsi matriks lainnya.
Menyediakan fasilitas untuk memplot struktur gambar (kekuatan fasilitas grafik tiga dimensi yang sangat memadai).
Script program yang dapat diubah sesuai dengan keinginan user.
Jumlah routine-routine powerful yang berlimpah dan terus berkembang.
Dilengkapi dengan toolbox, simulink, stateflow dan sebagainya, serta mulai melimpahnya source code di internet yang dibuat dalam matlab (contoh toolbox misalnya : signal processing, control system, neural networks dan sebagainya). (Leis, John W. 2011)
Gambar 2.20. tampilan depan MATLAB
35
2.5.1. M-File Penulisan barisan ekspresi dalam Matlab command window dilakukan baris perbaris dan biasanya untuk menyimpan barisan perintah dan hasil outputnya dengan menggunkan command diary. Hal ini sangatlah tidak efisien dikarenakan barisan yang telah tersimpan di diary tidak dapat diulangkan kembali seandaianya telah keluar dari Matlab. Apalagi jika dilakukan banyak sekali perulangan barisan perintah yang sama, misalkan dilakukan pengolahan data dan perhitungan yang samayang melibatkan data atau fungsi yang berbeda. Untuk itu Matlab menyediakan suatu struktur untuk membuat fungsi sendiri atau suatu teknik pemrograman dalam bentuk M-File. Fungsi M-file hampir sama dengan script file dimana keduanya merupakan suatu file teks dengan ekstensi “m” Fungsi M-file ini tidak dimasukkan dalam command window, melainkan suatu file tersendiri yang dibuat dalam editor teks (Matlab editor/debugger). Suatu fungsi M-File harus mengikuti beberapa aturan, fungsi M-file juga mempunyai sejumlah sifat penting. Aturan-aturan dan sifat-sifat tersebut meliputi : 1. Nama fungsi dan nama file harus identik. Contohnya flipud disimpan dalam file yang bernama flipud “m”. 2. Pertama kali Matlab mengeksekusi suatu fungsi M-file, Matlab membuka file fungsi tersebut dan mengkompilasi perintah-perintah di dalamnya menjadi suatu representasi internal dalam memori yang mempercepat eksekusi untuk semua pemanggilan berikutnya. Jika
36
fungsi juga melibatkan pemanggilan ke fungsi M-file yang lain, fungsi M-file yang dipanggil itu juga akan dikompilasi ke dalam memori. 3. Baris komentar sampai dengan baris bukan komentar yang pertama adalah teks help yang ditampilkan. Jika anda meminta help, misalnya >>help flipud yang menampilkan 9 baris komentar pertama dari contoh di atas. Baris komentar yang paling atas disebut baris H1 adalah baris yang dicari oleh perintah look for. 4. Setiap fungsi memiliki ruang kerjanya sendiri yang berbeda dengan ruang kerja Matlab. Satu-satunya hubungan antara ruang kerja Matlab dengan variabel-variabel dalam fungsi adalah variabel-variabel input dan output fungsi. Jika suatu fungsi mengubah nilai dalam bentuk suatu variabel input, perubahan itu hanya tampak dalam fungsi dan tidak mempengaruhi ruang kerja Matlab. 5. Jumlah dari argument input dan output yang digunakan jika suatu fungsi dipanggil hanya ada dalam fungsi tersebut. 6. Fungsi dapat berbagi variabel dengan fungsi lain, ruang kerja Matlab dan pemanggilan rekursi untuk dirinya sendiri jika variabelnya dideklarasikan sebagai variabel global. 7. Fungsi M-file berhenti dieksekusi dan kembali ke prompt jika telah mencapai akhir dari M-file atau jika menemui perintah return. Perintah return merupakan cara sederhana untuk menghentikan fungsi sebelum mencapai akhir file. 8. Fungsi M-file dapat memuat lebih dari sebuah fungsi.
37
Untuk membuat M-file click File di Matlab command window selanjutnya pilih New dan click M-File dari menu the pull down. Maka di layar akan ditampilkan Matlab Editor / Debugger .Selanjutnya di layar ini dituliskan argumen-argumen yang diinginkan. Setelah selesai melakukan pengetikan maka File, pada layar Matlab Editor / Debugger pilih Save as. berikan nama yang diinginkan untuk file tersebut, misalnya “firstgraph.m” kemudian click Save. Pastikan bahwa file yang disimpan pada direktori yang mudah untuk dipanggil. Sebagai contoh sederhana file dalam script adalah :
% Script file firstgraph. x = pi/100:pi/100:10*pi; y = sin(x)./x; plot(x,y) grid
Untuk mengesekusi file script di atas maka Command Window ketikan nama file yang telah disimpan sebelumnya firstgraph. Dengan syarat bahwa sebelumnya directori path sudah ditujukan ke tempat file yang disimpan lalu pilih menu run/play maka akan tampil gambar seperti berikut :
38
Gambar 2.21. contoh gambar tampilan dari script M-file
Gambar 2.21 merupakan hasil dari deklarasi script M-file untuk menampilkan sebuah grafik sinyal sinus yang diinginkan. Grafik dapat dimodifikasi dengan cara menambahkan script xlabel, ylabel, title dan lain-lain agar grfik mudah dipahami dan dianalisa. (Leis, John W. 2011)
2.6.
Code-Excited Linear Prediction (CELP)
2.6.1. Pengertian CELP Code-Excited Linear Prediction (CELP) adalah algoritma speech coding yang ditemukan oleh M.R. Schroeder dan B.S. Atal pada tahun 1985. Pada saat itu, CELP kualitasnya jauh lebih baik dibandingkan dengan algoritma low bitrate yang telah lebih dahulu ada seperti, residual excited linear prediction dan linear predictive coding vocoders (LPC Vocoder). LPC Vocoder juga memiliki beberapa jenis seperti algebraic CELP, relaxed CELP, low-delay CELP, dan Vector sum excited linear prediction. nama
39
"Code-Excited " berasal dari codebook eksitasi, yang berisi kode untuk membangkitkan filter sintesis. Pengkodean kompleksitas tinggi CELP awalnya dianggap menjadi tidak praktis namun setelah bertahun-tahun peneliti telah menemukan banyak cara untuk mempercepat proses encoding yang membuat CELP praktis menjadi kenyataan .Ide algoritma CELP terbagi menjadi beberapa bagian utama : 1.
Menggunakan source-filter model of speech production pada Linear production (LP).
2. Menggunakan adaptive dan fixed codebook sebagai input pada model LP. 3. Mengaplikasikan vector quantization (VQ). CELP coding adalah teknik frame berorientasi yang memecah sinyal masukan sampel ke dalam blok sampel yang diproses sebagai satu unit. Teknik pengkodean CELP didasarkan pada metode analisis-by-sintesis, sebagai pencari parameter pembobotan pengukuran gangguan yang meningkatkan kualitas sinyal sintetis. Algoritma yang pertama kali disimulasikan pada tahun 1983 oleh Schroeder dan Atal membutuhkan 150 detik untuk encode 1 detik kata yang diucapkan ketika dijalankan pada komputer Cray-1. Semenjak Itu banyak cara yang lebih efisien untuk pengimplementasian codebook dan pengembangan pada kemampuan komputer sehingga memungkinkan untuk menjalankan algoritma pada embedded devices seperti telepon selular.
40
Gambar 2.22. Skema dasar CELP, meminimalkan error dengan pemilihan entry codebook terbaik.
Gambar 2.22 adalah skema dasar CELP dan diagram blok dari encoder. terdapat codebook berukuran M dan Dimensi K, tersedia untuk kedua encoder dan decoder. Kode vektor memiliki komponen yang semuanya independen dipilih dari a N (0,1) distribusi sehingga setiap kode vektor memiliki spektrum 'derau putih' disekitarnya. Untuk setiap sub-frame dari masukan sinyal wicara (contoh k) pengolahan dilakukan dengan setiap kode vektor disaring melalui dua filter yaitu 1/A (z) dan 1/B (z) dan yn keluaran dibandingkan dengan sampel sinyal wicara. Keluaran kode vector terbaik yang telah dibandingkan dengan masukan sinyal wicara akan diseleksi untuk mewakili sub-frame pada bagian MSE. Filter 1/A (z) kode vektor menyerupai spektrum masukan sinyal wicara. Dengan kata lain, dalam waktu domain filter menggabungkan korelasi jangka pendek (korelasi dengan sampel L sebelumnya) secara berurutan. Selain korelasi jangka pendek, terdapat daerah sinyal wicara yang menunjukkan
41
periodisitas jangka panjang. Periode ini dikenal sebagai picth yang dimasukkan ke dalam spektrum lalu disintesis oleh picth filter 1/B (z). Sinyal wicara disintesis oleh filter adalah skala sinyal yang telah dikuatkan gain untuk membuat energi yang sama dengan energi masukan sinyal wicara. Untuk meringkas setiap frame sinyal wicara sintetis (N samples) perlu menghitung LPCs dan pitch dan memperbarui filter. Untuk setiap sub-frame sinyal wicara sintetis (K sampels), kode vektor yang menghasilkan sinyal terbaik dipilih untuk mewakili subframe. Decoder menerima indeks kode vektor yang dipilih dari nilai terkuantisasi untuk setiap subframe. LPCs dan nilai-nilai picth juga harus terkuantisasi dan dikirim ke setiap frame untuk merekonstruksi filter di decoder. Sinyal wicara direkonstruksi pada decoder melewati kode vektor dipilih melalui filter. Untuk menentukan rate pada CELP coder ditentukan oleh dua faktor : 1. Rate dari VQ = RVQ = 2. Bits yang berlebih perlu untuk diteruskan ke quantized Value of gain untuk setiap sub-frame dan koefisien linear predictive coding (LPC) untuk setiap frame. Untuk menentukan rate dari coder dalam bits per-second ditentukan sebagai berikut : R = ( RVQ + # overhead bits/sample)*8000 (Mulye, M. and Jagtap. S. 2014).
42
2.6.2. Frame dan sub-frame Sebuah model CELP memecah input menjadi 240 sampel frame, sama seperti standar LPC. Selanjutnya memproses 240 sampel frame menjadi 60 sub-frames, yang berarti setiap 1 frame memiliki 4 sub-frame. Jumlah tiap sampel per frame dan sub-frame bergantung pada versi dari CELP.
Gambar 2.23. struktur frame dan sub-frames
2.6.3. Codebook Pengembangan selanjutnya dari teknik coding ini adalah penggunaan codebook Pada sinyal eksitasi yang berbeda, bergantung pada encoder dan decoder. Encoder akan mencari sinyal yang paling pas, kemudian mengirimkan kedecoder, dimana didalam decoder ini sinyal akan diproses. Ada 2 jenis codebook, yaitu : 1. Fixed codebook 2. Adaptive codebook
43
Pada fixed codebook, encoding dan decoding perangkat memiliki codebook yang sama persis. Sedangkan pada adaptive codebook, codebook diperbarui dengan setiap sub-frame sinyal wicara untuk memberikan pilihan baru kode vektor setiap kali. kode vactor dapat terdiri dari white noise atau pulsa deterministik. Untuk penyederhanaan dipilih codebook yang berisi sample white noise tetap. gaussian white noise membuat kode vektor, dengan panjang 60 sampel. Panjang vektor codebook adalah 256 sehingga membuatnya menjadi 256 x 60 matriks. satu kode vektor digunakan untuk mewakili setiap sub-frame sinyal wicara.
2.6.4. CELP decoder
Gambar 2.24. CELP decoder
Gambar 2.24 adalah gambar dari CELP decoder dimana excitation dihasilkan dari penambahan adaptive codebook dan stochastic (fixed) codebook. (Shrestha, R and Chitrakar, S. 2009).
44
2.6.5. Linear predictive coding (LPC) Linear Prediction coding adalah dasar dari banyak teknik speech coding termasuk CELP. Prinsip dasarnya adalah menentukan sinyal x[n] menggunakan
kombinasi
linear
dari
sample
sebelumnya
untuk
mendapatkan parameter-parameter sinyal suara berupa koefisien-koefisien LPC. dimulai dengan asumsi bahwa sinyal suara diproduksi oleh dengungan pada akhir sebuah pita suara. The glotis (ruang antara pita suara) menghasilkan dengungan, yang dicirikan oleh intensitas (kerasnya suara) dan frekuensi (pitch). Saluran vokal (tenggorokan dan mulut) bentuk pipa, yang dicirikan oleh resonansi, yang disebut forman. LPC menganalisis sinyal suara dengan memperkirakan forman, menghapus pengaruhnya dari sinyal suara, dan memperkirakan intensitas dan frekuensi dari dengungan tersisa. Proses menghapus forman disebut invers penyaringan, dan sinyal sisa disebut residu. LPC mensintesis sinyal suara dengan membalik proses menggunakan residu untuk menciptakan sumber sinyal, menggunakan forman untuk membuat penyaring, dan menjalankan sumber sinyal melalui filter, sehingga menghasilkan pengaruh pada suara. Karena sinyal suara yang bervariasi dengan waktu, proses ini dilakukan pada potongan pendek dari sinyal suara, yang disebut frame. Biasanya 3050 frame per detik memperlihatkan suara yang jelas dengan kompresi yang baik. Secara umum LPC di bagi menjadi tiga tahap yaitu pembingkaian sinyal suara, penjendelaan dan metode autokorelasi. (Shrestha, R and Chitrakar, S. 2009).