BAB 2 LANDASAN TEORI 2.1 Teori-Teori Umum 2.1.1 Pengertian Suara Suara adalah fenomena fisik yang dihasilkan oleh getaran benda atau getaran suatu benda yang berupa sinyal analog dengan amplitudo yang berubah secara kontinyu terhadap waktu, Suara berhubungan erat dengan rasa “mendengar”. Suara atau bunyi biasanya merambat melalui udara. Suara atau bunyi tidak bias merambat melalui ruang hampa. Benda Bergetar
Perbedaan Tekanan di Udara
Melewati Udara(Gelombang)
Pendengar
Gambar 2.1 Proses Terjadinya Suara Suara dihasilkan oleh getaran suatu benda. Selama bergetar, perbedaan tekanan terjadi di udara sekitarnya. Pola osilasi yang terjadi dinamakan sebagai “Gelombang”. Gelombang mempunyai pola sama yang berulang pada interval tertentu, yang disebut sebagai “Periode”. Contoh suara periodik : instrument musik, nyanyian burung, dll dan contoh suara nonperiodik : batuk, percikan ombak, dll. Suara berkaitan erat dengan : 1.
Frekuensi - Banyaknya getaran dalam 1 detik. - Satuan : Hertz (Hz) atau cycles per second (cps) - Panjang gelombang suara (wavelength) dirumuskan = c/f Dimana c = kecepatan rambat bunyi 7
8
Dimana f = frekuensi Panjang gelombang suara bias dihitung juga dengan rumus : λ= c/f.
Berdasarkan frekuensinya, suara dibagi menjadi 4, yaitu : 1.
Infrasound
= 0Hz – 20 Hz
2.
Pendengaran manusia = 20Hz – 20 KHz
3.
Ultrasound
= 20KHz – 1 GHz
4.
Hypersound
= 1GHz – 10 THz
Manusia membuat suara dengan frekuensi : 50Hz – 10KHz. Sinyal suara musik memiliki frekuensi : 20Hz – 20Khz. Maka Sistem multimedia menggunakan suara yang berada dalam range pendengaran manusia. Suara yang berada pada range pendengaran manusia sebagai “Audio” dan gelombangnya sebagai “Accoustic Sinyal”. Suara diluar range pendengaran manusia dapat dikatakan sebagai “Noise” (getaran yang tidak teratur dan tidak berurutan dalam berbagai frekuensi, tidak dapat didengar manusia). 1. Amplitudo - Keras lemahnya bunyi atau tinggi rendahnya gelombang. - Satuan amplitudo adalah decibel (db) - Bunyi mulai dapat merusak telinga jika tingkat volumenya lebih
9
- besar dari 85 dB dan pada ukuran 130 dB akan mampu membuat hancur gendang telinga
2. Velocity -
Kecepatan perambatan gelombang bunyi sampai ke telinga pendengar.
-
Satuan yang digunakan : m/s
-
Pada udara kering dengan suhu 20 °C (68 °F)m kecepatan rambat suara sekitar 343 m/s.
2.1.2 Representasi Suara Gelombang suara analog tidak dapat langsung direpresentasikan pada komputer. Komputer mengukur amplitudo pada satuan waktu tertentu untuk menghasilkan sejumlah angka. Tiap satuan pengukuran ini dinamakan “SAMPLE”. untuk itu kita harus melakukan conversion data analog untuk dijadikan data digital.
2.1.2.1 Analog to Digital Conversion (ADC) Adalah proses mengubah amplitudo gelombang bunyi ke dalam waktu interval tertentu (disebut juga sampling), sehingga menghasilkan representasi digital dari suara. Sampling rate : beberapa gelombang yang diambil dalam satu detik. Contoh : jika kualitas CD Audio dikatakan memiliki frekuensi sebesar 44100 Hz, berarti jumlah sample sebesar 44100 per detik.
10
Gambar 2.2 Proses Sampling
1. Membuang frekuensi tinggi dari source sinyal 2. Mengambil sample pada interval waktu tertentu (sampling) 3. Menyimpan amplitudo sample dan mengubahnya ke dalam bentuk diskrit (kuantisasi). 4. Merubah bentuk menjadi nilai biner.
2.1.2.2 Digital to Analog Converter (DAC) Digital to Analog Converter (DAC) Adalah proses mengubah digital audio menjadi sinyal analog. DAC biasanya hanya menerima sinyal digital Pulse Code Modulation (PCM). PCM adalah representasi digital dari sinyal analog, dimana gelombang disample secara beraturan berdasarkan interval waktu tertentu, yang kemudian akan diubah ke biner. Proses pengubahan ke biner disebut Quantisasi. PCM ditemukan oleh insinyur dari Inggris, bernama Alec Revees pada tahun 1937. Contoh DAC adalah: soundcard, CDPlayer, IPod, mp3player.
11
2.2 Teori - Teori Khusus 2.2.1 Analisis Fitur Pengekstrasi Sinyal digital. Penelitian yang dapat memproses sinyal digital merupakan suatu metode yang khusus. Sehingga sinyal digital diubah menjadi suatu data yang dapat dihitung dan memiliki nilai ukur.Di antara metode- metode itu seperti : 1. Fast Fourier Transform (FFT) 2. Linear Predictive Coding (LPC) 3. Wavelet Transform (WT) Dari ketiga metode yang ada, akan di analisis oleh peneliti sebagai kajian penelitian ini agar dapat memperbaiki penelitian sebelumnya. Dan diharapkan ada pun cara yang terbaik dari ketiga metode. 2.2.1.1 Fast Fourier Transform (FFT) FFT merupakan sebuah kelas khusus yang mengimplementasikan algoritma transform fourier dengan cukup dalam waktu komputasi. Dalam FFT biasanya yang lakukan setelah gelombang telah diperoleh dan digital, FFT ditransformasikan ke frekuensi domain. Hasil FFT bisa baik nyata dan imajiner, atau magnitudo dan fasa, fungsi frekuensi. Pemilihan format output milik pengguna. Karena menghasilkan FFT spektrum frekuensi untuk waktu domain gelombang, beberapa aplikasi yang cukup sederhana, misalnya, analisis harmonik, distorsi analisis, analisis getaran, dan modulasi pengukuran, mungkin menyarankan diri segera. Wilayah penting lainnya adalah bahwa dari estimasi respons frekuensi. Sebuah linier, sistem invarian-waktu dapat dirangsang
12
dengan fungsi impuls., kemudian dapat diperoleh dan cepat-Fourierditransformasikan ke frekuensi domain. FFT dari respon impuls, yang disebut sebagai fungsi respon frekuensi, sepenuhnya menjadi ciri sistem. Sekali sistem fungsi respons frekuensi dikenal, orang dapat memprediksi bagaimana sistem itu akan bereaksi terhadap setiap bentuk gelombang. Hal ini dilakukan dengan konvolusi. (Smith, 1997)
2.2.1.2 Linear Predictive Coding (LPC) Linear Predictive Coding (LPC) adalah suatu teknik untuk analisis pidato dan merupakan metode yang paling berguna untuk pengkodean dalam pidato pada bit rate yang rendah. Memberikan perkiraan yang sangat akurat pada parameter pidato, dan relatif efisien untuk komputasi. Oleh karena itu prinsip kerja LPC menganalisis ujaran dengan memperkirakan forman, menghilangkan efek mereka dari pidato sinyal, dan memperkirakan intensitas dan frekuensi buzz yang tersisa. Proses mengeluarkan forman disebut invers filtering, dan sinyal sisanya disebut residu. Angka-angka yang menjelaskan forman dan residu dapat disimpan atau dikirimkan ke tempat lain. Sintesis LPC tanda ujaran dengan membalik proses: menggunakan sisa untuk menciptakan sumber sinyal, gunakan forman untuk membuat penyaring (yang mewakili tabung), dan menjalankan source melalui filter, sehingga dalam berbicara. Karena sinyal pidato bervariasi dengan waktu, proses ini dilakukan pada potongan pendek tanda ujaran, yang
13
disebut frame. Biasanya 30-50 frame per detik memberikan pidato dipahami dengan kompresi yang baik.
2.2.1.3 Alih Ragam Gelombang Singkat (ARGS) ARGS mulai diperkenalkan pada tahun 1980-an oleh Morlet dan Grossman sebagai fungsi matematis untuk merepresentasikan data atau fungsi sebagai alternatif transformasi-transformasi matematika yang lahir
sebelumnya
gelombang
untuk
singkat
menangani
merupakan
masalah
gelombang
resolusi. yang
Sebuah energinya
terkonsentrasi pada suatu selang waktu untuk memberikan kemampuan analisis transien, ketidakstasioneran, atau fenomena berubah terhadap waktu (time varying). Karakteristik dari gelombang singkat antara lain adalah berosilasi singkat, translasi (pergeseran), dan dilatasi (skala). Bentuk Gelombang Sinus dan gelombang singkat Skala (dilatasi) dalam sebuah gelombang singkat berarti pelebaran atau penyempitan gelombang singkat. Hubungan antara skala gelombang singkat dengan frekuensi yang dihasilkan oleh analisis gelombang singkat adalah nilai skala kecil (compressed
wavelet)
menyebabkan
perubahan
koefisien
yang
menyatakan frekuensi tinggi. Nilai skala besar (stretched wavelet) menyebabkan perubahan koefisien yang menyatakan frekuensi rendah. Tahap pertama analisis gelombang singkat adalah menentukan tipe gelombang singkat atau mother wavelet yang akan digunakan. Hal ini perlu dilakukan karena fungsi gelombang singkat sangat bervariasi.
14
Beberapa contoh mother wavelet adalah Haar, Daubechies. Setelah pemilihan mother gelombang singkat, tahap selanjutnya adalah membentuk basis gelombang singkat yang akan digunakan untuk mentransformasikan sinyal. ARGS memiliki kemampuan untuk menganalisis suatu data dalam domain waktu dan domain frekuensi secara simultan. Analisis data pada alih ragam gelombang singkat dilakukan dengan mendekomposisikan suatu sinyal ke dalam komponen komponen frekuensi yang berbeda-beda dan selanjutnya masing-masing komponen frekuensi tersebut dapat dianalisis sesuai dengan skala resolusinya atau level dekomposisinya. Hal ini seperti proses filtering, dimana sinyal dalam domain waktu dilewatkan ke dalam High Pass Filter dan Low Pass Filter untuk memisahkan komponen frekuensi tinggi dan frekuensi rendah. ARGS adalah sebuah alih ragam matematika yang digunakan untuk menganalisis sinyal bergerak. Sinyal bergerak ini dianalisis untuk didapatkan informasi spectrum frekuensi dan waktunya secara bersamaan. ARGS menyediakan penggambaran frekuensi waktu dari sinyal. Pada awalnya, alih ragam gelombang singkat digunakan untuk menganalisis sinyal bergerak (non-stationary sinyals). Sinyal bergerak ini
dianalisis
dalam
alih
ragam
gelombang
singkat
dengan
menggunakan teknik multi-resolution analysis. Secara umum teknik multi-resolution analysis adalah teknik yang digunakan untuk menganalisis frekuensi dengan cara frekuensi yang berbeda dianalisis
15
menggunakan resolusi berbeda. Resolusi dari sinyal merupakan ukutan jumlah informasi di dalam sinyal yang dapat berubah melalui operasi filterisasi. ARGS merupakan alat yang biasa digunakan untuk menyajikan data atau fungsi atau operator ke dalam komponen-komponen frekuensi yang berlainan, dan kemudian mengkaji setiap komponen dengan suatu resolusi yang sesuai dengan skalanya. ARGS mempunyai kemampuan membawa keluar ciri-ciri (features) khusus dari citra yang diteliti. Secara umum ARGS kontinu untuk sinyal f(x) berdimensi 1-D, didefinisikan pada persamaan (1).
(1) Dengan (2)
Fungsi ψ disebut dengan induk gelombang singkat a, b Є R, a ≠ 0 (R = bilangan nyata). Dalam hal ini, a adalah parameter lebar dan b adalah parameter penggeseran posisi terhadap sumbu-x. Persamaan (1) dapat dibentuk ke dalam bentuk diskret dengan memberikan a dan b nilai diskret (a=2n, b Є Z). Pada penelitian ini digunakan induk gelombang singkat Haar. Pada gelombang singkat terdapat istilah dekomposisi.
Secara
umum,
dekomposisi
gelombang
singkat
didapatkan melalui filterisasi subbidang dengan dua filter, yaitu grader
16
filter dan detail filter. Pengembangan untuk kasus sinyal berdimensi 2D (sinyal citra 2-D) biasanya dilakukan dengan menerapkan bank filter secara terpisah terhadap sinyal citra. Biasanya digunakan sebuah pass filter - down (H) dan pass filter - up (G). Konvolusi citra dengan pass filter - down menghasilkan sinyal yang biasa disebut dengan citra pendekatan (approximation image) dan konvolusi dengan pass filter up pada arah spesifik menghasilkan citra detil (details images). Setelah berbagai teori yang menjelaskan tentang pengekstrasian data sinyal, kami memilih memakai metode gelombang singkat, hal ini disebabkan dari perbandingan- perbandingan yang menyatakan antara metode gelombang singkat terhadap metode fast fourier Transform. Diantara lain menyebutkan bahwa pada FFT hanya mempersentasikan sinyal untuk jangkauan sinus, FFT hanya mengembangkan sinyal hanya terjadi pada frekuensi domain tetapi tidak memberikan informasi pada waktu domain. Sedangkan pada metode gelombang singkat, gelombang singkat bekerja pada waktu yang berbeda namun juga mempunyai gelombang yang kecil. Selain itu jika pada pengektrasian sinyal tidak berlanjut pada FFT terdapat kekurangan dibandingkan dengan gelombang singkat diantaranya pada fungsi kernel yang merupakan window dengan panjang yang tak terbatas membuat syarat stasioner tidak terpenuhi dan tidak dapat memberikan informasi waktu &frekuensi secara bersamaan. Selain itu dalam mother gelombang singkatnya. Beberapa jenis alih ragam gelombang singkat diantaranya Alih Ragam Gelombang Singkat Diskrit (Discrete Wavelet Transform)
17
dan Alih Ragam Gelombang Singkat Kontinyu (Continuous Wavelet Transform).
2.2.1.3.1 Alih Ragam Gelombang Singkat Kontinyu (ARGSK) ARGSK adalah metoda dekomposisi waktu-frekuensi (time-frequency decomposition) yang dikenal juga dengan dekomposisi spectral yang ditujukan untuk mengkarakterisasi respon seismik pada frekuensi tertentu. Dekomposisi spectral adalah penampang seismik konvensional yang anda amati merupakan komposit dari rentang frekuensi gelombang (umumnya 10 s/d 70 Hz, dengan frekuensi dominant sekitar 30Hz). Perbedaan penampang pada frekuensi yang berbeda akan menampilkan fitur geologi yang berbeda pula, karena pada hakikatnya sifat geologi seperti ketebalan, kandungan fluida, dll. hanya akan lebih jelas dilihat pada level frekuensi yang sesuai. Metoda dekomposisi spectral digunakan untuk menampilkan penampang seismik pada level frekuensi tertentu, katakanlah pada frekuensi 10Hz, 20Hz, 30Hz, dll. Ide dasar dari metoda ini adalah dilakukannya FFT (Fast Fourier Transform) dari setiap window waktu secara menerus (continuous) sehingga diperoleh gambaran kisaran frekuensi pada zona target (reservoar). Gambar dibawah ini adalah contoh penerapan ARGSK pada salah satu trace seismik sintetik:
18
Gambar 2.3 Trace Seismik Sintetik Gambar atas sebelah kiri adalah trace seismik sintetik sedangkan gambar sebelah kanan adalah hasil ARGSK dengan menggunakan
persamaan
Perhatikan
bahwa
ARGSK
ditampilkan dalam kawasan waktu terhadap frekuensi. Waktu tersebut adalah waktu TWT (Two Way Travel Time) dari penampang seismik itu sendiri. Lalu dengan menganalisis gambar ARGSK, katakanlah target reservoar anda berapa pada kisaran 0.9 detik, maka anda akan mendapatkan gambaran frekuensi dominan dari target
19
anda, katakanlah 32Hz. Lalu dengan menggunakan persamaan (2),
penampang
ARGSK
diinversi
kembali
untuk
mendapatkan penampang seismik pada frekuensi 32Hz, yang harapannya dapat meng-emphasize target reservoar anda. Lihat subjek dekomposisi spectral pada blog ini yang menujukkan hasil dari aplikasi metoda ARGSK terhadap data real. (Polikar, Robi, 1999)
2.2.1.3.2 Alih Ragam Gelombang Singkat Diskrit (ARGSD) Dasar dari ARGSD dimulai pada tahun 1976 dimana teknik untuk mendekomposisi sinyal waktu diskrit ditemukan. Di dalam ARGSK, sinyal dianalisis menggunakan seperangkat fungsi dasar yang saling berhubungan dengan penskalaan dan transisi sederhana. Sedangkan dalam ARGSD, penggambaran sebuah skala waktu sinyal digital didapatkan dengan menggunakan teknik filterisasi digital. Secara garis besar proses dalam teknik ini adalah dengan melewatkan sinyal yang akan dianalisis pada filter dengan frekuensi dan skala yang berbeda. Filterisasi sendiri merupakan sebuah funsi yang digunakan dalam
pemprosesan
sinyal.
Gelombang
singkat
dapat
direalisasikan menggunakan iterasi filter dengan penskalaan. Resolusi dari sinyal, yang merupakan rata-rata dari jumlah detil informasi dalam sinyal, ditemukan melalui filterasi ini
20
dan
skalanya
didapatkan
dengan
upsampling
dan
downsampling (subsampling). (Mallat, 1999) Sebuah sinyal harus dilewatkan dalam dua filterisasi ARGSD yaitu highpass filter dan lowpass filter agar frekuensi dari sinyal tersebut dapat dianalisis. Analisis sinyal dilakukan terhadap hasil filterisasi highpass filter dan lowpass filter di mana highpass filter digunakan untuk menganalisis frekuensi tinggi dan lowpass filter digunakan untuk menganalisis frekuensi rendah. Analisis terhadap frekuensi dilakukan dengan cara menggunakan resolusi yang dihasilkan setelah sinyal melewati filterisasi. Analisis frekuensi yang berbeda dengan menggunakan resolusi yang berbeda inilah yang disebut dengan multi-resolution analysis, seperti yang telah disinggung pada bagian Transformasi Gelombang singkat. sinyal menjadi frekuensi tinggi dan frekuensi rendah dalam proses filterisasi highpass filter dan lowpass filter disebut sebagai dekomposisi. Proses dekomposisi dimulai dengan melewatkan sinyal asal me lewati highpass filter dan lowpass filter. Misalkan sinyal asal ini memiliki rentang frekuensi dari 0 sampai dengan π rad/s. Dalam melewati highpass filter dan lowpass filter ini, rentang frekuensi disubsample menjadi dua, sehingga rentang frekuensi tertinggi pada masing-masing subsample menjadi π/2 rad/s. Setelah filterisasi, setengah dari sample atau salah satu subsample
21
dapat dieliminasi berdasarkan aturan Nyquist. Sehingga sinyal dapat selalu di-subsample oleh 2 (↓2 ) dengan cara mengabaikan setiap sample yang kedua. Proses dekomposisi ini dapat melalui satu atau lebih tingkatan. Dekomposisi satu tingkat ditulis dengan ekspresi matematika pada persamaan 3 dan 4.
(3)
(4)
dan
adalah hasil dari highpass filter
dan lowpass filter, x[n] merupakan sinyal asal, h[n] adalah highpass filter, dan g[n] adalah lowpass filter. Untuk dekomposisi lebih dari satu tingkat, prosedur pada rumus 3 dan 4 dapat digunakan pada masing-masing tingkatan. Contoh penggambaran dekomposisi dipaparkan pada Gambar 2.1 dengan menggunakan dekomposisi tiga tingkat.
22
Gambar 2.4 Dekomposisi Gelombang Singkat Tiga Tingkat
Pada gambar 2.4,
dan
yang
merupakan hasil dari highpass filter dan lowpass filter, y disebut
sebagai
koefisien
ARTGSD
.
merupakan detil dari informasi sinyal, sedangkan merupakan
t
kisiran
kasar
dari
fungsi
pensakalaan. Dengan menggunakan koefisien ARGSD ini maka dapat dilakukan proses Inverse Discrete Wavelet Transform (IDWT) untuk merekonstruksi menjadi sinyal asal. ARGSD menganalisis sinyal pada frekuensi berbeda dengan resolusi yang berbeda melalui dekomposisi sinyal sehingga menjadi detil informasi dan taksiran kasar. ARGSD bekerja pada dua kumpulan fungsi yang disebut fungsi penskalaan dan fungsi gelombang singkat yang masingmasing berhubungan dengan lowpass filter dan highpass filter. Seperti yang telah dijelaskan sebelumnya dekomposisi ini didasarkan pada
23
aturan Nyquist yang salah satunya mengatakan bahwa frekuensi komponen sample harus kurang atau sama dengan setengah dari frekuensi sampling. Jadi diambil frekuensi sample π/2 dari frekuensi sampling π dalam subsample oleh 2 pada dekomposisi gelombang singkat. Sebagai penggambaran dekomposisi gelombang singkat dengan sinyal asal x[n] yang memilki frekuensi maksimum f = π dipaparkan pada Gambar 2.5.
Gambar 2.5 Dekomposisi Gelombang Singkat dengan Frekuensi Sinyal Asal f = 0
24
Proses rekonstruksi diawali dengan menggabungkan koefisien ARGSD dari yang berada pada akhir dekomposisi dengan sebelumnya meng-upsample oleh 2 (↑2) melalui highpass filter dan lowpass filter. Proses rekonstruksi ini sepenuhnya merupakan kebalikan dar i proses dekomposisi sesuai dengan tingkatan pada proses dekomposisi. Sehingga persamaan rekonstruksi pada masing-masing tingkatan dapat ditulis sbb :
Proses
rekonstruksi
gelombang
singkat
untuk
mendapatkan sinyal asal dengan tiga tingkatan digambarkan pada Gambar 2.6.
Gambar 2.6 Rekonstruksi Gelombang Singkat Tiga Tingkat
25
ARGSD mempunya kelebihan dalam hal ketelitian analisis transformasi terhadap isyarat Transformasi. Gambar dibawah ini merupakan perbandingan antara representation of a noisy chrip sinyal dari ARGSD dan ARGSK.
Gambar 2.7 Representation of a Noisy Chrip Sinyal Dari gambar tersebut dapat terlihat ARGSD (DWT) lebih baik dibandingkan dengan ARGSK (CWT) dalam proses pengekstrasian sinyal suara, maka kami memakai ARGSD untuk mengekstrasi sinyal suara pada aplikasi yang kami buat. Beberapa jenis ARGS diantanya Haar dan Daubechies dengan penjelasan di bawah ini.
26
2.2.1.3.3 Gelombang Singkat Haar Gelombang singkat Haar merupakan gelombang singkat yang simple dalam bentuk diskrit. gelombang singkat Haar biasanya berelasi dengan fungsi matematika yang disebut dengan alih ragam haar. Aloh ragam haar berguna sebagai prototype untuk semua alih ragam gelombang singkat lainnya. Seperti contohnya pada alih ragam gelombang singkat, alih ragam haar menguraikan sinyal diskrit menjadi dua subsinyal dari setengah dari panjang record. Salah satu subsinyal berproses pada rata-rata atau trend dan sinyal satunya lagi berproses pada perbedaan atau fluktuasi. Alih ragam gelombang singkat Haar memiliki keuntungan yaitu : 1. mempunyai konsep yang simple. 2. Prosesnya cepat 3. Memiliki memory yang efesien, dimulai dari perhitungan langusng tanpa adanya array sementara. 4. Dapat mengulang kembali proses yang dilakukan tanpa mempengaruhi efek terhadap problem lainnya. Alih
ragam
Haar
mempunyai
keterbatasan
yang
merupakan problem bagi beberapa aplikasi. Pada umunya setiap rata-rata untuk tingkat selanjutnya dan setiap set koefisien, Tampilan haar transform merupakan sepasang nilai dari rata-rata dan perbedaan. Kemudian pertukaran algoritma
27
melalui kedua nilai dan perhitungan. Selain itu rata-rata dan perbedaan adanya pada sepasang selanjutnya.Spectrum koefisien frekuensi yang tinggi seharusnya dialihkan ke perubahan frekuensi yang tinggi. Layar Haar hanya memiliki 2 elemen luas. Jika perubahan yang besar menempati dari nilai genap ke nilai ganjil, perubahan tidak akan dialihkan ke dalam koefisien frekuensi tinggi. Maka gelombang singkat haar
transform
tidak
berguna
dalam
kompresi
dan
pengilangan noise pada proses sinyal suara.
2.2.1.3.4 Gelombang Singkat Daubechies Daubechies gelombang singkat dinamakan dari Ingrid Daubechies seorang profesor dari departemen matematika dan penggunaan matematika di universitas Princeton. dia sangat ahli dengan pekerjaannya dengan gelombang singkat di dalam image compression. daubechies adalah keluarga dari gelombang singkat orthogonal didefinisikan dengan discrete gelombang singkat transform dan dikarakteristikan dengan vanishing moment jumlah maksimal dari beberapa pemberi dukungan. dengan tiap ripe gelombang singkat di setiap class, ada sebuah fungsi scaling (di sebut juga father gelombang
singkat)
multiresolution orthogonal.
yang
menghasilkan
analisis
28
Alih ragam gelombang singkat Daubechies didefinisikan hampir sama dengan Alih ragam gelombang singkat Haar dengan
mengkomputasi
rata-rata
yang
perbedaan menggunakan scalar product
berjalan
dan
dengan sinyal
scaling dan gelombang singkat satu-satunya perbedaan diantara mereka terdiri dari bagaimana sinyal scaling ini dan gelombang singkat didifinisikan. Tipe gelombang singkat ini memepunyai respon frekuensi yang seimbang tapi fase responnya non-linear. daubecies gelombang singkat digunakan bertumpuk dengan windows, jadi
tingginya
reflek
koifisien
spectrum
semuanya
mempunyai perubahan frekuensi yang tinggi. Gelombang singkat daubechies juga berguna untuk mengkompresi dan menghilangkan noise dalam proses sinyal audio. Umumnya daubechies gelombang singkat dipilih karena mempunyai nilai A terttiggi saat menghilang, untuk memberikan dukungan width N=2A, dan diantara 2A-1 solusi yang mungkin salah satunya di pilih yang filter scalingnya mempunyai fase extremal. Alih ragam gelombang singkat juga sangat mudah di tempatkan untuk di tranning menggunakan alih ragam gelombang singkat. Gelombang singkat
daubechies
digunakan
secara
luas
dalam
memecahkan berbagai masalah, contohnya fractal problem sinyal, sinyal diskontinuitas, dan lain-lain.
29
Db4
Db8
Db12
Scaling functions
gelomba ng singkat functios amplitud es of the frequenc y spectra of the above functios
Gambar 2.8 Contoh Gelombang Singkat Daubechies
Gelombang sinyal tersebut tidak menunjukkan respon frekuensi tinggi dan rendah pass filter, tapi menuncukkan
30
amplitudo dari Continuous Forier Transforms dari scaling (biru) dan fungsi gelombang singkat (merah). Daubechies orthogonal gelombang singkats D2-D20 paling banyak digunakan. nomer index mengacu pada nomer koefesien N. tiap gelombang singkat memiliki number of zero moments atau vanishing moments sama dari setengah masa maksilmal kemampuan gelombang singkat untuk mewakili sifat polynomial atau informasi dari sebuah sinyal. untuk contoh, D2, dengan satu momen, dengan mudah mengencode polynomials koefisien satu, atau constant sinyal components. D4 mengencode polynomial dengan dua koefisien, seperti konstan dan linear komponen sinyal; dan D6 mengencode 3-polynomial, seperti konstan, linier dan kuadrat komponen sinyal. kemampuan untuk mengencode sinyal ini tidak memperhitungkan fenomena kebocoran sinyal yang terjadi dan kurangnya pergeseran-konstanan, yang timbul dari pergeseran diskrit operasi (di bawah) selama transformasi aplikasi. Sub-urutan yang mewakili linear, kuadrat (misalnya) komponen sinyal diperlakukan berbeda oleh alih ragam tergantung pada apakah poin sejajar denganatau bahkan urutan lokasi yang ganjil. Kekurangan dari sifat penting dari pergeseran-konstanan, telah menyebabkan pembangunan
beberapa
versi
berbeda
dari
sebuah
pergeseran-invarian (diskrit) alih ragam gelombang singkat.
31
Tabel 2.1 Perbandingan Daubechies dan Haar Gelombang singkat
No of bits
BER
Daubechies
16384
0%
Haar
16384
46%
Transform
Kami
memilih
daubechius
gelombang
singkat
transform karena pada daubechius gelombang singkat secara lengkap didukung oleh gelombang singkat dengan fasa ekstremal dan memiliki jumlah vanishing moment paling tinggi untuk lebar yang ditentukan. Vanishing moment menunjukan kemampuan gelombang singkat dalam merepresentasikan sifat polinomial. Filter skala yang dihubungkan adalah filter fasa minimum Berdasarkan artikel Mohamed I. Mahmoud, Moawad I. M. Dessouky, Salah Deyab, and Fatma H. Elfouly tentang yang kami baca tentang FPGA technologi yang meneliti tentang ARGS yang paling efektif dalam
menganalisa
sinyal dengan berbagai aplikasi di dapatkan bahwa nilai Bit Error Ratio (BER) dari daubechies lebih kecil dari Haar gelombang singkat. Sehingga dapat dilihat bahwa
32
pemakayan daubechies lebih efektif daripada Haar dalam menganalisa sinyal.
2.2.1.4 Metode Pencarian Linear Metode paling sederhana dalam mengimplementasikan sebuah direktori adalah dengan menggunakan linear list dari nama berkas dengan penunjuk ke blok data. Linear list dari direktori memerlukan pencarian searah untuk mencari suatu direktori didalamnya. Metode sederhana untuk di program tetapi memakan waktu lama ketika dieksekusi. Untuk membuat berkas baru kita harus mencari di dalam direktori untuk meyakinkan bahwa tidak ada berkas yang bernama sama. Lalu kita tambahkan sebuah berkas baru pada akhir direktori. Untuk menghapus sebuah berkas, kita mencari berkas tersebut dalam direktori, lalu melepaskan tempat yang dialokasikan untuknya. Untuk menggunakan kembali suatu berkas dalam direktori kita dapat melakukan beberapa hal. Kita dapat menandai berkas tersebut sebagai tidak terpakai (dengan menamainya secara khusus, seperti nama yang kosong, atau bit terpakai atau tidak yang ditambahkan pada berkas), atau kita dapat menambahkannya pada daftar direktori bebas. Alternatif lainnya kita dapat menyalin ke tempat yang dikosongkan pada direktori. Kita juga bisa menggunakan linked list untuk mengurangi waktu untuk menghapus berkas. Kelemahan dari linear list ini adalah percarian searah untuk mencari sebuah berkas. Direktori yang berisi informasi sering digunakan, implementasi yang lambat pada cara aksesnya akan
33
menjadi perhatian pengguna. Faktanya, banyak sistem operasi mengimplementasikan 'software cache' untuk menyimpan informasi yang paling sering digunakan. Penggunaan 'cache' menghindari pembacaan informasi berulang-ulang pada disk. Daftar yang telah diurutkan memperbolehkan pencarian biner dan mengurangi waktu rata-rata pencarian. Bagaimana pun juga penjagaan agar daftar tetap terurut dapat merumitkan operasi pembuatan dan penghapusan berkas, karena
kita
perlu
memindahkan
sejumlah
direktori
untuk
mengurutkannya. Tree yang lebih lengkap dapat membantu seperti Btree. Keuntungan dari daftar yang terurut adalah kita dapatkan daftar direktori yang terurut tanpa pengurutan yang terpisah.
2.2.1.5 Euclidean Distance Dalam matematika, jarak Euclidean atau Euclidean metrik adalah jarak antara dua yang diukur dengan penggaris, dan diberikan oleh rumus Pythagoras. Dengan menggunakan formula ini sebagai jarak, ruang Euclides menjadi ruang metrik. Norma yang terkait disebut norma Euklidean. Sastra lebih tua mengacu pada metrik sebagai metrik Pythagoras. Euclidean distance antara titik p dan q adalah panjang segmen garis Dalam koordinat Cartesian, jika p = (p1, p2 ,..., pn) dan q = (Q1, q2 ,..., qn) adalah dua titik dalam ruang-n Euclides, maka jarak dari p untuk q adalah diberikan oleh :
34
Aturan Euclidean Distance untuk mengukur jarak titik ke ruang Euclides asal:
2.2.2 Analisis Fitur Vektor 2.2.2.1 Zero Crossing Rate Zero - crossing rate adalah parameter penting dalam klasifikasi suara pembicara dan suara yang tidak terucap. hal ini juga sering digunakan sebagain front-end processing di dalam sistem pengenalan suara otomatis. nilai zero - crossing adalah indikator dari frekuensi dimana energi sinyal terkonsentrasi di dalam spektrum. suara pembicara dihasilkan karena eksistasi dari vokal periodik yang terbawa oleh udara di celah suara dan biasanya menunjukan nilai zero - crossing yang rendah. sedangkan suara yang tak terucap dihasilkan karena penyempitan saluran vokal yang cukup untuk menyebabkan terjadinya aliran udara turbulen yang akhirnya menghasilkan noise dan menunjukan nilai zero - crossing yang tinggi.
35
Gambar 2.9 Definisi Zero - Crossing Rate
Definisi untuk zero – crossings rate adalah
Dimana
Dan
Model untuk produksi suara menyarankan bahwa kisaran energi suara harus terkonsentrasi di bawah 3kHz karena jatuhnya spektrum diperkenalkan oleh gelombang glottal, sedangkan suara yang tak terucap, sebagian besar energinya ditemukan pada frekuensi yang lebih
36
tinggi. karena frekuensi tinggi maka zero-crossing rates tinggi, dan frekuensi rendah menyiratkan zero-crossing rates rendah, ada kolerasi kuat antara zero-crossing rate dan distribusi energi dengan frekuensi. sebuah generalisasi yang masuk akal adalah jika tingkat zero-crossing rate tinggi, sinyal suara adalah suara yang tidak diucapkan, sedangkan jika zero-crossing rate rendah, sinyal suara adalah suara yang diucapkan. Zero - crossing rate adalah manipulasi sederhana dari besarnya sinyaldapat
menyediakan
sejumlah
properti
berguna.
beberapa
pengukuran ini secara tradisional termasuk energi, rata-rata ukurannya, zero crossings, dan fungsi otokorelasi. Properti ini dapat digunakan untuk analisa yang lebih kompleks, seperti estimasi lapangan. Dalam konteks sinyal diskrit, zero crossing dikatakan terjadi jika sampel mempunyai tanda aljabar yang berbeda. Ini berarti bahwa ada hubungan antara zero - crossing dan konten frekuensi sinyal. Koefisien gelombang singkat sinyal audio dalam setiap subband mengambil suatu bentuk osilasi gelombang. Zero crossing di dalam tranformasi domain menggambarkan seberapa sering frekuensi sinyal telah berubah dalam periode waktu tertentu di dalam sebuah subband. Normalisasi zero – crossing rate didefinisikan sebagai berikut :
37
2.2.2.2 Mean Karakteristik frekuensi waktu dari audio yang sesuai untuk amplitudo dari koefisien gelombang singkat. dua notes dari frekuensi dan besarnya suara yang sama dapat menghasilkan suara yang berbeda. besarnya rata - rata dari suatu urutan dari koefisien adalah semacam ukuran sinyal. fitur yang kami gunakan ini adalah nilai rata - rata dari koefisien X(i), yang didefinisikan sebagai:
Dimana N adalah nilai dari koefisien di dalam sebuah subband.
2.2.2.3 Variances Koefisien gelombang singkat audio dapat dilihat sebagai distribusi dalam teori probabilitas. Kita tahu bahwa distribusi probabilitas secara unik dicirikan oleh momen. Audio adalah sinyal dengan rata - rata hampir nol, jadi kami memilih momen sentral kedua, seperti varians sebagai salah satu fitur kami. Jika kita mengasumsikan bahwa distribusi gelombang singkal dimodelkan sebagai fungsi kepadatan Laplace, distribusinya juga dapat secara langsung terhubung dengan deviasi standart. Fitur yang kami gunakan adalah