BAB 2 LANDASAN TEORI
2.1 Gelombang Bunyi Menurut Anwar, et al (2014), gelombang bunyi atau lebih khusus dikenal sebagai gelombang akustik adalah gelombang longitudinal yang berada dalam sebuah medium, biasanya udara. Gelombang suara berasal dari benda yang bergetar. Bentuk gelombang suara periodik akan menimbulkan sensasi yang menyenangkan (jika intensitas nya tepat) seperti bunyi musik. Sebaliknya, bunyi yang tidak periodik akan menimbulkan suara derau (noise).
2.2 Nada Sebuah nada adalah suatu bunyi yang memiliki nilai tertentu, yaitu pitch, yang diukur untuk menggambarkan jenis nada tersebut. Serangkaian nada yang tersusun teratur berdasarkan ketukan dan pola disebut musik (Afriani, 2012). Dalam teori musik, setiap nada memiliki nilai tertentu menurut frekuensinya ataupun jarak relatif nada tersebut terhadap nada patokan. Nada dapat diatur dalam tangga nada yang berdedabeda. Nada dasar menentukan frekuensi tiap-tiap nada pada suatu karya musik (Wilson, 2008). Nada merupakan jenis suprasegmental yang ditandai oleh tinggi-rendahnya arus ujaran yang terjadi karena frekuensi getaran yang berbeda antar segmen. Misalnya pada saat seseorang berada dalam kesedihan maka ia akan berbicara dengan nada yang rendah. Sebaliknya bila ia berada dalam keadaan marah atau gembira, ia berbicara dengan nada yang tinggi.
Universitas Sumatera Utara
6
2.3 Tangga Nada
Tangga nada merupakan kumpulan nada-nada yang harmonis. Kumpulan dari semua nada pada musik disebut tangga nada kromatik. Tangga nada kromatik dapat diartikan sebagai “nada setiap warna”. Istilah “tangga nada kromatik” dipakai untuk kedua belas nada dari tiap oktaf (Sijabat, 2009).
2.4 Alat Musik Gitar
Menurut Anwar (2014), masuknya alat musik gitar ke Indonesia salah satunya adalah dibawa oleh tawanan asal portugis sekitar abad ke-7. Secara umum gitar dibagi menjadi 2 jenis, gitar akustik dan gitar listrik (electric guitar). Gitar akustik merupakan gitar yang terbuat dari kayu, dan terdapat lubang suara atau tabung resonansi (sound hole). Bagian-bagian pada gitar akustik ditunjukkan pada gambar 2.1 berikut.
Gambar 2.1 Bagian-bagian gitar akustik (Anwar, 2014)
Universitas Sumatera Utara
7
Senar gitar yang dipetik akan menghasilkan bunyi yang memiliki frekuensi dan setelan nada yang berbeda tergantung kepada penggunaan dan keinginan dari pengguna gitar tersebut. Frekuensi suara senar gitar yang umum digunakan dapat dilihat pada tabel 2.1.
Tabel 2.1 Frekuensi Nada Gitar (Lourde R. & Saji, 2009) Nada senar gitar
Nomor Kunci
Frekuensi
E (senar 6)
E2
82.4
A (senar 5)
A2
110.0
G (senar 4)
D3
146.8
D (senar 3)
G3
196.0
B (senar 2)
B3
246.9
E (senar 1)
E4
329.6
2.5 Sejarah Pengenalan Suara
Sudah hampir lima dekade dilakukan penelitian di bidang pengenalan suara (speech recognition). Menurut Maulana (2013), riset untuk mengembangkan system speech recognition oleh mesin ini dibuat mulai tahun 1950-an yaitu pada saat peneliti mencoba mengeksploitasi ide dari acoustic-phonetics. Tahun 1952, Biddulph dan Balashek membuat sebuah sistem yang dapat mengenali suatu digit terisolasi dari seorang pembicara yang sangat bergantung pada resonansi spektral vokal dari setiap digit. Kemudian Olson dan Belar berusaha membuat sebuah sistem untuk mengenali 10 suku kata berbeda dari seorang pembicara yang juga sangat bergantung pada spektral dan area vokal pada tahun 1956. Selanjutnya Fry dan Denes, pada tahun 1959 membuat sebuah sistem pengenalan fonem untuk mengenali 4 vokal dan 10 konsonan dengan menggunakan analisis spektruk dan pencocok pola. Pada tahun yang sama, Forgie juga melakukan penelitian pengenalan vokal dimana 10 vokal disisipkan dalam format a/b/-vokal-/t. Pada tahun 1962 Sakae dan Doshita membuat hardware pengenalan fonem. Usaha selanjutnya dilakukan oleh Nagata dan rekan kerjanya di laboratorium NEC
Universitas Sumatera Utara
8
yang menjadi awal bagi sebuah program penelitian produktif. Usaha itu dilakukan oleh nagata pada tahun 1963. Pada era 1960-an, usaha yang dilakukan Martin dan rekannya pada laboraturium RCA adalah untuk membangun sistem dengan kemampuan dasarnya untuk mendeteksi awal dan akhir suatu speech. Pada tahun yang bersamaan, Vintsyuk mengajukan metode dynamic programming untuk menyamakan waktu dari pegutaran speech. Sejumlah batu pijakan yang signifikan diraih pada tahun 1970-an mengenai penelitian speech recognition. Penelitian Jepang menunjuk kearah bagaimana penerapan metode dynamic programming dapat diterapkan dan penelitian yang dilakukan Itakura tentang Linear Predictive Coding (LPC) dengan sukses pada pencobaan speech ber-bit rendah.
2.6 Pengenalan Suara
Pengenalan suara merupakan serangkaian proses untuk mengenali sinyal suara dengan membandingkan pola karakteristik sinyal suara acuan dengan pola karakteristik sinyal suara uji secara otomatis (Saaddatuddaroin, 2009). Suara dikenali melalui ciri-cirinya. Ciri-ciri tersebut digunakan untuk membedakan antara suara yang satu dengan suara yang lainnya. Pengenalan suara dapat diklasifikasikan dalam identifikasi dan verifikasi. Identifikasi suara adalah proses pengenalan suara berdasarkan sampel suara, sedangkan verifikasi suara adalah proses penerimaan atau penolakan terhadap suara yang diberikan (Setiawan & Handayani 2012).
2.7 Pengolahan Sinyal Digital
Pengolahan sinyal digital adalah pemrosesan sinyal yang berkaitan dengan perubahan bentuk, menipulasi isi dan penyajian dari sinyal suara dan informasi dalam bentuk digital (Huda, 2011). Tujuan dari pengolahan sinyal digital adalah untuk mendapatkan ekstraksi ciri dari sinyal suara. Sebuah proses untuk mengubah sinyal suara menjadi parameter-parameter yang selanjutnya dapat dilakukan proses selanjutnya, misalnya identifikasi pola suara. Proses yang terjadi pada pengolahan sinyal digital pada
Universitas Sumatera Utara
9
penelitian ini adalah proses sampling dan Fast Fourier Transform (FFT). Contoh input suara dapat dilihat pada gambar 2.2 berikut.
Gambar 2.2 Input Suara
2.7.1
Sampling
Proses sampling adalah proses untuk mengubah sinyal pada waktu-kontinu menjadi bentuk diskrit yang diperoleh dengan mengambil cuplikan sinyal pada waktu-kontinu (Huda, 2011).
2.7.2
Fast Fourier Transform (FFT)
Fast Fourier Transform merupakan DFT dengan algoritma yang lebih optimal, sehingga menghasilkan perhitungan yang lebih cepat. Dengan DFT, memerlukan waktu O(n2) untuk mengolah sampel data sebanyak n buah. Hal ini tentunya akan memakan waktu lama bila sampel data makin banyak (Stefanus, Hamz, M. & Angzas, Y., 2005). Proses pada metode fast Fourier Transform (FFT) adalah mengkonversi setiap frame N sampel dari domain waktu menjadi domain frekuensi. Menurut Hanggarsari,et al(2012), transformasi fourier merupakan metode yang efisien untuk transformasi fourier diskrit yang banyak digunakan pada pemrosesan sinyal digital.
Universitas Sumatera Utara
10
Contoh sinyal dalam domain waktu pada gambar 2.3 dan contoh sinyal dalam domain frekuensi pada gambar 2.4 berikut (Huda, 2011).
Gambar 2.3 Sinyal dalam domain waktu
Gambar 2.4 Sinyal dalam domain frekuensi
Metode FFT dapat dilakukan dalam domain waktu dan frekuensi, yang disebut sebagai desimasi – dalam – waktu (decimation-in-time) dan desimasi-dalam-frekuensi (decimation-in-frequency) (Gunawan, D., Juwono, F.H., 2012). Pada prinsipnya algoritma ini adalah memecah N-titik menjadi dua (N/2) – titik, kemudian dipecah lagi pada tiap (N/2) – titik menjadi dua (N/4) – titik, begitu seterusnya sampai hanya terdapat 1 titik. Prinsip tersebut dapat kita lihat lebih jelas pada gambar 2.2 berikut.
Universitas Sumatera Utara
11
Gambar 2.5 Desimasi untuk 16 titik
Konsep metode Fast Fourier Transfrom (FFT) secara keseluruhan dapat dilihat pada gambar 2.6.
Gambar 2.6 Konsep FFT Algoritma DFT melakukan perkalian kompleks sebanyak N. Dengan menggunakan FFT maka terdapat log2(N) perkalian kompleks. Sehingga jumlah perkalian kompleks berkurang dari N2 menjadi log2(N). Dikarenakan DFT merupakan bagian dari FFT, maka lebih baik menghitung FFT dengan mempertimbangkan nilai N DFT terlebih dahulu (Yang, 2012).
Universitas Sumatera Utara
12
k = 0, 1, 2…N-1
X(k) = ∑
(1)
Pisahkan x(n) menjadi dua bagian : x(ganjil) dan x(genap) = x(2m), dimana m=0, 1,2,…,N/2-1. Lalu nilai N DFT juga dibagi dua bagian untuk tiap nilai N/2 : =∑
X(k)
= ∑
=∑
+∑
∑
+
(2)
Dimana m = 0, 1, 2,…., N/2-1 Karena : = cos(
) + j sin(
= cos[
)
(3)
] + j. sin[
= -cos( = -[cos(
) – j.sin( ) + j.sin(
) )]
=-
(4)
=-
(5)
Maka :
Jadi ketika faktor diubah dengan setengah periode, nilai dari faktor tersebut tidak akan berubah, tetapi tanda nilai faktor tersebut akan menjadi sebaliknya. Hal ini merupakan sifat simetri dari faktor. Karena faktor bisa juga ditulis sebagai
=
, maka : (
)
=-
(6)
Dan (
2
=-
=
(7)
Universitas Sumatera Utara
13
Maka nilai N DFT akhirnya menjadi : X(k) = ∑
∑
(8)
k = 0,1….N/2 X(k + N/2) =
-
(9)
k = 0, 1, 2…..N/2 Jadi nilai N DFT dipisah menjadi dua nilai N/2 DFT. Dari persamaan (8), (k) memiliki (N/2) * (N/2) = (N/2)2.
memiliki N/2 + (N/2)2.
Maka jumlah total dari perhitungan untuk X(k) adalah 2(N/2) 2 + N/2=N2/2+N/2. Untuk nilai awal N DFT, dimulai dari N2. Maka pada langkah pertama, pisahkan x(n) menjadi dua bagian yang membuat perhitungan dari N2 menjadi N2/2+N/2. Jumlah angka perkalian dikurangi setengah secara berkala. Selanjutnya adalah proses pengurangan perkalian dari nilai N menjadi N/2. Lanjutkan pemisahan
(m) dan
(m) menjadi bagian ganjil dan genap dengan cara
yang sama, perhitungan untuk N/2 akan dikurangi menjadi N/4. Kemudian perhitungan DFT akan berkurang secara terus – menerus. Jadi jika sinyal untuk nilai N DFT terpisah terus – menerus sampai sinyal akhir menjadi satu titik. Misalkan ada N=2v DFT yang perlu dihitung. Maka jumlah pemisahan yang dapat dilakukan adalah v =
(N). Jumlah total perkalian akan dikurangi hingga (N/2)
tambahan perhitungan, angka yang akan dikurangi mencapai N
(N). Untuk (N). Karena
perkalian dan penambahan dikurangi, maka kecepatan perhitungan komputasi DFT dapat ditingkatkan. Tujuan utama untuk Radix -2 FFT adalah memisahkan deretan data menjadi ganjil dan genap secara terus – menerus sampai mendekati setengah perhitungan.
Universitas Sumatera Utara
14
2.8 Penelitian terdahulu Pada bagan ini akan dipaparkan tentang penelitian-penelitian sebelumnya yang berhubungan dengan pengenalan nada pada senar gitar. Pemaparan tentang penelitian sebelumnya dapat dilihat pada tabel 2.2 berikut.
Tabel 2.2 Penelitian terdahulu Penulis
Teknik yang
Keterangan
digunakan Afriani, S.S., 2012.
Jaringan Saraf Tiruan
Metode
Learning
Quantization dapat digunakan
Vector
Quantization.
Learning
Vector
untuk mengenali nada pada senar biola, dengan pengenalan nada G mencapai
100%,
nada
E
mencapai
93,33%,
nada
D
mencapai 40% dan nada A mencapai 60%. Anwar, K. Et al, 2014
Fast
Fourier Akord merupakan prinsip utama
Transform (FFT).
dalam memainkan alat musik gitar. penulis melakukan analisis fenomena
dari
menggunakan
akord
Dmayor
metode
Fast
Fourier Transform (FFT). Basuki, A., et al, 2006 Fast Tranform
Fourier Sinyal
suara
analog dicuplik
(FFT), dengan kecepatan 12000 Hz. Fast
Jaringan Saraf Tiruan Fourier
Transform(FFT)
(JST) Propagasi balik digunakan untuk mendapatkan (back Propagation).
fitur
sinyal
ditransformasikan domain fitur
frekuensi.
suara
tersebut
yang kedalam Kemudian diproses
dengan menggunakan jaringan saraf tiruan(JST).
Universitas Sumatera Utara
15
Tabel 2.2 Penelitian terdahulu (Lanjutan) Penulis
Teknik yang
Keterangan
digunakan Ardiansyah, M., 2014
Mel
Frequency Metode MFCC digunakan untuk
Cepstral
Coefficient mengambil nilai vektor pada
(MFCC) Learning
dan sebuah
lagu.
Metode
LVQ
Vector digunakan untuk mencocokkan
Quantization (LVQ).
data uji dengan data acuan yang telah disimpan di dalam database.
Dianputra, R., 2014
Fast
Fourier Algoritma FFT digunakan untuk
Transform (FFT)
menghitung
nilai
Discreate
Fourier Transform (DCT) untuk transformasi dari domain waktu ke
domain
frekuensi.
Data
masukan adalah suara senar gitar yang dipetik secara open string.
Universitas Sumatera Utara