Seminar Nasional Teknologi Informasi dan Komunikasi 2013 (SENTIKA 2013) Yogyakarta, 9 Maret 2013
ISSN: 2089-9815
PENGENALAN NADA PADA SENAR BIOLA DENGAN METODE JARINGAN SARAF TIRUAN LEARNING VECTOR QUANTIZATION Suci Shaumy Afriany, Esti Suryani, Wiharto Program Studi Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami 36A Kentingan Surakarta 57126 Telp. (0271) 646994 Fax. (0271) 646655 Email:
[email protected],
[email protected],
[email protected] ABSTRACT The violin is a string instrument with four strings which tuned on G, D, A, and E. A violinist is charged to remembering the sound produced by the strings when tuning the violin due to the pitch of musical instrument standard. This research is explain about the using of Learning Vector Quantization Method which is one of the artificial neural network method, to recognizing the tones (G, D, A, and E) of the open strings (the strings which are not pressed by fingers) from the violin by utilizing Linier Predictive Coding, one of the digital signal processing technique, to extract the violin sound signal which is resulting cepstral coefficients that representing the feature of each tones which will be used as an input of the neural network. The artificial neural network trained using 60 data tape consisting of 15 data of tone G, 15 data of tone D, 15 data of tone A, and 15 data of tone E, resulting in changes in the weights that are used to test the network to recognize the tone. The test network is divided into the memorization and the generalization. In the memorization test, the best recognition to the learning rate 0.00025 with the percentage of recognition up to 100%. While the generalization test using 60 test data consisting of 15 data of tone G, 15 data of tone D, 15 data of tone A, and 15 data of tone E , the result achieved 88.33% of recognition. Keywords: artificial neural network, cepstral coefficients, Learning Vector Quantization (LVQ), Linier Predictive Coding (LPC), tone, violin. ABSTRAK Biola merupakan salah satu alat musik dawai yang memiliki empat buah senar yaitu senar G, D, A, dan E. Seorang pemain biola dituntut untuk mampu mengingat bunyi yang dihasilkan keempat senar tersebut untuk menyetelnya sesuai frekuensi standar alat musik. Penelitian ini membahas tentang penggunaan salah satu metode jaringan saraf tiruan yakni Learning Vector Quantization (LVQ) untuk mengenali keempat nada (G, D, A, dan E) pada senar terbuka (yang tidak ditekan oleh jari) dari alat musik biola dengan memanfaatkan teknik pengolahan sinyal digital Linier Predictive Coding (LPC) untuk mengekstraksi sinyal suara biola sehingga menghasilkan koefisien cepstral yang merepresentasikan ciri dari masing-masing nada yang digunakan sebagai masukan jaringan saraf tiruan. Jaringan saraf tiruan dilatih menggunakan 60 data rekaman yang terdiri dari 15 data nada G, 15 data nada D, 15 data nada A, dan 15 data nada E, sehingga menghasilkan perubahan bobot yang digunakan untuk menguji jaringan dalam mengenali nada. Pengujian jaringan terbagi menjadi dua yaitu memorisasi dan generalisasi. Pada pengujian memorisasi, hasil pengenalan terbaik pada learning rate 0.00025 dengan presentase pengenalan mencapai 100%. Sedangkan pada pengujian generalisasi menggunakan 60 data uij yang terdiri dari 15 data nada G, 15 data nada D, 15 data nada A, dan 15 data nada E, hasil pengenalan mencapai 88.33%. Kata Kunci: Biola, jaringan saraf tiruan, koefisien cepstral, Learning Vector Quantization (LVQ), Linier Predictive Coding (LPC), nada. jarak antara nada pada senar yang satu ke nada pada senar lainnya berjarak lima nada. 0. Bagi seorang pemula, untuk belajar memainkan alat musik biola terkadang menghadapi kendala. Terutama apabila tidak mengetahui dasar musik. Kendala bagi seorang pebiola adalah mengingat nada ketika melakukan setem, yaitu mencocokkan nada pada masing-masing string yang tidak ditekan oleh jari (open string) sehingga dapat menghasilkan bunyi dengan frekuensi sesuai standar yang sudah ditetapkan secara internasional. 0
1. PENDAHULUAN Sebuah nada adalah suatu bunyi yang memiliki nilai tertentu, yaitu pitch (frekuensi), yang dapat diukur secara ilmiah untuk menggambarkan jenis nada tersebut. Nada dapat dihasilkan dari suara manusia dan alat musik. Suara manusia dan alat musik yang beragam menyebabkan jangkauan nada yang berbeda, tergantung dari jenis suara dan alat musik yang digunakan. 0 Biola (violin) merupakan salah satu jenis alat musik string (dawai atau senar). Biola memiliki empat senar yaitu G, D, A, dan E yang disetel berbeda satu sama lain dengan interval sempurna kelima yaitu
2. TINJAUAN PUSTAKA 64
Seminar Nasional Teknologi Informasi dan Komunikasi 2013 (SENTIKA 2013) Yogyakarta, 9 Maret 2013
ISSN: 2089-9815
terbuka yang dihasilkan oleh biola (violin).
Beberapa penelitian mengenai musik terutama mengenai pengenalan bunyi yang dihasilkan oleh alat musik telah banyak dilakukan, salah satunya adalah penelitian yang dilakukan oleh Eronen, et al., (72) mengenai pengenalan secara otomatis jenis alat musik menggunakan model Gaussian. Sebelum diklasifikasikan, terlebih dahulu dilakukan pengekstraksian suara alat musik menggunakan algoritma ekstraksi fitur (ciri) spektral dan temporal dari pitch tunggal suara alat musik, dimana ciri spektral berupa koefisien cepstral dan digunakan dalam pengklasifikasian jenis alat musik. Pengujian sistem menggunakan 1498 sampel data jangkauan pitch penuh dari 30 jenis alat musik orkestra yakni alat musik string, tiup, dan pukul yang dimainkan dengan teknik yang berbeda-beda. Hasil yang diperoleh adalah persentase keberhasilan pengenalan terhadap jenis alat musik mencapai 94% dan persentase pengenalan terhadap alat musik tunggal mencapai 80%. Penelitian lain dilakukan oleh Susanto 0 mengenai pengenalan jenis alat musik berdasarkan hasil rekaman beberapa alat musik yang dimainkan. Kemudian dilakukan pembacaan pada hasil rekaman untuk diperoleh bentuk diskrit dari sinyal alat musik untuk mempermudah dalam pengolahan sinyal pada hasil rekaman tersebut dengan pengekstrasian komponen cepstral untuk dijadikan sebagai masukan pada proses pelatihan jaringan saraf tiruan dengan algoritma Learning Vector Quantization (LVQ). Pengujian data rekaman dan data baru dilakukan setelah didapat perubahan bobot pada jaringan. Hasil yang diperoleh yaitu persentase pengenalan sebesar 88.33% terhadap data latih dengan kombinasi titik uji 2048, frame 20ms, orde LPC 14, orde cepstral 19, epoh 500. Persentase pengenalan terhadap data uji sebesar 88.33% terhadap data latih dengan kombinasi titik uji 2048, frame 20ms, orde LPC 14, orde cepstral 19, epoh 1000. Rata-rata persentase pengenalan terhadap data tunggal yang diambil secara realtime sebesar 52.23%. Penelitian lainnya dilakukan Fachrudin 0, yaitu mengenai pengenalan pengucap tak bergantung teks yang bertujuan untuk dapat mendengar dan mengenali pengucap yang sedang berbicara. Metode yang digunakan Fachrudin untuk mengekstraksi sinyal suara yaitu Linier Predictive Coding (LPC), sedangkan untuk pencocokan ciri digunakan metode Vector Quantization (VQ). Hasil yang diperoleh yaitu rata-rata persentase pengenalan untuk data rekaman dengan kombinasi orde LPC 12, panjang frame 20ms, ukuran codebook 16 dan 32 yaitu sebesar 68.5%. Rata-rata persentase pengenalan untuk pengujian realtime dengan kombinasi orde LPC 8, panjang frame 10ms, ukuran codebook 64 mencapai 58%. Mengacu pada ketiga penelitian tersebut, penelitian yang dilakukan oleh penulis yaitu pengenalan nada yang difokuskan pada senar
3. METODOLOGI PENELITIAN 3.1 Algoritma 3.1.1 Linier Predictive Coding (LPC) Linier Predictive Coding (LPC) adalah metode digital untuk men-encoding sebuah sinyal analog dimana sebuah nilai tertentu diprediksi oleh sebuah fungsi linier nilai sebelumnya dari sinyal tersebut 0. Ada dua alasan utama penggunaan metode LPC 0 , yaitu : 1. LPC dapat digunakan untuk memprediksi trayek dari sebuah sinyal. Dalam domain frekuensi, prediksi trayek ekuivalen dengan pemodelan spektrum sinyal. 2. LPC mampu menghilangkan bagian yang dapat terprediksi dalam upaya untuk menghindari bagian redundansi pada saat retransmitting yang dapat diprediksi oleh receiver dan sekaligus dapat menghemat penyimpanan, bandwidth, waktu, dan tenaga. Langkah-langkah dari pengolahan sinyal dengan LPC untuk memperoleh koefisien cepstral 0 yaitu : 1. Preemphasis (penekanan sinyal) (1) 1 adalah vocal tract model (pemodelan korelasi dan daya amplifikasi), adalah koefisien prediktor, adalah variabel integer yang melambangkan transformasi pada ruang . 2. Blocking into frame (pemblokan menjadi beberapa frame) Tahapan ini mengelompokkan sinyal hasil preemphasis ke dalam bingkai-bingkai dengan ukuran masing-masing bingkai sebesar data. Bingkai ini berurutan dengan pemisahan antara kedua bingkai sebesar data. = ⅓ dimana melambangkan jumlah sampel dari blok sinyal. 3. Frame windowing Setiap frame dikalikan dengan jendela sampel ( ) dengan menggunakan fungsi jendela Hamming untuk sampel ke-n 0 : 2 0.54
0.46 cos
1 ;
(2)
0 1 adalah frame pada data sinyal suara, melambangkan jumlah sampel dari blok sinyal. 4. Autocorrelation analysis Setiap himpunan frame window diatokorelasi sehingga didapatkan sebuah himpunan koefisien 1 , dengan adalah orde LPC yang diharapkan. 5. LPC/Cepstral analysis Vektor dari koefisien LPC untuk masing-masing frame, diperoleh dari autokorelasi vektor menggunakan metode rekursi Levinson atau Durbin. Vektor LPC kemudian dikalkulasikan sehingga didapatkan koefisien LPC yaitu . 6. Cepstral weighting pada Vektor koefisien cepstral yaitu ℓ 65
Seminar Naasional Teknologii Informasi dan Komunikasi K 2013 (SENTIKA 2013)) Yogyakartaa, 9 Maret 2013
frame w waktu ke yaitu :
ISSN N: 2089-9815
dberikan bobbot oleh winddow 2 Analisa Keebutuhan 3.2 3.2 2.1 Pengambbilan Data Naada Tahap penggambilan daata suara naada yaitu meerekam nada-nnada pada sennar terbuka bio ola dengan forrmat file waveform. w Prroses merekam nada dilakukan satu persatu p dengann variasi geseekan busur bio ola yaitu keraas, lembut, daan normal. Su uara nada kerras diperoleh dari menggessek biola den ngan busur bio ola bagian ujung u bawahh rambut daan teknik gessekan pendekk-pendek serrta cepat. Su uara nada lem mbut diperoleeh dengan meenggesek biolla dengan bag gian atas raambut busur biola dengaan teknik gessekan lambaat. Suara nadda normal dihasilkan d den ngan menggessek biola denngan bagian attas hingga baw wah rambut dengan kecepaatan gesekan sedang.
(33) adalah bobot pada jendela ke– sehinggga didapatkan : (4) adalah koefiisien cepstral yang y sudah diiberi bobot 7. Delta cepstrum Turunann cepstral (yyaitu vektor delta cepstruum) dihitungg dengan mennggunakan perrsamaan : (5)
3.2 2.2 Alur Jalan nnya Aplikasii adalaah vektor deltaa cepstrum, adalah orde pertama p polinomiaal ortogonal dari panjang jendela terbaatas, adalah faaktor penguattan yang dipiilih agar variaan dari sam ma dengan . L Learning Vecctor Quantizaation (LVQ) 3.1.2 Learnning vector quantization (LVQ) adaalah suatu meetode klasifikaasi pola yangg masing-massing unit outpput mewakili kategori ataau kelas terteentu (beberapaa unit output seharusnya digunakan d unntuk masing-m masing kelas). Vektor bobbot untuk sebuah unit output sering dinyyatakan sebaggai sebuah vekktor referensi.. Diasumsikaan bahwa seerangkaian pola p pelatihann dengan klasifikasi yang tersedia t bersaama dengan distribusi awal dari vektor reeferensi. Sesuudah pelatihann, sebuah jarinngan LVQ meengklasifikasiikan vektor inpput dengan menugaskan m kee kelas yang saama sebagai unit u output, sedangkan yang y mempunnyai vektor refferensi diklasiifikasikan sebbagai vektor innput 0. Adapuun algoritma dari LVQ 0 adaalah : Langkah 1 : Iniisialisasikan vektor refereensi dan learnning rate α(0),, Langkah 2: Selama koondisi berhennti bernilai saalah, kerjakan : a. Untukk masing-masiing pelatihan vektor input b. Temuukan output sehingga jarak eucleddean v bobot dan d unit outpuut antara vektor bernillai minimum c. Perbaaiki vektor bobbot dengann : 1. Jikka T = , dengan d T sebbagai kelas yang y beenar untuk veektor pelatihaan dan adaalah keelas yang direppresentasikann oleh unit outtput , maka : (6) 2. Jikka T
Gambar 1. 1 Diagram aluur jalannya ap plikasi 2.3 Ekstraksi Koefisien C Cepstral Meng ggunakan 3.2 Meetode LPC
makka : (7)
d. Kuranngi learning raate e. Tes koondisi berhenti 66
Seminar Nasional Teknologi Informasi dan Komunikasi 2013 (SENTIKA 2013) Yogyakarta, 9 Maret 2013
Gambar 2. Diagram alir langkah-langkah ekstraksi koefisien cepstral 3.2.4 Arsitektur JST LVQ Jaringan saraf tiruan LVQ yang digunakan pada penelitian ini terdiri dari tiga lapisan, yaitu lapisan input terdiri dari 20 sel input yang merepresentasikan koefisien cepstral, lapisan tersembunyi dengan empat sel bobot, dan lapisan output yang merepresentasikan klasifikasi nada. Arsitektur jaringan saraf tiruan LVQ dari penelitian ini ditunjukkan oleh Gambar 3.
ISSN: 2089-9815
Gambar 4. Diagram alir pembelajaran jaringan saraf tiruan 3.2.6 Proses Pengujian JST LVQ
Gambar 3. Arsitektur jaringan saraf tiruan LVQ Gambar 5. Diagram alir pengujian jaringan saraf tiruan
3.2.5 Proses Pembelajaran JST LVQ
3.3 Skenario Pengujian 3.3.1 Skenario Pengujian Memorisasi Pengujian memorisasi dilakukan terhadap 60 67
Seminar Naasional Teknologii Informasi dan Komunikasi K 2013 (SENTIKA 2013)) Yogyakartaa, 9 Maret 2013
ISSN N: 2089-9815
nad da G, A, dan d E menccapai 100%. Namun, perrsentase jarinngan saraf tirruan untuk mengingat m nad da D hanyaa mencapai 86.67% dik karenakan terdapat dua datta yang diklassifikasikan dallam Kelas 1. Grafik G hasil pengujian p mem morisasi dengaan banyak epo oh 295, dan leearning rate 00.0005 ditunju ukkan oleh Gaambar 6.
data rekam man dan ordee LPC 20 denggan variasi : - Dilakukkan sebanyakk 295 epohh, learning rate r 0.0005 - Dilakukkan sebanyakk 295 epohh, learning rate r 0.0015 - Dilakukkan sebanyak 295 epoh, leaarning rate 0.0005 - Dilakukkan sebanyakk 295 epohh, learning rate r 0.0045 - Dilakukkan sebanyakk 295 epohh, learning rate r 0.000255 Targeet persentase keberhasilan mengingat yaitu sebesar 80%.
Tabel T 1. Hasil pengujian p memorisasi learn ning rate 0.0005 dengan 295 epoh Nada N Perssentase Persentase Rata a-rata G 1000.00% D 866.67% 96.67% A 1000.00% E 1000.00%
NARIO PENGUJIAN GE ENERALISAS SI SKEN Penguujian generalisasi dilakukkan terhadap 60 data reall time dan ordde LPC 20 deengan kombinnasi learning rate dan banyak epohh terbaik yang y dihasilkann dari penngujian mem morisasi. Tarrget persentasse keberhasilaan pengenalaan yaitu sebeesar 70%.
4.
GUJIAN DAN N PEMBAHA ASAN 5. PENG 5.1. Speesifikasi Peran ngkat 5.1.2 P Perangkat Keeras Peranngkat keras yang diggunakan dalam membanggun dan mengguji aplikasi yaaitu notebookk PC Compaq Presario B12257TU dengann processor Inntel Core 2 Duo, RAM 2 GB, hardd disk 160 GB, G operatingg system mengggunakan Winndows 7 Ultim mate 32 bit, alat a pengambbil input suarra menggunaakan Genius Multimedia M Miicrophone (Tippe MIC-01A)).
Gaambar 6. Hasill pengujian m memorisasi learrning rate 0.0005 dengan epoh 295
5.2 2.2 Hasil Peengujian Deengan Learn ning Rate
nak Pembangu un Aplikasi 5.1.3 Peerangkat Lun Dalam m membanggun dan meenguji aplikkasi, lingkungaan perangkat lunak yang digunakan yaitu Java SE 6 sebagai programming p language unntuk user inteerface serta membangunn jaringan saaraf tiruan, dan d pemrograman Matlabb untuk prooses pengolahhan sinyal LPC. L Databasse Server yang y digunakaan yaitu MySQ QL 5.5.8.
0.0 0015 dan Bany nyak Epoh 2955 Setelah dilakkukan pengujian dengan ban nyak epoh 295 5 dan learninng rate 0.00155, diperoleh persentase p rata-rata jaringann saraf tiruan dalam mengiingat nada yaiitu sebesar 96.67% yang dittunjukkan oleeh Tabel 2. Perrsentase jarinngan saraf tirruan untuk mengingat m nad da G, A, dan d E menccapai 100%. Namun, perrsentase jarinngan saraf tirruan untuk mengingat m nad da D hanyaa mencapai 86.67% dik karenakan terdapat dua datta yang diklassifikasikan dallam Kelas 1. Grafik G hasil pengujian p mem morisasi dengaan banyak epo oh 295, dan leearning rate 00.0015 ditunju ukkan oleh Gaambar 7.
nak Pendukun ng 5.1.4 Peerangkat Lun Untukk menunjang pembangunaan dan pengujjian aplikasi, diperlukan beberapa perangkat p luunak pendukunng yaitu Microosoft Office Word W 2007 unntuk dokumenntasi, NetBeanns IDE 7.2 Reelease Candiddate untuk Javva IDE, Naviicat Enterprise Version 9.11.11 for MySQ QL untuk daatabase IDE, dan SoundM MAX Integratedd Digital HD D Audio Verssion 6.10.1.5240 Microsofft Windowss Hardware Compatibiility Publisherr untuk merekkam suara biolla.
Tabel T 2. Hasil pengujian p memorisasi learn ning rate 0.0015 dengan 295 epoh Peersentase Ratta-rata Nada Perssentase G 100.00% D 866.67% 96.67% A 100.00% E 100.00%
5.2. Hassil Pengujian Memorisasi
5.2.1 Hasil Ha Pengujiian Dengan Learning Rate R 0.0005 daan Banyak Eppoh 295 Setelaah dilakukan pengujian p denngan banyak eppoh 295, dan learning ratee 0.0005, dipeeroleh persenttase rata-rata jaringan j saraff tiruan dalam m mengingat nada n yaitu sebeesar 96.67% yang y ditunjukkkan oleh Tabeel 1. Persentasse jaringan saraf s tiruan untuk u menginngat 68
Seminar Naasional Teknologii Informasi dan Komunikasi K 2013 (SENTIKA 2013)) Yogyakartaa, 9 Maret 2013
ISSN N: 2089-9815
ban nyak epoh 295 dan leearning ratee 0.0045, dip peroleh persenntase rata-rata jaringan saaraf tiruan dallam menginggat nada yaittu sebesar 85% 8 yang ditu unjukkan olehh Tabel 4. Peersentase jarin ngan saraf tiru uan untuk mengingat m nadda G dan E mencapai 100 0%. Persenttase jaringann saraf tiruaan untuk meengingat nadaa A mencapai 93.33%, dik karenakan terdapat satu datta yang diklassifikasikan dalam Kelas 1. Sedangkan peersentase jarinngan saraf tiru uan untuk meengingat nadda D hanyaa mencapai 46.67%, dik karenakan terdapat t 8 buah datta yang dik klasifikasikan ke dalam K Kelas 1. Graafik hasil pen ngujian memoorisasi dengann banyak epoh h 295, dan lea arning rate 0.00045 ditunjukkkan oleh Gam mbar 9.
Gambar 7. 7 Hasil penguujian memorissasi learning rate r 0.0015 dengan d epoh 295 2
Tabel T 4. Hasil pengujian p memorisasi learn ning rate 0.0045 dengan 295 epoh a-rata Nada Perssentase Perrsentase Rata G 1000.00% D 466.67% 85% A 933.33% E 1000.00%
5.2.3 Hasil Ha Pengujiian Dengan Learning Rate R 0.005 dan n Banyak Epooh 295 Setelaah dilakukan pengujian p denngan banyak eppoh 295 dan learning ratee 0.005, dipeeroleh persenttase jaringan saraf tiruan dalam mengiingat nada yaitu sebesar 85% yang ditunjukkan oleh Tabel 3. Persentasse jaringan saraf s tiruan untuk u menginngat nada G dan d E mencappai 100%. Perrsentase jarinngan saraf tiruuan untuk mengingat m naada A mencaapai 93.33%, dikarenakann terdapat satu s data yang y diklasifikkasikan dalaam Kelas 1. Sedanggkan persentasse jaringan saraf tiruan untuk u menginngat nada D hanya menncapai 46.67%, dikarenaakan terdapat 8 buah data yang y diklasifikkasikan ke dalam Kelas 1. Grafik hasil pengujian meemorisasi denngan banyak epoh 295, dan learning rate 0.005 ditunjukkkan oleh Gambbar 8. morisasi learniing Tabbel 3. Hasil peengujian mem rate 0.0005 dengan 2995 epoh Nadaa Persentasee Persentasse Rata-rata G 100.00% D 46.67% 8 85% A 93.33% E 100.00%
Gaambar 9. Hasill pengujian m memorisasi learrning rate 0.0045 dengan epoh 295 5.2 2.5 Hasil Peengujian Deengan Learn ning Rate 0.0 00025 dan Banyak Epoh 2995 Setelah dilaakukan penguujian terhadaap dengan ban nyak epoh 295 dan learning rate 0.00025, dip peroleh persenntase rata-rata jaringan saaraf tiruan dallam menginggat nada yaituu sebesar 10 00% yang ditu unjukkan olehh Tabel 5. Peersentase jarin ngan saraf tiru uan untuk mengingat m naada G, D, A, A dan E meencapai 100% %. Grafik hasill pengujian memorisasi m den ngan banyak epoh e 295, dann learning ratte 0.00025 ditu unjukkan olehh Gambar 10. Tabel T 5. Hasil pengujian p memorisasi learn ning rate 0.000025 dengann 295 epoh Nada Perssentase Perrsentase Rata a-rata G 1000.00% D 1000.00% 100.00% A 1000.00% E 1000.00%
Gambar 8. 8 Hasil penguujian memorissasi learning rate r 0.005 deengan epoh 2995
5.2.4 Hasil Ha Pengujiian Dengan Learning Rate R 0.0045 daan Banyak Eppoh 295 Setelaah dilakukan pengujian terhadap t denngan 69
Seminar Naasional Teknologii Informasi dan Komunikasi K 2013 (SENTIKA 2013)) Yogyakartaa, 9 Maret 2013
ISSN N: 2089-9815
nad da E, learniing rate 0.000025, dan dilakukan seb banyak 190 eppoh ditunjukkaan oleh Tabel 6. Pen ngenalan nadda terbaik darri jaringan saaraf tiruan yan ng dilakukan terhadap dataa realtime seb banyak 60 datta yang terdirri dari 15 dataa nada G, 15 data nada D, 15 data nadda A, dan 155 data nada E, E dengan lea arning rate 0.00025, dan ddilakukan sebaanyak 190 epo oh, terjadi paada nada G yang mencap pai 100%, dissusul kemudiaan dengan nnada E yang mencapai 93.33% karenaa terdapat ssatu buah data d yang dik klasifikasikan ke dalam K Kelas 2. Nadaa A hanya meencapai 60% karena terdaapat 6 buah data d yang dik klasifikasikan dalam K Kelas 1. Kemudian, K perrsentase rata--rata yang terrendah adalah h nada D yan ng hanya meencapai 40% karena terjad di 9 buah kessalahan menggklasifikasi kee dalam Kelass 1. Grafik hassil pengujiann generalisasi pada learn ning rate 0.0 00025 dan epooh 190 ditunjuukkan oleh Gaambar 11. Tabel 6. Hassil pengujian ggeneralisasi dengan d learningg rate 0.000255 dan 190 epo oh P Persentase Ra ataNada Perrsentase rata G 1000.00% D 40% 73.33% A 60% E 933.33%
Gambarr 10. Hasil penngujian memoorisasi learninng rate 0.000225 dengan epooh 295 Persenntase rata-rataa jaringan saaraf tiruan dalam mengingaat nada mampu m melampaui tarrget keberhasiilan dalam mengingat m naada yaitu 800%, dengan learning raate 0.000255 menghasillkan persentasse rata-rata jarringan dalam mengingat nada n sebesar 100%, 1 learninng rate 0.00005 menghasillkan persentasse rata-rata jarringan dalam mengingat nada n sebesar 96.67%, 9 learning rate 0.0015 menghasillkan persentasse rata-rata jarringan dalam mengingat nada n sebesar 96.67%, 9 learning rate 0.00445 menghasillkan persentasse rata-rata jarringan dalam mengingat nada n sebesar 85%, learninng rate 0.0005 menghasillkan persentasse rata-rata jarringan dalam mengingat nada n sebesar 85%. Apabiila diperhattikan, perseentase-persenttase tersebut menunjukkann bahwa persentase tertinnggi diperolehh dari learningg rate terkeciil, dan persenttase terkecil diperoleh dari d learningg rate terbeesar. Sehinggaa dapat dikaatakan bahwaa semakin kecil k learning rate maka kem mampuan jariingan saraf tirruan semakin baik dalam mengenali m pola yang terbenntuk dari koefisien cepsstral yang dihasilkan dari d pengolahhan sinyal. Terbukti dari d banyakknya kesalahann yang terjaddi dalam menngklasifikasi data d nada yanng tidak sesuaii dengan kelaas dari nada yang y diharapkaan. Banyaknyya kesalahan mengklasifikkasi data padda learning rate r 0.005 daan learning rate r 0.0045 untuk u nada D sebanyak 8 data, d serta unntuk nada A sebanyak satu s buah data. d Sedanggkan banyaknyya kesalahann mengklasifiikasi data pada p learning rate 0.0005 dan d learning rate r 0.0015 unntuk nada D seebanyak 2 datta. Setelaah diketahui bahwa perssentase rata-rrata jaringan saraf tiruan dalam d menginngat nada denngan mpu learning rate 0.000225 pada epooh 295 mam mencapaii 100%, makaa untuk penguujian generalisasi dilakukann pengujian paada learning rate r 0.00025. 5.3. Hassil Pengujian Generalisasii 5.3.1. Hasil Ha Pengujjian generaalisasi denggan learning rate 0.00025 dan 190 epoh h Hasil pengujian geeneralisasi denngan jumlah data d realtime sebanyak 60 data yang terrdiri dari 15 data d nada G, 15 1 data nada D, D 15 data nadda A, dan 15 data d
Gambar G 11. Haasil pengujiann generalisasi learning rate 0.00025 0 denggan epoh 190 5.3 3.2. Hasil Pengujian generalisasi dengan lea arning rate 0.000025 dan 2995 epoh Hasil pengujjian generalisaasi dengan ju umlah data rea altime sebanyyak 60 data daata yang terdiiri dari 15 datta nada G, 15 data nada D, 15 data nada A, dan 15 datta nada E, leaarning rate 00.00025, dan dilakukan pad da epoh 295 ditunjukkan d olleh Tabel 7. Pengenalan nada terbaikk dari jaring gan saraf tiru uan yang dilakukan d terrhadap data realtime seb banyak 60 datta yang terdirri dari 15 datta nada G, 15 data nada D, 15 data nada A, dan 15 daata nada E, den ngan learninng rate 0.00025, dan dilakukan seb banyak 295 eppoh, terjadi paada nada G daan E yang meencapai 100% %, disusul kem mudian dengaan nada A yan ng mencapai 66.67%, 6 karenna terdapat 5 buah data yan ng salah dikklasifikasikann ke dalam Kelas 1. 70
Seminar Naasional Teknologii Informasi dan Komunikasi K 2013 (SENTIKA 2013)) Yogyakartaa, 9 Maret 2013
Persentasse rata-rata yang y terendahh adalah nadaa D yang haanya mencappai 33.33% karena terdaapat kesalahann mengklasifikkasi ke dalam m Kelas 1 padaa 10 buah dataa. Grafik hasiil pengujian generalisasi g p pada learning rate 0.000255 dan epoh 295 ditunjukkkan oleh Gam mbar 12.
ISSN N: 2089-9815
perrsentase rata-rata terkecil dalam mengeenali pola yan ng dihasilkann koefisien ccepstral yakn ni sebesar 73.33%. Epoh 295 menghasilkkan persentasse rata-rata seb besar 75%. Seedangkan epohh terbanyak yaitu y epoh 350 0 mampu menghasilkann persentasee sebesar 88.33%. Grafik perbaandingan perrsentase rata--rata hasil pen ngujian generralisasi pada learning ratee 0.00025 den ngan mevariaasikan banyakknya epoh diitunjukkan oleeh Gambar 14.
Tabel 7. Hasil penggujian generalisasi dengan l learning rate 0.00025 0 dan 295 2 epoh Persentase RataNadaa Persentasse r rata G 100.00% % D 33.33% 7 75% A 66.67% E 100.00% %
Tabel 8. Hassil pengujian ggeneralisasi dengan d learningg rate 0.000255 dan 350 epo oh P Persentase Ra ataNada Perrsentase rata G 866.67% D 800.00% 88.33% A 866.67% E 1000.00%
Gambarr 12. Hasil penngujian generralisasi learninng rate 0.000225 dengan epooh 295 5.3.3. Hasil Ha Pengujjian generaalisasi denggan learning rate 0.00025 dan 350 epoh h Hasil pengujian geeneralisasi denngan jumlah data d realtime sebanyak 60 data data yanng terdiri darii 15 data nadaa G, 15 data nada n D, 15 datta nada A, dann 15 data nadaa E, learningg rate 0.000255, dan dilakuukan pada epohh 350 ditunjukkkan oleh Tabbel 8. Pengeenalan nada terbaik darii jaringan saaraf tiruan yang y dilakukkan terhadap data realttime sebanyakk 60 data yangg terdiri dari 15 data nadaa G, 15 data nada n D, 15 datta nada A, dann 15 data nadaa E, dengan learning ratte 0.00025, dan dilakuukan sebanyakk 350 epoh, terjadi padaa nada E yang y mencapaii 100%, disussul kemudiann dengan nadaa G dan A yaang mencapai 86.67% dikaarenakan terdaapat 2 buah kesalahan mengklasifikkasi nada yang y diklasifikkasikan ke dallam Kelas 1. Persentase ratarata yang terendah adalah a nada D yang haanya mencapaii 80% dikarennakan terjadi 3 buah kesalaahan dalam mengklasifikas m si ke dalam Kelas 1. Graafik hasil penngujian geneeralisasi padaa learning rate r 0.00025 dan d epoh 350 ditunjukkan oleh o Gambar 13. 1 Berdaasarkan hasil pengujian generalisasi g p pada learning rate 0.00025 dengan epohh 190, epoh 295, 2 dan epohh 350, persenntase rata-ratta jaringan saaraf tiruan dalam d mengeenali pola yang y dihasillkan koefisienn cepstral datta nada menuunjukkan bahhwa epoh palling sedikit yaitu y epoh 1990 menghasillkan
Gambar G 13. Haasil pengujiann generalisasi learning rate 0.00025 0 denggan epoh 350
Gambar G 14. Haasil pengujiann generalisasi learning rate 0.00025 0 denggan epoh 350 71
Seminar Nasional Teknologi Informasi dan Komunikasi 2013 (SENTIKA 2013) Yogyakarta, 9 Maret 2013
ISSN: 2089-9815
Sedangkan epoh terbanyak yaitu epoh 350 mampu menghasilkan persentase rata-rata 88.33% dengan persentase pengenalan pada nada E yang mencapai 100%, lalu nada G dan nada A mencapai 86.67%, dan nada D mencapai 80%.
Kemampuan jaringan saraf tiruan pada learning rate 0.00025 dengan variasi epoh dalam mengenali pola yang dihasilkan koefisien cepstral pada pengujian generalisasi memberikan hasil yang berbeda dengan pengujian memorisasi pada learning rate 0.00025 dan variasi epoh yang sama yakni epoh 190, epoh 295, dan epoh 350. Pengujian memorisasi dilakukan menggunakan data koefisien cepstral dari nada yang telah direkam, lalu dijadikan bahan pembelajaran jaringan saraf tiruan. Sedangkan pengujian generalisasi dilakukan menggunakan data koefisien cepstral yang diambil ketika nada dimainkan langsung, bukan dari file rekaman. Persentase rata-rata hasil pengujian memorisasi yang mencapai 100% menunjukkan hasil yang baik dari jaringan saraf tiruan, karena mampu mengingat dengan sempurna pola dari koefisien cepstral yang sudah pernah dipelajari sebelumnya. Akan tetapi, berdasarkan hasil pengujian generalisasi yang telah dilakukan hanya mampu mencapai persentase ratarata sebesar 88.33% dalam mengenali pola dari koefisien cepstral yang belum pernah dipelajari, sehingga dapat dikatakan bahwa jaringan saraf tiruan pada penelitian yang dilakukan penulis tidak dapat secara sempurna mengenali pola koefisien cepstral yang belum pernah dipelajari. Hal ini disebabkan karena koefisien cepstral ketika biola dimainkan secara langsung pada saat pengujian generalisasi memiliki pola yang lebih beragam dan berbeda dengan pola dari koefisien cepstral pada file rekaman yang dijadikan pembelajaran jaringan saraf tiruan. Keragaman pola tersebut disebabkan oleh kondisi penyetelan senar yang tidak bisa sama persis ketika merekam nada untuk pembelajaran dengan memainkan nada pada saat pengujian generalisasi. Namun, dalam penelitian ini, persentase rata-rata jaringan saraf tiruan dalam mengenali nada dari hasil pengujian generalisasi yaitu sebesar 88.33% telah mampu melampaui target keberhasilan pengenalan yaitu sebesar 70%.
6.2. Saran Saran untuk penelitian selanjutnya adalah : 1. Mengembangkan penelitian dengan menggunakan data rekaman maupun data pengujian yang berasal dari hasil setem beberapa pemain biola lain yang memiliki kompetensi sama dengan pemain biola yang telah menyetem biola untuk data rekaman dan data pengujian yang telah dilakukan oleh penulis. 2. Mengembangkan penelitian dengan mengkaji pengaruh suhu terhadap suara biola yang dihasilkan apakah berdampak pada keakuratan pengenalan nada. 3. Mengembangkan penelitian dengan mengkaji penyebab kesalahan hasil pengenalan nada D dan nada A yang cenderung dikenali ke dalam kelas nada G. REFERENSI Bradbury, Jeremy. 2000. “Linier Predictive Coding”. Florida: Florida Institute of Technology. Eronen, Antti., Anssi Klapuri. 2000. “Musical Instrument Recognition Using Cepstral Coefficients And Temporal Features”. Proc. Of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP. Fachrudin, AN. 2004. Pengenalan Pengucap Tak Bergantung Teks dengan Metode Vector Quantization (VQ) Melalui Ekstraksi Linier Predictive Coding (LPC). Jurusan Teknik Elektro, Fakultas Teknik, Universitas Diponegoro. Semarang. Gunawan, Dadang., dan Filbert Hilman Juwono. 2012. “Pengolahan Sinyal Digital Dengan Pemrograman Matlab”. Graha Ilmu. Yogyakarta. ISBN : 978-979-756-814-6. Hidayanto, Achmad. 2009. “Dasar Pemodelan Markov”. Fakultas Teknik, Universitas Dipenogoro, Semarang, http://achmad.blog.undip.ac.id/files/2009/06/mar kov.pdf (Diunduh 22 Januari 2012) Hohmann, C.H. 1910. “Pratical Violin Method Book 1”, (E-book). U.S.A.: Carl Fischer New York. ISBN-13 : 9780825808883. ISO 16:1975 “Acoustics – Standard tuning frequency (Standard musical pitch)”. Changes made in 1995, ISO Standards Handbook : Acoustics, Vol.1, General Aspects of Acoustics: Methods of noise neasurement in general; Noise with respect to human beings; Ed. 2.616. International Organization for Standardization. ISBN : 92-67-10221-4 Kristanto, Andi. 2004. “Jaringan Saraf Tiruan
6. KESIMPULAN DAN SARAN 6.1. Kesimpulan Berdasarkan hasil pengujian generalisasi terhadap 60 data uji yang terdiri dari 15 data nada G, 15 data nada D, 15 data nada A, dan 15 data nada E pada learning rate 0.00025 dengan epoh 190, epoh 295, dan epoh 350, persentase rata-rata jaringan saraf tiruan dalam mengenali pola yang dihasilkan koefisien cepstral data nada menunjukkan bahwa: Epoh yang paling sedikit yaitu epoh 190 menghasilkan persentase rata-rata terkecil dalam mengenali pola yang dihasilkan koefisien cepstral yakni 73.33% dengan persentase pengenalan pada nada G yang mencapai 100%, nada E mencapai 93.33%, nada A mencapai 60%, dan nada D mencapai 40%. Epoh 295 menghasilkan persentase rata-rata 75% dengan persentase pengenalan pada nada G dan E yang mencapai 100%, nada A mencapai 66.67%, dan nada D mencapai 33.33%. 72
Seminar Nasional Teknologi Informasi dan Komunikasi 2013 (SENTIKA 2013) Yogyakarta, 9 Maret 2013
(Konsep Dasar, Algoritma, dan Aplikasi)”. Yogyakarta: Gala Media. Miller, Michael. 2005. “The Complete Idiot’s Guide to Music Theory Second Edition” , (E-book). U.S.A: Penguin Group (USA) Inc, New York. ISBN : 1-4295-1388-8. Munawar, Badri. 2010. “Pengidentifikasian Kata Dengan Menggunakan Metode Hidden Markov Model (HMM) Melalui Ekstraksi Ciri Linier Prediction Coding (LPC)”. Jurusan Teknik Informatika, Fakultas Teknik dan Ilmu Komputer, Universitas Komputer Indonesia.. S., Amri. 2009. www.musikbiola.com (Diakses 20 Januari 2011 pukul 6.39 WIB) Susanto, Indra. 2004. “Pengenalan Suara Alat Musik Dengan Metode Jaringan Saraf Tiruan (JST) Learning Vector Quantization (LVQ) Melalui Ekstraksi Koefisien Cepstral”. Makalah disajikan dalam Seminar Tugas Akhir, Jurusan Teknik Elektro Fakultas Teknik Universitas Diponegoro, Semarang. Vaseghi, Saeed V. 2007. “Multimedia Signal Processing : Theory and Applications in Speech, Music, and Communications”. United Kingdom: John Willey & Sons, Ltd.
73
ISSN: 2089-9815