PENERAPAN SOM UNTUK PENGENALAN NADA PADA ANGKLUNG MODERN
AREN AUDITA
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Penerapan SOM untuk Pengenalan Nada pada Angklung Modern adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Februari 2014 Aren Audita NIM G64114016
ABSTRAK AREN AUDITA. Penerapan SOM untuk Pengenalan Nada pada Angklung Modern. Dibimbing oleh AGUS BUONO. Angklung merupakan warisan budaya Indonesia yang berasal dari Jawa Barat dan telah berkembang mengikuti perkembangan musik yang modern. Tujuan penelitian ini adalah menerapkan metode self-organizing maps (SOM) dan ekstraksi ciri mel-frequency cepstrum coefficients (MFCC) serta mengetahui akurasinya. Data yang digunakan sebanyak 300 nada angklung yang dimainkan dengan cara dicetok dari 12 nada diatonis yang masing-masing nadanya sebanyak 25 suara. Data nada direkam selama 3 detik dengan beberapa cetokan dalam memainkannya. Proses awal adalah membuat nada menjadi satu cetokan saja, kemudian dinormalisasi, lalu diekstraksi ciri dengan 26 koefisien cepstral MFCC. Pembagian data latih dan uji dilakukan secara acak dengan komposisi setiap nada yaitu 19 data latih dan 5 data uji. Penelitian ini melakukan tiga ulangan di radius 0, 1, dan 2 dengan data latih, data uji, dan 10 nilai parameter laju pembelajaran pada SOM yang berbeda di tiap ulangannya. Hasil clustering dengan SOM menghasilkan akurasi terbaik sebesar 98.33% di radius 1 pada ulangan 1 dan 3, serta di radius 2 pada ulangan 1 dengan laju pembelajaran yang sama di kedua radius yaitu 0.0090. Kata kunci: angklung, clustering, MFCC, nada diatonis, SOM
ABSTRACT AREN AUDITA. Application of SOM for Tones Recognition on Modern Angklung. Supervised by AGUS BUONO. Angklung is an Indonesian cultural heritage from West Java and has been developed following the development of modern music. The purpose of this research is to recognize the tone of angklung by using self-organizing maps (SOM) and mel-frequency cepstrum coefficients (MFCC) feature extraction. The used data were 300 tones of angklung that were played by staccato of 12 diatonic tones, each tone by 25 voices. Tones data were recorded for 3 seconds with some staccato in play. The initial process was making the data into one staccato tone, normalized, and then its characteristics were extracted with 26 cepstral coefficients MFCC. Distribution of training and test data was conducted randomly by the composition of 19 training data and 5 test data for each tone. This research conducted three repetitions on radius 0, 1, and 2 with training data, test data and learning rate of 10 parameter values at different SOM in each of their repetition. The result shows that the best accuracy obtained was 98.33% at a radius of 1 in repetition 1 and 3, as well as at a radius of 2 in repetition 1 with a common learning rate in both radius, 0.0090. Keywords: angklung, clustering, diatonic tones, MFCC, SOM
PENERAPAN SOM UNTUK PENGENALAN NADA PADA ANGKLUNG MODERN
AREN AUDITA
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Ilmu Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
Penguji: 1 Aziz Kustiyo, SSi MKom 2 Toto Haryanto, SKom MSi
Judul Skripsi : Penerapan SOM untuk Pengenalan Nada pada Angklung Modern Nama : Aren Audita NIM : G64114016
Disetujui oleh
Dr Ir Agus Buono, MSi MKom Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen
Tanggal Lulus:
Judul Skripsi: Penerapan SOM untuk Pengenalan Nada pada Angklung Modem Nama : Aren Audita NIM : G64114016
Disetujui oleh
Dr If
>1U
~-~-
Tanggal Lulus:
r ,'
u uono MSi MKom Pembimbing
Ket'Ua Departemen - -'
o 4 MAR 2014
PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian ini ialah pengenalan suara, dengan judul Penerapan SOM untuk Pengenalan Nada pada Angklung Modern. Terima kasih penulis ucapkan kepada: 1 Ayah dan seluruh keluarga atas segala doa, dukungan dan kasih sayangnya khususnya untuk ibu saat masih menemani dalam pengerjaan karya ilmiah ini. 2 Bapak Dr Ir Agus Buono, MSi MKom selaku dosen pembimbing yang telah banyak memberi saran saat bimbingan. 3 Bapak Aziz Kustiyo, SSi MKom dan Bapak Toto Haryanto, SKom MSi selaku dosen penguji atas kesediaannya sebagai penguji. 4 Suhermanto dan Sarah dari Lises Gentra Kaheman IPB yang telah membantu selama pengumpulan data. 5 Teman-teman Ilkom alih jenis angkatan 6 khususnya teman-teman satu bimbingan yang senantiasa memberikan dukungan dan bantuan selama pengerjaan karya ilmiah ini. Semoga karya ilmiah ini bermanfaat.
Bogor, Februari 2014 Aren Audita
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
3
Manfaat Penelitian
3
Ruang Lingkup Penelitian
3
METODE
3
Lingkungan Pengembangan
3
Studi Literatur
4
Pengambilan Data Nada Angklung
4
Praproses
5
Pembagian Data Latih dan Data Uji
8
Pemodelan SOM (Self-Organizing Maps)
8
Pengujian
9
Rancangan Percobaan
9
HASIL DAN PEMBAHASAN
10
Pengambilan Data Nada Angklung
10
Praproses
10
Pembagian Data Latih dan Data Uji
10
Struktur SOM
11
Hasil dan Analisis Percobaan
11
SIMPULAN DAN SARAN
15
Simpulan
15
Saran
16
DAFTAR PUSTAKA
16
RIWAYAT HIDUP
18
DAFTAR TABEL 1 2 3 4
Nada angklung melodi Hasil randperm data uji Akurasi 91.67% ulangan 3 radius 0 Akurasi 91.67% ulangan 2 radius 0
2 10 14 15
DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Angklung Tahapan proses penelitian Alur praproses Alur ambil satu cetokan nada Diagram alur proses MFCC Kohonen self-organizing maps Akurasi radius 0 Rata-rata akurasi radius 0 Akurasi radius 1 Akurasi radius 2 Akurasi radius 0, 1, dan 2 Rata-rata akurasi radius 1 Rata-rata akurasi radius 2 Rata-rata akurasi dari 3 ulangan di 3 radius
1 4 5 6 7 9 11 11 12 12 13 13 13 14
PENDAHULUAN Latar Belakang Angklung merupakan warisan budaya dari Indonesia yang berasal dari daerah Jawa Barat. Angklung adalah alat musik yang terdiri atas dua sampai empat tabung bambu yang digantung dalam bingkai bambu dan terikat dengan tali rotan. Pada bulan November 2010, UNESCO telah mengakui angklung sebagai warisan kebudayaan dunia dari Indonesia dengan kategori “Intangible Cultural Heritage of Humanity” (UNESCO 2010). Angklung telah berkembang mengikuti perkembangan musik yang modern. Angklung yang awalnya hanya memiliki nada pentatonis, kini telah berkembang menjadi nada diatonis. Nama nada pada skala pentatonis yaitu C, D, E, G, dan A, sedangkan pada skala diatonis yaitu C, C#, D, D#, E, F, F#, G, G#, A, A#, dan B. Angklung diatonis ini dikembangkan oleh Bapak Daeng Soetigna pada tahun 1938 yang kemudian diberi nama angklung Padaeng. Menurut Kemdikbud RI (tahun tidak diketahui), angklung ini dikelompokkan menjadi dua yaitu angklung melodi dan angklung akompanimen (pengiring). Jenis angklung ini dapat dilihat pada Gambar 1. Jenis angklung pada Gambar 1 dari kiri ke kanan yaitu angklung melodi 2 tabung, angklung melodi 3 tabung, angklung mayor akompanimen, dan angklung minor akompanimen. Satu set unit angklung melodi terdapat 31 angklung melodi kecil dan 11 angklung melodi besar. Nada angklung melodi kecil dapat dilihat pada Tabel 1. Cara memainkan angklung ini ada tiga yaitu: 1 Kurulung (getar) Satu tangan memegang rangka angklung, kemudian tangan yang lainnya menggoyangkan angklung selama nada yang diinginkan. 2 Cetok (sentak) Tabung dasar ditarik dengan cepat oleh jari ke telapak tangan, sehingga nada yang dihasilkan akan berbunyi sekali saja (staccato). 3 Tengkep Teknik yang mirip dengan kurulung, hanya saja salah satu tabung ditahan agar tidak bergetar.
Gambar 1 Angklunga
a
Sumber: http://www.angklung-udjo.co.id/wp-content/uploads/2010/01/angklung-range.jpg.
2 Tabel 1 Nada angklung melodib Oktaf Nada Melodi F# 0 3 G 1 G# 2 A 3 A# 4 B 5 4
C C# D D# E F F# G G# A A# B
6 7 8 9 10 11 12 13 14 15 16 17
5
C C# D D# E F F# G G# A A# B
18 19 20 21 22 23 24 25 26 27 28 29
6
C
30
Bagi orang biasa atau pemula dalam bidang musik, untuk menghasilkan nada pada angklung ini cukuplah mudah. Akan tetapi, untuk mengenali nada pada angklung tersebut, mereka membutuhkan waktu untuk mengenalinya. Tentunya hal ini berbeda dengan seorang ahli musik yang sudah terbiasa memegang alat musik ini. Oleh karena itu, sistem pengenalan nada pada angklung dibutuhkan untuk membantu dalam mengenali nada tersebut. Penelitian tentang pengenalan nada angklung ini masih jarang ditemukan. Penelitian yang akan dilakukan yaitu dengan mencoba menggunakan metode selforganizing maps (SOM) sebagai pengenalan pola dan mel-frequency cepstrum coefficients (MFCC) sebagai fitur ekstraksi cirinya. Pemilihan kedua metode ini b
Sumber: http://klungbot.com/wp-content/uploads/2013/04/tabel-nada-angklung.pdf.
3 berdasarkan penelitian yang dilakukan oleh Zak (2011) dan Monte et al. (1996). Pada penelitian Zak (2011) menghasilkan akurasi di atas 90%, sedangkan pada penelitian Monte et al. (1996) menghasilkan akurasi 100%. Alasan lainnya adalah Davis dan Mermelstein telah membuktikan bahwa MFCC memberikan akurasi tertinggi dibandingkan dengan fitur ekstraksi lainnya (Buono et al. 2011; Ganchev 2005). Angklung yang digunakan dalam penelitian ini adalah angklung melodi kecil 2 tabung Padaeng yang akan dimainkan dengan cara dicetok. Nada yang dipilih adalah nada diatonis dalam satu oktaf yang berada pada oktaf keempat. Tujuan Penelitian Tujuan dari penelitian ini ialah: 1 Menerapkan metode SOM dan teknik ekstraksi ciri MFCC dalam pengenalan nada pada angklung. 2 Mengetahui akurasi pengenalan nada pada angklung dengan menggunakan metode SOM dan teknik ekstraksi ciri MFCC. Manfaat Penelitian Penelitian ini diharapkan dapat memberikan informasi mengenai akurasi penggunaan metode SOM dalam pengenalan nada pada angklung. Ruang Lingkup Penelitian Ruang lingkup dalam penelitian ini ialah: 1 Nada yang akan dikenali adalah nada diatonis dalam satu oktaf yang berada pada oktaf keempat. 2 Nada yang akan dikenali adalah nada angklung yang dimainkan dengan cara staccato (dicetok). 3 Jenis angklung yang dipakai adalah angklung melodi kecil 2 tabung Padaeng.
METODE Penelitian ini dilakukan dengan beberapa tahapan proses, yaitu studi literatur, pengambilan data nada angklung, praproses, pemodelan SOM, dan pengujian. Tahapan proses penelitian ini dapat dilihat pada Gambar 2. Lingkungan Pengembangan Penelitian ini menggunakan perangkat keras dan perangkat lunak dengan spesifikasi sebagai berikut: 1 Perangkat Keras Processor Intel Core 2 Duo CPU @ 2.10 GHz. Memori 4 GB. Harddisk 300 GB. Keyboard dan mouse.
4 Monitor. 2 Perangkat Lunak Sistem operasi Windows XP Professional 32 bit. Matlab 7.7.0 (R2008b). Mulai
Studi Literatur
Pengambilan Data Nada Angklung Praproses
Data Latih
Data Uji
Pemodelan SOM
Data Bobot Hasil SOM
Pengujian
Selesai
Gambar 2 Tahapan proses penelitian Studi Literatur Tahapan ini melakukan pencarian dan pembelajaran tentang apa yang dibutuhkan dalam penelitian ini. Hal-hal yang dibutuhkan antara lain tentang metode SOM dan juga MFCC. Selain itu, hal-hal yang terkait dengan pengenalan suara akan dicari dan dipelajari untuk dijadikan referensi dalam penelitian ini. Pengambilan Data Nada Angklung Data yang digunakan dalam penelitian ini adalah 12 jenis nada angklung yang dimainkan dengan cara dicetok kemudian direkam. Angklung yang digunakan berasal dari Lises Gentra Kaheman IPB. Dua belas jenis nada tersebut yaitu C, C#, D, D#, E, F, F#, G, G#, A, A#, dan B. Masing-masing nada tersebut direkam sebanyak 25 kali sehingga didapatkan untuk setiap nada memiliki 25 data suara. Data direkam di ruangan yang hening guna menghindari noise. Data nada direkam selama 3 detik dengan sampling rate 11 000 Hz, bit rate sebesar 16 bit,
5 dan ekstensi fail WAV. Selama 3 detik itu terdapat beberapa cetokan dalam memainkannya. Praproses Tahapan ini membuat setiap nada yang awalnya terdapat beberapa cetokan menjadi satu cetokan saja. Alur dari tahapan ini dapat dilihat pada Gambar 3. Pada tahap silence removing di awal, data yang terdapat silent di awal akan dibuang. Setelah itu, data akan diambil satu cetokan di awal saja. Untuk membuat nada menjadi satu cetokan di awal saja, nada akan diambil dari awal dalam kondisi bersuara hingga ditemukannya kondisi nada yang silent. Dalam mendeteksi kondisi silent itu, proses ini akan menggunakan algoritma silence removal dan endpoint detection yang dilakukan oleh Saha et al. (2005). Alur dari proses ini dapat dilihat pada Gambar 4. Setelah itu, data akan dinormalisasi sehingga semua data memiliki nilai maksimum 1 atau nilai minimum -1. Kemudian, data diekstraksi ciri dengan menggunakan MFCC. Diagram alur proses MFCC dapat dilihat pada Gambar 5 (Do 1994).
Silence Removing di awal
Membuat nada menjadi satu cetokan
Normalisasi
Ekstraksi ciri MFCC
Mel Cepstrum
Gambar 3 Alur praproses
6 Mulai
Baca x (i) & Hitung μ, σ x(i) = sampel nada yang ke i μ = rata-rata; σ = simpangan baku While x (i) <= panjang (x)
tidak
|x(i) - μ|⁄σ > z z = threshold
Tandai x (i) dengan 0 (Sampel tidak bersuara)
ya Tandai x (i) dengan 1 (Sampel bersuara)
x dibagi menjadi beberapa frame Untuk setiap frame, tandai 1 jika di dalam frame itu lebih banyak sampel bersuara dibandingkan sampel tidak bersuara dan tandai 0 jika sampel tidak bersuara yang lebih banyak Ambil frame awal yang bersuara sampai bertemu frame yang tidak bersuara
Selesai
Gambar 4 Alur ambil satu cetokan nada MFCC ini sering digunakan sebagai ekstraksi ciri dalam pengenalan suara, karena dapat merepresentasikan ciri sebuah sinyal suara (Do 1994). MFCC ini mengubah sinyal suara ke dalam bentuk matriks yang berukuran jumlah koefisien dikali dengan banyaknya frame suara yang terbentuk. Beberapa parameter input dalam proses ini yaitu: 1 Input yang digunakan adalah data suara nada dengan ekstensi WAV. 2 Sampling rate yaitu nilai sinyal suara yang diambil dalam satu detik. Sampling rate yang digunakan sebesar 11 000 Hz. 3 Time frame yaitu waktu yang dipakai untuk membagi data suara menjadi beberapa bagian frame. Time frame yang digunakan sebesar 40 ms. 4 Overlapping digunakan untuk mengurangi hilangnya informasi saat proses frame blocking. Overlapping yang digunakan sebesar 50%. 5 Koefisien cepstral yaitu koefisien ciri yang diinginkan untuk output dari proses MFCC. Koefisien cepstral yang digunakan sebesar 26 karena dalam penelitian Wisnudisastra dan Buono (2010) menghasilkan akurasi 96% untuk 26 koefisien cepstral dan akurasi 91% untuk 13 koefisien cepstral.
7 Speech
Frame Blocking
Frame
Windowing
Mel Cepstrum
FFT Spectrum
Cepstrum
Mel-frequency
Gambar 5 Diagram alur proses MFCC Frame Blocking Pada tahapan MFCC ini, sinyal suara akan dibagi menjadi beberapa frame dari N sampel yang direpresentasikan dalam bentuk vektor. Agar tidak ada informasi yang hilang, setiap frame yang bersebelahan dibuat menjadi saling tumpang tindih atau overlap. Windowing Proses frame blocking memungkinkan terjadinya diskontinuitas sinyal pada awal dan akhir setiap frame. Diskontinuitas ini akan menyebabkan terjadinya distorsi spektral. Untuk menguranginya, tiap frame dilakukan proses windowing. Metodenya yaitu dengan mengalikan tiap frame dengan fungsi window tertentu. Fungsi window yang dipakai adalah Hamming window: w(n) = 0.54 - 0.46 cos(2πn / (N - 1)) , 0 n N-1 Keterangan: N = jumlah sampel pada setiap frame n = frame ke-… w = fungsi Hamming window Fast Fourier Transform (FFT) Proses ini mengubah setiap frame dari domain waktu ke domain frekuensi. Hal ini dilakukan untuk mempermudah dalam pemrosesan selanjutnya. Hasil dari proses ini yaitu spektrum atau periodogram. Algoritme dari FFT yaitu: N-1 Xn = ∑k=0 xk eps(- 2πjkn / N) , n = 0,1,2,…,N-1
Keterangan: Xn = magnitude frekuensi xk = nilai-nilai sampel N = jumlah data sampel j = bilangan imajiner Mel-frequency Persepsi manusia terhadap frekuensi sinyal suara tidak mengikuti skala linear. Oleh karena itu untuk setiap nada dengan frekuensi aktual f (dalam satuan Hz), nilai subjektif dari pitch diukur dengan menggunakan skala “mel”. Skala mel-frequency adalah selang frekuensi linear di bawah 1000 Hz dan selang logaritmik di atas 1000 Hz. Proses ini umumnya menggunakan filterbank. Perhitungannya adalah: N-1 Xi = log10 ∑k=0 |X(k)| Hi (k) , i = 1,2,3,…,M
Keterangan: Hi (k) = nilai filter segitiga ke i X(k) = nilai data ke k hasil proses FFT
8 M = jumlah filter N = banyaknya data Cepstrum Proses ini mengubah mel-frequency ke domain waktu dengan menggunakan Discrete Cosine Transform (DCT). Hasilnya disebut dengan MFCC. Proses DCT: M
Cj =
Xi cos(j(i - 1)2(π / M))
i=0
Keterangan: Cj = nilai koefisien C ke j j = jumlah koefisien cepstral i = jumlah wrapping Xi = hasil mel-frequency pada frekuensi ke i Pembagian Data Latih dan Data Uji Pada tahap ini, data yang telah melalui tahap praproses akan dipilih secara acak dari masing-masing nada. Pembagian data tersebut yaitu 19 data suara untuk data latih, 1 data suara untuk data bobot, dan 5 data suara untuk data uji. Setelah itu, data latih akan melalui tahap pemodelan SOM sebagai vektor masukan dan data bobot untuk bobot awal. Pemodelan SOM (Self-Organizing Maps) Metode ini merupakan salah satu model jaringan saraf tiruan. Metode ini disebut juga topology-preserving maps yang berarti struktur topologi antara unit cluster (Fausett 1994). SOM ini mempunyai bobot vektor setiap unit cluster sebagai contoh dari pola masukan yang terkait dengan cluster tersebut. Selama prosesnya, akan dipilih satu cluster sebagai pemenang dan cluster pemenang serta cluster tetangganya akan memperbaharui bobot cluster. Cluster pemenang ini ditentukan dari jarak yang terdekat dari bobotnya. Arsitektur dari model SOM menurut Fausett (1994) dapat dilihat pada Gambar 6. Menurut Fausett (1994), algoritme dari metode SOM ini yaitu: 1 Inisialisasi Bobot wij Parameter laju pembelajaran awal (α) dan faktor penurunannya Parameter topologi tetangga (R) 2 Selama kondisi penghentian bernilai salah, lakukan langkah 3-9 3 Untuk setiap vektor masukan x, lakukan langkah 4-6 2
4 Hitung D(j) = ∑ (wij - xi ) untuk semua j 5 Tentukan indeks J sehingga D(J) bernilai minimum. D(J) dilihat dari D(j) 6 Modifikasi bobot untuk setiap unit j di sekitar J berdasarkan topologi tetangga yang telah ditentukan dan untuk seluruh i: wij (baru) = wij (lama) + α(xi - wij(lama)) 7 Modifikasi laju pembelajaran 8 Kurangi radius topologi tetangga pada waktu tertentu 9 Uji kondisi penghentian
9
…
Y1
Wij
Wi1
Ym
W1m
Wnj
W1j
Wn1 W11
…
Yj
Wim Wnm
X1
…
Xi
…
Xn
Gambar 6 Kohonen self-organizing maps Pengujian Pengujian dilakukan dari data uji yang telah diekstraksi ciri menggunakan MFCC kemudian di-cluster dengan metode SOM menggunakan bobot dari hasil SOM data latihnya. Setiap data nada angklung yang diuji akan di-cluster-kan ke cluster yang sesuai. Tingkat akurasi sistem akan dihitung untuk mengevaluasi hasil penelitian. Setiap data yang diuji akan dilihat apakah data tersebut akan masuk ke dalam cluster yang sesuai. Persentase tingkat akurasi dihitung dengan fungsi berikut: Hasil=
∑ nada yang benar × 100% ∑ nada yang diuji
Rancangan Percobaan Penelitian ini menggunakan data nada dengan perekaman 3 detik, sampling rate 11 000 Hz, bit rate sebesar 16 bit, ekstensi fail WAV, dan dalam 3 detik itu terdapat beberapa cetokan dalam memainkannya. Pada tahap MFCC, parameter yang digunakan adalah sampling rate sebesar 11 000 Hz, time frame sebesar 40 ms, overlapping sebesar 50%, dan 26 koefisien cepstral. Threshold yang digunakan pada tahap ambil satu cetokan nada sebesar 0.1. Penelitian ini akan melakukan tiga kali ulangan dengan 10 parameter SOM berbeda di tiap ulangannya. Setiap ulangan ini mempunyai jumlah yang sama di setiap nadanya yaitu 19 data latih, 5 data uji, dan 1 data bobot tetapi ada perbedaan dalam pemilihan secara acak dari masing-masing nada yaitu untuk data latih dan data uji. Sepuluh parameter SOM yang berbeda itu terletak pada laju pembelajaran. Laju pembelajaran yang akan digunakan yaitu 0.0001, 0.0003,
10 0.0005, 0.0007, 0.0009, 0.0010, 0.0030, 0.0050, 0.0070, dan 0.0090. Parameter lainnya dalam pemodelan SOM yaitu 300 epoch, penurunan laju pembelajaran sebesar 0.1, radius sebesar 0, 1, dan 2, vektor masukan x diambil dari data latih, bobot awal diambil dari data bobot.
HASIL DAN PEMBAHASAN Pengambilan Data Nada Angklung Nada angklung diambil dengan cara direkam langsung menggunakan perangkat lunak Matlab. Nada tersebut direkam selama 3 detik dengan beberapa cetokan dalam memainkannya lalu disimpan ke dalam ekstensi fail WAV. Jumlah data yang direkam sebanyak 300 data nada angklung dari 12 nada yang masingmasing nadanya sebanyak 25 suara. Praproses Pada tahap awal praproses ini, data nada dibuat menjadi satu cetokan saja. Setelah itu, data akan dinormalisasi dengan cara membagi semua nilai nada dengan nilai maksimum dari absolut nilai nada. Kemudian, data diekstraksi ciri dengan menggunakan MFCC. Proses MFCC ini menggunakan fungsi auditory toolbox Matlab. Parameter MFCC yang digunakan yaitu sampling rate sebesar 11 000 Hz, time frame sebesar 40 ms, overlapping sebesar 50%, dan koefisien cepstral sebesar 26. Pembagian Data Latih dan Data Uji Setiap nada akan dibagi menjadi 3 bagian yaitu 19 data suara untuk data latih, 1 data suara untuk data bobot, dan 5 data suara untuk data uji. Tahap awal adalah menentukan data ke-25 sebagai data bobot, kemudian memilih secara acak 5 data yang akan menjadi data uji dengan menggunakan fungsi randperm pada Matlab. Sisa dari data itu akan dijadikan sebagai data latih. Hasil randperm untuk data uji dapat dilihat pada Tabel 2.
Ulangan 1 2 3
Tabel 2 Hasil randperm data uji Data uji ke1 2 3 5 24 1 20 6 10 3 9 24
4 13 1 14
5 3 19 10
Tabel 2 menunjukkan pada percobaan di ulangan pertama akan menggunakan 5 data uji pada urutan data ke-24, 16, 17, 18, dan 23. Ulangan kedua akan menggunakan 5 data uji pada urutan data ke-9, 16, 23, 14, dan 17 sedangkan pada ulangan ketiga pada urutan data ke-11, 19, 22, 1, 12. Proses
11 pembagian untuk setiap ulangan ini didapatkan sejumlah data latih sebanyak 228, data uji sebanyak 60, dan data bobot sebanyak 26. Struktur SOM Struktur SOM ini memiliki 26 neuron input dan 12 neuron output. Vektor bobot Laju masukannya ialah data latih dan bobot awalnya ialah data bobot. pembelajaran yang digunakan yaitu 0.0001, 0.0003, 0.0005,, 0.0007, 0. 0.0009, 0.0010, 0.0030, 0.0050 0050, 0.0070, dan 0.0090. Parameter lainnya yaitu 300 epoch, penurunan laju pembelajaran sebesar 0.1, serta radius sebesar 0, 1, dan 2. 2 Hasil dan Analisis Percobaan
Akurasi
Radius 0 Gambar 7 menyajikan akurasi hasil percobaan tiga kali ulangan dengan meter laju pembelajaran berbeda di setiap tiap ulangannya. Di gambar ini sepuluh parameter terlihat bahwa akurasi terendah yang didapatkan sebesar 88.33% dan akurasi tertinggi sebesar 91.67%. Ulangan pertama dan ketiga ga terlihat bahwa semakin besar laju pembelajarannya, pembelajarannya, maka semakin rendah akurasi yang didapatkan. Hal ini dikarenakan kecepatan belajar pada jaringan SOM. Laju pembelajaran yang besar berarti kecepatan belajarnya pun lebih cepat dan tidak terlalu detail sehingga pemetaan nadanya tidak terlalu baik. Sebaliknya, laju pembelajaran yang kecil akan menghasilkan pemetaan nada yang baik karena proses pembelajarannya akan lebih detail walaupun lama dalam kecepatan belajarnya. 100% 96% 92% 88% 84% 80%
90.00%
91.67%
91.67%
90.00%
88.33%
Ulangan 1
Ulangan 2
Ulangan 3
α = 0.0001 α = 0.0003 α = 0.0005 α = 0.0007 α = 0.0009 α = 0.0010 α = 0.0030 α = 0.0050 α = 0.0070 α = 0.0090
Rata-Rata Akurasi
Gambar 7 Akurasi radius 0 100% 96% 92% 88% 84% 80%
89.00%
Ulangan 1
91.67%
91.50%
Ulangan 2
Ulangan 3
Gambar 8 Rata-rata akurasi radius 0 Dari Gambar 8, rata-rata rata rata akurasi terkecil terdapat di ulangan 1 yaitu 89% rata akurasi terbesar terdapat di ulangan 2 yaitu 91.67%. Pada gambar ini dan rata-rata juga dapat dilihat bahwa setiap ulangan memiliki rata-rata rata rata akurasi yang berbeda-
12 beda. Hal ini dikarenakan kurang baiknya dalam perekaman nada. Oleh karena itu, setiap data uji berubah, maka berubah pula akurasi yang didapatkan. Radius 1 dan Radius 2 Saat radius 1 dan 2 ini, akurasi yang dihasilkan mengalami peningkatan kurasi. Akurasi yang dihasilkan saat radius 1 dan radius 2 dapat dilihat pada akurasi. Gambar 9 dan Gambar 10.. Akurasi tertinggi yang dihasilkan saat saat radius 1 dan 2 ini sama yaitu 98.33%, begitupun dengan d akurasi terendahnya yaitu 90.00%. Pada ngan dan radius 2 di ulangan 1 dan 3, radius 1 di semua ulangan 3, semakin kecil laju pembelajarannya nya maka semakin kecil pula akurasi yang dihasilkan. Hal ini erbanding terbalik saat radius 0. berbanding 0 Perbandingan ketiga radius ini dapat dilihat pada Gambar 11. 100%
98.33%
Akurasi
96% 92%
93.33%
98.33% 96.67% 95.00% 95.00% 93.33% 91.67% 93.33% 91.67%
90.00%
88% 84% 80% Ulangan 1
Ulangan 2
Ulangan 3
α = 0.0001 α = 0.0003 α = 0.0005 α = 0.0007 α = 0.0009 α = 0.0010 α = 0.0030 α = 0.0050 α = 0.0070 α = 0.0090
Gambar 9 Akurasi radius 1 100%
Akurasi
96% 92%
98.33% 95.00% 93.33%
91.67%
95.00% 95.00% 93.33% 93.33% 91.67%
90.00%
88% 84% 80% Ulangan 1
Ulangan 2
Ulangan 3
α = 0.0001 α = 0.0003 α = 0.0005 α = 0.0007 α = 0.0009 α = 0.0010 α = 0.0030 α = 0.0050 α = 0.0070 α = 0.0090
Gambar 10 Akurasi radius 2
96.67%
13 100%
Akurasi
96% 92% 88% 84% 80% 0.0001 0.0003 0.0005 0.0007 0.0009 0.0010 0.0030 0.0050 0.0070 0.0090 Laju Pemahaman Radius 0 Ulangan 1
Radius 0 Ulangan 2
Radius 0 Ulangan 3
Radius 1 Ulangan 1
Radius 1 Ulangan 2
Radius 1 Ulangan 3
Radius 2 Ulangan 1
Radius 2 Ulangan 2
Radius 2 Ulangan 3
Rata-Rata Akurasi
Gambar 11 Akurasi radius 0, 1, dan 2 100% 96% 92% 88% 84% 80%
91.50%
92.17%
Ulangan 1
Ulangan 2
94.17%
Ulangan 3
Gambar 12 Rata-rata akurasi radius 1
Rata-Rata Akurasi
Jika dilihat dari radius 0, 1, dan 2 yang dapat dilihat pada Gambar 8, 12, 12 dan 13, radius 1 dan 2 ini yang lebih tinggi untuk semua ulangan dalam menghasilkan akurasinya dibandingkan dengan radius 0. Perbedaan rata-rata rata akurasi di radius 1 dan 2 ini terletak pada ulangan 1 dan 3. Untuk ulangan 1, radius 2 yang menghasilkan akurasi tertinggi yaitu 91.67%, 91.67%, sedangkan untuk ulangan 3, radius 1 yang menghasilkan akurasi tertinggi yaitu 94.17%. 94.17% Untuk ulangan 2, radius 1 dan 2 ini sama-sama sama menghasilkan akurasi 92.17%. 100% 96% 92% 88% 84% 80%
91.67%
92.17%
Ulangan 1
Ulangan 2
94.00%
Ulangan 3
Gambar 13 Rata-rata akurasi radius 2 rata akurasi untuk tiap ulangan ini juga terjadi pada radius 1 Perbedaan rata--rata dan 2. Radius 0, 1, dan 2 ini mengalami perbedaan rata-rata rata rata akurasi untuk tiap ulangannya. Hal ini dapat dikatakan bahwa dalam perekaman nada pun dapat mempengaruhi hasil akurasi yang didapatkan.
Rata-Rata Akurasi
14 100% 96% 92% 88% 84% 80%
90.72%
92.61%
92.61%
Radius 0
Radius 1
Radius 2
Gambar 14 Rata-rata Rata akurasi dari 3 ulangan di 3 radius Radius yang menghasilkan akurasi tertinggi berdasarkan rata rata-rata ulangannya adalah radius 1 dan 2 dengan akurasi sebesar 92.61%, sedangkan yang terendah adalah radius 0 dengan akurasi sebesar 90.72%. 90.72% Hal ini dapat dilihat pada Gambar 14. Dapat dikatakan bahwa radius 1 dan 2 inilah yang terbai terbaik dalam menghasilkan akurasi. Analisis Kesalahan Clustering Kesalahan yang terjadi dalam penempatan cluster ini karena jarak nada yang kecil yaitu setengah. Contohnya adalah pada percobaan di ulangan 3 dengan radius 0 yang akurasinya nya sebesar 91.67% di Tabel 3.. Disini ada 2 nada yang masuk ke cluster yang salah yaitu yaitu nada D# dan F. Dua nada D# masuk ke cluster E serta 3 nada F masuk ke F#. Hal ini terjadi karena nada D# dan E ini berjarak setengah nada, begitu pun nada F dan F#. Hal serupa terjadi pada ulangan 2 dengan radius 0 di Tabel 4. 4 Bahkan pada percobaan ini terdapat 5 nada F yang semuanya masuk ke cluster yang salah yaitu F#. Tabel 3 Nada A A# A 5 0 A# 0 5 B 0 0 C 0 0 C# 0 0 D 0 0 D# 0 0 E 0 0 F 0 0 F# 0 0 G 0 0 G# 0 0
Akurasi 91.67% ulangan 3 radius 0 B C C# D D# E F F# G G# 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 3 2 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 2 3 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5
Untuk mengatasinya, penggantian radius perlu dilakukan. Hal ini dikarenakan nada yang berpengaruh dalam penempatan cluster yang sesuai itu adalah nada tetangganya yang bersebelahan. Hal ini dapat dilihat dari Tabel 3 dan 4 yang semua kesalahan clustering-nya clustering nya ada pada jarak nada yang setengah. Penggantian radius menjadi 1 untuk ulangan 2 dengan laju pembelajaran 0.0090 berhasil menaikkan akurasinya dari 91.67% menjadi 95%. Lima nada F yang masuk ke cluster F#, setelah diganti radiusnya menjadi 1, kini hanya 3 nada
15 yang masuk ke cluster F#. Saat radius diganti menjadi 2 pun akurasinya meningkat menjadi 93.33%. Begitupun dengan nada F yang 3 nadanya masih masuk ke cluster F#. Tetapi dalam radius 2 ini, nada B yang awalnya masuk ke cluster B semua, sekarang ada 1 nada yang masuk ke cluster yang salah yaitu A#. Tabel 4 Nada A A# A 5 0 A# 0 5 B 0 0 C 0 0 C# 0 0 D 0 0 D# 0 0 E 0 0 F 0 0 F# 0 0 G 0 0 G# 0 0
Akurasi 91.67% ulangan 2 radius 0 B C C# D D# E F F# G G# 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 5
Hal ini membuktikan bahwa dengan mengganti radiusnya menjadi 1 ataupun 2, maka akan meminimalisir kesalahan clustering dan dapat meningkatkan akurasinya. Nada yang masih salah dalam clustering ini dikarenakan kurang baiknya dalam perekaman nada dan juga kurang baiknya dalam memainkan angklungnya.
SIMPULAN DAN SARAN Simpulan Berdasarkan penelitian yang telah dilakukan, maka dapat disimpulkan bahwa: 1 Penelitian ini telah berhasil menerapkan metode SOM dan teknik ekstraksi ciri MFCC dalam pengenalan nada angklung. 2 Akurasi tertinggi yang dihasilkan adalah 98.33% di radius 1 pada ulangan 1 dan 3 serta di radius 2 pada ulangan 1 dengan laju pembelajaran yang sama di kedua radius yaitu 0.0090. Parameter MFCC yang digunakan yaitu sampling rate sebesar 11 000 Hz, time frame sebesar 40 ms, overlapping sebesar 50%, dan 26 koefisien cepstral serta parameter SOM lainnya yaitu 300 epoch, penurunan laju pembelajaran sebesar 0.1. 3 Saat radius 0, semakin besar laju pembelajaran yang digunakan maka semakin kecil akurasi yang didapatkan karena proses pembelajaran yang cepat dan tidak terlalu detail sehingga pemetaan nada tidak baik, sedangkan pada radius 1, semakin besar laju pembelajaran maka semakin besar akurasi yang didapatkan.
16 4 Perubahan radius dari 0 menjadi 1 ataupun 2, maka akan meminimalisir kesalahan clustering dan dapat meningkatkan akurasinya. 5 Radius 1 dan 2 memiliki rata-rata akurasi tertinggi dari ulangannya yaitu sebesar 92.61%. Saran Saran untuk pengembangan selanjutnya yaitu: 1 Mencoba dengan data yang lebih banyak lagi untuk dibandingkan hasilnya dengan penelitian ini. 2 Mencoba memodelkan dengan metode pengenalan pola serta ekstraksi ciri yang lain untuk dibandingkan akurasinya dengan penelitian ini. Metode pengenalan pola lain misalnya LVQ, Backpropagation, Counterpropagation, dan lainnya. Metode ekstraksi ciri misalnya LPCC, LPC, RCC, dan lainnya. 3 Mencoba mengganti parameter-parameter SOM serta MFCC untuk dibandingkan hasilnya dengan penelitian ini.
DAFTAR PUSTAKA Buono A, Jatmiko W, Kusumoputro B. 2011. Mel-frequency cepstrum coefficients as higher order statistics representation to characterize speech signal for speaker identification system in noisy environment using hidden markov model. Di dalam: Mwasiagi JI, editor. Self Organizing Maps Applications and Novel Algorithm Design. Rijeka (HR): Intech. hlm 189-206. doi: 10.5772/566. Do MN. 1994. Digital signal processing mini-project: an automatic recognition system. Laussane (CH): Federal Institute of Technology. Fausett L. 1994. Fundamentals of Neural Networks: Architectures, Algorithms, and Applications. New Jersey (US): Prentice Hall. Ganchev TD. 2005. Speaker recognition [disertasi]. Patras (GR): University of Patras. [Kemdikbud RI] Kementerian Pendidikan dan Kebudayaan Republik Indonesia. [tahun tidak diketahui]. Angklung [Internet]. [diunduh 2013 Okt 3]. Tersedia pada: http://kebudayaanindonesia.net/id/culture/826/angklung#.UlgaY1NmNds. Monte E, Hernando J, Miro X, Adolf A. 1996. Text independent speaker identification on noisy environments by means of self organizing maps. Di dalam: Bunnell HT, Idsardi W, editor. Proceedings ICSLP 96 Fourth International Conference on Spoken Language; 1996 Okt 3-6; Philadelphia, Amerika Serikat. Wilmington (US): Citation Delaware. 3(1):1084-1807. doi: 10.1109/ICSLP.1996.607980. Saha G, Chakroborty S, Senapati S. 2005. A new silence removal and endpoint detection algorithm for speech and speaker recognition applications. Di dalam: Lamba TS, Biswas PK, Pathak SS, editor. Proceedings of the Eleventh National Conference on Communications NCC-2005; 2005 Jan 28-30. Kharagpur (IN): Allied. hlm 291-295.
17 [UNESCO] United Nations Educational, Scientific and Cultural Organization. 2010. Indonesian angklung [Internet]. [diunduh 2013 Okt 3]. Tersedia pada: http://www.unesco.org/culture/ich/en/RL/00393. Wisnudisastra E, Buono A. 2010. Pengenalan chord pada alat musik gitar menggunakan codebook dengan teknik ekstraksi ciri MFCC. Jurnal Ilmiah Ilmu Komputer. 14 (1):16-21. Zak A. 2011. Ship’s hydroacoustics signatures classification using neural networks. Di dalam: Mwasiagi JI, editor. Self Organizing Maps - Applications and Novel Algorithm Design. Rijeka (HR): Intech. hlm 209-232. doi: 10.5772/566.
18
RIWAYAT HIDUP Penulis dilahirkan di Cirebon, Jawa Barat, Indonesia pada tanggal 16 Oktober 1990. Penulis merupakan anak kedua dari tiga bersaudara, dari pasangan H Achmad Hudaja, SEAk dan Dra Hj Sri Endang Pawukir, MA. Penulis memulai pendidikan formal dari TK 27 Cirebon dan lulus pada tahun 1996, kemudian melanjutkan pendidikan di SDN Kebonbaru 4 Cirebon dan lulus pada tahun 2002. Pendidikan menengah diselesaikan di SMP Negeri 5 Cirebon dan lulus pada tahun 2005. Lalu, penulis melanjutkan pendidikan tingkat atas di SMAN 6 Cirebon dan lulus pada tahun 2008. Pada tahun 2008, penulis melanjutkan pendidikan di Institut Pertanian Bogor Direktorat Program Diploma, Program Keahlian Teknik Komputer melalui jalur Undangan Seleksi Masuk IPB (USMI) dan lulus pada tahun 2011. Pada tahun 2011, penulis melanjutkan pendidikan di Program Alih Jenis S1 Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.