KLASIFIKASI GENRE MUSIK MENGGUNAKAN LEARNING VECTOR QUANTIZATION (LVQ)
MUHAMMAD RIDWAN FANSURI
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
KLASIFIKASI GENRE MUSIK MENGGUNAKAN LEARNING VECTOR QUANTIZATION (LVQ)
MUHAMMAD RIDWAN FANSURI G64062253
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
ABSTRACT MUHAMMAD RIDWAN FANSURI, Musical Genre Classification Using Learning Vector Quantization (LVQ). Under the supervision of SONY HARTONO WIJAYA. Radio stations and music television have a milion of music tapes. A lot of musical genres create a problem when people wants to determine the right genre of a new kind of music. To classify the musical genre is not an easy task, because the musical genre is really difficult to standardization. Automatic musical genre classification can assist the human role in that process and help people to searching for the song acording to the genre that people want. This research using Mel Frequency Coefficient Cepstrum (MFCC) to obtain feature extraction. Learning Vector Quantization (LVQ), one kind of artificial neural network used for classification method. The number of genres that are used were four kind of musical genre, that is rock, classic, keroncong, and jazz with four different duration that is 5 second, 10 second, 20 second and 25 second. This research using k- fold cross validation to distribute dataset for training and testing set with the number of folds as much as 2 until 10 fold. This research succesfully implemented MFCC feature exraction and classification using LVQ. Based on this research, the accuracy of the classification using Learning Vector Quantization reaches 93,75% for the four type musical genre. The highest accuracy value was obtain from the experiments with a duration of 10 second and the number of fold 4. Training time for each duration is 30 minute for 5 second music duration, 45 minute for 10 second music duration 120 minute for 20 second music duration and 150 minute for 25 second music duration. Keywords : Classification, Music, Genre , K- Fold Cross Validation ,Mel Frequency Coefficient Cepstrum (MFCC), Learning Vector Quantization (LVQ), Artificial Neural Network.
Judul Penelitian : Klasifikasi Genre Musik Menggunakan Learning Vector Quantization (LVQ) Nama
: Muhammad Ridwan Fansuri
NRP
: G64062253
Menyetujui: Pembimbing,
Sony Hartono Wijaya, M.Kom NIP. 19810809 200812 1 002
Mengetahui: Ketua Departemen Ilmu Komputer,
Dr. Ir. Sri Nurdiati, M.Sc NIP. 19601126 198601 2 001
Tanggal Lulus :
PRAKATA Alhamdulilahi Rabbil βalamin, puji dan syukur penulis panjatkan kepada Allah SWT atas segala limpahan karunia sehingga skripsi penulis dengan judul Klasifikasi Genre Musik Menggunakan Learning Vector Quantization (LVQ) dapat diselesaikan. Penelitian ini dilakukan mulai Januari 2010 sampai dengan Desember 2010. Selama pelaksanaan skripsi ini, penulis memperoleh banyak sekali bantuan dari berbagai pihak. Dengan segala kerendahan hati penulis menyampaikan ucapan terima kasih kepada: 1 Kedua orang tua tercinta yang selalu memberikan kasih sayang, doa, dan dukungan moral. 2 Bapak Sony Hartono Wijaya, M.Kom selaku pembimbing atas bimbingan, arahan, dan nasihat yang diberikan selama pengerjaan tugas akhir ini. 3 Bapak Dr. Ir. Agus Buono, M.Si., M.Kom dan Bapak Rindang Karyadin, S.T., M.Kom selaku dosen penguji. 4 Ibu Dra. Psi. Waysima, M.Sc. atas segala bantuan selama penulis kuliah. 5 Rekan-rekan satu bimbingan Gunawan, Yoga, Kanta dan Subhan 6 Rekan-rekan Ilmu Komputer 43 7 Departemen Ilmu Komputer, staf, dan dosen yang telah banyak membantu baik selama penelitian maupun pada masa perkuliahan. Penulis menyadari masih banyak kekurangan dalam penelitian ini. Oleh karena itu, kritik dan saran sangat penulis harapkan untuk perbaikan di masa mendatang semoga penelitian ini dapat bermanfaat, Amin.
Bogor, Maret 2011
Muhammad Ridwan Fansuri
RIWAYAT HIDUP
Penulis dilahirkan di Bogor pada tanggal 21 Mei 1988 sebagai anak pertama dari tiga bersaudara dari pasangan Bapak Udjang Sugiman dan Ibu N. Badrianingsih. Pada tahun 2006 penulis lulus dari SMA Negeri 6 Bogor dan pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) melalui jalur Seleksi Penerimaan Mahasiswa Baru (SPMB). Pada tahun 2006 penulis diterima di Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam. Pada tahun 2009 Penulis menjalankan Praktik Kerja Lapangan (PKL) di Markas Besar Kepolisian Republik Indonesia Jakarta selama kurang lebih dua bulan.
DAFTAR ISI Halaman DAFTAR TABEL .................................................................................................................................. v DAFTAR GAMBAR .............................................................................................................................. v DAFTAR LAMPIRAN ........................................................................................................................... v PENDAHULUAN 1 Latar Belakang .................................................................................................................................... 1 Rumusan Masalah ............................................................................................................................... 1 Tujuan ................................................................................................................................................. 1 Ruang Lingkup ................................................................................................................................... 1 Manfaat ............................................................................................................................................... 1 TINJAUAN PUSTAKA 1 Genre Musik ....................................................................................................................................... 1 Digitalisasi Gelombang Audio ............................................................................................................ 1 Ekstraksi Ciri Sinyal Audio ................................................................................................................ 2 Mel-Frequency Ceostrum Coefficient (MFCC) .................................................................................. 2 Klasifikasi ........................................................................................................................................... 4 Jaringan Syaraf Tiruan ........................................................................................................................ 4 Learning Vector Quantization (LVQ) ................................................................................................. 4 K-fold Cross Validtion ........................................................................................................................ 5 Confusion Matrix ................................................................................................................................ 5 METODE PENELITIAN 5 Studi Pustaka....................................................................................................................................... 5 Perumusan Masalah ............................................................................................................................ 5 Data Musik.......................................................................................................................................... 5 Praproses ............................................................................................................................................. 6 Pembagian Data Uji dan Data Latih ................................................................................................... 6 Pelatihan ............................................................................................................................................. 6 Pengujian ............................................................................................................................................ 6 Evaluasi............................................................................................................................................... 6 Lingkungan Pengembangan ............................................................................................................... 6 HASIL DAN PEMBAHASAN 6 Data Musik.......................................................................................................................................... 6 Praproses ............................................................................................................................................. 7 Pelatihan dan Pengujian ...................................................................................................................... 8 KESIMPULAN DAN SARAN 11 Kesimpulan ....................................................................................................................................... 11 Saran ................................................................................................................................................. 11 DAFTAR PUSTAKA ........................................................................................................................... 11
DAFTAR TABEL Halaman 1 2 3 4 5
Akurasi pengujian tiap fold ............................................................................................................... 9 Hasil klasifikasi data berdurasi 5 detik.............................................................................................. 9 Hasil klasifikasi data berdurasi 10 detik.......................................................................................... 10 Hasil klasifikasi data berdurasi 20 detik.......................................................................................... 10 Hasil klasifikasi data berdurasi 25 detik.......................................................................................... 10
DAFTAR GAMBAR Halaman 1 Diagram blok proses MFCC. ............................................................................................................ 2 2 Proses frame blocking. ...................................................................................................................... 2 3 Hamming window. ............................................................................................................................ 3 4 Sinyal audio dalam domain frekuensi. .............................................................................................. 3 5 Mel- frequency wrapping. ................................................................................................................. 3 6 Arsitektur JST. .................................................................................................................................. 4 7 Arsitektur jaringan LVQ. .................................................................................................................. 4 8 Contoh k - fold cross validation. ....................................................................................................... 5 9 Metodologi penelitian. ...................................................................................................................... 5 10 Grafik durasi 5 detik. ......................................................................................................................... 7 11 Grafik durasi 10 detik. ....................................................................................................................... 7 12 Grafik durasi 20 detik........................................................................................................................ 7 13 Grafik durasi 25 detik........................................................................................................................ 7 14 Sinyal audio. ..................................................................................................................................... 7 15 Hasil frame blocking. ........................................................................................................................ 8 16 Hasil proses windowing. ................................................................................................................... 8 17 Hasil ekstraksi ciri untuk genre jazz. ................................................................................................ 8 18 Hasil ekstraksi ciri untuk genre keroncong. ...................................................................................... 8 19 Hasil ekstraksi ciri untuk genre klasik. ............................................................................................. 8 20 Hasil ekstraksi ciri untuk genre rock................................................................................................. 8 21 Grafik perbandingan waktu proses. ................................................................................................ 11
DAFTAR LAMPIRAN Halaman 1 Daftar lagu yang digunakan pada penelitian. .................................................................................. 14 2 Hasil proses MFCC. ........................................................................................................................ 17 3 Hasil klasifikasi tiap genre. ............................................................................................................. 20
v
PENDAHULUAN Latar Belakang Genre musik adalah pengelompokan musik sesuai dengan kemiripan satu dengan yang lain, seperti kemiripan dalam hal frekuensi musik, struktur ritmik, dan konten harmoni. Genre musik merupakan hal yang penting bagi masyarakat yang menyukai musik, karena membuat masyarakat dengan mudah mengelompokan musik yang yang mereka sukai. Pada umumnya pengelompokan lagu dilakukan secara manual yaitu dengan mendengarakan lagu secara langsung kemudian dikelompokkan bedasarkan genre lagu tersebut. Metode ini mempunyai keunggulan yaitu mempunyai tingkat akurasi yang tinggi, tetapi kekurangan dari metode ini adalah sangat tidak efisien untuk data berjumlah banyak, karena harus didengarkan satu persatu. Pengelompokan genre lagu secara otomatis mulai dikembangkan untuk membantu mengelompokan lagu yang berjumlah banyak. Proses ini mempunyai keunggulan dalam jumlah data yang bisa diporses namun kekurangan dari proses otomatis adalah akurasi yang rendah. Untuk dapat dikelompokkan data musik harus melalui proses ekstraksi ciri yang bertujuan mendapatkan ciri dari lagu tersebut. Salah satu metode yang dapat digunakan adalah Mel-frequency cepstral coefficient (MFCC). MFCC mengekstraksi ciri suara berdasarkan spektrum yang dihasilkan dari musik. Penelitian yang menggunakan MFCC dalam proses ekstraksi ciri antara lain, Prameswari (2010) yang melakukan penelitian pengembangan sistem pengenalan kata berbasis fonem dalam bahasa Indonesia dengan metode resilent backpropagation, dan Wisnudhisastra (2009) tentang pengenalan chord gitar dengan teknik ekstraksi ciri Mel-frequency cepstral coefficient (MFCC). Leaning Vector Quantization (LVQ) merupakan salah satu contoh dari jaringan syaraf tiruan yang digunakan untuk proses klasifikasi. Metode LVQ sudah banyak digunakan untuk penelitian, seperti penelitian oleh Effedy et al (2008) mengenai deteksi pornografi pada citra digital menggunakan pengolahan citra dan jaringan syaraf tiruan, Qurβani & Rosmalinda (2010) yang meneliti jaringan syaraf tiruan LVQ untuk aplikasi pengenalan tanda tangan. Klasifikasi genre musik telah dilakukan oleh Talupur et al (2002). Pada penelitian ini genre
yang diklasifikasikan antara lain klasik, rock, jazz dan country dengan akurasi tertinggi yang dihasilkan sebesar 80 %. Berdasarkan penelitian yang terkait, metode MFCC dan LVQ dapat digunakan untuk klasifikasi genre musik. Rumusan Masalah Rumusan masalah dalam penelitian ini adalah bagaimana membuat model klasifikasi data audio menggunakan jaringan syaraf tiruan LVQ. Ruang Lingkup Ruang lingkup pada penelitian ini antara lain: 1. Dalam penelitian ini, genre musik yang diklasifikasikan dibatasi hanya genre rock, klasik, jazz dan keroncong. 2. Musik yang diolah mempunyai durasi 5, 10, 20, dan 25 detik dengan format wav. 3. Data musik menggunakan chanel mono. Tujuan Tujuan dari penelitian ini adalah mengembangkan model Learning Vector Quantization untuk klasifikasi genre musik. Manfaat Penelitian ini diharapkan dapat melakukan klasifikasi pada data musik menggunakan Learning Vector Quantization agar dapat membantu peran manusia dalam hal menentukan genre musik, sehingga genre musik tidak lagi bersifat relatif, tetapi dapat dikelompokkan dengan standardisasi yang telah ditentukan. TINJAUAN PUSTAKA Genre Musik Genre musik adalah label yang dibuat dan digunakan manusia untuk mengkategorikan dan menggambarkan musik di dunia (Tzanekatis 2002). http://allmusic.com mengelompokan genre musik ke dalam 11 genre utama, yaitu pop/rock, jazz, r&b, rap, country, blues, elektronik, latin, reggae, internasional, dan klasik. Digitalisasi Gelombang Audio Gelombang audio merupakan gelombang longitudinal yang merambat melalui medium seperti medium padat, cair, atau gas. Gelombang suara merupakan gelombang analog yang apabila diolah menggunakan peralatan elektronik, gelombang tersebut harus melalui tahap digitalisasi sehingga gelombang tersebut berupa data digital.
1
Dalam proses digitalisasi audio, gelombang audio melalui dua tahap proses yaitu sampling dan kuantisasi (Jurafsky & Martin 2000). Sampling merupakan proses pengambilan nilai dalam jangka waktu tertentu. Nilai yang dimaksud adalah amplitudo, yaitu besarnya volume suara pada suatu waktu. Proses sampling menghasilkan sebuah vektor yang menyatakan nilai β nilai hasil sampling. Vektor tersebut mempunyai panjang yang bergantung pada lamanya sinyal dan sampling rate yang digunakan. Sampling rate sendiri adalah banyaknya nilai yang diambil setiap detiknya. Untuk mengukur panjang vektor sinyal, digunakan rumus beikut:
Sinyal Kontinu
Frame Blocking
frame
Windowing
Fast Fourier Transform
π = πΉπ Γ π dengan S = panjang vektor πΉπ = sampling rate (Hertz) T = panjang sinyal (detik)
spectrum Mel Frequency Wrapping
Tahap selanjutnya adalah proses kuantisasi. Kuantisasi bertujuan menyimpan nilai amplitudo ke dalam representasi nilai 8 bit atau 16 bit (Jurafsky & Martin 2000).
mel spctrum
Cepstrum
Ekstraksi Ciri Sinyal Audio Ekstraksi ciri berfungsi mengkarakterisasi sinyal audio. Beberapa fitur sinyal audio yang biasa digunakan antara lain Linear Predictive Coding, Perceptual Linear Prediction, dan MelFrequency. Proses ini dilakukan karena sinyal audio merupakan sinyal yang bervariasi yang diwaktukan dengan lambat. Jadi pada jangka waktu yang sangat pendek (5β100 ms), karakteristik sinyal tersebut hampir sama, tetapi dalam jangka waktu yang lebih panjang (0,2 detik atau lebih), karakteristik sinyal audio tersebut berubah dan memperlihatkan perbedaan sinyal audio yang diolah (Do 1994). Mel-Frequency Cepstrum Coefficient (MFCC)
mel spectrum
Gambar 1
Diagram blok proses MFCC (Do 1994)
Tahap-tahap dari proses MFCC dapat dijelaskan sebagai berikut (Do 1994): 1. Frame Blocking, proses ini membagi sinyal audio ke dalam frame. Tiap frame terdiri atas N sample. Gambar 2 menggambarkan ilustrasi dari proses frame blocking.
Tujuan dari MFCC adalah mengadapatasi kemampuan telinga manusia dalam mendengar dan mengolah suara. Proses MFCC dapat dilihat pada Gambar 1.
Gambar 2
Proses Frame Blocking
2
2. Windowing, pada tahap ini sinyal yang telah dibagi ke dalam frame dilakukan proses windowing untuk meminimalkan diskontinuitas sinyal, dengan cara meminimalkan distorsi spectral dengan menggunakan window untuk memperkecil sinyal hingga mendekati nol pada awal dan akhir tiap frame. Window yang dipakai pada proses ini adalah Hamming window dengan persamaan : π€ π = 0,54 β 0,46 πππ (2ππ/(π β 1))
4. Mel-Frequency Wrapping. Berdasarkan studi psikofisik, persepsi manusia terhadap frekuensi sinyal audio tidak berupa skala linier. Jadi untuk setiap nada dengan frekuensi aktual f (dalam Hertz) dapat diukur tinggi subjektifnya menggunakan skala βmelβ. Skala mel-frequency adalah selang frekuensi di bawah 1000 Hz, dan selang logaritmik untuk frekuensi di atas 1000 Hz. Gambar 5 mengilustrasikan filter pada proses mel- frequency wrapping.
(1) Dengan n = 1, 2, 3... N-1 (N adalah jumlah frame yang digunakan) Ilustrasi dari Hamming window dapat dilihat pada Gambar 3.
Gambar 5
Mel - frequency filter
Proses wrapping terhadap sinyal dalam domain frekuensi menggunakan persamaan berikut : πβ1
Gambar 3
Hamming window
ππ = πππ10
3. Fast Fourier Transform (FFT), merupakan fast algorithm dari Discrete Fourier Transform (DFT) yang berguna untuk konversi setiap frame dari domain waktu menjadi domain frekuensi. Berikut persamaan yang digunakan : πβ1
π₯π π β2ππππ /π
ππ = π=0
(2) dengan n=0, 1, 2 ... N-1, j adalah bilangan imajiner, yaitu j = β 1. Gambar 4 memperlihatkan sinyal yang sudah berubah ke dalam domain frekuensi.
π₯ π π»π (π) π=0
(3) dengan i= 1,2,3...,M (M adalah jumlah filter segitiga) dan Hi (k) adalah nilai filter segitiga untuk frekuensi akustik sebesar k. 5. Cepstrum, tahap ini menkonversikan log mel spectrum ke dalam domain waktu Hasil proses ini disebut mel frequency cepstrum coefficients. Berikut ini adalah persamaan yang digunakan dalam DCT : π
πΆπ =
ππ πππ (π(π β 1)/2 π =1
π ) π (4)
dengan j= 1,2,3, . . . K (K adalah jumlah koefisien yang diingankan) dan M adalah jumlah filter.
Gambar 4
Sinyal audio dalam domain frekuensi
3
Klasifikasi Klasifikasi merupakan proses menemukan sekumpulan model (atau fungsi) yang menggambarkan dan membedakan konsep atau kelas-kelas data, dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu objek atau data yang label kelasnya tidak diketahui (Han & Kamber 2001). Klasifikasi terdiri atas dua tahap, yaitu pelatihan dan prediksi (klasifikasi). Pada tahap pelatihan dibentuk sebuah model domain permasalahan dari setiap instance yang ada. Penentuan model tersebut berdasarkan analisis pada sekumpulan data pelatihan, yaitu data yang label kelasnya telah diketahui. Pada tahap klasifikasi, dilakukan prediksi kelas dari instance (kasus) baru yang telah dibuat pada tahap pelatihan (GΓΌvnir et al 1998). Jaringan Syaraf Tiruan Jaringan syaraf tiruan (JST) adalah sistem pemroses informasi yang memiliki karakteristik mirip dengan jaringan syaraf biologi. JST dibentuk sebagai generalisasi model matematika dari jaringan syaraf biologi, dengan asumsi bahwa: ο Pemrosesan informasi terjadi pada banyak elemen sederhana (neuron). ο Sinyal dikirimkan di antara neuron-neuron melalui penghubung-penghubung (sinapsis). ο Untuk menentukan output, setiap neuron menggunakan fungsi aktivasi (Jong 1992). Arsitektur jaringan syaraf tiruan disajikan pada Gambar 6.
input (Widodo 2005). Ilustrasi dari jaringan LVQ dapat dilihat pada Gambar 7.
Gambar 7
Arsitektur jaringan LVQ (Widodo 2005)
Algoritme pelatihan LVQ bertujuan memperoleh unit output yang paling dekat dengan vektor input. Bila x dan wc berasal dari kelas yang sama, maka vektor bobot didekatkan ke vektor input, tetapi apabila berasal dari kelas yang berbeda, maka vektor bobot akan dijauhkan dengan vektor input. Kelebihan dari LVQ adalah: 1. nilai error yang lebih kecil dibandingkan dengan jaringan syaraf tiruan seperti backpropagation. 2. Dapat meringkas data set yang besar menjadi vektor codebook berukuran kecil untuk klasifikasi. 3. Dimensi dalam codebook tidak dibatasi seperti dalam teknik nearest neighbour. 4. Model yang dihasilkan dapat diperbaharui secara bertahap. Kekurangan dari LVQ adalah:
Gambar 6
Arsitektur JST sederhana (Jong 1992)
Learning Vector Quantization (LVQ) Learning Vector Quantization (LVQ) merupakan suatu metode klasifikasi pola yang masing-masing unit output mewakili kategori atau kelas tertentu. Vektor bobot untuk unit output sering disebut vektor referensi untuk kelas yang dinyatakan oleh unit tersebut. LVQ mengklasifikasikan vektor input dalam kelas yang sama dengan unit output yang memiliki vektor bobot yang paling dekat dengan vektor
1. Dibutuhkan perhitungan jarak untuk seluruh atribut. 2. Akurasi model dangan bergantung pada inisialisasi model serta parameter yang digunakan (learning rate, iterasi, dan sebagainya). 3. Akurasi juga dipengaruhi distribusi kelas pada data training. 4. Sulit untuk menentukan jumlah codebook vektor untuk masalah yang diberikan. Algoritme LVQ Berikut ini adalah algoritme dari LVQ : ο· ο· ο·
Diinisialisasikan nilai bobot, maksimum epoch, dan learning rate, Nilai input (m,n), dan kelas target dimasukkan ke dalam vector (1,n) Selama kondisi berhenti bernilai salah, dilakukan :
4
a. b. c.
Untuk masing-masing pelatihan vektor input x Dicari j sehingga ||x-wj|| bernilai minimum Perbaiki wj dengan : 1. Jika T = cj maka wj baru =wj lama + Ξ± x-wj lama
Informasi tersebut didapatkan dari buku, jurnal, internet dan artikel-artikel yang membahas klasifikasi genre musik. Mulai
Studi Pustaka
Perumusan Masalah
2. Jika T β cj wj baru =wj lama Ξ± x-wj lama d. e.
Data Musik
Learning rate dikurangi Kondisi berhenti dilihat
Praproses
K-fold Cross Validation Metode k-fold cross validation membagi data menjadi k-buah subset, sebanyak k-1 buah subset digunakan sebagai training set dan 1 buah set sebagai testing set (Guiterez 2000). Sebagai gambaran, pada Gambar 8 terdapat ilustrasi k-fold cross validation menggunakan 4 buah fold.
Pembagian data (K-fold cross validation)
Data Latih
Data Uji
Pelatihan
Klasifikasi
LVQ
Evaluasi
Selesai
Gambar 9 Gambar 8
Contoh cross validation dengan 4 fold
Confusion Matrix Confusion matrix mengandung informasi tentang aktual dan prediksi klasifikasi yang dilakukan oleh sistem. Hasil dari sebuah sistem sering dievaluasi menggunakan confusion matrix (Kohavi and Provost 1998).
METODE PENELITIAN Penelitian ini melalui beberapa tahapan proses. Tahapan proses yang dilakukan dalam penelitian ini disajikan pada Gambar 9. Studi Pustaka Pada tahap ini, kegiatan yang dilakukan adalah mengumpulkan semua informasi atau literatur yang terkait dalam penelitian.
Metodologi penelitian
Perumusan Masalah Pada tahap ini dilakukan analisis terhadap permasalahan seperti pemilihan data musik, pemilihan bagian yang akan dijadikan data latih dan data uji. Data Musik Data yang digunakan pada penelitian ini berjumlah 80 buah data yang dibagi ke dalam 4 buah genre yaitu, keroncong, jazz, klasik, dan rock, (masingβmasing genre terdiri atas 20 buah lagu). Penulis menggunakan 4 buah genre dikarenakan penelitian ini dimaksudkan sebagai model awal penelitian klasifikasi genre musik. Setelah data dikumpulkan proses selanjutnya adalah memotong durasi dari tiap lagu secara random, menjadi 5, 10, 20 dan 25 detik dengan menggunakan software Audacity.
5
Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode MFCC. Beberapa parameter MFCC yang digunakan pada penelitian ini adalah, sampling rate sebesar 11000 Hz, jumlah data tiap frame sebanyak 512, dan jumlah cepstral coefficient sebesar 13. Pembagian Data Uji dan Data Latih Untuk pembagian data uji dan data latih digunakan metode k-fold cross validation yang akan membagi data ke dalam subset-subset sesuai jumlah fold yang digunakan. Fold yang dipakai pada penelitian ini berjumlah 2 hingga 10 fold. Pelatihan Input layer merupakan matriks hasil ekstraksi ciri menggunakan MFCC yang dibagi menggunakan k-fold cross validation dengan target kelas pada masing-masing lagu yaitu kelas 1 untuk genre keroncong, kelas 2 untuk genre jazz, kelas 3 untuk genre klasik dan kelas 4 untuk genre rock. Jaringan LVQ yang dibentuk menggunakan 4 neuron sesuai dengan banyaknya genre dalam penelitian. Parameter lain yang digunakan adalah learning rate, learning rate yang dipilih adalah 0.01. Pengujian Proses pengujian dilakukan dengan menguji data yang telah dibagi ke dalam matriks data uji menggunakan metode k-fold cross validation. Data uji tersebut kemudian diuji menggunakan fungsi sim dari Matlab. Fungsi ini menghitung jarak data yang diuji menggunakan model JST hasil pelatihan menggunakan jarak eucllidean. Evaluasi Evaluasi merupakan proses untuk melihat apakah proses klasifikasi sudah tepat atau belum. Pada proses ini akan dilihat apakah tiaptiap lagu yang diuji apakah sudah masuk ke dalam kelas yang tepat atau belum. Hasil klasifikasi dapat dilihat dalam sebuah confusion matrix yang di dalamnya terdapat jumlah dari data yang masuk ke dalam kelas yang benar dan kelas yang salah.
i. Perangkat Keras ο· Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz. ο· Memori 1 GB. ο· Harddisk 80 GB. ο· Keyboard dan mouse. ο· Monitor. ο· Speaker. ii. Perangkat Lunak ο· Sistem operasi Professional. ο· Matlab 7.R2008b. ο· Audacity 1.2.6.
Windows
XP
Pada tahap pengujian, spesifikasi perangkat keras dan lunak yang digunakan adalah: i. Perangkat Keras ο· Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz ο· Memori 1 GB. ο· Harddisk 80 GB. ο· Keyboard dan mouse. ο· Monitor. ii. Perangkat Lunak ο· Sistem operasi Professional. ο· Matlab 7.R2008b.
Windows
XP
HASIL DAN PEMBAHASAN Data Musik Penelitian ini menggunakan 80 buah lagu berformat mp3 yang sebelumnya telah diketahui jenis genre dari lagu tersebut. Genre musik yang digunakan adalah keroncong, jazz, klasik, dan rock dengan masingβmasing 20 buah lagu untuk setiap genre. Judul dari lagu yang digunakan untuk penelitian dapat dilihat pada Lampiran 1. Data tersebut kemudian disesuaikan panjang durasinya menjadi 5, 10, 20, dan 25 detik untuk selanjutnya diubah chanel-nya menjadi mono. Pemilihan 4 macam durasi tersebut bertujuan membandingkan durasi mana yang menghasilkan akurasi tertinggi. Gambar 10, 11, 12, dan 13 memperlihatkan grafik gelombang audio yang dipergunakan pada penelitian.
Lingkungan Pengembangan Untuk tahap pelatihan, penelitian ini diimplementasikan menggunakan spesifikasi perangkat keras dan lunak sebagai berikut:
6
sampling rate sebesar 11000 Hz, banyaknya data dalam satu frame sebanyak 512 data. Parameter ini dipilah berdasarkan parameter yang digunakan pada penelitian Prameswari (2010), apabila nilai sampling rate ditambah maka data yang diambil dalam satu detik semakin banyak dan semakin mendekati sinyal asli, tetapi waktu proses juga akan semakin panjang. Gambar 14 mengilustrasikan sinyal audio yang digunakan dengan sampling rate sebesar 11000 Hz dengan contoh dari data berdurasi 5 detik. Gambar 10 Grafik durasi 5 detik
Ganbar 11
Grafik durasi 10 detik Gambar 14
Gambar 12
Grafik durasi 20 detik
Gambar 13
Grafik durasi 25 detik
Sinyal audio
Sinyal audio tersebut kemudian dilakukan proses frame blocking yang membagi data ke dalam beberapa frame. Overlap antar frame yang digunakan sebesar 94% dikarenakan overlap sebesar 94% menghasilkan akurasi yang paling optimal. Pada awal penelitian overlap antar frame yang digunakan sebesar 50% seperti pada penelitian Prameswari (2010), namun akurasi yang dihasilkan hanya berkisar 65% sehingga digunakan overlap sepanjang 94%. Hasil proses frame blocking dapat dilihat pada Gambar 15.
Praproses
Gambar 15
Data musik yang telah disesuaikan panjang durasinya dilakukan proses ekstraksi ciri menggunakan metode MFCC. Parameter yang digunakan dalam proses MFCC antara lain,
Proses selanjutnya adalah proses windowing masing-masing frame, fungsi window yang digunakan adalah Hamming window. Gambar
Hasil frame blocking
7
16 mengilustrasikan hasil dari proses windowing. Hasil praproses untuk genre klasik, rock dan keroncong disajikan pada Lampiran 2.
Gambar 16
Gambar 19
Hasil ekastraksi ciri untuk genre klasik
Gambar 20
Hasil ekstraksi ciri untuk genre rock.
Hasil proses windowing
Kemudian dilakukan proses mel-frequency wrapping. Pada proses ini diperlukan beberapa filter yang saling overlap dalam domain frequensi. Selanjutnya hasil dari proses Melfrequency wrapping dilakukan proses konversi log mel spectrum ke dalam domain waktu. Hasil dari proses ini disebut mel frequency cepstrum coefficient. Hasil proses ini disajikan pada Gambar 17, 18, 19 dan 20.
Pelatihan dan Pengujian
Gambar 17
Hasil ekstraksi ciri untuk genre jazz
Gambar 18
Hasil ekstraksi ciri untuk genre keroncong
Setelah dilakukan proses ekstraksi ciri, selanjutnya dilakukan proses pembagian data menggunakan metode k-fold cross validation. Data yang akan dilakukan percobaan berupa sebuah matriks berukuran banyaknya sample dalam satu data dikali banyaknya data yaitu 80 buah lagu. Pada baris terakhir disisipkan kelas dari data tersebut sebagai inputan untuk pelatihan menggunakan LVQ. Untuk pelatihan paramater-parameter yang digunakan antara lain, jumlah folds, epoch, dan learning rate. Dalam penelitian ini jumlah epoch yang digunakan sebanyak 1000 epoch, tetapi proses pelatihan akan dihentikan ketika error rate pada pelatihan sudah stabil meskipun belum mencapai jumlah epoch maksimum. Learning rate yang digunakan adalah 0.01, nilai ini digunakan karena nilai ini yang menghasilkan error rate yang paling kecil. Ketika nilai learning rate ditambah proses pelatihan akan semakin cepat, tetapi berimbas pada error rate yang semakin besar. Sedangkan apabila
8
learning rate lebih rendah rendah dari 0.01 proses pelatihan akan semakin lambat tetapi error rate yang dihasilkan tidak lebih baik dari nilai learning rate sebesar 0.01. Jumlah fold yang digunakan berjumlah 2 hingga 10 fold. Setiap pembagian menghasilkan 2 buah matriks, satu matriks untuk data latih dan matriks lainnya untuk data uji. Pelatihan menggunakan LVQ menggunakan data dari matriks data latih hasil pembagian metode k-fold cross validation. Hasil dari pelatihan ini adalah sebuah model jaringan syaraf tiruan yang di dalamnya terdapat matriks hasil pelatihan berukuran banyaknya target dari data yang dilatih. Tabel 1 menyajikan hasil klasifikasi tiap fold. Tabel 1 Durasi
5
Durasi
10
Durasi
20
Durasi 20
Durasi
25
Akurasi pengujian tiap fold Fold
Akurasi
2
88,7 %
3
91,02%
4
90%
5
90%
6
88,75%
7
88,75%
8
88,75%
9
87,5%
10
88,75%
Fold
Akurasi
2
87,5%
3
92,5%
4
93,75%
5
90%
6
90%
7
90%
8
88,75%
9
90%
10
92,5%
Fold
Akurasi
2
66,25%
3
67,5%
4
68,75%
5
65%
6
68%
Fold
Akurasi
7
65%
8
65%
9
70,8%
10
68,75%
Fold
Akurasi
2
61,25%
3
65%
4
67,5%
5
63,75%
6
63,75%
7
65%
8
65%
9
67,5%
10
66,25%
Dari hasil percobaan dapat dilihat bahwa akurasi tertinggi didapatkan dari percobaan dengan durasi 5 dan 10 detik, dengan akurasi masingβmasing 90%. Sedangkan percobaan dengan hasil akurasi terendah yaitu sebesar 65% didapatkan dari data dengan durasi sepanjang 25 detik. Berdasarkan percobaan dapat dilihat bahwa percobaan menggunakan 4-fold menghasilkan nilai akurasi tertinggi dari tiap panjang durasi. Hasil klasifikasi genre musik dengan 4-fold dapat dilihat pada Tabel 2, 3, 4, dan 5. Tabel 2
Kelas
Hasil klasifikasi data berdurasi 5 detik Jumlah Data Tiap Kelas
Tingkat Akurasi
1
2
3
4
1
18
0
1
1
90%
2
0
20
0
0
100%
3
5
0
14
1
70%
4
0
0
0
20
100%
Rata-rata
90%
9
Tabel 3
Kelas
Hasil klasifikasi data berdurasi 10 detik Jumlah Data Tiap Kelas
Tingkat Akurasi
1
2
3
4
1
18
0
1
1
90%
2
0
20
0
0
100%
3
2
0
18
0
90%
4
1
0
0
19
95% 93,75%
Rata-rata Tabel 4
Kelas
Hasil klasifikasi data berdurasi 20 detik Jumlah Data Tiap Kelas
Tingkat Akurasi
1
2
3
4
1
16
2
1
1
80%
2
10
7
0
3
35%
3
3
3
14
0
70%
4
1
1
0
18
90% 65%
Rata-rata Tabel 5
Kelas
Hasil klasifikasi data berdurasi 25 detik Jumlah Data Tiap Kelas
Tingkat Akurasi
1
2
3
4
1
16
2
1
1
80%
2
12
6
0
2
30%
3
2
4
14
0
70%
4
1
1
0
18
90%
Rata-rata
67,5%
Kelas 1 pada Tabel 2, 3, 4 ,dan 5 mewakili genre keroncong, kelas 2 mewakili genre jazz, kelas 3 mewakili genre keroncong, dan kelas 4 mewakili genre rock. Hasil klasifikasi untuk data dengan durasi 5 detik disajikan pada Tabel 2. Dari Tabel 2 dapat dilihat untuk genre dengan kelas 2 dan 4 yaitu genre jazz dan rock memiliki tingkat akurasi hingga 100%. Untuk genre keroncong tingkat akurasinya adalah 90% atau sebanyak 18 buah data diklasifikasikan ke kelas
yang benar sedangkan dua buah data yang salah diklasifikasikan ke dalam kelas klasik (3) dan rock (4). Hasil akurasi yang paling rendah adalah genre klasik dengan tingkat akurasi sebesar 70%, sebanyak 5 buah data dari genre klasik diklasifikasikan ke dalam kelas keroncong dan 1 buah diklasifikasikan ke dalam genre rock. Untuk data dengan durasi 10 detik akurasi tertinggi dimiliki oleh genre jazz dengan akurasi sebesar 100 % seperti disajikan pada Tabel 3. Selanjutnya genre rock meiliki tingkat akurasi sebesar 95% jadi hanya satu data yang salah diklasifikasikan ke dalam kelas keroncong, sementara genre keroncong dan klasik memiliki akurasi yang sama yaitu 90%. Pada genre keroncong 1 data diklasifikasikan ke dalam kelas klasik dan satu lagu ke dalam kelas rock. Sementara untuk genre klasik 2 data yang salah diklasifikasikan ke dalam kelas rock. Data dengan akurasi sepanjang 20 detik mengalami penurunan tingkat akurasi. Akurasi tertinggi yang pada durasi 10 dan 5 sebesar 100% kini hanya 90% yang dimiliki oleh genre rock seperti yang terlihat pada Tabel 4 dua data yang salah masuk ke dalam kelas keroncong dan jazz. Genre keroncong menghasilkan akurasi sebesar 80% dimana ada 4 buah data yang salah diklasifikasikan, 2 data diklasifikasikan sebagai kelas jazz, 1 data untuk klasik dan satu lagi untuk jazz. Genre klasik menghasilkan tingkat akurasi masing sebesar 70%, 3 buah data salah diklasifikasikan ke dalam genre keroncong dan 3 data lainya ke dalam genre jazz. Hasil akurasi terendah adalah genre jazz sebesar 35%, pada genre jazz sebanyak 10 data atau 50% dari keseluruhan diklasifikasikan ke dalam genre keroncong dan 3 lainya diklasifikasikan ke dalam genre rock . pada durasi 20 detik genre klasik lebih banyak diklasifikasikan ke dalam genre keroncong dikarenakan jarak hasil perhitungan jarak genre keroncong lebih dekat kepada genre keroncong. Penyebab lain adalah semakin panjangnya durasi, semakin banyak juga vektor yang dilakukan perhitungan sehingga membuat genre klasik lebih dekat kepada genre keroncong. Hasil klasifikasi dengan durasi 25 detik tidak terlalu berbeda jauh dengan yang dihasilkan pada data dengan durasi 20 detik. Seperti terlihat pada Tabel 5, akurasi tertinggi masih dipegang oleh genre rock dengan akurasi sebesar 90%, sebanyak 18 data diklasifikasikan benar, 1 data diklasifikasikan sebagai kelas keroncong dan 1 data lagi diklasifikasikan ke dalam kelas jazz. Genre keroncong dengan
10
akurasi sebesar 80% dengan 2 data diklasifikasikan sebagai kelas jazz, 1 data diklasifikasikan sebagai kelas klasik dan 1 data sebagai kelas rock. Genre klasik dengan akurasi 70% dengan 2 buah data diklasifikasikan sebagai kelas keroncong dan 4 buah data diklasifikasikan sebagai kelas jaz. Genre jazz menghasilkan akurasi sebesar 30%, sebanyak 12 data diklasifkasikan salah ke dalam kelas keroncong dan 6 buah data diklasifikasikan sebagai kelas jazz. Hal ini disebabkan oleh jarak vector sampel dari genre klasik lebih dekat kepada genre keroncong. Untuk lebih jelasnya Lampiran 3 menampilkan hasil klasifikasi secara lengkap. Klasifikasi dengan durasi 20 dan 25 sekon mempunyai hasil yang lebih rendah dibandingkan klasifikasi dengan durasi 5 dan 10 sekon. Hal tersebut dikarenakan semakin panjang durasi semakin banyak pula vektor yang dihitung sehingga mempengaruhi hasil dari perhitungan jarak yang menyebabkan proses pelatihan tidak menghasilkan codebook vector yang sesuai. Untuk waktu pelatihan disajikan pada Gambar 21 , data dengan durasi 5 detik memakan waktu 30 menit, durasi 10 detik memakan waktu 45 menit, durasi 20 memakan waktu 120 menit, dan durasi 25 detik memakan waktu 150 menit.
10 detik memiliki tingkat akurasi tertinggi. Hasil penelitian ini lebih tinggi dari penelitian Taluput et al (2002) yang menghasilkan akurasi sebesar 80%. Kecenderungan pengaruh penambahan durasi terhadap penurunan durasi terlihat pada data dengan durasi 10 dan 20 yang detik mengalami penurunan tingkat akurasi dari 93,75% menjadi 65%. Saran Saran yang penulis dapat berikan untuk penelitian selanjutnya yang berkaitan antara lain: 1. Penelitian ini hanya menggunakan 4 buah genre musik dari genre musik utama. Pada penelitian selanjutnya diharapkan menggunakan genre musik yang lebih beragam dan berasal dari sub genre. 2. Durasi yang digunakan pada penelitian ini adalah 5, 10, 20 dan 25 dan chanel yang digunakan adalah chanel mono. Diharapkan pada penelitian selanjutnya menggunakan durasi yang lebih beragam dan chanel stereo. 3. Untuk pengujian diperhatikan aspek distribusi, jadi tidak hanya dilihat dari jarak data uji terhadap codebook vector.
DAFTAR PUSTAKA 200
150 120
150 100 30
45
5 Sekon
10 Sekon
50 0
Gambar 21
Grafik proses
20 Sekon
25 Sekon
perbandingan
waktu
KESIMPULAN DAN SARAN Kesimpulan Dari hasil percobaan yang dilakukan didapatkan, penelitian ini telah berhasil mengimplementasikan metode MFCC dan LVQ dalam membuat model codebook vector dan melakukan klasifikasi genre musik dengan akurasi sebesar 90% untuk durasi 5 detik, 93,75% untuk durasi 10 detik, 65 untuk durasi 20 detik dan 93,75% untuk durasi 25 detik. Dari hasil percobaan dapat disimpulkan bahwa durasi
Campbell,Jr JP. 1997. Speaker Recognition: A Tutorial. Procedding IEEE, Vol 85 No.9, September 1997. Do MN. 1994. Digital Signal Processing MiniProject: An Automatic Speaker Recognition System. Audio Visual Communication Laboratory, Swiss Federal Institute of technology, Laussanne,Switzerland. Fausett L. 1994. Fundamental of Neural Network Architectures, Algorithm, and Applications. New Jersey: Prentice Hall. Han J, Kamber M. 2001. Data Minning Concepts & Techniques. USA: Academic Press Prameswari. 2010. Pengembangan Sistem Pengenalan Kata Berbasiskan Fonem dalam Bahasa Indonesia dengan Metode Resilent Backpropagation. [Skripsi]. Bogor: Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor.
11
Suhartono MN. 2007. Pengembangan Model Identifikasi Pembicara dengan Probabilistic Neural Network. [Skripsi]. Bogor: Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor. Talupur M, Suman N, Yan H. 2002. Classification of Music Genre. Computer Science Department. Carnegie Mellon University. Widodo TN. 2005. Sistem Neuro Fuzzy. Graha Ilmu, Yogyakarta. Wisnudisastra E. 2010. Pengenalan Chord Pada Alat Musik Gitar Menggunakan Codebook Dengan Teknik Ekstraksi Ciri MFCC. [Skripsi]. Bogor: Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor.
12
LAMPIRAN
Lampiran 1 Daftar lagu yang digunakan pada penelitian 1 Daftar lagu jazz yang digunakan pada penelitian Data
Judul Lagu
jazz01
John Scofield β I Donβt Need No Doctor
jazz02
Shakatak ft Al Jarreau β Day By Day
jazz03
Jeffrey Osbourne β Eenie Meenie
jazz04
Gino Vannelli β I Just Wanna Stop
jazz05
Lee Ritenour β Every Little Thing She Does Is
jazz06
Sergio Mendes β Rainbowβs End
jazz07
Richard Bona β Bona Petit
jazz08
Brian Culberston β Itβs On Tonight
jazz09
Oleta Adams β Get Here
jazz10
Madeleine Peyroux β Dance Me To The End Of Love
jazz11
Peter Cincotti β Some Kind Of Wonderful
jazz12
Don't know why
jazz13
Gwyneth Herbert β Only Love Can Break
jazz14
Mozart 40
jazz15
Turkish Dance
jazz16
Piano Concerto
jazz17
Hungarian Dance
jazz18
Fur Elise
jazz19
Melody In F
jazz20
All of Me
2 Daftar lagu klasik yang digunakan pada penelitian Data klasik01 klasik02 klasik03 klasik04 klasik05 klasik06 klasik07 klasik08 klasik09 klasik10 klasik11 klasik12 klasik13 klasik14 klasik15 klasik16 klasik17
Judul Lagu Symphony No.15 [G Major] I. Allegro Symphony No.15 [G Major] II. Andante Symphony No.15 [G Major] III. Menuetto Symphony No.15 [G Major] IV. Presto Symphony No.16 [C Major] I. Allegro maestoso Symphony No.16 [C Major] II. Andante grazioso Symphony No.16 [C Major] III. Rondo-Allegro Symphony No.17 [G Major] I. Allegro Symphony No.17 [G Major] II. Andante Symphony No.17 [G Major] III. Allegro Symphony No.18 [F Major] I. Allegro Symphony No.18 [F Major] II. Andantino grazioso Symphony No.18 [F Major] III. Menuetto Symphony No.18 [F Major] IV. Molto allegro Symphony No.24 [B-flat Major] I. Allegro spiritoso Symphony No.24 [B-flat Major] II. Andantino grazioso Symphony No.24 [B-flat Major] III. Allegro
14
Lampiran 1 Lanjutan Data
Judul Lagu
klasik18
Symphony No.26 [E-flat Major] I. Molto Presto
klasik19
Symphony No.26 [E-flat Major] II. Andante
klasik20
Symphony No.26 [E-flat Major] III. Allegro
3 Daftar lagu keroncong yang digunakan pada penelitian Data
Judul Lagu
keroncong23
Gesang - Sebelum Aku Mati
keroncong02
Rayuan Pulau Kelapa
keroncong24
Seto Ohasi
keroncong04
Aryati
keroncong05
Dibawah Sinar Bulan
keroncong25
Tembok Besar
keroncong07
Mus mulyadi-Hatimu Hatiku
keroncong08
Saputangan
keroncong09
Mus mulyadi- Hota Holo
keroncong10
Layu sebelum berkembang
keroncong11
Sudah Jauh
keroncong26
Borobudur
keroncong27
Bumi Emas Tanah Airku
keroncong14
Sepasang Mata Bola
keroncong15
Hetty Koes Endang- Tinggal Kenangan
keroncong16
Jenang Gulo
keroncong17
Kesumaning Ati
keroncong18
Bengawan Solo
keroncong19
Keroncong Telomoyo
keroncong20
Kalung Mutiara
4 Daftar lagu roock yang digunakan pada penelitian Data
Judul Lagu
rock01
Avenged 7 Vold - Almost Easy
rock02
Alter Bridge - Open Your Eyes
rock03
Alter Bridge - Broken Wings
rock04
Dragon Force β Rising Force
rock05
Foo Fighter - Learn To Fly
rock06
Incubus - Megalomaniac
rock07
Motor Head - Enter A Sandman
15
Lampiran 1 Lanjutan Data
Judul Lagu
rock08
Metallica - I Disepear
rock09
Korn - Word Up
rock10
Linkin Park - In The End
rock11
Linkin Park - One Step Closer
rock12
Quenn - We Are The Champion
rock13
Andra - Kepayang
rock14
Andra - Muak
rock15
J-Rock - Meraih Mimpi
rock16
St. Loco - Microphone Anthem
rock17
St. Loco - Terapi Energi
rock18
Seurieus - Kapan Ku Punya Pacar
rock19
Seuriues - Musik Jazz
rock20
Pas Band - Yesterday
16
Lampiran 2 Proses MFCC 1 Sinyal Lagu Keroncong
2 Hasil Framming Lagu Keroncong
3 Hasil Windowing Lagu Keroncog
17
Lampiran 2 Lanjutan 4 Sinyal Lagu Klasik
5 Hasil Framming Lagu Klasik
6
Hasil Windowing Lagu Klasik
18
Lampiran 2 Lanjutan 7 Sinyal Lagu Rock
8 Hasil Framming Lagu Rock
9
Hasil Windowing Lagu Rock
19
Lampiran 3 Hasil klasifikasi 1 Hasil klasifikasi untuk genre keroncong
Durasi (detik)
Data 5
10
20
25
keroncong01
1
1
1
1
keroncong02
1
1
1
1
keroncong03
1
1
1
1
keroncong04
1
1
1
1
keroncong05
1
1
1
1
keroncong06
1
1
1
1
keroncong07
1
1
1
1
keroncong08
1
1
1
1
keroncong09
1
1
1
1
keroncong10
1
1
1
1
keroncong11
1
1
1
1
keroncong12
1
1
1
1
keroncong13
1
1
1
1
keroncong14
3
3
3
3
keroncong15
1
1
1
1
keroncong16
4
4
4
4
keroncong17
1
1
2
2
keroncong18
1
1
1
1
keroncong19
1
1
1
1
keroncong20
1
1
2
2
Keterangan : 1 = Keroncong 2 = Jazz 3 = Klasik 4 = Rock
20
Lampiran 3 Lanjutan 2 Hasil klasifikasi untuk genre Jazz Durasi (detik)
Data 5
10
20
25
jazz01
2
2
1
1
jazz02
2
2
4
1
jazz03
2
2
4
4
jazz04
2
2
1
1
jazz05
2
2
2
2
jazz06
2
2
4
4
jazz07
2
2
1
1
jazz08
2
2
2
2
jazz09
2
2
2
2
jazz10
2
2
2
2
jazz11
2
2
2
1
jazz12
2
2
1
1
jazz13
2
2
1
1
jazz14
2
2
1
1
jazz15
2
2
2
2
jazz16
2
2
4
4
jazz17
2
2
1
1
jazz18
2
2
2
2
jazz19
2
2
1
1
jazz20
2
2
1
1
Keterangan : 1 = Keroncong 2 = Jazz 3 = Klasik 4 = Rock
21
Lampiran 3 Lanjutan 3 Hasil klasifikasi untuk genre klasik Durasi (detik)
Data 5
10
20
25
klasik01
3
3
3
3
klasik02
3
3
3
3
klasik03
3
3
3
3
klasik04
3
3
3
3
klasik05
1
1
1
1
klasik06
3
3
3
3
klasik07
1
3
3
3
klasik08
1
3
2
2
klasik09
3
3
3
3
klasik10
3
3
3
3
klasik11
3
3
3
3
klasik12
3
3
3
3
klasik13
3
3
1
3
klasik14
3
3
3
3
klasik15
1
1
2
2
klasik16
3
3
3
3
klasik17
3
3
3
1
klasik18
1
3
1
1
klasik19
3
3
3
3
klasik20
2
3
2
2
Keterangan : 1 = Keroncong 2 = Jazz 3 = Klasik 4 = Rock
22
Lampiran 3 Lanjutan 4 Hasil klasifikasi untuk genre rock Durasi (detik)
Data 5
10
20
25
rock01
4
4
4
4
rock02
4
4
4
4
rock03
4
4
4
4
rock04
4
4
4
4
rock05
4
4
4
4
rock06
4
4
4
4
rock07
4
4
4
4
rock08
4
1
1
1
rock09
4
4
4
4
rock10
4
4
4
4
rock11
4
4
4
4
rock12
4
4
2
2
rock13
4
4
4
4
rock14
4
4
4
4
rock15
4
4
4
4
rock16
4
4
4
4
rock17
4
4
4
4
rock18
4
4
4
4
rock19
4
4
4
4
rock20
4
4
4
4
Keterangan : 1 = Keroncong 2 = Jazz 3 = Klasik 4 = Rock
23