TESIS
REKAYASA SISTEM PENGELOMPOKAN MUSIK TERHADAP SUASANA HATI DENGAN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR DAN K-MEANS
I GEDE HARSEMADI NIM 1191761015
PROGRAM PASCA SARJANA UNIVERSITAS UDAYANA DENPASAR 2016 i
TESIS
REKAYASA SISTEM PENGELOMPOKAN MUSIK TERHADAP SUASANA HATI DENGAN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR DAN K-MEANS
I GEDE HARSEMADI NIM 1191761015
PROGRAM MAGISTER PROGRAM STUDI MANAJEMEN SISTEM INFORMASI DAN KOMPUTER PROGRAM PASCA SARJANA UNIVERSITAS UDAYANA DENPASAR 2016 ii
REKAYASA SISTEM PENGELOMPOKAN MUSIK TERHADAP SUASANA HATI DENGAN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR DAN K-MEANS
Tesis untuk Memperoleh Gelar Magister pada Program Magister, Program Studi Manajemen Sistem Informasi dan Komputer Program Pascasarjana Universitas Udayana
I GEDE HARSEMADI NIM 1191761015
PROGRAM MAGISTER PROGRAM STUDI MANAJEMEN SISTEM INFORMASI DAN KOMPUTER PROGRAM PASCA SARJANA UNIVERSITAS UDAYANA DENPASAR 2016 iii
Lembar Persetujuan Pembimbing
TESIS INI TELAH DISETUJUI PADA TANGGAL 21 Juli 2016
Pembimbing I,
Pembimbing II,
Dr. Ir. Made Sudarma, M.A.Sc. NIP. 196512311993031189
Nyoman Pramaita, ST., MT., PhD. NIP. 197104091997021004
Mengetahui,
Ketua Program Magister Teknik Elektro Program Pascasarjana Universitas Udayana
Direktur Program Pascasarjana Universitas Udayana
Prof. Ir. I.A. Dwi Giriantari, M.Eng.Sc., PhD. NIP. 196512131991032001
Prof. Dr. dr. A.A Raka Sudewi, Sp.S (K) NIP. 195902151985102001
iv
Tesis Ini Telah Diuji pada Tanggal 15 Juli 2016
Panitia Penguji Tesis Berdasarkan SK Rektor Universitas Udayana, No.: 194/UN14.4/TU/TE/2016 Tanggal 11 Juli 2016
Ketua
: Dr. Ir. Made Sudarma, M.A.Sc.
Anggota
: 1. Nyoman Pramaita, ST., MT., PhD. 2. Prof. Ir. Rukmi Sari Hartati, MT., PhD. 3. I Nyoman Satya Kumara, ST., MSc., PhD. 4. Dr. Nyoman Gunantara, ST., MT.
v
SURAT PERNYATAAN BEBAS PLAGIAT
Saya yang bertanda tangan dibawah ini : Nama
: I Gede Harsemadi
NIM
: 1191761015
Program Studi
: Magister Teknik Elektro
Judul Tesis
: Rekayasa Sistem Pengelompokan Musik Terhadap Suasana Hati dengan Menggunakan Algoritma K-Nearest Neighbor dan K-Means
Dengan ini menatakan bahwa karya ilmiah Tesis ini bebas plagiat. Apabila di kemudian hari terbukti plagiat dalam karya ilmiah ini, maka saya bersedia menerima sanksi sesuai peraturan Mendiknas RI No. 17 tahun 2010 dan Peraturan Perundang-undangan yang berlaku.
Denpasar, 15 Juli 2016 Yang membuat pernyataan,
I Gede Harsemadi
vi
UCAPAN TERIMAKASIH
Segenap puja dan puji syukur penulis panjatkan kehadapan Ida Sang Hyang Widhi Wasa sebagai sumber dari segala sumber pengetahuan, karena atas asung kertha wara nugrahaNya Tesis yang berjudul “Rekayasa Sistem Pengelompokan Musik Terhadap Suasana Hati dengan Menggunakan Algoritma K-Nearest Neighbor dan K-Means ini dapat diselesaikan. Pada kesempatan ini perkenankanlah penulis mengucapkan terima kasih yang sebesar-besarnya kepada Bapak Dr. Ir. Made Sudarma, M.A.Sc., selaku Dosen Pembimbing I yang telah banyak membantu dalam memberikan ide, saran dan motivasi. Terimakasih yang sebesar-besarnya pula kepada penulis sampaikan kepada Nyoman Pramaita, ST., MT., PhD. selaku Dosen Pembimbing II yang telah memberikan bimbingan dan arahan dalam penyelesaian Tesis ini. Ucapan yang sama juga ditujukan kepada Direktur Program Pascasarjana Universitas Udayana yaitu Prof. Dr. dr. A.A. Raka Sudewi, Sp.S(K) atas kesempatan yang diberikan kepada penulis untuk dapat menjadi Mahasiswa pada program Pascasarjana Universitas Udayana, serta ucapan terima kasih kepada Prof. Ir. Ida Ayu Dwi Giriantari, M.Eng.Sc., PhD. sebagai Ketua Program Magister Program Studi Teknik Elektro Program Pascasarjana Universitas Udayana. Penulis juga menyampaikan terima kasih yang sebesar-besarnya kepada Bapak, Ibu, Istri dan Anak-Anak tercinta serta seluruh keluarga yang telah banyak memberikan bantuan, dorongan dan semangat untuk menyelesaikan Tesis ini. Penulis juga ucapkan terima kasih kepada Bapak/Ibu Dosen di P.S Teknik Elektro Universitas Udayana dan Civitas Akademika STMIK STIKOM Bali serta berbagai pihak yang tidak mungkin disebutkan satu persatu, yang dengan semangat sudah memberikan dorongan untuk mengikuti dan menyelesaikan pendidikan program Magister ini. Semoga Ida Sang Hyang Widhi Wasa/ Tuhan Yang Maha Kuasa selalu melimpahkan rahmat-Nya kepada semua pihak yang sudah penulis sebutkan maupun yang belum penulis sebutkan tetapi sudah berpartisipasi dan menunjukkan dedikasi serta ketulusan sangat luar biasa dalam membantu penyelesaian Tesis ini. Denpasar, Juli 2016 Penulis
vii
ABSTRAK
Musik erat kaitannya dengan psikologi manusia, kenyataan ini mengindikasikan bahwa musik dapat terkait dengan emosi dan mood/ suasana hati tertentu pada manusia. setiap musik yang telah tercipta memiliki energi emosi tersendiri yang terpancar maka dari itu mulai banyak penelitian yang telah dilakukan pada pengenalan emosi musik tersebut. Music Information Retrieval (MIR) adalah salah satu bagian dalam Data Mining dimana informasi yang akan digali dari sumber data berupa musik yang diperoleh dari dataset training dan dataset testing menggunakan referensi musik Audio Network. Penelitian ini mnghasilkan sebuah rekayasa sistem pengelompokan suasana hati terhadap musik dengan menggunakan algoritma K-NN dan K-Means dimana sistem ini memiliki 3 komponen utama yaitu komponen input, sistem pengelompokan mood musik, serta komponen output. Sistem akan menerima input data berupa file musik format mono *.wav, yang selanjutnya melakukan proses pengelompokan terhadap musik dengan mengggunakan klasifikasi K-NN dan KMeans clustering. Kemudian sistem menghasilkan output berupa jenis mood yaitu, contentment/ kepuasan, exuberance/ gembira, depression/ depresi dan anxious/ cemas; kalut. Secara umum hasil akurasi sistem dengan menggunakan algoritma klasifikasi lebih baik dibandingkan dengan algoritma clustering, diantaranya K-NN (86,55%), SVM (63,95%), ID3 (59,33%) dan K-Means (24,51%). Serta waktu pemrosesan data berurut-urut K-NN (0,01021 detik), ID3 (0,05091 detik), SVM (0,14118 detik) dan K-Means (0,1425 detik). Kata Kunci : Musik, Mood, Klasifikasi, K-NN, K-Means
viii
ABSTRACT
Music is closely related to human psychology, this fact indicates that music can be associated with emotion and mood / certain mood in humans. any music that has been created has its own emotional energy is shown, therefore started a lot of research has been done on the introduction of the emotion of the music. Music Information Retrieval (MIR) is one piece in the Data Mining where the information will be extracted from the data source in the form of music derived from the training dataset and testing dataset using musical references Audio Network. This study builds systems engineering grouping mood to music using K-NN algorithm and K-Means where the system has three main components, namely input components, systems grouping mood music, and component outputs. The system will receive input data including music files mono * .wav format, which then do the grouping of music by using a classification K-NN and K-Means clustering. Then the system to produce output that kind of mood, contentment, Exuberance, depression and anxious. As the results of system accuracy by using a classification algorithm is better than the clustering algorithm, among K-NN (86,55%), SVM (63,95%), ID3 (59,33%) and K-Means (24,51%). As well as the data processing time in K-NN (0,01021 seconds), ID3 (0,05091seconds), SVM (0,14118 seconds) and K-Means (0,1425 seconds) Keywords : Music, Mood, Classification, K-NN, K-Means
ix
DAFTAR ISI
Lembar Persetujuan Pembimbing ................................................................... iv Tesis Ini Telah Diuji pada ................................................................................. v UCAPAN TERIMAKASIH ............................................................................. vii ABSTRAK.......................................................................................................viii ABSTRACT ...................................................................................................... ix DAFTAR ISI ...................................................................................................... x DAFTAR GAMBAR ....................................................................................... xiii DAFTAR TABEL ............................................................................................ xv BAB I PENDAHULUAN ................................................................................... 1 1.1 Latar Belakang ......................................................................................... 1 1.2 Rumusan Masalah .................................................................................... 7 1.3 Tujuan Penelitian ..................................................................................... 7 1.4 Manfaat Penelitian ................................................................................... 7 1.5 Ruang Lingkup Penelitian ....................................................................... 8 1.6 Keaslian Penelitian .................................................................................. 9 BAB II KAJIAN PUSTAKA ........................................................................... 11 2.1 State of The Art Review ........................................................................... 11 2.2 Music Information Retrieval (MIR) ........................................................ 22 2.3 Emosi dan Suasana Hati pada Musik .................................................... 22 2.3.1 Definisi Emosi ................................................................................... 23 2.3.2 Definisi Suasana Hati/ Mood ............................................................. 23 2.4 Evaluasi Model Musik Terhadap Mood ................................................ 27 2.5 Fast Fourier Transform ......................................................................... 29 2.6 Feature Extraction ................................................................................. 31 2.6.1 Spectral Centroid ............................................................................... 32 2.6.2 Spectral Skewness ............................................................................. 33 2.6.3 Spectral Rolloff ................................................................................. 33 2.6.4 Spectral Slope.................................................................................... 34 2.6.5 Spectral Kurtosis ............................................................................... 34 2.6.6 Spectral Spread .................................................................................. 34 2.6.7 Spectral Decrease .............................................................................. 35 2.6.8 Spectral Flux ..................................................................................... 35 2.6.9 Spectral Flatness ................................................................................ 35 2.7 Data Mining ............................................................................................ 36 2.8 K-Nearest Neighbor ................................................................................. 39 2.9 K-Means Clustering ................................................................................ 42 2.10 Support Vector Machine ...................................................................... 45
x
2.10.1 Karakteristik SVM ........................................................................... 46 2.10.2 Kelebihan dan Kekurangan SVM ..................................................... 47 2.10.3 Maximum Margin Hyperplanes ....................................................... 50 2.10.4 Linear Support Vector Machine ....................................................... 51 2.10.5 Nonlinier Support Vector Machine .................................................. 59 2.10.6 Multi Class SVM .............................................................................. 61 2.11 Decision Tree ........................................................................................ 62 2.10.1 Algoritma ID3 ................................................................................. 63 2.10.2 Entropy & Information Gain .......................................................... 65 2.12 Pengujian Accuracy untuk Sistem Klasifikasi ..................................... 67 2.13 Pengujian Silhouette Coefficient untuk Sistem Clustering K-Means ... 69 BAB III METODE PENELITIAN .................................................................. 71 3.1 Tempat Penelitian .................................................................................. 71 3.2 Alur Analisis ........................................................................................... 72 3.2.1 Pendefinisian Masalah ....................................................................... 75 3.2.2 Studi Literatur ................................................................................... 75 3.2.3 Akuisisi Data ..................................................................................... 75 3.2.4 Pra-pengolahan File Musik ................................................................ 76 3.2.5 Ekstraksi Fitur ................................................................................... 78 3.2.6 Analisis Data ..................................................................................... 78 3.2.7 Pengujian Sistem ............................................................................... 90 BAB IV ............................................................................................................. 93 HASIL DAN PEMBAHASAN......................................................................... 93 4.1 Antarmuka Sistem.................................................................................. 93 4.2 Antarmuka Training Data ..................................................................... 93 4.2.1 Antarmuka Masukkan File .wav ........................................................ 97 4.2.2 Antarmuka Ekstraksi Fitur dengan Fast Fourier Transform ................ 98 4.2.3 Antarmuka Spectral Analysis ............................................................. 99 4.2.4 Pengelompokan Dataset Training .................................................... 101 4.3 Antarmuka Sistem Klasifikasi K-Nearest Neighbor ............................ 107 4.3.1 Load File ......................................................................................... 108 4.3.2 Ekstraksi Fitur FFT.......................................................................... 109 4.3.3 Spectral Analysis ............................................................................. 110 4.3.4 Input Data Training ......................................................................... 111 4.3.5 Klasifikasi Mood Musik Menggunakan K-NN ................................. 112 4.4 Antarmuka Sistem Klasifikasi Mood Musik Menggunakan SVM ..... 113 4.5 Antarmuka Sistem Klasifikasi Mood Musik Menggunakan ID3 ....... 119 4.6 Antarmuka Sistem Pengelompokan Mood Musik Menggunakan KMeans ......................................................................................................... 126 4.7 Hasil Pengujian Menggunakan K-Nearest Neighbor ........................... 129
xi
4.8 Hasil Pengujian Menggunakan SVM .................................................. 137 4.9 Hasil Pengujian Menggunakan ID3..................................................... 140 4.10 Hasil Pengujian Menggunakan K-Means .......................................... 144 BAB V............................................................................................................. 155 KESIMPULAN DAN SARAN....................................................................... 155 5.1 Kesimpulan ........................................................................................... 155 5.2 Saran ..................................................................................................... 156 DAFTAR PUSTAKA ..................................................................................... 157
xii
DAFTAR GAMBAR
Gambar 2. 1 Diagram Fishbone penelitian.......................................................... 21 Gambar 2. 2 Lingkaran kata sifat model emosi Hevner ...................................... 25 Gambar 2. 3 Model dimensi emosi Thayer ......................................................... 26 Gambar 2. 4 Diagram model emosi arousal-valence Thayer ............................... 27 Gambar 2. 5 Diagram alir proses clustering K-Means ........................................ 45 Gambar 2. 6 Kemungkinan hyperplane untuk memisahkan kumpulan data linear ................................................................................................................... 50 Gambar 2. 7 Margin batas kemungkinan ............................................................ 51 Gambar 2. 8 Batas kemungkinan dan margin dari SVM ..................................... 53 Gambar 2. 9 Data dikotomis yang dipetakan kembali menggunakan Kernel Dasar Radial......................................................................................................... 60 Gambar 3. 1 Blok diagram sistem pengelompokan suasana hati terhadap musik . 72 Gambar 3. 2 Alur Analisis Penelitian ................................................................. 74 Gambar 3. 3 Tahapan prapengolahan file musik ................................................. 77 Gambar 3. 4 Tahapan penyusunan data latih/training data mood musik .............. 80 Gambar 3. 5 Tahapan klasifikasi mood musik menggunakan algoritma KNN..... 81 Gambar 3. 6 Diagram alir proses klasifikasi KNN .............................................. 82 Gambar 3. 7 Alur klasifikasi SVM ..................................................................... 84 Gambar 3. 8 Alur klasifikasi Decision Tree (ID3) .............................................. 86 Gambar 3. 9 Diagram alir clustering K-Means ................................................... 89 Gambar 3. 10 Alur proses pengujian sistem ....................................................... 91 Gambar 4. 1 Antarmuka Training Data .............................................................. 94 Gambar 4. 2 Panel pengolahan data latih ............................................................ 95 Gambar 4. 3 Diagram sampling sinyal audio asli ................................................ 95 Gambar 4. 4 Diagram sampling sinyal audio FFT .............................................. 96 Gambar 4. 5 Diagram spectrogram file audio masukan....................................... 97 Gambar 4. 6 Masukkan File .wav ....................................................................... 97 Gambar 4. 7 Diagram sampling sinyal audio asli ................................................ 98 Gambar 4. 8 Antarmuka sistem ekstraksi FFT .................................................... 99 Gambar 4. 9 Proses pembentukan dataset pelatihan mood music ...................... 100 Gambar 4. 10 Grafik nilai feature set mood 1. Contentment/Menenangkan ...... 104 Gambar 4. 11 Grafik nilai feature set mood 2. Exuberance/Bersemangat .......... 104 Gambar 4. 12 Grafik nilai feature set mood 3. Depression/Depresi ................... 105 Gambar 4. 13 Grafik nilai feature set mood 4. Anxious/Kacau ......................... 105 Gambar 4. 14 Perbandingan 9 nilai spectral feature terhadap 4 kategori mood . 106 Gambar 4. 15 Perbandingan 4 kategori mood terhadap 9 nilai spectral feature.. 107 Gambar 4. 16 Antarmuka sistem klasifikasi K-NN ........................................... 108 Gambar 4. 17 Antarmuka Load File untuk memuat file musik .......................... 109 Gambar 4. 18 Antarmuka hasil ekstraksi fitur FFT ........................................... 109 Gambar 4. 19 Antarmuka Spectral Analysis ..................................................... 110 Gambar 4. 20 Antarmuka Load Data Training .................................................. 111
xiii
Gambar 4. 21 Antarmuka input nilai k untuk klasifikasi K-NN ........................ 112 Gambar 4. 22 Antarmuka hasil klasifikasi K-NN berupa jenis mood ................ 113 Gambar 4. 23 Antarmuka sistem klasifikasi SVM ............................................ 114 Gambar 4. 24 Antarmuka Load File Audio sebagai input data .......................... 115 Gambar 4. 25 Antarmuka ekstraksi FFT ........................................................... 116 Gambar 4. 26 Antarmuka Spectral Analysis ..................................................... 117 Gambar 4. 27 Antarmuka input dataset training SVM ...................................... 118 Gambar 4. 28 Antarmuka hasil klasifikasi SVM berupa jenis mood ................. 119 Gambar 4. 29 sistem klasifikasi ID3 ................................................................. 120 Gambar 4. 30 Antarmuka Load File Audio sebagai input data .......................... 121 Gambar 4. 31 Antarmuka hasil Ekstraksi FFT .................................................. 122 Gambar 4. 32 Antarmuka Spectral Analysis ..................................................... 123 Gambar 4. 33 Antarmuka input dataset training ID3......................................... 124 Gambar 4. 34 Antarmuka hasil klasifikasi ID3 berupa jenis mood .................... 125 Gambar 4. 35 Antarmuka proses clustering data menggunakan K-Means ......... 127 Gambar 4. 36 Antarmuka input file uji untuk clustering ................................... 128 Gambar 4. 37 Antarmuka input nilai k sebagai jumlah cluster .......................... 128 Gambar 4. 38 Antarmuka hasil clustering data uji ............................................ 129 Gambar 4. 39 Hasil akurasi klasifikasi mood menggunakan K-NN .................. 135 Gambar 4. 40 Rata-rata waktu proses klasifikasi K-NN terhadap jumlah data uji ................................................................................................................. 136 Gambar 4. 41 Hasil akurasi klasifikasi mood musik menggunakan SVM ......... 138 Gambar 4. 42 Rata-rata waktu proses klasifikasi SVM terhadap sejumlah data uji ................................................................................................................. 140 Gambar 4. 43 Hasil akurasi klasifikasi mood musik menggunakan ID3 ............ 142 Gambar 4. 44 Rata-rata waktu proses klasifikasi ID3 terhadap sejumlah data uji ................................................................................................................. 143 Gambar 4. 45 Nilai silhouette coefficient untuk setiap jumlah data uji.............. 146 Gambar 4. 46 Total sum of distance pada K-Means.......................................... 147 Gambar 4. 47 Waktu yang diperlukan untuk mengelompokkan sejumlah data uji ................................................................................................................. 149 Gambar 4. 48 Persentase hasil akurasi K-Means clustering mood musik .......... 150 Gambar 4. 49 Perbandingan persentase akurasi sistem pengelompokan musik terhadap mood.......................................................................................... 151 Gambar 4. 50 Perbandingan waktu proses sistem pengelompokan musik terhadap mood ........................................................................................................ 152
xiv
DAFTAR TABEL
Tabel 2. 1 Rangkuman State of The Art .............................................................. 16 Tabel 3. 1 Pembagian kategori mood musik untuk training dataset ..................... 79 Tabel 4. 1 Kode untuk setiap jenis mood musik ............................................... 100 Tabel 4. 2 Data Latih mood musik kategori 1) Contentment/Menenangkan ...... 101 Tabel 4. 3 Data Latih mood musik kategori 2) Exuberance/Bersemangat ......... 102 Tabel 4. 4 Data Latih mood musik kategori 3) Depression/Depresi .................. 102 Tabel 4. 5 Data Latih mood musik kategori 4) Anxious/Kacau ......................... 103 Tabel 4. 6 Hasil akurasi K-NN klasifikasi 40 file musik ................................... 130 Tabel 4. 7 Hasil akurasi K-NN klasifikasi 80 file musik ................................... 130 Tabel 4. 8 Hasil akurasi K-NN klasifikasi 120 file musik ................................. 131 Tabel 4. 9 Hasil akurasi K-NN klasifikasi 160 file musik ................................. 131 Tabel 4. 10 Hasil akurasi K-NN klasifikasi 200 file musik ............................... 132 Tabel 4. 11 Hasil akurasi K-NN klasifikasi 240 file musik ............................... 132 Tabel 4. 12 Hasil akurasi K-NN klasifikasi 280 file musik ............................... 133 Tabel 4. 13 Hasil akurasi K-NN klasifikasi 320 file musik ............................... 133 Tabel 4. 14 Hasil akurasi K-NN klasifikasi 360 file musik ............................... 134 Tabel 4. 15 Hasil akurasi K-NN klasifikasi 400 file musik ............................... 134 Tabel 4. 16 Persentase hasil akurasi total klasifikasi mood musik menggunakan K-NN berdasarkan nilai ketetanggaan k (1-16) ......................................... 135 Tabel 4. 17 Rata-rata waktu proses klasifikasi K-NN ....................................... 136 Tabel 4. 18 Persentase hasil akurasi total klasifikasi mood musik menggunakan algoritma SVM......................................................................................... 137 Tabel 4. 19 Rata-rata waktu proses klasifikasi SVM......................................... 139 Tabel 4. 20 Persentase hasil akurasi total klasifikasi mood musik menggunakan algoritma ID3 ........................................................................................... 141 Tabel 4. 21 Rata-rata waktu proses klasifikasi ID3 ........................................... 143 Tabel 4. 22 Nilai Silhouette Coefficient ........................................................... 145 Tabel 4. 23 Nilai sum of distance berdasarkan jumlah data uji.......................... 146 Tabel 4. 24 Waktu pemrosesan K-Means ......................................................... 148 Tabel 4. 25 Persentase akurasi K-Means clustering mood musik ...................... 149 Tabel 4. 26 Perbandingan persentase akurasi sistem dan waktu proses untuk masing-masing algoritma ......................................................................... 151
xv