BAB I PENDAHULUAN
1.1 Latar Belakang Musik merupakan sarana yang ampuh dan memiliki banyak kebaikan bagi tubuh dan jiwa manusia, musik dapat menenangkan bahkan membangkitkan semangat seseorang yang mendengarkan musik. Para ahli psikologi menyatakan bahwa terdapat bagian pada otak manusia yang merasakan musik dekat dengan bagian otak yang berhubungan dengan ekspresi emosional manusia. Maka dari itu terdapat hubungan langsung antara musik dan emosi (Samira Pouyanfar, dkk, 2014). Terdapat dua kelompok peneliti yang mempelajari hubungan antara musik dengan emosi, yaitu ; 1) Psikolog Musik, mereka yang mempelajari hubungan antara isyarat akustik (beat, tempo, tingkat suara, dll.) dengan berbagai ekspresi emosi (marah, sedih, senang, tenang, dll.) dan sebagian besar mereka yang mengembangkan model emosional. 2) Peneliti bidang komputer, yaitu mereka yang mengembangkan algoritma untuk mendeteksi emosi terhadap musik secara otomatis. Mereka mencoba menggunakan emosi selain untuk mendapatkan metadata konvensional seperti genre/jenis musik, musik mood, yang juga sebagai penelitian dalam bidang Music Information Retrieval. Musik erat kaitannya dengan psikologi manusia, kenyataan ini mengindikasikan bahwa musik dapat terkait dengan emosi dan mood/suasana hati tertentu pada manusia. Berbagai penelitian yang telah dilakukan memperkuat pernyataan tersebut. Dalam penelitian yang dilakukan oleh Song et al, (2012)
1
menyatakan “Because music conveys and evokes feelings, a wealth of research has been performed on music emotion recognition”, melalui pernyataan tersebut dapat disimpulkan bahwa setiap musik yang telah tercipta memiliki energi emosi tersendiri yang terpancar, maka dari itu mulai banyak penelitian yang telah dilakukan pada pengenalan emosi musik. Dari sudut pandang psikologi musik, elemen yang paling penting dalam penggolongan musik itu sendiri adalah pada emosi apa yang tersirat dari musik tersebut. Banyak sekali upaya yang telah dilakukan oleh para penulis dan pemusik dalam mencoba menjelaskan hubungan antara musik dengan suasana hati, namun tidak menghasilkan suatu standar dan kesepakatan mengenai hal tersebut. Hal ini yang memicu ketertarikan dan semakin bertambahnya penelitian yang berkaitan seputar musik dan kaitannya dengan suasana hati. Hevner dalam penelitiannya berjudul Experimental studies of the elements of expression in music (Hevner K, 1936) melakukan eksperimen dimana pendengar musik diminta untuk menuliskan kata sifat yang muncul di pikiran mereka yang paling deskriptif terhadap musik yang didengarkan. Eksperimen ini dilakukan untuk memperkuat hipotesis bahwa musik benar-benar membawa arti emosional. Dia juga menemukan dalam sebuah kelompok yang mempunyai latar belakang budaya yang sama memiliki pelabelan mood musik cenderung konsisten antar individunya. Hevner
membagi klasifikasi emosi menjadi 64 kata sifat
dan
mengelompokkannya menjadi 8 cluster yaitu sober/memabukkan, gloomy/murung, longing/hasrat, lyrical/lirik, sprightly/lincah, joyous/gembira, restless/gelisah dan robust/kuat. Selanjutnya pengelompokan tersebut diperbaiki oleh penelitian
2
Farnsworth pada tahun 1958 dimana beliau menyusun ulang emosi menjadi 10 cluster, diantaranya : cheerful/ceria, fanciful/fantastis, delicate/ halus, leisurely/ santai, pathetic/ mengenaskan, depressing/ depresi, spiritual/ rohani, dramatic/ dramatis, exciting/ menarik, dan frustated/ frustasi (Tao Li, 2003). Pengelompokan yang lebih sederhana sebenarnya telah dilakukan pada tahun 1989-an, Thayer melakukan penelitian dengan judul The biopsychology of mood and arousal, muncul pendekatan lain yang lebih sederhana terhadap kategorisasi pada suasana hati dalam musik. Thayer mengajukan model 2 dimensi yang memetakan suasana hati dalam musik, pendekatan 2 dimensi ini mengangkat teori yang menyatakan bahwa emosi dan suasana hati disebabkan oleh dua faktor, yaitu stress (senang dan cemas) dan energy (santai dan energetik). Selanjutnya dari model 2 dimensi ini dibagi menjadi 4 cluster yaitu contentment/kepuasan, exuberance/gembira, depression/depresi, dan anxious/cemas;kalut, (Thayer, 1989). Menentukan emosi atau suasana hati apa yang terkandung sebuah lagu merupakan tantangan dalam penelitian ini. Untuk mengetahui lebih efektif mengenai suasana hati yang muncul dalam sebuah lagu, dapat diketahui pada saat mendengarkan lagu tersebut pada bagian intro dan refrain lagu (Seungwon Oh, dkk., 2013). Bagian intro merupakan bagian awal yang dapat menentukan atmosfer lagu, intro juga secara intuitif memiliki kata-kata dan nada-nada yang intensif untuk memberikan informasi mengenai suasana hati. Bagian refrain merupakan bagian dengan kata-kata atau nada-nada yang paling sering diulang-ulang dalam sebuah lagu. Secara umum bagian refrain adalah bagian dengan pengulangan kata dan nada
3
yang paling sering dan hal ini yang menjadi bagian refrain yang paling menentukan mood apa yang terkandung dalam lagu tersebut. Dalam hal menentukan jenis mood yang terkandung dalam lagu diperlukan metode khusus yang menggabungkan komputasi numerik dengan penambangan data berupa fitur-fitur unik dalam sebuah lagu, hal ini dikenal sebagai Music Information Retrieval (MIR). MIR adalah salah satu bagian dalam data mining dimana informasi yang akan digali dari sumber data berupa musik. Banyak penelitian yang telah dilakukan mengenai MIR khususnya pada klasifikasi emosi dan mood dalam bidang musik, psikologi, pemrosesan sinyal, machine learning maupun kombinasi dari beberapa model penelitian tersebut. MIR menggunakan berbagai macam metode data mining untuk pengelompokan termasuk di dalamnya klasifikasi dan clustering data seperti K-NN, C4.5, decission tree, Support Vector Model (SVM), Artificial Neural Network, Self Organization Map, K-Means dan lain sebagainya. Dalam proses data mining, sebelum berbagai jenis lagu tersebut dikelompokkan berdasarkan mood, maka harus melewati tahap awal pengolahan data (preprocessing). Tahapan preprocessing ini dikenal dengan feature selection (Samira Pouyanfar, dkk, 2014). Tahapan selanjutnya dari feature selection adalah proses feature extraction atau ekstraksi citi dari sebuah file lagu untuk menemukan ciri yang untuk masuk ke tahapan pengolahan data berikutnya, perlu dilakukan pengolahan sinyal dengan menggunakan transformasi fourier yang berfungsi mengubah fungsi atau sinyal dalam domain waktu ke domain frekuensi. Tahapan feature extraction terdiri dari tiga proses, yaitu pengambilan sampel lagu (bagian
4
refrain), penerapan fast fourier transform dan spectral analysis untuk mendapatkan nilai spectral feature yang menjadi atribut dasar untuk dilakukannya klasifikasi mood. Dalam tahapan klasifikasi, K-Nearest Neighbor (K-NN) merupakan suatu metode klasifikasi dengan supervisi (supervised learning) dimana hasil dari query data yang baru diklasifikasikan berdasarkan kategori pada K-NN. Tujuan dari algoritma ini adalah mengklasifikasikan obyek baru berdasarkan atribut dan training sample. Pada berbagai penelitian dibidang lain dengan memanfaatkan KNN misalnya pada pengolahan sinyal suara, pengolahan citra digital, sistem pendukung keputusan dan berbagai sistem kecerdasan buatan lainnya, dan terbukti K-NN dapat bekerja dengan baik. Metode klasifikasi lainnya yaitu Support vector machine (SVM) juga merupakan suatu teknik pemodelan supervised learning yang relatif baru (1995) untuk melakukan prediksi, baik dalam kasus klasifikasi maupun regresi, yang sangat populer belakangan ini. Baik para ilmuwan maupun praktisi telah banyak menerapkan teknik ini dalam menyelesaikan masalah-masalah nyata dalam kehidupan sehari-hari. Terbukti dalam beberapa implementasi terkait klasifikasi musik terhadap mood, SVM memberi hasil yang lebih baik dari algoritma klasifikasi lainnya, terutama dalam hal solusi yang dicapai (Samira Pouyanfar, 2014). SVM berusaha untuk menemukan fungsi pemisah (classifier) yang optimal yang bisa memisahkan multi set data dari multi class yang berbeda. Pohon keputusan atau dikenal dengan Decision Tree merupakan salah satu algortima klasifikasi yang paling populer karena mudah untuk diinterpretasi oleh
5
manusia. Dengan kemampuannya untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih sederhana. Pohon keputusan juga dapat menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Dalam penelitian terkait menggunakan algoritma ini dalam klasifikasi musik terhadap mood menghasilkan hasil klasifikasi yang cukup baik (Braja Gopal, 2013) Untuk proses clustering dalam penelitian ini menggunakan algoritma KMeans, dimana algoritma data mining ini melakukan proses pemodelan tanpa supervisi (unsupervised learning) dan merupakan salah satu algoritma yang melakukan pengelompokan data dengan sistem partisi. Metode K-Means berusaha mengelompokkan data yang ada ke dalam beberapa kelompok, dimana data dalam satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata lain, algoritma ini berusaha untuk meminimalkan variasi antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data yang ada di cluster lainnya. Berdasarkan pemaparan penjelasan latar belakang tersebut maka penelitian ini dilakukan untuk dapat membangun sebuah rekayasa sistem yang dapat mengelompokkan musik ke dalam empat parameter mood atau suasana hati yang terdapat dalam musik. Sistem ini akan dibangun berdasarkan pengelompokkan parameter mood yang diperoleh dengan menggunakan algoritma K-Nearest Neighbor dan K-Means, serta sebagai pembanding pengujian menggunakan algoritma Support Vector Machine dan Decision Tree. Sistem ini nantinya
6
diharapkan dapat membantu penggunanya untuk menemukan kategori mood apa yang terkandung dalam sebuah file musik. Perlu diperhatikan juga bahwa file musik yang digunakan ini hanya instrumental musik saja tanpa mengandung lirik vokal. Koleksi musik yang digunakan dalam proses pelatihan dan pengujian ini diperoleh dari situs www.audionetwork.com.
1.2 Rumusan Masalah Berdasarkan latar belakang yang telah disebutkan di atas, maka rumusan masalah dalam penelitian ini adalah bagaimana membangun sistem pengelompokan musik terhadap suasana hati dan mengetahui unjuk kerja algoritma K-Nearest Neighbor dengan K-Means serta membandingkan dengan algoritma Support Vector Machine, dan Iterative Dichotomiser 3.
1.3 Tujuan Penelitian Tujuan yang ingin dicapai melalui penelitian ini adalah untuk memperoleh perbandingan persentase hasil akurasi terbaik dan waktu pemrosesan tercepat dalam hal pengelompokan musik terhadap suasana hati/mood diantara algoritma KNN, K-Means, SVM, dan ID3.
1.4 Manfaat Penelitian Secara praktis, hasil dari penelitian ini diharapkan memberikan manfaat sebagai berikut : 1. Menghasilkan sebuah sistem yang dapat melakukan pengelompokan musik terhadap suasana hati/mood menggunakan algoritma K-Nearest Neighbor, K-Means, SVM, dan ID3.
7
2. Memperoleh hasil persentase akurasi pengelompokan musik terbaik dan waktu pemrosesan tercepat diantara keempat algoritma tersebut dalam hal pengelompokan musik terhadap suasana hati/mood. Secara akademis penelitian ini diharapkan dapat memberikan manfaat diantaranya : 1. Dapat memberikan suatu karya penelitian yang dapat mendukung dalam pengembangan penelitian yang terkait dengan Music Information Retrieval. 2. Bagi peneliti, dapat menambah wawasan dalam menerapkan algoritma data mining dalam hal pengelompokan musik terhadap suasana hati/mood, yang dapat menjadi acuan terhadap pengembangan penelitian sejenis.
1.5 Ruang Lingkup Penelitian Sehubungan dengan luasnya cakupan yang dapat diambil dari penelitian ini, maka perlu dibuat batasan-batasan dalam penelitian ini, antara lain: a. Sistem ini menggunakan model pengelompokan suasana hati/mood model Thayer yaitu 1) Contentment/ ketenangan; nyaman; relaksasi, 2) Exuberance/bersemangat; riuh; 3) Depression/depresi; sedih, dan 4) Anxious/cemas; kalut; kacau. b. File musik yang digunakan dalam proses pelatihan maupun pengujian adalah file musik format mono .wav pada bagian intro atau refrain berdurasi 30 detik. c. Metode ekstraksi fitur yang digunakan adalah Fast Fourier Transform dimana hasil dari metode ini akan dianalisis lebih lanjut dengan
8
menggunakan 9 metode spectral analysis (spectral centroid, spectral skewness, spectral rolloff, spectral slope, spectral kurtosis, spectral spread, spectral decrease, spectral flux, dan spectral flatness) untuk memperoleh karakter musik dengan ciri yang lebih tepat. d. Proses klasifikasi mood/suasana hati terhadap musik musik dilakukan dengan menggunakan algoritma K-Nearest Neighbor, K-Means, Support Vector Machine dan Iterative Dichotomiser 3. e. Kategori musik yang akan digunakan sebagai data latih/training dan data uji untuk proses klasifikasi adalah dataset yang bersumber dari situs www.audionetwork.com, yang telah memiliki label mood/suasana hati berdasarkan anotasi/tag dari pakar musik. File musik yang digunakan ini hanya instrumental musik saja tanpa mengandung lirik vokal. f. Pembuatan sistem dilakukan dengan menggunakan Matlab R2015a sebagai aplikasi utama. g. Modul pemrograman pada bagian spectral analysis menggunakan modul yang bersumber dari penelitian “An Introduction to Audio Content Analysis, Applications in Signal Processing and Music Informatics” (Alexander Lerch, 2012)
1.6 Keaslian Penelitian Berdasarkan penelitian yang akan diambil, penulis mengkaji banyak topik yang berhubungan dengan Music Information Retrieval diantaranya jurnal, artikel, paper, white paper, buku, dan penelitian yang sudah ada sebelumnya.
9
Penelitian mengenai MIR telah dilakukan dengan menggunakan beberapa metode pada aplikasi yang berbeda-beda. Metode yang digunakan sebagai machine learning dalam penelitian-penelitian tersebut antara lain seperti K-Nearest Neighbor, K-Means, Support Vector Machine (SVM), Decision Tree, Naïve Bayes, Neural Network, Backpropagation, dan lain sebagainya. Berdasarkan beberapa penelitian yang telah dilakukan, telah ada beberapa penelitian sejenis yang dilakukan untuk mengelompokkan musik berdasarkan mood/suasana hati dengan menggunakan berbagai algoritma data mining, maka dalam penelitian ini penulis mengusulkan pendekatan baru dalam hal perbandingan hasil kinerja algoritma dalam mengelompokan musik terhadap suasana hati menggunakan metode K-Nearest Neighbor dan K-Means dan pembanding pengujian sistem menggunakan Support Vector Machine dan Decision Tree. Serta dalam proses mendapatkan nilai fitur dengan ekstraksi fitur dengan menggunakan metode Fast Fourier Transform dan sembilan jenis Spectral Analysis Features. Penelitian terkait yang menggunakan berbagai pendekatan data mining lainnya dirangkum pada state of the art pada Bab II.
10