PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
KEAKURATAN METODE K-MEANS CLUSTERING DALAM PENGELOMPOKAN LAGU DAERAH BERDASARKAN PULAU ASAL DI INDONESIA
SKRIPSI
Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika
Oleh Theodorus Cahyo Adi Nugroho 105314109
PROGRAM STUDI JURUSAN TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2015
i
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
THE ACCURACY OF K-MEANS CLUSTERING METHOD TO CLUSTERING FOLK SONGS BASED ISLAND IN INDONESIA
A THESIS
Presented as Partial Fulfillment of Requirements To Obtain Sarjana Komputer Degree In Informatics Engineering Department
By Theodorus Cahyo Adi Nugroho 105314109
INFORMATICS ENGINEERING STUDY PROGRAM INFORMATICS ENGINEERING DEPARTMENT FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2015 ii
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
iii
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
iv
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
HALAMAN PERSEMBAHAN
This thesis belongs to :
My Lord Jesus Christ, thank you so much for everything that He given to me until now…
My parent, thank you so much for all supports and guiding me…
My friends, thank you so much for all supports…
v
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa di dalam skripsi yang saya tulis ini tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.
Yogyakarta, 26 Januari 2015 Penulis
Theodorus Cahyo Adi Nugroho
vi
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma: Nama : Theodorus Cahyo Adi Nugroho NIM
: 105314109
Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan Universitas Sanata Dharma karya ilmiah yang berjudul:
KEAKURATAN METODE K-MEANS CLUSTERING DALAM PENGELOMPOKAN LAGU DAERAH BERDASARKAN PULAU ASAL DI INDONESIA Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan kepada perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data mendistribusikan secara terbatas, dan mempublikasikannya di Internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun memberikan royalti kepada saya selama tetap mencamtumkan nama saya sebagai penulis. Demikian pernyataan ini saya buat dengan sebenarnya. Yogyakarta, 26 Januari 2015 Penulis
Theodorus Cahyo Adi Nugroho
vii
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
ABSTRAK
Di Indonesia, terdapat berbagai macam daerah dan setiap daerah memiliki karakteristik yang berbeda - beda, antara lain adalah baju daerah, bahasa daerah, dan yang sering kita dengar adalah lagu daerah. Terdapat 34 propinsi dengan 190 lagu daerah. Akan tetapi, masyarakat di Indonesia masih banyak yang tidak mengetahui asal lagu daerah tersebut karena jumlah lagu daerah yang sangatlah banyak dan beragam karakteristiknya. Dari latar belakang tersebut, maka pengelompokkan lagu daerah dilakukan menggunakan algoritma K-Means. Proses ekstraksi ciri dilakukan dengan menggunakan metode MFCC yang terdapat pada jAudio. Hasil akhir yang diperoleh adalah tingkat akurasi algoritma K-Means dalam pengelompokkan lagu daerah berdasarkan pulau asalnya. Hasil akurasi rata – rata dari pengujian adalah 50.44% dengan tingkat akurasi paling tinggi 53.33% dan paling rendah 46.67%. Hal ini dikarenakan data yang digunakan karakteristiknya sangat rendah dan hasil MFCC menjadi kurang baik, dibuktikan dengan percobaan pengelompokan lagu berdasarkan genre.
Kata Kunci : K-Means, MFCC, jAudio, Lagu Daerah, WAV
viii
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
ABSTRACT
In Indonesia, there are many regions and each region has different characteristics, example : the local clothes, the local languages, and that we often hear is a local song. There are 34 provinces with 190 folk songs. However, people in Indonesia are still do not know the origin of the song because the number of folk songs are so numerous and diverse characteristics. From this background, the grouping of folk songs performed by using the K-Means algorithm. The process of feature extraction is performed by using the method contained in jAudio, MFCC. The final result obtained is the accuracy of the K-Means algorithm in clustering folk song based on the island of origin. The results of average accuration of the test is 50.44% with the highest level of accuration is 53.33% and lowest level of accuration is 46.67%. This is because the characteristics of the data used is very low and MFCC be less good results, it proved by experiment clustering songs by genre.
Keywords : K-Means, MFCC, jAudio, Folk Songs, WAV
ix
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus, sehingga penulis dapat menyelesaikan tugas akhir sebagai salah satu mata kuliah wajib dan merupakan syarat akademik pada jurusan Teknik Informatika Universitas Sanata Dharma Yogyakarta. Pada kesempatan ini, penulis ingin mengucapkan terima kasih kepada pihak-pihak yang telah membantu penulis baik selama penelitian maupun saat pengerjaan skripsi ini. Ucapan terima kasih penulis sampaikan di antaranya kepada : 1. Ibu Sri Hartati Wijono, S.Si., M.Kom., selaku dosen pembimbing tugas akhir. Terima kasih atas bimbingan, kesabaran, waktu, dukungan dan ilmu yang sudah diberikan kepada penulis selama mengerjakan tugas akhir. 2. Ibu Ridowati Gunawan, S.Kom., M.T., dan Bapak Alb. Agung Hadhiatma, S.T., M.T., selaku dosen penguji. Terima kasih atas saran dan kritik yang telah diberikan. 3. Ibu Paulina Heruningsih Prima Rosa S.Si., M.Sc., selaku Dekan Fakultas Sains dan Teknologi dan dosen pembimbing akademik Teknik Informatika kelas c. Terima kasih atas dukungan, bimbingan dan kesabarannya dalam menghadapi mahasiswa. 4. Seluruh Dosen Teknik Informatika atas ilmu yang telah diberikan selama masa kuliah dan sangat membantu penulis dalam mengerjakan tugas akhir. x
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
5. Orang tua, Laurentius Suwondo dan Laurentia Endang Pratiwi atas dukungan moral, spiritual dan finansial dalam penyusunan skripsi. 6. Om Sutadi, Mas Andi, Mbak Vita, Mbak Rina, Mas Anton dan seluruh keluarga besar Sugeng Hutomo dan Eyang Muntilan atas semangat, dukungan dan doanya. 7. Mr. Cory McKay for the dissertation about jAudio. Thank you so much for all the answers and helping me to understanding about jAudio. 8. Mas Audris, Mbak Petra, Fa Febrian, Edo, Agus, Yhoga, Dita dan Teddy atas bantuan dan semangat serta doanya selama penulis mengerjakan tugas akhir. 9. Ougi, Ronny, Ardy, Renny, Andhini, Festi, Maria, Ria, Sepen, Novi, Amel, Felisitas, Erlita dan Ayu atas semua dukungan dan semangat serta doanya. 10. Seluruh teman-teman Teknik Informatika 2010 dan 2011, atas dukungan dan doanya. 11. Semua pihak yang tidak dapat disebutkan satu per satu yang telah membantu penulis dalam pengerjaan skripsi ini.
xi
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
Penulis menyadari masih banyak kekurangan yang terdapat dalam laporan tugas akhir ini. Saran dan kritik sangat diharapkan untuk hasil yang lebih baik di masa depan.
Penulis,
Theodorus Cahyo Adi Nugroho
xii
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
DAFTAR ISI
HALAMAN JUDUL BAHASA INDONESIA ............................................................................I HALAMAN JUDUL BAHASA INGGRIS ................................................................................II HALAMAN PERSETUJUAN ...............................................ERROR! BOOKMARK NOT DEFINED. HALAMAN PENGESAHAN ................................................ERROR! BOOKMARK NOT DEFINED. HALAMAN PERSEMBAHAN ................................................................................................ V PERNYATAAN KEASLIAN KARYA ................................................................................... VI LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS............................................................................................... VII ABSTRAK ............................................................................................................................. VIII ABSTRACT ..............................................................................................................................IX KATA PENGANTAR ................................................................................................................X DAFTAR ISI .......................................................................................................................... XIII DAFTAR GAMBAR............................................................................................................... XV DAFTAR TABEL .................................................................................................................. XVI BAB I PENDAHULUAN ........................................................................................................... 1 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7.
LATAR BELAKANG ........................................................................................................... 1 RUMUSAN MASALAH ....................................................................................................... 3 TUJUAN PENELITIAN ........................................................................................................ 3 BATASAN MASALAH ........................................................................................................ 3 MANFAAT PENELITIAN ..................................................................................................... 4 METODOLOGI PENELITIAN ............................................................................................... 4 SISTEMATIKA PENULISAN................................................................................................. 5
BAB II LANDASAN TEORI ..................................................................................................... 7 2.1. MUSIK TRADISIONAL / LAGU DAERAH ............................................................................. 7 2.2. PENGENALAN POLA ........................................................................................................ 11 2.3. AUDIO FEATURE EXTRACTION ....................................................................................... 13 2.3.1. Aplikasi jAudio ...................................................................................................... 13 2.3.2. Mel-frequency Cepstral Coefficients (MFCC) ...................................................... 14 2.4. CLUSTERING ................................................................................................................... 17 2.5. ALGORITMA K-MEANS ................................................................................................... 18 BAB III ANALISIS DAN PERANCANGAN PENELITIAN ................................................. 22 3.1. PERANCANGAN PENELITIAN SECARA UMUM ................................................................. 22 3.2. DATA PREPROCESSING ATAU PEMBUATAN DATA .......................................................... 24 3.3. PROSES CLUSTERING ...................................................................................................... 25 3.4. PROSES PENGUJIAN ........................................................................................................ 26 3.5. SPESIFIKASI HARDWARE DAN SOFTWARE ...................................................................... 28 3.5.1. Hardware .............................................................................................................. 28
xiii
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
3.5.2.
Software ................................................................................................................ 28
BAB IV ANALISIS DAN IMPLEMENTASI PENELITIAN ................................................. 29 4.1. 4.2. 4.3.
IMPLEMENTASI MENENTUKAN CENTROID AWAL ............................................................. 29 IMPLEMENTASI CLUSTERING DENGAN METODE K-MEANS.............................................. 30 IMPLEMENTASI PENGUJIAN AKURASI BERDASARKAN NILAI PRECISION TERTINGGI. ........ 34
BAB V HASIL DAN PEMBAHASAN .................................................................................... 39 5.1. HASIL PENGUKURAN ...................................................................................................... 39 5.2. SKENARIO PENGUJIAN .................................................................................................... 41 5.3. ANALISA HASIL .............................................................................................................. 47 5.3.1. Kesalahan Pengelompokkan Lagu Daerah ........................................................... 49 5.3.2. Penentuan Centroid Awal ..................................................................................... 52 5.3.3. Karakteristik Lagu dan MFCC ............................................................................. 55 BAB VI KESIMPULAN DAN SARAN ................................................................................... 59 6.1. 6.2.
KESIMPULAN .................................................................................................................. 59 SARAN ............................................................................................................................ 60
DAFTAR PUSTAKA ............................................................................................................... 61
xiv
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
DAFTAR GAMBAR
GAMBAR 2. 1 DIAGRAM BLOK MEL - FREKUENSI KOEFISIEN CEPSTRAL .............................................. 15 GAMBAR 2. 2 DIAGRAM ALGORITMA K-MEANS................................................................................... 20
GAMBAR 3. 1 DIAGRAM BLOK PENELITIAN SECARA UMUM ................................................................. 23 GAMBAR 3. 2 OUTPUT JAUDIO .......................................................................................................... 24 GAMBAR 3. 3 DATABASE HASIL JAUDIO ............................................................................................. 25 GAMBAR 3. 4 DIAGRAM BLOK PROSES CLUSTERING DENGAN ALGORITMA K-MEANS .................... 26
GAMBAR 4. 1 MENENTUKAN CENTROID AWAL .................................................................................... 30 GAMBAR 4. 2 CLUSTERING DENGAN K-MEANS ................................................................................... 34 GAMBAR 4. 3 PENGUJIAN AKURASI .................................................................................................... 38
xv
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
DAFTAR TABEL
TABEL 5. 1 INISIALISASI CLUSTER TIAP PULAU ................................................................................... 39 TABEL 5. 2 LAGU DAERAH DENGAN ACTUAL CLUSTER 1 ..................................................................... 40 TABEL 5. 3 LAGU DAERAH DENGAN ACTUAL CLUSTER 2 ..................................................................... 40 TABEL 5. 4 LAGU DAERAH DENGAN ACTUAL CLUSTER 3 ..................................................................... 40 TABEL 5. 5 PERBANDINGAN CLUSTER................................................................................................. 41 TABEL 5. 6 BOBOT PERBANDINGAN PREDICTED CLUSTER DENGAN ACTUAL CLUSTER ......................... 42 TABEL 5. 7 PRECISION PERBANDINGAN PREDICTED CLUSTER DENGAN ACTUAL CLUSTER ................... 43 TABEL 5. 8 PRECISION TERTINGGI PERBANDINGAN PREDICTED DENGAN ACTUAL CLUSTER................. 45 TABEL 5. 9 TOTAL BOBOT PERBANDINGAN PREDICTED CLUSTER DENGAN ACTUAL CLUSTER BERDASARKAN PRECISION TERTINGGI ....................................................................................... 46 TABEL 5. 10 AKURASI BERDASARKAN PRECISION TERTINGGI ............................................................... 46 TABEL 5. 11 HASIL PENGUJIAN AKURASI .................................................................................................. 47 TABEL 5. 12 TABEL PERSENTASE LAGU .............................................................................................. 50 TABEL 5. 13 TABEL PERSENTASE KESALAHAN..................................................................................... 51 TABEL 5. 14 AKURASI TIAP PULAU..................................................................................................... 52 TABEL 5. 15 TABEL INISIALISASI GENRE LAGU.................................................................................... 57 TABEL 5. 16 TABEL AKURASI BERDASARKAN GENRE ........................................................................... 58
xvi
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
1
BAB I PENDAHULUAN 1.1.
Latar Belakang
Di Indonesia, terdapat berbagai macam daerah dan setiap daerah memiliki karakteristik yang berbeda - beda, antara lain adalah baju daerah, bahasa daerah, dan yang sering kita dengar adalah lagu daerah. Terdapat 34 propinsi dengan 190 lagu daerah. Akan tetapi, masyarakat di Indonesia masih banyak yang tidak mengetahui asal lagu daerah tersebut karena jumlah lagu daerah yang sangatlah banyak dan beragam karakteristiknya. Karakteristik lagu suatu pulau jelas sangat berbeda dengan pulau lain, misal: karakter satu lagu di pulau Jawa berbeda dengan karakter lagu di pulau Sumatera. Akan tetapi, sebelum lagu daerah dikelompokkan berdasarkan pulau asalnya, data tersebut
harus dapat disimpan
karakteristiknya agar pengelompokkan menghasilkan hasil yang optimum. Pengolahan lagu daerah tersebut dapat dilakukan dengan metode MFCC. MFCC merupakan salah satu metode dalam fiture extraction berbasis timbral. Pada penelitian Genre Classification and The Variance of MFCC to Key And Tempo (Tom LH. Li and Antoni B. Chan, 2011) MFCC mengkodekan baik timbral maupun kunci pada musik. Penelitian tersebut menghasilkan akurasi 68,9% menggunakan klasifikasi Aug-Both dengan 13 koefisien MFCC. Selain itu, genre musik klasik menghasilkan akurasi 90% untuk semua data.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
2
Dalam kasus ini, pengelompokkan lagu daerah dapat dilakukan dengan metode Data Clustering. Data Clustering merupakan salah satu metode Data Mining yang bersifat tanpa arahan (unsupervised). Ada dua jenis
data
clustering
yang
sering
dipergunakan
dalam
proses
pengelompokan data yaitu hierarchical (hirarki) data clustering dan nonhierarchical (non hirarki) data clustering. K-Means merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok. Metode ini mempartisi data ke dalam cluster/kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain. Adapun tujuan dari mengelompokkan data ini adalah untuk meminimalisasikan objective function yang diset dalam proses clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam suatu cluster dan memaksimalisasikan variasi antar cluster (MacQueen, J. B. 1967). Kelebihan metode k-means adalah dapat memecahkan berbagai macam permasalahan. Salah satunya adalah permasalahan dalam bidang musik, yaitu : mengelompokkan lagu daerah berdasarkan pulau asalnya. Dalam penelitian ini, hasil tingkat akurasi dari clustering bisa beragam karena penelitian itu dilakukan untuk mencari keakurasian metode K-Means dalam menangani pengelompokkan lagu daerah berdasarkan pulau asalnya di Indonesia.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
1.2.
3
Rumusan Masalah
Seberapa besar tingkat akurasi metode K-Means Clustering dalam mengelompokkan lagu daerah berdasarkan pulau asalnya di Indonesia. 1.3.
Tujuan Penelitian
Penelitian ini bertujuan untuk mengetahui tingkat akurasi metode K-Means Clustering dalam mengelompokkan lagu daerah berdasarkan pulau asalnya di Indonesia. 1.4.
Batasan Masalah
Batasan penelitian ini, antara lain : 1. Mengetahui keakuratan metode K-mean Clustering dalam mengelompokkan lagu daerah berdasarkan pulau asalnya di Indonesia. 2. Pengujian akurasi menggunakan metode precision. 3. Format lagu daerah adalah wave (.wav). 4. Proses extract feature menggunakan metode Mel-frequency Cepstral Coefficient (MFCC) yang terdapat dalam aplikasi jAudio. 5. MFCC menghasilkan banyak koefisien yang dapat dijadikan fitur untuk penelitian. Penelitian ini menggunakan 13 koefisien karena koefisien lebih dari 13 dianggap tidak berpengaruh banyak.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
4
6. Hanya menggunakan 10 lagu daerah untuk mewakili setiap pulau. Pulau yang dipakai untuk penelitian ini adalah pulau Jawa, Sumatera dan Maluku. 7. Penelitian menggunakan software Netbeans IDE 8.0.1 dengan bahasa pemrograman Java. 1.5.
Manfaat Penelitian
Manfaat dari penelitian ini untuk mengetahui akurasi metode KMeans Clustering dalam mengelompokkan lagu daerah berdasarkan pulau asalnya di Indonesia.
1.6.
Metodologi Penelitian
Tahapan yang dilakukan dalam pembuatan tugas akhir adalah :
1. Studi Pustaka Pada tahap ini mempelajari informasi yang berhubungan dengan skripsi ini. Informasi dapat diperoleh dari buku - buku referensi atau sumber - sumber yang berkaitan dengan skripsi ini, baik dari text book maupun internet.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
5
2. Analisis dan Perancangan Penelitian Pada tahap ini dilakukan analisis terhadap masalah, proses, cara kerja, dan solusi. Selain itu, dilakukan perancangan terhadap data dan penelitian secara keseluruhan.
3. Implementasi Program Pada tahap ini dilakukan penerapan implementasi dengan pengkodean program perangkat lunak pengujian akurasi dengan menggunakan bahasa pemrograman Java.
4. Pengujian dan Analisa Penelitian Pengujian dilakukan untuk memastikan akurasi metode kmeans clustering dalam clustering lagu daerah berdasarkan pulau asal di Indonesia. Lalu melakukan analisa tentang hasil yang diperoleh dari pengujian penelitian. 1.7.
Sistematika Penulisan
Dalam tulisan ini ada enam buah bab, sebagai berikut :
BAB I PENDAHULUAN Berisi pendahuluan yang akan dibahas meliputi latar belakang masalah, rumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian dan sistematika penulisan.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
6
BAB II LANDASAN TEORI Berisi konsep - konsep yang akan digunakan sebagai acuan dalam penelitian.
BAB III ANALISIS DAN PERANCANGAN PENELITIAN Berisi analisis dan perancangan yang akan digunakan dalam penelitian keakuratan metode k-means clustering untuk mengelompokkan lagu daerah berdasarkan pulau asalnya di Indonesia.
BAB IV IMPLEMENTASI Berisi implementasi dan penjelasan fungsi program dari penelitian yang dibuat.
BAB V ANALISIS HASIL Berisi analisis dan hasil dari pengujian yang dilakukan.
BAB VI KESIMPULAN DAN SARAN Berisi kesimpulan dan saran dari analisis pengujian yang dilakukan.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
7
BAB II LANDASAN TEORI Pada bab ini akan dijelaskan mengenai teori - teori yang menjadi landasan untuk mengembangkan penelitian beserta perangkatnya. Teori - teori yang akan dibahas antara lain musik traditional/lagu daerah, pengenalan pola, Audio Feature Extraction, Mel-frequency Cepstral Coefficients (MFCC), Clustering, algoritma K-Means Clustering dan aplikasi jAudio. 2.1.
Musik Tradisional / Lagu Daerah
Musik tradisional adalah musik atau seni suara yang berasal dari berbagai daerah, dalam hal ini di Indonesia. Musik tradisional adalah musik yang lahir dan berkembang di suatu daerah tertentu dan diwariskan secara turun temurun dari satu generasi ke generasi berikutnya. Musik ini menggunakan bahasa, gaya, dan tradisi khas daerah setempat. Secara umum, musik tradisional memiliki ciri khas sebagai berikut : a) Dipelajari Secara Lisan Sebagai bagian dari kebudayaan, musik daerah diwariskan secara turun temurun. Proses pewarisan musik ini biasanya dilakukan secara lisan. Generasi tua mengajarkan komposisi musik daerah kepada generasi muda. Anak-anak itu akan meneruskannya pula kepada anak-anak mereka. Demikian seterusnya, sehingga tradisi musik tersebut tetap dikenal oleh masyarakat. Atau orang yang telah mahir memainkan instrumen musiknya atau terampil menyanyikan lagu-lagu daerah akan memberikan contoh
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
8
kepada pengikutnya untuk kemudian ditirukan. Orang yang belajar harus menghapalkannya tanpa ada catatan. Dengan terus berlatih, ia akan menguasai semakin banyak lagu dan teknik. b) Tidak Memiliki Notasi Proses pembelajaran yang berlangsung secara lisan membuat partitur (naskah musik) menjadi suatu hal yang tidak terlalu penting. Oleh karena itu, sangat lazim jika musik tradisional daerah tidak memiliki partitur notasi tertentu. Walau demikian, ada beberapa daerah yang memiliki notasi musik seperti di Pulau Jawa dan Bali. Namun, notasi ini tetap tidak memiliki partitur, tapi dipelajari secara lisan. Sebenarnya, hal ini dikemudian hari dapat menimbulkan masalah. Jika orang-orang yang belajar tentang kesenian itu semakin sedikit atau malah tidak ada, kesenian tersebut bisa punah. Tanpa catatan tertulis, orang lain tidak bisa melestarikannya. c) Bersifat Informal Musik Tradisional sangat lazim digunakan sebagai suatu bentuk ekspresi masyarakat. Musik ini banyak digunakan dalam kegiatan rakyat biasa sehingga bersifat lebih sederhana dan informal / santai. Hanya jika digunakan di kalangan istana saja jenis musik ini menjadi lebih kompleks dan formal / serius.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
9
d) Pemainnya Tidak Terspesialisasi Sistem yang dikembangkan dalam proses belajar instrumen musik daerah biasanya bersifat generalisasi. Pemain musik tradisional belajar untuk dapat memainkan setiap instrumen yang ada dalam suatu jenis musik daerah. Mereka akan belajar memainkan instrumen mulai dari yang termudah sampai yang terumit. Jadi, pemain musik daerah yang sudah mahir mempunyai kemampuan untuk memainkan semua instrumen musik tersebut. e) Syair Lagu Berbahasa Daerah Selain syair yang menggunakan bahasa daerah, musik tradisional juga menggunakan alunan melodi dan irama yang menunjukkan ciri khas kedaerahan. Misalnya, syair lagu dari daerah Jawa . Alunan melodinya pun menggunakan nada-nada dari tangga nada pelog dan slendro. Contoh lainnya, syair lagu dari daerah Jakarta umumnya berbahasa Betawi dan alunan melodinya tersusun atas tangga-tangga nada diatonis. f) Lebih Melibatkan Alat Musik Daerah Umumnya, permainan musik dalam lagu-lagu daerah di Indonesia dibawakan dengan alat-alat musik khas dari daerah-daerah itu sendiri. Contoh, lagu -lagu daerah Jawa umumnya diiringi oleh alat musik khas Jawa, yaitu gamelan. Contoh lainnya, lagu-lagu daerah Sulawesi Utara umumnya diiringi alat musik khas Sulawesi Utara, yaitu Kulintang.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
10
g) Merupakan Bagian dari Budaya Masyarakat Musik tradisional merupakan salah satu bentuk kebudayaan yang berkembang di dalam kehidupan masyarakat. Oleh karena itu, setiap ciri kebudayaan masyarakat Sang Penciptanya pasti sudah melekat erat didalamnya. Musik daerah merupakan salah satu bentuk gambaran kebudayaan suatu daerah, selain tarian, pakaian, dan adat kebiasaan lainnya. Melalui musik daerah, kita dapat mengenali daerah asal musik itu dan ciri budaya masyarakatnya. Misalnya : ketika kita mendengarkan permainan gamelan Jawa kita akan langsung mengetahui kalau itu adalah musik daerah Jawa Tengah, bukan Sunda. Kita dapat mengenalinya lewat karakter permainan gamelan terutama lewat suara, irama, dan lagunya. Karakter inilah yang menggambarkan ciri khas adat Jawa. Salah satu contohnya adalah irama musik gamelan Jawa yang umumnya terdengar melantun halus dan lembut. Hal ini menunjukkan budaya orang Jawa yang menekankan tutur kata yang halus, ramah, dan sopan. Dari pengertian dan ciri-ciri musik tradisional tersebut, peneliti dapat mengambil kesimpulan bahwa musik tradisi cenderung bersifat eksklusif. Artinya, musik ini tidak dapat dinikmati secara luas oleh masyarakat di luar kebudayaan yang melahirkan musik tersebut. Komposisi, fungsi, nilai, dan karakteristik syair musik tradisi suatu masyarakat sangatlah khas sehingga tidak mudah untuk dinikmati atau diterima sebagai bagian dari kebudayaan masyarakat lain. Oleh karena itu, musik tradisi cenderung kurang dapat berkembang sehingga musik ini
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
11
sering disebut sebagai musik tradisional. (Matius Ali, 2006 dan Hartaris A.T., 2007) 2.2.
Pengenalan Pola
Pengenalan pola bertujuan menentukan kelompok atau kategori pola berdasarkan ciri-ciri yang dimiliki oleh pola tersebut. Dengan kata lain, pengenalan pola membedakan suatu objek dengan objek yang lain. Pengenalan pola sendiri merupakan cabang dari kecerdasan buatan (Artificial Inteligence). Beberapa definisi tentang pengenalan pola, di antaranya: Suatu ilmu untuk mengklasifikasikan atau menggambarkan sesuatu berdasarkan pengukuran kuantitatif fitur (ciri) atau sifat utama dari suatu obyek. (Putra, Darma, 2010). Penentuan suatu objek fisik atau kejadian ke dalam salah satu atau beberapa kategori. (Duda dan Hart dalam Al Fatta, Hanif, 2009). Berdasarkan definisi di atas, pengenalan pola dapat didefinisikan sebagai cabang kecerdasan buatan yang menitikberatkan pada metode pengklasifikasian
objek
ke
dalam
kelas-kelas
tertentu
untuk
menyelesaikan masalah tertentu. Pengenalan pola merupakan cabang dari kecerdasan buatan yang saat ini berkembang pesat untuk mendukung aspek keamanan suatu
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
12
sistem. Saat ini, aplikasi-aplikasi pengenalan pola juga sudah sangat beragam, di antaranya: a) Voice recognition yang menggunakan pengenalan suara sebagai kunci bagi pengguna sistem. b) Fingerprint identification yang menggunakan pengenalan sidik jari sebagai kunci telah dipakai secara luas sebagai pengganti password atau pin untuk mengakses sistem tertentu. c) Face identification yang menggunakan pengenalan wajah sebagai kunci bagi pengguna sistem, bahkan saat ini badan penegak hukum sedang mengembangkan sistem untuk mengidenfikasi para buronan dengan melakukan scanning pada wajah para pelaku kejahatan yang sudah didatabase-kan berdasarkan foto pelaku kejahatan tersebut. d) Handwriting identification yang menggunakan pengenalan tulisan yang telah secara luas digunakan oleh sistem perbankan untuk membuktikan pelaku transaksi adalah orang yang benar-benar berhak. e) Optical Character Recognition (OCR) yang secara luas digunakan pada counter pengecekan barang. f) Robot vision yang digunakan oleh aplikasi robotik dalam mengenali objek tertentu pada lingkungan yang unik.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
2.3.
13
Audio Feature Extraction
Ekstraksi fitur audio adalah proses otomatis penggalian informasi tentang karakteristik file audio yang kemudian dapat digunakan untuk tujuan seperti mengklasifikasikan dan menganalisis audio. Ekstraksi fitur audio melibatkan sejumlah langkah, termasuk parsing dan berpotensi dekompresi sampel audio dari file di mana mereka disimpan, pra pengolahan sampel sehingga mereka secara tepat dipersiapkan untuk fitur tertentu yang akan diekstraksi dan akhirnya, penggalian fitur sendiri, yang dapat dihitung berdasarkan sampel dasar, fitur lain yang telah diekstraksi, atau keduanya. Salah satu aplikasi untuk ekstraksi fitur audio adalah jAudio (McEnnis, Daniel, Ichiro Fujinaga, Cory McKay, Philippe DePalle. 2005). 2.3.1. Aplikasi jAudio
jAudio
adalah komponen jMIR
dikhususkan untuk
penggalian fitur dari data audio dan melakukan semua langkah diatas. Hal ini dirancang untuk digunakan secara langsung sebagai audio ekstraksi fitur aplikasi perangkat lunak sederhana serta platform iteratif untuk mengembangkan fitur baru yang kemudian dapat dibagi di antara para peneliti. Ekstraktor fitur audio yang meliputi implementasi dari 26 fitur inti, termasuk fitur yang terbukti dalam penelitian MIR dan lebih eksperimental fitur bermakna perseptual. jAudio menempatkan penekanan lebih besar pada perpanjangan dari komponen jMIR lainnya, dan termasuk
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
14
implementasi metafeatures dan agregator yang dapat digunakan untuk secara otomatis menghasilkan lebih banyak fitur dari fitur inti (misalnya, standar deviasi, turunan, dan lain-lain). Sejumlah alat untuk memfasilitasi pengembangan dan pengujian fitur baru juga disertakan, seperti waktu dan frekuensi domain visualisasi alat; fungsi perekaman audio; sintesis data uji; Audio konversi format file; dan MIDI ke fungsi konversi audio. Parameter ekstraksi fitur seperti ukuran jendela, tumpang tindih, downsampling dan normalisasi juga dapat diatur oleh pengguna. (McEnnis, Daniel, Ichiro Fujinaga, Cory McKay, Philippe DePalle. 2005). 2.3.2. Mel-frequency Cepstral Coefficients (MFCC)
Mel frekuensi koefisien cepstral fitur adalah spektral berbasis jangka pendek yang digunakan oleh banyak peneliti untuk pengenalan suara (W. Walker, P. Lamere, P. Kwok, B. Raj, E. Gouvea, P. Wolf, and J. Woelfel, 2004), sistem pencarian (J. T. Foote, 1997), musik summarization (B. Logan and S. Chu, 2000), diskriminasi pidato / musik (B. Logan, 2000). Kekuatan MFCC terletak pada kemampuannya untuk perwakilan kompak spektrum amplitudo.
Langkah-langkah
untuk
menghitung
MFCC
sebagaimana diuraikan dalam (L. R. Rabiner and B. H. Juang, 1993) telah ditunjukkan pada gambar 2.1 dibawah ini.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
15
Gambar 2. 1 Diagram Blok Mel - Frekuensi Koefisien Cepstral Sinyal audio pertama dibagi menjadi beberapa frame durasi tetap. Frame dapat terdiri dari sampel yang tumpang tindih dengan frame sebelumnya. Untuk meminimalkan diskontinuitas pada awal dan akhir frame fungsi windowing (window Hamming adalah salah satu yang paling banyak digunakan) yang juga diterapkan pada frame. Spektrum amplitudo untuk masing-masing (windowed) frame diperoleh dengan menerapkan Discrete Fourier Transform (DFT). Sebagai hubungan antara kenyaringan yang dirasakan dan spektrum amplitudo lebih logaritmik linear, logaritma dari amplitudo diambil. Dengan demikian, spektrum dimensi N diperoleh di mana N adalah ukuran frame. Spektrum ini dihaluskan untuk membuatnya bermakna perseptual. Cara termudah untuk melakukan hal ini untuk mempertimbangkan spektrum rata-rata selama frekuensi bin. Tapi ditempatkan terpisah pada jarak yang sama atas skala frekuensi tidak sesuai sistem pendengaran manusia sebagai frekuensi dirasakan dan frekuensi sinyal tidak berhubungan linier. Hal ini menyebabkan perkembangan frekuensi Mel. Relasi dapat dinyatakan sebagai berikut.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
16
di mana, f dan fm adalah frekuensi sinyal dan frekuensi yang sesuai Mel masing-masing. Pemetaan adalah sekitar linier bawah 1kHz dan logaritma di atas. Dengan demikian, logaritma dari spektrum amplitudo yang diperoleh setelah DFT dipetakan ke skala Melfrekuensi dan dihaluskan dengan mempertimbangkan sampah selama Mel skala. Unsur-unsur di vektor Mel-spektrum yang dihaluskan sangat berkorelasi. Untuk decorrelate dan untuk mengurangi jumlah parameter DCT dilakukan untuk memperoleh Mel frekuensi koefisien cepstral dan pertama 13 koefisien diambil sebagai fitur untuk frame. Dengan demikian, koefisien c [n] dapat direpresentasikan sebagai
di mana, 0 < n < L-1, X [k] menjadi Mel-spektrum yang dihaluskan sinyal input x [n] dan L adalah jumlah elemen dalam vektor Melspektrum yang dihaluskan.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
2.4.
17
Clustering
Tujuan utama dari metode cluster adalah pengelompokan sejumlah data/obyek ke dalam cluster (group) sehingga dalam setiap cluster akan berisi data semirip mungkin (Santoso, 2007). Dalam clustering kita berusaha untuk menempatkan obyek yang mirip satu sama lain dan sangat berbeda dengan obyek dalam cluster - cluster yang lain. K-means clustering adalah salah satu teknik unsupervised learning dimana tidak memiliki 'label' untuk fase learning. Clustering terbagi menjadi beberapa, yaitu (Zaiane, 1999) : 1. Partitioning Clustering Partitioning clustering disebut juga exclusive clustering dimana setiap data harus termasuk dalam cluster tertentu dan memungkinkan bagi setiap data yang termasuk cluster tertentu pada suatu tahapan proses, pada tahapan berikutnya berpindah ke cluster yang lain. 2. Hierarchical Clustering Pada Hierarchical Clustering setiap data harus masuk ke dalam cluster tertentu, namun suatu data yang masuk ke dalam cluster tertentu pada suatu tahapan proses tidak dapat berpindah ke cluster lain pada proses berikutnya. Contoh : Single Linkage, Centroid Linkage, Complete Linkage, Average Linkage
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
18
3. Overlapping Clustering Overlapping Clustering mengijinkan setiap data masuk ke beberapa cluster berbeda dan data mempunyai nilai keanggotaan pada beberapa cluster. Contoh : Fuzzy C-means, Gaussian Mixture 4. Hybrid Hybrid merupakan kombinasi dari karakteristik partitioning, overlapping dan hierarchical. 2.5.
Algoritma K-Means
Ada dua jenis clustering yang sering digunakan dalam proses pengelompokkan data, yaitu hierarchical data clustering dan nonhierarchical data clustering. K-means clustering merupakan salah satu metode data clustering non hirarki yang berusaha memisahkan data yang ada ke dalam bentuk satu atau lebih cluster. Metode ini mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain. Tujuan dari data clustering ini adalah untuk meminimalisasi objective function yang diatur dalam proses clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam suatu cluster dan memaksimalisasikan variasi antar cluster. Data clustering menggunakan
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
19
metode K-Means ini secara umum dilakukan dengan algoritma dasar sebagai berikut. 1. Tentukan jumlah cluster. 2. Alokasikan data ke dalam cluster secara random. 3. Hitung centroid / rata- rata dari data yang ada di masing - masing cluster. 4. Alokasikan masing - masing data ke centroid / rata - rata terdekat. 5. Kembali ke langkah 3, apabila masih ada data yang berpindah cluster atau apabila perubahan nilai centroid, ada yang di atas nilai threshold yang ditentukan atau apabila perubahan nilai pada objective function yang digunakan di atas nilai threshold yang ditentukan. Gambar 2.2 merupakan diagram algoritma K-Means secara umum.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
20
START
Inisialisasi jumlah K
Tentukan centroid
Hitung jarak dengan centroid
Kelompokkan dengan centroid terdekat
Hitung centroid baru
F
Centroid tetap?
T
FINISH
Gambar 2. 2 Diagram Algoritma K-Means Ada beberapa kelebihan pada algoritma K-Means, yaitu (S. Russell and P. Norvig, 2010) :
1. Mudah untuk diimplementasikan dan dijalankan. 2. Waktu yang dibutuhkan untuk menjalankan pembelajaran ini relatif cepat. 3. Mudah untuk diadaptasi. 4. Umum digunakan.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
Algoritma
k-means
memiliki
beberapa
kelebihan,
namun
21
ada
kekurangannya juga. Kekurangan dari algoritma tersebut yaitu :
1. Sebelum
algoritma
dijalankan,
k
buah
titik
diinisialisasi
secara random sehingga pengelompokkan data yang dihasilkan dapat berbeda-beda (X. Wu and V. Kumar, eds., 2009). Jika nilai random untuk inisialisasi kurang baik, maka pengelompokkan yang dihasilkan pun menjadi kurang optimal. 2. Dapat terjebak dalam masalah yang disebut curse of dimensionality. Hal ini dapat terjadi jika data pelatihan memiliki dimensi yang sangat tinggi (Contoh jika data pelatihan terdiri dari 2 atribut maka dimensinya adalah 2 dimensi. Namun jika ada 20 atribut, maka akan ada 20 dimensi). Salah satu cara kerja algoritma ini adalah mencari jarak terdekat antara k buah titik dengan titik lainnya. Jika mencari jarak antar titik pada 2 dimensi, masih mudah dilakukan. Namun bagaimana mencari jarak antar titik jika terdapat 20 dimensi. Hal ini akan menjadi sulit. 3. Jika hanya terdapat beberapa titik sampel data, maka cukup mudah untuk
menghitung dan mencari titik terdekat dengan k titik yang diinisialisasi secara random. Namun jika terdapat banyak sekali titik data (misalnya satu milyar buah data), maka perhitungan dan pencarian titik terdekat akan membutuhkan waktu yang lama. Proses tersebut dapat dipercepat, namun dibutuhkan struktur data yang lebih rumit seperti kD-Tree atau hashing.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
22
BAB III ANALISIS DAN PERANCANGAN PENELITIAN Bab ini akan menjelaskan tentang rancangan penelitian yang akan dilakukan penulis. Penelitian ini berfungsi untuk menganalisa tingkat akurasi metode K-Means Clustering dalam mengelompokkan lagu daerah berdasarkan pulau asalnya di Indonesia. 3.1.
Perancangan Penelitian Secara Umum
Penelitian ini digunakan untuk menganalisa tingkat akurasi metode K-Means Clustering dalam mengelompokkan lagu daerah berdasarkan pulau asalnya yang terdapat di Indonesia. Ekstraksi fitur lagu daerah dilakukan dengan menggunakan aplikasi jAudio dan hasil dari ekstraksi fitur yang berupa data numerik disimpan ke dalam database sebelum diproses lagi. Data yang sudah disimpan di dalam database, kemudian diproses dengan algoritma K-Means Clustering untuk mencari cluster prediksi dari tiap - tiap lagu daerah tersebut. Setelah cluster prediksi tiap lagu sudah didapatkan, kemudian hasil cluster prediksi tersebut dicocokkan dengan actual cluster yang sesuai dengan pulau asal dari lagu tersebut. Kemudian dihitung total bobot perbandingan antara cluster prediksi dengan actual cluster. Dalam penelitian ini, pengujian dilakukan berdasarkan precision tertinggi.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
23
Langkah - langkah penelitian secara umum dapat dilihat pada gambar 3.1 dibawah ini.
Data lagu berekstensi .wav
Data disimpan di dalam database
Feature Extraction
Inisialisasi jumlah K
Tentukan centroid
Hitung jarak dengan centroid
Kelompokkan dengan centroid terdekat
Hitung centroid baru
F Centroid tetap? T
Menghitung akurasi
Gambar 3. 1 Diagram Blok Penelitian Secara Umum
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
3.2.
24
Data Preprocessing atau Pembuatan Data
Dalam penelitian ini, format lagu daerah yang digunakan adalah MIDI yang berformat .wav dengan jumlah lagu daerah sebanyak 30 lagu dari 3 pulau di Indonesia yaitu Sumatera, Jawa dan Maluku. Panjang data maksimal 60s, sampling rate 44000Hz, 16 bits. Data diproses dengan menggunakan algoritma MFCC (Mel - Frekuensi Cepstral Coefisien) dengan menggunakan aplikasi jAudio. MFCC merupakan algoritma yang banyak digunakan untuk speech processing dan music retrieval berbasis timbral. Output dari aplikasi jAudio adalah merupakan data numerik berformat
.txt.
jAudio
memproses
semua
lagu
daerah
dengan
menggunakan algoritma MFCC dan menghasilkan 13 koefisien pada setiap lagu daerah tersebut. Gambar 3.2 ini merupakan output dari jAudio.
Gambar 3. 2 Output jAudio
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
25
Setelah output dari jAudio didapatkan, kemudian data tersebut disimpan dalam Microsoft Excel untuk disimpan lagi dalam database. Gambar 3.3 merupakan tabel database hasil preprocessing menggunakan jAudio.
Gambar 3. 3 Database Hasil jAudio
3.3.
Proses Clustering
Pada tahap clustering akan menggunakan algoritma K-Means. Setelah data di proses ekstraksi fitur, maka data yang siap diolah dimasukan ke dalam database. Kemudian data tersebut dihitung menggunakan algoritma K-Means untuk mendapatkan cluster dari setiap lagu daerah. Gambar 3.4 di bawah menunjukkan proses dari clustering menggunakan algoritma K-Means.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
26
Data siap diolah
Tentukan 3 centroid awal
Hitung jarak semua data dengan centroid
Kelompokkan data dengan centroid terdekat
Hitung centroid baru
F
Centroid tetap?
T Cluster Final
Gambar 3. 4 Diagram Blok Proses Clustering dengan Algoritma K-Means
3.4.
Proses Pengujian
Dalam penelitian ini, pengujian akurasi dilakukan berdasarkan nilai precision tertinggi dari perbandingan cluster prediksi dengan actual cluster. Precision adalah jumlah kelompok dokumen relevan dari total jumlah dokumen yang ditemukan oleh sistem (Hardi, 2006: 22). Precision juga merupakan cara mengukur tingkat efektivitas sistem information
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
27
retrieval. Pengukuran tingkat ketepatan (precision) dalam kegiatan penelusuran menurut Hasugian (2006: 5):
Precision =
Jumlah dokumen relevan yang terambil Jumlah dokumen yang terambil dalam pencarian
Langkah - langkah dalam pengujian akurasi adalah sebagai berikut 1. Bandingkan cluster prediksi dengan actual cluster semua lagu daerah. 2. Hitung bobot dari semua perbandingan cluster prediksi dengan actual cluster. 3. Hitung nilai precision setiap perbandingan cluster berdasarkan bobot dari perbandingan cluster prediksi dengan actual cluster. 4. Pilih cluster berdasarkan nilai precision yang tertinggi. 5. Hitung bobot cluster yang dipilih berdasarkan nilai precision tertinggi. 6. Hitung akurasi berdasarkan jumlah bobot cluster.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
3.5.
28
Spesifikasi Hardware dan Software
Berikut adalah spesifikasi hardware dan software yang digunakan dalam penelitian ini. 3.5.1. Hardware
1. Processor : Intel(R) Core(TM) i7-2630QM CPU @ 2.00 GHz 2. Memory (RAM) : 8.00 GB 3. System type : 64-bit Operating System 3.5.2. Software
1. Windows 7 Home Premium 2. jAudio (McEnnis, Daniel, Ichiro Fujinaga, Cory McKay, Philippe DePalle. 2005) 3. Netbeans IDE 8.0.1
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
29
BAB IV ANALISIS DAN IMPLEMENTASI PENELITIAN Pada bab ini akan dijelaskan tentang implementasi penelitian. 4.1.
Implementasi menentukan centroid awal
Pada langkah menentukan centroid awal, centroid diambil berdasarkan id dari lagu daerah. Setelah id dari lagu daerah dipilih, maka data fitur diambil berdasarkan id dari lagu daerah tersebut. Berikut ini merupakan list code untuk menentukan centroid awal. void setCentroidAwal(int[] idCentroid) { //method yang digunakan untuk menentukan centroid awal berdasarkan id centroid centroid = new double[idCentroid.length][fitur.size()]; for (int i = 0; i < idCentroid.length; i++) { for (int j = 0; j < fitur.size(); j++) { centroid[i][j]
=
((Double[])
fitur.get(j))[idCentroid[i]]; } } cluster = new int[((Double[]) fitur.get(0)).length];
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
30
System.out.println(""); } Gambar 4. 1 Menentukan Centroid Awal
4.2.
Implementasi clustering dengan metode K-Means
Program akan memproses algoritma K-Means dengan metode proses. Data yang akan diolah dalam metode proses diambil dari database. Berikut ini merupakan list code algortma K-Means. void proses() throws SQLException { int[]
clusterLama
=
new
int[((Double[])
fitur.get(0)).length]; int iterasi = 0;
List<String>
judul_musik
=
DatabaseControl.getDatabaseControl().getJudulMusik(); String[]
judul
=
judul_musik.toArray(new
String[judul_musik.size()]);
do { iterasi++; System.out.println("Iterasi ke - " + iterasi); System.out.println("");
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
31
for (int i = 0; i < centroid.length; i++) { for (int j = 0; j < centroid[i].length; j++) { System.out.print(centroid[i][j] + " "); } System.out.println(""); }
System.out.println("");
System.arraycopy(cluster,
0,
clusterLama,
0,
clusterLama.length); for (int i = 0; i < ((Double[]) fitur.get(0)).length; i++) { double[] distance = new double[centroid.length]; for (int j = 0; j < distance.length; j++) { distance[j] = 0.0; for (int k = 0; k < fitur.size(); k++) { distance[j]
+=
Math.pow(((Double[])fitur.get(k))[i]
-
centroid[j][k],
2);//euclidian distance //distance[j]
+=
Math.abs(((Double[])
fitur.get(k))[i] - centroid[j][k]);//manhattan } distance[j] = Math.sqrt(distance[j]);
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
32
System.out.print(distance[j]+" "); } System.out.println(""); int indexMin = 0; for (int j = 1; j < distance.length; j++) { if (distance[j] < distance[indexMin]) { indexMin = j; } }
cluster[i] = indexMin + 1; }
System.out.println(""); System.out.println("CLUSTER"); System.out.println("---------------------------------------------------"); for (int i = 0; i < centroid.length; i++) { int jumData = 0; double[] newCentroid = new double[fitur.size()]; for (int j = 0; j < ((Double[]) fitur.get(0)).length; j++) { if (cluster[j] == i + 1) { jumData++;
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
33
for (int k = 0; k < newCentroid.length; k++) { newCentroid[k]
+=
((Double[])
fitur.get(k))[j]; } } } for (int j = 0; j < newCentroid.length; j++) { newCentroid[j] = newCentroid[j] / jumData; } centroid[i] = newCentroid; }
for (int i = 0; i < cluster.length; i++) { System.out.println(judul[i] +" = "+ cluster[i]); } System.out.println(""); } while (!checkCluster(clusterLama)); }
boolean checkCluster(int[] clusterLama) { boolean sama = true; for (int i = 0; i < clusterLama.length; i++) { if (cluster[i] != clusterLama[i]) {
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
34
sama = false; break; } } return sama; }
public int[] getCluster() { return cluster; } } Gambar 4. 2 Clustering dengan K-Means
4.3.
Implementasi pengujian akurasi berdasarkan nilai precision tertinggi.
Langkah terakhir dalam penelitian ini adalah pengujian akurasi. Pengujian akurasi dalam penelitian ini menggunakan nilai precision tertinggi dari perbandingan predicted cluster dengan actual cluster. Berikut ini merupakan list code untuk pengujian akurasi berdasarkan nilai precision tertinggi. public void Uji_Precision(int[] pred, int[] act, int centroid) { int[][] precision = new int[centroid][centroid]; int[] totBaris = new int[centroid];
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
35
for (int i = 0; i < pred.length; i++) { precision[pred[i] - 1][act[i] - 1]++; totBaris[pred[i] - 1]++; }
float[][] prec = new float[centroid][centroid]; for (int i = 0; i < prec.length; i++) { float[] persen1 = prec[i]; for (int j = 0; j < persen1.length; j++) { prec[i][j] = ((float) precision[i][j]) / totBaris[i]; } } System.out.println("Precision
Setiap
Cluster"); for (int i = 0; i < precision.length; i++) { int[] cm1 = precision[i]; for (int j = 0; j < cm1.length; j++) { int d = cm1[j]; //
System.out.print(d+" "); System.out.print(prec[i][j] + " "); }
//
System.out.println(totBaris[i]); System.out.println(" ");
Perbandingan
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
}
ArrayList
arr1 = new ArrayList(); ArrayList arr2 = new ArrayList(); for (int i = 0; i < centroid; i++) { int indexMax1 = 0; int indexMax2 = 0; float max = -1; for (int j = 0; j < centroid; j++) { if (arr1.contains(j)) { continue; } for (int k = 0; k < centroid; k++) { if (arr2.contains(k)) { continue; } if (prec[j][k] > max) { indexMax1 = j; indexMax2 = k; max = prec[j][k]; } } } arr1.add(indexMax1);
36
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
37
arr2.add(indexMax2); }
int jumBenar = 0; float akurasi = 0;
System.out.println(" "); System.out.println("Cluster yang diambil berdasarkan precision tertinggi"); for (int i = 0; i < arr1.size(); i++) { System.out.println((arr1.get(i) + 1) + " -> " + (arr2.get(i) + 1 + " ")); jumBenar += precision[arr1.get(i)][arr2.get(i)]; }
int tot = 0; for (int i = 0; i < totBaris.length; i++) { tot += totBaris[i]; }
System.out.println(""); System.out.println("Jumlah Benar = " + jumBenar); System.out.println("Akurasi jumBenar) / tot * 100 + "%");
= " + ((float)
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
} Gambar 4. 3 Pengujian Akurasi
38
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
39
BAB V HASIL DAN PEMBAHASAN Hal yang utama dalam pembahasan bab ini adalah analisa hasil tingkat akurasi dari pengujian algoritma k-means clustering dalam mengelompokkan lagu daerah berdasarkan pulau asalnya. Pengujian tingkat akurasi dilakukan dengan melibatkan centroid yang dipilih, banyaknya iterasi, nilai precision tertinggi dan bobot cluster yang diambil berdasarkan nilai precision tertinggi. 5.1.
Hasil Pengukuran
Hasil pengukuran didapatkan dengan mencocokan hasil cluster prediksi yang dilakukan oleh sistem dengan actual cluster yang telah ditetapkan oleh penguji berdasarkan manual book dengan cara inisialisasi. Inisialisasi
dilakukan
untuk
mempermudah
peneliti
dalam
membandingkan cluster prediksi dengan actual cluster. Dibawah ini merupakan tabel inisialisasi cluster tiap pulau.
Tabel 5. 1 Inisialisasi Cluster Tiap Pulau Pulau Sumatra Jawa Maluku
Inisialisasi Cluster 1 2 3
Pada pengujian yang dilakukan, jumlah data lagu daerah terdapat 30 lagu dari 3 pulau. Setiap pulau diwakili oleh 10 lagu daerah. Dibawah ini merupakan tabel lagu daerah yang digunakan dalam penelitian ini beserta inisialisasi pulau.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
Tabel 5. 2 Lagu Daerah dengan Actual Cluster 1 JUDUL Bungong Jeumpa.wav Dodoi Si Dodoi.wav Gelang Sipaku Gelang.wav Kampuang Nan Jauh Dimato.wav Lancang Kuning.wav Lisoi.wav Na Sonang Do Hita Nadua.wav Opio.wav Sinanggar Tulo.wav Soleram.wav
Actual 1 1 1 1 1 1 1 1 1 1
Tabel 5. 3 Lagu Daerah dengan Actual Cluster 2 JUDUL Bubuy Bulan.wav Cublak - Cublak Suweng.wav Es Lilin.wav Gambang Suling.wav Gundul - Gundul Pacul.wav Jaranan.wav Peuyeum Bandung.wav Suwe Ora Jamu.wav Tokecang.wav Warung Pojok.wav
Actual 2 2 2 2 2 2 2 2 2 2
Tabel 5. 4 Lagu Daerah dengan Actual Cluster 3 JUDUL Ayo Mama.wav Buka Pintu.wav Burung Kakak Tua.wav Burung Tantina.wav Hela Rotan.wav Naik - Naik Ke Puncak Gunung.wav Nona Manis Siapa Yang Punya.wav Rasa Sayange.wav Sari Nande.wav Waktu Hujan Sore - Sore.wav
Actual 3 3 3 3 3 3 3 3 3 3
40
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
5.2.
41
Skenario Pengujian
Di
bawah
ini
merupakan
langkah
-
langkah
pengujian
menggunakan centroid awal lagu Bungong Jeumpa, Gundul – Gundul Pacul dan Waktu Hujan Sore - Sore : 1. Bandingkan predicted cluster dengan actual cluster semua lagu daerah. Tabel dibawah merupakan tabel perbandingan antara predicted cluster dengan actual cluster dari semua lagu daerah.
Tabel 5. 5 Perbandingan Cluster JUDUL Ayo Mama.wav Bubuy Bulan.wav Buka Pintu.wav Bungong Jeumpa.wav Burung Kakak Tua.wav Burung Tantina.wav Cublak - Cublak Suweng.wav Dodoi Si Dodoi.wav Es Lilin.wav Gambang Suling.wav Gelang Sipaku Gelang.wav Gundul - Gundul Pacul.wav Hela Rotan.wav Jaranan.wav Kampuang Nan Jauh Dimato.wav Lancang Kuning.wav Lisoi.wav Na Sonang Do Hita Nadua.wav Naik - Naik Ke Puncak Gunung.wav Nona Manis Siapa Yang Punya.wav Opio.wav Peuyeum Bandung.wav Rasa Sayange.wav Sari Nande.wav
Predicted 3 2 1 1 1 3 3 1 2 1 3 2 3 2 1 2 3 1 1 3 1 3 1 3
Actual 3 2 3 1 3 3 2 1 2 2 1 2 3 2 1 1 1 1 3 3 1 2 3 3
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
Sinanggar Tulo.wav Soleram.wav Suwe Ora Jamu.wav Tokecang.wav Waktu Hujan Sore - Sore.wav Warung Pojok.wav
2 1 1 3 3 1
42
1 1 2 2 3 2
Dalam tabel perbandingan diatas, lagu Ayo Mama.wav diprediksi oleh algoritma K-Means masuk ke dalam cluster 3 dan menurut sumbernya (actual cluster) lagu tersebut masuk ke dalam cluster 3. Lagu Buka Pintu.wav diprediksi oleh algoritma K-Means masuk ke dalam cluster 1, sedangkan menurut sumbernya (actual cluster) lagu tersebut masuk ke dalam cluster 3. 2. Hitung bobot dari semua perbandingan predicted cluster dengan actual cluster. Tabel dibawah ini merupakan tabel pembobotan dari hasil perbandingan cluster.
Tabel 5. 6 Bobot Perbandingan Predicted Cluster dengan Actual Cluster Cluster Actual Predicted 1 1 2 1 3 1 Cluster Actual Predicted 1 2 2 2 3 2 Cluster Actual Predicted
Bobot 6 3 4 Bobot 2 4 0 Bobot
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
1 2 3
3 3 3
43
2 3 6
Dari tabel pembobotan diatas, actual cluster 1 yang diprediksi oleh algoritma K-Means sebagai cluster 1 berbobot 6. Actual cluster 2 yang diprediksi oleh algoritma K-Means sebagai cluster 1 berbobot 3. Actual cluster 3 yang diprediksi oleh algoritma K-Means 3. Hitung nilai precision setiap perbandingan cluster berdasarkan bobot dari perbandingan predicted cluster dengan actual cluster. Tabel di bawah merupakan tabel nilai precision. Tabel 5. 7 Precision Perbandingan Predicted Cluster dengan Actual Cluster Cluster Actual Predicted 1 1 2 1 3 1 Cluster Actual Predicted 1 2 2 2 3 2 Cluster Actual Predicted 1 3 2 3 3 3
Bobot
Precision
6 3 4
0.4615 0.2308 0.3077
Bobot
Precision
2 4 0
0.3333 0.6667 0
Bobot
Precision
2 3 6
0.1818 0.2727 0.5455
Pada tabel diatas nilai precision dihitung dengan menggunakan persamaan:
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
Precision =
44
Bobot tiap cluster Jumlah total bobot cluster
Actual cluster 1 yang diprediksi oleh algoritma K-Means sebagai cluster 1 berbobot 6 dengan nilai precision 0.4615. Actual cluster 2 yang diprediksi oleh algoritma K-Means sebagai cluster 1 berbobot 3 dengan nilai precision 0.2308. Actual cluster 3 yang diprediksi oleh algoritma K-Means sebagai cluster 1 berbobot 4 dengan nilai precision 0.3077. Actual cluster 1 yang diprediksi oleh algoritma K-Means sebagai cluster 2 berbobot 2 dengan nilai precision 0.3333. Actual cluster 2 yang diprediksi oleh algoritma K-Means sebagai cluster 2 berbobot 4 dengan nilai precision 0.6667. Actual cluster 3 yang diprediksi oleh algoritma K-Means sebagai cluster 2 berbobot 0 dengan nilai precision 0. Actual cluster 1 yang diprediksi oleh algoritma K-Means sebagai cluster 3 berbobot 2 dengan nilai precision 0.1818. Actual cluster 2 yang diprediksi oleh algoritma K-Means sebagai cluster 3 berbobot 3 dengan nilai precision 0.2727. Actual cluster 3 yang diprediksi oleh algoritma K-Means sebagai cluster 3 berbobot 6 dengan nilai precision 0.5455.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
45
4. Pilih cluster berdasarkan nilai precision yang tertinggi.
Tabel 5. 8 Precision Tertinggi Perbandingan Predicted dengan Actual Cluster Cluster Actual Predicted 2 2 3 3 1 1
Bobot
Precision
4 6 6
0.6667 0.5455 0.4615
Berdasarkan tabel diatas cluster dengan precision tertinggi yang pertama terdapat pada actual cluster 2 dan predicted cluster 2 dengan bobot 4 dan precision 0.6667. Cluster dengan precision tertinggi yang kedua terdapat pada actual cluster 3 dan predicted cluster 3 dengan bobot 6 dan precision 0.5455. Dan cluster dengan precision tertinggi yang terakhir terdapat pada actual cluster 1 dan predicted cluster 1 dengan bobot 6 dan precision 0.4615. 5. Hitung total bobot cluster yang dipilih berdasarkan nilai precision tertinggi. Total bobot cluster merupakan jumlah dari ketiga bobot yang diambil berdasarkan precision tertinggi. Total bobot cluster dapat dilihat pada tabel 5.9.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
46
Tabel 5. 9 Total Bobot Perbandingan Predicted Cluster dengan Actual Cluster berdasarkan Precision Tertinggi Cluster Precision Actual Predicted 2 2 0.6667 3 3 0.5455 1 1 0.4615 Total Bobot Cluster
Bobot 4 6 6 16
6. Hitung akurasi berdasarkan jumlah bobot cluster. Akurasi didapatkan dengan rumus :
Akurasi =
Total Bobot Total Data
x 100 %
Jadi, pada percobaan pertama ini akurasi yang didapatkan adalah 53.33%. Dengan perhitungannya sebagai berikut
Akurasi =
16 30
x 100 %
Hasil dapat dilihat pada tabel 5.10 dibawah ini. Tabel 5. 10 Akurasi berdasarkan Precision Tertinggi Cluster Precision Bobot Actual Predicted 2 2 0.6667 4 3 3 0.5455 6 1 1 0.4615 6 Total Bobot Cluster 16 Akurasi 53.33333
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
5.3.
47
Analisa Hasil
Berdasarkan pengujian yang telah dilakukan sebanyak 30 kali, tingkat akurasi dari berbagai centroid awal menghasilkan tingkat akurasi terendah yaitu 46.67% dan akurasi tertinggi adalah 53.33%. Hasil pengujian akurasi dapat dilihat pada tabel 5.11 dibawah ini. Tabel 5. 11 Hasil Pengujian Akurasi Pengujian 1
2
3
4
5
6
7
8
9
10
Centroid Awal Bungong Jeumpa Gundul - Gundul Pacul Waktu Hujan Sore - Sore Bungong Jeumpa Cublak - Cublak Suweng Naik - Naik Ke Puncak Gunung Burung Kakak Tua Gundul - Gundul Pacul Soleram Kampuang Nan Jauh Dimato Bubuy Bulan Ayo Mama Dodoi Si Dodoi Gambang Suling Naik - Naik Ke Puncak Gunung Bungong Jeumpa Bubuy Bulan Ayo Mama Bungong Jeumpa Cublak - Cublak Suweng Buka Pintu Bungong Jeumpa Es Lilin Burung Kakak Tua Bungong Jeumpa Gambang Suling Burung Tantina Bungong Jeumpa Gundul - Gundul Pacul
Tingkat Akurasi 53.33%
53.33%
46.67%
46.67%
46.67%
53.33%
53.33%
46.67%
53.33%
53.33%
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Hela Rotan Bungong Jeumpa Jaranan Naik - Naik Ke Puncak Gunung Bungong Jeumpa Peuyeum Bandung Nona Manis Siapa Yang Punya Bungong Jeumpa Suwe Ora Jamu Rasa Sayange Bungong Jeumpa Tokecang Sari Nande Bungong Jeumpa Warung Pojok Waktu Hujan Sore - Sore Dodoi Si Dodoi Bubuy Bulan Ayo Mama Dodoi Si Dodoi Cublak - Cublak suweng Buka Pintu Gelang Sipaku Gilang Es Lilin Burung Kakak Tua Gelang Sipaku Gilang Gambang Suling Burung Tantina Kampuang Nan Jauh Dimato Gundul - Gundul Pacul Hela Rotan Kampuang Nan Jauh Dimato Jaranan Naik - Naik Ke Puncak Gunung Lancang Kuning Peuyeum Bandung Nona Manis Siapa Yang Punya Lancang Kuning Suwe Ora Jamu Rasa Sayange Lisoi Tokecang Sari Nande
46.67%
53.33%
53.33%
53.33%
53.33%
46.67%
53.33%
53.33%
53.33%
53.33%
46.67%
46.67%
46.67%
53.33%
48
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
Lisoi Warung Pojok Waktu Hujan Sore - Sore Na Sonang Do Hita Nadua Bubuy Bulan Ayo Mama Na Sonang Do Hita Nadua Cublak - Cublak Suweng Buka Pintu Opio Es lilin Burung Kakak Tua Opio Gambang Suling Burung Tantina Sinagar Tulo Gundul - Gundul Pacul Hela Rotan
25
26
27
28
29
30
49
53.33%
46.67%
53.33%
46.67%
46.67%
46.67%
Dari tabel 5.11 diatas menghasilkan akurasi rata - rata, yaitu sebesar 50.44%. 5.3.1. Kesalahan Pengelompokkan Lagu Daerah
Dalam penelitian ini, pengelompokkan lagu daerah menjadi hal yang diutamakan. Kesesuaian lagu daerah berdasarkan pulau asal diteliti dengan menggunakan metode K-Means. Dengan kata lain, akan ada beberapa lagu daerah yang masuk ke dalam cluster yang sesuai atau bahkan tidak sesuai. Dalam 30 pengujian terdapat lagu daerah dengan tingkat akurasi kebenaran yang sangat rendah. Hal ini dibuktikan dalam tabel 5.12
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
50
Tabel 5. 12 Tabel Persentase Lagu JUDUL Ayo Mama Bubuy Bulan Buka Pintu Bungong Jeumpa Burung Kakak Tua Burung Tantina Cublak - Cublak Suweng Dodoi Si Dodoi Es Lilin Gambang Suling Gelang Sipaku Gelang Gundul - Gundul Pacul Hela Rotan Jaranan Kampuang Nan Jauh Dimato Lancang Kuning Lisoi Na Sonang Do Hita Nadua Naik - Naik Ke Puncak Gunung Nona Manis Siapa Yang Punya Opio Peuyeum Bandung Rasa Sayange Sari Nande Sinanggar Tulo Soleram Suwe Ora Jamu Tokecang Waktu Hujan Sore - Sore Warung Pojok
Jumlah Benar Salah 19 11 21 9 9 21 14 16 9 21 19 11 4 26 16 14 14 16 5 25 7 23 14 16 19 11 14 16 16 14 7 23 7 23 16 14 9 21 19 11 16 14 4 26 9 21 19 11 7 23 16 14 5 25 4 26 19 11 5 25
Persentase Benar Salah 63% 37% 70% 30% 30% 70% 47% 53% 30% 70% 63% 37% 13% 87% 53% 47% 47% 53% 17% 83% 23% 77% 47% 53% 63% 37% 47% 53% 53% 47% 23% 77% 23% 77% 53% 47% 30% 70% 63% 37% 53% 47% 13% 87% 30% 70% 63% 37% 23% 77% 53% 47% 17% 83% 13% 87% 63% 37% 17% 83%
Berdasarkan tabel 5.12 maka dihasilkan tabel lagu daerah dengan tingkat persentase kesalahan, yaitu tabel 5.13 dibawah ini.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
51
Tabel 5. 13 Tabel Persentase Kesalahan JUDUL
Persentase Kesalahan
Cublak - Cublak Suweng Peuyeum Bandung Tokecang Gambang Suling Suwe Ora Jamu Warung Pojok Gelang Sipaku Gelang Lancang Kuning Lisoi Sinanggar Tulo Buka Pintu Burung Kakak Tua Naik - Naik Ke Puncak Gunung Rasa Sayange Bungong Jeumpa Es Lilin Gundul - Gundul Pacul Jaranan Dodoi Si Dodoi Kampuang Nan Jauh Dimato Na Sonang Do Hita Nadua Opio Soleram Ayo Mama Burung Tantina Hela Rotan Nona Manis Siapa Yang Punya Sari Nande Waktu Hujan Sore - Sore Bubuy Bulan
87% 87% 87% 83% 83% 83% 77% 77% 77% 77% 70% 70% 70% 70% 53% 53% 53% 53% 47% 47% 47% 47% 47% 37% 37% 37% 37% 37% 37% 30%
Pada tabel 5.13 lagu daerah Pulau Jawa yaitu Cublak – Cublek Suweng termasuk dalam lagu daerah dengan tingkat persentase kesalahan paling tinggi. Dalam 30 percobaan, lagu
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
52
Cublak – Cublak Suweng 26 kali tidak sesuai dengan cluster yang seharusnya, dengan persentase kesalahan mencapai 87%. 5.3.2. Penentuan Centroid Awal
Dalam algoritma K-Means pengambilan centroid awal sangat berpengaruh dalam pengelompokkan lagu - lagu daerah. Dalam penelitian ini, pengambilan centroid awal dilakukan secara random. Kelemahan dari metode penentuan centroid awal secara random adalah hasil yang dapat berubah - ubah dan sulit untuk mencapai global optimum. Berdasarkan tabel 5.11 salah satu pengaruh tinggi rendahnya tingkat akurasi adalah pengambilan centroid awal. Tabel 5.14 dibawah ini merupakan tabel tingkat akurasi tiap pulau. Tabel 5. 14 Akurasi Tiap Pulau Pengujian
1
2
3
4
5
Centroid Awal Bungong Jeumpa Gundul - Gundul Pacul Waktu Hujan Sore - Sore Bungong Jeumpa Cublak - Cublak Suweng Naik - Naik Ke Puncak Gunung Burung Kakak Tua Gundul - Gundul Pacul Soleram Kampuang Nan Jauh Dimato Bubuy Bulan Ayo Mama Dodoi Si Dodoi Gambang Suling
Tingkat Akurasi Sumatera
Jawa
Maluku
46.15%
66.66%
54.55%
46.15%
27.27%
0.00%
37.50%
33.33%
54.54%
37.50%
33.33%
54.54%
33.33%
33.33%
50.00%
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
6
7
8
9
10
11
12
13
14
15
16
17
18
Naik - Naik Ke Puncak Gunung Bungong Jeumpa Bubuy Bulan Ayo Mama Bungong Jeumpa Cublak - Cublak Suweng Buka Pintu Bungong Jeumpa Es Lilin Burung Kakak Tua Bungong Jeumpa Gambang Suling Burung Tantina Bungong Jeumpa Gundul - Gundul Pacul Hela Rotan Bungong Jeumpa Jaranan Naik - Naik Ke Puncak Gunung Bungong Jeumpa Peuyeum Bandung Nona Manis Siapa Yang Punya Bungong Jeumpa Suwe Ora Jamu Rasa Sayange Bungong Jeumpa Tokecang Sari Nande Bungong Jeumpa Warung Pojok Waktu Hujan Sore - Sore Dodoi Si Dodoi Bubuy Bulan Ayo Mama Dodoi Si Dodoi Cublak - Cublak suweng Buka Pintu Gelang Sipaku Gilang Es Lilin Burung Kakak Tua
46.15%
66.66%
54.54%
46.15%
27.27%
0.00%
18.18%
33.33%
25.00%
46.15%
66.66%
54.54%
46.15%
66.66%
54.54%
18.18%
33.33%
25.00%
33.33%
23.07%
54.54%
18.18%
66.66%
30.76%
33.33%
23.07%
54.54%
46.15%
66.66%
54.54%
37.50%
33.33%
54.54%
33.33%
27.27%
30.76%
18.18%
66.66%
30.76%
53
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
19
20
21
22
23
24
25
26
27
28
29
30
Gelang Sipaku Gilang Gambang Suling Burung Tantina Kampuang Nan Jauh Dimato Gundul - Gundul Pacul Hela Rotan Kampuang Nan Jauh Dimato Jaranan Naik - Naik Ke Puncak Gunung Lancang Kuning Peuyeum Bandung Nona Manis Siapa Yang Punya Lancang Kuning Suwe Ora Jamu Rasa Sayange Lisoi Tokecang Sari Nande Lisoi Warung Pojok Waktu Hujan Sore - Sore Na Sonang Do Hita Nadua Bubuy Bulan Ayo Mama Na Sonang Do Hita Nadua Cublak - Cublak Suweng Buka Pintu Opio Es lilin Burung Kakak Tua Opio Gambang Suling Burung Tantina Sinagar Tulo Gundul - Gundul Pacul Hela Rotan
Rata - Rata
46.15%
66.66%
54.54%
46.15%
66.66%
54.54%
18.18%
33.33%
25.00%
66.66%
37.50%
54.54%
66.66%
40.00%
50.00%
18.18%
66.66%
30.76%
18.18%
66.66%
30.76%
37.50%
33.33%
54.54%
33.33%
27.27%
30.76%
33.33%
33.33%
50.00%
37.50%
33.33%
54.54%
66.66%
40.00%
50.00%
37.67%
44.64%
42.59%
54
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
55
Berdasarkan Tabel 5.12 centroid awal yang digunakan sangat berpengaruh terhadap tingkat akurasi. Pada percobaan 1, lagu Gundul – Gundul Pacul merupakan centroid awal yang akurasinya tinggi, yaitu 66.66% dibandingkan 2 centroid lainnya. Pada percobaan 3, lagu Gundul – Gundul Pacul merupakan centroid awal yang akurasi paling rendah, yaitu 33.33% dibandingkan 2 centroid lainnya. Dari 30 percobaan diatas, kita biasa mengetahui bahwa pengambilan centroid awal sangat berpengaruh terhadap akurasi, dan tidak ada jaminan bahwa hasil yang diperoleh akan selalu optimal. Berdasarkan dari data tersebut, maka penelitian ini menghasilkan tingkat akurasi rata – rata tiap pulau : 1. Pulau Sumatera akurasi rata – ratanya adalah 37.67%. 2. Pulau Jawa akurasi rata – ratanya adalah 44.64%. 3. Pulau Maluku akurasi rata – ratanya adalah 42.59%. 5.3.3. Karakteristik Lagu dan MFCC
Dalam MFCC, terdapat beberapa hal yang perlu diperhatikan, antara lain adalah: kunci yang digunakan beserta perpindahannya dan tempo lagu (Tom LH. Li and Antoni B. Chan, 2011). Kedua hal tersebut sangat berpengaruh terhadap hasil akurasi. Apabila hal tersebut tidak diperhatikan, maka kita akan kehilangan beberapa informasi dari sumber data tersebut.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
56
Fitur yang dihasilkan oleh MFCC adalah fitur yang berbasis timbral, dengan kata lain untuk membedakan lagu daerah tersebut adalah berdasarkan instrumennya atau alat musik yang digunakan (Tom LH. Li and Antoni B. Chan, 2011). Instrumen yang digunakan dalam membuat lagu daerah tiap daerah berbeda – beda. Berikut ini adalah instrumen yang paling banyak digunakan dalam pembuatan lagu daerah : 1.
Lagu daerah yang berasal dari pulau Sumatera sebagian besar
menggunakan instrumen biola, rebana, seruling dan gendang. 2.
Lagu daerah yang berasal dari pulau Jawa sebagian besar
menggunakan instrumen berbagai macam jenis gamelan. 3.
Lagu daerah yang berasal dari pulau Maluku sebagian besar
menggunakan instrumen berbagai macam jenis tifa dan gong. Dalam penelitian ini, instrumen lagu daerah banyak tidak menggunakan alat musik tradisional sehingga karakter lagu daerah kurang akurat. Selain itu, lagu daerah yang digunakan rata – rata menggunakan kunci dan perpindahan kunci yang hampir sama pada semua lagu daerah. Rata- rata tempo yang digunakan pada setiap lagu daerah dalam penelitian ini juga hampir sama dan seharusnya tempo lagu daerah dari tiap pulau sangatlah berbeda. Hal tersebut menyebabkan MFCC kesulitan untuk mencari karakter lagu daerah yang sesuai dengan pulau asalnya. Untuk membuktikan bahwa perpindahan kunci, tempo dan instrumen yang digunakan sangat penting, peneliti juga melakukan
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
percobaan
dengan
menggunakan
program
yang
sama
57
untuk
pengelompokkan lagu berdasarkan genre dengan inisialisasi genre lagu seperti pada tabel 5.15 berikut ini. Tabel 5. 15 Tabel Inisialisasi Genre Lagu Genre Lagu Pop Rock Dangdut
Inisialisasi Cluster 1 2 3
Contoh lagu dan genre yang digunakan dalam percobaan, terdapat pada tabel 5.16 dibawah ini. Tabel 5. 16 Tabel Judul dan Genre Lagu Judul Lagu Sewindu Gajah Teman Hidup Almost Easy Critical Acclaim Bat Country Bahtera Cinta Judi Puing - Puing
Genre Lagu Pop Pop Pop Rock Rock Rock Dangdut Dangdut Dangdut
Genre pop memiliki karakter musik yang perpindahan kunci konsisten, musik ringan dan tempo sedang. Genre rock memiliki karakter musik yang perpindahan kunci cepat, musik dan tempo cepat. Genre dangdut memiliki karakter musik yang perpindahan kunci cepat, musik mendayu – dayu dan tempo lumayan cepat.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
58
Dalam percobaan ini, peneliti melakukan 3 kali percobaan dengan menggunakan centroid awal random / acak, dihasilkan tingkat akurasi yang terdapat pada tabel 5.17 berikut. Tabel 5. 17 Tabel Akurasi Berdasarkan Genre Centroid Pengujian Awal Sewindu 1 Almost Easy Bahtera Cinta Gajah 2 Bat Country Judi Teman Hidup 3 Almost Easy Puing - Puing
Tingkat Akurasi 88.89%
88.89%
88.89%
Dari tabel 5.17 diatas dapat disimpulkan bahwa MFCC dapat digunakan untuk mengambil karakteristik suatu lagu berdasarkan genre. Tingkat akurasi yang dihasilkan menjadi sangat baik, hal ini dipengaruhi oleh lagu yang jelas karakteristiknya dari setiap genre. Selain itu, perpindahan kunci dan tempo dari genre setiap lagu sangat berpengaruh terhadap hasil MFCC (Tom LH. Li and Antoni B. Chan, 2011). Semakin kuat karakterisitik suatu lagu setiap genre akan menghasilkan tingkat akurasi yang semakin tinggi juga.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
59
BAB VI KESIMPULAN DAN SARAN
Bagian ini memberikan kesimpulan dan saran berdasarkan hasil penelitian yang telah dilakukan. 6.1.
Kesimpulan
Melalui penelitian yang dilakukan, dapat disimpulkan bahwa : 1. Dalam penelitian ini, pengelompokkan lagu daerah menggunakan fitur MFCC dengan jAudio dan clustering dengan metode K-Means dapat menghasilkan tingkat akurasi rata – rata keseluruhan sebesar 50.44%. 2. Tingkat akurasi rata – rata pengelompokkan lagu daerah tiap pulau yang dihasilkan oleh metode K-Means adalah 37.67% untuk Sumatera, 44.67% untuk Jawa dan 42.59% untuk Maluku. 3. Pengambilan centroid awal secara random sangat berpengaruh terhadap tingkat akurasi, selain itu dengan metode pengambilan centroid awal secara random, sulit untuk mencapai global optimum karena hasil yang berubah – ubah. 4. Metode yang digunakan untuk ekstrak fitur dalam penelitian ini adalah MFCC. MFCC merupakan metode dalam music retrieval yang berbasis timbral. Dalam penelitian ini, instrumen lagu daerah banyak tidak menggunakan alat musik tradisional. Hal ini juga menyebabkan MFCC kesulitan untuk mencari karakter lagu daerah yang sesuai dengan pulau asalnya. Selain itu, data lagu daerah yang digunakan rata
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
60
– rata menggunakan kunci dan perpindahan kunci yang hampir sama pada semua lagu daerah. Rata- rata tempo yang digunakan pada setiap lagu daerah dalam penelitian ini juga hampir sama dan seharusnya tempo lagu daerah dari tiap pulau sangatlah berbeda. Hal – hal tersebut sangat berpengaruh terhadap tingkat akurasi karena vektor hasil proses ekstrak fitur dengan MFCC menjadi kurang baik. Semua hal tersebut dibuktikan dengan percobaan yang dilakukan peneliti dengan mengelompokkan lagu berdasarkan genre dengan hasil akurasi yang lebih tinggi yaitu 88.89% karena karakteristik lagu, instrumen dan tempo lagu yang sangat jelas perbedaannya dari setiap lagu berdasarkan genrenya. 6.2.
Saran
1. Data yang digunakan dapat menggunakan musik dengan tingkat detail instrumen yang lebih tinggi daripada MIDI. 2. Disarankan lagu daerah yang dipakai sebagai sumber data benar – benar menggunakan alat musik daerah asal, selain itu kunci dan perpindahannya serta temponya benar – benar mencerminkan karakter asal dari lagu daerah. 3. Disarankan memakai
metode clustering
selain K-Means dan
menggunakan metode music retrieval selain MFCC, karena metode MFCC lebih tepat untuk speech dan speak recognition. 4. Jika memakai metode K-Means disarankan untuk memakai metode untuk menentukan centroid awal agar hasilnya dapat lebih optimal.
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
61
DAFTAR PUSTAKA
A.T., Hartaris (2007) Seni Musik SMA Jilid 2.
Ali, Matius (2006) Seni Musik SMA Jilid 1, ISBN: 9797344096.
B. Logan. Mel Frequency Cepstral Coefficients for Music Modeling. 2000.
B. Logan and S. Chu. Music summarization using key phrases. In IEEE Conf. on Acoustics, Speech and Signal Processing, (2000).
J. Schuermann “Pattern Classification: A Unified View of Statistical and Neural Approaches”, Wiley&Sons, 1996, ISBN 0-471-13534-8.
MacQueen, J. B. (1967). Some Methods for classification and Analysis of Multivariate Observations, Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, University of California Press, 1: 281-297.
McEnnis, Daniel, Ichiro Fujinaga, Cory McKay, Philippe DePalle. 2005. "JAudio: A feature extraction library". ISMIR.
Osma L Zaiane, Eli Hagen, Jiawei Han, Word taxonomy for on-line visual Asset management and mining fourth international workshop on application of natural language to information system (NLDB'99).
PLAGIAT PLAGIATMERUPAKAN MERUPAKANTINDAKAN TINDAKANTIDAK TIDAKTERPUJI TERPUJI
62
Putra, Darma. Pengolahan Citra Digital, 2010.
Rabiner, L., and B. H. Juang. 1993. Fundamentals of speech recognition. Upper Saddle River, NJ: Prentice-Hall.
Richard O. Duda, Peter E. Hart, David G. Stork (2001) “Pattern classification (2nd edition)”, Wiley, New York, ISBN 0-471-05669-3.
Santosa, Budi, 2007, “Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis”, Graha Ilmu, Yogyakarta.
S. Russell and P. Norvig, Artificial Intelligence A Modern Approach. Upper Saddle River, New Jersey 07458: Pearson Education, Inc., 3 ed., 2010.
Tom LH. Li and Antoni B. Chan. Genre Classification and The Variance of MFCC to Key And Tempo, 2011.
W. Walker, P. Lamere, P. Kwok, B. Raj, E. Gouvea, P. Wolf, and J. Woelfel. Sphinx-4: A Flexible Open Source Framework for Speech Recognition, 2004.
X. Wu and V. Kumar, eds., The Top Ten Algorithms in Data Mining.Chapman and Hall, 2009.
Zaiane. Introduction to Data Mining.1999