PROCEEDING SEMINAR NASIONAL TEKNOLOGI INFORMASI DAN APLIKASINYA 2012 “Aplikasi Teknologi Informasi dalam Menunjang Pelestarian Budaya Nasional dan Pengembangan Sektor Pariwisata” Bali, 9 Oktober 2011
Diselenggarakan Oleh : Program Studi Teknik Informatika Jurusan Ilmu Komputer Universitas Udayana Bali
KATA PENGANTAR
Puji syukur kita panjatkan kehadirat Tuhan Yang Maha Esa, atas terselesainya penyususnan Proceeding SNATIA 2012 ini. Buku ini memuat naskah hasil penelitian dari berbagai bidang kajian yang telah direview oleh pakar dibidangnya dan telah dipresentasikan dalam acara Seminar SNATIA 2012 pada tanggal 9 Oktober 2012 di Universitas Udayana kampus Bukit Jimbaran, Badung, Bali. Kegiatan SNATIA 2012 merupakan yang pertama kali diadakan, dan akan menjadi agenda tahunan Program Studi Teknik Informatika, Jurusan Ilmu Komputer, Universitas Udayana. SNATIA 2012 mengambil tema “Aplikasi Teknologi Informasi dalam Menunjang Pelestarian Budaya Nasional dan Pengembangan Sektor Pariwisata”, dengan pembicara utama seminar yang terdiri dari pakar peneliti dibidang teknologi informasi, pembicara dari praktisi pariwisata Bali, dan pembicara dari Dinas Kebudayaan Propinsi Bali. Meskipun kegiatan seminar dan pendokumentasian naskah dalam proceeding ini telah dipersiapkan dengan baik, namun kami menyadari masih banyak kekurangannya. Untuk itu panitia mohon maaf yang sebesar-besarnya, dan juga mengucapkan terimakasih atas kepercayaan dan kerjasamanya dalam kegiatan ini. Kritik dan saran perbaikan sangat diharapkan untuk penyempurnaan di masa mendatang, yang dapat dikirimkan melalui email
[email protected]. Kepada semua pihak yang terlibat, baik langsung maupun tidak langsung dalam penyelenggaraan seminar, dan penyusunan proceeding SNATIA 2012, panitia mengucapkan terima kasih.
Denpasar, 9 Oktober 2012 Panitia SNATIA 2012 Ketua Pelaksana
I Gede Santi astawa, S.T., M.Cs.
DAFTAR ISI Kata Pengantar Daftar Isi Analisis Dan Implementasi Algoritma Learning Vector Quantization (Lvq) Dalam Pengenalan Ekspresi Wajah Kadek Dian Trisnadewi, I Wayan Santiyasa, I Made Widiartha ..........................................................
1
Analisis Kualitas Voip Pada Jaringan Yang Menggunakan Active Queue Management Random Early Detection (Red) I Dewa Made Bayu Atmaja Darmawan ................................................................................................
6
Analisis Sistem Firewall Pada Jaringan Komputer Menggunakan Iptables Untuk Meningkatkan Keamanan Jaringan ( Studi Kasus : Jaringan Komputer Jurusan Matematika Fakultas Mipa Universitas Udayana) I Wayan Supriana, I Wayan Santiyasa, Cokorda Rai Adi Pramartha..................................................
13
Ekstraksi Tepi Dengan Menggunakan Fuzzy Spatial Filtering Dan Slicing Intensity I Gede Aris Gunadi, Retantyo Wardoyo .............................................................................................
22
Evaluasi Cluster Menggunakan Metode Prototype-Based Cohesion And Separation Dan Silhouette Coefficient Pada Implementasi Algoritma Som Gusti Ayu Vida Mastrika Giri, Kadek Cahya Dewi ...........................................................................
29
Group Decision Support System Dengan Menggunakan Metode Analytical Hierarchy Process (Ahp) Dan Borda Dalam Penentuan Lokasi Bank Dan Pimpinan Cabang Yang Tepat Desak Made Dwi Utami Putra ...............................................................................................................
34
Identifikasi Lagu Menggunakan Algoritma K-Nearestneighbours – Cosine Similarity(KNNCS) I Gede Suta Lascarya Astawa, Agus Muliantara, Kadek Cahya Dewi.................................................
42
Kompresi Citra Fraktal Dengan Algoritma Genetika Adaptif Putu Indah Ciptayani1, Zulfahmi Indra2...............................................................................................
46
Mobile Information System Untuk Mengidentifikasidefisiensi Unsur Hara Pada Daun Asti Dwi Irfianti, Endang Sulistyaningsih ............................................................................................
51
Model Rekayasa Perangkat Lunak Berbasis Komponen (Component-Based Software Engineering) Herri Setiawan, Edi Winarko................................................................................................................
57
Model Sistem Pendukung Keputusan Kelompok Dengan Metode Multiplicative Exponent Weighting Muhammad Syaukani, Sri Hartati .......................................................................................................
65
Optimasi Distribusi Pupuk Bersubsidi Dengan Menggunakan Algoritma Genetika (Studi Kasus: Kab. Jombang Jawa Timur) Asti Dwi Irfianti, Sri Hartati ..................................................................................................................
72
2012
Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya
IDENTIFIKASI LAGU MENGGUNAKAN ALGORITMA K-NEARESTNEIGHBOURS – COSINE SIMILARITY(KNNCS) I GedeSutaLascaryaAstawa, AgusMuliantara, KadekCahyaDewi Program StudiTeknikInformatika, JurusanIlmuKomputer, FMIPA, UniversitasUdayana Email :
[email protected] ,
[email protected],
[email protected]
ABSTRAK Jumlah musik yang bertipe data *.mp3 kian hari kian bertambah, sehinggasering ditemukan suatu file dengan nama yang tidak sesuai dengan judul aslinya. Hal ini membuat para pendengar music memerlukan suatu aplikasi yang dapat memberikan informasi dari suatu file *.mp3 tentang judul atau artis dari file tersebut. Penelitian ini akan membuat suatu aplikasi yang nantinya berfungsi untuk memberikan informasi dari suatu file *.mp3 yang di-upload oleh user. Aplikasi ini diberi namaMusic Information by Computer Science (MICS) Identifications dan aplikasi ini akan dibangun dengan berbasis web. Proses identifikasi lagu akan menggunakan 5 fitur dari suatu lagu yaitu, key, mode, tempo, energy, danloudness. Data *.mp3 yang diunggah oleh user akan dicari nilai kemiripan audio terhadap data lagu yang tersimpan di dalamdatabase. Dataset dari penelitian ini berjumlah 280 lagu dari 14 genre berbedadan tentunyamemiliki fitur-fitur musik yang berbeda juga.Data sampel berjumlah 196 dan sisanya sebanyak 84 digunakan sebagai data uji. Data sampel memiliki bit rate 64kbit/s, dan data uji terdiri dari bit rate 32 kbit/s, 48 kbit/s,dan 56kbit/s. Variabel penelitian dari penilitian ini adalah nilai K dan nilai threshold pada Cosine Similarity. Hasil penelitian yang memiliki akurasi terbesar ada pada bit rate 32kbit/s dengan threshold 0.999, sedangkan untuk nilai K tidak berpengaruh. Karena dengan nilai K berbeda pun, hasil akurasi yang didapatkan sama pada setiap pengujian dengan threshold dan bit rate tertentu. Kata Kunci :fiturlagu, K-Nearest Neighbours, Cosine Similarity, Echo Nest, akurasi ABSTRACT From day to day, any kind of music data with *.mp3 type is growing up in the quantity and as a consequences there is often be found a file which the title is not match with the real title of that file should be. This condition make a music listeners need an application in order can give them an information about the title and also the artist from the *.mp3 file they have. This research is going to make an application which have a function to give an information from a *.mp3 file that has been uploaded by user. This application name is Music Information by Computer Science (MICS) Identifications and will be built up on web base. The identification process of the song will using 5 features from the song itself including key, mode, tempo, energy, and also loudness. The uploaded *mp3 data from the user will being looked for the audio similarity according to songs data which is already in the database. The dataset from this research is account for 280 songs from 14 different genre and certainly has a different feature of music too. Sample data is about 196 and the rest of the 84 data will be used as a test data. The samples data has a 64kbit/s bit rate while the test data has a 32 kbit/s bit rate, 48kbit/s bit rate and 56kbit/s bit rate. The variable from this research are the K value and threshold in Cosine Similarity. The result of this research which have the biggest accuration will be in the 32kbit/s bit rate with 0,999 threshold while the K value will not have any influence. Because even with the different K value, the accurate result that obtained will be the same in every test with any threshold and any bit rate. Keyword : song feature, K-Nearest Neighbours, Cosine Similarity, Echo Nest, accuration
1.
PENDAHULUAN Musik adalah suatu susunan nada yang memiliki tempo tertentu dan harmonisasi di setiap nadanya. Musik itu sendiri memiliki fungsi yang berbeda-beda dalam penggunaannya. Beberapa jenis music ada yang digunakan dalam acara kebudayaan, dilain sisi music juga bias digunakan sebagai bahan terapi untuk kesehatan. Dewasa ini music atau lagu telah memiliki beragam jenis genre berdasarkan perkembangannya dari tahun ketahun. Jumlah lagu pun bias dikatakan tidak terbatas sedangkan kemampuan otak manusia untuk mengingat informasi tentang suatu lagu terbatas. Seiring dengan perkembangan teknologi digital, duplikasi sebuah lagu sangatlah sering terjadi. Akibatnya seringkali pula ditemukan nama file sebuah lagu yang tidak memiliki metadata penyanyi, judul, genre, atau yang lainnya. Sebagai contoh sebuah file lagu memiliki nama track1.mp3. Oleh sebab itu dalam penelitian ini, akan dilakukan identifikasi lagu berdasarkan audio similarity menggunakan ModifiedKJurusan Ilmu Komputer, FMIPA, Universitas Udayana
42
Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya
2012
Nearest Neighbours(KNN) menggunakan Cosine Similarity. Data sampel yang dalam penelitian ini adalah 280 lagu yang diambil dari database Echo Nest dan telah diekstraksi melalui website tersebut. Fitur lagu yang akan digunakan dalam penelitian ini adalah key, mode, tempo, loudness, dan energy. 2.MATERIDANMETODE 2.1 FiturMusik Pada identifikasi music dalam penelitian ini, music diidentifikasi dengan menggunakan beberapa fitur yaitu energi, key, loudness, mode, dan tempo. Fitur Energi Key Loudness Mode Tempo
Nilai 0.0 < energy < 1.0 0 < key < 11 -100.0 < loudness < 100.0(dB) 0 -1 0.0 < tempo < 500.0 (BPM)
Gambar1.FiturMusik Energi dari suatu lagu adalah suatu fitur lagu yang merepresentasikan suatu tingkat dari kemampuan suatu lagu untuk meningkatkan emosi dari pendengarnya. Fitur key adalah nada dasar yang diperkirakan dari suatu lagu. Analisis Key dari suatu lagu didasarkan pada nada tonic triad serta penggunaan akord mayor atau minor. Loudness merupakan tingkat kenyaringan yang dari suatu lagu dengan satuan decibels (DB). Loudness juga merupakan suatu nilai yang menyatakan kualitas dari suatu lagu. Mode adalah nilai akord secara umum dengan nilai ‘1’ untuk mayor dan nilai ‘0’ untuk minor.Dan fitur yang terakhir digunakana dalah tempo. Tempo adalah kecepatan rata-rata lagu dengan nilai Beats per Minutes (BPM)(Yu Yao Chang, 2005). 2.2 Pengumpulan Dataset Untuk dataset, didapatkan dari mengunggah 280 file mp3 kewebsite Echo Nest untuk mendapatkan fitur-fitur dari mp3 tersebut. Untuk mendapatkan hasil analisadari file MP3 yang diunggah digunakan cURL PHP dengan format data yang dhasilkan dari ekstraksi adalah berupa Json File danXML File. Echo Nest adalah adalah suatu perusahaan musik yang menyediakan web service tentang musik. Ribuan aplikasi berbasis music dibangun dalam Echo Nest Platform. Echo Nest menyediakan API Key yang bias digunakan untuk mendapatkan data dari web Echo Nest secara gratis (Echo Nest, 2011). API Key adalah kode unik sepanjang12digityangdikeluarkanolehEchoNestuntuksetiappenggunaEchoNest. 2.3 Cosine Similarity Cosine similarity merupakan salah satu metode similarity yang memperhitungkan jarak dan sudut antar data uji dengan data sampel. Perhitungan pada cosine similarity didasarkan pada vector dot product dan jarak dari data uji ke data sampel (Tan, Steinbach, & Kumar, 2006). Untuk menentukan nilai similarity dalam cosine similarity dapat dicari dengan persamaan
2.4
Min Max Normalization Perbedaan rentang data yang ada pada dataset, bias menyebabkan proses identifikasi memiliki akurasi yang lebih rendah. Karena bias menyebabkan satu dimensi data tidak mempengaruhi nilai distance atau similarity pada suatu identifikasi. Min Max Normalization didapatkan dari perhitungan nilai minimum dan maksimum dari suatu fitur data, atau dapat dilihat pada persamaan
Dengan nilai f adalah nilai fitur sebelum dinormalisasi, fmin adalah rentang nilai terkecil untuk f, dan nilai fmax adalah rentang nilai terbesar untuk f (Dhaliwal & Sandhu, 2011). 2.5 K-Nearest Neighbours Konsep dasar algoritma KNN adalah mencari jarak terdekat antara data yang dievaluasi dengan K tetangga (neighbours) terdekatnya dalam data uji (Eka, 2011). Secara umum algoritma KNN bisadilihat sebagai berikut.(Dewi, 2008) 1. Menentukan nilai parameter K (jumlahtetanggaterdekat). 2. Menghitung jarak setiap sampel data dengan data yang akan diuji. 43
Jurusan Ilmu Komputer, FMIPA, Universitas Udayana
2012
Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya
3. Mengurutkan data berdasarkan jarak dari yang terkecil hingga yang terbesar. 4. Klasifikasi data baru dari hasil perhitungan dengan memberikan label kelas tiap data. Jarak untuk setiap data uji dengan data sampel dihitung dengan rumus jarak Euclidean seperti pada persamaan.
Beberapa kelebihan dari algoritma KNN ini adalah sebagai berikut. 1. Handal dalam uji data yang memiliki tingkat noise yang tinggi. 2. Efektif jika data yang diuji dalam jumlah besar. 3. Algoritma secara umum mudah untuk dimengerti. 2.6. CONCEPTMAP Concept maps adalah diagram yang menggambarkan bagaimana konsep system akan bekerja secara menyeluruh. Konsep digambarkan dengan bentuk oval dan dihubungkan antara satu konsep dengan konsep lainnya(Ellis, 2010). Untuk concept map MICS (Identification) digambarkan pada gambar 3.1.
Gambar2.ConceptMapMICSIDentification 3.HASIL Hasil evaluasi system dilakukan dengan menghitung akurasi dari sistem yang dibuat dengan menggunakan confusion matrix.Tabel confusion matrix dapat dilihat sebagai berikut. Tabel 1. Confusion Matrix True False
Positif
Negatif
TP FP
TN FN
Dengan : x TP adalah jumlah lagu benar yang teridentifikasi benar x TN adalah jumlah lagu benar yang teridentifikasi salah x FP adalah jumlah lagu salah yang teridentifikasi benar x FN adalah jumlah lagu salah yang teridentifikasi salah Persamaan untuk mendapatkan nilai akurasi, precision, danrecall dapat dilihat sebagai berikut. Akurasi =
;Precision =
;
Recall =
Pengujian dari MICS Identification dilakukan sebanyak 27 kali dengan data hasil uji pada table 4.2 Dapat dilihat pada table 2, bahwa akurasi dengan nilai tertinggi didapatkan pada pengujian dengan data uji 32kbit/s, threshold 0.999, dan nilai K bervariasi.
Jurusan Ilmu Komputer, FMIPA, Universitas Udayana
44
Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya
2012
Tabel 2 HasilUjiSistem No.
DataUji
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
32 32 32 32 32 32 32 32 32 48 48 48 48 48 48 48 48 48 56 56 56 56 56 56 56 56 56
NilaiK
Threshold 5 5 5 7 7 7 10 10 10 5 5 5 7 7 7 10 10 10 5 5 5 7 7 7 10 10 10
0.997 0.998 0.999 0.997 0.998 0.999 0.997 0.998 0.999 0.997 0.998 0.999 0.997 0.998 0.999 0.997 0.998 0.999 0.997 0.998 0.999 0.997 0.998 0.999 0.997 0.998 0.999
TP 56 56 55 56 56 55 56 56 55 52 52 51 52 52 51 52 52 51 55 55 54 55 55 54 55 55 54
FP
FN 2 2 1 2 2 1 2 2 1 5 5 4 5 5 4 5 5 4 4 4 3 4 4 3 4 4 3
25 25 25 25 25 25 25 25 25 26 26 26 26 26 26 26 26 26 24 24 24 24 24 24 24 24 24
TN
Akurasi
1 1 3 1 1 3 1 1 3 1 1 3 1 1 3 1 1 3 1 1 3 1 1 3 1 1 3
0.68 0.68 0.69 0.68 0.68 0.69 0.68 0.68 0.69 0.63 0.63 0.64 0.63 0.63 0.64 0.63 0.63 0.64 0.67 0.67 0.68 0.67 0.67 0.68 0.67 0.67 0.68
Precision 0.96 0.96 0.98 0.96 0.96 0.98 0.96 0.96 0.98 0.91 0.91 0.92 0.91 0.91 0.92 0.91 0.91 0.92 0.93 0.93 0.94 0.93 0.93 0.94 0.93 0.93 0.94
Recall 0.69 0.69 0.68 0.69 0.69 0.68 0.69 0.69 0.68 0.67 0.67 0.66 0.67 0.67 0.66 0.67 0.66 0.66 0.67 0.67 0.69 0.69 0.69 0.69 0.69 0.69 0.69
nilai K yang digunakan adalah 7 agar rekomendasi lagu tidak terlalu banyak ataupun terlalu sedikit. Nilai akurasi tertinggi adalah 0.69 dengan precision dari nilai akurasi tertinggi adalah 0.98 dan nilai recall adalah 0.68. 4. SIMPULAN Simpulan yang dari penelitian yang dilakukan adalah sebagai berikut: 1. Algoritma K-Nearest Neighbour-Cosine Similarity (KNNCS) dapat digunakan untuk mengidentifikasi lagu dengan menggunakan 5 fitur yaitu key, mode, loudness, energy, dan tempo. 2. Nilai K pada algoritma KNNCS tidak mempengaruhi tingkat akurasi dari sistem MICS Identification. 3. Akurasi tertinggi didapat pada saat pengujian dengan menggunakan lagu 32kbit/s, threshold 0.999, dan nilai K yang bervariasi dengan nilai akurasi 0.69, precision 0.98, dan recall 0.68. DAFTAR PUSTAKA [1] Anan, Y. (2011). MUSIC GENRE CLASSIFICATION USING SIMILARITY FUNCTIONS . [2] Chang, Y.-Y. (2005). Music Tempo (Speed) Classification . [3] Corporation, T. E. (2011). http://the.echonest.com. Retrieved from Echo Nest Developer. [4] Dewi, K. C. (2008). MUSIC RECOMMENDATION BASED ON AUDIO SIMILARITY USING KNEAREST NEIGHBOR. [5] Dhaliwal, D. S., & Sandhu, P. S. (2011). Enhanced K-Nearest Neighbor Algorithm . [6] Ellis, D. (2010). Becoming a Master Student. Boston: Cengange Learning. [7] Kadyanan, I. G. (2010). Perolehan Citra Berbass Konten Pada Aplikasi Pengnderaan Jarak Jauh . [8] Kuswardani, V. (n.d.). Visualisasi PCM 8 Bit Menggunakan Pemrograman JAVA . [9] Mandel, M. I. (2005). SONG-LEVEL FEATURES AND SUPPORT VECTOR MACHINES FOR MUSIC CLASSIFICATION [10] Mart'n, R. (2009). Melodic Track Identification in MIDI Files Considering its Imbalanced Context . [11] Nenzén, H. (2011). Choice of threshold alters projections of species range shifts under climate . [12] P´erez-Sancho, C. (2008). Genre Classification of Music by Tonal Harmony . [13] Rauber, A. (2008). RHYME AND STYLE FEATURES FOR MUSICAL GENRE CLASSIFICATION BY SONG LYRICS. [14] S., N. E. (2011). APLIKASI PENGOLAHAN CITRA DIGITAL DALAM KLASIFIKASI CACAT KAIN GREY MENGGUNAKAN METODE K-NEAREST NEIGHBOR . 45
Jurusan Ilmu Komputer, FMIPA, Universitas Udayana