BAB I
PENDAHULUAN
1.1 Latar Belakang
Pengguna internet di dunia mengalami peningkatan. Statistik pengguna internet berdasarkan
hasil survey Nielsen Online, yaitu pada tanggal 31 Maret 2011 menunjukkan bahwa 2.095.006.005 dari 6.930.055.154 penduduk dunia menggunakan internet (Group, 2012).
Dibanding dengan pengguna internet pada tahun 2000 dan 2011, peningkatan terjadi sebesar
480.4%. Untuk lebih jelasnya dapat dilihat pada tabel dibawah ini yang diadaptasi dari (Group, 2012). Tabel 1 World internet usage and population
Pengguna Internet (31 Desember 2000)
Region Dunia
Populasi (2011)
Data Terakhir Pengguna Internet
Perkembangan 2000-2011
Afrika
1,037,524,058
4,514,400
118,609,620
2,527.4%
Asia
3,879,740,877
114,304,000
922,329,554
706.9%
Eropa
816,426,346
105,096,093
476,213,935
353.1%
Timur Tengah
216,258,843
3,284,800
68,553,666
1,987.0%
Amerika Utara
347,394,870
108,096,800
272,066,000
151.7%
Amerika Latin
597,283,165
18,068,919
215,939,400
1,037.4%
Australia
35,426,995
7,620,830
21,293,830
179.4%
TOTAL (Dunia)
6,930,055,154
360,985,492
2,095,006,005
480.4%
Dari sekian banyak pengguna internet, pencarian mengenai kategori Arts & Entertainment merupakan kategori yang paling banyak dicari oleh pengguna internet. Pada tahun 2011, kategori Arts & Entertainment menduduki posisi pertama sebagai kategori yang paling banyak dicari oleh pengguna internet di mesin pencari Google untuk kata kunci musik 1
BAB I Pendahuluan
2
dengan memperoleh persentase 50 – 75 % (Google, 2011). Dari persentase 50 – 75 %
tersebut, 75 – 100 % adalah pengguna yang mencari informasi mengenai musik dan audio. Pada tahun 2011 juga, lebih dari 60.000.000 data lagu diperoleh dari aplikasi audioscrobbler
semua pengguna (last.fm, 2011). Data lagu meliputi data lagu nasional dan internasional. Hal tersebut menandakan bahwa musik merupakan kata kunci yang paling banyak dicari oleh pengguna internet dan pengguna internet disediakan begitu banyak pilihan data lagu.
Sebelumnya, (Wiranto, 2010) sudah menuliskan bahwa tipe pencari pertama lebih mudah mendapatkan informasi yang diinginkan karena sudah memiliki referensi yang jelas dan
cukup dibantu dengan search engine, sedangkan tipe pencari kedua sulit mendapatkan
informasi yang diinginkan karena hanya memiliki topik tertentu. Untuk membantu pencari tipe kedua ini dibutuhkan mesin pencari yang disertai dengan sistem yang dapat memberikan rekomendasi, yaitu sistem rekomendasi (Wiranto, 2010). Sistem rekomendasi adalah perangkat lunak dan teknik yang mengberikan saran-saran untuk item yang bermanfaat bagi pengguna (Ricci, et al., 2011). Ada beberapa metode yang digunakan untuk sistem filtering,
content-based
filtering,
hybrid
rekomendasi seperti, collaborative
recommendation,
dan
knowledge-based
recommendation (Jannach et al., 2011). Collaborative filtering merupakan metode sistem rekomendasi yang memanfaatkan data komunitas. Content-based merupakan metode sistem rekomendasi yang menganalisis dokumen atau deskripsi dari suatu item yang telah dinilai oleh seseorang sebelumnya (Ricci et al., 2011). Knowledge-based merupakan metode rekomendasi yang memanfaatkan kebutuhan seseorang dan pengetahuan mengenai domain produk (Ricci et al., 2011). Sedangkan, hybrid merupakan kombinasi dari dua atau lebih metode-metode sistem rekomendasi yang telah disebutkan sebelumnya. Maka dari itu, terdapat dua metode yang memanfaatkan data komunitas, yaitu collaborative filtering dan hybrid recommendation (apabila menggabungkan collaborative filtering dengan metode lainnya), namun metode collaborative filtering merupakan teknik yang telah sukses dan paling banyak digunakan dalam pengembangan sistem perekomendasi sampai saat ini dibandingkan metode yang lain (Konstan et al., 1997).
Sistem rekomendasi lagu dengan metode collaborative filtering yang memanfaatkan implicit feedback datasets
BAB I Pendahuluan
3
Sistem rekomendasi dengan pendekatan collaborative filtering akan bekerja dengan cara
menghimpun feedback pengguna dalam bentuk eksplisit dan implisit. Feedback secara eksplisit merupakan opini yang diberikan pengguna mengenai suatu item. Sedangkan,
feedback secara implisit merupakan opini berdasarkan kebiasaan pengguna. Dalam dunia nyata, kebanyakan sistem rekomendasi menggunakan feedback eksplisit dan implisit, namun feedback yang diterima akan berlebihan (Liu et al., 2010). Feedback berlebihan yang dimaksud yaitu saat sistem menerima satu feedback dari pengguna, maka pengguna tersebut
mendapatkan rekomendasi, namun ketika sistem tersebut menerima feedback baik secara
explicit maupun implicit, maka akan menghasilkan rekomendasi dari berdasarkan kedua
feedback tersebut, sehingga hasil yang direkomendasikan akan berlebihan.
Menurut hasil penelitian yang dilakukan oleh Yifan Hu, Yehuda Koren, dan Chris Volinsky (Hu et al., 2008), mereka membuat suatu pemodelan dengan menggunakan metode collaborative filtering yang hanya memanfaatkan feedback secara implisit untuk sistem rekomendasi acara televisi. Pemodelan tersebut menggunakan dua pendekatan yaitu pendekatan secara personal ( neighborhood models ) dan pendekatan secara non-personal ( latent factor models ). Ketiga orang tersebut menyimpulkan bahwa rekomendasi yang dihasilkan dengan pendekatan secara personal lebih baik dari pendekatan secara non-personal. Berdasarkan hasil kesimpulan dari penelitian Yifan Hu, Yehuda Koren, dan Chris Volinsky diatas, yaitu bahwa pendekatan secara personal lebih baik dari pendekatan secara nonpersonal maka
sistem rekomendasi lagu yang akan dibuat menggunakan pendekatan
personal. Dalam pendekatan personal ini sistem rekomendasi lagu akan menggunakan dua pemodelan, yaitu secara model ke tetanggaan ( neighborhood model ).
1.2 Rumusan Masalah Berdasarkan latar belakang yang diuraikan sebelumnya, maka dibuat rumusan masalah, yaitu membuktikan bahwa dengan hanya memanfaatkan implicit feedback dapat menghasilkan rekomendasi lagu secara personal.
Sistem rekomendasi lagu dengan metode collaborative filtering yang memanfaatkan implicit feedback datasets
BAB I Pendahuluan
4
1.3 Tujuan Sistem Berdasarkan hasil perumusan masalah yang diuraikan sebelumnya, maka tujuan dari sistem
yang akan dibuat, yaitu membuat suatu sistem yang dapat merekomendasikan lagu secara personal dengan menerapkan metode Neighborhood Models yang hanya memanfaatkan
implicit feedback, sehingga sistem dapat menghasilkan rekomendasi lagu secara personal.
1.4 Batasan Masalah Adapun batasan masalah dari sistem yang akan dibuat yaitu sebagai berikut : 1.
Sistem memanfaatkan data-data implicit feedback yang sudah disediakan pada situs
last.fm
2.
Implicit feedback yang dimanfaatkan yaitu berapa kali pengguna mendengarkan lagu, sehingga pengguna secara tidak langsung memberikan penilaian terhadap lagu yang didengarkan.
3.
Sistem hanya menampilkan hasil rekomendasi berupa daftar lagu yang memiliki nilai similarity terdekat dengan lagu yang sudah didengarkan.
1.5 Metode Pengerjaan Berikut ini merupakan tahapan kegiatan dalam pelaksanaan tugas akhir : 1.
Penentuan topik, ruang lingkup, dan perumusan masalah Dalam menentukan topik dilakukan dengan cara diskusi secara berkelompok baik secara mandiri maupun dengan melibatkan pembimbing dan koordinator tugas akhir. Hasil dari diskusi ini yaitu topik yang akan dikerjakan pada tugas akhir, dengan ruang lingkup dan perumusan masalah yang mengacu pada salah satu jurnal yang didapat pada situs Pennsylvania State University dan aplikasi sejenis yang sudah ada, yaitu situs www.last.fm.
2.
Studi literatur dan tinjauan pustaka Pada tahap ini dilakukan dengan mengumpulkan referensi dari baik buku ( Recommendation System, Recommender Systems Handbook, Collective Intelligence in Action, Mahout in Action ), jurnal ( Collaborative Filtering for Implicit Feedbacks
Sistem rekomendasi lagu dengan metode collaborative filtering yang memanfaatkan implicit feedback datasets
BAB I Pendahuluan
5
Datasets ), artikel, dan aplikasi sejenis ( www.last.fm ). Adapun tinjauan pustaka yang telah ditentukan yaitu sebagai berikut :
1) Sistem Rekomendasi 2) Collaborative Filtering ( neighborhood models , association rule mining )
3.
Analisis Sistem Pada tahap ini dilakukan dengan menganalisis kebutuhan dari pada sistem rekomendasi lagu, analisis sistem dilakukan berdasarkan tinjauan pustaka yang telah ditentukan yaitu menganalisis metode yang ada pada sistem rekomendasi ( sebelumnya, neighborhood models, association rule mining ), menganalisis perilaku pengguna
terhadap sistem yang akan dibuat, serta menganalisis dataset yang telah didapat. 4.
Perancangan Pada tahap ini dilakukan dengan merancang sistem sesuai dengan hasil analisis dan kebutuhan sistem, yaitu merancang basis data, namun rancangan tidak dilakukan dari awal karena memanfaatkan data yang sudah ada; merancang algoritma.
5.
Implementasi Pada tahap ini dilakukan dengan melakukan implementasi terhadap perancangan yang sudah dibuat sebelumnya sehingga kebutuhan sistem dapat terpenuhi.
6.
Pengujian Pada tahap ini dilakukan dengan memasukan dataset yang didapat dari situs last.fm , kemudian sistem memproses inputan tersebut, dari hasil yang dikeluarkan oleh sistem yaitu berupa daftar rekomendasi untuk setiap pengguna, kemudian diambil sampel 5 pengguna sebagai responden yang menilai hasil daftar rekomendasi yang dihasilkan oleh sistem. Dari penilaian responden tersebut menjadi ukuran hasil rekomendasi tersebut ukuran pendekatan keinginan pengguna.
Sistem rekomendasi lagu dengan metode collaborative filtering yang memanfaatkan implicit feedback datasets