BAB I PENDAHULUAN
1.1. Latar Belakangg Penelitian sistem Peneliti tian seputar siste em rekomendasi dalam satu ddekade ekade terakhir ini berkembang pesat. Lebih yang berkemba bang dengann pe pesa at. Leb bih h ddari arri 20 200 artikel arti ar t ke kell pe penelitian yan angg membahas tentang tent ntang
sistem si ist stem em
rekomendasi rekomen enda dasi
sudah
terpublikasi terpu ubl blik ikasi
(Beel, (Bee eel, l,
2013).
Seiring
bertambahnya artikel-artikel rekomendasi yang dikembangkan bertam amba bahn hnya art tik ikel-artikel tersebut, algoritma rekomenda dasi s yan ng di dike kemban ngk g an diinovasikan sistem semakin dann di diin i ovas asikan sesuai dengan kebutuhan masing-masing sis ste t m pu punn semaki kin banyak. informasinya, algoritma ba bany nyak. Berdasarkan sudut pandang penyaringan informasin nya y , al algo gori r tmaa rekomendasi terbagi menjadi re eko k meendasi yang sering digunakan dalam sistem rekomendasi terb bagi m enjaadi d Collaborative tiga jenis, jeenis, yaitu : Content-Based Filtering (CB), User-Based Co ollaboraative Filtering Filt lter e in ing (UCF) dan Item-Based Collaborative Filtering (ICF). tersebut Beberapa peneliti mengembangkan mengemba bang ngka kan ketiga algoritma penyaringan ter erse sebu but secara menggabungkan lebih se seca caraa tterpisah, erpi er p sah, namun ada juga peneliti yang meng gga g bungkan le lebi bihh da dari ri ssatu atu algoritma mendapatkan hasil rekomendasi al algo gori ritma dengan ttujuan ujua uj uan mendapat atka kann ha hasi sil rekomend ndas asii ya yyang ng terbaik ((Hu Hu et al., Campos 2011), ) (De (De C amppos et al., 2010), (Chen et am et al. 2010). Untuk Unttuk mengetahui men enge geta tahui apakah mendapatkan algoritma yang dikembangkan m endapatkaan hasil yang terbaik atau tidak, para peneliti menggunakan beberapa teknik eevaluasi valuasi seperti Mean Absolute Error Recall, dan (MAE), Precision Value, Recall l, da an lainnya. (Beel, 2013), (Jin, 2006), (Claypool, 1999). (Claypool 1999) Dalam
penerapannya
pada
sistem
rekomendasi,
UCF
seringkali
dipasangkan dengan ICF karena memiliki banyak kesamaan dalam teknik
1
penyaringan dan bahkan dalam hal kekurangan dan kelebihannya. UCF mengasumsikan bahwa untuk mencari sesuatu yang akan disukai oleh pengguna pengguna kecenderungan A, maka harus dicari penggun unaa llain ain dengan ke kece c nderungan yang sama. Pengguna lain yang memilikii ketertarikan ketertarikan / kecenderungan yang sama sam a a dengan pengguna A sesuatu disebut dengan deng ngaan neighbor. Segala la ses e ua u tu yyang ang di an ddisukai sukai oleh neighbor neig ghb h or akan menjadi sumber er rekomendasi si untuk unt ntuuk pengguna A. Sedikit Sedik d kit berbeda berbeda dengann UCF, ICF menampung segala dahulu menampunng se me sega gala item m yang telah disukai oleh pengguna peeng nggu g na A tterlebih erle er lebih dahu hulu dan kemudian kemudi dian an mulai ai menelusuri item lain yang akan disukai disukkai olehh pengguna peng pe nggunaa A. Perbedaan mencari Pe erbedaan d IICF CF dan UCF terletak pada titik awal dalam menc cari rrekomendasi ekom ek o endaasi s untuk 2011), un untu tuk seorang seeorang pengguna dan jenis neighbor-nya. (Lops et al., 2011 11), ((Sarwar Sarw Sa rwaar et 2001). al., 200 01). Peran neighbor sangatlah penting dalam sistem rekomend rekomendasi, dasi,, selain n sebagai rekomendasi, berperan sebag agai ai ssumber umbe um berr re reko k meend n asi, ada ada jjuga ugaa da ug data ta llain ainn pa ai ppada da neighborr yang yan angg menghitung na nantinya akan digunakan untuk meng nghitung nilai prediksi. Dalam hal iini ni ddata ata at tersebut nilai Nilai te ters rseb ebut u adalah ada dala lahh ni nila laii rating rati ra ting ng neighbor nei eigh ghborr terhadap terhadaap it item em rekomendasi. reko re kome mend ndas asii. N ilaii pprediksi il redi re diks ksii ini nantinya peneliti nant na ntin inya ya digunakan dig gun unak akan an ooleh lehh pa le para r pen enel elit iti sebagai seba baga gaii tolak t laak ukur to uku seberapa seb ber erap apa “baik” “baik” dikembangkan. algoritma rekomendasi rekkomendasi yang sedang sedan ng dikemb mbangkan. Pada penelitian ini, pen peneliti mencoba neliti men ncoba memanfaatkan sebuah metode mendapatkan pengukuran dengan tujuan bisa m endap apatkan neighborr terbaik, sebagai dasar pencarian rekomendasi dan nilai prediksi pred dik iksi yang akurat. Metode pengukuran yang digunakan adalah Pearson-Correlation Coefficient. Dengan memanfaatkan metode pengukuran ini, peneliti ingin membuktikan seberapa besar pengaruh relasi neighbor terhadap keakuratan rekomendasi dan prediksi. 2
Keakuratan rekomendasi dan prediksi dari penelitian ini akan dievaluasi dengan menggunakan metode evaluasi Mean Absolute Error (MAE), Precision dan Recall Value. Metode MAE AE digunakan digunakan untuk unt ntuk u mengukur seberapa kuat akurasi yang peneliti dari nilai prediksi ya yan ng diberikan oleh algoritma peneli liti ti dengan nilai ratingg yang (evaluasi offline). sudah diberi ri oleh pengguna (ev val a ua uasi s secara sec ecar araa of offl f ine). Precisionn dan Recall Value berfungsi berfun ngsi untuk mengetahui meeng nget etah ahui seberapa banyak k rrekomendasi ekom ek omeendasi item yang ya “tepat” diberikan untuk di iberikan un untu tukk ppenerima. enerima ma. 1.2. Perumusan Peru Pe rumusa san Masalah Dari diambil rumusan Daari latar belakang permasalahan tersebut diatas, dapat di diam mbi bill ru rumu m sann ma masalah h sebagai berikut : sistem 1. Bagaimana Baagaimana menerapkan metode Pearson-Correlation kedalam kedallam sist stem m rekomendasi? rekkomendasi? 22. Apakah
nilai
relasi
antara
ppengguna engguna en
terhadap
neighbor-nya
dapat dap apaat
mempengaruhi memp me mpengaruhi keakuratan rekomendasi dan prediksi? Batasan 1.3. Ba 1.3. Bata tasan Masalah Masa Ma sala lah Pada P da penelitian ini lingkupp permasalahan Pa p rmassalahan dibatasi sebagaii bberikut pe erikut : digunakan untuk 1. Teknik pengukuran yang dig gun u akan unt ntuk menentukan relasi antar pengguna sistem adalah Pearson-Correlation Pearson-Correlat ation 22. Algoritma yang digunakan untukk menghitung nilai prediksi rekomendasi adalah User-Based Collaborative Filtering dengan melibatkan nilai kedekatan pengguna dengan neighbor-nya.
3
3. Teknik evaluasi yang digunakan untuk mengukur keakuratan nilai prediksi adalah Mean Absolute Error (MAE). 4. Precision, Recall Value Valu luee digunakan digunakan untuk mengukur meng nguk u ur keakuratan rekomendasi. 1.4. Manfaat Pe Penelitian Penelitian ini ataupun Pe ni bermanfaat ber erma m nfaaat untuk untu un tukk para paaraa ppeneliti enel en elitti at atau aupun developer develo ope p r yang ingin mengembangkan rekomendasi. dari me engembang ngka kann sistem rek ekom omendasi. Hasil H si Ha sill evaluasi ev darri al aalgoritma g ritma pr go pprediksi, ediksi, algoritma rekomendasi algori ritm ma re rek komeend ndasi serta pencarian neighborr dapat ddigunakan igunak ig akan an ssebagai ebagai bbahan eb ahan tinjauan tinj jau auan an untuk uk penelitian di masa mendatang. 1.5. Tujuan 1. 5. Tuju juan Penelitian Tujuan dari penelitian ini adalah untuk mengetahui apakah pemanfaatan pemanfaata tann Pearson-Correlation dalam Pearso on-Correlation dalam pencarian neighborr dan melibatkannya da alam pproses rosees penawaran serta mempengaruhi pena awa waran rekomendasi rekomenddas asii se sert rtaa pe ppenghitungan nghitungan nnilai ilai il ai prediksi pre redi d ksi dapat me empengaru ruhi hi kualitas rekomendasi. 1.6. Sistematika 1. 6. Si S stem emat atik ikaa Penulisan Penu Pe nuli lisa san n Penulisan tesis n te tesi sis in inii dengan de n jjudul udul ud ul : User-Based Use serr-Ba Baseed Collaborative Collaborativ Co ivee Filtering Filltering Fi Memanfaatkan Pearson-Correlation Neighbor Dengan M emanfaatkan Pearson-C em Correlattion Untuk Mencarii Ne Neig ighb hbor Terdekat Dalam Sistem Rekomendasi, disusun dalam daalam lima bab, dengan sistematika penulisan sebagai berikut. Bab pertama Pendahuluan. B Bab ab ini menjelaskan secara singkat isi dari tesis yang berisi latar belakang, perumusan masalah, batasan masalah dan manfaat penelitian serta tujuan penelitian.
4
Bab kedua Tinjauan Pustaka. Bab ini akan menjelaskan teori yang mendukung penyelesaian tesis yang berisi uraian penelitian pendahuluan, Collaborative Filtering, algoritma User-Based Collabo borrative Filteri ring ng,, Pearson-Correlation Coefficient, Error, Mean Absolute Erro rorr, Precision dan Recall Value. Bab Metodologi Penelitian. Ba ab ketiga M ettod odol o ogi Pe P n li ne litian a . Ba Babb ini ini menjelaskan m njelaskan tentang me tent ntang bahan atau materi penelitian, langkah-langkah mate eri penelitia ian, n dataa da ddan n lang gkaahh la lang ngka kahh pe ppenelitian. nelitian n. Bab kkeempat Bab eem mpat Analisis dan Perancangan Sistem.
memberikan Babb in inii me m mber erikan
penjelasan akan dibangun, serta penj njel elaasan ttentang entang analisis dan desain perangkat lunak yang ak kan a dib iban angu gun, ser rta t sistem si sis stem e yang yaang akan diterapkan. Bab kelima Implementasi dan Pengujian Sistem. Dalam bab ba ini akan ak kan dibahas mencari ddi bahaas implementasi dari teknik pengukuran Pearson-Correlation untuk unttuk me encarri neighbor neighb hbor or
dalam
Collaborative Co C llaborative
ssistem isttem is
Filtering g
rekomendasi reko re k mendasi dan
yang ya
mengevaluasi men enge gevaluasi
memanfaatkan mem emanfaatkan hasil
yang
User-Based User-Bas ased ed
didapat
ddengan enga en gan
menggunakan me meng nggu guna n kan Mean Absolute Error dan Precision Value. keenam Kesimpulan Bab Ba ke Bab keen enam am K esim es impuula lan dan n Sa Saran. B ab b ini ini berisi beris isii kesimpulan kesi ke simp mpul ulan an penelitian pen enelitian serta saran-saran yang mungkin ddiberikan iberikan uuntuk ib ntuk pengembangan lebih lanjut.
5