TESIS USER-BASED COLLABORATIVE FILTERING DENGAN MEMANFAATKAN PEARSON-CORRELATION UNTUK MENCARI NEIGHBORS TERDEKAT DALAM SISTEM REKOMENDASI
ARVID THEODORUS No. Mhs : 125301834/PS/MTF
PROGRAM STUDI MAGISTER TEKNIK INFORMATIKA PROGRAM PASCASARJANA UNIVERSITAS ATMA JAYA YOGYAKARTA 2016
UCAPAN TERIMA KASIH
panjatkan kehadirat T Tuhan Puji dan syukur penulis pe uhan yang telah memberikan anugerah, judul rahmat dan anu ugerah, sehinggaa penulis dapat menyelesaikan menyelesaika kann Tesis dengan judu User-Based Collaborative Filtering User-Base ed Collabor rativ ivee Filter rin ingg Dengan Deng De ngan an Memanfaatkan Mem eman anfa faatkan Pearson Pearrso s n Correlation Sistem Rekomendasi. Untukk Mencari Neighbors Neig Ne i hbors Terdekat Teerd rdek ekatt Dalam S iste is tem m Re R komenddas asii. Penulisan pemenuhan salah Pe enu nuli lissan laporan laaporan ini merupakan kelengkapan dan pe pemenu nuha hann da dari sal alah a satu bertujuan melatih syarat at dalam dal alam memperoleh gelar Magister Teknik. Selain ituu bert rtuj ujua uan mela l tih mahasiswa ma aha hasi siswaa untuk dapat menghasilkan suatu karya yang dapat dipertanggungjawabkan dipertan nggunngj gjaawabkaan secara ilmiah, se seca carra ilm miah, sehingga dapat bermanfaat bagi penggunanya. Dalam telah D alam menyelesaikan pembuatan program dan laporan Tesis ini,, penuliss tel lah menerima mene nerim ma bimbingan, saran, dan masukkan dari berbagai pihak, baik secara seccara ra llangsung angssun ung maupun segala kerendahan kesempatan m aupun tidak langsung. Untuk Untukk itu itu dengan den e gann se sega galla kerendah han hati, pada kesem mpa pattan ini in ni penulis pe menyampaikan ucapan terima kasih kepada : Bapak Budiyanto, 1. Ba Bapa pak k Ir. Ir A. A. Djoko Djo joko ko Bud diy iyan anto to,, M.Eng., M.En Eng. g., Ph.D., Ph.D., D selaku sela se laku ku ddosen osen pembimbing memberikan pe pemb mbim imbbing ng I yang telah te member erik ikan bimbingannya bimb mbin i gaann nnya ya dengan deng de ngan an sabar dan juga baik kepada penulis, jug ga kepada bimbingan, 2. Ibu Dra. Ernawati, M.T., M.T., selaku u dosen pembimbing II atas bimbingan pengerjaan dan masukkan selama pen ngerjaan an Tesis ini. 3. Keluarga tercinta yang telahh memberikan memberikan semangat dan doa. 4. Teman-teman Gereja GBI Keluarga Allah Jogja dan kepada keluarga KIMEO yang selalu mendukung dan menguatkan didalam doa.
DAFTAR ISI
DAFTAR ISI ................................ .............................................................................................................i ................................................................................i ..............................................................................................iv DAFTAR GAMBAR .... ............................................................................................iv .................................................................................................... DAFTAR TABEL L ................................................................. ....................................v INTISARI ...............................................................................................................vi .............................................................................................................................vi BAB I ......................................................................................................................... ......................................................................................................................................1 PENDAHULUAN PEND NDAHULUA UAN ................................................................................................... .................. ..........................................................................................1 Latar Belakang ............................................................................................. 1.1 L atar at ar B elakan angg ..................................................... ............................................ 1 ..................................................................................... 1.22 Perumusan Per eruumussan Masalah ..................................................... ......................................3 Batasan .......................................................................................... 11.3 .3 Batas asan Masalah ................................................................ ................................. 3 Manfaat ....................................................................................... 11.4 .44 M anfaat Penelitian ................................................................. .......................... 4 Tujuan ......................................................................................... 11.5 .5 T ujuan Penelitian ...................................................................... .......................4 1.6 Sistematika Penulisan ..................................................................................4 ...................................................................................................................... BAB II II ................................................................................................................. ......6 TINJAUAN ............................................. TI TINJ N AUAN PUSTAKA DAN LANDASAN TEORI .................................. .............6 Tinjauan Pustaka .......................................................................................... 2.1 Tinjaua an Pu Pust s ak a a ...... .............................................................................................................. 6 ........................................................................................ 2.2 Tinjauan Teoritis ..................... . ...................................................................... 112 2 .................................................. 2.2.1 User-Based Collaborative Filtering ...................................... .................12 Coefficient ....................................................... 22.2.2 .22.22 Pearson-Correlation Pea ears rson on-C -Cor orre rela lati tion on C o fficcie oe ient nt ........................... .....................................16 2.2.3 Evaluasi Sistem Rekomendasi .......................................................... 22. 2.3 Eva valu luas asii Si Sist stem em R ekom men enda dasi ..... .................................................................. 18 BAB III III .................................................................................................................. .................................................................................................................................... 21 METODOLOGI PENELITIAN ............................................................................. ..............................................................................21 3.1 Bahan Penelitian ........................................................................................ 21 ............................................................................................ 3.2 Alat Penelitian .................... .......................................................................... 21 Keras 3.2.1 Kebutuhan Perangkat K eras as ..............................................................21 Lunak 3.2.2 Kebutuhan Perangkat Lun unak .............................................................21 3.3 Langkah-Langkah Penelitian ..................................................................... 22 BAB IV .................................................................................................................. 26 ANALISIS DAN PERANCANGAN SISTEM .....................................................26
i
4.1 Analisis Sistem........................................................................................... 26 4.1.1 Perspektif Perangkat Lunak .............................................................. 26 4.1.2 Fungsi g Perangkat g Lunak ................................................................... 27 4.1.3 Karakteristik ........................................................ k Pengguna Pengguna Produk ......... ................................................ 32 4.1.4 Kebutuhan ............................................................................ Kebuttuh uhan Khusus ........................................ ...................................... 32 4.1.4.1 Antarmuka............................................................... 4.1.4 4.11 Kebutuhan An Antarmuka........... ....................................................... 32 Perangkat Lunak ................................................................... 4.2 Perancangan Perancangan n Per eran angkat L unak un ak ... .......................................................................... 34 Layer ........................................................... 4.2.1 Perancangan Per e ancang ngan a Arsitektur La aye y r .................... . .........................................34 Dekomposisi 4.2.2 .2 D ekompo ek posi sisii Data ............................................................................. ...................................................................................34 4.2.2.1 .............................................................................. 4.2 .2.2.1 Tabel Tabel Rating ............................................... ...................................35 4.2.2.2 4.2.2 .2.2 Tabel Pengguna (users) ............................................................. ................................................................. 35 3 4.2.2.3 4.2.2.3 Tabel Film (movies) ................................................................... ........................................................................ 366 .......................................................................... 4.2.2.4 Tabel Neighbor ................................................................. ............ 36 4.2.2.5 Tabel Neighbor Grouped ...........................................................37 37 ........................................................................... 4.2.2.6 Tabel Korelasi ......................................................................... ... 388 ................................................................... 4.2.2.7 Tabel Rekomendasi ............................................................ ........ 38 Prediksi 4.2.2.8 Tabel Tabe Ta bell P redik diksi si.............................................................................. ............................................................................... 339 9 ............................................ 4.2.2.9 Tabel MAE (mean an absolute abssol olute error) ........................................ .....3399 4.2.2.10 Tabel Presisi .............................................................................. ............................................................................... 40 40 Antarmuka 44.3 .33 Perancangan Peran anca cang ngan an A ntar nt armu muka ka ............................................................................. ................................................................................. 41 ........................................................................... 4.3.1 Perancangan Peran nca cang ngan Proses ...... . .................................................................................43 Analisis 44.4 .4 A nali lisis i Algoritma Alggoritma Rekomendasi Al Rekom mendasi .............................................................. ...................................................................46 BAB V ................................................................................................................... .................................................................................................................... 48 PENGUJIAN IMPLEMENTASI DAN PENGU UJIAN .................................................................48 5.1 Implementasi Perangkat Lu Lunak .................................................................. 48 Antarmuka 5.1.1 Implementasi Antarmu uka Perangkat Peerangkat Lunak ...................................... 49 Textbox 5.1.1.1 Implementasi Textb box – Porsi Data .......................................... 49 5.1.1.2 Implementasi Progress Bar ........................................................ 50 5.1.1.3 Implementasi Tombol : Buat Tabel Korelasi ............................ 51 5.1.1.4 Implementasi Tombol : Buat Tabel Neighbor ........................... 52
ii
5.1.1.5 Implementasi Tombol : Buat Tabel Neighbor ........................... 52 5.1.1.6 Implementasi Tombol : Grouping Neighbor .............................53 5.1.1.7 Implementasi Tombol : Hitungg Korelasi ................................... 54 p Implementasi Tabel 5.1.1.8 Implemen enta tasi Tombol : Buat T abel Rekomendasi & Prediksi .. 55 ab 5.1.1.9 Implementasi Impplementasi Tombol : Cari Rekomendasi Im Rekomen nda dasi & Nilai Prediksi .... 56 5.1.1.10 Hitung 5.1.1 1.10 1 Implementasii Tombol : Buat Tabel MAE & H itung MAE ....... 57 5.1.1.11 Tombol Tabel Presisi, TP 5.1.1.11 Implementasi Im mpl p em emeentasi T ombo om boll : Bu Buatt T abel ab e P r sisi, Cari T re P dan FP & Cari TP .......................................................................... ri T P ddan an FN ............................... ..............................................59 Perangkat ....................................................................... 55.2 .2 Pengujian Pen ngu guji jian an Perangk gkat at Lunak ........................... .................................................... 60 5.2.1 Pengujian .................................................................. 5.22.1 Pengu 5. gujjian Fungsionalitas .................................. . ...................................... 60 .......................................................................... 5.3 .3 Validasi Validas asi Perangkat Lunak ................................................ ............................... 66 ............................................. 55.4 .4 Kelebihan Kel elebihan dan Kelemahan Perangkat Lunak ....................... .......................... 771 1 BAB BA B VII .................................................................................................................. ....................................................................................................................... 722 PENUTUP PENUT PE TUP.............................................................................................................. ................................................................................................................... 72 72 6.1 Kesimpulan ................................................................................................ ................................................................................................. 722 6.2 Saran .......................................................................................................... 722 DAFTAR DA AFT FTAR A PUSTAKA A ............................................................................................. ............ ........................................................................................... 74 74
iii
DAFTAR GAMBAR
Gambar 2.1 Skema Tahapan UCF F ............... ......................................................................... ............................................................ 13 Himpunan Memiliki Gambar 2.2 Contoh Himp mpunan Bilangan Yang Mem mil i iki Korelasi Positif dan Negatif.................................................................................................................... ....................................................................................................................... 17 Penerapan Algoritma Rekomendasi User-Based Gambar 4.1 Arsitektur Arsitektur Penerapa an Algo gori r tma Re ekomendasi Us ser er-Based Collaborative Memanfaatkan Pearson-Correlation Collaborat ativ ive Filtering Filterin ingg Dengan De M eman em anfa faat a ka kann Pe Pear arson-Correlatio on ................... 27 Gambar Arsitektur Pada Algoritma Gamb bar 4.2 Perancangan Perancang ngan an A rsitektur Antarmuka-Database Antarmuka-Da Dataaba base Pad ada Algori ritm tma Rekomendasi Memanfaatkan Pearson-Correlation ...................................... Reko komendas asii Ya Yang Meman anfa faatk tkan Pearson-Co Corr rrel elation ........ .................................. 34 Gambar G ambarr 44.3 .33 Perancangan Peranca cangan Antarmuka Untuk Penerapan Algoritma Alg lgoritma m User-Based Use s r-Baseed Collaborative ................... Collab abor orat ativ i e Filtering Filltering Dengan Memanfaatkan Pearson-Correlation Fi Pearson-Corrrel e ationn ..... ................. 42 Gambar Textbox ............................................................................. Gamb mbar ar 5.1 T extbox Porsi Data ..................................................... ..............................49 49 Gambar ..................... Ga Gamb mbar 55.2 .2 Efek Perubahan Dari Fungsi Pada Textbox Porsi Data .......... ............. 500 ....................................................................................... Ga Gambar r 5.3 Progress Bar ...................................................................... ...................... 50 Gambar ...................... Gamba ar 5.4 Gambar Keseluruhan Antarmuka Beserta Tombolnya ....... .................51 51 Gambar Gamba ar 5.5 Spesifikasi Tabel Korelasi.................................................................. 522 Gambar ................................................................ Ga Gamb mbaar 5.6 Spesifikasi Tabel Neighbor ....................................................... ........... 552 2 Tabel UserNeighbor Yang Sudah Terisi ................................... Gambar 5.7 Tab abel el U serN se rNei eigh ghbor Ya Y ng Sud udaah Ter eris isii Da Data ta ..... ................................... 553 3 Gambar ..................... Ga G mbar 5.8 Tabel UserNeighborGrouped UserNeighborGro oup uped ed Yang Sudah Terisi Data ................ ....... 554 4 Gambar ........................................ Ga Gamb mbar 5.9 Tabel Correlation Yang Sudah Terisi Data ............................ .................. 55 Gambar Spesifikasi Tabel Rekomendasi ....................................................... Ga Gamb mbar ar 55.10 .10 10 Sp Spes esif ifik ikas asii Ta Tabe bell Re Reko komend ndas asii ........................................ ................... 56 Gambar Spesifikasi Tabel Prediksi ................................................................ Ga Gamb mbar ar 5.11 Sp Spes esif ifik ikassi Ta Tabe bell Pred dik iksi si .......... ............................................................... 56 Gambar Tabel UCF_Recommendation Data Gamb bar 55.12 .12 12 Ta Tabe bel UCF_Recomm mendation on Yang Sudah Terisi Teri risi si D ataa .................. 57 at Sudah Gambar 5.13 Tabel UCF_Prediction UCF_Predicti tion Yang S udah Terisi Data ..............................57 UCF_MAE Gambar 5.14 Spesifikasi Tabel U CF_MAE .......................................................... 58 Yang Sudah Gambar 5.15 Tabel UCF_MAE Ya ang Sud dah Terisi Data .....................................59 UCF_Precision Gambar 5.16 Spesifikasi Tabel UCF_ F_Prrecision .................................................... 60 UCF_Precision Yang Gambar 5.17 Tabel UCF Precision Ya ang Sudah Terisi Data ...............................60
iv
DAFTAR TABEL
Tabel 2.1 Tabel Rangkuman Tinjau Tinjauan uan P Pustaka ustaka ..................................................... 10 us Beberapa Hasil Tabel 2.2 Klasifikasi Dari ri B eberapa Kemungkinann Ha H sil Rekomendasi ..............19 Rating ........................................................................................... Tabel 4.1 Tabel Ra Rati ting .......................................................... . ................................. 35 Tabel ...................................................................................... Tabel 4.2 Tabe bel Pengguna ......... ............................................................................................. 35 .............................................................................................. Tabel 4.33 Tabel Film m .... ........................................................................................................ 36 Tabel Tabel Neighbor ...................................................................................... Tabe el 4.4 Tabe el Neighb hbor ........... ......................................................................................37 Tabel Neighbor ....................................................................... Ta 4.5 Ta Tabel Tabe bell N eig ghb hbor Grouped ................................. . ........................................... 37 Tabel Tabel Korelasi ........................................................................................ Tabe el 4. 4.66 Ta T bel K orelasi ........................................................... . ................................... 38 Tabel Tabel ................................................................................ Tabe bell 4. 44.7 7 Ta abel Rekomendasi................................................................ .................... 338 Tabel Tabel ........................................................................................ Ta Tabe bell 4.8 T abel Prediksi .................................................................... ........................ 399 Tabel 4.9 ....................................................... Ta Tabe bel 4. .9 Tabel MAE (Mean Absolute Error) ...................................... ..................... 40 Tabel 44.10 .10 Tabel Presisi ......................................................................................... 40 Tabel 5.1 Tabel Pengujian Fungsionalitas Perangkat Lunak ................................. 611 .......................... Ta 5.2 Klasifikasi Hasil Rekomendasi Terhadap Data Rating .................. Tabel ......... 67 Pencarian Dengan Korelasi Lebih Tabel 55.3 .3 Hasil Pe Penc ncarian TP, FP dan FN De Den ngan Batas K orelasi Lebi or ih Dari 0 ..67 67 Dengan Pearson-Correlation Tabel 5.4 Tabel Hasil Evaluasi UCF CF D enggan Memanfaatkan Pearson-Correla en ati tion on ............................................ Dengan Batas Korelasi User-Neighbor Lebih Dari 0 ................................... De ...........68 68 Tabel Hasil Pencarian Batas Korelasi Lebih Ta Tabe bell 5. 55.5 5 Ha Hasi sill Pe Penc ncar aria iann TP TP,, FP F dan FN Dengan Deng ngan an B atas at as K orel or elas asii Le Lebi bih Da Dari ri 0,3 0,3 ................................................................................................................................ ..... . .............................................................................................................................................69 Tabel Tabel Hasil UCF Dengan Memanfaatkan Pearson-Correlation Ta abe bell 5. 5.66 Ta Tabe bell Ha Hasi sill Ev Evaluasii U CF D engann M emanf nfaa aatk t an nP ears ea rson on-C -Corrrelation Batas Korelasi User-Neighbor Lebih Dengan B atas at as K orelasi User-Neigh ghbor Le ebih Dari 0,3 .........................................69 UCF Tabel 5.7 Tabel Hasil Evaluasi U CF Dengann Memanfaatkan Pearson-Correlation User-Neighbor Lebih Dengan Batas Korelasi User-Nei igh g bor Lebi ih Dari 0,5 .........................................70
v
User-Based Collaborative Filtering Dengan Memanfaatkan Pearson-Correlation Untuk Mencari Neighbors Terdekat Dalam Sistem Rekomendasi Disusun Oleh : Arvid Theodorus Nomor Mahasiswa 125301834/PS/MTF No Nomo mor Maha h si sisw swaa : 12 1253 5301 0183 834/ 4/PS PS/MTF INTISARI
Dalam Dala Da lam sa sat satu tu dekade terakhir ini perkembangan yang ng pes pesat sat sseputar eput ep utar sis sistem istem rekomendasi mencari teknik-teknik reko kome mendassi mendorong para peneliti untuk terus menca ari te tekn kniik-tekni nik rekomendasi kepentingan re reko komend ndasi baru. Beberapa faktor seperti kebutuhan bisnis,, ke epe pent ntin ingann penelitian rekomendasi peneliti tian maupun kepentingan pribadi membuat sistem rekomend dasi ssemakin emak kin banyak k variasinya. Tujuan uutama tam ta ma dari vari rias asi tersebut ut adalah untu tukk me m ncari teknik yyang angg an variasi untuk mencari te terbaik dalam memberi rekomendasi. N amun, beberapa teknik rekomendasii ma masi sih Namun, masih belu be belum lum m me memi memiliki mili liki ki metode met etod odee ya yang ng berfungsi untuk unttuk m mencari enca en cari ri rrelasi elas el asii an anta antar tar pe peng pengguna. nggu guna. Untu Un Untuk tukk itu, penelitian penel elit itia iann ini in ni akan ak bberfokus erfo er foku kus pada paada m metode etod odee pe pencarian re rela relasi lasi si antar rekomendasi. penggunaa ddalam alam sebuah sistem rekom al mendasi. Peneliti memanfaatkan mem eman anffaatkan teknik pengukuran Pearson-Correlation Pearson-Correlatio on dalam aalgoritma lgoritma User-Based Collaborative membuktikan Filtering untuk menghitung relasi relassi dan m embuktikan seberapa besar pengaruh rekomendasi relasi tersebut terhadap keakuratan re ekoomendasi dan prediksi. Katakunci : User Based Collaborative Filtering, Pearson Correlation, Sistem Rekomendasi, Evaluasi Sistem Rekomendasi
vi