ISSN : 2407 - 6511 Analisis Perbandingan Sistem Rekomendasi dengan Faktorisasi Matriks dan Pearson Berbasis Collaborative Filtering Pada Web E-Commerce 1Marissa
Aflah Syahran 2Erwin Budi Setiawan
3
Sri Suryani
Fakultas Informatika , Telkom University Jl. Telekomunikasi Dayeuh Kolot Bandung 40257
[email protected] 2
[email protected] 3
[email protected] Abstraks Recommender system merupakan suatu sistem yang mampu memberikan suatu rekomendasi kepada user terhadap item, seperti barang, musik, video, film, buku, dan sebagainya, yang mungkin akan dipilihnya. Penelitian ini mengimplementasikan dan menganalisis perbandingan recommender system dengan algoritma pearson serta faktorisasi matriks yang berbasis Collaborative Filtering. Analisis perbandingan didasarkan pada analisis algoritma, nilai Mean Absolute Error (MAE) dan Response time. Dari hasil analisis, didapatkan bahwa kompleksitas algortima faktorisasi matriks Lebih kompleks dari algoritma pearson. Selain itu didapat nilai MAE recommender system dengan algoritma faktorisasi matriks memiliki nilai MAE yang lebih kecil daripada recommender system dengan algoritma pearson serta nilai Response time recommender system dengan algoritma pearson lebih kecil daripada algoritma faktorisasi matriks. Metode yang paling baik digunakan adalah faktorisasi matriks karena memiliki MAE lebih akurat dibandingkan dengan metode pearson. Perkembangan hardware juga membuat response time tidak berpengaruh secara signifikan Kata kunci: recommender system, Collaborative Filtering, pearson, faktorisasi matriks, MAE, response time 1. Pendahuluan 1.1 Latar Belakang Pada umumnya, pengguna internet yang mengunjungi web E-Commerce masih membutuhkan waktu yang relatif lama dalam mencari barang-barang yang diinginkan olehnya. Setiap pengguna masih sering menggunakan menu search pada setiap web E-Commerce dalam mencari barang-barang yang dibutuhkan. Hal ini kadang berpengaruh terhadap user yang malas dalam melakukan pencarian. Oleh sebab itu, dibutuhkan sebuah sistem yang dapat memberikan rekomendasi kepada user terhadap barangbarang yang dibutuhkan sesuai dengan profil dan rating yang diberikan oleh masing-masing user. Recommender system adalah sebuah sistem yang mencoba untuk memprediksi sebuah item (lagu, buku, film, berita, barang dan sebagainya) berdasarkan informasi (profil, data, maupun rating) yang diperoleh dari pengguna kemudian merekomendasikannya kepada pengguna tertentu. Informasi yang diberikan oleh pengguna dapat diperoleh secara eksplisit dan implisit yang merupakan proses pembangkitan profil pengguna. Sebuah web E-Commerce yang dilengkapi dengan recommender system dapat memberikan rekomendasi berupa barang-barang yang dibutuhkan oleh pengguna dengan proses membangkitkan profil pengguna dari web tersebut. Dalam penelitian ini akan dibahas perbandingan antara 2 buah metode recommender system, yaitu dengan metode faktorisasi matriks dan metode pearson berbasis Collaborative Filtering. Perbandingan tersebut dilihat dari analisis algoritma, response time, dan nilai MAE (Mean Absolute Error). 1.2 Perumusan Masalah Permasalahan yang dijadikan objek penelitian dalam Penelitian ini adalah : 1. Bagaimana melakukan implementasi recommender system pada sebuah web ecommerce dengan menggunakan metode faktorisasi matriks dan metode pearson berbasis Collaborative Filtering. 2. Bagaimana mencari perbandingan kedua metode tersebut berdasarkan analisis algoritma, response time, dan MAE (mean absolute error) sehingga dapat menghasilkan rekomendasi yang tepat. 1.3 Tujuan Tujuan dari Penelitian ini adalah: 1. Melakukan implementasi recommender system dengan metode faktorisasi matriks dan pearson berbasis Collaborative Filtering pada web E-Commerce 2. Menguji dan menganalisis akurasi rekomendasi yang dihasilkan oleh recommender system berdasarkan analisis algoritma, response time dan nilai Mean Absolute Error (MAE) pada
50
ISSN : 2407 - 6511 algoritma pearson dan faktorisasi matriks kemudian membandingkan hasil diantara keduanya. 2. Dasar Teori 2.1. E-Commerce Secara umum E-Commerce dapat didefinisikan sebagai segala bentuk transaksi perdagangan / perniagaan barang atau jasa (trade of goods and service) dengan menggunakan media eletronik [10]. 2.2 Recommender system Recommender system adalah sebuah sistem yang mencoba untuk memprediksi sebuah item (lagu, buku, film, berita, barang dan sebagainya) berdasarkan informasi yang diperoleh dari pengguna kemudian merekomendasikannya kepada pengguna tertentu. Informasi yang diberikan oleh pengguna dapat diperoleh secara eksplisit dan implisit yang merupakan proses pembangkitan profil pengguna. Yang dimaksud secara eksplisit adalah informasi tersebut diberikan langsung oleh pengguna. Misalnya, memberikan rating terhadap film yang pernah ditonton. Sedangkan yang dimaksud secara implisit adalah informasi tersebut diperoleh tanpa diketahui oleh pengguna. Misalnya, dengan melakukan penelusuran dari transaksi yang pernah dilakukan oleh pengguna. Recomender system dapat digunakan pada layanan E-Commerce, yaitu dengan memberikan rekomendasi terhadap barang-barang yang dapat dibeli oleh user tertentu. Rekomendasi ini berasal dari informasi implisit yaitu informasi yang dihasilkan dari pembangkitan data profil pengguna maupun dari informasi eksplisit yaitu pemberian rating oleh pengguna E-Commerce tersebut. Secara umum recommender system dibagi menjadi 3 kategori besar, yaitu: 1. Content based filtering, 2. Collaborative Filtering dan 3. Hybrid 2.3 Collaborative Filtering Collaborative Filtering (CF) merupakan suatu teknik yang digunakan dalam recommender system. Konsep utama dari CF adalah untuk memberikan rekomendasi kepada seorang user berdasarkan pada opini yang diberikan oleh user-user lain yang memiliki kesamaan terhadap suatu item. 2.4 Pure Pearson Correlation CF Pearson’s correlation merupakan salah satu metode dari memory-based CF yang digunakan dalam menentukan korelasi antara dua user atau dua item. Nilai bobot pada pearson’s correlation dapat dihitung dengan rumus sebagai berikut [2]:
Rentang nilai bobot berkisar antara -1 sampai dengan 1. Semakin besar nilai bobotnya, maka korelasinya akan semakin tinggi pula. Prediksi pada pearson’s correlation dapat dihitung dengan rumus:
2.5 Faktorisasi Matriks Faktorisasi matriks adalah metode yang memfaktorkan sebuah matriks, misalnya untuk mencari dua (atau lebih) matriks-matriks, sehingga ketika dikalikan akan didapatkan kembali matriks yang nilainya sama atau mendekati nilai matriks aslinya. faktorisasi matriks mengkarakterkan antara user dan item dengan vektor dari faktor yang
51
ISSN : 2407 - 6511 3 muncul dari pola rating user. Faktor keterkaitan yang besar antara user dan item mengarahkan pada sebuah rekomendasi. Metode ini menjadi populer dengan mengombinasikan perkiraan yang baik dengan akurasi prediksi[6]. Faktorisasi matriks dapat digunakan untuk menemukan latent factor / latent features berdasarkan interaksi antara dua macam entitas yang berbeda, dan untuk memprediksi rating dalam item. Perhitungan faktorisasi matriks dapat diambil dari rumus berikut ini [7] :
Dengan keterangan sebagai berikut : α = konstanta yang nilainya menentukan nilai batas bawah = 0.0002 β = konstanta untuk mengendalikan besarnya vektor fitur user dan fitur item=0.02 2.6 Response time Response time adalah waktu yang dibutuhkan oleh sebuah sistem untuk melakukan satu kali eksekusi proses. Response time dinyatakan dalam satuan detik. Semakin besar nilai response time, berarti semakin lama waktu yang dibutuhkan oleh sistem untuk melakukan sebuah proses. Sehingga semakin kecil nilai response time, maka semakin baik sistem tersebut. 2.7 MAE MAE digunakan untuk mengukur error dari prediksi rating yang akan dihasilkan oleh recommender system [16]. Semakin kecil nilai MAE, maka semakin baik prediksi yang dihasilkan. MAE biasa digunakan untuk mengukur error dari prediksi rating yang dihasilkan oleh sebuah recommender system. Prediksi yang yang baik akan ditunjukkan dengan nilai MAE yang semakin kecil. Fungsi MAE dapat didefinisikan sebagai berikut:
3. Analisis Perancangan Sistem 3.1 Analisis Sistem Pada analisis sistem ini akan didefinisikan kebutuhan-kebutuhan dari sistem yang akan dibangun. Secara umum, arsitektur aplikasi ecommerce dengan menggunakan recommender system dapat dilihat pada gambar 1 sebagai berikut
52
ISSN : 2407 - 6511
3.2 Flowmap Penggambaran kerja aplikasi E-Commerce dengan recommender system ini dapat dilihat pada gambar 2
4. Implementasi dan Analisis Hasil Pengujian 4.1 Data Set Dataset yang digunakan dalam pengujian sistem merupakan data user yang me-rating barangbarang elektronik. Dataset ini terdiri dari 944 user yang telah memberikan rating terhadap 1682 barang dengan total rating sebanyak 3077 rating. Pada pengujian sistem nantinya dilakukan pembagian yang terdiri 2 bagian, yaitu rating_tabel untuk data latih serta rating_prediksi untuk data uji. Pembagian data latih dan data uji dilakukan secara random dengan persentase mulai dari 10% sampai 95%. Pembagian tersebut dapat ditunjukkan melalui tabel 1 :
53
ISSN : 2407 - 6511 4.2 Analisis Algoritma Pearson Untuk memberikan rekomendasi berupa rating prediksi dengan menggunakan algoritma pearson, akan dilakukan 2 kali perhitungan. Perhitungan yang pertama adalah menghitung nilai bobot antar item. Setelah mengetahui nilai bobot antar item, maka dapat dilakukan perhitungan kedua yaitu perhitungan rating prediksi. Proses pada algoritma pearson dimulai dengan menghitung bobot antar item. Perhitungan bobot tersebut menggunakan rumus pada persamaan (2.1) Setelah diketahui bobot dari antar item, maka akan dapat diketahui nilai prediksi dari user untuk item tertentu dengan menggunakan rumus pada persamaan (2.2). Dari algoritma pearson yang ada, dihitung nilai kompleksitas waktunya sebagai berikut : Kompleksitas waktu = 6n2 + 9n + 2 O(n) = n2 Keterangan : n = banyaknya data inputan 4.3 Analisis Response time Pearson Berikut ini adalah hasil pengujian terhadap recommender system dengan menggunakan algoritma pearson berdasarkan pengaruh perbedaan persentase data yang diukur dengan menghitung besarnya response time yang dibutuhkan :
Berikut ini penggambaran hasil pengujian menggunakan grafik:
Dari gambar 4.1 dapat dilihat bahwa nilai response time berupa kurva yang naik pada awalnya kemudian turun di akhir. Hal ini disebabkan, perhitungan prediksi untuk pearson terdiri dari 2 tahap, yaitu perhitungan bobot dan perhitungan prediksi itu sendiri. Masing-masing tahap akan membutuhkan waktu tersendiri. Semakin banyak data latih, maka perhitungan bobot akan membutuhkan waktu semakin besar. Selain itu, semakin banyak data latih, maka perhitungan untuk prediksi semakin sedikit. Demikian juga, semakin sedikit data latih, maka perhitungan bobot akan semakin kecil tetapi perhitungan prediksi akan semakin banyak. Dalam hal ini, maka ada 2 buah faktor yang menentukan perhitungan response time, yaitu perhitungan bobot dan perhitungan prediksi. Pada data latih 10 %, menunjukkan faktor yang banyak berpengaruh terhadap response time adalah lamanya perhitungan prediksi, sedangkan perhitungan bobot sedikit berpengaruh. Pada data ini juga menunjukkan response time paling
54
ISSN : 2407 - 6511 minimum. Pada data latih 95% menunjukkan faktor yang banyak berpengaruh terhadap response time adalah perhitungan bobot, sedangkan perhitungan prediksi sedikit berpengaruh. Jika dilihat dari data diatas, pada data latih 10 %, memiliki response time sebesar 173,31 detik. Sedangkan pada data latih 90 %, memiliki response time sebesar 1423,79 detik. Jika melihat bahwa perhitungan bobot akan lebih cenderung kepada data latih sedangkan perhitungan prediksi lebih cenderung kepada data uji, maka dari data diatas dapat diketahui bahwa untuk melakukan perhitungan bobot membutuhkan waktu yang lebih lama dibandingkan untuk melakukan perhitungan prediksi. Hal ini dapat memberikan penjelasan mengapa pada data latih 60 % memiliki response time paling lama sebesar 2389,49 detik. Hal ini menunjukkan pada titik tersebut perhitungan bobot dan perhitungan prediksi mencapai titik maksimum. 4.4 Analisis MAE Pearson Berikut ini adalah hasil pengujian terhadap recommender system dengan menggunakan algoritma pearson berdasarkan pengaruh perbedaan persentase data yang diukur dengan menghitung nilai MAE : Tabel 3. Hasil Pengujian Pearson berdasarkan MAE
Berikut ini penggambaran hasil pengujian menggunakan grafik pada gambar 4 :
Berdasarkan hasil pengujian diatas, jumlah data latih akan mempengaruhi nilai MAE. Semakin banyak jumlah data latih, maka nilai MAE akan semakin kecil. Hal ini dikarenakan semakin besar jumlah data latih, kemungkinan item memiliki similarity dengan item lain semakin besar sehingga prediksi akan semakin mendekati nilai sebenarnya dan nilai MAE akan menjadi semakin kecil. Dari penjelasan diatas, dapat diambil kesimpulan bahwa semakin besar jumlah data latih maka semakin besar pula nilai simmilarity antar item dan semakin kecil pula nilai MAE, sehingga semakin besar jumlah data latih, maka semakin bagus recommender system yang dibangun. 4.5 Analisis Algoritma Faktorisasi Matriks Algoritma faktorisasi matriks dimulai dari pembentukan dekomposisi matriks menjadi matriks R dengan dimensi m x n. Setelah dekomposisi matriks tersebut, akan dibentuk 2 buah matriks, yaitu matriks P yang memiliki dimensi (m x latent ) serta matriks Q yang memiliki dimensi (latent x n). Perhitungan faktorisasi matriks akan menggunakan rumus pada persamaan (2.3), (2.4) dan (2.5). Setelah itu akan dihitung perkalian dua buah matriks P dan Q yang menghasilkan matriks R’. Perkalian ini akan dicari nilai error-nya dan dilihat apakah error-nya sudah mencapai 0.01 atau
55
ISSN : 2407 - 6511 belum. Kalau belum, maka akan dilakukan iterasi berikutnya hingga mencapai error tersebut. iterasi akan berakhir setelah mencapai error 0.01 atau mencapai iterasi yang ditentukan. Dari algoritma faktorisasi matriks yang ada, dihitung nilai kompleksitas waktunya sebagai berikut : Kompleksitas waktu = 3n4 + 2n3 + n2 + n + 1 O(n) = n4 Keterangan : n = banyaknya data inputan 4.6 Analisis Response time Faktorisasi Matriks Pada pengujian ini, dengan menggunakan algoritma faktorisasi matriks, untuk masing-masing persentase data latih dan data uji, akan diberikan nilai latent antara 1 sampai 5 serta iterasi antara 10, 100, 1000, 10000 dan 50000 kemudian diukur nilai response time-nya. Pengujian pertama untuk response time pada faktorisasi matriks menggunakan iterasi 10 memberikan hasil sebagai berikut :
Pengujian kedua untuk response time pada faktorisasi matriks menggunakan iterasi 100 memberikan hasil sebagai berikut :
Pengujian ketiga untuk response time pada faktorisasi matriks menggunakan iterasi 1000 memberikan hasil sebagai berikut :
56
ISSN : 2407 - 6511 Pengujian keempat untuk response time pada faktorisasi matriks menggunakan iterasi 10000 memberikan hasil sebagai berikut :
Pengujian kelima untuk response time pada faktorisasi matriks menggunakan iterasi 50000 memberikan hasil sebagai berikut :
Secara keseluruhan, berdasarkan hasil pengujian dari pengujian pertama sampai kelima (iterasi 10, 100, 1000, 10000 dan 50000) dapat dilakukan analisis sebagai berikut : latih maka response time yang dibutuhkan semakin sedikit. Hal ini disebabkan karena semakin banyak data latih, maka semakin banyak data yang mengisi matriks R (matriks yang diharapkan), sehingga waktu untuk mencapai matriks R dengan error mendekati 0.01 akan semakin cepat, begitu pula sebaliknya. response time yang dibutuhkan semakin besar. Hal ini disebabkan, semakin banyak latent , maka semakin besar dimensi matriks yang digunakan, sehingga waktu untuk eksekusi menjadi semakin lama, begitu pula sebaliknya. response time yang dibutuhkan. Hal ini disebabkan semakin banyak iterasi, maka semakin banyak pula proses yang dilakukan, sehingga waktu yang dibutuhkan semakin lama. 4.7 Analisis MAE Faktorisasi Matriks Pada pengujian ini, dengan menggunakan algoritma faktorisasi matriks, untuk masing-masing persentase data latih dan data uji, akan diberikan nilai latent antara 1 sampai 5 serta iterasi antara 10, 100, 1000, 10000, 50000 dan percobaan MAE< 0.01 kemudian diukur nilai MAE-nya. Pengujian pertama untuk MAE pada faktorisasi matriks menggunakan iterasi 10 memberikan hasil sebagai berikut :
57
ISSN : 2407 - 6511 Pengujian kedua untuk MAE pada faktorisasi matriks menggunakan iterasi 100 memberikan hasil sebagai berikut :
Pengujian ketiga untuk MAE pada faktorisasi matriks menggunakan iterasi 1000 memberikan hasil sebagai berikut :
Pengujian keempat untuk MAE pada faktorisasi matriks menggunakan iterasi 10000 memberikan hasil sebagai berikut :
Pengujian kelima untuk MAE pada faktorisasi matriks menggunakan iterasi 50000 memberikan hasil sebagai berikut :
Berdasarkan data hasil pengujian, untuk iterasi 50000 dan latent 1, dapat dibuat grafik regresi linier sebagai berikut :
58
ISSN : 2407 - 6511
Sebagaimana diketahui diatas, kondisi berhenti faktorisasi matriks ada 2, yaitu iterasi selesai atau e < 0.01. percobaan-percobaan di atas menghasilkan MAE yang masih ada di atas 0.01, sehingga dapat disimpulkan bahwa percobaan faktorisasi matriks diatas berhenti akibat iterasi yang selesai. Hal ini diperkuat dengan bukti bahwa percobaan untuk iterasi yang semakin meningkat sampai 50000 iterasi menghasilkan MAE yang semakin menurun. Oleh sebab itu, dengan kondisi terbaik, yaitu menggunakan data latih 95 % dan latent 1 akan dicari hasil MAE yang mencapai e < 0.01. Dari percobaan yang dilakukan, didapat hasil sebagai berikut : Tabel 4. Percobaan Faktorisasi Matriks MAE < 0.01
Berdasarkan 5 pengujian diatas, dapat dilakukan analisis sebagai berikut : semakin besar data latih, maka semakin banyak data yang mengisi matriks R (matriks yang diharapkan), sehingga kemungkinan untuk mencapai error 0.01 8 semakin besar. Oleh sebab itu, nilai error (MAE) yang dihasilkan akan semakin kecil. oleh semakin banyak jumlah latent yang digunakan maka semakin banyak pula dimensi matriks P dan Q. Perkalian matriks P dan Q pun akan menghasilkan nilai yang lebih besar, sehingga nilainya jauh dari matriks R (matriks yang diharapkan). Oleh sebab itu, nilai rating prediksi akan semakin jauh dari rating yang diharapkan. Hal ini berpengaruh kepada nilai MAE yang semakin besar. Oleh sebab itu, latent terbaik untuk faktorisasi matriks adalah latent 1. pada setiap iterasi, dilakukan perbaikan matriks untuk mencapai matriks R (matriks yang diharapkan), sehingga semakin banyak iterasi, maka matriks hasil perkalian P dan Q yang dihasilkan akan semakin mendekati matriks R. Semakin banyak iterasi yang dilakukan, semakin kecil pula nilai e (error) yang dihasilkan. Hal ini menyebabkan rating prediksi akan semakin mendekati rating sebenarnya, sehingga nilai MAE akan semakin kecil. 4.8 Analisis Perbandingan Algoritma Pearson dan Faktorisasi Matriks Berikut ini merupakan hasil perbandingan analisis terhadap algoritma pearson dan algoritma faktorisasi matriks. Tabel 5. Perbandingan Algoritma Pearson dan Faktorisasi Matriks
Dari tabel 5, dapat dilihat bahwa kompleksitas waktu dari faktorisasi matriks (n3) lebih kompleks dari kompleksitas waktu yang dimiliki oleh algoritma pearson (n2). Dengan perhitungan kompleksitas waktu tersebut, faktorisasi matriks akan membutuhkan waktu eksekusi yang lebih
59
ISSN : 2407 - 6511 lama daripada waktu eksekusi yang dibutuhkan algoritma pearson. Oleh karena itu, pearson lebih efisien dibandingkan algoritma faktorisasi matriks. Dilain sisi, faktorisasi matriks memiliki tahapan untuk perbaikan di setiap iterasinya, sedangkan algoritma pearson tidak memiliki tahapan tersebut, sehingga apabila iterasi dilakukan dalam jumlah yang besar, maka nilai error yang dihasilkan oleh faktorisasi matriks akan lebih kecil nilai error yang dihasilkan oleh algoritma pearson. 4.9 Analisis Perbandingan Response time Pearson dengan Faktorisasi Matriks Dari beberapa hasil analisis diatas, diambil hasil pengujian terbaik untuk setiap persentase data latih. Dari hasil tersebut, kemudian dibandingkan nilai response time yang diperoleh algoritma pearson serta faktorisasi matriks. Berikut ini adalah hasil pengujian terhadap recommender system dengan menggunakan algoritma pearson dan faktorisasi matriks berdasarkan pengaruh perbedaan persentase data yang diukur dengan menghitung nilai response time : Tabel 6. Hasil Pengujian Response time Pearson dan Faktorisasi Matriks Berdasarkan Response time
Berdasarkan hasil pengujian pada tabel 6 dapat dilihat bahwa nilai response time yang diberikan oleh pearson yaitu 684.82 yang jauh lebih kecil dari nilai response time yang dihasilkan oleh faktorisasi matriks yaitu 145202.76. Hal ini disebabkan pada faktorisasi matriks, terdapat proses iterasi secara bertingkat dan pengujian diatas menggunakan iterasi sebanyak 103189 kali (hasil pengujian dengan nilai MAE terbaik). Hal ini menunjukkan bahwa pearson memiliki kelebihan dalam waktu eksekusi yang lebih cepat dibandingkan faktorisasi matriks. 4.10 Analisis Perbandingan MAE Pearson dengan Faktorisasi Matriks Dari beberapa hasil analisis diatas, diambil hasil pengujian terbaik untuk setiap persentase data latih. Dari hasil tersebut, kemudian dibandingkan nilai MAE yang diperoleh algoritma pearson serta faktorisasi matriks. Berikut ini adalah hasil pengujian terhadap recommender system dengan menggunakan algoritma pearson dan faktorisasi matriks berdasarkan pengaruh perbedaan persentase data yang diukur dengan menghitung nilai MAE :
60
ISSN : 2407 - 6511 Tabel 7. Hasil Pengujian MAE Pearson dan Faktorisasi Matriks Berdasarkan MAE
Berdasarkan hasil pengujian pada tabel 7 dapat dilihat bahwa nilai MAE yang diberikan oleh algoritma faktorisasi matriks yaitu 0.0099 memiliki nilai yang lebih kecil dibandingkan nilai MAE yang diberikan oleh algoritma pearson yaitu 0,8945. Hal ini dikarenakan pada pearson hanya menghitung nilai simmilarity dari antar item saja, sedangkan pada faktorisasi matriks akan menghitung rating dengan cara membuat matriks yang semakin mendekati nilai real rating. Hal ini membuat faktorisasi matriks akan menghasilkan rating-rating yang semakin dekat dengan nilai pada real rating. Nilai MAE pada faktorisasi matriks diatas pun akan semakin kecil jika iterasi yang diberikan semakin besar, yaitu 103189 iterasi. Dari analisis diatas, dapat diambil kesimpulan bahwa algoritma faktorisasi matriks menghasilkan nilai MAE yang lebih kecil daripada algoritma pearson, sehingga algoritma faktorisasi matriks membuat recommender system yang lebih akurat daripada algoritma pearson. 5. Kesimpulan dan Saran 5.1. Kesimpulan Berdasarkan hasil pengujian dan analisis, dapat diambil beberapa kesimpulan sebagai berikut : 1. Response time pada pearson berupa kurva karena perhitungan prediksi untuk pearson terdiri dari 2 tahap, yaitu perhitungan bobot pada data latih dan perhitungan prediksi pada data uji, dimana perhitungan bobot membutuhkan response time lebih lama dibandingkan perhitungan prediksi, dan response time pada faktorisasi matriks, semakin banyak data latih maka response time yang dibutuhkan semakin sedikit, semakin banyak latent yang digunakan maka response time yang dibutuhkan semakin besar serta semakin banyak jumlah iterasi maka semakin besar response time yang dibutuhkan. Oleh karena itu, metode pearson lebih efisien dibandingkan faktorisasi matriks. 2.
MAE pada pearson, semakin besar jumlah data latih maka semakin besar pula nilai simmilarity antar item dan semakin kecil pula nilai MAE, dan MAE pada faktorisasi matriks, semakin besar jumlah data latih maka nilai MAE akan semakin kecil, semakin banyak jumlah latent yang digunakan, maka nilai MAE semakin besar, serta semakin banyak jumlah iterasi yang dilakukan, maka nilai MAE semakin kecil. Oleh karena itu, metode faktorisasi matriks memiliki MAE lebih kecil dibandingkan pearson.
3.
Kompleksitas waktu asimptotik dari faktorisasi matriks (n4) lebih kompleks dari kompleksitas waktu asimptotik yang dimiliki oleh algoritma pearson (n2).
4.
Pada penelitian ini, metode yang paling baik digunakan adalah faktorisasi matriks karena memiliki MAE lebih akurat dibandingkan dengan metode pearson. Perkembangan hardware juga membuat response time tidak berpengaruh secara signifikan. Oleh karena itu, response time pada faktorisasi matriks tidak terlalu berpengaruh.
61
ISSN : 2407 - 6511 5.2. Saran Beberapa hal yang dapat dijadikan saran dalam penulisan penelitian ini untuk penelitian selanjutnya antara lain : 1. Untuk penelitian selanjutnya, dapat dilihat perbandingan algoritma pearson dan faktorisasi matriks berdasarkan parameter yang lain, seperti precission, recall. 2. Dapat dilakukan pre-processing terhadap data latih maupun data uji agar data yang dihasilkan untuk pengujian menunjukkan data terbaik. 3. Mengefisiensikan algoritma faktorisasi matriks untuk mempersingkat waktu eksekusi. Daftar Pustaka [1] Albright, Russell; Cox, James; Duling, David; Langville, Amy N; and Meyer, Carl D. 2006. “Algorithms, Initializations, and Convergence for the Nonnegative Matrix Factorization”. Department of Mathematics, College of Charleston, Charleston, SC 29424, USA, Department of Mathematics, Center for 10 Research in Scientific Computation, N. Carolina State University, Raleigh, N.C. 27695-8205, USA [2] Chee, Sonny Han Seng. 2000. “RecTree: A Linear Collaborative Filtering Algorithm”. Simon Fraser University. [3] Ding, Yi and Li, Xue. 2005. “Time Weight Collaborative Filtering”. School of Information Technology and Electrical Engineering, University of Queensland. [4] Gujarati, D. 1991. EKONOMETRIKA DASAR. Erlangga. Jakarta. [5] Han, Jiawei and Kamber, Micheline. 2006. “Data mining : Concept and Techniques”. San Fransisco, United States of America. [6] Koren,Yehuda; Yahoo Research and Robert Bell and Chris Volinsky, AT&T Labs—Research. 2009. “Matrix Factorization Techniques for Recommender Sistem”. IEEE Computer Society. [7] Mardhia,Murein Miksa. 2011. "Sistem Rekomendasi dengan Teknik Faktorisasi Matriks dan Temporal Dynamics Berbasis Collaborative Filtering". Institut Teknologi Telkom, Bandung. [8] Nugroho, Bunafit. 2007. “Trik dan Rahasia Membuat Aplikasi Web dengan PHP”. Yogyakarta : Gava Media [9] Pilászy, István. 2009. “Factorization-Based Large Scale Algorithm”. Budapest University of Technology and Economics [10] Prasetyo, Didik Dwi. 2002. “Administrasi Database Server MySQL”. Bandung : PT Elex Media Komputindo [11] Romero, C and Ventura,S. 2006. “Data mining in ELearning”. Athenaeum Press Ltd., Gateshead : Great Britain [12] Sania, Rika; Maharani,Warih and dan Prima,Angelina K. 2010. "Analisis Perbandingan Metode Pearson Dan Spearman Correlation Pada Recommender system". Konferensi Nasional Sistem dan Informatika 2010 : Bali. [14] Syilfi; Ispriyanti, Dwi and Safitri, Diah. 2012. "Analisis Regresi Linier Piecewise Dua Segmen". JURNAL GAUSSIAN, Volume 1, Nomor 1, Tahun 2012, Halaman 219-228. [15] Takács, Gábor; Pilászy, István; Németh, Bottyán; and Tikky, Domonkos. 2008. “Investigation of Various Matrix Factorization Methods for Large Recommender systems”. István Széchenyi University, Budapest University of Technology and Economics [16] Vozalis, Emmanouil & Margaritis, Konstantinos G. 2003. “Analysis of Recommender systems' Algorithms”. Greece: University of Macedonia
62