BAB 2 LANDASAN TEORI
2.1.
Sistem Rekomendasi
Sistem rekomendasi merupakan sebuah perangkat lunak yang bertujuan untuk membantu pengguna dengan cara memberikan rekomendasi kepada pengguna ketika pengguna dihadapkan dengan jumlah informasi yang besar. Rekomendasi yang diberikan diharapkan dapat membantu pengguna dalam proses pengambilan keputusan, seperti barang apa yang akan dibeli, buku apa yang akan dibaca, atau musik apa yang akan didengar, dan lainnya (Ricci et al, 2011). Sistem rekomendasi pribadi (personalized recommender system) harus mengenal terlebih dahulu setiap pengguna yang ada. Setiap sistem rekomendasi harus membangun dan memelihara user model atau user profile yang berisi ketertarikan pengguna (Jannach et al, 2010). Sebagai contoh, sistem rekomendasi di website Amazon menyimpan setiap transaksi pembelian pelanggan, komentar pelanggan, dan review / rating yang diberikan oleh pelanggan terhadap suatu produk. Terdapat dua buah pendekatan yang dapat dilakukan untuk membentuk user profile, yaitu pendekatan implicit dan explicit. Pendekatan implicit, artinya, sistem menyimpan dan mempelajari perilaku pengguna di dalam sistem untuk membangun profil pengguna. Perilaku pengguna dapat berupa likes/dislikes, ratings, dan lain sebagainya terhadap beberapa item. Sementara pendekatan explicit, yaitu dengan menanyakan kepada pengguna secara langsung
deskripsi
item
yang
bagaimana
yang
ia
sukai/minati.
Universitas Sumatera Utara
7
Berbagai metode telah ditemukan untuk menyediakan rekomendasi yang handal. Berdasarkan metode rekomendasi yang sering digunakan, sistem rekomendasi dibagi dalam tiga klasifikasi yaitu: content-based recommendation, collaborativefiltering recommendation, dan hybrid recommendation.
2.2.
Sistem Rekomendasi Content Based
Sistem rekomendasi berbasis konten (Content-based Recommendation System) menggunakan ketersediaan konten (sering juga disebut dengan fitur, atribut atau karakteristik) sebuah item sebagai basis dalam pemberian rekomendasi (Ricci et al, 2011). Sebagai contoh, sebuah film mempunyai konten seperti genre, author, tahun rilis, dan lain-lain, atau sebuah file dokumen memiliki konten berupa tulisan yang ada di dalamnya. Sistem rekomendasi berbasis konten mencoba untuk melakukan pecocokan (matching) antara profil pengguna (user profile) dengan konten item (item content). Misalnya, seorang pengguna telah memberi rating kepada 5 buah item π1 , π2 , π3 , π4 , π5 yang memiliki empat buah fitur π1 , π2 , π3 , π4 , π5 . Angka 1 menandakan bahwa item tersebut memiliki atribut yang bersangkutan, sedangkan angka 0 menunjukkan bahwa item tersebut tidak memiliki atribut tersebut. Tabel 2.1 Tabel Item Feature
Fitur ππ
Fitur ππ
Fitur ππ
Fitur ππ
rating
Item ππ
1
1
1
1
4
Item ππ
1
0
1
1
3
Item ππ
1
0
0
0
2
Item ππ
1
0
1
1
3
Item ππ
1
1
0
1
?
Untuk menghitung bobot dari masing-masing atribut dapat dengan menggunakan rumus berikut (Uluyagmur et al, 2012). π€ π’, ππ =
1 πΌπ’
π₯ π, π π(π’, π)
(2.1)
ππ πΌπ’
Universitas Sumatera Utara
8
Dimana : ο·
π€ π’, ππ merupakan bobot yang dimiliki oleh pengguna u terhadap fitur ππ .
ο·
πΌπ’ merupakan satu set item yang telah dirating oleh pengguna u.
ο·
π₯(π, π) merupakan nilai kehadiran (angka 1 atau 0) sebuah fitur di dalam sebuah item.
ο·
π(π’, π) merupakan rating yang diberikan pengguna u terhadap item i. Sedangkan untuk menghitung prediksi rating yang akan diberikan seorang
pengguna terhadap sebuah item dapat menggunakan formula berikut ini (Uluyagmur et al, 2012). π
β² π’, π =
1 π·π
(2.2)
π€(π’, π) ππ π·π
Dimana : ο·
π
β² π’, π merupakan prediksi rating pengguna u terhadap item i.
ο·
π·π merupakan fitur yang muncul di dalam item i. Sistem rekomendasi berbasis konten memiliki beberapa kelebihan, yaitu :
ο·
Sistem rekomendasi berbasis konten dapat menjelaskan bagaimana hasil rekomendasi didapatkan.
ο·
Sistem rekomendasi berbasis konten dapat merekomendasikan item-item yang bahkan belum pernah di-rate oleh siapapun.
Namun, sistem rekomendasi berbasis konten juga memiliki beberapa kelemahan, yaitu : ο·
Sistem rekomendasi berbasis konten tidak memiliki kemampuan untuk dapat memeberikan hasil rekomendasi yang tidak terduga (Serendipity Problem).
ο·
Sistem rekomendasi berbasis konten memerlukan sebuah profil user yang berisikan ketertarikan dan minat pengguna. Bagi pengguna baru yang belum pernah melakukan aktivitas apapun dan tidak memiliki profil user yang cukup, sistem rekomendasi tidak dapat memberikan rekomendasi yang handal kepadanya (Cold Start Problem).
Universitas Sumatera Utara
9
2.3.
Sistem Rekomendasi Collaborative Filtering
Ide utama dalam sistem rekomendasi collaborative filtering adalah untuk memanfaatkan opini pengguna lain yang ada untuk memprediksi item yang mungkin akan disukai/diminati oleh seorang pengguna (Ricci et al, 2011). Kualitas rekomendasi yang diberikan dengan menggunakan metode ini sangat bergantung dari opini pengguna lain (neighbor) terhadap suatu item. Belakangan diketahui bahwa melakukan reduksi neighbor (yaitu dengan memotong neighbor sehingga hanya beberapa pengguna yang memiliki kesamaan / similiarity tertinggi sajalah yang akan digunakan dalam perhitungan) mampu meningkatkan kualitas rekomendasi yang diberikan (Adomavicious dan Kwon, 2007). Sistem rekomendasi collaborative filtering beroperasi di dalam sebuah ruang dua dimensi User x Item. Rating yang dapat diberikan oleh seorang pengguna terhadap sebuah item dapat direpresentasikan sebagai R (bilangan bulat tidak negatif atau bilangan real dengan jarak tertentu), dan sistem rekomendasi mencoba untuk memprediksi rating yang akan diberikan seorang user untuk sebuah item yang belum pernah ia beri rating sebelumnya. Misalnya, terdapat lima pengguna π’1 , π’2 , π’3 , . . π’5 dan lima item π1 , π2 , π3 , . . π5 . Sebuah sistem rekomendasi ingin memprediksi berapa rating yang akan diberikan oleh π’1 kepada π5 . Tabel 2.2 Matrix User x Item pada Sistem Rekomendasi Collaborative Filtering
Item ππ
Item ππ
Item ππ
Item ππ
Item ππ
User ππ
5
7
5
7
?
User ππ
5
7
5
7
9
User ππ
5
7
5
7
9
User ππ
6
6
6
6
5
User ππ
6
6
6
6
5
Terdapat sebuah cara yang sering digunakan dalam menghitung / memprediksi rating pengguna u terhadap item i dengan mengkalkulasikan rata-rata rating pengguna lain (neighbor) (Adomavicious dan Kwon, 2007), yaitu rumus weighted sum:
Universitas Sumatera Utara
10
π
β² π’, π
=
π’ β² π π(π’)
1 π ππ(π’, π’β² )
(2.3) β²
β²
π ππ π’, π’ β π
(π’ , π) π’β²βπ(π’)
Dimana: ο·
π
β² (π’, π)adalah prediksi rating pengguna u terhadap item i.
ο·
π
(π’β², π)adalah rating pengguna uβ (pengguna selain u) terhadap item i.
ο·
π ππ(π’, π’β² ) adalah kemiripan antara pengguna π’ dengan π’β² .
ο·
N(u) adalah satu set pengguna lain yang mirip dengan pengguna u. Cosine-based Similiarity adalah cara terbaik untuk menghitung kemiripan dua
pengguna (Adomavicious dan Kwon, 2007). Cosine-based similiarity dapat dikalkulasikan dengan formula sebagai berikut : π ππ π’, π’β² =
π βπΌ(π’,π’β²) π
π βπΌ(π’,π’ β² ) π
(π’, π)
2
π’, π π
(π’β² , π)
(2.4)
π βπΌ(π’ ,π’ β² ) π
(π’β², π)
2
Dimana: ο·
π ππ π’, π’β² adalah kemiripan antara pengguna π’ dengan π’β² .
ο·
πΌ(π’, π’β² ) adalah satu set item yang telah di-rating oleh kedua pengguna π’ dengan π’β² . Sistem rekomendasi collaborative filtering memiliki beberapa kelebihan,
diantaranya adalah : ο·
Dapat bekerja di dalam keadaan dimana konten sulit dianalisis sekalipun.
ο·
Memiliki kemampuan untuk menghasilkan rekomendasi yang tak terduga.
Sistem rekomendasi collaborative filtering memiliki beberapa kekurangan, diantaranya adalah : ο·
Jika terdapat item baru di dalam sistem tersebut, maka sistem tidak dapat merekomendasikan item tersebut sampai pengguna lain berminat pada item tersebut. (First Rater Problem)
ο·
Hasil rekomendasi tidak selamanya handal. Terdapat kemungkinan adanya sebuah pengguna yang hanya memiliki sedikit neighbor dengan tingkat kesamaan (similiarty) yang kecil. (Grey Sheep Problem)
Universitas Sumatera Utara
11
ο·
Hasil rekomendasi yang tidak handal yang dikarenakan matrix rating yang jarang. (Sparsity Problem)
2.4.
Sistem Rekomendasi Hybrid
Masing-masing teknik sistem rekomendasi memiliki kelebihan dan kelemahannya tersendiri. Karenanya, sistem rekomendasi hybrid yang menggabungkan kekuatan dari model dan algoritma yang berbeda untuk mengatasi masalah-masalah yang telah disebutkan di atas menjadi target penelitian yang sedang marak dikembangkan (Jannach et al, 2011). Terdapat beberapa cara penggabungan yang dapat dilakukan dalam metode hybrid yaitu :
2.4.1. Penggabungan Linear (Linear Combination) Penggabungan ini menggabungkan hasil perhitungan beberapa teknik rekomendasi secara linear. Penggabungan ini menghitung prediksi rating secara terpisah terlebih dahulu, kemudian hasil dari masing-masing metode tersebut digabungkan menjadi satu. Claypool et al (1999) menggunakan rumus weighted average untuk menggabungkan hasil tersebut. π
ππ¦ππππ = (π€1 π
1 + π€2 π
2 + . . π€π π
π )/(π€1 + π€2 +. . π€n )
(2.5)
Dimana : ο·
π
ππ¦ππππ merupakan prediksi rating hybrid
ο·
π€π merupakan bobot prediksi rating dengan teknik/metode ke-n .
ο·
π
π merupakan prediksi rating dengan teknik / metode ke-n Gambar 2.1 merupakan contoh penggambaran dari penggabungan secara linear
antara teknik collaborative filtering dengan content based.
Universitas Sumatera Utara
12
Rating Matrix
Collaborative Filtering Combination Filtering
User Profile
Content Based Filtering
Gambar 2.1 Linear Combination
2.4.2. Penggabungan secara Sekuensial (Sequential Combination) Penggabungan ini melakukan perhitungan pada salah satu metode terlebih dahulu (misalnya content based) , kemudian hasil dari perhitungan tersebut dihitung dengan metode berikutnya (misalnya collaborative filtering) (Hayati, 2011). Penggabungan ini digambarkan pada gambar 2.2 berikut.
User Profile
Content Based Filtering
Combination Filtering
Collaborative Filtering
Gambar 2.2 Sequential Combination
2.4.3. Penggabungan secara Item-based Clustering Hybrid Method (ICHM) Penggabungan ini mengintegrasikan informasi item dan rating pengguna untuk menghitung kemiripan item-item (Hayati, 2011). Penggabungan ini digambarkan pada gambar 2.3.
Universitas Sumatera Utara
13
Group + Rating
Group Rater
Item Rating
Collaborative Filtering
Item group vector
Combination Filtering
Item Content
Clustering
Gambar 2.3 Item-based Clustring Hybrid Method
2.5.
Sistem Rekomendasi dengan Multi-Criteria Rating
Sistem rekomendasi dengan multi-criteria rating memperluas single-criteria rating, dengan menunjukkan preferensi subjektif seorang pengguna terhadap beberapa kriteria dari sebuah item (Adomavicious dan Kwon, 2007). Sebagai contoh, sebuah sistem rekomendasi film mengizinkan seorang pengguna untuk menilai bukan hanya berdasarkan tingkat kepuasan keseluruhan sebuah film, tetapi juga tingkat kepuasan berdasarkan beberapa kriteria film, seperti visual effetcs, story, atau acting. Beberapa contoh sistem rekomendasi multi-criteria rating yang sudah ada, yaitu : Zagatβs Guide yang menyediakan tiga kriteria untuk rating restoran (food, dΓ©cor, dan service), Buy.com yang menyediakan beberapa kriteria untuk rating elektronik (display size, performance, battery life, dan cost), dan Yahoo! Movies yang menunjukkan rating setiap pengguna untuk keempat kriteria (story, action, direction, dan visual). Untuk mempermudah pemahaman sistem rekomendasi multi-criteria rating tersebut, maka perhatikan contoh berikut :
Universitas Sumatera Utara
14
Tabel 2.3 Matrix User x Item pada Sistem Rekomendasi Multi-criteria Rating
Item ππ
Item ππ
Item ππ
Item ππ
Item ππ
User ππ
52,2,8,8
75,5,9,9
52,2,8,8
75,5,9,9
?
User ππ
58,8,2,2
79,9,5,5
58,8,2,2
79,9,5,5
9
User ππ
58,8,2,2
79,9,5,5
58,8,2,2
79,9,5,5
9
User ππ
63,3,9,9
64,4,8,8
63,3,9,9
64,4,8,8
5
User ππ
63,3,9,9
64,4,8,8
63,3,9,9
64,4,8,8
5
Sebuah sistem rekomendasi ingin memprediksi rating yang akan diberikan seorang pengguna π’1 terhadap item π5 . Pada tabel 2.3, secara sekilas, terlihat bahwa u2 dan u3 adalah yang terdekat dengan u1 . Tetapi, sebenarnya u4 dan u5 lah yang paling mirip dengan u1 (lihat multi-criteria rating-nya). Terdapat dua penyelesaian permasalahan sistem rekomendasi dengan multicriteria rating, yaitu similiarity based approach dan aggregation function based approach (Adomavicius dan Kwon, 2007).
Jannach (2012) kemudian, dengan
penelitiannya, menyatakan bahwa aggregation function based approach pada sistem rekomendasi multi-criteria rating dapat menghasilkan rekomendasi yang lebih unggul dibandingkan dengan metode lainnya. Alasan dibalik munculnya pendekatan fungsi agregasi adalah asumsi bahwa multi-criteria rating adalah representasi dari ketertarikan pengguna untuk masingmasing kriteria pada sebuah item (Adomavicius dan Kwon, 2007). Oleh karena itu, rating keseluruhan (untuk sebuah item), bukanlah sebuah rating yang independent jika dibandingkan dengan rating kriteria lainnya, melainkan sebuah fungsi agregasi f dari masing-masing kriteria rating. ππ = π( π1 . . ππ )
(2.6)
Dimana : ο·
ππ adalah rating keseluruhan untuk satu item
ο·
ππ adalah rating kriteria ke-k
Universitas Sumatera Utara
15
Terdapat beberapa cara untuk membangun fungsi agregasi tersebut. Cara yang pertama adalah dengan mendefinisikan sendiri fungsi aggregasi f tersebut dengan mengandalkan ahli di dalam bidangnya (domain expertise), atau dengan cara yang lebih sederhana, yaitu fungsi rata-rata dari kriteria rating yang ada (Jannach et al, 2012). π
πππππ = (π€1 π
1 + π€2 π
2 + . . π€π π
π )/(π€1 + π€2 +. . π€n )
(2.7)
Dimana : ο·
π
πππππ merupakan prediksi rating akhir (gabungan beberapa kriteria)
ο·
π€π merupakan bobot prediksi rating kriteria ke-n .
ο·
π
π merupakan prediksi rating kriteria ke-n Cara yang lebih canggih (dan lebih menjanjikan) adalah dengan menggunakan
teknik statistik atau machine learning untuk mengetahui hubungan antara rating keseluruhan dengan rating untuk masing-masing kriteria.
2.6.
Proses Pengambilan Keputusan pada Pemilihan Software Antivirus
Pengguna komputer pribadi maupun staf IT yang bertanggung jawab atas keamanan data di sebuah perusahaan harus mampu melakukan review dan perbandingan sebelum melakukan pengambilan keputusan untuk menggunakan sebuah produk software antivirus tertentu. Pengguna harus mengetahui kriteria apa saja yang pokok yang harus dimiliki oleh sebuah software antivirus. Kriteria yang harus dimiliki oleh sebuah software antivirus (Castelli, 2001) antara lain adalah: ο·
Detection, hal yang paling diinginkan oleh seorang pengguna terhadap sebuah antivirus adalah menangkap virus. Hal yang menjadi bahan perhatian adalah seberapa banyak virus yang mempu dikenali oleh sebuah antivirus, atau yang biasa disebut dengan detection rate. Tabel 2.4 Pembagian Deteksi Virus
Virus terdeteksi Virus tidak terdeteksi Benar Virus
True Positive
False Negative
Bukan Virus False Positive
True Negative
Universitas Sumatera Utara
16
Tabel 2.4 menjelaskan pembagian dari jenis deteksi virus. Sebagai contoh, ketika antivirus mengatakan bahwa sebuah file merupakan sebuah virus, dan file tersebut memang benar merupakan virus, berarti deteksi yang diberikan adalah True Positive. Ketika sebuah antivirus mengatakan sebuah file merupakan virus, padahal file tersebut bukan virus, maka deteksi tersebut adalah False Positive. ο·
Technology, hal kedua yang paling penting adalah teknologi apa saja yang dipakai oleh antivirus tersebut. Beberapa teknologi
yang popular dan sedang
dikembangkan adalah : Real Time Protection, On-Demand Access, E-mail protection, Trojan Protection, Parental Control, Internet Security, dan lain-lain. ο·
Maintenance, hal yang tidak kalah pentingnya adalah bagaimana vendor antivirus menjaga kualitas produk antivirus yang mereka keluarkan, dan seberapa sering update definisi virus yang mereka berikan.
ο·
Performance, banyak software antivirus yang memakan resource komputer terlalu tinggi sehingga memperlambat proses lain yang sedang berjalan. Bagi komputer di perusahaan besar, maupun komputer server, performance merupakan kriteria yang cukup penting untuk dipertimbangkan.
ο·
Technical Support, sebuah vendor antivirus yang baik menyediakan bantuan online bagi para pelanggan. Bantuan yang diberikan dapat dibagi menjadi beberapa level sesuai dengan kebutuhan dari pelanggan itu sendiri.
2.7.
Bahasa Pemrograman PHP
Menurut Sibero (2011), PHP (Hypertext Preprocessor) adalah pemrograman interpreter yaitu proses penerjemahan dari kode sumber menjadi kode mesin yang dimengerti komputer pada saat baris kode dijalankan secara langsung. PHP pada awalnya ditulis menggunakan bahasa PERL (Perl Script), kemudian ditulis ulang dengan menggunakan bahasa C CGI-BIN (Common Gateway Interface-Binnary) yang bertujuan agar halaman website dapat mendukung formulir dan penyimpanan data. PHP adalah bahasa pemrograman Server Side Programming, memungkinkan sebuah website yang dibangun bersifat dinamis (Sibero, 2011).
Universitas Sumatera Utara
17
2.8.
Database
Database adalah koleksi data item yang saling terkait terkelola sebagai satu unit. Beberapa defenisi lain tentang database yaitu sebagai berikut: ο·
Suatu pengorganisasian sekumpulan data yang saling berhubungan sehingga memudahkan aktivitas untuk memperoleh informasi (Sutanta, 2004).
ο·
Database merupakan data yang saling terhubung dan deskripsi dari data yang dirancang untuk kebutuhan organisasi (McLeod dan Schell, 2004).
ο·
Sedangkan menurut Date, database adalah record yang terkomputerisasi yang bertujuan menyediakan informasi ketika dibutuhkan (Kadir, 2003).
Penerapan database dalam sistem informasi disebut database system. Dari teori-teori tersebut dapat disimpulkan bahwa database adalah sekumpulan data yang terorganisasi dan saling terhubung untuk menyediakan informasi yang diperlukan. Basis data (database), atau sering pula dieja basis data, adalah kumpulan informasi yang disimpan didalam komputer secara sistematik sehingga dapat diperiksa menggunakan suatu program komputer untuk memperoleh informasi dari basis data tersebut. Perangkat lunak yang digunakan untuk mengelola dan memanggil kueri (query) basis data disebut sistem manajemen basis data (Database Management System, DBMS) (Sutanta, 2004). Sistem basis data (database system) didefinisikan sebagai sekumpulan subsistem yang terdiri atas basis data dengan para pemakai yang menggunakan basis data secara bersama-sama, personal-personal yang merancang dan mengelola basis data, teknik- teknik untuk merancang dan mengelola basis data, serta sistem komputer untuk mendukungnya (Kadir, 2003). Database system adalah sistem penyimpanan informasi yang terorganisasi dengan suatu cara sehingga memudahkan untuk proses pengolahan data (McLeod dan Schell, 2004). DBMS adalah sebuah sistem perangkat lunak yang mengizinkan pengguna untuk mendefinisikan, membuat, memelihara, dan mengatur akses ke database. Sedangkan menurut McLeod dan Schell (2004), DBMS adalah aplikasi perangkat
Universitas Sumatera Utara
18
lunak yang menyimpan struktur database, hubungan antardata dalam database, serta berbagai formulir laporan yang berkaitan dengan database tersebut.
2.9.
Data Flow Diagram (DFD)
Dengan adanya konsep pemrograman terstruktur di dalam pembangunan software, developer dimudahkan dalam membagi-bagi fungsi, prosedur, dan modul program yang dibangun. Dalam konsep pemrograman terstruktur dikenal metode DFD (Data Flow Diagram). DFD adalah sebuah metode yang digunakan untuk merepresentasikan sebuah sistem atau perangkat lunak pada beberapa level detail. DFD lebih sesuai untuk memodelkan fungsi-fungsi dan prosedur-prosedur pada pemrograman sistem yang terstruktur (Structural Programming) (Rosa et al, 2011).
2.10.
Unified Modelling Language (UML)
Untuk membantu dalam pengembangan perangkat lunak dikenal istilah pemodelan. Salah satu pemodelan yang saat ini paling banyak digunakan oleh pengembang perangkat lunak adalah UML (Unified Modelling Language). UML adalah standar bahasa yang sering digunakan dalam bidang industri untuk mendefinisikan requirement (kebutuhan), membuat analisis dan desain, serta menggambarkan arsitektur dalam pemrograman berorientasi objek. Ada beberapa hal yang dimaksud dalam kompleksitas pada perangkat lunak (Rosa et al, 2011): 1. Kompleksitas domain atau permasalahan perangkat lunak 2. Kesulitas mengelola proses pengembangan perangkat lunak 3. Kemungkinan fleksibilitas perubahan perangkat lunak 4. Permasalahan karakteristik bagian-bagian perangkat lunak secara diskrit
UML terbagi atas 3 (tiga) kategori, yaitu diagram struktur (structure diagram), diagram kelakuan sistem (behaviour diagram), dan diagram interaksi (interaction diagram)(Rosa, et al. 2011).
Universitas Sumatera Utara
19
2.11.
Penelitian Terdahulu
Sistem rekomendasi telah ada semenjak awal tahun 1990. Berbagai penelitian telah dilakukan untuk menyempurnakan, menggabungkan, dan bahkan menemukan teknik rekomendasi baru untuk mengatasi permasalahan di dalam sistem rekomendasi yang terus berkembang. Penulis menggunakan penelitian yang telah dibuat sebelumnya sebagai rujukan maupun pertimbangan algoritma dan metode yang tepat untuk digunakan di dalam permasalahan penelitian ini. Penulis menggunakan beberapa metode baru yang sedang berkembang. Beberapa penelitian terdahulu di bidang sistem rekomendasi yang penulis gunakan, diantaranya : Hayati (2012) menggunakan metode hybrid (content based dan collaborative filtering) dengan algoritma k-Nearest Neighbor pada sistem rekomendasi pariwisata. Hayati menggunakan kombinasi sekuensial untuk menggabungkan kedua metode tersebut. Uluyagmur et al (2012) telah menggunakan metode content based dengan menggunakan fitur set yang berbeda (different feature set) di dalam sistem rekomendasi film. Uluyagmur et al membangun profil pengguna, yang berupa bobot terhadap masing-masing attribut yang ada, untuk mengukur ketertarikan pengguna terhadap masing-masing attribut di dalam item. Claypool et al (1999) menggunakan teknik linear combination untuk menggabungkan teknik content based dengan collaborative filtering di dalam sistem rekomendasi berita online. Adomavicius dan Kwon (2007) melakukan penelitian di bidang sistem rekomendasi dengan multi-criteria rating. Adomavicius mengatakan bahwa terdapat dua buah solusi permasalahan sistem rekomendasi dengan multi-criteria rating, yaitu similiarity based approach dan aggregation function based approach. Jannach et al (2012) melakukan penelitian berupa perbandingan antara beberapa metode penyelesaian sistem rekomendasi dengan multi-criteria rating. Aggregation function based approach merupakan salah satu metode yang berhasil diimplementasikan dan mampu menghasilkan rekomendasi yang lebih akurat dibandingkan dengan metode lainnya.
Universitas Sumatera Utara
20
Tabel 2.5 Penelitian Terdahulu
Peneliti
Metode
Kasus
Tahun Penelitian
Hayati
Hybrid (Content Based dan Collaborative) Content Based (Different Feature Set) Hybrid (Content Based dan Collaborative Filtering) dengan Linear Combination Teknik agregasi dan similiarity
Sistem Rekomendasi Pariwisata Sistem Rekomendasi Film Sistem Rekomendasi Berita Online
2012
Sistem Rekomendasi dengan Multi-criteria Rating Sistem Rekomendasi dengan Multi-criteria Rating
2007
Uluyagmur et al Claypool et al
Adomavicius dan Kwon Jannach et al
2.12.
Berbagai teknik (untuk membandingkan beberapa teknik)
2012 1999
2012
Perbedaan dengan Penelitian Terdahulu
Hayati (2012) menggunakan metode hybrid (content based dan collaborative filtering) dengan menggunakan algoritma k-Nearest Neighbor. Hayati menggunakan kombinasi sekuensial untuk menggabungkan antara content based dengan collaborative filtering. Hayati (2012) menggunakan cara explicit untuk membangun profil pengguna (user profile), yaitu dengan menyediakan formulir preferensi agar pengguna dapat mendeskripsikan secara langsung tujuan wisata bagaimana yang ia inginkan. Claypool et al (2012) menggunakan metode content based pada sistem rekomendasi dengan fitur set berbeda. Sistem rekomendasi yang dibangun olehnya mempelajari preferensi setiap pengguna yang ada (user profile) berdasarkan histori lihat (watch history) pengguna. Kemudian, dengan menggunakan user profile tersebut, sistem rekomendasi menghitung prediksi seberapa besar ketertarikan pengguna terhadap semua film yang belum pernah ia lihat sebelumnya. Di dalam penelitian ini, peneliti menggunakan metode hybrid (content based dan collaborative filtering) pada sistem rekomendasi dengan multi-criteria rating. Berbeda dengan Hayati (2012), penulis menggunakan kombinasi linear untuk menggabungkan kedua metode tersebut. Selain itu, peneliti menggunakan cara implicit untuk membangun profil pengguna (user profile), yaitu dengan mempelajari rating yang diberikan pengguna terhadap beberapa produk software antivirus. Multicriteria rating penulis terapkan untuk menghasilkan rekomendasi yang lebih handal.
Universitas Sumatera Utara