BAB I PENDAHULUAN 1.1
Latar Belakang dan Permasalahan Perkembangan volume dan keragaman informasi yang tersedia di internet
saat ini sangat pesat sehingga mendorong tumbuhnya media pemberitaan online. Media pemberitaan online (situs berita) sudah menjadi media utama untuk menyampaikan informasi atau berita dari kebanyakan instansi. Berita online sudah menjadi kebutuhan bagi user internet untuk mengetahui kabar terkini dan teraktual. Di Indonesia terdapat berbagai situs berita yang berisi beragam berita yang diterbitkan setiap waktu. Hal ini berdampak pada ketersedian berita yang jumlahnya melimpah. Banyaknya berita yang tersedia membuat pembaca sulit untuk mendapatkan informasi yang cepat dan relevan dengan kebutuhan user. User membutuhkan waktu yang lama apabila menemukan artikel berita yang terkait dengan membaca satu per satu judul setiap berita. Kemiripan berita juga tidak bisa hanya dinilai dari judulnya saja. Tantangan penyedia media online saat ini adalah memberikan layanan yang terbaik, salah satunya membantu user untuk menemukan berita yang mereka sukai. Suatu sistem rekomendasi dengan penyaringan otomatis diperlukan untuk menanggulangi masalah tersebut. Sistem rekomendasi merupakan sistem yang bertujuan untuk menghasilkan rekomendasi untuk user terkait pemilihan suatu item yang mungkin menarik bagi mereka. Sistem rekomendasi memiliki cara yang berbeda dalam menganalisis sumber data untuk menemukan prediksi berdasarkan hubungan antara user dan item yang digunakan untuk mengidentifikasi kecocokan antara keduanya (Melville, P. dan Sindhwani, V., 2012). Menurut Ricci et all (2011), terdapat enam pendekatan berbeda untuk teknik dalam sistem rekomendasi, yaitu content-based, collaborative filtering,
demographic,
knowledge-based,
community-based,
dan
hybrid
recommender systems. Sistem rekomendasi memiliki tiga strategi yang umum digunakan dalam menghasilkan rekomendasi yaitu Content-Based Filtering (CBF) berdasarkan kemiripan konten, Collaborative Filtering (CF) berdasarkan transaksi
2
user lainnya yang memiliki kemiripan catatan transaksi dengan user, dan Hybrid Filtering (HF) yang merupakan gabungan dari kedua strategi sebelumnya. Penelitian tentang sistem rekomendasi sebelumnya dilakukan dengan cara sistem akan memberikan rekomendasi kepada user dengan mengakses riwayat penjelajahan dan profil user lalu menggunakan information filtering serta information
collaboration
untuk
diimplementasikan
pada
google
news.
Rekomendasi berita secara personal hanya bisa diberikan kepada member user dan memiliki riwayat penjelajahan yang (lebih dari 1 bulan) di google news. Pembaca baru yang selanjutnya disebut user anonim tidak bisa diberikan rekomendasi secara personal sesuai dengan berita yang diminatinya. Rekomendasi diberikan berdasarkan information collaboration yang artinya rekomendasi berita diberikan berdasarkan berita–berita yang disukai oleh user lain (Liu, et al. 2010). Sistem rekomendasi berbasis konten merupakan penggabungan dari beberapa topik ilmu komputer, terutama Sistem Temu Balik Informasi (Information Retrieval) dan Kecerdasan Buatan (Artificial Intellegince). Berdasarkan perspektif Sistem Temu Balik Informasi meneliti tentang teknologi rekomendasi yang melibatkan proses pencarian informasi. Berdasarkan perspektif kecerdasan buatan meneliti tentang model inferensi yang akan digunakan dalam pengambilan keputusan untuk item yang direkomendasikan (Lops dkk, 2011). Keuntungan utama dari sistem rekomendasi berbasis konten adalah memungkinkan membangun sistem rekomendasi yang sesuai dengan materi yang diinginkan user atau setiap konten yang sesuai, baik dari bahasa, topik atau apapun itu. Sebaliknya, sistem rekomendasi kolaboratif membutuhkan komunitas user yang besar, karena rekomendasinya berdasar pada bagaimana user yang sama telah menilai suatu item. Masalah lain untuk rekomendasi berita dengan penyaringan kolaboratif selain memerlukan banyak user, item harus telah dinilai oleh setidaknya beberapa user, dan dalam kasus situs berita, item baru yang mungkin paling sesuai belum tentu sudah dinilai, dan item lama menjadi yang paling memungkinkan untuk direkomendasikan karena telah dinilai sebelumnya. Pada penelitian ini akan dikembangkan sistem rekomendasi berita berbasis konten, dimana item yang direkomendasikan kepada user berdasarkan konten berita
3
yang sedang dibaca user. Penelitian ini dilakukan pada user anonim, yaitu user yang tidak memiliki profil user dan riwayat akses berita sehingga dalam penentuan rekomendasi berita berdasarkan kesamaan setiap artikel berita dengan berita yang sedang dibaca oleh user dapat dijadikan solusi untuk memberikan rekomendasi secara personal. Kecerdasan buatan memiliki beragam cara yang dapat digunakan untuk pengambilan keputusan, salah satunya adalah dengan menggunakan sistem inferensi fuzzy. Penelitian ini menggunakan aturan fuzzy dalam menentukan item mana yang cocok direkomendasikan kepada user. Teori himpunan fuzzy merupakan kerangka matematis yang digunakan untuk merepresentasikan ketidakpastian, ketidakjelasan, ketidaktepatan, kekurangan informasi, dan kebenaran parsial. Pengambilan keputusan merupakan bagian penting dalam seluruh sistem. Sistem inferensi fuzzy merumuskan aturan yang sesuai dan berdasarkan aturan keputusan logika fuzzy yang telah dibuat (Sivanandam dkk, 2007). Sistem inferensi fuzzy ini akan diimplementasikan untuk menemukan berita yang relevan dengan berita yang sedang dibaca user. Penggunaan logika fuzzy ini digunakan untuk memudahkan pengambilan keputusan apakah suatu artikel layak direkomendasikan atau tidak, hal ini disebabkan dokumen yang berupa teks tidak mudah diterjemahkan ke dalam nilai absolut 0 atau 1. Keterkaitan antar dokumen berita tidak bisa dinilai secara mutlak. Oleh karen itu, logika fuzzy akan diterapkan pada sistem ini dengan menggunakan beberapa atribut dari dokumen berita sehingga dapat digunakan untuk menjelaskan apakah dokumen ini layak direkomendasikan atau tidak. Penerapan sistem inferensi fuzzy pada sistem rekomendasi diharapkan dapat membantu user dalam melakukan penyaringan otomatis untuk mendapatkan berita yang relevan berdasarkan konten berita yang sedang dibaca user. Sistem akan memeriksa keterkaitan antar dokumen berita dengan memeriksa atribut setiap berita untuk mengetahui berita mana yang relevan dan akan direkomendasikan. Sistem ini nantinya diharapkan dapat dimanfaatkan dengan baik oleh pengembang situs berita online.
4
1.2
Perumusan Masalah Berdasarkan permasalahan yang telah dipaparkan pada latar belakang,
penelitian akan dititik beratkan pada bagaimana mengimplementasikan sistem rekomendasi berita berbasis konten dengan menggunakan sistem inferensi fuzzy untuk mendapatkan output berita yang relevan berdasarkan konten berita yang sedang dibaca oleh user.
1.3
Batasan Masalah Adapun batasan masalah dalam penelitian ini agar lebih mudah dipahami
dan tidak terlalu luas dalam penulisannya sebagai berikut: a. Sistem rekomendasi yang dikembangkan hanya
menggunakan
pendekatan berbasis konten (content-based) dan tidak menggunakan pendekatan berbasis collaborative-filtering. b. Sistem tidak memperhatikan history dari url yang dikunjungi user sebelumnya atau banyaknya user yang mengunjungi url berita tersebut. c. Sistem rekomendasi yang dikembangkan berfokus pada konten berita. d. Data berita yang digunakan adalah data berita dari 6 situs berita yang paling
sering
diakses
di
Indonesia
berdasarkan
data
dari
www.similarweb.com pada bulan Maret 2016, yaitu
detik.com (peringkat Indonesia 9)
Liputan6.com (peringkat Indonesia 21)
kompas.com (peringkat Indonesia 23)
Viva.co.id (peringkat Indonesia 29)
merdeka.com (peringkat Indonesia 30)
Tribunnews.com (peringkat Indonesia 34)
e. Sistem rekomendasi menggunakan bahasa pemrograman php dengan framework laravel dan database yang digunakan dalam sistem adalah PostgreSQL. f. Sistem yang dikembangkan hanya pada tahap purwarupa atau prototype. g. Sistem menggunakan pembobotan kata TF-IDF (Term FrequencyInverse Document Frequency).
5
h. Algoritma similarity yang digunakan adalah algoritma cosine similarity. Sistem menghitung similaritas dari judul berita, lead (teras berita) dan konten setiap berita. i. Sistem rekomendasi berita menggunakan aturan sistem inferensi fuzzy mamdani. j. Penelitian menggunakan data berita yang sudah ada dan tidak berfokus pada pengambilan atau crawling data berita. k. Penelitian tidak berfokus pada sinonim kata, polisemi kata dan konteks kalimat (context-free). l. Tingkat relevansi hasil rekomendasi dari sistem akan diuji dengan pengujian kepada user.
1.4
Tujuan Penelitian Tujuan dari penelitian ini adalah mengimplementasikan sistem rekomendasi
berita berbasis konten dengan menggunakan sistem inferensi fuzzy untuk menentukan output berita yang sesuai berdasarkan kesesuaian konten berita yang relevan dengan berita yang sedang dibaca oleh user. Setiap artikel berita akan melalui proses preprocessing data, kemudian akan dilakukan proses pembobotan kata TF-IDF. Hasil bobot kata akan digunakan untuk menentukan nilai similaritas antar berita menggunakan algoritma cosine similarity, yang akan menghitung nilai kesamaan antara judul, lead dan konten setiap berita. Sistem ini menggunakan aturan sistem inferensi fuzzy mamdani untuk menghasilkan berita yang akan direkomendasi agar dapat menghasilkan output yang sesuai dengan keinginan user. Penelitian ini akan menguji seberapa akurat dan relevan output berita yang diberikan sistem kepada user.
1.5
Manfaat Penelitian Manfaat dari penelitian ini sebagai berikut a. Membuka wawasan topik penelitian baru yaitu sistem rekomendasi berbasis konten untuk berita berbahasa Indonesia
6
b. Mengimplementasikan
sistem
rekomendasi
berbasis
konten
menggunakan sistem inferensi fuzzy dan berbasis php c. Memberikan referensi bagi pengembang situs berita dalam menentukan kelebihan dan kekurangan dalam menggunakan sistem rekomendasi berbasis konten menggunakan sistem inferensi fuzzy tersebut.
1.6
Sistematika Penulisan Sistematika dalam penulisan tugas akhir ini terdiri dari tujuh bab, yaitu: BAB I PENDAHULUAN Berisi mengenai latar belakang penelitian, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metode penelitian dan sistematika penulisan. BAB II TINJAUAN PUSTAKA Bab ini memuat pembahasan mengenai penelitian terdahulu yang digunakan sebagai bahan referensi dalam penulisan penelitian ini dan penjelasan yang membedakan penelitian ini dengan penelitian sejenis yang pernah ada sebelumnya. BAB III LANDASAN TEORI Bab ini berisi teori-teori yang menjadi landasan dalam penulisan penelitian ini yaitu mengenai sistem temu balik informasi, sistem rekomendasi, sistem rekomendasi berbasis konten, struktur berita, preprocessing teks, pembobotan kata TF-IDF, algoritma cosine similarity, logika fuzzy, sistem inferensi fuzzy mamdani, dan evaluasi sistem rekomendasi BAB IV ANALISIS DAN PERANCANGAN SISTEM Bab ini berisi analisis terhadap sistem yang akan dikembangkan, serta penjelasan mengenai perancangan sistem berdasarkan hasil analisis yang telah dilakukan.
7
BAB V IMPLEMENTASI SISTEM Bab ini akan menjelaskan hasil implementasi dari sistem yang telah dibangun
berdasarkan
perancangan
yang
telah
dilakukan
sebelumnya. BAB VI HASIL PENGUJIAN DAN PEMBAHASAN Bab ini akan menjelaskan hasil yang diperoleh setelah sistem selesai diimplementasikan dan pembahasan hasil pengujian dan analisis sistem tersebut. BAB VII KESIMPULAN DAN SARAN Bab ini berisi mengenai kesimpulan dari penelitian yang telah dilakukan dan saran untuk pengembangan penelitian selanjutnya.
8