STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA
HAFIZHIA DHIKRUL ANUGRAH
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA
HAFIZHIA DHIKRUL ANUGRAH
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
ABSTRACT HAFIZHIA DHIKRUL ANUGRAH. Comparative Study of Term Weighting for Information Retrieval on Indonesian Documents. Supervised by JULIO ADISANTOSO. One of the classical models of Information Retrieval (IR) systems is the vector space model. Vector in this model represents the weight of terms contained in the documents and queries. A term can be a word, a phrase, or a unit in a document describing the context of the document. Since each term has a different level of importance in the document, weighting is needed. The commonly used weighting method is TF-IDF (Term Frequency Inverse Document Frequency). Previous research indicates that the distribution of term weighting follow the Poisson distribution, hence a method called RIDF (Residual Inverse Document Frequency) was developed. Other weighting methods by considering the query is called Query Term weighting. Both of the latter methods has not been implemented for documents in Indonesian. This research implements the methods TF-IDF, RIDF and Query Term Weighting on search engine for documents in Indonesian. The result of this research is a search engine with an average precision of 63,9%. Keyword : IDF, Term Weighting, TF, TF-IDF, RIDF, Query Term Weighting
Judul Skripsi Nama NIM
: Studi Komparatif Pembobotan Kata untuk Temu Kembali Informasi Dokumen Bahasa Indonesia : Hafizhia Dhikrul Anugrah : G64080050
Menyetujui: Pembimbing
Ir. Julio Adisantoso, M.Kom NIP. 19620714 198601 1 002
Mengetahui: Ketua Departemen Ilmu Komputer
Dr. Ir. Agus Buono, M.Si, M.Kom NIP. 19660702 199302 1 001
Tanggal Lulus:
KATA PENGANTAR Alhamdulillahirabbil ‘alamin, puji syukur penulis panjatkan ke hadirat Allah subhanahu wata’ala yang telah memberikan rahmat dan karunia-Nya sehingga tugas akhir dengan judul Sistem Manajemen Pembelajaran Pemrograman dapat diselesaikan. Shalawat dan salam penulis sampaikan kepada Nabi Muhammad shallallahu ‘alaihi wassalam beserta keluarga, sahabat dan para pengikutnya yang selalu berpegang teguh kepada Al-Quran dan As-Sunnah. Penulis menyadari bahwa tugas akhir ini tidak akan terselesaikan tanpa bantuan dari berbagai pihak. Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada: 1 Ayahanda Yoyo Suwaryo, Ibunda Dedeh Sulastri, serta adik-adik Nuri Dinaliya, Khalifatul Ardy, dan Mohammad Shabry Syukur atas doa, nasihat, semangat, dukungan, dan kasih sayang yang luar biasa kepada penulis. 2 Bapak Ir. Julio Adisantoso, M.Kom selaku dosen pembimbing tugas akhir yang memberikan bimbingan, ide, dukungan, semangat serta kesabaran dalam pengerjaan tugas akhir ini. 3 Bapak Ahmad Ridha, S.Kom, MS dan Bapak Sony H. Wijaya, S.Kom, M.Kom selaku dosen penguji yang telah memberi masukan dan saran pada tugas akhir penulis. 4 Ilman, Ryantie, Tiara, Putra, Pradit, Nanda, Dipo, Dayat, Dani, Catur, dan rekan-rekan seperjuangan di Ilmu Komputer IPB angkatan 45 atas segala kebersamaan, bantuan, dukungan, serta kenangan bagi penulis selama menjalani masa studi. Semoga kita berjumpa kembali kelak sebagai orang-orang sukses. 5 Rekan-rekan satu bimbingan, Rizky Utama Pramudia, Fania Rahmanawati Karimah, Putri Dewi Purnama Sari, Nofel Saputra, Meriska Defriani, Susi Handayani, Meri Marlina, Anita, dan khususnya Alfa Nugraha Pradana yang selalu memberi semangat, bantuan, dan kesetiaannya dalam menemani penulis selama studi di IPB. 6 Para sahabat dan rekan-rekan lainnya, Gina, Mike, Mey, Wuri, Eka, Winda, Encang, Ucha, Ina, Isti, Ojan, Dinie, Aul, Zuma, Depe, Imel, Tika, Ruri, Dila, Aini, Norma, Eja, dan Brud yang telah memberikan bantuan, dukungan, dan semangat dalam mengerjakan skripsi ini. 7 Para peserta seminar yang telah hadir dan memberikan pertanyaan maupun masukan kepada penulis mengenai skripsi ini. Penulisan tugas akhir ini masih terdapat banyak kekurangan dan kelemahan dalam berbagai hal karena keterbatasan kemampuan penulis. Penulis menerima adanya masukan berupa saran atau kritik yang bersifat membangun. Semoga penelitian ini memberikan manfaat dalam proses perkuliahan baik sekarang maupun di masa mendatang. Bogor, April 2013
Hafizhia Dhikrul Anugrah
RIWAYAT HIDUP Penulis dilahirkan di Kota DKI Jakarta, pada tanggal 14 Mei 1990 dari pasangan Ibu Dedeh Sulastri dan Bapak Yoyo Suwaryo, merupakan anak pertama dari empat bersaudara. Pada tahun 2008 penulis lulus dari Sekolah Menengah Atas Negeri 47 Jakarta dan diterima di Program Studi Ilmu Komputer Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Setelah menyelesaikan Tingkat Persiapan Bersama di IPB pada tahun 2009, penulis diterima sebagai mahasiswa Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Penulis pernah melaksanakan kegiatan Praktik Kerja Lapangan di Pengembangan dan Pemeliharaan Aplikasi (PPA) Bidang Moneter – Bank Indonesia.
DAFTAR ISI Halaman DAFTAR TABEL ...............................................................................................................................viii DAFTAR GAMBAR ...........................................................................................................................viii DAFTAR LAMPIRAN........................................................................................................................viii PENDAHULUAN .................................................................................................................................. 1 Latar Belakang .................................................................................................................................. 1 Tujuan ............................................................................................................................................... 1 Ruang Lingkup .................................................................................................................................. 1 METODE PENELITIAN ....................................................................................................................... 1 Koleksi Dokumen.............................................................................................................................. 1 Praproses Dokumen .......................................................................................................................... 1 Pembobotan TF-IDF ......................................................................................................................... 2 Pembobotan TF-RIDF ....................................................................................................................... 2 Pembobotan Query Term Weighting (TF-F1) ................................................................................... 2 Pemrosesan Kueri.............................................................................................................................. 2 Pemeringkatan Dokumen .................................................................................................................. 2 Evaluasi Sistem ................................................................................................................................. 3 Lingkungan Implementasi ................................................................................................................. 3 HASIL DAN PEMBAHASAN............................................................................................................... 3 Dokumen Pengujian .......................................................................................................................... 3 Pemrosesan dokumen ........................................................................................................................ 4 Pengujian Kinerja Sistem .................................................................................................................. 4 SIMPULAN DAN SARAN .................................................................................................................... 7 Simpulan ........................................................................................................................................... 7 Saran ................................................................................................................................................. 7 DAFTAR PUSTAKA ............................................................................................................................. 7 LAMPIRAN ........................................................................................................................................... 8
DAFTAR TABEL Halaman 1 Relevant dan retrieved documents ....................................................................................................... 3 2 Deskripsi Dokumen Uji Pertanian (.txt) .............................................................................................. 3 3 Perbandingan 30 kueri pada sistem ...................................................................................................... 6
DAFTAR GAMBAR
1 2 3 4
Halaman Tahapan pembangunan sistem. ........................................................................................................... 1 Contoh dokumen pengujian. ............................................................................................................... 3 Perbandingan asumsi r/R pada pembobotan TF-F1. ........................................................................... 4 Perbandingan pembobotan untuk pembobotan TF-IDF, TF-RIDF, dan TF-F1. ................................. 5
DAFTAR LAMPIRAN Halaman 1 Daftar kueri uji dan dokumen yang relevan ........................................................................................ 9 2 Contoh dokumen koleksi pengujian .................................................................................................. 15 3 Daftar stopword ................................................................................................................................ 16 4 Daftar AVP pada pengujian pembobotan TF-IDF ........................................................................... 20 5 Daftar AVP pada pengujian pembobotan TF-RIDF ........................................................................ 22 6 Daftar AVP pada pengujian pembobotan TF-F1dengan asumsi 0,5 ................................................ 24 7 Daftar AVP pada pengujian pembobotan TF-F1 dengan asumsi 0,3 ............................................... 26 8 Daftar AVP pada pengujian pembobotan TF-F1 dengan asumsi 0,1 ............................................... 28 9 Antarmuka halaman utama sistem komparatif pembobotan kata ..................................................... 30 10 Antarmuka hasil pencarian ............................................................................................................. 30 11 Antarmuka pemilihan dokumen ...................................................................................................... 30
1
PENDAHULUAN Latar Belakang Seiring dengan perkembangan informasi, masalah telah bergeser dari cara mengakses informasi menjadi memilih informasi yang berguna. Pemilihan atau penemuan kembali informasi ini tidak mungkin dilakukan secara manual karena kumpulan informasi yang sangat besar dan terus bertambah besar. Sistem temu kembali informasi (information retrieval system) merupakan sistem yang digunakan untuk menemukan informasi yang relevan dengan kebutuhan pengguna secara otomatis berdasarkan query yang diberikan (Mandala dan Setiawan 2002). Salah satu model sistem temu kembali informasi klasik adalah model ruang vektor (Mandala dan Setiawan, 2002). Vektor dalam model ini merepresentasikan bobot term yang terdapat pada dokumen dan query. Term dapat berupa kata, frasa, atau unit dalam suatu dokumen yang menggambaran konteks dari dokumen tersebut. Karena tiap term memiliki tingkat kepentingan yang berbeda dalam dokumen, maka diperlukan bobot. Metode pembobotan yang umum digunakan ialah TFIDF (Term Frequency Inverse Document Frequency). Pembobotan melibatkan tiga komponen yaitu pembobotan lokal, global, dan normalisasi (Manning et al. 2008). Pembobotan lokal menentukan posisi kata dalam suatu dokumen sedangkan pembobotan global mengitung posisi kata dalam koleksi. Normalisasi mengubah panjang vektor menjadi vektor satuan. Dalam pembobotan global (IDF), asumsi yang digunakan adalah jika suatu kata mucul hanya dalam beberapa koleksi maka kata itu semakin penting digunakan sebagai penciri. Xia dan Chai (2011) mengungkapkan bahwa sebuah term harus diberi pembobotan yang berbeda. Nanas et al. (2004) menyatakan bahwa pembobotan kata dengan menggunakan log dalam formula IDF menyebar menurut sebaran Poisson sehingga dikembangkan metode Residual Inverse Document Frequency (RIDF). Metode pembobotan global lainnya dengan memperhatikan query disebut Query Term Weighting (F1). Kedua metode terakhir belum pernah diimplementasikan dalam sistem Temu Kembali Informasi dokumen berbahasa Indonesia. Oleh karena itu, penelitian ini mengimplementasikan metode Residual Inverse Document Frequency (TF-RIDF) dan Query
Term Weighting (TF-F1) pada mesin pencari dokumen bahasa Indonesia. Tujuan Penelitian ini bertujuan membandingkan metode pembobotan kata TF-IDF, TF-RIDF dan TF-F1 dalam temu kembali informasi dokumen bahasa Indonesia. Ruang Lingkup Dokumen yang digunakan dalam penelitian ini adalah dokumen berbahasa Indonesia dan tidak memperhatikan adanya kesalahan ketik.
METODE PENELITIAN Penelitian akan dilakukan dalam beberapa tahap yakni: praproses dokumen, pemrosesan kueri, pemeringkatan dokumen, dan evaluasi hasil temu-kembali informasi. Tahapan-tahapan tersebut dapat dilihat pada Gambar1.
Gambar 1 Tahapan pembangunan sistem. Koleksi Dokumen Dokumen yang digunakan sebagai dokumen pengujian adalah korpus yang tersedia di lab Temu Kembali Informasi hasil penelitian Adisantoso & Ridha (2004). Dokumen tersebut merupakan dokumen pertanian yang berjumlah 1000 dokumen dan kueri uji berjumlah 30 kueri dengan daftar dokumen yang relevan (Lampiran 1). Praproses Dokumen Tahapan penelitian dimulai dengan melakukan indexing terhadap dokumen di dalam sebuah korpus. Terdapat tiga tahapan praproses yang digunakan pada penelitian, yaitu: 1
Tokenisasi, adalah suatu proses pemisahan (parsing) kalimat ke dalam unit-unit yang lebih kecil yang disebut token. Hal ini dilakukan dengan cara menghapus semua karakter dalam tanda
2
2
3
baca yang terdapat pada dokumen dan mengubah kata menjadi lowercase. Pembuangan stopword. Stopword adalah kata-kata umum yang biasanya muncul dalam jumlah yang besar dan dianggap tidak memiliki makna (Manning et al. 2008). Pembobotan menggunakan metode TFIDF, TF-RIDF, dan TF-F1.
Pembobotan TF-IDF Diketahui tft,d adalah frekuensi kemunculan suatu term t pada dokumen d dan dft adalah banyaknya dokumen di dalam korpus yang mengandung kata tertentu (Manning et al. 2008). Pembobotan TF-IDF memberikan bobot pada term t dalam dokumen d dengan nilai:
dengan
, dan N adalah jumlah
dokumen dalam koleksi. Pembobotan TF-RIDF Nanas et al. (2004) mengungkapkan RIDF merupakan variasi dari IDF yang memberikan bobot untuk term berdasarkan selisih logaritme terhadap IDF sebelumnya. RIDF memakai model Poisson: (
)
dengan Y = 0,1,2,3, …, dan tengah sebaran Poisson.
adalah nilai
Peluang banyaknya peubah acak Y dalam periode waktu t diberikan oleh : (
………. (1)
)
⁄ dengan dengan adalah frekuensi kumulatif kata t dalam koleksi. Persamaan (1) digunakan untuk menghitung peluang peubah acak Y. Dengan demikian nilai RIDF kata t adalah (
)
(
(
))
Pembobotan Query Term Weighting (TF-F1) Robertson dan Sparck (1976) mengusulkan perhitungan F1 sebagai solusi untuk penyusunan kemungkinan pembobotan dalam mencari term, yaitu ⁄ ⁄ dengan r adalah jumlah dokumen yang ditentukan pengguna yang berisi istilah, R adalah jumlah dokumen yang ditentukan pengguna, n adalah jumlah dokumen dalam koleksi yang mengandung istilah, dan N adalah
jumlah dokumen dalam koleksi. Karena r dan R tidak diketahui berapa jumlah dokumen yang ditentukan oleh pengguna sehingga pada penelitian ini r/R diuji dengan tiga nilai asumsi yaitu 0.1, 0.3, dan 0.5. Pemrosesan Kueri Pemrosesan kueri meliputi tokenisasi, pembuangan stopword, dan proses penghitungan pembobotan. Kueri yang dimasukkan akan dilakukan indexing kueri yang dilakukan secara online sehingga diperoleh array kueri yang dapat digunakan dalam proses perhitungan ukuran kesamaan. Pemeringkatan Dokumen Hasil pembobotan yang diperoleh pada pengindeksan korpus secara offline dengan pengindeksan kueri secara online kemudian diperiksa kesamaan dokumen menggunakan ukuran kemiripan kosinus (Cosine Similarity). Ukuran kesamaan kosinus (cosine similarity) adalah sebuah model matematika yang digunakan untuk menghitung kesamaan antara kueri dan dokumen (Manning et al. 2008). Dokumen dan kueri dengan kata penciri digambarkan sebagai model vektor sehingga dapat dihitung kesamaannya (Salton 1989). Misalkan Q (wq1 , wq 2 ,, wqt ) adalah vektor kueri dan
Di ( wi1 , wi 2 ,, wit )
adalah vektor dokumen dengan wqj dan wij sebagai bobot istilah t dalam kueri Q dan dokumen Di. Koefisien kesamaan antara kueri dan dokumen dapat diperoleh dengan rumus inner product: ( ,
i )=
∑ w j .wij =1
Namun demikian, dokumen yang lebih panjang dengan lebih banyak kata penciri memiliki kemungkinan nilai kemiripan yang lebih besar dengan kueri tertentu dibandingkan dokumen-dokumen yang lebih pendek sehingga vektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen Di menjadi: ∑ w j .wij ( , i )= ….…(2) 2 2 √∑ w j √∑ wij Formula (2) ini merepresentasikan sudut kosinus antara vektor kueri dan vektor dokumen sebagai vektor-vektor dalam ruang t dimensi, dengan t sebagai jumlah istilah unik dalam sistem (Salton 1989). Dilihat dari hasil kemiripan cosine, semakin tinggi nilai
3
pembobotannya menunjukkan bahwa dokumen tersebut memiliki tingkat kemiripan yang besar dari kueri yang diinputkan. Evaluasi Sistem Dua ukuran utama keefektifan penemu kembalian yang telah digunakan sejak lama adalah recall dan precision (Salton 1989). Recall adalah perbandingan jumlah materi relevan yang ditemukembalikan terhadap jumlah materi yang relevan, sedangkan precision adalah perbandingan jumlah materi relevan yang ditemukembalikan terhadap jumlah materi yang ditemukembalikan.
HASIL DAN PEMBAHASAN Dokumen Pengujian Penelitian ini menggunakan 1000 dokumen pertanian yang berasal dari Laboratorium Temu Kembali Departemen Ilmu Komputer IPB. Deskripsi dokumen uji yang digunakan dapat dilihat pada Tabel 2. Tabel 2 Deskripsi Dokumen Uji Pertanian (.txt) Dokumen Ukuran rata-rata dokumen Ukuran seluruh dokumen Ukuran dokumen terbesar Ukuran dokumen terkecil
Tabel 1 Relevant dan retrieved documents Relevant
Non Relevant
Retrieved
true positive (tp)
false positive (fp)
Non retrieved
false negative (fn)
true negative (tn)
Berdasarkan precision (P) persamaan =
t t
Tabel 1, recall (R) dan dapat dinyatakan sebagai
dan
=
t t
n
….…(3)
Average precision (AVP) dihitung berdasarkan 11 standard recall levels, yaitu 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% dengan menggunakan interpolasi maksimum (Baeza-Yates & Ribeiro-Neto 1999). Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut: Perangkat lunak: • Microsoft Windows 7 Professional sebagai sistem operasi • PHP sebagai bahasa pemrograman • Netbeans IDE 7.0 sebagai IDE untuk pembangunan sistem • Xampp Server Apache version 2.5.8 sebagai server web • Notepad++ • Microsoft Office 2010 sebagai aplikasi yang digunakan untuk melakukan perhitungan dalam evaluasi Perangkat Keras: • Processor Intel Core 2 Duo 2.53 GHz • RAM 4 GB • Harddisk 320 GB
Bytes 4139 4050443 52759 444
Koleksi ini dibuat sesuai struktur tag XML pada masing-masing dokumen. Contoh dokumen pengujian yang digunakan dapat dilihat pada Lampiran 2. Tag XML yang digunakan dalam koleksi dokumen pertanian adalah
mewakili keseluruhan dokumen. Di dalamnya terdapat tag lain yang mendeskripsikan isi dokumen secara lebih jelas.
mewakili ID dokumen. ID yang dipakai merupakan kombinasi nama sumber berita, tanggal berita, dan urutan berita pada tanggal yang sama. <TITLE> mewakili judul dokumen.
menunjukkan penulis dari berita tersebut.
mewakili isi dokumen. Jumlah kueri uji yang akan digunakan dalam penelitian ini adalah 30 kueri uji dokumen pertanian yang berasal dari Laboratorium Temu Kembali (Lampiran 1).
balaipenelitian000000001 <TITLE>PRODUKTIVITAS SOM JAWA (Tal nu pan cula u Gaer n.)… Ireng Darwati Ireng Darwati, Mono Rahardjo, dan Rosita SMD Som Jawa merupakan tanaman yang menghasilkan umbi. Untuk….
Gambar 2 Contoh dokumen pengujian.
4
Pemrosesan dokumen Pemrosesan dokumen dilakukan melalui beberapa tahapan yaitu: tokenisasi, pembuangan stopword, dan pembobotan. Tahap tokenisasi dilakukan dengan pembacaan karakter per karakter. Tujuannya untuk membedakan karakter-karakter yang bersifat separator. Separator yang dihilangkan yaitu: karakter pemisah indeks istilah (whitespace), karakter angka, titik, koma, dan karakter lainnya yang dianggap kurang representasif dalam mencirikan suatu dokumen. Tahap pembuangan stopword dilakukan setelah hasil tokenisasi dokumen didapatkan. Hasil tokenisasi dibandingkan dengan stopword. Jika token berada di dalam stopword, token tersebut harus dihilangkan. Pembuangan juga dilakukan untuk token yang terdiri atas dua kata karena token tersebut kurang representatif dalam mencirikan suatu dokumen. Daftar stopword yang digunakan dalam penelitian ini diperoleh dari Herdi (2010) dan dicantumkan pada Lampiran 3. Hasil dari tahap ini akan digunakan sebagai input pada tahap selanjutnya yaitu pembobotan. Tahap pembobotan dilakukan secara offline dengan menggunakan TF-IDF, TF-RIDF, dan TF-FI. Untuk semua term pada masing-masing dokumen dihitung bobotnya untuk kemudian digunakan dalam proses temu kembali informasi. Hasil pembobotan tersebut disimpan ke dalam file teks sehingga dapat digunakan pada proses temu kembali. Pengujian Kinerja Sistem
Precision
Proses evaluasi dalam penelitian ini dilakukan pada koleksi dokumen pertanian. Proses evaluasi pada koleksi dokumen pertanian menggunakan 30 kueri uji yang terdapat pada Laboratorium Information Retrieval.
Pencarian dengan kueri uji ini dilakukan dengan melakukan pengukuran recall-precision dari sistem. Perhitungan recall dan precision menggunakan persamaan (3). Hasil dari evaluasi recall precision masing-masing kueri diinterpolasi maksimum untuk mencari nilai average precision (AVP) dan digambarkan dalam bentuk grafik serta tabel (Gambar 3 dan 4). Pada tahap evaluasi penelitian ini, dilakukan beberapa perbandingan hasil temu kembali pada kueri uji berdasarkan metode pembobotan TFIDF, TF-RIDF dan TF-F1. Kueri yang digunakan untuk evaluasi memiliki panjang dua sampai empat kata. Jumlah kueri yang memunyai panjang kueri dua kata sebanyak 17 kueri, untuk panjang kueri tiga kata sebanyak 9 kueri, dan untuk panjang kueri empat kata sebanyak 4 kueri. Tabel 3 merupakan hasil perbandingan dari 30 kueri yang dimasukkan ke sistem komparatif pembobotan kata. Pada pembobotan TF-FI diggunakan tiga asumsi untuk r/R yaitu 0.1, 0.3, dan 0.5. Nilai AVP TF-F1 dengan asumsi 0.5 memiliki nilai akurasi paling besar dibandingkan yang lainnya, yaitu 63.9% sehingga penelitian ini menggunakan asumsi 0.5 pada pembobotan TFF1. Perbandingan nilai AVP dengan asumsi 0.1, 0.3, dan 0.5 pada pembobotan TF-F1 dapat dilihat pada Gambar 3. Dibandingkan dengan metode pembobotan lainnya, nilai AVP TF-F1 paling besar. Perbandingan nilai AVP dari pembobotan TFIDF, TF-RIDF dan TF-F1 dapat dilihat pada Gambar 4. Pada Lampiran 4, 5, 6, 7, dan 8 dapat dilihat nilai AVP pada masing-masing kueri pada pengujian pembobotan TF-IDF, TFRIDF, TF-F1 dengan asumsi 0.1, 0.3, dan 0.5.
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0
0.1
Tf-F1 0.5
0.2 Tf-F1 0.1
0.3
0.4
0.5 0.6 Recall Tf-F1 0.3
0.7
0.8
0.9
Gambar 3 Perbandingan asumsi r/R pada pembobotan TF-F1.
1
5
1 0.9 0.8
Precision
0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 TfIdf
0.1 TfRidf
0.2
0.3
0.4
0.5 0.6 Recall
0.7
0.8
0.9
1
Tf-F1
Gambar 4 Perbandingan pembobotan untuk pembobotan TF-IDF, TF-RIDF, dan TF-F1.
6
Tabel 3 Perbandingan 30 kueri pada sistem Kueri
TF-IDF
TF-RIDF
TF-F1 0,1
TF-F1 0,3
TF-F1 0,5
Bencana Kekeringan
0.822
0.877
0.780
0.838
0.879
Dukungan Pemerintah Pada Pertanian
0.250
0.215
0. 514
0.468
0.469
Flu Burung
0.938
0.938
0.923
0.925
0.936
Gabah Kering Giling
0.549
0.572
0.557
0.613
0.593
Gagal Panen
0.515
0.632
0.879
0.770
0.758
Impor Beras Indonesia
0.742
0.901
0.903
0.889
0.903
Industri Gula
0.672
0.754
0.717
0.712
0.733
Institut Pertanian Bogor
0.635
0.580
0.655
0.691
0.698
Kelangkaan Pupuk
0.815
0.854
0.871
0.869
0.838
Kelompok Masyarakat Tani
0.398
0.398
0.540
0.543
0.540
Laboratorium Pertanian
0.550
0.240
0.671
0.649
0.642
Musim Panen
0.473
0.604
0.523
0.523
0.587
Pembangunan Untuk Sektor Pertanian
0.482
0.637
0.602
0.597
0.602
Penerapan Bioteknologi Di Indonesia
0.275
0.500
0.563
0.552
0.541
Penerapan Teknologi Pertanian
0.496
0.412
0.483
0.653
0.692
Penyakit Hewan Ternak
0.333
0.373
0.511
0.419
0.422
Penyuluhan Pertanian
0.539
0.286
0.765
0.789
0.778
Perdagangan Hasil Pertanian
0.195
0.303
0.214
0.214
0.214
Sistem Pertanian Organik
0.681
0.737
0.686
0.729
0.745
Petani Tebu
0.431
0.412
0.717
0.698
0.690
Peternak Ayam
0.896
0.921
0.923
0.923
0.925
Produk Usaha Peternakan Rakyat
0.314
0.497
0.370
0.370
0.439
Pupuk Organik
0.383
0.509
0.458
0.496
0.483
Riset Pertanian
0.322
0.318
0.659
0.646
0.659
Swasembada Pangan
0.369
0.353
0.703
0.734
0.607
Tadah Hujan
0.450
0.442
0.852
0.572
0.527
Tanaman Obat
0.527
0.723
0.747
0.726
0.747
Tanaman Pangan
0.270
0.281
0.274
0.274
0.274
Upaya Peningkatan Pendapatan Petani
0.198
0.218
0.382
0.405
0.382
Harga Komoditas Pertanian
0.785
0.671
0.382
0.595
0.864
Average Precision (AVP)
0.510
0.542
0.627
0.630
0.639
7
Berdasarkan Tabel 3, panjang kueri dua kata mempunyai hasil yang paling optimal untuk menaikkan temu kembali, karena semakin panjang kueri yang diberikan maka dokumen yang di-retrieve semakin tidak relevan. Sistem pembobotan berdasarkan pembobotan TF-F1 memiliki hasil yang lebih baik dari TF-IDF dan TF-RIDF. Namun, terdapat beberapa kueri dari sistem TF-IDF dan TF-RIDF yang memiliki nilai yang lebih baik dari TF-F1. Sebagai contoh kueri tersebut adalah ‘flu burung’.
DAFTAR PUSTAKA Adisantoso J, Ridha A. 2004. Corpus Dokumen Teks Bahasa Indonesia untuk Pengujian Efektifitas Temu Kembali Informasi. Laporan Akhir Hibah Penelitian SP4, Departemen Ilmu Komputer FMIPA IPB, Bogor. Baeza-Yates R, Ribeiro-Neto B. 1999. Modern Information Retrieval. Harlow (UK): Addison Wesley.
Hal tersebut disebabkan oleh jumlah kata pada gugus jawaban dari kueri sedikit. Jumlah kata yang sedikit berakibat pada sedikitnya jumlah paragraf pada dokumen dan mengakibatkan kata penciri pada dokumen tidak tersebar. Pada penelitian ini, penciri yang tidak tersebar menyebabkan penciri dokumen mendapatkan bobot yang kecil dan kinerja sistem menurun. Antarmuka sistem komparatif pembobotan kata ini dapat dilihat pada Lampiran 9, 10, dan 11.
Herdi H. 2010. Pembobotan dalam proses pengindeksan dokumen bahasa Indonesia menggunakan framework Indri [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
SIMPULAN DAN SARAN
Manning CD, Raghavan P, Schutze H. 2008. Introduction to Information Retrieval. Cambridge: Cambridge University Press.
Simpulan Berdasarkan penelitian yang telah dilakukan, dapat disimpulkan bahwa sistem komparatif pembobotan kata berhasil menerapkan metode pembobotan TF-IDF, TFRIDF, dan TF-F1. Nilai AVP dari hasil pembobotan TF-F1 lebih besar dibandingkan pembobotan TF-IDF dan TF-RIDF untuk 1000 dokumen pertanian, yaitu 63.9% untuk TF-F1, 54.2% untuk TF-RIDF, dan 51% untuk TF-IDF. Saran Beberapa hal yang perlu dikembangkan dalam penelitian ini: 1
Perlu menggunakan metode pembobotan yang lebih beragam untuk melihat berbagai perbandingan dari metode pembobotan pada sistem temu kembali informasi.
2
Perlu adanya pemilihan fitur sehingga hanya token tertentu yang dipilih untuk proses perhitungan.
Mandala R, Setiawan H. 2002. Peningkatan Performansi Sistem Temu Kembali Informasi dengan Perluasan Query secara Otomatis. Bandung, Indonesia: Institut Teknologi Bandung.
Nanas N, Uren V, Roeck AD. 2004. A Comparative Study of Term Weighting Methods for Information Filtering. Milton Keynes (UK): The Open University Knowledge Media Institute Milton Keynes. Robertson SE, Sparck JK. 1976. Relevance weighting of search term. Journal of the American Society for Information Science 27:129-146. Salton G. 1989. Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer. Boston: AddisonWesley. Xia T, Chai Y. 2011. An Improvement to TFIDF: Term Distribution based Term Weight Algorithm. Journal of Software 6(3):413420.
LAMPIRAN
9
Lampiran 1 Daftar kueri uji dan dokumen yang relevan Kueri
Gugus Jawaban
Bencana kekeringan
gatra070203, gatra161002, gatra210704, gatra301002, indosiar010903, indosiar170603, indosiar220503, indosiar260803-003, indosiar310504, kompas210504, kompas250803, mediaindonesia050604-001, mediaindonesia110703, mediaindonesia160603, mediaindonesia240503, mediaindonesia260803, mediaindonesia270803, mediaindonesia310503, pikiranrakyat020704, republika030903-001, republika030903-002, republika070604-001, republika090804-01, republika120804-01, republika120804-04, republika130804-02, republika200603, republika210704004, republika250604, republika270503, republika270704-002, situshijau181103-001, suarakarya000000-002-01, suarakarya000000-021, suaramerdeka130602, suaramerdeka190903, suarapembaruan150903, suarapembaruan180303, suarapembaruan260703-002.
Dukungan pemerintah pertanian
pada
Flu burung
Gabah giling
indosiar070504, jurnal000000-026, kompas030401, kompas050303, kompas060503, kompas071100, kompas150201, kompas200802, kompas300402, mediaindonesia130204, mediaindonesia220303, pembaruan110903, poskota040804, republika100903, republika180303, republika210902, republika230903, republika251102-001, republika251102-002, republika300604001, situshijau150504-002, situshijau190303-002, situshijau200103-002, situshijau201003-001, situshijau281003-002, suarakarya000000-028, suaramerdeka130902, wartapenelitian000000-002, wartapenelitian000000-007. gatra220604, gatra270104-001, gatra270104-002, gatra300104, indosiar020304, indosiar240204, mediaindonesia090204, mediaindonesia140704, mediaindonesia200204, republika090604, republika120704-005, republika190504-001, republika190604-005, republika210504-001, republika290704-002, situshijau280404-004, suarakarya000000-001, suarakarya000000-008, suarakarya000000-014, suaramerdeka160204, suaramerdeka200104.
kering
Gagal panen
indosiar180603, indosiar240703, indosiar300304, kompas 170402, kompas030502-001, kompas160704, kompas170903, mediaindonesia250304, pikiranrakyat300604, republika040303, republika060804-003, republika100704003, republika100804, republika120804-01, republika180504-002, republika210704-001, republika230704-001, republika231202-001, republika231202-002, republika290604-003, republika290604-007, situshijau281003-004, suarakarya000000-007, suaramerdeka090104. gatra070203, gatra190802, gatra190902-02, gatra301002, indosiar010504, indosiar031203, indosiar040903, indosiar050704-002, indosiar070504, indosiar130504, indosiar140204, indosiar160304, indosiar170603, indosiar180304, indosiar240703, indosiar260803-001, indosiar260803-003, kompas030704, kompas031003, kompas170504, mediaindonesia030603, mediaindonesia050604-001, mediaindonesia110703, mediaindonesia140203, mediaindonesia160603, mediaindonesia240503, mediaindonesia310503, republika030903-002, republika060804-001, republika080703, republika09080401, republika120804-04, republika130704-001, republika130804-02, republika200603, republika230704-005, republika260604-003, situshijau091203002, situshijau100603-003, situshijau110303-002, situshijau280404-002, suarakarya000000-002-02, suarakarya000000-011, suaramerdeka120104, suaramerdeka130602, suarapembaruan120104, suarapembaruan260703-001, suarapembaruan260703-002.
10
Lanjutan Kueri Impor Indonesia
Gugus Jawaban beras
gatra180103, gatra220802, indosiar180603, indosiar180703, indosiar200304, indosiar300703-002, kompas 170402, kompas 170402, kompas050602, kompas101002, kompas101004, kompas160704, kompas180504, kompas270401, kompas270502-002, kompas310702, mediaindonesia050104, mediaindonesia060803, mediaindonesia100203, mediaindonesia131003, mediaindonesia160603, mediaindonesia250304, republika020604-001, republika060804-001, republika090902, republika100703, republika100704-003, republika180504-002, republika210704-001, republika230704-001, republika231202-001, republika231202-002, republika240604-001, republika300704-002, situshijau281003-004, suarakarya000000-007, suarakarya000000-023, suaramerdeka120104, suaramerdeka130104, suaramerdeka170602-001, suaramerdeka270601, suarapembaruan100903, suarapembaruan110903
Industri gula
gatra200103, kompas031003, kompas250901, mediaindonesia120604-002, pikiranrakyat300704-002, republika010704-003, republika020804, republika090902, republika100902, republika220604-002, republika280704-002, republika301002, situshijau210103-001, suarakarya000000-001-01, suarakarya000000-007, suarakarya000000-028, suaramerdeka130902, suarapembaruan100903, suarapembaruan220403
Institut pertanian bogor
gatra020804, gatra180304, gatra180702, gatra220704, gatra290903, gatra300404, kompas100399, kompas111099, kompas121099, kompas150304-001, kompas200704, kompas200799, kompas230704, mediaindonesia080704, mediaindonesia090704, mediaindonesia101003, mediaindonesia290903-002, republika010704-001, republika061003, republika070604-002, republika100604002, republika100704-002, republika110604-002, republika140704-002, republika160604-002, republika170604-001, republika180303, republika180604, republika190604-001, republika190604-002, republika211002, republika220604001, republika230704-08, situshijau070503, situshijau101103-004, situshijau281003-003, suarakarya000000-005, suarakarya000000-010, suarapembaruan150903, suarapembaruan260703-001
Kelangkaan pupuk
indosiar010704, indosiar060204, indosiar190504-001, indosiar200104, indosiar260504, indosiar290604, kompas210504, kompas300502-001, pikiranrakyat010504-003, republika050604, republika160604-001, suarakarya000000-001-02, suarakarya000000-002, suarakarya000000-006, suarakarya000000-026, suarakarya000000-029, suarakarya000000-030, suarakarya000000-032, suarakarya000000-038, suaramerdeka161101
Kelompok masyarakat tani
bitraindonesia000000-001, indosiar021203-002, jurnal000000-017, kompas180502, kompas211103, kompas250901, kompas260304, kompas260902, kompas270203-002, kompas270502-002, kompas300502-001, replubika110804, republika030304, republika110604-004, republika131203-001, republika140703, republika151202, republika180303, republika270704-001, republika280703, republika300704-001, situshijau070503, situshijau120303-003, situshijau130303001, situshijau190303-002, situshijau200103-002, situshijau281003-004, suarakarya000000-001-02, suarakarya000000-037, suaramerdeka260902, suarapembaruan090202, suarapembaruan130103
Laboratorium pertanian
balaipenelitian000000-010, gatra100203, indobic130504-002, indosiar010704, jurnal000000-027, kompas220801, kompas241203, kompas300502-002, mediaindonesia290903-002, republika050804-007, republika120704-005, republika230704-004, republika300604-002, situshijau040603, situshijau05110302, situshijau100603-001, situshijau140503-001-01, situshijau150403-002, situshijau180603-003, suarakarya000000-003, suaramerdeka031101
11
Lanjutan Kueri Musim panen
Pembangunan untuk sektor pertanian
Penerapan bioteknologi di indonesia
harga komoditas pertanian
Gugus Jawaban gatra190902-02, gatra230103-001, gatra240203, indosiar010504, indosiar021203-002, indosiar060204, indosiar071103, indosiar110304, indosiar240604, indosiar300304, kompas030502-001, kompas041103, kompas220901-001, kompas240103, kompas300502-001, mediaindonesia131203-001, mediaindonesia230604, pikiranrakyat240404, pikiranrakyat300604, poskota261202, republika060804-001, republika060804003, republika100704-003, republika151202, republika171102, republika240604-005, republika290604-007, republika300704-002, situshijau000000-001, situshijau040603, situshijau080503-004, situshijau250403-004, situshijau270503-002, situshijau280404-002, suarakarya000000-007, suarakarya000000-023, suarakarya000000-028, suaramerdeka120104, suaramerdeka290901, suarapembaruan031002 gatra180304, jurnal000000-002, kompas020803, kompas031003, kompas060203, kompas060503, kompas100399, kompas101004, kompas110201, kompas111099, kompas121099, kompas150304-002, kompas190802, kompas191099, kompas200799, kompas210502, kompas220901-002, kompas230603, kompas240803, kompas260203, kompas270204, kompas280602, kompas290404, mediaindonesia050604-002, mediaindonesia060903, mediaindonesia090903, mediaindonesia160903, pembaruan110903, poskota110703, republika060903, republika070104, republika080703, republika100804, republika100903, republika101203, republika110604-002, republika131203-001, republika150604-003, republika150903, republika190803, republika251002-003, republika290704003, republika300604-001, situshijau091203-002, situshijau280203, suarapembaruan140303 jurnal000000-018, kompas121099, puslitbang000000-001, republika220604003, republika290704-002, situshijau000000-002, situshijau030603-001, situshijau040603, situshijau050703-001, situshijau070103-001, situshijau070103-002, situshijau070103-003, situshijau100603-002, situshijau100603-003, situshijau110303-002, situshijau130103-001, situshijau130503-001, situshijau130503-002, situshijau140103-002, situshijau140103-003, situshijau140503-001-01, situshijau140903-001, situshijau150403-001, situshijau150403-002, situshijau160103, situshijau180603-003, situshijau180803-003, situshijau200103-001, situshijau210103-003, situshijau210503-001, situshijau270303-004, situshijau270503-002, situshijau270703-005, situshijau300403, situshijau310303, situshijau310303-No, suarakarya000000-001-02, suarakarya000000-014, suarapembaruan020603, suarapembaruan020603-No, suarapembaruan151102, wartapenelitian000000-009 indosiar071103,indosiar180603,indosiar221003,indosiar240604,indosiar300304 ,jurnal000000-022,jurnal000000-027,kompas 170402,kompas030502001,kompas030502-002,kompas080702,kompas100399,kompas101004, kompas111099,kompas140802,kompas160304,kompas170104,kompas171002, kompas180502,kompas180504,kompas230603,kompas250901,kompas270203001,kompas270401,kompas270502-001,kompas280602,kompas311203, mediaindonesia060803,mediaindonesia310503,pikiranrakyat240404, pikiranrakyat300604,poskota000000-002,poskota000000-003,republika030804002,republika060503,republika060804-001,republika060804-003, republika061102,republika090902,republika140704-004,situshijau050703-002, situshijau070503,situshijau130203-002,situshijau240203-002,situshijau280203, situshijau280404-001,situshijau280404-002,situshijau280404-003, suarakarya000000-002-02,suarakarya000000-021,suaramerdeka170602-001, suaramerdeka290802,suaramerdeka311003,suarapembaruan100903, suarapembaruan220403,trubus000004,wartapenelitian000000-002
12
Kueri Penerapan pertanian
Gugus Jawaban teknologi
indosiar250204-001, jurnal000000-001, jurnal000000-011, jurnal000000013, jurnal000000-017, jurnal000000-024, kompas121099, kompas251003, kompas290402, mediaindonesia170403, republika050903, republika131203-001, republika140604-001, republika180504-001, republika201102, republika220604-003, republika230704-08, republika260803, situshijau030603-001, situshijau080103, situshijau100603-003, situshijau140103-002, situshijau140903-001, situshijau140903-003, situshijau180603-003, situshijau180803-002, situshijau181103-002, situshijau270303-004, situshijau270503-002, situshijau270703-005, situshijau281003-003, situshijau290503-003, suarakarya000000-034, suarapembaruan020603No, suarapembaruan060602, suarapembaruan160702, wartapenelitian000000-003, wartapenelitian000000-007, wartapenelitian000000-009
Penyakit hewan ternak
gatra270104-002, gatra270104-003, gatra300104, mediaindonesia090204, republika150103, republika160704-003, republika260704-004, republika300604-002, suarakarya000000-004, suarakarya000000-008, suarakarya000000-014, suarakarya000000-017, suaramerdeka260302-01
Penyuluhan pertanian
bitraindonesia000000-001, gatra190902-02, indosiar310504, jurnal000000-005, jurnal000000-014, kompas050802, kompas130699, kompas170104, kompas200503-002, mediaindonesia160603, poskota110703, republika030903-002, republika050804-001, republika061003, republika171003, republika180303, republika200203, republika210504-001, republika220604-003, republika260604-003, republika300604-003, situshijau201003-002, situshijau230103-001, situshijau270703-001, suaramerdeka271102, wartapenelitian000000-002, wartapenelitian000000-007
Perdagangan pertanian
gatra011102, indosiar070204, indosiar201103, jurnal000000-002, jurnal000000-027, kompas031003, kompas041102, kompas101002, kompas140802, kompas160304, kompas270401, kompas270502-001, kompas271103, kompas311203, mediaindonesia030104, mediaindonesia101003, mediaindonesia150903, mediaindonesia170303, republika020604-001, republika041102, republika281202, situshijau130303-001, situshijau191103, situshijau240203-002, suarakarya000000-013, suaramerdeka120104, suaramerdeka270601, suarapembaruan080903-001, suarapembaruan080903-002, wartapenelitian000000-006
hasil
Sistem pertanian organik
indosiar250204-002, jurnal000000-017, kompas010499, kompas030502002, kompas050802, kompas081203, kompas181099, kompas221001, kompas241203, kompas260304, kompas270502-002, kompas300502-001, republika131203-001, republika150303, republika180303, situshijau070503, situshijau091203-001, situshijau091203-004, situshijau290503-003, suarakarya000000-001-02, suarapembaruan000000-002, suarapembaruan090202, suarapembaruan110702-01, suarapembaruan160702
Petani tebu
indosiar190504-002, indosiar290604, kompas031003, kompas250901, kompas310702, republika010704-003, republika020804, republika100902, republika140704-004, republika150604-002, republika200704-001, republika220604-002, republika280704-002, republika310704-001, situshijau280203, suarakarya000000-007, suarakarya000000-028, suaramerdeka130902, suarapembaruan100903, suarapembaruan220403
13
Lanjutan Kueri
Gugus Jawaban
Peternak ayam
gatra270104-001, gatra270104-002, gatra300104, indosiar020304, indosiar161203, indosiar240204, jurnal000000-009, kompas051103, kompas120101, mediaindonesia090204, republika061003, republika100604-002, republika190504-001, republika210504-001, situshijau280404-004, suarakarya000000-001, suarakarya000000-008, suarakarya000000-014, suarakarya000000-017, suarapembaruan220802
Produk usaha peternakan rakyat
jurnal000000-003, kompas120101, mediaindonesia010304, mediaindonesia090204, republika150303, republika170704-007, republika220704-003, republika260604-001, republika300604-002, situshijau190303-001, suarakarya000000-008, suarakarya000000-013, suarapembaruan151102
Pupuk organik
balaipenelitian000000-001, kompas270502-002, kompas280502, kompas300502-001, republika050804-007, republika190104, republika201102, republika270604, situshijau091203-004, situshijau140103-001, suarakarya000000-001-02, suarakarya000000-037, suaramerdeka031101, suaramerdeka170602-002, suarapembaruan090202, suarapembaruan130103, suarapembaruan160702, suarapembaruan220802, wartapenelitian000000-002, wartapenelitian000000-008
Riset pertanian
balaipenelitian000000-012, gatra270104-002, indobic130504-001, jurnal000000-008, jurnal000000-015, jurnal000000-018, jurnal000000019, jurnal000000-026, kompas010499, kompas170104, kompas221003, kompas230603, mediaindonesia131003, puslitbang000000-001, republika030903-002, republika070604-002, republika100704-002, republika140104, republika170604-001, republika190604-001, republika190604-002, republika210704-001, republika210704-003, republika220604-003, republika241203, republika260803, republika280703, republika300604-003, situshijau040603, situshijau070503, situshijau080503-001, situshijau091203-003, situshijau101103-004, situshijau130103-001, situshijau130503-002, situshijau140103-002, situshijau140903-001, situshijau140903-003, situshijau150403-002, situshijau180803-002, situshijau181103-002, situshijau200103-001, situshijau200103-001-No, situshijau201003-002, situshijau210103-003, situshijau210503-001, situshijau250203, situshijau270303-004, situshijau290503-001, situshijau300403, situshijau310303, suarakarya000000-001-02, suarakarya000000-010, suarakarya000000-019, suarakarya000000-027, suarakarya000000-034, suarakarya000000-037, suaramerdeka270601, suarapembaruan000000002, suarapembaruan020603, suarapembaruan060602, suarapembaruan110702, suarapembaruan110702-01, suarapembaruan151102, suarapembaruan160702, suarapembaruan241003, suarapembaruan290802-001, wartapenelitian000000-007, wartapenelitian000000-009
kompas150201, republika100604-002, republika210504-001, republika290704-002, suarakarya000000-001, suarakarya000000-014,
14
Lanjutan Kueri
Gugus Jawaban
Swasembada pangan
indosiar021203-002, kompas060503, kompas100901, kompas110201, kompas150304-002, kompas170104, kompas230603, kompas230899, kompas270203-001, kompas270401, kompas270502-002, mediaindonesia160603, republika030304, republika060503, republika061003, republika080703, republika100704-005, republika220604-003, republika220604-003, republika230902-001, republika230902-002, republika231202-001, republika231202-002, suarakarya000000-001-02, suarakarya000000-002-02, suarakarya000000016, suarakarya000000-021, suaramerdeka170602-001, suarapembaruan110903, suarapembaruan221102
Tadah hujan
gatra210704, gatra301002, indosiar260803-001, indosiar310504, jurnal000000-001, kompas270502-002, mediaindonesia160603, mediaindonesia310503, republika090804-01, republika210704-004, republika230704-005, republika240604-005, republika290604-007, suarakarya000000-001-02, suarakarya000000-030, suaramerdeka130602, suarapembaruan260703-002, wartapenelitian000000-004
Tanaman obat
balaipenelitian000000-008, balaipenelitian000000-009, indobic120504, indosiar010704, indosiar260803-002, republika020604-003, republika030804-002, republika270604, republika290604-001, situshijau030203-001, situshijau041203, situshijau060503, situshijau070103-004, situshijau070103-005, situshijau100603-002, situshijau101103-003, situshijau120303-004, situshijau130103-002, situshijau130503-001, situshijau140103-003, situshijau140903-004, situshijau180203-001, situshijau180203-002, situshijau201003-002, situshijau270303-001, situshijau270303-003, situshijau270503-002, situshijau270703-002, situshijau290503-001
Tanaman pangan
bitraindonesia000000-001, indosiar021203-001, indosiar030304, indosiar050704-002, indosiar130104, indosiar130504, indosiar160304, indosiar180304, indosiar310504, kompas020603, kompas120102, kompas120702, kompas171002, kompas180701, kompas240302, kompas260203, kompas311203, mediaindonesia030104, mediaindonesia160603, mediaindonesia170303, mediaindonesia220303, republika030304, republika050903, republika080604-004, republika150903, republika200603, republika220604-003, republika230704-006, republika241203, republika260604-001, republika271003, situshijau070103-003, situshijau140903-001, situshijau181103-001, situshijau290403-002, suarakarya000000-001-02, suarakarya000000-011, suarakarya000000-013, suarakarya000000-031, suaramerdeka160703, suaramerdeka250302, suarapembaruan151102, suarapembaruan260703-002
Upaya peningkatan pendapatan petani
indosiar150104-001, jurnal000000-017, kompas030502-001, kompas031003, kompas100399, kompas170903, kompas200802, kompas210502, kompas260702, kompas270203-001, kompas300402, kompas300502-002, pembaruan110903, poskota110703, republika030804-002, republika030903-001, republika060804-001, republika060804-003, republika230404, republika231202-001, republika231202-002, republika240604-005, republika241203, republika281202, republika300704-002, situshijau140503-001, situshijau180803-002, situshijau181103-002, situshijau200103-001, situshijau280203, suaramerdeka120104, suaramerdeka170602-001, suarapembaruan060602, suarapembaruan290802-001, wartapenelitian000000-005
15
Lampiran 2 Contoh dokumen koleksi pengujian balaipenelitian000000-004 <TITLE>PENGARUH JARAK TANAM TERHADAP JUMLAH MATA TUNAS PADA BEBERAPA KLON KAPUK MOCH. SAHID, BUADI, dan O.M.Y. FACHRUDIN RINGKASAN Percobaan dilakukan di Kebun Percobaan Muktiharjo, Pati dari bulan Desember 1991 sampai dengan Desember 1993. Perlakuan disusun secara faktorial dalam rancangan petak terbagi dengan tiga ulangan. Petak utama adalah dua macam jarak tanam kapuk masing-masing 2 m x 1 m dan 2 m x 2 m. Anak petak terdiri dari delapan macam klon sebagai sumber mata tunas yaitu : MH I, MH II, Togo B, (Lanang 36 x Siam) x Congo, (Congo 2 x Lanang), (SS 29 x Congo), (Jepara x Congo 2), dan (P. Gudang x Lanang x Congo). Ukuran petak 20 m x 4 m. Lubang tanam berukuran 0.6 m x 0.6 m x 0.6 m ditanami satu tanaman. Pupuk kandang dicampur dengan tanah digunakan sebagai penimbunan pada saat tanam. Bahan tanaman berupa bibit stum okulasi. Hasil penelitian menunjukkan bahwa jumlah mata tunas aktif dengan jarak tanam 2 m x 1 m lebih banyak dibanding 2 m x 2 m, masingmasing 147 625 dan 79 661 mata tunas per hektar, sedang diameter entresnya pada jarak tersebut masing-masing 34.47 mm dan 42.53 mm. Jumlah mata tunas aktif tertinggi dihasilkan oleh klon (SS 29 x Congo), yaitu 123 959.33 tunas per hektar dan 33.33 tunas per tanaman. Kata kunci : Ceiba pentandra, jarak tanam, klon, mata tunas, produksi
16
Lampiran 3 Daftar stopword Acapkali
apalagi
begini
berikut
bukankah
Ada
apalah
beginilah
berikutnya
bukanlah
Adakah
apanya
begitu
berjumlah
bukannya
Adakan
apapun
begitulah
berkat
buktikan
Adalah
arti
begitupula
berkenaan
cara
Adanya
artian
begitupun
berkesan
cerita
Adapun
artinya
belakang
berkesempatan
ceritanya
Aduh
asalan
belakangan
berkesimpulan
contoh
Agak
asalkan
belum
berlalu
contohkan
Agaknya
asumsi
belumlah
berlalunya
contohnya
Agar
asumsinya
benar
berlama
cukup
Aja
atas
benarkah
berlangsung
Cuma
Akalan
atasnya
benarnya
bermula
daerah
Akan
atau
berada
bersama
dahulu
Akankah
ataukah
berakhir
bersamaan
dalam
Akhir
ataupun
berakhirnya
bertepatan
dan
Akhirnya
awal
berakibat
beruntun
dapat
Akibat
bagai
berakibatkan
berupa
dapatkah
Akibatkan
bagaikan
beralasan
besarnya
dapatkan
Akibatnya
bagaimana
beralih
beserta
dapatlah
Aku
bagaimanakah
beralihnya
besok
dari
Ala
bagaimanapun
beranggapan
besoknya
darinya
Alangkah
bagi
berapa
betapa
daripada
Alasan
baginya
berapanya
biar
dekat
Alasannya
bagus
berapapun
biarlah
dekatnya
Alih
bagusnya
berarti
biasa
demi
Alihkan
bahkan
berasumsi
biasanya
demikian
Amat
bahwa
berbagai
bicarakan
demikianlah
amatlah
baik
berbagi
bicaranya
dengan
ambil
baiknya
berbanding
bila
dengannya
anda
balik
berbeda
bilamana
depan
andai
banding
berdampak
bilang
depannya
anggap
bandingkan
berdasarkan
bisa
di
anggapan
banyak
berhadapan
bisakah
dia
antar
banyaknya
berharap
bisanya
dialah
antara
barangkali
berhubung
boleh
dialami
antaranya
baru
berhubungan
boro
dialihkan
apa
bawah
beri
buat
diambil
apabila
bawahnya
berikan
buatnya
diambilkan
apakah
beberapa
berikanlah
bukan
diambilnya
17
Lanjutan dianggap
dimulailah
haruslah
kapan
lakukan
diantara
dimulainya
harusnya
karena
lalu
diantaranya
dimungkinkan
hendak
karenanya
lalui
diapakan
dipaparkan
hendaklah
kata
lama
dibagi
dipersilahkan
hendaknya
katakan
lanjut
dibagikan
disaat
hingga
katakanlah
lantaran
dibeberapa
disebabkan
how
katanya
lantas
diberbagai
disejumlah
ialah
kau
lebih
diberi
diseluruh
ingin
kayak
lepas
diberikan
disertai
ini
kayaknya
lewat
diberinya
disertakan
inilah
ke
lokasi
dibiarkan
disimpulkan
inipun
kebanyakan
maka
dibiasakan
disitulah
itu
kebetulan
makin
dibilang
ditanggapi
itulah
kebiasaan
mampu
dicontoh
ditanya
itupun
kecil
mampukah
dicontohkan
ditanyakan
iya
kecuali
mampunya
dicontohkannya
dituturkan
jadi
kemana
mana
didapat
diucapkan
jadikan
kemanakah
manakala
didapati
dkk
jadilah
kembali
manalagi
didapatkan
dll
jadinya
kemudian
manapun
didapatnya
dsb
jangan
kemungkinan
masa
didasarkan
dua
jarang
kemungkinannya
masih
digolongkan
dulu
jauh
kenapa
masihkah
digunakan
dulunya
jelaskan
kenapakah
masing
diharapkan
empat
jika
kepada
masuk
dijadikan
enggak
jikalau
kepadanya
masyarakat
dijadikannya
engkau
juga
kepala
mau
dikarenakan
esok
jumlah
ketika
maupun
dikasih
gimana
jumlahnya
ketimbang
melainkan
dikata
habis
justru
khususnya
melakukan
dikatakan
habisan
juta
kini
melalui
dikatakannya
habiskan
kabupaten
kita
melihat
dikategorikan
habisnya
kadang
kondisi
memang
dikembangkan
hal
kalau
kurang
memaparkan
diketahui
hampir
kalaupun
lagi
membagi
diketahuinya
hanya
kali
lagian
membagikan
dilaksanakan
hanyalah
kalian
lagipula
memberi
dilakukan
hari
kami
lain
memberikan
dimana
harus
kamu
lainnya
memberinya
dimulai
haruskah
kan
laksana
membiarkan
18
Lanjutan membolehkan
menuju
paparan
sambil
segera
membuat
menunjukkan
paparkan
sambutannya
sehabis
memeperoleh
menurut
paparnya
sampai
seharusnya
memiliki
menurutnya
para
sana
seharusnyalah
meminta
menuturkan
pasti
sang
sehingga
memperbolehkannya
menyatakan
pastilah
sangat
sehubungan
mempersilahkan
menyebabkan
pastinya
sangatlah
sejak
mempunyai
menyebutkan
pelak
satunya
sejauhmana
memungkinkan
menyia
pelbagai
saya
sejumlah
menanggapi
mereka
pemaparan
sayangnya
sekalian
menanggapinya
merupakan
pembagian
seakan
sekaligus
menanyakan
meski
pembagiannnya
seandainya
sekalipun
mencapai
meskipun
pendapat
seantero
sekarang
mencontohkan
mesti
pengalihan
sebab
sekata
mendapat
mestinya
pengambil
sebabkan
sekedar
mendapati
misal
pengambilan
sebabnya
sekeliling
mendapatkan
misalkan
pengandaian
sebagai
seketika
mendapatkannya
misalnya
per
sebagaimana
sekian
menerus
mudah
peralihan
sebagainya
sekitar
mengada
mula
percuma
sebagian
selagi
mengaku
mulai
peri
sebaik
selain
mengalami
mulainya
perihal
sebaiknya
selalu
mengalihkan
mulanya
perlahan
sebaliknya
selama
mengambil
muncul
perlu
sebanyak
selanjutnya
mengambilnya
mungkin
pernah
sebelum
selesai
menganggap
mungkinkah
persen
sebelumnya
selesaikah
menganggapnya
namun
pertamanya
sebenarnya
seluruh
mengapa
nanti
pinggir
seberapa
seluruhnya
mengatakan
negara
pula
seberat
semakin
mengembangkan
nilai
pulalah
sebesar
semampunya
mengenai
nyaris
pun
sebetulnya
semenjak
menggunakan
nyiakan
rata
sebuah
sementara
mengungkapkan
oleh
relevankah
secara
semestinya
meningkat
orang
rendah
sedalam
semisal
meningkatkan
pada
saat
sedang
semoga
menjadi
padahal
saatnya
sedangkan
semua
menjadikan
padanannya
saatnyalah
sedapat
semuanya
menjadikannya
paling
saja
sedemikian
semula
menjelang
panjangnya
salah
sedikit
seolah
menjelaskan
papar
sama
sedikitnya
seorang
19
Lanjutan seorangpun
sia
tergolong
untuk
sepadan
sialnya
terhadap
usah
sepanjang
siap
terjadi
usahlah
sepasang
siapa
terjadilah
usai
sepele
siapakah
terjadinya
usianya
sependapat
siapapun
terkadang
waktu
seperti
silahkan
terkait
waktulah
sepertinya
singkatnya
terkecuali
waktunya
seputar
sini
terlalu
walau
seraya
sinilah
terlebih
walaupun
serba
situ
termasuk
warga
serentak
sosok
ternyata
yaitu
sering
sosoknya
tersebut
yakni
seringkali
suatu
tertentu
yang
seringkalinya
sudah
terus
seringlah
sulit
tetap
seringnya
sungguh
tetapi
serta
sungguhpun
tiap
sertanya
supaya
tiba
sesaat
tak
tidak
sesama
tambahnya
tidaklah
sesamamu
tanggapan
tidaknya
sesedikit
tanggapannya
tiga
seseorang
tanggapnya
tinggi
sesuai
tanpa
tutur
sesuatu
tapi
tuturnya
sesuatunya
tatkala
ucap
sesudah
telah
ucapan
sesudahnya
tempat
ucapannya
sesukanya
tengah
ucapkan
sesungguhnya
tentang
ucapnya
setelah
tentu
ujar
setelahnya
tentunya
ujarnya
seterusnya
tepatnya
umpamanya
setiap
terbagi
umum
setidak
terbalik
umumnya
setidaknya
terbiasa
ungkap
seusai
terbilang
ungkapan
sewaktu
terdapat
ungkapkan
seyogyanya
terdapat
ungkapnya
Lampiran 4 Daftar AVP pada pengujian pembobotan TF-IDF Kueri
Nilai precision pada eleven standard recall 0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Bencana kekeringan
1.000
1.000
0.900
0.900
0.900
0.880
0.800
0.750
0.733
0.590
0.587
Dukungan pemerintah pada pertanian
1.000
0.300
0.300
0.234
0.178
0.174
0.165
0.141
0.130
0.092
0.041
Flu burung
1.000
1.000
1.000
0.941
0.941
0.941
0.941
0.941
0.900
0.870
0.840
Gabah kering giling
1.000
0.833
0.833
0.667
0.480
0.438
0.383
0.383
0.370
0.361
0.293
Gagal panen
1.000
0.750
0.750
0.625
0.588
0.458
0.439
0.327
0.247
0.241
0.241
Impor beras indonesia
1.000
1.000
1.000
1.000
0.950
0.821
0.675
0.640
0.500
0.345
0.226
Industri gula
1.000
1.000
0.800
0.800
0.800
0.769
0.750
0.700
0.500
0.176
0.093
Institut pertanian bogor
1.000
0.833
0.692
0.682
0.630
0.605
0.605
0.588
0.559
0.480
0.310
Kelangkaan pupuk
1.000
1.000
1.000
0.909
0.909
0.846
0.813
0.714
0.708
0.692
0.377
Kelompok masyarakat tani
0.800
0.800
0.533
0.524
0.333
0.283
0.266
0.258
0.257
0.186
0.140
Laboratorium pertanian
1.000
0.800
0.714
0.692
0.692
0.632
0.517
0.517
0.266
0.145
0.072
Musim panen
0.818
0.818
0.818
0.520
0.475
0.412
0.325
0.305
0.267
0.248
0.196
Pembangunan untuk sektor pertanian
1.000
0.700
0.600
0.600
0.524
0.464
0.382
0.363
0.285
0.231
0.159
Penerapan bioteknologi di indonesia
1.000
0.833
0.450
0.200
0.135
0.090
0.085
0.058
0.058
0.058
0.058
Penerapan teknologi pertanian
1.000
1.000
0.727
0.706
0.615
0.500
0.471
0.226
0.123
0.048
0.043
Penyakit hewan ternak
0.500
0.500
0.400
0.400
0.389
0.389
0.346
0.212
0.212
0.156
0.155
Penyuluhan pertanian
1.000
1.000
1.000
0.667
0.667
0.560
0.425
0.352
0.180
0.042
0.038
Perdagangan hasil pertanian
0.400
0.286
0.286
0.268
0.232
0.180
0.156
0.111
0.100
0.082
0.048
Sistem pertanian organik
1.000
1.000
0.737
0.737
0.737
0.737
0.714
0.680
0.606
0.512
0.036
Petani tebu
1.000
1.000
0.556
0.476
0.476
0.333
0.238
0.238
0.193
0.151
0.084
Peternak ayam
1.000
1.000
1.000
1.000
1.000
1.000
0.867
0.842
0.842
0.818
0.488
Produk usaha peternak rakyat
1.000
1.000
0.500
0.273
0.143
0.113
0.113
0.096
0.090
0.062
0.060
Pupuk organik
1.000
0.600
0.407
0.407
0.407
0.407
0.255
0.208
0.189
0.176
0.156
21
Lanjutan Riset pertanian
1.000
0.778
0.609
0.356
0.255
0.131
0.099
0.094
0.079
0.074
0.074
Swasembada pangan
0.500
0.500
0.500
0.400
0.400
0.400
0.400
0.400
0.242
0.220
0.094
Tadah hujan
0.667
0.667
0.667
0.438
0.417
0.417
0.406
0.406
0.385
0.293
0.184
Tanaman obat
1.000
1.000
1.000
0.818
0.75
0.441
0.254
0.152
0.134
0.134
0.109
Tanaman pangan
1.000
0.296
0.278
0.277
0.234
0.163
0.163
0.162
0.136
0.136
0.121
Upaya peningkatan pendapatan petani
0.500
0.500
0.188
0.169
0.163
0.141
0.117
0.112
0.109
0.106
0.076
Harga komoditas pertanian
1.000
1.000
0.889
0.889
0.889
0.889
0.864
0.851
0.708
0.464
0.197
Lampiran 5 Daftar AVP pada pengujian pembobotan TF-RIDF Kueri
Nilai precision pada eleven standard recall 0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Bencana kekeringan
1.000
0.900
0.900
0.900
0.900
0.880
0.833
0.833
0.833
0.833
0.833
Dukungan pemerintah pada pertanian
0.217
0.217
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
Flu burung
1.000
1.000
1.000
0.941
0.941
0.941
0.941
0.941
0.900
0.870
0.840
Gabah kering giling
1.000
1.000
0.714
0.615
0.476
0.414
0.414
0.414
0.414
0.414
0.414
Gagal panen
0.750
0.750
0.714
0.593
0.593
0.593
0.593
0.593
0.593
0.593
0.593
Impor beras indonesia
1.000
1.000
1.000
1.000
0.957
0.957
0.800
0.800
0.800
0.800
0.800
Industri gula
1.000
1.000
1.000
0.818
0.818
0.769
0.750
0.583
0.517
0.517
0.517
Institut pertanian bogor
1.000
1.000
0.692
0.462
0.462
0.462
0.462
0.462
0.462
0.462
0.462
Kelangkaan pupuk
1.000
1.000
1.000
0.909
0.909
0.846
0.765
0.762
0.762
0.720
0.720
Kelompok masyarakat tani
0.800
0.800
0.563
0.524
0.400
0.400
0.400
0.400
0.400
0.400
0.400
Laboratorium pertanian
0.333
0.231
0.231
0.231
0.231
0.231
0.231
0.231
0.231
0.231
0.231
Musim panen
0.818
0.818
0.818
0.565
0.517
0.517
0.517
0.517
0.517
0.517
0.517
Pembangunan untuk sektor pertanian
1.000
0.833
0.591
0.583
0.571
0.571
0.571
0.571
0.571
0.571
0.571
Penerapan bioteknologi di indonesia
1.000
1.000
0.389
0.389
0.389
0.389
0.389
0.389
0.389
0.389
0.389
Penerapan teknologi pertanian
1.000
0.353
0.353
0.353
0.353
0.353
0.353
0.353
0.353
0.353
0.353
Penyakit hewan ternak
0.500
0.500
0.400
0.400
0.368
0.368
0.320
0.310
0.310
0.310
0.310
Penyuluhan pertanian
1.000
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
Perdagangan hasil pertanian
0.667
0.267
0.267
0.267
0.267
0.267
0.267
0.267
0.267
0.267
0.267
Sistem pertanian organik
1.000
0.818
0.818
0.818
0.722
0.722
0.652
0.640
0.640
0.640
0.640
Petani tebu
1.000
1.000
0.455
0.259
0.259
0.259
0.259
0.259
0.259
0.259
0.259
Peternak ayam
1.000
1.000
1.000
1.000
1.000
1.000
0.867
0.842
0.842
0.792
0.792
Produk usaha peternakan rakyat
1.000
1.000
0.800
0.333
0.333
0.333
0.333
0.333
0.333
0.333
0.333
Pupuk organik
1.000
1.000
0.400
0.400
0.400
0.400
0.400
0.400
0.400
0.400
0.400
Lanjutan Riset pertanian
1.000
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
Swasembada pangan
0.417
0.417
0.381
0.333
0.333
0.333
0.333
0.333
0.333
0.333
0.333
Tadah hujan
0.667
0.667
0.429
0.429
0.417
0.417
0.367
0.367
0.367
0.367
0.367
Tanaman obat
1.000
1.000
1.000
0.818
0.591
0.591
0.591
0.591
0.591
0.591
0.591
Tanaman pangan
0.375
0.313
0.267
0.267
0.267
0.267
0.267
0.267
0.267
0.267
0.267
Upaya peningkatan pendapatan petani
0.235
0.235
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
Harga komoditas pertanian
1.000
0.923
0.923
0.567
0.567
0.567
0.567
0.567
0.567
0.567
0.567
Lampiran 6 Daftar AVP pada pengujian pembobotan TF-F1dengan asumsi 0,5 Kueri
Nilai precision pada eleven standard recall
Bencana kekeringan Dukungan pemerintah pada pertanian Flu burung Gabah kering giling Gagal panen Impor beras indonesia Industri gula Institut pertanian bogor Kelangkaan pupuk Kelompok masyarakat tani Laboratorium pertanian Musim panen Pembangunan untuk sektor pertanian
0 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.800 1.000 0.800 1.000
0.1 1.000 0.500 1.000 0.833 1.000 1.000 1.000 1.000 1.000 0.800 0.75 0.800 0.727
0.2 0.905 0.455 1.000 0.833 0.786 1.000 0.800 0.722 1.000 0.500 0.700 0.667 0.625
0.3 0.905 0.455 0.938 0.667 0.708 1.000 0.800 0.722 0.900 0.480 0.700 0.565 0.538
0.4 0.905 0.393 0.938 0.500 0.692 1.000 0.800 0.630 0.900 0.480 0.643 0.517 0.533
0.5 0.846 0.393 0.938 0.448 0.692 0.821 0.733 0.600 0.857 0.480 0.611 0.517 0.533
0.6 0.821 0.393 0.938 0.448 0.692 0.821 0.667 0.600 0.824 0.480 0.591 0.517 0.533
0.7 0.821 0.393 0.938 0.448 0.692 0.821 0.667 0.600 0.714 0.480 0.517 0.517 0.533
0.8 0.821 0.393 0.900 0.448 0.692 0.821 0.533 0.600 0.696 0.480 0.517 0.517 0.533
0.9 0.821 0.393 0.870 0.448 0.692 0.821 0.533 0.600 0.692 0.480 0.517 0.517 0.533
1 0.821 0.393 0.840 0.448 0.692 0.821 0.533 0.600 0.633 0.480 0.517 0.517 0.533
Penerapan bioteknologi di indonesia
1.000
0.833
0.529
0.448
0.448
0.448
0.448
0.448
0.448
0.448
0.448
Penerapan teknologi pertanian
1.000
1.000
0.700
0.700
0.615
0.600
0.600
0.600
0.600
0.600
0.600
Penyakit hewan ternak
0.667
0.667
0.400
0.400
0.389
0.389
0.346
0.346
0.346
0.346
0.346
Penyuluhan pertanian
1.000
1.000
0.889
0.818
0.75
0.739
0.739
0.655
0.655
0.655
0.655
Perdagangan hasil pertanian
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
Sistem pertanian organik
1.000
1.000
0.737
0.737
0.737
0.737
0.714
0.633
0.633
0.633
0.633
Petani tebu
1.000
0.800
0.667
0.667
0.667
0.667
0.667
0.630
0.630
0.600
0.600
Peternak ayam
1.000
1.000
1.000
1.000
1.000
1.000
0.867
0.85
0.85
0.818
0.792
Produk usaha peternakan rakyat
1.000
0.667
0.500
0.333
0.333
0.333
0.333
0.333
0.333
0.333
0.333
Pupuk organik
1.000
0.500
0.423
0.423
0.423
0.423
0.423
0.423
0.423
0.423
0.423
Lanjutan Riset pertanian
1.000
0.750
0.640
0.607
0.607
0.607
0.607
0.607
0.607
0.607
0.607
Swasembada pangan
1.000
0.667
0.571
0.571
0.560
0.552
0.552
0.552
0.552
0.552
0.552
Tadah hujan
0.800
0.800
0.800
0.471
0.471
0.435
0.423
0.400
0.400
0.400
0.400
Tanaman obat
1.000
1.000
1.000
1.000
0.857
0.600
0.552
0.552
0.552
0.552
0.552
Tanaman pangan
0.286
0.278
0.273
0.273
0.273
0.273
0.273
0.273
0.273
0.273
0.273
Upaya peningkatan pendapatan petani
1.000
0.714
0.276
0.276
0.276
0.276
0.276
0.276
0.276
0.276
0.276
Harga komoditas pertanian
1.000
1.000
0.833
0.833
0.833
0.833
0.833
0.833
0.833
0.833
0.833
Lampiran 7 Daftar AVP pada pengujian pembobotan TF-F1 dengan asumsi 0,3 Kueri
Nilai precision pada eleven standard recall 0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Bencana kekeringan
1.000
1.000
0.905
0.905
0.905
0.833
0.733
0.733
0.733
0.733
0.733
Dukungan pemerintah pada pertanian
1.000
0.571
0.429
0.400
0.393
0.393
0.393
0.393
0.393
0.393
0.393
Flu burung
1.000
1.000
0.933
0.933
0.933
0.933
0.933
0.900
0.900
0.870
0.840
Gabah kering giling
1.000
0.833
0.833
0.667
0.524
0.481
0.481
0.481
0.481
0.481
0.481
Gagal panen
1.000
1.000
1.000
0.800
0.667
0.667
0.667
0.667
0.667
0.667
0.667
Impor beras indonesia
1.000
1.000
1.000
1.000
1.000
0.815
0.815
0.815
0.815
0.815
0.815
Industri gula
1.000
0.833
0.833
0.800
0.800
0.733
0.650
0.577
0.533
0.533
0.533
Institut pertanian bogor
1.000
0.833
0.706
0.684
0.654
0.621
0.621
0.621
0.621
0.621
0.621
Kelangkaan pupuk
1.000
1.000
1.000
1.000
0.917
0.917
0.824
0.789
0.704
0.704
0.704
Kelompok masyarakat tani
0.800
0.800
0.538
0.480
0.480
0.480
0.480
0.480
0.480
0.480
0.480
Laboratorium pertanian
1.000
0.750
0.700
0.700
0.667
0.591
0.591
0.536
0.536
0.536
0.536
Musim panen
0.600
0.600
0.529
0.520
0.500
0.500
0.500
0.500
0.500
0.500
0.500
Pembangunan untuk sektor pertanian
1.000
0.700
0.579
0.536
0.536
0.536
0.536
0.536
0.536
0.536
0.536
Penerapan bioteknologi di indonesia
1.000
0.833
0.529
0.464
0.464
0.464
0.464
0.464
0.464
0.464
0.464
Penerapan teknologi pertanian
1.000
1.000
0.609
0.609
0.567
0.567
0.567
0.567
0.567
0.567
0.567
Penyakit hewan ternak
0.500
0.500
0.500
0.500
0.412
0.412
0.400
0.346
0.346
0.346
0.346
Penyuluhan pertanian
1.000
1.000
0.889
0.786
0.786
0.750
0.750
0.679
0.679
0.679
0.679
Perdagangan hasil pertanian
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
Sistem pertanian organik
1.000
0.737
0.737
0.737
0.737
0.737
0.714
0.655
0.655
0.655
0.655
Petani tebu
1.000
0.800
0.667
0.667
0.667
0.667
0.667
0.654
0.654
0.621
0.621
Peternak ayam
1.000
1.000
1.000
1.000
1.000
1.000
0.867
0.850
0.850
0.792
0.792
Produk usaha peternakan rakyat
1.000
0.400
0.400
0.400
0.267
0.267
0.267
0.267
0.267
0.267
0.267
Pupuk organik
1.000
0.478
0.478
0.478
0.478
0.478
0.414
0.414
0.414
0.414
0.414
Lanjutan Riset pertanian
1.000
0.750
0.667
0.586
0.586
0.586
0.586
0.586
0.586
0.586
0.586
Swasembada pangan
1.000
0.750
0.750
0.750
0.750
0.727
0.679
0.667
0.667
0.667
0.667
Tadah hujan
0.833
0.833
0.833
0.545
0.533
0.476
0.458
0.444
0.444
0.444
0.444
Tanaman obat
1.000
1.000
1.000
0.909
0.857
0.536
0.536
0.536
0.536
0.536
0.536
Tanaman pangan
0.286
0.278
0.273
0.273
0.273
0.273
0.273
0.273
0.273
0.273
0.273
Upaya peningkatan pendapatan petani
1.000
0.833
0.292
0.292
0.292
0.292
0.292
0.292
0.292
0.292
0.292
Harga komoditas pertanian
1.000
0.875
0.52
0.519
0.519
0.519
0.519
0.519
0.519
0.519
0.519
Lampiran 8 Daftar AVP pada pengujian pembobotan TF-F1 dengan asumsi 0,1 Kueri
Nilai precision pada eleven standard recall 0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Bencana kekeringan
1.000
0.800
0.789
0.789
0.762
0.741
0.741
0.741
0.741
0.741
0.741
Dukungan pemerintah pada pertanian
1.000
0.500
0.462
0.462
0.462
0.462
0.462
0.462
0.462
0.462
0.462
Flu burung
1.000
1.000
0.929
0.929
0.929
0.929
0.929
0.900
0.900
0.870
0.840
Gabah kering giling
1.000
0.667
0.556
0.550
0.550
0.467
0.467
0.467
0.467
0.467
0.467
Gagal panen
1.000
1.000
1.000
0.833
0.833
0.833
0.833
0.833
0.833
0.833
0.833
Impor beras indonesia
1.000
1.000
1.000
1.000
1.000
0.821
0.821
0.821
0.821
0.821
0.821
Industri gula
1.000
0.800
0.800
0.769
0.769
0.769
0.667
0.577
0.577
0.577
0.577
Institut pertanian bogor
1.000
0.621
0.621
0.621
0.621
0.621
0.621
0.621
0.621
0.621
0.621
Kelangkaan pupuk
1.000
1.000
1.000
1.000
0.923
0.923
0.867
0.773
0.773
0.692
0.633
Kelompok masyarakat tani
0.800
0.800
0.500
0.480
0.480
0.480
0.480
0.480
0.480
0.480
0.480
Laboratorium pertanian
1.000
1.000
0.667
0.667
0.643
0.600
0.591
0.556
0.552
0.552
0.552
Musim panen
0.600
0.600
0.529
0.520
0.500
0.500
0.500
0.500
0.500
0.500
0.500
Pembangunan untuk sektor pertanian
1.000
0.727
0.625
0.538
0.533
0.533
0.533
0.533
0.533
0.533
0.533
Penerapan bioteknologi di indonesia
1.000
0.833
0.625
0.467
0.467
0.467
0.467
0.467
0.467
0.467
0.467
Penerapan teknologi pertanian
1.000
0.667
0.444
0.400
0.400
0.400
0.400
0.400
0.400
0.400
0.400
Penyakit hewan ternak
0.750
0.750
0.750
0.571
0.500
0.438
0.429
0.357
0.357
0.357
0.357
Penyuluhan pertanian
1.000
1.000
0.889
0.786
0.786
0.708
0.708
0.633
0.633
0.633
0.633
Perdagangan hasil pertanian
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
0.214
Sistem pertanian organik
0.722
0.722
0.722
0.722
0.722
0.722
0.643
0.643
0.643
0.643
0.643
Petani tebu
1.000
0.800
0.706
0.706
0.706
0.706
0.684
0.667
0.667
0.621
0.621
Peternak ayam
1.000
1.000
1.000
1.000
1.000
1.000
0.929
0.882
0.818
0.818
0.704
Produk usaha peternakan rakyat
1.000
0.400
0.400
0.400
0.267
0.267
0.267
0.267
0.267
0.267
0.267
Pupuk organik
0.478
0.478
0.478
0.478
0.478
0.478
0.433
0.433
0.433
0.433
0.433
29
Lanjutan Riset pertanian
1.000
0.818
0.737
0.586
0.586
0.586
0.586
0.586
0.586
0.586
0.586
Swasembada pangan
0.733
0.733
0.733
0.733
0.727
0.727
0.679
0.667
0.667
0.667
0.667
Tadah hujan
1.000
1.000
1.000
1.000
1.000
0.778
0.778
0.778
0.727
0.654
0.654
Tanaman obat
1.000
1.000
1.000
1.000
0.857
0.600
0.552
0.552
0.552
0.552
0.552
Tanaman pangan
0.286
0.278
0.273
0.273
0.273
0.273
0.273
0.273
0.273
0.273
0.273
Upaya peningkatan pendapatan petani
1.000
0.714
0.276
0.276
0.276
0.276
0.276
0.276
0.276
0.276
0.276
Harga komoditas pertanian
1.000
0.714
0.276
0.276
0.276
0.276
0.276
0.276
0.276
0.276
0.276
Lampiran 9 Antarmuka halaman utama sistem komparatif pembobotan kata
Lampiran 10 Antarmuka hasil pencarian
Lampiran 11 Antarmuka pemilihan dokumen