CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED
SELAMET SUBU
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
2
CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED
SELAMET SUBU
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
1
ABSTRACT SELAMET SUBU. Cross Language Question Answering System Using Heuristic and Rule Based Scoring. Supervised by SONY HARTONO WIJAYA. Cross Language Question Answering (CL-QAS) means that the question is expressed in another language than that in which documents from which the answer is extracted are written. The challenge therefore was to identify answers to a Indonesian question in a collection of English documents. The focus of the evaluation was on finding answers, so translation of the answer from English into Indonesian was not required. The first step on CL-QAS was the user enter question query. The used question query is limited to question type: WHO, WHERE, WHEN, and HOW MANY or HOW MUCH. The question word on query is used to obtain an answer candidate, while other words beside the question word are used to analyze the question. Parsing the query will be done for separating between question words and question sentences or keyword. This keyword will be used for feedback the document and top passage. The passage will score using heuristic and rule based method. The candidate answer then will extracted from the passage which have the highest score. The candidate answer which have the nearest distance average with the keyword will be returned as an answer for the query. Evaluation for the answer is based on four criteria: right,unsupported,wrong, and null. Experiment is do by comparing the result of passage heuristic and rule based scoring. Comparing is do by getting the result of top passage and the correct answer from those two kind of passage scoring. The heuristic scoring produced the highest percentage for right criteria 92.5%, unsupported criteria 0%, wrong criteria 7.5% and null criteria 0% whereas rule based producing for right criteria 90%, unsupported criteria 0%, wrong criteria 10%, and null criteria 0 %.
Keywords: cross language information retrieval, heuristic scoring, question answering, rule based scoring
ii
Judul Skripsi Nama NRP
: Cross Language Question Answeing System Menggunakan Pembobotan Heuristic dan Rule Based : Selamet Subu : G64096056
Disetujui Pembimbing
Sony Hartono Wijaya SKom MKom NIP 198108092008121002
Diketahui Ketua Departemen Ilmu Komputer
Dr Ir Agus Buono MSi MKom NIP 196607021993021001
Tanggal Lulus:
ii
iii
PRAKATA Alhamdulilahirobbil’alamin, segala puji syukur penulis panjatkan kehadirat Allah Subhanahuwata'ala atas segala karunia-Nya sehingga tugas akhir ini berhasil diselesaikan. Topik tugas akhir yang dipilih dalam penelitian ialah Cross Language Question Answering System Menggunakan Pembobotan Heuristic dan Rule Based. Penulis sadar bahwa tugas akhir ini tidak akan terwujud tanpa bantuan dari berbagai pihak. Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada: 1
Orang tua tercinta Bapak La Moha dan Ibu Waode Koke, saudara-saudaraku Muhammad Karim, Emy Saelan, Bone Ramadhan, dan Daud Yusuf serta segenap keluarga besar, terima kasih atas doa dan dukungan yang tiada henti.
2
Bapak Sony Hartono Wijaya SKom MKom selaku dosen pembimbing tugas akhir. Terima kasih atas kesabaran dan dukungan dalam penyelesaian tugas akhir ini.
3
Bapak Ir Julio Adisantoso MKom dan Bapak Ahmad Ridha SKom MS selaku dosen penguji, Dr Ir Agus Buono MSi MKom selaku Ketua Departemen Ilmu Komputer IPB serta seluruh dosen dan staf Departemen Ilmu Komputer FMIPA IPB.
4
Sahabat-sahabatku Suci, Deby, Om Achul, Om Al, Om Ravis, Om Pebri, Om Fredi, Om Sammy dan seluruh teman-teman X4 serta seluruh keluarga besar kosan Rian Firdaus. Terima kasih atas semangat dan kebersamaannya selama penyelesaian tugas akhir ini.
5
Seluruh pihak yang turut membantu baik secara langsung maupun tidak langsung dalam pelaksanaan tugas akhir.
Penulis menyadari bahwa dalam penulisan tugas akhir ini masih terdapat banyak kekurangan dan kelemahan dalam berbagai hal karena keterbatasan kemampuan penulis. Penulis berharap adanya masukan berupa saran atau kritik yang bersifat membangun dari pembaca demi kesempurnaan tugas akhir ini. Semoga tugas akhir ini bermanfaat.
Bogor, Maret 2012
Selamet Subu
iii
iv
RIWAYAT HIDUP Penulis dilahirkan di Kabupaten Muna, Sulawesi Tenggara pada tanggal 3 Desember 1986 dari Ayah La Moha dan Ibu Waode Koke. Penulis merupakan putra kelima dari lima bersaudara. Tahun 2005 penulis lulus dari SMA Negeri 1 Raha dan pada tahun yang sama lulus seleksi masuk Diploma IPB melalui jalur Undangan Seleksi Masuk IPB (USMI). Tahun 2008 penulis lulus dari Diploma IPB dan pada tahun 2009 diterima di Alih Jenis Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam IPB.
iv