TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA
ADI DARLIANSYAH
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA
ADI DARLIANSYAH
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
ABSTRACT ADI DARLIANSYAH. Indonesian Temporal Question Answering System. Supervised by AHMAD RIDHA. Time is an important dimension in information retrieval. Temporal expressions describe time information embedded in the documents. Therefore, extraction and normalization of temporal expressions from documents are crucial. In this research, a question answering system is implemented for temporal information processing from documents in Indonesian language based on four types of temporal question beginning with question words such as siapa (what), kapan (when), di mana (where), and berapa (how many). Implicit time references in document are first normalized and tagged manually into explicit time references. Complex temporal question is divided into simpler questions by using temporal signal detection for specific sequence of events. In order to obtain answer candidates, heuristic weighting is performed on the top passages. Answer extraction is performed using the smallest distance between query and answer candidates. A corpus containing 100 documents and 80 queries is used in this research. Answer evaluation is based on three criteria, namely, Right, Wrong, and Unsupported. The questions are used to evaluate the results of BM25 and Proximity ranking modes. The evaluation for simple temporal questions (Type 1 and 2) using BM25 and Proximity gave the same results at 85% Right answers for Type 1 and 75% for Type 2. The results for complex temporal questions (Type 3 and 4) indicated good performance. The best results were obtained by BM25 at 95% Right answers for Type 3 and 75% for Type 4, while using Proximity resulted in 85% Right answers for Type 3 and 80% for Type 4. We also used our corpus on a nontemporal question answering system by Umriadi in 2011. The results are 60%, 55%, 60%, and 40% Right answers for Type 1, 2, 3, and 4, respectively, much lower than our temporal question answering system. Therefore, temporal expression extraction and temporal signal identification are particularly important for handling questions containing temporal information. Our system is able to identify and answer the temporal questions in Indonesian language.
Keywords: bahasa Indonesia, question answering, temporal expression, temporal question
Penguji: 1 Sony Hartono Wijaya SKom MKom 2 Ir Julio Adisantoso MKom
Judul Skripsi Nama NIM
: Temporal Question Answering System Bahasa Indonesia : Adi Darliansyah : G64096001
Disetujui Pembimbing
Ahmad Ridha SKom MS NIP 19800507 200501 1 001
Diketahui Ketua Departemen Ilmu Komputer
Dr Ir Agus Buono MSi MKom NIP 19660702 199302 1 001
Tanggal Lulus:
PRAKATA Bismillahirrahmaanirrahiim. Puji dan syukur penulis panjatkan ke hadirat Allah subhanahu wata’ala atas segala rahmat dan karunia-Nya sehingga tugas akhir ini dapat diselesaikan dengan baik. Tugas akhir ini berjudul Temporal Question Answering System Bahasa Indonesia. Penulis mengucapkan terima kasih terutama kepada orang tua tercinta Bapak Sarmili Hidayat dan Ibu Sri Idayati, Kakak Wulan Anggraeni, Adik Bentar Choirul Huda, serta seluruh keluarga besar atas segala doa, nasihat dan kasih sayangnya. Terima kasih kepada Bapak Ahmad Ridha SKom MS selaku dosen pembimbing tugas akhir sekaligus pembimbing akademik atas bantuan, pengarahan dan kesabarannya selama penyelesaian tugas akhir ini, Bapak Sony Hartono Wijaya SKom MKom dan Bapak Ir Julio Adisantoso MKom selaku dosen penguji atas kritik dan sarannya, serta seluruh dosen dan staf Departemen Ilmu Komputer IPB. Rekan-rekan satu bimbingan, Mohamad Reza Pancawan dan Syahrul Fathi, serta teman-teman Ilkom X4, terima kasih atas semangat dan kebersamaan kalian. Semoga Allah subhanahu wata’ala membalas amal baik dan jasa seluruh pihak yang turut membantu dalam pelaksanaan tugas akhir. Semoga tugas akhir ini bermanfaat.
Bogor, April 2012
Adi Darliansyah
RIWAYAT HIDUP Penulis bernama lengkap Adi Darliansyah, lahir di Bogor, Jawa Barat pada tanggal 11 Oktober 1988. Penulis merupakan anak kedua dari tiga bersaudara dari pasangan Bapak Sarmili Hidayat dan Ibu Sri Idayati. Tahun 2006 penulis lulus dari SMA Negeri 1 Cibinong dan diterima di Program Keahlian Teknik Komputer, Direktorat Program Diploma IPB melalui jalur Undangan Seleksi Masuk IPB, lulus pada tahun 2009. Pada tahun yang sama, penulis melanjutkan pendidikan di Program Sarjana Alih Jenis Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam IPB.