PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA
SYAHRUL FATHI
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
PRAKATA Alhamdulilahirobbil’alamin, segala puji syukur penulis panjatkan ke hadirat Allah Subhanahuwa ta’ala atas segala karunia-Nya sehingga tugas akhir ini berhasil diselesaikan. Topik tugas akhir yang dipilih dalam penelitian adalah Pembentukan Passage dalam Question Answering System untuk Dokumen Bahasa Indonesia. Penulis ingin mengucapkan terima kasih kepada: Ibu tersayang Isma Nurmala Ghani, Ayah tercinta Ucin Muhammad Nuryasin, adikku Irvany Irsyad, dan segenap keluarga besar, terima kasih atas doa dan dukungannya. Bapak Ahmad Ridha SKom MS selaku dosen pembimbing tugas akhir. Terima kasih waktu yang telah diberikan dalam penyelesaian tugas akhir ini. Semoga amal perbuatan bapak menjadi pahala yang berkah. Bapak Sony Hartono Wijaya SKom MKom dan Bapak Ir Julio Adisantoso MKom selaku dosen penguji, dan seluruh dosen dan staf Departemen Ilmu Komputer FMIPA IPB. Teman-teman Ilkomerz angkatan 4. Adi Darliansyah dan M. Reza Pancawan selaku teman seperjuangan bimbingan. Terima kasih atas semangat dan kebersamaannya selama penyelesaian tugas akhir ini. Seluruh pihak yang turut membantu baik secara langsung maupun tidak langsung dalam pelaksanaan tugas akhir.
Bogor, April 2012
Syahrul Fathi
RIWAYAT HIDUP Penulis dilahirkan di Bogor, Jawa Barat pada tanggal 20 April 1988 dari Bapak Ucin Muhammad Nuryasin dan Ibu Isma Nurmala Ghani. Penulis merupakan putra pertama dari dua bersaudara. Tahun 2006 penulis lulus dari SMA Negeri 2 Bogor dan pada tahun yang sama lulus seleksi masuk Diploma IPB Program Keahlian Teknik Komputer melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun 2009, penulis lulus dari Diploma IPB dan pada tahun yang sama diterima di Program Alih Jenis Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam.
PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA
SYAHRUL FATHI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
ABSTRACT SYAHRUL FATHI. Passage Formation in Question Answering System for Documents in Bahasa Indonesia. Supervised by AHMAD RIDHA. Passages are used by question answering system to get pieces of relevant documents. This research compared various aspects of passages: overlapping and non-overlapping passages, sentencebased and word-based passages, and passage formation time (before and after indexing). Types of question in this research are siapa (who), di mana (where), kapan (when), and berapa (how many). For indexing and retrieval process, we used BM25 and proximity algorithms from Sphinx. Top documents or passages were re-weighted using rules to get passages containing answers candidate. Answer extraction was performed using the smallest distance between query and candidate answers. Evaluation was conducted using mean reciprocal rank and answer accuracy (four criteria: Right, Unsupported, Wrong, and Null). The best result was obtained using BM25 for two kinds of passage, namely, 20 overlapping words with 80% accuracy and 30 overlapping words with 77.5% accuracy, where both considered one tag as one word and were formed after indexing. The best result for proximity were obtained three kinds of passages, namely, 2 overlapping sentences with 77.5% accuracy, 2 non-overlapping sentences with 77.5% accuracy, and 20 overlapping words with 77.5% accuracy, they also considered one tag as one word and were formed after indexing. The average performance based on mean reciprocal rank for passage by using BM25 and Proximity are 75.1% and 76.1%, respectively. The passages formed after indexing have better accuracy which indicates retrieving relevant documents is important for question answering system. Keywords: passage retrieval, question answering, rule based, window based passage
Judul Skripsi Nama NIM
: Pembentukan Passage dalam Question Answering System untuk Dokumen Bahasa Indonesia : Syahrul Fathi : G64096063
Disetujui Pembimbing
Ahmad Ridha SKom MS NIP 19800507 200501 1 001
Diketahui Ketua Departemen
Dr Ir Agus Buono MSi MKom NIP 19660702 199302 1 001
Tanggal Lulus:
PRAKATA Alhamdulilahirobbil’alamin, segala puji syukur penulis panjatkan ke hadirat Allah Subhanahuwa ta’ala atas segala karunia-Nya sehingga tugas akhir ini berhasil diselesaikan. Topik tugas akhir yang dipilih dalam penelitian adalah Pembentukan Passage dalam Question Answering System untuk Dokumen Bahasa Indonesia. Penulis ingin mengucapkan terima kasih kepada: Ibu tersayang Isma Nurmala Ghani, Ayah tercinta Ucin Muhammad Nuryasin, adikku Irvany Irsyad, dan segenap keluarga besar, terima kasih atas doa dan dukungannya. Bapak Ahmad Ridha SKom MS selaku dosen pembimbing tugas akhir. Terima kasih waktu yang telah diberikan dalam penyelesaian tugas akhir ini. Semoga amal perbuatan bapak menjadi pahala yang berkah. Bapak Sony Hartono Wijaya SKom MKom dan Bapak Ir Julio Adisantoso MKom selaku dosen penguji, dan seluruh dosen dan staf Departemen Ilmu Komputer FMIPA IPB. Teman-teman Ilkomerz angkatan 4. Adi Darliansyah dan M. Reza Pancawan selaku teman seperjuangan bimbingan. Terima kasih atas semangat dan kebersamaannya selama penyelesaian tugas akhir ini. Seluruh pihak yang turut membantu baik secara langsung maupun tidak langsung dalam pelaksanaan tugas akhir.
Bogor, April 2012
Syahrul Fathi
RIWAYAT HIDUP Penulis dilahirkan di Bogor, Jawa Barat pada tanggal 20 April 1988 dari Bapak Ucin Muhammad Nuryasin dan Ibu Isma Nurmala Ghani. Penulis merupakan putra pertama dari dua bersaudara. Tahun 2006 penulis lulus dari SMA Negeri 2 Bogor dan pada tahun yang sama lulus seleksi masuk Diploma IPB Program Keahlian Teknik Komputer melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun 2009, penulis lulus dari Diploma IPB dan pada tahun yang sama diterima di Program Alih Jenis Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam.