SISTEM PENCARIAN AYAT AL-QUR’AN BERDASARKAN TERJEMAHAN BAHASA INGGRIS DENGAN PORTER STEMMER ENHANCEMENT MENGGUNAKAN MODEL RUANG VEKTOR
TUGAS AKHIR Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Pada Jurusan Teknik Informatika
Oleh:
ANITA 10851001575
UIN SUSKA RIAU
FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU PEKANBARU 2014
SISTEM PENCARIAN AYAT AL-QUR’AN BERDASARKAN TERJEMAHAN BAHASA INGGRIS DENGAN PORTER STEMMER ENHANCEMENT MENGGUNAKAN MODEL RUANG VEKTOR ANITA 10851001575 Tanggal Sidang : 12 Juni 2014 Periode Wisuda : Oktober 2014
Jurusan Teknik Informatika Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif kasim Riau
ABSTRAK Pencarian dokumen secara digital menjadi kegiatan yang rutin dilakukan oleh berbagai kalangan dewasa ini. Pencarian ayat Al-Qur’an terjemahan bahasa Inggris berbasis Information Retrieval (temu kembali informasi) juga telah diterapkan di beberapa penelitian. Tahapan dalam information retrieval yang dilakukan terhadap koleksi dokumen atau corpus terdiri dari text operation (pengoperasian text), indexing (pengindeksan), dan weighting (pembobotan). Tahapan text operation terdiri dari penghapusan karakter/mark-up, penghapusan stopwords, dan stemming. Stemming adalah proses pengembalian kata ke bentuk dasarnya. Algoritma Porter digunakan untuk melakukan proses stemming dalam bahasa Inggris. Namun, algoritma ini hanya melakukan pemotongan akhiran (suffix) yang terdapat pada kata berimbuhan, dan mengabaikan jika pada kata tersebut terdapat awalan (prefix) sehingga proses stemming yang dilakukan tidak maksimal. Pada penelitian ini dilakukan peningkatan (enhancement) terhadap algoritma Porter dengan cara melakukan pengecekan kembali setelah suatu term atau kata mengalami proses pemotongan akhiran dan melakukan pemotongan awalan jika ditemukan. Dengan menggunakan model ruang vektor, hasil pencarian dari sistem ini menjadi terurut berdasarkan nilai relevansi tertinggi yang diperoleh dari dokumen terhadap query pengguna. Pengujian performasi dilakukan dengan menggunakan precision dan recall dengan melakukan pencarian query yang mengandung imbuhan terutama awalan dan hasil akhirnya diperoleh rata-rata nilai precision 0.8 (80%) dan recall 1 (100%). Ini menunjukkan bahwa hasil pencarian dari query yang diujikan telah sesuai dan memenuhi kebutuhan pengguna. Kata kunci: Model Ruang Vektor, Porter Stemmer Enhancement, Precision, Recall, Temu kembali Informasi.
vii
QURAN VERSE SEARCH SYSTEM BASED ON ENGLISH TRANSLATION WITH PORTER STEMMER ENHANCEMENT USING VECTOR SPACE MODEL
ANITA 10851001575 Date of Exam : 12th June 2014 Graduation Ceremony Period : October 2014
Informatics Engineering Department Faculty of Science and Technology State Islamic University of Sultan Syarif Kasim Riau
ABSTRACT Documents searching have become a routine of various circles nowadays. Searching on English translation of Quran verse based on Information retrieval has also been applied in some studies. The phases in information retrieval that are done towards the documents collection or corpus consist of text operation, indexing, and weighting. Phases of text operation consist of mark-up removing, stop-words removing, and stemming. Stemming is a process to return the root of words. Porter algorithm is applied to do stemming process in English. However, this algorithm merely cut the suffix in a word, and will disregard if in that word found prefix so that stemming process won’t be maximal. In this study applied enhancement of Porter algorithm by re-checking a term after it go through suffix cutting processing and if found prefix, it will be cut. By using Vector space model, the results of documents searching could be sequenced based on highest relevancy values (descending) with user’s query. Performance trial is done using precision and recall by searching queries which contain affix, prefix in particular and the final results were obtained average value of precision 0.8 (80%) and recall 1 (100%). Those show that searching results of the trial queries have been relevant with user’s needs. Keywords: Information Retrieval, Porter Stemmer Enhancement, Precision, Recall, Vector Space Model.
viii
KATA PENGANTAR
Alhamdulillaahi Robbil’alamin, penulis ucapkan puji dan syukur kehadirat Allah SWT atas segala limpahan rahmat dan karunia-Nya yang diberikan sehingga penulis dapat menyelesaikan penelitian sekaligus penulisan laporan tugas akhir ini. Allahumma sholli’ala Muhammad wa’ala ali sayyidina Muhammad, yang tidak lupa penulis haturkan juga untuk junjungan alam, kekasih Allah, Rasul Allah, dan tauladan kita yakni Nabi Muhammad SAW. Laporan tugas akhir ini merupakan salah satu prasyarat untuk memenuhi persyaratan akademis dalam meraih gelar kesarjanaan di Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Sultan Syarif Kasim Riau (UIN SUSKA Riau). Selama menyelesaikan tugas akhir ini, penulis telah banyak mendapatkan bantuan, bimbingan, dan petunjuk dari banyak pihak baik secara langsung maupun tidak langsung. Untuk itu dalam kesempatan ini penulis ingin mengucapkan terimakasih yang sebesar-besarnya kepada: 1. Prof. Dr. H. Munzir Hutami, M.A, selaku Rektor Universitas Islam Negeri Sultan Syarif Kasim Riau. 2. Dra. Yenita Morena, M.Si, selaku Dekan Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau. 3. Elin Haerani, ST, M.Kom, selaku Ketua Jurusan Teknik Informatika, Fakultas Sains dan Teknologi. 4. Surya Agustian, ST., M.Kom, Selaku dosen pembimbing dalam tugas akhir. Terima kasih banyak atas dukungan, ilmu serta semangat yang telah diberikan selama membimbing penulis mengerjakan Tugas Akhir ini. 5. Jasril, S.Si, M.Sc., selaku dosen penguji 1 yang telah membari banyak masukan, kritik dan saran kepada penulis dalam penyempurnaan Tugas Akhir ini.
ix
6. Lestari Handayani, ST, M.Kom., selaku penguji 2 yang juga telah banyak memberi masukan, kritik dan saran kepada penulis dalam penyempurnaan Tugas Akhir ini. 7. M. Affandes, ST, MT., selaku koordinator tugas akhir yang telah memberi banyak kemudahan bagi penulis. 8. Keluarga penulis, Bapak dan Mamak, orang tua paling hebat dan sabar yang tidak pernah berhenti berdoa untuk keberhasilan ananda. Kakak dan Abang, Santi, Rio, Dodi dan Nani yang selalu memberi motivasi dan dukungan. Ega, Razik, Abe dan Abi, keponakan yang paling imut yang selalu membuat penulis tersenyum. 9. Sahabat-sahabat yang selalu mendoakan dan mendukung penulis, Uci, Opik, Kiki, Putri Nuzul, Dea, Widya, Rita, Rini, Mia, Ika, Emil, Anggi, Yuliska Yuli, Bang Oni, Agus, Dika. Terima kasih untuk semuanya. 10. Teman-teman MatiC 08, Putri, Dianing, Lia, Sepri, Rika, Heffy, Lesti, Lidya, Vera, Helmi, Ersad, Wahyu, Ridho, Nicky, Suhendi, Ikhwanul, Verdy, Panora, Ardian, Agung, dan teman-teman lainnya. 11. Dan terakhir, terimakasih pula penulis ucapkan untuk Almamater Teknik Informatika, Fakultas Sains dan Teknologi, UIN Sultan Syarif Kasim Riau serta pihak-pihak lain yang tidak dapat penulis sebutkan satu persatu. Terimakasih banyak atas bantuan dan dukungannya yang berharga. Akhirnya, penulis menyadari dalam penulisan laporan ini masih terdapat kekurangan. Oleh karena itu, saran dan kritik sangat penulis harapkan untuk kemajuan penulis secara pribadi. Terimakasih.
Pekanbaru, Juni 2014
Penulis
x
DAFTAR ISI HALAMAN JUDUL LAPORAN................................................................. i LEMBAR PERSETUJUAN ......................................................................... ii LEMBAR PENGESAHAN .......................................................................... iii LEMBAR HAK ATAS KEKAYAAN INTELEKTUAL............................. iv LEMBAR PERNYATAAN.......................................................................... v LEMBAR PERSEMBAHAN ....................................................................... vi ABSTRAK ................................................................................................... vii ABSTRACT.................................................................................................... viii KATA PENGANTAR ................................................................................. ix DAFTAR ISI................................................................................................. xi DAFTAR GAMBAR .................................................................................... xiv DAFTAR TABEL......................................................................................... xvi DAFTAR LAMPIRAN................................................................................. xvii DAFTAR SIMBOL ..................................................................................... xviii DAFTAR ISTILAH ...................................................................................... xix BAB I PENDAHULUAN............................................................................. I-1 1.1. Latar Belakang ........................................................................... I-1 1.2. Rumusan Masalah ...................................................................... I-3 1.3. Batasan Masalah ....................................................................... I-3 1.4. Tujuan Penelitian ...................................................................... I-3 1.5. Sistematika Penulisan ............................................................... I-3 BAB II LANDASAN TEORI....................................................................... II-1 2.1. Information retrieval (IR) .......................................................... II-1 2.1.1. Pengertian IR .................................................................. II-1 2.1.2. Proses Temu Kembali (The Retrieval Process)............... II-2 2.1.3. Bagian-bagian IR ............................................................ II-3 2.1.3.1. Text Operation / Preprocessing ........................ II-3
xi
2.1.3.2. Indexing ............................................................. II-12 2.1.3.3. Query Operation ................................................ II-13 2.1.3.4. Searching .......................................................... II-13 2.1.3.4. Ranking .............................................................. II-14 2.2. Pemodelan Pada IR ................................................................... II-14 2.2.1. Model Boolean ................................................................ II-14 2.2.2. Model Probabilistik ........................................................ II-15 2.2.3. Model Ruang Vektor ...................................................... II-15 2.2.3.1. Pembobotan Terhadap Term .............................. II-16 2.2.3.2. Rumus Relevansi .............................................. II-16 2.3. Pengukuran Performansi Information Retrieval System ........... II-18 BAB III METODOLOGI PENELITIAN ..................................................... III-1 3.1. Identifikasi Masalah ................................................................... III-1 3.2. Perumusan Masalah ................................................................... III-2 3.3. Studi Literatur ............................................................................ III-2 3.4. Analisa Sistem............................................................................ III-2 3.5. Perancangan Sistem .................................................................. III-5 3.6. Implementasi Sistem ................................................................. III-5 3.7. Pengujian Sistem ........................................................................ III-5 3.8. Kesimpulan Dan Saran .............................................................. III-6 BAB IV ANALISA DAN PERANCANGAN.............................................. IV-1 4.1. Analisa Sistem............................................................................ IV-1 4.1.1. Analisa Proses terhadap Corpus...................................... IV-2 4.1.1.1. Text Operation .................................................. IV-3 4.1.1.2. Indexing ............................................................. IV-10 4.1.1.3. Pembobotan (weighting) ................................... IV-12 4.1.2. Analisa Proses terhadap Query ........................................ IV-18 4.1.2.1. Text Operation ...................................................... IV-18 4.1.2.2. Pembobotan Query ................................................ IV-19 4.1.2.3. Normalisasi Bobot Query ..................................... IV-19
xii
4.1.3. Perhitungan Nilai Relevansi Dokumen Terhadap Query Dan Perangkingan ........................................................... IV-19 4.2. Perancangan Sistem .................................................................. IV-20 4.2.1. Perancangan Struktur Menu............................................. IV-20 4.2.2. Perancangan Pseudo Code ............................................... IV-21 BAB V IMPLEMENTASI DAN PENGUJIAN ........................................... V-1 5.1. Implementasi ............................................................................. V-1 5.1.1. Lingkungan Implementasi ............................................... V-1 5.1.2. Hasil Implementasi ......................................................... V-1 5.2. Pengujian ................................................................................... V-8 5.2.1. Rencana Pengujian ........................................................... V-8 5.2.2. Hasil Pengujian ............................................................... V-8 BAB VI PENUTUP ...................................................................................... VI-1 6.1. Kesimpulan ............................................................................... VI-1 6.2. Saran .......................................................................................... VI-1 DAFTAR PUSTAKA LAMPIRAN DAFTAR RIWAYAT HIDUP
xiii