BAB I PENDAHULUAN 1.1
Latar Belakang
Fiqih berarti paham atau mengerti, merupakan salah satu bagian dari domain agama. Hukum mempelajarinya adalah fardu ’ain bagi setiap kaum muslimin (Rasjid, 2013). Pemanfaatan internet sebagai media untuk mengakses informasi terus meningkat jumlah penggunanya. Dalam domain agama, orang cenderung bertanya kepada ahli (ustadz atau ulama) melalui situs-situs tanya jawab yang tersedia di internet daripada membaca buku-buku klasik yang ada (Fikri and Purwarianti, 2012). Ketersediaan ahli untuk menjawab pertanyaan-pertanyaan yang diajukan pengguna seringkali terbatas jumlahnya, sehingga diperlukan sistem question answering (QA) yang dapat menjawab pertanyaan secara otomatis. Sistem QA juga diperlukan karena kemampuannya dalam memahami bahasa alami dan dapat menyajikan jawaban yang ringkas dan tepat (Sundblad, 2007). Menurut Dwivedi and Singh (2013) usaha untuk memahami pertanyaan dalam bahasa alami merupakan salah satu tantangan dalam sistem QA. Pemahaman terhadap pertanyaan pengguna merupakan hal yang sangat penting dalam memberikan jawaban yang benar (Zhang and Lee, 2003). Berbagai pendekatan telah dilakukan dalam penelitian-penelitian sebelumnya untuk meningkatkan kemampuan sistem QA. Menurut Kalaivani and Duraiswamy (2012) dan Dwivedi and Singh (2013) pendekatanpendekatan dalam sistem QA dapat dibagi menjadi tiga bagian, yakni pendekatan statistical atau pendekatan machine learning, pendekatan pattern maching atau pendekatan template based, dan pendekatan linguistic atau pendekatan knowledge based. Sedangkan, komponen-komponenen penyusun sistem QA adalah question classification, information retrieval, dan answer extraction (Allam and Haggag, 2012). Pendekatan machine learning dalam mengembangkan sistem QA dilakukan oleh Wang et al. (2009); Mollaei (Rahati-Quchani); Xu (2012). Beberapa metode yang digunakan dalam pendekatan machine learning adalah k-Nearest Neighbors, Naive Bayes, Decision Tree, dan SNoW. Berbagai penelitian juga dilakukan untuk menemukan metode klasifikasi terbaik dengan membandingkan metode-metode klasifikasi yang ada. Hasil penelitian Zhang and Lee (2003) dan Wang et al. (2009) menunjukkan algoritma SVM memiliki tingkat akurasi lebih baik dalam melakukan
1
2
klasifikasi pertanyaan dibandingkan dengan metode-metode lain. Pengembangan sistem QA dalam bahasa Indonesia yang menggunakan pendekatan machine learning dilakukan oleh Purwarianti et al. (2007). Menurut Dwivedi and Singh (2013) keunggulan pendekatan machine learning adalah kemampuannya dalam melakukan klasifikasi pertanyaan, namun memiliki kelemahan dalam proses sintaksis dan semantik. Pendekatan template based dilakukan oleh Wang (2010); Unger (2012), juga dilakukan oleh Bendi (2010), dan Andri (2011). Pendekatan template based memiliki keunggulan berupa kecepatan proses dalam me-retrieve (mengembalikan) jawaban, namun memiliki kelemahan dalam proses semantik karena proses pencarian berdasarkan pencocokan string. Selain menggunakan template based sebagai question process penelitian Bendi (2010) dan Andri (2011) juga memanfaatkan ontology sebagai knowledge based untuk merepresentasikan pengetahuan. Upaya pengembangan sistem QA juga dilakukan oleh Suryawan (2013) dengan menggunakan pendekatan linguistic atau pendekatan knowledge based dengan memanfaatkan ontology untuk membangun pengetahuan. Kelebihan pemanfaatan ontology yang dilakukan oleh Suryawan (2013) adalah kemampuan sistem dalam melakukan analisa sintaksis dan semantik karena pertanyaan-pertanyaan dapat diterjemahkan secara langsung menjadi bahasa query. Kekurangan pendekatan linguistic (Dwivedi and Singh, 2013) adalah membutuhkan waktu yang lama dalam membangun pengetahuan. Penelitian ini mengusulkan pendekatan machine learning dengan menggunakan metode Support Vector Machine (SVM) untuk melakukan klasifikasi pertanyaan, serta memanfaatkan ontology sebagai basis pengetahuan untuk merealisasikan pengetahuan fiqih. Domain masalah dalam penelitian adalah permasalahan fiqih. Penelitian ini diharapkan dapat menghasilkan sistem QA yang dapat memahami pertanyaan yang diajukan sehingga mampu memberikan jawaban dengan tepat. 1.2
Rumusan Masalah
Berdasarkan latar belakang di atas, rumusan masalah dalam penelitian ini adalah sebagai berikut : 1. Bagaimana menghasilkan model yang dapat mengklasifikasi pertanyaan dengan menggunakan algoritma Support Vector Machine (SVM). 2. Bagaimana membangun ontology yang dapat merepresentasikan pengetahuan
3
fiqih. 3. Berdasarkan tipe pertanyaan yang dihasilkan oleh SVM, bagaimana menerjemahkan pertanyaan menjadi query untuk mengambil pengetahuan fiqih dalam ontology. 1.3
Batasan Masalah
Berdasarkan rumusan masalah tersebut, beberapa batasan masalah dibuat dalam penelitian ini. Batasan-batasan masalah antara lain: 1. Domain masalah dalam penelitian ini adalah ilmu fiqih permasalahan thaharah. 2. Tanya jawab dalam sistem QA fiqih menggunakan Bahasa Indonesia baik berupa kalimat tanya maupun kalimat perintah. 3. Pertanyaan-pertanyaan yang dapat diproses oleh sistem QA fiqih adalah berupa: (a) Pertanyaan faktual, bukan perhitungan matematika. (b) Kalimat tunggal bukan kalimat majemuk bertingkat yang ditandai dengan konjungsi (kata penghubung dan, atau, serta, tanda baca “,”). (c) Bukan kalimat pertentangan, misalnya “fardhu wudhu bukan sunat wudhu”, “bukan fardhu wudhu”, “cara wudhu selain sunat” dan sebagainya 4. Klasifikasi pertanyaan menggunakan metode SVM yang diimplementasikan menggunakan LibSVM. 5. Sumber pengetahuan fiqih diperoleh dari buku "Ensiklopedi Fiqih Islam Fiqih Sunnah 1”, “Fiqih Islam”, dan “Seri Fiqih Kehidupan” serta dari sumber internet yaitu www.konsultasisyariah.com dan www.rumahfiqih.com. 1.4
Tujuan dan Manfaat Penelitian
Tujuan dari penelitian ini adalah untuk mengetahui kemampuan sistem QA fiqih dengan menggunakan metode SVM dan ontology dalam memahami pertanyaan yang diajukan. Adapun manfaat yang diharapkan dalam penelitian Question Answering (QA) fiqih adalah sebagai berikut:
4
1. Dengan adanya sistem QA fiqih ini diharapkan dapat membantu dan memudahkan pengguna dalam mencari informasi dan mempelajari ilmu fiqih. 2. Diharapkan dapat memberi kontribusi (referensi) terhadap peneliti dan pengembang sistem QA berbasis ontology dimasa mendatang khususnya QA permasalahan fiqih bahasa Indonesia. 1.5
Metodologi Penelitian Metodologi yang digunakan pada penelitian ini sebagai berikut:
1. Studi literatur Studi literatur digunakan dengan mengumpulkan dan mempelajari literatur baik dari jurnal, internet, buku teks atau karya-karya ilmiah yang terkait paradigma sistem question answering serta pemanfaatan ontology dalam merealisasikan pengetahuan baik dari aspek teoritis, metodologi, maupun aspek penerapannya dalam teknologi semantik web. 2. Pengumpulan data Pada tahap ini, dilakukan pengumpulan data yang dapat digunakan dalam mengembangkan sistem QA fiqih. Pengumpulan data tentang pengetahuan fiqih diperoleh dari buku Ensiklopedia Fiqih karya Sabiq (2006). Kosakata bahasa Indonesia yang digunakan dalam pengolahan bahasa alami diperoleh dari literatur yang berkaitan dengan tata bahasa Indonesia. 3. Analisa dan perancangan sistem Sebelum merancang sistem QA fiqih, dilakukan analisa permasalahan secara bertahap. Tahap awal dari analisa dan perancangan sistem adalah analisa kebutuhan sistem berupa tipe pertanyaan pengguna yang disampaikan dengan menggunakan bahasa Indonesia. Selanjutnya adalah analisa dan perancangan ontology sebagai basis pengetahuan fiqih. Perancangan antar muka pengguna merupakan tahap akhir dari analisa dan perancangan sistem. 4. Implementasi sistem Dalam membangun sistem QA Fiqih berbasis web, bahasa pemrograman java dan java server page (JSP) digunakan untuk mengimplementasikan aplikasi dengan menggunakan editor Netbeans 8.0 pada sistem QA. Untuk pembangunan
5
basis pengetahuan ontology menggunakan bahasa OWL dengan bantuan tools Protege 4.3, sedangkan dalam proses answer extraction digunakan OWL API untuk mengeksekusi queri pengguna. 5. Pengujian sistem Pengujian dilakukan terhadap dua komponen dalam sistem QA fiqih, yakni: pengujian akurasi klasifikasi pertanyaan dan pengujian terhadap kemampuan sistem dalam memberikan jawaban atas pertanyaan pengguna. Pengujian akurasi klasifikasi pertanyaan dengan menggunakan metode Cross Validation, sedangkan pengujian terhadap kemampuan sistem dalam memberikan jawaban dilakukan dengan dua pendekatan, yaitu: pengujian kualitatif dan pengujian kuantitatif. Pengujian kualitatif dilakukan berdasarkan kemampuan sistem dalam memahami pertanyaan pengguna, sedangkan pengujian kualitatif dilakukan untuk mengetahui perbandingan jumlah pertanyaan yang mampu dijawab dengan benar dan jumlah pertanyaan yang tidak dapat dijawab dengan benar oleh sistem. 1.6
Sistematika Penulisan
Penulisan laporan penelitian ini dibagi mejadi 7 (tujuh) bab. Pembagian tersebut dapat dijelaskan dengan struktur sebagai berikut : 1. BAB I PENDAHULUAN Bab ini berisi tentang latar belakang masalah, batasan masalah, perumusan masalah, manfaat penelitian, tujuan penelitian, tinjauan pustaka, model penelitian dan sistematika penulisan. 2. BAB II TINJAUAN PUSTAKA Bab ini berisi tentang hubungan penelitian-penelitian yang telah dilakukan sebelumnya dengan penelitian ini. 3. BAB III LANDASAN TEORI Bab ini berisi uraian tentang teori-teori yang digunakan dengan penelitian ini. Teori-teori yang diuraikan dalam bab ini terkait dengan pengolahan bahasa alami dan teori klasifikasi pertanyaannya, teori semantik web termasuk didalamnya teori tentang question answering (QA) dan teori ontology, serta teori tentang pemanfaatan OWL API dalam memproses query.
6
4. BAB IV ANALISIS DAN RANCANGAN SISTEM Bab ini akan diurakan spesifikasi kebutuhan sistem dan perancangan ontology fiqih, perancangan klasifikasi pertanyaan, perancangan aplikasi sistem QA dan perancangan antar muka pengguna. 5. BAB V IMPLEMENTASI Bab V berisi tentang implementasi dari perancangan pada bab sebelumnya yakni implementasi ontology fiqih dengan menggunakan tool Protege, implementasi algoritma SVM dengan menggunakan libSVM untuk mengklasifikasi pertanyaan, serta implementasi sistem QA fiqih dengan bahasa pemrograman JAVA dan JSP. 6. BAB VI HASIL PENELITIAN DAN PEMBAHASAN Bab ini akan dijelaskan hasil penelitian yang diperoleh dalam penelitian yang disusun secara sistematis dan disertai alasan yang rasional tentang masalah penelitian. 7. BAB VII KESIMPULAN DAN SARAN Bab ini berisi kesimpulan berdasarkan pada implementasi dan uraian-uraian yang diperoleh sebelumnya serta saran untuk perbaikan dan pengembangan QA dimasa mendatang.