BAB 1 PENDAHULUAN 1.1. Latar belakang Dengan berkembangnya teknologi dewasa ini, segala sesuatu harus dilakukan secara cepat, begitu juga dengan pembaca yang ingin secara cepat mengetahui keseluruhan infomasi penting di dalam dokumen. Dengan demikian pembaca mengetahui kalimat utama pada teks yang berisi informasi-informasi penting dalam dokumen tersebut. Pembaca cenderung lebih menyukai membaca kalimat utama dokumen daripada membaca keseluruhan isi dalam dokumen[2]. Ketersedian
informasi
yang
semakin
berkembang
pesat
menandakan bahwa akses untuk memperoleh kalimat utama yang koheren menjadi hal yang vital. Dengan adanya pemilihan kalimat utama, diharapkan pembaca dapat secara cepat dan mudah memahami makna dari sebuah dokumen tanpa harus membaca keseluruhan teks. Hal ini dapat menghemat waktu pembaca karena dapat menghindari pembacaan teks yang tidak relevan dengan informasi yang diharapkan oleh pembaca, terutama ketika sangat banyak infomasi yang tersedia di internet[1]. MMR (Maximum Marginal Relevance)
yaitu merupakan salah
satu metode pemilihan kalimat utama teks otomatis sederhana akan tetapi mempunyai hasil pengujian cukup tinggi dibandingkan dengan pemilihan kalimat utama manual. Data yang berupa artikel akan mempunyai keluaran yang berupa kalimat mana yang menyatakan kalimat opini dan kalimat fakta. Berdasarkan eksperimen, metode MMR(Maximum Marginal Relevance) terbukti dapat digunakan secara efektif untuk memilihan ide pokok berita secara otomatis dengan recall 60%, precision 77% dan fmeasure 66%. metode MMR(Maximum Marginal Relevance)
yang
sederhana menghasilkan pengujian diatas rata-rata dalam proses pemilihan kalimat utama membuat metode ini menarik untuk digunakan sebagai salah satu metode ekstraksi ide pokok [3].
1
Dalam tugas akhir ini akan dibuat aplikasi otomatisasi pemilihan kalimat utama dalam dokumen tunggal bahasa indonesia dengan metode maximum marginal relevance. 1.2. Rumusan masalah Dalam melakukan penelitian ini, ada beberapa rumusan masalah yang ingin diselesaikan. Antara lain sebagai berikut : a.
Bagaimana menghitung bobot dari kalimat dalam sebuah paragraf ataupun keseluruhan teks dengan melihat total kata yang sama dengan kalimat pada list keyword, frekuensi kata pada kalimat, posisi kalimat pada paragraf dan total relasi antar kalimat.
b. Bagaimana menghasilkan kalimat utama dengan menggunakan metode MMR(Maximum Marginal Relevance). 1.3. Batasan masalah Adapun batasan-batasan permasalahan yang akan dicakup dalam Tugas Akhir ini antara lain : a. Paragraf dan dokumen yang dimasukkan adalah berbahasa indonesia dengan bentuk deduktif, induktif dan campuran, bukan paragraf dan dokumen yang tidak memiliki kalimat utama. b. Input harus berupa dokumen tunggal berformat doc,docx,txt. c. Judul diambil untuk digunakan menjadi keywords. d. Kalimat harus diakhiri dengan tanda (.), (?), atau (!), bukan dengan tanda (:), (;), atau (,). e. Proses dalam dokumen tunggal dibatasi oleh paragraf-paragraf. f. Anonim dan Sinonim dihitung satu kata. g. Susunan kalimat sudah dalam bentuk baku sesuai EYD Bahasa Indonesia. h. Menggunakan bahasa pemrograman JAVA i. Menggunakan database SQLite. 1.4. Tujuan Adapun tujuan yang ingin dicapain dalam Tugas Akhir ini adalah melakukan ekstraksi ide pokok menggunakan metode MMR (Maximum Marginal Relevance). 2
1.5. Metodologi Metodologi proses pelaksanaan Tugas Akhir ini terdiri dari studi literatur, analisa desain sistem, implementasi perangkat lunak, uji coba dan evaluasi serta penyusunan laporan Tugas Akhir a. Studi Literatur Pada tahap ini dilakukan penggalian teori-teori yang relevan dengan permasalah yang sedang di kaji. Studi literatur ini meliputi pemahaman mengenai metode Text Mining serta metode MMR(Maximum Marginal Relevnce) untuk diterapkan dalam ekstraksi dan perankingan kalimat. b. Pengumpulan Data Tahap berikutnya yaitu melakukan pengumpulan data-data yang akan digunakan untuk proses ekstraksi dan perangkingan kalimat. Dalam hal ini data yang dikumpulkan merupakan data tekstual dari artikelartikel berita, kesehatan dan lainnya. c. Analisis dan Desain Sistem Pada tahap ini dilakukan analisa mengenai proses ekstraksi dan perankingan kalimat yang akan dijalankan oleh sistem yang digambarkan dengan menggunakan diagram, agar alur proses sistem dapat lebih mudah dipahami. d. Implementasi Melakukan desain sistem dengan menggunakan diagram UML. Setelah itu, membangun aplikasi Otomatisasi Pemilihan Kalimat Utama Dalam Dokumen Tunggal Bahasa Indonesia Dengan Metode Maximum Marginal Relevance. e. Pengujian Pada tahap ini dilakukan pengujian terhadap sistem yang telah dibuat. Pengujian dilakukan berdasarkan hasil ekstraksi dan perangkingan kalimat oleh sistem. Pengujian ini dilakukan dengan membandingan hasil pemilihan kalimat utama manual dengan hasil pemilihan kalimat utama otomatis dalam aplikasi program dan menghasilkan seberapa akurasi pemilihan kalimat utama tersebut. 3
f. Pembuatan laporan Tahap ini dilakukan untuk mendapatkan dokumentasi hasil pemilihan kalimat utama sehingga dapat dipergunakan untuk mengembangan atau penelitian lanjutan. 1.6 Sistematika Penulisan Sistematika penulisan laporan tugas akhir ini di bagi dalam beberapa bab antara lain sebagai berikut: BAB I : PENDAHULUAN Bab ini menjelaskan mengenai latar belakang pengambilan Tugas Akhir yang berjudul “Otomatisasi Pemilihan Kalimat Utama Dalam Dokumen Tunggal Bahasa Indonesia Dengan Metode Maximum Marginal Relevance”, rumusan masalah, batasan masalah, tujuan penelitian, metodologi dan sistematika penulisan. BAB II : LANDASAN TEORI Bab ini menjelaskan mengenai teori-teori yang relevan dengan permasalahan yang dikaji, sehingga dapat mendukung secara teknis pengerjaan aplikasi dengan mengimplementasikan metode text mining dan metode Maximum Marginal Relevance dalam melakukan ekstraksi. BAB III : ANALISA DAN PERANCANGAN Bab ini menjelaskan perancangan aplikasi yang akan di buat. Perancangan tersebut
meliputi
perancangan
data,
perancangan
arsitektur
dan
perancangan antarmuka dari sistem. Dari bab ini diharapkan dapat memberikan gambaran yang jelas untuk implementasi coding program dan pengujian. BAB IV : IMPLEMENTASI DAN UJI COBA Bab ini merupakan implementasi atau pembuatan aplikasi, aplikasi yang dibuat sesuai dengan perancangan sistem yang dibuat pada bab III. Pada bab ini akan dilakukan pengujian dimana hasil ekstraksi menggunakan
4
Metode Hitung Bobot akan dibandingkan degan hasil ekstraksi pada Metode Maximum Marginal Relevance. BAB V : PENUTUP Bab ini berisi kesimpulan yang dapat di ambil dari aplikasi yang telah di buat serta saran-saran membangun yang dapat digunakan untuk pengembangan sistem di masa mendatang.
5