BAB I PENDAHULUAN
1.1 Latar Belakang Perkembangan sebuah informasi berbanding lurus dengan tingginya laju teknologi pada saat ini, ketersediaan dan perkembangan dari informasi yang berbentuk text digital beserta isinya merupakan salah satu manfaat yang bisa kita dapatkan dengan adanya teknologi tersebut. Metode baru harus ditemukan untuk bisa mengkonsumsi informasi secara cepat dan dimengerti, terutama ketika waktu menjadi sebuah pertimbangan dalam menentukan ukuran untuk mengkonsumsi sebuah informasi (resource) Salah satu metode yang diterima dan berkembang pada saat ini yaitu, Automatic Text Summarization. Sebagai salah satu metode untuk menterjemahkan dan mengambil intisari dari sebuah dokumen secara cepat dengan mengeliminasi dan menfilter informasi yang tidak relevan dari sebuah resources. Automatic Text Summarization memungkinkan pengguna untuk mendapatkan intisari atau ringkasan dari informasi yang dibutuhkan, walaupun ringkasan tersebut bisa juga dilakukan dengan menggunakan metode manual, namun terdapat beberapa kendala yang akan dihadapi yaitu masalah waktu dan memerlukan pemahaman baik yang hanya bisa dilakukan oleh expert (author, narator, editor), dan berdasarkan hasil penelitian yang dilakukan oleh Department of Computer Science, University of California Los Angeles, USA, meringkas secara manual juga dipengaruhi oleh faktor humanly seperti, latar belakang dan pemahaman yang dimiliki oleh Abstractor (author, narator, editor), sehingga akan sulit untuk mendapatkan ringkasan dari dokumen secara akurat dan konsisten. Automated Summaries adalah konsisten yang tidak dipengaruhi oleh faktor luar (humanly) dalam mendapatkan intisari atau ringkasan informasi dan membantu pengguna dalam mendapatkan informasi yang dibutuhkan secara akurat.
1
2
Berdasarkan kenyataan di atas maka dilakukan penelitian dengan topik “Indonesian Language Automatic Summarizer For a Single Document” atau selanjutnya disingkat dengan INASum”. INASum merupakan aplikasi pertama di Indonesia untuk meringkas sebuah dokumen dengan menggunakan bahasa Indonesia, dimana metode yang digunakan adalah men-generate sebuah dokumen dalam format text yang akan dibangun intisarinya berdasarkan kata-kata kunci di setiap paragraf kalimat, sehingga informasi yang dihasilkan adalah informasi yang relevan sesuai dengan kebutuhan pengguna. Aplikasi INASum ini dibangun dengan toolkit pemrogramman Delphi7 dan sebagai perangkat basis datanya, dipilih Absolute Database. 1.2. Rumusan Masalah Permasalahan yang menjadi acuan dalam pembuatan tugas akhir ini adalah sebagai berikut : 1. Belum adanya aplikasi untuk meringkas sebuah dokumen dengan input dan output dalam bahasa indonesia. 2. Munculnya permasalahan dalam meringkas sebuah dokumen dengan metode manual seperti adanya faktor internal dari seorang abstractor dalam meringkas sebuah dokumen sehingga output yang dihasilkan menjadi tidak konsisten dan akurat. 1.3. Tujuan Pembuatan Tujuan pembuatan tugas akhir ini dijabarkan dalam poin-poin khusus sebagai berikut: 1. Membuat suatu perangkat lunak INASum dengan kemampuan untuk melakukan Ekstraksi sebuah dokumen dengan input dan output dalam bahasa Indonesia. 2. Membuat sebuah aplikasi yang dapat meringkas sebuah dokumen secara independen berdasarkan Frasa Bahasa Indonesia
3
1.4. Batasan Masalah Batasan masalah untuk pelaksanaan Tugas Akhir ini adalah sebagai berikut: 1. Aplikasi ini digunakan pada single dokumen, dengan asumsi dokumen sudah diubah kedalam teks digital dengan menggunakan bahasa indonesia dan sudah dalam bentuk format text (.txt). 2. Aplikasi ini berdiri dan dibangun pada perangkat komputer stand alone, dengan basis sistem operasi Windows. 3. Aplikasi ini tidak bisa men-generate dokumen selain menggunakan bahasa indonesia. 4. Aplikasi ini hanya men-generate dokumen bahasa Indonesia dengan pola bahasa yang mengacu pada
Ejaan Yang disempurnakan (EYD) dengan
referensi Ilmu Bahasa Indonesia Sintaksis karangan M. Ramlan, serta kalimat yang digunakan adalah kalimat berita (News), hal ini dilakukan untuk lebih menfokuskan tipe kalimat yang akan diproses, kaitannya dengan banyaknya tipe dan pola dari bahasa indonesia. 5. Aplikasi ini menghasilkan kalimat yang terdiri dari klausa dan pola bahasa indonesia dengan tidak melihat posisi di dalam paragraf (induksi atau deduksi). 6. Aplikasi ini tidak merangkai kalimat yang dihasilkan sistem, sehingga tidak melihat keterhubungan makna antar kalimat 7. Aplikasi ini tidak bisa men-generate kata-kata ambigu, yaitu kalimat yang mengandung dua makna. 8. Kalimat masukan berupa kalimat berita, aktif tunggal yang sesuai dengan ejaan yang telah disempurnakan 9. Kalimat masukan majemuk yang terbentuk dari dua kalimat tunggal akan diproses berdasarkan kalimat tunggal dengan pemisah berupa tanda ',' atau kata sambung. 10. Keterangan yang digunakan adalah keterangan waktu atau keterangan tempat.
4
1.5. Metodologi Pemecahan Masalah Adapun metodologi yang diterapkan dalam tugas akhir ini adalah sebagai berikut: 1. Studi pustaka yaitu studi literatur diperlukan dalam mengumpulkan data-data yang sifatnya referensial dan berupa teori-teori yang mendukung dalam pembangunan aplikasi. 2. Observasi lewat internet untuk mencari aturan-aturan yang tidak terdapat pada buku-buku referensial. 3. Konsultasi
dengan
pembimbing
mengenai
permasalahan
yang
sulit
dipecahkan. Pada tahap implementasi digunakan siklus hidup rekayasa perangkat lunak dengan model Waterfall yang melalui beberapa tahap antara lain : 1.
Tahap pemahaman teori. Tahap pemahaman teori dilakukan dengan tujuan : a. Memahami teori-teori tentang teknik kompilasi. b. Memberikan landasan teori bagi algoritma dan bahasa yang akan dibuat. c. Memahami aturan pokok penulisan bahasa Indonesia yang baik serta memahami aturan untuk bisa membuat intisari dalam suatu kalimat.
2.
Tahap analisis dan perancangan perangkat lunak. Tahap analisis dan perancangan perangkat lunak meliputi beberapa kegiatan yakni : a. Pembentukan bahasa yang merupakan analisis dasar kebutuhan perangkat lunak. b. Pembentukan penganalisis leksikal, penganalisis sintaksis, yang merupakan implementasi perangkat lunak secara global untuk dievaluasi kegunaan dan kebutuhan masing-masing bagian. 3.
Tahap pembuatan program (cooding). Pada tahap ini merupakan implementasi nyata setelah kebutuhan perangkat lunak dianalisis dan dirancang.
5
4.
Tahap testing dan evaluasi. Tahapan ini dilakukan untuk memastikan program sudah berjalan sesuai perencanaan untuk dievaluasi guna melakukan perbaikanperbaikan kecil serta untuk mendapatkan saran bagi pengembangan perangkat lunak.
1.6. Sistematika Penyusunan Laporan Penyusunan sistematika laporan bertujuan agar segala aktivitas yang dilakukan dapat terekam kedalam suatu bentuk laporan yang jelas, ringkas dan sistematis. Urutan penulisan laporan yang dilaksanakan dalam pelaksanaan Tugas Akhir ini adalah sebagai berikut:
BAB I
PENDAHULUAN Bab ini berisi tentang latar belakang, rumusan masalah, tujuan pembuatan,
batasan masalah, metodologi pemecahan masalah,
dan sistematika penyusunan laporan. BAB II
LANDASAN TEORI Pada bab ini akan diuraikan tentang teori-teori yang dapat dijadikan
BAB III
landasan dalam pembahasan materi.
PERANCANGAN DAN PEMBUATAN SISTEM Bab ini berisi tentang perancangan dan pembuatan aplikasi INASum berdasarkan teori tentang pengolahan bahasa alami.
BAB IV
PENGUJIAN DAN ANALISIS Bab ini berisi tentang tahap pengujian aplikasi INASum serta dilakukan analisis terhadap hasil pengujian tersebut.
BAB V
KESIMPULAN DAN SARAN Bab ini menguraikan yang menjadi kesimpulan dan saran-saran penggunaan serta penyempurnaan aplikasi INASum.