BAB 1 PENDAHULUAN
Latar Belakang Berita pada media massa online bertambah banyak setiap waktu karena selalu ada sesuatu yang patut untuk diberitakan kepada khalayak. Hal ini membuat pembaca harus menyiapkan waktu untuk mengakses penyedia berita baik melalui situs website atau aplikasi kemudian membaca setiap pembaruan berita yang diminatinya. Memahami isi teks berita keseluruhan memerlukan waktu yang relatif lama dibandingkan dengan teks yang sudah diringkas. Sehingga berita yang sudah diringkas akan mempermudah pembaca untuk memahami isi berita tersebut. Menurut Aristoteles (2011) yang merujuk kepada (Radev et al. 2002; Blake et al. 2001) peringkasan teks merupakan proses untuk menghasilkan teks yang lebih sedikit (<50%) dari teks asli namun tetap mengandung bagian-bagian penting dan selaras dengan sistematika penulisan teks asli dengan bertujuan untuk mempersingkat waktu untuk memahami isi dokumen. Peringkasan teks otomatis atau automatic text summarization (ATS) yaitu peringkasan teks yang dilakukan oleh mesin dengan algoritma atau metode tertentu. Pada umumnya peringkasan teks terbagi menjadi dua teknik yaitu ekstraktif dan abstraktif. Teknik ekstraktif mengambil kalimat-kalimat yang penting dalam teks kemudian menyatukannya dalam ringkasan yang dihasilkan, kemudian teknik abstraktif adalah teknik yang yang memparafrasakan isi teks asli dalam bentuk yang lebih singkat. Penelitian dalam peringkasan teks otomatis dalam bahasa Indonesia sudah banyak dilakukan. Salah satunya adalah penelitian yang dilakukan oleh Aristoteles (2014) yang memanfaatkan 11 fitur yaitu posisi kalimat, positive keyword, negativekeyword, kemiripan antar kalimat, kalimat yang menyerupai judul kalimat, kalimat yang mengandung nama entitas, kalimat yang mengandung data numerik, panjang kalimat, koneksi antar—kalimat, penjumlahan bobot koneksi antar—kalimat, dan kalimat semantik.
Universitas Sumatera Utara
2
Bobot fitur teks yang didapatkan kemudian diolah dengan model metode regresi logistik. Penelitian yang dilakukan Aristoteles (2014) menggunakan sumber data korpus statis dari penelitian yang dilakukan oleh Ridha (2002). Artinya sumber data yang akan disingkat disimpan terlebih dahulu dalam media penyimpan komputer tanpa memperhatikan adanya pembaruan berita pada media massa online. Kemudian penelitian yang dilakukan oleh Fachrurrozi et al. (2013) menggunakan metode frequent term based dengan cara mengidentifikasi kemudian mengekstraksi informasi penting dari teks. Pada sistem yang dibuat seluruh kata benda dan kata kerja dihitung, karena menurut Fachrurrozi et al. (2013) kedua kata ini merepresentasikan isi teks. Dengan pendekatan statistik, judul teks dan lokasi kalimat tersebut dalam teks juga digunakan karena ini merupakan konsep dasar dari tingkat kepentingan kalimat dalam teks. Berbeda dengan penelitian Fachrurrozi et al. (2013), penelitian yang dilakukan Riandayani et al. (2014) membandingkan metode fuzzy logic dan fuzzy c-means (FCM). Peringkasan pada penelitian ini memanfaat 7 fitur kalimat yaitu sentence position, sentence length feature, title feature, term weight, entity word or term, numerical data, thematic word. Skor masing-masing kalimat dalam teks akan dioptimasi oleh metodemetode yang digunakan. Kemudian hasil dari fuzzy logic dan fuzzy c-means dibandingkan dengan ringkasan manual yang dihasilkan oleh manusia. Pada penelitian ini data diperoleh dari beberapa situs berita online seperti kompas.com, detik.com, liputan6.com menggunakan teknik web data extraction. Kemudian data yang dapatkan diringkas menggunakan algoritma TextTeaser yang memang dioptimalkan untuk meringkas teks berita (Balbin, 2011). Algoritma ini menghasilkan ringkasan secara ekstraktif yang menggunakan elemen dalam teks sebagai acuan peringkasan. Elemen teks yang digunakan TextTeaser ada empat yaitu judul teks, posisi kalimat, panjang kalimat, dan frekuensi keyword. Elemen-elemen ini akan menghasilkan skor untuk setiap kalimat yang mana skor ini akan menentukan suatu kalimat masuk dalam ringkasan atau tidak. Rumusan Masalah Banyaknya sumber berita online membuat sebagian orang memilih untuk membuka dan membaca hanya satu sumber. Padahal pada kenyataannya masing-masing sumber memiliki gaya penyampaian yang berbeda walaupun pada topik berita yang sama.
Universitas Sumatera Utara
3
Sehingga akan ada kemungkinan perbedaan informasi yang disampaikan antara satu sumber berita dengan yang lain. Tidak jarang orang akan melakukan cross-check dari berbagai sumber yang ada untuk memeriksa variasi kelengkapan isi berita yang akan menguras waktu dan tenaga. Namun setiap orang memiliki waktu yang berbeda dan terbatas untuk melakukan hal tersebut. Untuk mengatasinya, aplikasi peringkasan isi berita dari berbagai sumber disajikan dalam sebuah aplikasi Android dapat dijadikan solusi untuk meningkatkan efisiensi membaca. Batasan Masalah Sistem peringkasan teks yang akan dikembangkan memiliki batasan atau ruang lingkup yang mencakup: 1. Masukan data berupa teks berita bahasa Indonesia. 2. Asumsi teks berita menggunakan pola bahasa yang mengacu pada ejaan yang disempurnakan (EYD). 3. Tidak menangani kesalahan penulisan kata. 4. Kohesi dan koherensi antar kalimat kalimat tidak ditangani. Tujuan Penelitian Tujuan penelitian yang dilakukan adalah untuk meringkas teks berita online berbahasa Indonesia menggunakan algoritma TextTeaser. Manfaat Penelitian Manfaat yang diperoleh dari penelitian ini adalah: 1. Mempersingkat waktu baca berita menggunakan smartphone Android. 2. Mempermudah pemahaman isi berita. Metodologi Penelitian Tahapan-tahapan yang akan dilakukan dalam pelaksanaan penelitian ini adalah sebagai berikut : 1. Studi Literatur Tahap ini dilaksanakan untuk mengumpulkan dan mempelajari informasiinformasi yang diperoleh dari buku, jurnal, dan berbagai sumber referensi lain
Universitas Sumatera Utara
4
yang berkaitan dengan penelitian seperti automatic text summarization (ATS), algoritma TextTeaser, dan algoritma TextRank. 2. Analisis Permasalahan Pada tahap ini dilakukan analisis terhadap berbagai informasi yang telah diperoleh dari berbagai sumber yang terkait dengan penelitian agar didapatkan metode yang tepat untuk menyelesaikan masalah dalam penelitian ini. 3. Perancangan Sistem Tahap ini dilakukan perancangan sistem mulai dari perancangan arsitektur, perancangan data, dan perancangan user interface (UI) untuk menyelesaikan permasalahan yang terdapat di dalam tahap analisis. Kemudian dilanjutkan dengan mengimplementasikan hasil analisis dan perancangan ke dalam sistem. 4. Implementasi Sistem Pada tahap ini dilakukan proses implementasi kode program sistem aplikasi yang mencakup aplikasi server dan aplikasi untuk end-user menggunakan bahasa pemrograman yang telah dipilih sesuai dengan analisis dan perancangan yang telah dilakukan. 5. Pengujian Pada tahap ini dilakukan pengujian sistem untuk mencari kesalahan yang mungkin ada sehingga dapat diperbaiki. Kemudian akan dilakukan analisis terhadap fokus permasalahan penelitian, apakah sudah sesuai dengan yang diinginkan. Sistematika Penulisan Penulisan skripsi ini terdiri dari lima bab dengan masing-masing bab secara singkat dijelaskan sebagai berikut: Bab 1: Pendahuluan Bab ini berisikan latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metode penelitian, dan sistematika penulisan. Bab 2: Landasan Teori Bab ini berisi landas teori pendukung penelitian skripsi yaitu teori peringkasan teks otomatis, kerangka pikir dan hipotesis yang diperoleh dari acuan yang mendasari dalam melakukan penelitian ini.
Universitas Sumatera Utara
5
Bab 3: Analisis dan Perancangan Sistem Di dalam bab ini terdapat pemaparan mengenai analisis penelitian dan dasar-dasar perancangan yang digunakan untuk membangun suatu sistem. Seperti arsitektur umum, cara kerja proses peringkasan menggunakan algoritma TextTeaser dan lain-lain. Bab 4: Implementasi dan Pengujian Sistem Bab ini berisi implementasi perancangan sistem dari hasil analisis dan perancangan yang sudah dibuat, serta menguji sistem untuk menemukan kelebihan dan kekurangan pada sistem rekomendasi yang dibuat. Bab 5: Kesimpulan dan Saran Bab ini berisikan kesimpulan yang didapatkan terhadap hasil penelitian skripsi dan saran untuk pengembangan lebih lanjut tentang topik terkait yang dibahas pada skripsi.
Universitas Sumatera Utara