BAB I PENDAHULUAN 1.1
Latar Belakang Media massa memiliki berbagai jenis media penyiaran seperti televisi dan
radio dan media cetak seperti surat kabar, majalah dan tabloid. Namun, dengan kemajuan teknologi saat ini penyebaran berita dilakukan melalui media online. Sejak tahun 1990-an, teknologi internet menjadi media penyebaran berita kepada khayalak ramai (Arifin dkk, 2008). Berita yang disebarkan melalui media online merupakan artikel berita tekstual yang dikemas dengan bahasa tulis yang lugas dan informatif. Terdapat sembilan (9) kategori berita pada setiap media online antara lain olahraga, seni, hiburan, keluarga, politik, kesehatan, ekonomi, pemerintahan dan kriminal (Djuraid, 2007). Salah satu berita yang sering diberitakan di media online adalah berita kriminal. Berita kriminal merupakan berita atau laporan mengenai kejahatan yang diperoleh dari pihak kepolisian. Berbagai laporan kepolisian menyebutkan kriminalitas disebabkan atau dipicu dari persolan ekonomi, sosial, konflik, dan rendahnya kesadaran hukum masyarakat. Dilain hal tindakan kriminal tidak jarang dipicu oleh persoalan-persoalan sepele. Hal tersebut menjadi kontribusi pada peningkatan angka kriminalitas. Seperti yang disebutkan BPS pada laporan statistika kriminal (2014), selama periode 2013 setiap 1 menit 32 detik terjadi tindak kriminal di Indonesia. Polri memantau dan mengevaluasi perkembangan kriminalitas sebanyak 11 (sebelas) jenis kriminal. Kesebelas tindak kriminal tersebut meliputi pencurian dengan pemberatan, pencurian kendaraan bermotor, penganiayaan berat, narkoba, perjudian, pencurian dengan kekerasan, pemerasan, pencurian kayu, penggunaan senjata api dan bahan peledak, penyelundupan dan korupsi. Secara garis besar, kriminalitas tersebut dibagi menjadi lima kategori yaitu kejahatan narkoba contohnya perdagangan barang-barang terlarang, kejahatan politik yakni korupsi, kolusi, nepotisme; kejahatan kesusilaan contoh: pemerkosaan dan pencabulan dan kejahatan terhadap nyawa yakni pembunuhan,
1
2
penganiayaan sedangkan kejahatan terhadap harta benda seperti pencurian, perampokan (Kartono, 2003). Meningkatnya
berita
mengenai
kriminal,
maka
berdampak
pada
meningkatnya jumlah berita yang disuguhkan kepada masyarakat. Hal tersebut juga berdampak pada meningkatnya volume berita, sehingga dibutuhkan sebuah ringkasan. Ringkasan merupakan teks yang dihasilkan dari sebuah kumpulan teks yang mengandung informasi penting dengan panjang teks tidak lebih dari setengah teks aslinya (Radev et al., 2002). Dalam ilmu komputer, teknik peringkasan dikenal dengan peringkas teks otomatis atau automatic text summarization. Automatic Text Summarization (ATS) adalah sebuah aplikasi yang dijalankan pada komputer untuk membuat versi berita yang lebih singkat dari berita aslinya. Selain merubah berita menjadi lebih singkat, peringkasan juga dapat digunakan untuk mempermudah proses klasifikasi. Proses kinerja klasifikasi dokumen menjadi tidak optimal dapat dipengaruhi oleh banyaknya term sebuah dokumen (Yu et al., 2009). Klasifikasi merupakan sebuah proses untuk menyatakan suatu objek ke salah satu kategori yang sudah didefinisikan sebelumnya (Gupta, 2012). Kategori yang sudah terdefinisi disebut data latih. Data latih digunakan untuk memprediksi data yang belum diketehui kelasnya. Sebelum proses klasifikasi data dilakukan, data tersebut harus melalui tahapan preprocessing. Tahapan preprocessing yang dilakukan secara umum yakni tokenizing, stopwords, dan stemming. Tujuan preprocessing ini untuk mendapatkan spesifikasi data input yang sesuai. Salah satu pendekatan sistematis untuk membangun sekumpulan data input dokumen teks adalah pendekatan Decision Tree Induction. Algoritma yang menggunakan pendekatan ini antara lain ID3, C45 dan CART. Dalam penelitian ini algoritma yang digunakan adalah algoritma Iterative Dichotomiser (ID3). Algoritma ini melakukan pencarian secara rakus/menyeluruh (Greedy) pada semua kemungkinan pohon keputusan. Algoritma ini digunakan pada suatu kasus dengan atribut yang bersifat kategorikal dan juga diterapkan pada kasus dokumen teks. Hasil algoritma Iterative Dichotomiser (ID3) memiliki akurasi yang lebih baik daripada metode decision tree yang lain (Bashir et al.,
3
2014). Proses klasifikasi dalam penilitian ini yakni klasifikasi berita dengan atribut berdasarkan isi dokumen. Semakin banyak volume dokumen dapat menyebabkan suatu permasalahan pada klasifikasi dokumen. Banyaknya term terdapat pada dokumen bisa menyebabkan proses klasifikasi lambat (Yu et al, 2009). Oleh karena itu, dokumen yang digunakan pada penelitian ini berupa ringkasan berita kriminal. Metode yang digunakan untuk peringkas dokumen yaitu metode Maximum Marginal Relevance (MMR). Metode ini menghitung kesamaan antar kalimat dan kesamaan setiap kalimat terhadap judul dari konten berita. Peringkas dokumen yang memperhatikan keterkaitan kalimat tersebut diharapkan dapat menghasilkan ringkasan kalimat dengan baik sehingga dapat meningkatkan proses kerja klasifikasi dokumen artikel berita kriminal.
1.2
Rumusan Masalah Berdasarkan penjelasan pada latar belakang, rumusan masalah yang dibahas
pada penelitian ini yaitu : 1.
Bagaimana menentukan jenis kriminal yang terdapat pada artikel berita.
2.
Bagaimanakah pengaruh peringkasan dokumen otomatis pada kinerja klasifikasi dokumen teks.
1.3
Batasan Masalah Batasan masalah pada penelitian adalah sebagai berikut :
1.
Data yang digunakan yaitu data berupa artikel berita dari portal berita kompas.com dan detik.com.
2.
Artikel berita hanya dibagi dalam lima kelas yaitu kejahatan ekonomi, kejahatan politik, kejahatan kesusilaan, kejahatan terhadap jiwa dan kejahatan terhadap harta benda.
3.
Peringkasan yang dilakukan hanya untuk dokumen tunggal.
4.
Algoritma Maximum Marginal Relevance (MMR) digunakan untuk melakukan proses ringkasan dari dokumen artikel berita kriminal.
5.
Algoritma ID3 digunakan untuk melakukan klasifikasi jenis kejahatan berdasarkan ringkasan berita yang telah dilakukan sebelumnya.
4
1.4
Tujuan Penelitian Berdasarkan latar belakang dan rumusan masalah di atas, maka tujuan dari
penelitian ini adalah menerapkan metode klasifikasi pada ringkasan berita kriminal menggunakan Algoritma Iterative Dichotomiser Tree. Ringkasan bertujuan untuk mereduksi dokumen menjadi lebih singkat dengan tetap menjaga informasi penting dokumen asli yang dapat mempengaruhi kinerja klasifikasi.
1.5
Manfaat Penelitian Output dari hasil rancang bangun ini diharapkan dapat memudahkan
pengguna untuk mengetahui berita kriminal secara ringkas yang dilengkapi dengan kelas kategori kriminal pada berita tersebut.
1.6
Keaslian Penelitian Berdasarkan referensi yang dimiliki, penelitian mengenai klasifikasi berita
kriminal menggunakan Algoritma Iterative Dichotomiser Tree (ID3) berdasarkan peringkasan teks otomotis dengan metode Maximum Marginal Relevance (MMR) ini belum pernah dilakukan. Walaupun demikian, terdapat penelitian terdahulu tentang topik dan metode sejenis yang dipaparkan pada tinjuan pustaka dalam penelitian ini.
1.7
Metode Penelitian Tahapan-tahapan dalam melakukan penelitian terbagi menjadi beberapa
tahap seperti Gambar 1.1 berikut:
Gambar 1. 1 Tahapan metodologi penelitian
1.
Studi Pustaka Studi pustaka dilakukan dengan membaca dan mempelajari literatur terkait
permasalahan dalam penelitian ini. Literatur yang didapatkan dari jurnal ilmiah, e-book dan hasil laporan penelitian dan buku. Literatur yang dipelajari berkaitan
5
dengan konsep peringkasan teks otomatis (automatic text summarization), pembobotan Term Frequency-Inverse Document Frequency (TF-IDF), metode Maximum Marginal Relevance (MMR) dan metode Iterative Dichotomiser (ID3). 2.
Pengumpulan Data Tahapan pengumpulan data dilakukan dengan melakukan penyaringan
artikel-artikel berita online khusus berita dengan kasus kriminal. Hasil dari tahapan ini yang akan dijadikan data input pada sistem untuk proses klasifikasi jenis kriminal dalam berita tersebut. 3.
Analisis kebutuhan sistem Tahapan ini merupakan tahapan yang dilakukan untuk menggambarkan
kebutuhan model sistem yang akan dibangun. Pada tahap ini akan dihasilkan spesifikasi model prototype program untuk melakukan klasifikasi kategori kejahatan kriminal berdasarkan peringkasan berita. 4.
Perancangan model sistem Pada tahap ini dilakukan rancangan arsitektur model sistem, perancangan
proses bisnis, perancangan basis data dan perancangan antarmuka aplikasi. Proses perancangan ini dilakukan dengan mendeskripsikan secara tekstual maupun dengan menggunakan diagram permodelan. 5.
Implementasi Tahapan
implementasi
adalah
menuliskan
kode
program
dengan
menggunakan tools pemrograman. Tahapan implementasi diharapkan bisa sesuai seperti yang telah dirancang pada tahapan rancangan model sistem. Perangkat lunak yang digunakan adalah software XAMPP yang mendukung web server Apache, bahasa pemrograman PHP dan MYSQL yang digunakan untuk implementasi database. 6.
Pengujian Pengujian yang dilakukan dalam penelitian ini yaitu pengujian terhadap
fungsional dari sistem yang telah dibangun atau biasa disebut dengan pengujian black box. Hasil pengujian dilakukan analisa apakah menunjukkan performansi yang sesuai dengan spesifikasi yang telah dirancang. Penilaian performansi akan menggunakan perhitungan recall, precision, F-measure dan accuracy.
6
1.8
Sistematika Penulisan Sistematika penulisan merupakan gambaran seara umum pada setiap bab
terkait penulisan penelitian. Adapun sistematika penulisan dalam penelitian ini adalah sebagai berikut : BAB I PENDAHULUAN Pendahuluan berisi uraian singkat mengenai latar belakang masalah, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, keaslian penelitian, metode penelitian, dan sistematika penulisan tesis. BAB II TINJAUAN PUSTAKA Tinjauan pustaka membahas tentang penelitian-penelitian terdahulu yang terkait dengan penelitian ini. Selain itu, pada bab ini juga diuraikan tentang perbandingan fokus dan tujuan dari metode yang diterapkan antara penelitian ini dengan penelitian yang telah ada sebelumnya. BAB III LANDASAN TEORI Landasan teori memuat tentang teori-teori dasar terkait dengan penelitian yang dilakukan dan menjadi dasar dalam memecahkan masalah dalam penelitian ini. BAB IV ANALISIS DAN SISTEM Bab ini menerangkan tentang analisis sistem dan sistem yang akan dibangun. Uraian pada bab ini mencakup rancangan arsitektur model sistem, perancangan proses bisnis, perancangan basis data dan perancangan antarmuka sistem. BAB V IMPLEMENTASI Bab ini mengurasikan tentang implementasi yang diterapkan berdasar rancangan sistem pada bab sebelumnya. Implementasi dilakukan dengan menggunakan bahasa pemrograman PHP dan basis data MySQL. BAB VI HASIL DAN PEMBAHASAN Bab ini membahas hasil implementasi penelitian yang dilakukan. Hasil penelitian berupa ringkasan berita dan klasifikasi ringkasan berita tersebut. Dari hasil pengujian dapat diketahui tingkat pencapaian keakuratan dari model sistem
7
klasifikasi ringkasan berita menggunakan Algoritma Iterative Dichotomiser Tree (ID3). BAB VII PENUTUP Bab ini berisi kesimpulan dan saran dari hasil penelitian yang telah dilakukan. Kesimpulan diambil berdasarkan hasil dan pembahasan pada bab sebelumnya. Selanjutnya, kekurangan yang ada pada sistem dimasukkan ke dalam saran untuk pengembangan penelitian di masa yang akan datang.