1
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Plagiarisme atau sering disebut plagiat adalah penjiplakan atau pengambilan karangan, pendapat, dan sebagainya dari orang lain dan menjadikannya seolah-olah karangan dan pendapat sendiri (Alsasian, 2006). Plagiat dapat dianggap sebagai tindak pidana karena dianggap mencuri hak cipta orang lain dan melanggar undang-undang tentang hak cipta. Praktek plagiat juga dapat menimbulkan konflik antar sesama apabila terdapat lebih dari satu orang mengakui satu karya. Untuk itu, perlu adanya Sistem untuk mendeteksi plagiarisme (Eko, 2011). Di dunia pendidikan, khususnya Universitas, rentan terjadi praktek plagiarisme. Misalnya dalam hal pembuatan Tugas Akhir, sering terjadi kemiripan antar Tugas Akhir. Untuk mendeteksi kemiripan tersebut, banyak Universitas yang masih melakukannya secara manual sehingga menghabiskan waktu yang lama juga tenaga yang ekstra (Hari, 2003). Seiring dengan perkembangan zaman, kemajuan ilmu dan teknologi, khususnya di bidang ilmu komputer, algoritma untuk mendeteksi kemiripan dokumen ditemukan dan berhasil dikembangkan oleh para ahli (Salmuasih & Sunyoto, 2013). Hal
ini membuat penulis tertarik mengembangkan sistem
komputer untuk mendeteksi plagiarisme. Dalam proses mendeteksi plagiarisme menggunakan sistem komputer, stemming adalah salah satu cara yang digunakan untuk meningkatkan performa information retrieval dengan cara mentransformasi kata-kata dalam sebuah dokumen teks ke bentuk kata dasarnya yang biasa disebut dengan root word (Ledy, 2009). Untuk proses stemming, penulis mengambil algoritma Nazief dan Adriani (Ledy, 2009). Setelah di-stem maka dilakukan perhitungan persentasi kemiripan antar root
2
words (Salmuasih & Sunyoto, 2013). Selanjutnya untuk menghitung persentasi kemiripan tersebut terdapat beberapa algoritma misalnya Algoritma Winnowing, Algoritma Smith Waterman, Algoitma Boyer-Moore dan Algoritma Rabin-Karp (Salmuasih & Sunyoto, 2013). Penulis mengambil Algoritma Rabin-Karp untuk proses perhitungannya. Berdasarkan latar belakang yang telah diuraikan diatas, maka penulis mencoba melakukan
penelitian
dengan
judul
“Implementasi
Algoritma
Rabin-Karp
menggunakan Stemming Nazief dan Adriani Untuk Mendeteksi Tingkat Kemiripan File Teks Yang Berbentuk Skripsi.
1.2 Rumusan Masalah
Rumusan masalah dalam penelitian ini adalah : bagaimana membuat sistem yang mampu mendeteksi tingkat kemiripan file teks yang berbentuk skripsi menggunakan algoritma Rabin-Karp beserta stemming Nazief dan Adriani.
1.3 Batasan Masalah
Agar pembahasan dalam penelitian ini terarah, diperlukan batasan-batasan berikut: 1. Aplikasi ini hanya mendeteksi kemiripan file teks yang berbentuk skripsi. 2. Aplikasi ini hanya bisa memproses file berekstensi pdf (.pdf) yang diambil dari repository USU. 3. Data yang digunakan adalah skripsi mahasiswa S1 ilmu komputer USU stambuk 2006,2007,2008 masing-masing 10 skripsi. 4. Aplikasi hanya dapat membaca teks, gambar dan rumus pada file skripsi yang akan dibandingkan tidak diperhitungkan. 5. Tools yang digunakan adalah PHP & MySQL.
1.4 Tujuan Penelitian Tujuan penelitian ini adalah sebagai berikut: 1. Untuk mendeteksi kemiripan file teks yang berbentuk skripsi. 2. Untuk mengimplementasikan algoritma Stemming Nazief dan Adriani dalam pendeteksian kemiripan file teks.
3
3. Untuk mengimplementasikan keefisienan algoritma Rabin-Karp dalam menghitung persentasi kemiripan file teks.
1.5 Manfaat Penelitian Penelitian ini diharapkan dapat mendeteksi kemiripan file teks yang berbentuk skripsi mahasiswa untuk mengantisipasi plagiarisme.
1.6 Metodologi Penelitian
Tahapan yang dilakukan dalam penelitian ini adalah: •
Studi Literatur dan Pengumpulan Data
•
Pada penelitian ini penulis melakukan studi literatur dan mengumpulkan data dari buku-buku, artikel-artikel, jurnal-jurnal, web site-web site yang berhubungan dengan penelitian penulis, natural language processing. Analisis dan Perancangan Sistem Melakukan analisis algoritma Stemming Nazief dan Adriani serta algoritma RabinKarp. Pada tahap ini juga akan di susun perancangan sistem dengan menerapkan algoritma Stemming Nazief dan Adriani sebagai algoritma stemmer untuk pendeteksian kemiripan dokumen, serta algoritma Rabin-Karp sebagai algoritma penghitung persentase kemiripan.
•
Implementasi Tahap ini dilakukan dengan mengimplementasikan perancangan sistem dan flowchart yang ditetapkan kedalam bahasa pemrograman PHP.
•
Pengujian Pengujian aplikasi yang telah selesai dibuat.
•
Dokumentasi Dokumentasi dihasilkan dengan membuat skripsi sebagai laporan dari hasil penelitian.
4
1.7 Sistematika Penulisan
Sistematika penulisan dari skripsi ini terdiri dari beberapa bagian utama sebagai berikut:
BAB 1: PENDAHULUAN
Bab ini akan menjelaskan mengenai latar belakang pemilihan judul skripsi “Implementasi Algoritma Rabin-Karp Menggunakan Stemming Nazief dan Adriani Untuk Mendeteksi Tingkat Kemiripan File Teks Yang Berbentuk Skripsi, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metode penelitian, dan sistematika penulisan.
BAB 2: LANDASAN TEORI
Bab ini akan membahas teori-teori yang berkaitan dengan Data Mining, Teks Mining, ekstraksi dokumen, algoritma Rabin-Karp, stemming Nazief dan Adriani.
BAB 3: ANALISIS DAN PERANCANGAN SISTEM
Bab ini akan menjabarkan tentang tujuan dari perancangan sistem, ukuran-ukuran setiap perspektif, penentuan target yang menjadi tolak ukur keberhasilan peningkatan kinerja, dan juga tahapan dalam mengimplementasikan metode.
BAB 4: IMPLEMENTASI DAN PENGUJIAN
Bab ini akan membahas bentuk perangkat lunak yang dibuat yaitu perancangan antar muka, algoritma-algoritma dan bentuk sistem yang digunakan dalam penyusunan fungsi dan prosedur yang membangun program serta tampilan program implementasi algoritma Rabin-Karp menggunakan stemming Nazief dan Adriani untuk mendeteksi tingkat kemiripan file teks yang berbentuk skripsi.
5
BAB 5: KESIMPULAN DAN SARAN
Bab terakhir akan memuat kesimpulan isi dari keseluruhan uraian bab-bab sebelumnya dan saran-saran dari hasil yang diperoleh dan diharapkan dapat bermanfaat dalam pengembangan selanjutnya.