BAB 1 PENDAHULUAN
1.1
Latar Belakang Pemanfaatan teknologi pada era globalisasi telah menjadi satu hal yang sangat penting dalam kehidupan sehari-hari. Beberapa pemanfaatan teknologi dalam kehidupan sehari-hari adalah untuk mencari, mengolah, atau menyimpan informasi dengan menggunakan Personal Computer. Informasi yang didapat biasanya berupa dokumen teks. Kemudahan mendapatkan informasi dalam berupa dokumen teks bisa menimbulkan sifat manusia yang negatif, yaitu dengan cara membuat karya atau tugas dengan melakukan penjiplakan. Penjiplakan atau plagiat menurut Permendiknas, (Pencegahan dan Penanggulangan Plagiat di Perguruan Tinggi, No 7, Pasal 1 ayat 1 2010) Plagiat merupakan perbuatan secara sengaja atau tidak sengaja dalam memperoleh atau mencoba memperoleh kredit atau nilai untuk suatu karya ilmiah, dengan mengutip sebagian atau seluruh karya dan/atau karya ilmiah orang lain, tanpa menyatakan sumber secara tepat dan memadai Penjiplakan di dunia pendidikan, (Universitas Pendidikan Indonesia 2012: 1-15) biasa terjadi jika seorang siswa atau mahasiswa yang mendapatkan tugas dan dikejar-kejar waktu untuk mengerjakan tugas tersebut. Untuk mendapatkan nilai dari tugas tersebut
dan dengan harapan mendapatkan hasil yang baik,
mahasiswa atau siswa melakukan kegiatan plagiat dengan melihat tugas milik temannya dengan cara mengubah sebagian atau tanpa mengubah sama sekali, cukup dengan teknik copy dan paste tugas milik temannya tanpa memahami 1
2 tugas-tugasnya terlebih dahulu, tugasnya dapat terselesaikan. Mahasiswa atau siswa yang melakukan penjiplakan percaya bahwa melakukan plagiat merupakan cara tercepat untuk menyelesaikan tugas-tugasnya. Hal semacam ini dapat menimbulkan masalah terhadap evaluasi hasil belajar siswa atau mahasiswa. Tidak mudah bagi seorang pengajar untuk memberikan penilaian objektif terhadap tugas yang telah diberikan kepada siswa atau mahasiswanya. Akan semakin bertambah parah apabila siswa atau mahasiswa yang mengikuti kegiatan belajar-mengajar tersebut jumlahnya sangat banyak. Kemungkinan terjadinya penjiplakan akan semakin besar dan akan semakin sulit mendeteksinya mengingat begitu banyak file-file jawaban. Oleh karena itu perlu dibuat sebuah aplikasi yang dapat mendeteksi kesamaan dokumen.Steven (2009: 19) telah melakukan penelitian tentang pendeteksian plagiarisme dengan menggunakan algoritma Rabin-Karp. RabinKarp adalah algoritma pencarian kata yang mencari sebuah pola berupa substring dalam sebuah teks menggunakan hashing dan metode k-gram. K-gram adalah rangkaian terms dengan panjang k. Kebanyakan yang digunakan sebagai terms adalah kata. K-gram merupakan sebuah metode yang diaplikasikan untuk pembentukan kata atau karakter.
Metode k-gram ini digunakan untuk
mengambil potongan-potongan karakter huruf sejumlah k dari sebuah kata yang secara kontinuitas dibaca dari teks sumber hingga akhir dari dokumen. Algoritma ini bekerja dengan baik pada sebagian besar kasus praktis, tapi akan mengakibatkan waktu komputasi yang relatif lama jika teks berisi banyak perbandingan nilai hashing yang tidak sama (Khan & Pateriya, 2012: 4). Seperti mencari kata ‘ax’ yang terdapat pada 10.000.000 karakter ‘a’. Berbeda dengan
3 Steven, kami membuat aplikasi yang berbasis web untuk pendeteksian kesamaan dokumen dengan menggunakan algoritma Winnowing (Schleimer, Wilkerson, & Aiken, 2003: 4). Winnowing menggunakan window sebagai metodenya, yaitu pembentukan window setelah proses hashing. Setelah pembentukan window yang berisi nilai-nilai hash, maka dipilih nilai hash yang paling kecil dari setiap window. Jika ada lebih dari satu nilai yang paling kecil di proses Windowing, maka nilai yang terkecil pada window sebelumnya itu dipilih untuk dijadikan document’s fingerprints. Fingerprints inilah yang akan dijadikan dasar pembanding antar file-file teks yang telah dimasukkan. Sebuah dokumen dikatakan telah menjiplak dokumen lain apabila memiliki tingkat kesamaan yang melebihi batas toleransi tertentu yang telah ditentukan.
1.2
Ruang Lingkup Berikut ini adalah ruang lingkup dari penelitian. 1.
Penelitian akan difokuskan untuk mendeteksi kesamaan dokumen pada dokumen-dokumen berbasis teks yang berekstensi doc, html, dan pdf.
2.
Algoritma yang digunakan untuk pendeteksian kesamaan dokumen adalah algoritma winnowing dan metode k-gram.
3.
Tingkat plagiarism dapat ditentukan berdasarkan tingkat kesamaan dalam pengunaan kata-kata yang muncul secara berurutan dalam dokumen (Mutiara-Agustina, 2008).
4.
Penelitian ini tidak membahas tentang security yang dipakai pada aplikasi.
4 5. 1.3
Speed performance yang cepat.
Tujuan dan Manfaat 1.3.1
Tujuan Penelitian ini dibuat untuk menciptakan suatu perangkat lunak berbasis web untuk memeriksa kesamaan dokumen. Selain itu, dengan diketahuinya perbandingan kemiripan dokumen berdasarkan persentase toleransi kemiripan yang diberikan, diharapkan dapat membantu mendeteksi kesamaan kata pada dokumen.
1.3.2
Manfaat Adapun manfaat dari penulisan karya ilmiah ini adalah sebagai berikut. 1. Bagi institusi: diharapkan kemungkinan
dengan adanya program pendeteksi plagiarisme
dapat yang
melakukan muncul
antisipasi dari
proses
terhadap
berbagai
pembelajaran
dan
meningkatkan kualitas lulusan-lulusan dari institusi. 2. Bagi pengguna lain: dengan adanya program pendeteksi plagiarisme dapat dengan cepat mengetahui seberapa besar persentase kesamaan sebuah dokumen dengan dokumen lainnya. 3. Bagi pembaca: menambah pengetahuan tentang pengaplikasian algoritma winnowing dan penggunaaanya. 4. Bagi peneliti lain: diharapkan dapat menjadi bahan pengembangan penelitian selanjutnya untuk masalah yang sama secara lebih mendalam.
5
1.4
Metodologi Penelitian Metodologi yang digunakan dalam penyusunan skripsi ini adalah sebagai berikut. 1.4.1 Metode Analisis Pada metode ini dilakukan dengan 4 tahapan, sebagai berikut: a.
Studi litelatur Studi litelatur adalah mencari referensi teori yang yang relefan
dengan kasus atau permasalahan pada skripsi ini. Referensi tersebut berisikan tentang : •
Algoritma Rabin-Karp
•
Algoritma Winnowing
•
Kesamaan Dokumen
Referensi ini dapat dicari dari buku, jurnal dan artikel peneltian yang sejenis. Output dari studi litelatur ini adalah terkumpulnya referensi yang relefan dengan perumusan masalah. b. Kuesioner Metode ini dilakukan dengan cara memberikan daftar pertanyaan berkaitan dengan skripsi ini yang diberikan ke beberapa orang untuk kemudian hasil dari kuesioner akan dijadikan data untuk membantu dalam pembuatan skripsi ini.
6
c.
Komparasi Metode ini membandingkan algoritma Rabin–Karp dengan algoritma
Winnowing berdasarkan cara kerja dan waktu dari kedua algoritma tersebut.
1.4.2
Metode Perancangan Metode perancangan dalam penyusunan skripsi ini mengunakan metode Waterfall. Menurut Pressman (2010: 39) waterfall adalah suatu model pengembangan sistem yang paling populer dan model klasik dalam daur hidup pengembangan sistem yang bersifat sistematis. Tahapantahapan waterfall adalah sebagai berikut : a. Communication. b. Planning. c. Modelling. d. Construction. e. Deployment.
1.5
Sistematika Penulisan Sistematika penulisan skripsi ini memberikan gambaran mengenai isi secara keseluruhan dari skripsi yang dibuat. Terdapat lima bab utama pada penulisan skripsi ini. Berikut ini adalah sistematika penulisan yang dibuat.
7
BAB 1 : PENDAHULUAN Bab ini membahas mengenai latar belakang masalah, ruang lingkup, tujuan dan manfaat, metodologi, serta sistematika penulisan yang digunakan dalam skripsi ini. BAB 2 : LANDASAN TEORI Bab ini membahas mengenai landasan teori yang digunakan dalam pendeteksian kesamaan dokumen yang mencakup algoritma Winnowing serta teori-teori lain yang akan menjadi dasar dari penelitian yang akan dilakukan. BAB 3 : ANALISIS DAN PERANCANGAN PROGRAM Bab ini membahas mengenai analisis dari algoritma Rabin-karp dan juga algoritma Winnowing dan juga perancangan untuk membuat aplikasi BAB 4 : IMPLEMENTASI DAN EVALUASI PROGRAM Bab ini membahas mengenai implementasi dari program yang dianalisis dari setiap modul pada program serta evaluasi dari aplikasi yang telah dibuat. BAB 5 : SIMPULAN DAN SARAN Bab ini berisi simpulan dari hasil analisis dan perancangan program serta saran penulis tujukan untuk pengembangan aplikasi lebih lanjut.