BAB II TINJAUAN PUSTAKA
2.1. Landasan Teori 2.1.1. Plagiarisme Ada beberapa definisi menurut para ahli lainnya (dalam Novanta, 2009), yaitu : 1. Menurut Ir. Balza Achmad, M.Sc.E, plagiarisme adalah berbuat sesuatu seolah-olah karya orang lain tersebut adalah karya kita dan mengakui hasil karya tersebut adalah milik kita, 2. Menurut Brotowidjoyo, plagiarisme merupakan pembajakan berupa fakta, penjelasan, ungkapan, dan kalimat orang lain secara tidak sah.
Di Indonesia perlindungan hak cipta diatur dalam Undang-Undang Republik Indonesia Nomor 19 Tahun 2002 Tentang Hak Cipta. Oleh karena itu kegiatan plagiarisme atau yang lebih dikenal dengan kata plagiat harus dihindari. Di Indonesia sendiri, pelanggaran hak cipta bisa terjadi dimana saja, mulai dari pelanggaran hak cipta lagu, hak cipta perangkat lunak (software), dan lain-lain. Dari salah satu berita yang diterbitkan kompas pada tanggal 11 Juli 2012 menyebutkan bahwa Indonesia berada di peringkat ke-11 Negara yang melakukan pembajakan software. Dari hal ini patutnya kita sebagai warga Negara Indonesia harus menyadari bahwa jangan sampai kita berada di peringkat tertinggi dalam pelanggaran hak cipta karya yang sebenarnya dimiliki oleh orang lain.
4
Menurut Novian, dkk. (2012), terdapat beberapa jenis plagiat yang dikenal selama ini, yaitu : 1.
Word-of-word plagiarism : menyalin setiap kata secara langsung tanpa diubah sedikitpun.
2.
Plagiarism of the form of a source : menyalin dan atau menulis ulang kodekode program tanpa mengubah struktur dan jalannya program.
3.
Plagiarism of authorship : mengakui hasil karya orang lain sebagai hasil karya sendiri dengan mencantumkan nama sendiri menggantikan nama pengarang sebenarnya.
Beberapa contoh praktik plagiat pada sebuah program yang dikemukakan oleh Novian, dkk. (2012), yaitu : 1.
2.
Leksikal : perubahan pada kode (source code) program, misalnya : 1.
Komentar diubah (ditambah, dikurangi, atau diganti)
2.
Format penulisan diubah
3.
Nama variabel diubah
Struktural : perubahan struktur program 1.
Perubahan urutan algoritma yang tidak mengubah jalannya program.
2.
Prosedur diubah menjadi fungsi atau sebaliknya.
3.
Pemanggilan prosedur diganti dengan isi prosedur itu sendiri.
5
2.1.1.1. Bentuk Plagiarisme Dalam (Novanta, 2009), bentuk-bentuk plagiarisme yang sering terjadi di dunia akademis berdasarkan artikel Clough adalah : 1. Plagiarisme kata per kata, merupakan penyalinan kalimat secara langsung dari sebuah dokumen teks tanpa adanya pengutipan atau perizinan. 2. Plagiarisme paraphrase, merupakan penulisan ulang dengan mengubah kata atau sintaksis, tetapi teks aslinya masih dapat dikenali. 3. Plagiarisme sumber sekunder, merupakan perbuatan mengutip kepada sumber asli yang didapat dari sumber sekunder dengan menghiraukan teks asli dari sumber yang sebenarnya. 4. Plagiarisme struktur sumber, merupakan penyalinan/penjiplakan struktur suatu argument dari sebuah sumber. 5. Plagiarisme ide, merupakan penggunaan ulang suatu gagasan/pemikiran asli dari sebuah sumber teks tanpa bergantung bentuk teks sumber. 6. Plagiarisme authorship, merupakan pembubuhan nama sendiri secara langsung pada hasil karya orang lain. 2.1.1.2. Identifikasi Plagiarisme Dalam (Novanta, 2009) Beberapa faktor yang dapat digunakan untuk mengidentifikasikan plagiarisme menurut Clough yaitu : 1. Penggunaan kosa kata. Menganalisis kosa kata yang digunakan dalam suatu tugas terhadap penggunaan kosa kata sebelumnya dapat membantu menentukan apakah mahasiswa benar-benar telah menulis teks tersebut. Dengan menemukan
6
suatu kosa kata baru dalam jumlah yang besar (terutama kosa kata lanjut) dapat menentukan apakah mahasiswa menulis teks tanpa melakukan plagiarisme. 2. Perubahan kosa kata Apabila penggunaan kosa kata berubah secara significant dalam suatu teks, hal ini dapat mengindikasikan plagiarisme dengan cara copy and paste. 3. Teks yang membingungkan. Apabila alur dari suatu teks tidak halus dan tidak konsisten, hal ini mengindikasikan penulis tidak menulis menggunakan pemikirannya sendiri atau beberapa bagian dari tulisannya bukanlah hasil karyanya. 4. Penggunaan tanda baca. Tidak wajar apabila dua orang penulis menggunakan tanda baca yang persis sama dalam membuat suatu karya tulis. 5. Jumlah kemiripan teks. Pasti ada beberapa kemiripan antara beberapa teks yang menulis dengan topik yang sama seperti nama-nama, istilah-istilah dan sebagainya. Bagaimanapun, tidak wajar bila beberapa teks yang berbeda memiliki kesamaan atau kemiripan teks dalam jumlah yang besar. 6. Kesalahan ejaan yang sama. Merupakan hal yang biasa terjadi bagi seseorang penulis dalam membuat suatu karya tulis. Menjadi tidak wajar bila beberapa teks yang berbeda memiliki kesalahan-kesalahan yang sama dalam pengejaan atau jumlah ejaan salah yang sama.
7
7. Distribusi kata-kata. Tidak wajar apabila distribusi penggunaan kata dalam teks yang berbeda memiliki kesamaan. Sebagai contoh, suatu teks memiliki parameter yang sama untuk suatu distribusi statistic yang digunakan untuk menjelaskan penggunaan istilah. 8. Struktur sintaksis teks. Hal ini menunjukkan plagiarisme mungkin saja telah terjadi jika dua teks secara jelas memiliki kesamaan struktur sintaksis. Hal yang wajar bila penggunaan struktur sintaksis yang digunakan oleh beberapa penulis akan berbeda. 9. Rangkaian-rangkaian panjang kata yang sama. Tidak wajar apabila suatu teks yang berbeda (bahkan yang menggunakan judul yang sama) memiliki rangkaian/urutan karakter yang sama. 10. Orde kemiripan antar teks. Hal ini bisa mengindikasikan plagiarisme apabila orde kecocokan kata atau frase antar dua teks sama. Meskipun diajarkan untuk menyajikan fakta-fakta dalam suatu aturan (contohnya pendahuluan, isi, kemudian kesimpulan), kurang wajar jika fakta-fakta yang sama dilaporkan dalam orde yang sama. 11. Ketergantungan pada kata atau frase tertentu. Seorang penulis mungkin memilih penggunaan suatu kata atau frase tertentu. Kekonsistenan penggunaan kata-kata tersebut dalam suatu teks yang ditulis oleh
orang
lain
dengan
menggunakan
kata
yang
berbeda
dapat
mengindikasikan plagiarisme.
8
12. Frekuensi kata. Tidak wajar apabila kata-kata dari dua teks yang berbeda digunakan dengan frekuensi yang sama. 13. Keputusan untuk menggunakan kalimat panjang atau kalimat pendek. Tanpa sepengetahuan kita, para penulis tentu memiliki keputusan penggunaan panjang kalimat yang tidak biasa dikombinasikan dengan fitur-fitur lain. 14. Teks yang dapat dibaca. Penggunaan metrik/ukuran seperti index Gunning FOG, Flesch Reading Ease Formula atau SMOG dapat membantu menentukan suatu skor kemampuan. Tidak wajar apabila penulis yang berbeda akan memiliki skor yang sama. 15. Referensi yang tidak jelas. Apabila referensi yang muncul dalam suatu teks tetapi tidak terdapat pada daftar pustaka, hal ini dapat mengindikasikan plagiarisme cut and paste, dimana penulis tidak menyalin referensinya secara lengkap.
2.1.2. Algoritma Smith-Waterman Menurut artikel yang terdapat dalam situs Wikipedia.org, Algoritma SmithWaterman merupakan algoritma klasik yang telah dikenal luas dalam bidang bioinformatika sebagai metode yang dapat mengidentifikasi local similarities (penyejajaran
sekuens)
yaitu
proses
penyusunan
dua
local
sequences
(rangkaian/susunan atau rentetan) nucleotide atau protein sequences sehingga kemiripan antara dua sequence tersebut akan terlihat. Berdasarkan fungsi proses penyejajaran sekuens tersebut, maka algoritma ini dapat dikonversikan ke dalam
9
pemrograman komputer untuk digunakan membantu proses pendeteksian dokumen teks yang dianggap cenderung plagiat dengan cara melihat kesamaan isi (local similarities) dari beberapa dokumen teks.
Abcbadbca |||||| ||| Ab–b–dbda Gambar 2.1. Optimal Alignment Dari Dua Substring Algoritma standar Smith-Waterman yang dipakai untuk penghitungan local alignment berdasarkan dokumen dari situs Baylor College of Medicine HGSC adalah (Novanta, 2009) : 1. Menambahkan sebuah nilai pada setiap perbandingan a. Menggunakan nilai positif, apabila memiliki kemiripan. b. Menggunakan nilai negatif, apabila memiliki perbedaan. 2. Inisialisasi awal matriks dengan nilai 0 (nol). 3. Semua nilai yang terdapat dalam matriks apabila lebih kecil dari 0 (nol), maka nilai dianggap 0 (nol). 4. Memulai traceback dari nilai yang tertinggi yang ditemukan dimanapun pada matriks. 5. Penghitungan dilanjutkan hingga skor bernilai 0 (nol).
10
Robert W. Irving dalam (Novanta, 2009) merumuskan skema pemrograman dinamis algoritma klasik Smith-Waterman kedalam dua bagian, yaitu : 1. Didefinisikan Sij menjadi nilai maksimun yang didapatkan dari proses perbandingan sebuah substring A pada posisi ke-i dengan sebuah substring B pada posisi ke-j. Hubungan rekurens standar untuk Sij, yaitu : -
Jika A(i) = B(j) maka Sij = Si-1,j-1+h, atau
-
Jika A(i) ≠ B(j) maka Sij = max(0,Si-1,j-d,Si,j-1-d,Si-1,j-1-r)
-
Dimana kondisi awal adalah Si,0 = S0,j = 0 untuk semua i,j.
2. Digunakan ide traceback path untuk mengkonstruksikan sebuah local alignment yang optimal pada posisi ke-i substring A dan posisi ke-j substring B agar lebih jelas terlihat. Dengan diberikan sel (i,j) dapat didefinisikan sebuah sel parent sebagai berikut : -
Jika Sij = 0, maka sel (i,j) tidak mempunyai parent
-
Jika A(i) = B(j), maka sel (i,j) mempunyai parent sel (i-1,j-1)
-
Sebagai tambahan, sel (i,j) mempunyai parent yaitu untuk sel (p,q) ϵ {(i1,j),(i,j-1)} sehingga Sij = Spq-d, dan/atau sel (i-1,j-1) jika Sij = Si-1,j-1-r
2.2. Penelitian Terkait Sudah terdapat beberapa penelitian sebelumnya yang sama, yakni mengenai sebuah sistem pendeteksi kesamaan dokumen teks. Penelitian-penelitian tersebut menggunakan berbagai algoritma diantaranya algoritma Rabin-Karp, SmithWaterman, Brute Force, dan Edit Distance.
11
Penelitian sebelumnya telah dilakukan oleh Novanta (2009) dengan judul Pendeteksian Plagiarisme Pada Dokumen Teks Dengan Menggunakan Algoritma Smith-Waterman. Dari penelitian ini disimpulkan bahwa Algoritma SmithWaterman memiliki keakuratan yang lebih baik pada saat membandingkan dokumen yang mengandung perubahan struktur kalimat khususnya dalam paragraf ketimbang perubahan struktur kata di dalam kalimat. Akan tetapi sistem ini hanya dapat membaca dokumen dengan tipe file .txt, dan masih belum menggunakan penerapan Graphical User Interface (GUI) dalam antarmuka sistemnya. Penelitian lain mengenai sistem pendeteksi plagiarisme juga telah dilakukan oleh Novian, dkk. (2012), dengan menggunakan algoritma Rabin-Karp. Judul yang digunakan dalam penelitiannya yaitu Aplikasi Pendeteksian Plagiat Pada Karya Ilmiah Menggunakan Algoritma Rabin-Karp. Aplikasi yang dibuat menggunakan Microsoft Visual C++, dan modifikasi dari algoritma pencocokan string Rabin-Karp. Aplikasi yang dibuat mampu membandingkan dokumen dengan data yang besar dalam jumlah yang banyak dan juga menampilkan katakata yang sama dari kedua dokumen yang dibandingkan. Untuk pengembangan sistem yang lebih baik, penulis akan mengembangkan sistem yang menggunakan algoritma Smith-Waterman yang mampu melakukan perbandingan dokumen bukan hanya terbatas pada tipe data .txt, akan tetapi bisa digunakan untuk pembacaan dokumen bertipe .doc, .pdf, dan juga disertai kemampuan untuk menampilkan letak kesamaan dari kedua dokumen.
12