E S N T E
ISSN: 2088-9984
PROSIDING
S N E T E
PROSIDING
SNETE 2013
SEMINAR NASIONAL & EXPO TEKNIK ELEKTRO KE-3 TAHUN 2013
HERMES PALACE HOTEL - BANDA ACEH 26 AGUSTUS 2013
SNETE 2013
Sinergisitas Perkembangan Penelitian di Bidang Teknik Elektro dan Peningkatan Produktivitas Industri dalam Mengisi Pembangunan Nasional
Organizer:
Sponsor:
Jurusan Teknik Elektro Fakultas Teknik Universitas Syiah Kuala
ISSN: 2088-9984
Jurusan Teknik Elektro Fakultas Teknik - Universitas Syiah Kuala Jl. Tgk. Syech Abdurrauf no. 7 Kopelma Darussalam, Banda Aceh - 23111 Telp./Fax.: +62-651-7554336 Email:
[email protected] http://elektro.unsyiah.ac.id
Co-organizer:
Magister Teknik Elektro Teknik Elektro Universitas Syiah Kuala Universitas Malikussaleh
Politeknik Negeri Lhokseumawe
Politeknik Aceh
http://elektro.unsyiah.ac.id/snete/2013
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
PROSIDING
SNETE 2013 SEMINAR NASIONAL DAN EXPO TEKNIK ELEKTRO 2013
ISSN: 2088-9984
26 AGUSTUS 2013 HERMES PALACE HOTEL BANDA ACEH
Editor: Dr. Teuku Yuliar Arif, S.T., M.Kom. Zulfikar, S.T., M.Sc.
i
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
ii
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
KATA PENGANTAR
Puji syukur kehadirat Allah SWT, atas segala rahmat dan hidayah-Nya sehingga pada tahun 2013 ini Seminar Nasional Teknik Elektro (SNETE) ke-3 dapat dilaksanakan kembali. SNETE2013 merupakan kelanjutan SNETE2011 yang dilaksanakan di Banda Aceh dan SNETE2012 yang dilaksanakan di Medan. SNETE2013 mengusung tema “Sinergitas Perkembangan Penelitian di Bidang Teknik Elektro dan Produktivitas Industri dalam Mengisi Pembangunan Nasional”. Bidang ilmu Teknik Elektro yang mencakup bidang Teknik Energy Listrik, Teknnik Telekomunikasi, Teknik Elektronika, Teknik Sistem Kendali, Teknik Komputer dan Informatika dewasa ini terus berkembang dengan pesat. Untuk dapat terus mengikuti perkembangan tersebut, berbagai kemajuan dibidang keilmuan, hasil penelitian dan inovasi Teknik Elektro perlu secara terus meneruskan saling dipertukarkan dan disebarkan ke khalayak melalui berbagai media, salah satunya melalui kegiatan SNETE. SNETE2013 diisi oleh tiga pembicara kunci mewakili kalangan akademisi dan praktisi/industri. Selain itu, sejumlah 40 makalah ilmiah dari berbagai bidang dipresentasikan oleh pemakalah dari berbagai universitas dan lembaga/institusi nasional. Pada sesi ekspo, SNETE2013 juga menampilkan berbagai produk teknologi dari karya peniliti dan industri. Atas nama panitia SNETE 2013, izinkan saya menyampaikan penghargaan atas dukungan terselenggaranya kegiatan ini kepada : Rektor Universitas Syiah Kuala, Dekan Fakultas Teknik Universitas Syiah Kuala, serta institusi pendidikan lainnya yang mendukung acara ini: Magister Teknik Elektro Universitas Syiah Kuala, Jurusan Teknik Elektro Universitas Malikussaleh, Polteknik Aceh, Polteknik Negeri Lhokseumawe; para pembicara kunci, para sponsor, dan seluruh panitia pelaksana sehingga seminar ini dapat terlaksana dengan baik. Secara khusus, saya juga mengucapkan terima kasih kepada seluruh pemakalah dan peserta, atas partisipasi, kontribusi dan inovasi nyata bagi perkembangan ilmu Teknik Elektro melalui SNETE2013. Selamat Seminar! Terima Kasih
Dr. Teuku Yuliar Arif, S.T., M.Kom. Ketua Panitia
iii
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
iv
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
PANITIA SEMINAR NASIONAL DAN EKSPO TEKNIK ELEKTRO SNETE 2013
Penanggung Jawab
: Dr. Ir. Marwan (Dekan Fakultas Teknik Unsyiah Syiah Kuala)
Wakil Penaggung Jawab
: 1. Dr. Ir. Mirza Irwansyah, MBA., MLA. (Pembantu Dekan I, Fakultas Teknik Unsyiah Syiah Kuala) 2. Ir. Syahrizal, MT. (Pembantu Dekan II, Fakultas Teknik Unsyiah Syiah Kuala) 3. Dr. M. Ilham Maulana, ST., MT (Pembantu Dekan III, Fakultas Teknik Unsyiah Syiah Kuala) 4. Dr. Ir. Taufiq Saidi, M.Eng (Pembantu Dekan IV, Fakultas Teknik Unsyiah Syiah Kuala)
Pengarah
: 1. Prof. Dr. Ir. Yuwaldi Away, M.Sc 2. Ir. Mansur Gapy, M.Sc 3. Ir. Syahrizal, MT 5. Ir. Agus Adria, M.Sc
Koordinator Wakil Koordinator
: Dr.Ir. Rizal Munadi, MM, MT : Alfisyahrin, ST., MT
Ketua Pelaksana Wakil Ketua Pelaksana Sekretaris Bendahara
: : : :
Komite Pelaksana
: Program 1. Dr. Syahrial M.Eng 2. Dr. Khairul Munadi, ST.,M.Eng 3. Dr. Nasaruddin, ST.,M.Eng 4. Dr. Taufig A Gani, S.Kom.,M.Eng.Sc 5. Rahmad Dawood, S.Kom, M.Sc 6. Alfatirta Mufti, ST, M.Sc 7. Syukriyadin, ST, MT 8. Mahdi Syukri, ST, MT 9. Zulhelmi, ST, M.Sc
Dr. Teuku Yuliar Arif, ST, M.Kom Zulfikar, ST, M.Sc Melinda, ST, M.Sc M. Irhamsyah, ST, MT
v
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
Publikasi dan Dokumentasi 1. Yudha Nurdin, ST, MT 2. Hubbul Walidainy, ST, MT 3. Sayed Muchallil, ST, M.Sc 4. Ir. Ernita Dewi Meutia, M.S.Tc.E 5. Ir. Walidin, MT 6. Zulsyukri, ST
Kesekretariatan dan Sponsorship 1. Dr. Fitri Arnia, ST.,M.Eng.Sc 2. Mohd Syaryadi, ST., M.Sc 3. Fardian, ST., M.Sc 4. Roslidar, ST, M.S.Tc.E 5. Jasmiati, A.Md 6. Dewi Yana, SHi Logistik dan Expo 1. Tarmizi, ST, M.Sc 2. Yunidar, S.Si, MT 3. Ramdhan Halid Siregar, ST, MT 4. Ahmadiar, ST, M.Sc 5. Afdal, ST, M.Sc 6. Yudha Iskandar, ST 7. Ali Imron, ST 8. Edi Sukriansyah, ST
vi
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
DAFTAR REVIEWER
Prof. Dr. Ir. Yuwaldi Away, M.Sc
Universitas Syiah Kuala
Prof. Zainal A.Hasibuan, Ir.,MLS, PhD
Universitas Indonesia
Prof. Dr. Ir. Riri Fitri Sari, M.Sc., MM
Universitas Indonesia
Prof. Tulus, M.Si.,Ph.D
Universitas Sumatra Utara
Dr. Ir. Rinaldi Munir, MT
Institut Teknologi Bandung
Dr. Ardian Ulvan, ST., M.Sc
Universitas Lampug
Dr.Ir. Rizal Munadi, MM, MT
Universitas Syiah Kuala
Dr. Ir. Syahrial, M.Eng
Universitas Syiah Kuala
Dr. Taufig A Gani, S.Kom.,M.Eng.Sc
Universitas Syiah Kuala
Dr. Khairul Munadi, ST.,M.Eng
Universitas Syiah Kuala
Dr. Nasaruddin, ST.,M.Eng
Universitas Syiah Kuala
Dr. Fitri Arnia, ST.,M.Eng.Sc
Universitas Syiah Kuala
Rahmad Dawood, S.Kom, M.Sc
Universitas Syiah Kuala
Roslidar, ST, M.S.Tc.E
Universitas Syiah Kuala
Alfatirta Mufti, ST, M.Sc
Universitas Syiah Kuala
Syukriyadin, ST, MT
Universitas Syiah Kuala
Mahdi Syukri, ST, MT
Universitas Syiah Kuala
Zulhelmi, ST, M.Sc
Universitas Syiah Kuala
Ikhwanus, ST.,MT
Universitas Malikussaleh
Muhammad Syahroni, ST., MT.
Politeknik Negeri Lhokseumawe
vii
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
DAFTAR ISI Kata Pengantar
iii
Panitia Seminar Nasional dan Expo Teknik Elektro SNETE 2013
v
Daftar Reviewer
vii
Daftar Isi
viii
A. ENERGI LISTRIK Generator Mini Dengan Prinsip Termoelektrik Dari Uap Panas Kondensor Pada Sistem Pendingin 1 Ryanuargo, Syaiful Anwar dan Sri Poernomo Sari Universitas Gunadarma Rancang Bangun Sistem Penerangan Dengan Menggunakan Solar Cell Berbasis Mikrokontroler Atmega 16 Rouhillah dan Ilham Hasbiullah Politeknik Aceh Perancangan Prototype Generator Magnet Permanen Fluks Aksial Pada Pembangkit Listrik Tenaga Angin Untuk Penerangan Lampu Jalan Dhiyaul Farhan M. Nur, Ramdhan Halid Siregar dan Mahdi Syukri Universitas Syiah Kuala Perancangan Alternator Kecepatan Rendah Yang Di Pakai Pada Turbin Angin Tipe Horizontal Multi Blade Di Pantai Alue Naga Aceh Besar Analdi Muttaqin, Mahdi Syukri dan Ramdhan Halid Siregar Universitas Syiah Kuala Studi Kelayakan Investasi Pembangkit Listrik Tenaga Mini Hidro di Bendungan Krueng Jreu Indrapuri Aceh Besar Hendrayana, Syukriyadin, Fadli dan Muhammad Rizal Fachri Universitas Syiah Kuala Operasi Ekonomis Melalui Pengaturan Frekwensi Sistem Joko Pitoyo, Haryo Pramita Sedewa dan Ahmad Edy Syukral PLN INDONESIA Simulasi Sinkronisasi Generator 3 Fasa Pada PLTMH Isolated Berbasis Mikrokotroler Atmega 16 Muhammad Rizal Fachri, Syukriyadin dan Hendrayana Universitas Syiah Kuala viii
8
12
20
29
37
42
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
Analisa Jaringan Distribusi 20 kv Menggunakan FMEA Pada PT. PLN Cabang Medan Cholish dan Syukriadin Universitas Syiah Kuala
49
B. TEKNIK TELEKOMUNIKASI Sistem Pengolahan Data Satelit S-NPP Berbasis CSPP: RDR ke SDR Budhi Gustiandi dan Andy Indradjad Lembaga Penerbangan dan Antariksa Nasional
56
Pengaruh Lebar Slot Aperture Pada Antena Mikrostrip Aperture Coupled 2,4 GHz Ipan Suandi dan Eko Setijadi Institut Teknologi Sepuluh Nopember
63
Prototipe Arduino Untuk Sistem Identifikasi Lokasi Berbasis GPRS Edi Sukriansyah, Rahmad Dawood dan Nasaruddin Universitas Syiah Kuala
69
Ancaman Kemanan dan Privasi pada Radio Frequency Identification Tag (RFID) –Ikhtisar Ernita Dewi Meutia Universitas Syiah Kuala
75
Perbandingan Daya Penerimaan Dengan Menggunakan IEEE 802.11n dan 802.11b/g Pada Gedung ICT Center Unsyiah Syahrial, Hubbul Walidainy dan Mulyadi Universitas Syiah Kuala Evaluasi Kinerja Jaringan Multihop Relay WiMAX Dhara Monica Aqsa, Nasaruddin dan Muhammad Irhamsyah Universitas Syiah Kuala Pengaruh Preamble HT-Mixed dan HT-Greenfield Terhadap Throughput MAC DCF pada IEEE 802.11n Teuku Yuliar Arif Universitas Syiah Kuala Analisis Performansi Jaringan 3G UMTS/WCDMA Operator XL Dengan Menggunakan Metode Drive Test (Studi Kasus Universitas Syiah Kuala) Hubbul walidainy, Melinda, Syahrial dan Aulia Al Farabi Universitas Syiah Kuala
ix
82
87
92
100
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
Antena Mikrostrip Susun dengan Pencatuan Proximity Couple Untuk X-band Radar Fitri Yuli Zulkifli, Nugroho Adi Saputro, Basari dan Eko Tjipto Rahardjo Universitas Indonesia
106
Analisis Unjuk Kerja Algoritma MUSIC dan ESPRIT pada Pendeteksian Arah Kedatangan Sinyal pada Antena Array Linear 109 Muhammad Syahroni Politeknik Negeri Lhokseumawe Analisis Unjuk Kerja Jaringan WLAN IEEE 802.11g Dengan Metode ISATAP Rizal Munadi, Mujir Syah Dani dan Sayed Muchallil Universitas Syiah Kuala
114
C. ELEKTRONIKA DAN INSTRUMENTASI Pemanfaatan Mikrokontroller Tipe Atmega 8535 Sebagai Pengendali Inverter 3 Fasa Dengan Pemrograman ½ λ Yohanes Rikky Wibowo dan Leonardus Heru Pratomo Universitas Katolik Soegijapranata Perancangan Sistem Pendeteksi Kondisi Kebusukan Telur Ayam Berbasis Mikrokontroler AVR Atmega8 Dengan Menggunakan Sensor LDR (Light Dependent Resistor) Alfisyahrin, Fardian dan Zakaria Universitas Syiah Kuala Monitoring Secara Online Temperatur Transformator Distribusi Menggunakan Layanan Pesan Singkat (SMS) Noer Soedjarwanto dan Osea Zebua Universitas Lampung Pendeteksi Kecepatan Kendaraan Menggunakan Laser Pointer Dan Fotodioda Berbasis Arduino Uno Yunidar, Alfisyahrin dan Irfan Furqan Universitas Syiah Kuala
118
124
130
136
D. TEKNIK INFORMATIKA DAN KOMPUTER Rancangan Change Management Bisnis Konvesional Ke E-Business Menggunakan Model E-Transformation Process-Technology-People (P-T-P) (Studi Kasus :UNIKOM) Diana Effendi Universitas Komputer Indonesia
x
142
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
Analisis kinerja XML, JSON, dan HTML data pada Web Billing System PDAM Aceh Jaya Dien Taufan Lessy dan Ichsan Politeknik Aceh
148
Penentuan Lokasi Pembangunan Industri Baru Menggunakan SAW dan AHP Mutammimul Ula Universitas Malikussaleh
152
Rancang Bangun Aplikasi Menu Restoran dan Warung Kopi Berbasis Android Jurnalis J.Hius dan Mustari STMIK U’Budiyah dan Politeknik Aceh
159
Kajian Mengenai Pemanfaatan Teknologi Virtualisasi pada Sebuah Perusahaan Wina Witanti Universitas Jenderal Achmad Yani
166
Prototipe Desain Visual Realitas Tertambah dengan Kacamata Pintar di Museum Fatahillah Leonardo Adi Dharma Widya dan Yuke Ardhiati Universitas Trisakti
172
Spektrum Ekson Sekuen Deoxyribo Nucleic Acid Menggunakan Transformasi Fourier Diskrit Suhartati Agoes dan Steven Universitas Trisakti
179
Model Transformasi Informasi Digital Dengan Metode Encoder-Decoder Perkalian Angka Sembilan Bobby Yuhanda dan Nasaruddin Universitas Syiah Kuala
185
Pengaruh Alokasi Memori Terhadap Waktu Eksekusi Pada Komputasi Hadoop Cluster Harits Arunda Achsan, Taufiq Abdul Gani, Melinda, Yuwaldi Away, Zefriansyah dan Teddy Juana Universitas Syiah Kuala dan UKCC Research Group
191
Performansi Beberapa Metode Pengacakan Citra Berbasis Discrete Cosine Transform Mutia Hanum, Khairul Munadi dan Fitri Arnia Universitas Syiah Kuala
197
Analisis Performansi Apache Web Server Pada Raspberry Pi Teddy Juana, Zefriansyah, Yuwaldi Away, Melinda dan Harits Arunda A UKCC Research Group dan Universitas Syiah Kuala
201
Rancang Bangun Sistem Informasi dan Aplikasi Penjualan pada Koperasi Kartika Salak Dina Anggraini, Widiastuti dan Faizal Universitas Gunadarma
205
xi
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
Analisa Kebutuhan User Aplikasi e-Gampong (Sistem Tata Kelola dan Diseminasi Informasi Desa di Aceh Berbasis TIK) Fathia Sabrina, Khairul munadi dan Rahmad Dawood Universitas Syiah Kuala Penerapan UCD pada Aplikasi Magic Book Alumni Mahasiswa Berbasis AR Agus Komarudin dan Rezki Yuniarti Universitas Jenderal Achmad Yani Mengukur Tingkat Kesamaan Paragraf Menggunakan Vector Space Model untuk Mendeteksi Plagiarisme Taufiq M. Isa dan Taufik Fuadi Abidin Universitas Syiah Kuala
214
220
229
Aplikasi Pengirim dan Pembalas SMS Otomatis pada Smartphone Berbasis Android Ahmad Raf’ie Pratama dan Fachrudin Gilang Dewantara Universitas Islam Indonesia
235
A Model of Information Guide for Universitas Syiah Kuala Ahmadiar Universitas Syiah Kuala
242
E. TEKNIK SISTEM KENDALI Desain 2-Dof Pi Dengan Decoupling Pada Pengaturan Level Coupled Tanks Muhammad sadli, Katjuk Astrowulan dan Ali Fatoni Institut Teknologi Sepuluh Nopember
247
Arsitektur Behavior-Based Dengan Fuzzy Untuk Navigasi Car-Like Mobile Robot Sarmayanta Sembiring, Usman Baafai, Tulus dan Pernantin Tarigan Universitas Sumatera Utara
253
xii
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
Mengukur Tingkat Kesamaan Paragraf Menggunakan Vector Space Model untuk Mendeteksi Plagiarisme Taufiq M. Isa 1) dan Taufik Fuadi Abidin 2) 1) Jurusan Matematika, FMIPA, Universitas Syiah Kuala Jl. Syech Abdurrauf No. 3, Kopelma Darussalam, Banda Aceh, 23111, Indonesia email:
[email protected] 2)
Jurusan Informatika, FMIPA, Universitas Syiah Kuala Jl. Syech Abdurrauf No. 10, Kopelma Darussalam, Banda Aceh, 23111, Indonesia email:
[email protected]
plagiarisme. Sebagai contoh, artikel yang berjudul RI as a new middle power yang ditulis oleh salah seorang profesor di the Jakarta Post pada tanggal 12 November 2009 diduga sangat mirip dengan artikel yang ditulis oleh Carl Ungerer yang berjudul The Middle Power Concept in Australian Foreign Policy yang dipublikasikan di Australian Journal of Politics and History, volume 53(4), halaman 538-551 pada tahun 2007. Karena tulisan sang professor lebih baru dari tulisan yang ditulis Carl Ungerer maka diduga tindakan plagiarisme telah terjadi pada tulisan tersebut [1]. Surat edaran yang dikeluarkan oleh Direktorat Jenderal Pendidikan Tinggi (DIKTI), Kementerian Pendidikan dan Kebudayaan pada tanggal 18 Oktober 2010 perihal pencegahan dan penanggulangan plagiat menyebutkan bahwa dalam penentuan kenaikan jabatan akademik seorang guru besar diperlukan penilaian sejawat (peer review) oleh minimal 2 orang guru besar dari perguruan tinggi lain. Langkah itu perlu mendapat apresiasi, namun dalam melakukan penilaian sejawat, sangat sulit bagi penilai memeriksa dan membandingkan karya ilmiah yang diajukan dengan karya ilmiah lain satu per satu. Membandingkan karya ilmiah secara manual akan menghabiskan banyak waktu dan tenaga. Oleh karena itu, dibutuhkan aplikasi yang dapat menentukan kemiripan dokumen atau bagian dalam dokumen dengan cepat [2]. Jika tingkat kesamaan antar dokumen atau bagian dari dokumen tinggi maka dapat diduga telah terjadi tindakan plagiarisme pada dokumen atau bagian dari dokumen tersebut. Membandingkan sebuah dokumen dengan semua dokumen yang ada dalam database juga membutukan banyak waktu walaupun dilakukan dengan bantuan komputer. Jika terdapat n buah dokumen dalam database maka kompleksitas untuk menghitung tingkat kesamaan antar pasangan dokumen adalah O(n2). Bila n cukup besar maka proses perhitungan membutuhkan waktu yang lama. Untuk itu, penentuan k buah dokumen yang relevan harus
ABSTRACT A statement cited from other sources but is not referenced correctly can be categorized as plagiarism. Plagiarism can be identified by measuring the similarity of paragraphs in documents. If a database has n documents, the complexity to calculate the degree of similarity between two documents is O(n2), and if the value of n is very large, the calculation will take a lot of time. In this paper, we propose and describe an algorithm to measure the similarity of documents. The process is started by finding k relevant documents using swish-e (simple web indexing system for humans - enhanced), and then, the vectors of paragraphs are constructed. Cosine angle of two vectors is computed to measure the similarity of paragraphs in the documents. Our results show that the algorithm works well to measure the similarity of paragraphs in document.
Key words Vector Space Model, pendeteksian plagiarisme
tingkat
kesamaan
paragraf,
1. Pendahuluan Kemajuan teknologi berdampak positif dan negatif. Dampak positif telah banyak dirasakan oleh manusia dan tidak perlu dibahas lagi, sedangkan dampak negatif masih harus terus dikurangi dan dicarikan langkah solutifnya. Kemudahan seseorang untuk mendapatkan dokumen secara online adalah salah satu contoh dari dampak positif kemajuan teknologi internet. Namun, ketika kemudahan itu kemudian disalahgunakan dengan mengutip tulisan orang lain tanpa menulis rujukan secara benar maka tindakan plagiarisme akan terus meningkat. Tulisan atau potongan tulisan yang diambil dari tulisan orang lain, sengaja atau tidak sengaja, bila tidak dirujuk dengan baik dan benar, dapat dikategorikan sebagai 229
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
dilakukan terlebih dahulu sebelum tulisan dalam dokumen dibandingkan satu per satu. Penentuan k buah dokumen yang relevan dapat dilakukan menggunakan aplikasi swish-e (simple web indexing system for humans – enhanced). Swish-e dapat membangun indeks, menentukan peringkat (ranking), dan mempercepat proses pencarian dokumen berdasarkan kata kunci (query) yang diinputkan oleh pengguna, sama seperti cara kerja mesin pencari (search engine) [4]. Setelah filterisasi dilakukan, vector space model dari setiap paragraf dalam k dokumen akan dibangun. Jika dua buah vektor paragraf diposisikan pada bidang orthogonal maka kedua vektor tersebut akan membentuk sudut. Nilai dari sudut kosinus yang dibentuk oleh kedua vektor itu dapat digunakan untuk mengukur similaritas dari kedua paragraph [5]. Vektor yang berhimpit (bersudut 0 derajat) nilai kosinusnya 1 yang berarti sangat mirip, sebaliknya jika kedua vector bertolak belakang membentuk sudut 90 derajat maka nilai kosinusnya 0 yang artinya tidak ada kesamaan. Kontribusi dari naskah ini adalah: 1. Mendeskripsikan bagaimana swish-e mengindeks dokumen dalam format PDF dan menampilkan dokumen yang relevan berdasarkan query yang diinput oleh pengguna. 2. Membangun vector space model dan menggunakan pengukuran sudut kosinus untuk menentukan similaritas paragraf dalam dokumen. 3. Membuat prototipe aplikasi untuk mendeteksi kesamaan antar dokumen.
perubahan ke dalam format XML atau HTML harus dilakukan terlebih dahulu sebelum swish-e membangun indeks. Swish-e merupakan pengembangan lanjutan dari versi awal yang dibuat oleh Kevin Hughes [7]. Robinowitz dalam publikasinya [4] menyebutkan bahwa swish-e dirancang bukan hanya untuk membangun indeks tetapi juga efektif untuk mencari dokumen yang telah diindeks. Kecepatan swish-e dalam membangun indeks dan mencari dokumen sangat baik sehingga cocok digunakan untuk mencari dan menyaring sejumlah dokumen.
1.3 Pembobotan TF x IDF Term Frequency (TF) dan Inverse Document Frequency (IDF) merupakan pembobotan yang sering digunakan dalam penelusuran informasi dan text mining [8]. TF merupakan pembobotan yang sederhana dimana penting tidaknya sebuah kata diasumsikan sebanding dengan jumlah kemunculan kata tersebut dalam dokumen, sementara IDF adalah pembobotan yang mengukur seberapa penting sebuah kata dalam dokumen bila dilihat secara global pada seluruh dokumen. Nilai pembobotan TF x IDF akan tinggi jika nilai TF besar dan kata yang diamati tidak ditemukan di banyak dokumen. Nilai TF dihitung menggunakan fungsi berikut: TF(d,t) = f(d, t)
(1)
Dimana f(d,t) adalah jumlah kemunculan kata t pada dokumen d. IDF mempertimbangkan frekuensi kata pada seluruh dokumen yang ada. Pembobotan IDF menganggap bahwa bobot sebuah kata akan besar jika kata tersebut sering muncul dalam sebuah dokumen tetapi tidak banyak dokumen yang menggandung kata tersebut. Nilai IDF dihitung menggunakan fungsi berikut:
1.1 Plagiarisme Menurut Kamus Besar Bahasa Indonesia [6], plagiat adalah perbuatan mengambil karangan atau pendapat orang lain dan menjadikannya seolah-olah karangan atau pendapat itu sebagai milik sendiri. Menurut Peraturan Menteri Pendidikan Nasional nomor 17 tahun 2010, plagiat adalah tindakan secara sengaja atau tidak sengaja untuk memperoleh atau mencoba memperoleh kredit atau nilai untuk suatu karya ilmiah dengan mengutip sebagian atau seluruh karya dan/atau karya ilmiah pihak lain yang diakui sebagai karya ilmiahnya tanpa menyatakan sumber secara tepat dan memadai. Sementara, plagiator adalah orang perseorangan atau sekelompok orang pelaku plagiat, masing-masing bertindak untuk diri sendiri, untuk kelompok atau untuk dan atas nama suatu badan.
IDF(t) = log(N/df(t))
(2)
Dimana df(t) adalah jumlah dokumen yang memiliki kata t. Hasil kajian sebelumnya memperlihatkan bahwa pembobotan TF x IDF dapat meningkatkan performansi secara lebih baik [9]. Nilai TF x IDF dihitung menggunakan fungsi berikut ini. TFIDF(d,t) = TF(d,t) x IDF(t)
(3)
1.4 Stopword 1.2 Swish-e
Stopword adalah kumpulan kata-kata yang memiliki nilai f(d, t) dan df(t) yang tinggi. Dengan kata lain, stopword adalah kumpulan kata yang sering muncul dalam dokumen. Karena stopword pada umumnya adalah kata penghubung yang tidak begitu penting maka stopword dapat diabaikan dan tidak ikut diindeks.
Swish-e adalah sebuah aplikasi yang dapat digunakan untuk mengindeks dokumen dalam jumlah besar, mencari dokumen dengan cepat, dan menentukan peringkat dari dokumen secara akurat [4]. Dokumen dapat berformat HTML, TXT, dan XML. Khusus untuk dokumen PDF,
230
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
1.5 Vector Space Model (VSM)
2. Metode Penelitian
Model ruang vektor (vector space model) sering digunakan untuk mempresentasikan sebuah dokumen dalam ruang vektor [10]. Dalam kajian ini, VSM dari paragraf digunakan untuk mengukur kemiripan antara dua paragraf pada dokumen yang berbeda. Paragraf merupakan vektor berdimensi n dan parameter t adalah semua kata yang ditemukan dalam daftar leksikon (vocabulary) tanpa duplikasi. Gambar 1 memperlihatkan tiga buah vektor pada ruang dimensi 3. Nilai kosinus digunakan untuk mengukur tingkat kesamaan antar dua vektor. Pada Gambar 1, P1 adalah vektor dari paragraf pembanding, sementara P2 dan P3 adalah vektor dari paragraf yang dibandingkan
2.1 Dataset Dataset yang digunakan dalam kajian ini adalah dokumen PDF dalam bahasa Indonesia yang berasal dari repositori beberapa universitas di Indonesia (Tabel 1). Total dokumen PDF adalah sebanyak 52.889. Dokumen PDF tersebut kemudian dibersihkan [11] dan diubah ke dalam format XML agar dapat diindeks oleh swish-e. Dari hasil preprocessing, ditemukan 13 file PDF yang tidak memenuhi syarat karena file tersebut hanya berisi gambar dan tanpa tulisan. Sementara untuk penelitian ini, dokumen harus memiliki minimal tulisan karena tujuan penelitian adalah menentukan kesamaan antar dokumen yang dihitung berdasarkan antar kesamaan paragraf dalam dokumen. Total dokumen yang digunakan setelah preprocessing berjumlah 52876. Tabel 1 Dataset
Sumber UI ITS UNDIP UNM UNS
Gambar 1 Vector Space Model
Jika P1 adalah vektor dari paragraf pembanding dan P2 adalah vektor dari paragraf yang dibandingkan, maka P1 dan P2 merupakan dua buah vektor dalam ruang berdimensi n, dimana n=3, dan θ adalah sudut yang dibentuk oleh kedua vektor tersebut.
P1 P2 P1 P2 Cos
UPI
n
Pi i 1
1
2
dan
P2
(4)
i 1
2
2
(5)
Selanjutnya, tingkat kesamaan dari kedua vektor dihitung berdasarkan rumus sudut kosinus yang terbentuk dari kedua vektor pada bidang orthogonal. Jika kosinus bernilai 1 makan kedua vektor tersebut memiliki tingkat kesamaan yang tinggi. Jika kosinus bernilai 0 maka dapat dikatakan bahwa kedua vektor tersebut memiliki tingkat kesamaan yang rendah [11].
Sim( P1 , P2 ) Cos
P1 P2 P1 P2
1565
Proses membangun prototipe untuk mendeteksi plagiarisme dibagi menjadi dua tahap. Tahap pertama adalah mengubah format dokumen dan membangun indeks. Tahap kedua adalah menghitung nilai similaritas antara paragraf-paragraf pada sebuah dokumen dengan paragraf-paragraf pada dokumen lain yang termasuk dalam k dokumen yang relevan dari hasil perankingan yang dilakukan swish-e. Langkah-langkah pada tahap awal diilustrasikan pada Gambar 2. Pada tahapan I, dokumen dalam format PDF diubah menjadi dalam format XML. Hal ini dilakukan karena swish-e hanya dapat mengindeks dokumen dalam format HTML, TXT, dan XML. Bersamaan dengan proses perubahan format tersebut, akhir dari setiap paragraf disisipkan simbol #. Hal ini dilakukan untuk memudahkan proses identifikasi paragraf dalam dokumen saat VSM dari paragraf dibangun. Tahapan I ini dilakukan sekali saja selama tidak ada perubahan dokumen dalam database. Dengan kata lain, proses pembersihan, konversi format, dan pembangkitan indeks hanya dilakukan sekali selama database tidak berubah.
n
Pi
http://repository.ui.ac.id http://digilib.its.ac.id http://eprints.undip.ac.id http://library.um.ac.id http://uap.unnes.ac.id/ data/skripsi/pdf http://abstrak.digilib.upi.edu
Jumlah File 3686 1126 23 21818 24658
2.2 Algoritma
dimana P1 P2 merupakan inner product dari kedua vektor tersebut dan |P1| dan |P2| adalah panjang vektor.
P1
URL
(6)
231
Seminar Nasional dan ExpoTeknik Elektro 2013
Dokumen PDF
Mengubah format
swish-e indeks
ISSN: 2088-9984 Selanjutnya, nilai TF x IDF dihitung untuk setiap kata yang ada dalam paragraf. Dengan kata lain, nilai TF x IDF merupakan nilai elemen dari vektor paragraf yang jumlahnya sebanyak kata non-stopword dalam semua paragraf dan unik (tidak duplikasi). Setelah perhitungan TF x IDF selesai dilakukan, langkah selanjutnya adalah menghitung nilai similaritas antar paragraf untuk mengukur tingkat kemiripan antar paragraf. Nilai threshold kemiripan dapat diatur sesuai keinginan pengguna, misalnya 70%, 80%, 90%, atau 100%.
Dokumen XML
swish-e
Gambar 2 Tahapan I
Pada tahapan II, masukkan penting yang harus diberikan oleh pengguna adalah query dan parameter k. Query dapat berupa satu kata atau lebih dan jumlah maksimum dokumen yang akan diambil ditentukan oleh parameter k. Selanjutnya, semua kata tanpa duplikasi dan non-stopword dikumpulkan dari setiap paragraf. Bersamaan dengan proses ini, nilai IDF juga dihitung. Nilai TF tidak dihitung karena pada saat swish-e membangun indeks nilai TF telah dihitung. Tahapan II secara lengkap diilustrasikan pada Gambar 3.
3. Hasil dan Pembahasan 3.1 Hasil Pengujian Algoritma Pengujian algoritma dilakukan menggunakan beberapa jenis query, yaitu query satu kata, dua kata, dan tiga kata. Total query adalah 15, masing-masing 5 query untuk setiap jenis. Daftar query yang digunakan dalam pengujian dirangkum pada Tabel 2. Tabel 2 Query yang digunakan
Satu Kata algoritma pendidikan
Memasukkan Query
jaringan Meranking dokumen (swish-e)
Swish-e indeks
peluang belajar
Mengambil paragraf
Menentukan unik kata dan nilai IDF
Paragrafparagraf
Menghilangkan stopwords
Mencari nilai TF x IDF
Menghitung similaritas paragraf
logika matematika kultur jaringan
kurikulum berbasis kompetensi sistem informasi geografis
ekonomi kerakyatan
pengolahan rumput laut
Kemiripan antar paragraf dibagi menjadi tiga kelompoek yaitu kemiripan dengan similaritas rendah, sedang, dan tinggi. Similaritas rendah memiliki nilai similaritas antara 50-65,99%, similaritas sedang memiliki nilai kesamaan antara 66-80,99%, sedangkan similaritas tinggi memiliki nilai kemiripan antara 81-100%. Gambar 4 memperlihatkan diagram batang rata-rata similaritas untuk query satu kata. Query Satu Kata
Pasangan Paragraf
k dokumen yang relevan
Query Dua Kata Tiga Kata penggalian data pemrograman berbasis web ilmu komputer kamus bahasa Indonesia
Membangun Vector Space Model
21.6
25 20
15
15
8.2
10 5 0 Rendah
Sedang
Tinggi
Similaritas
Nilai similaritas antar paragraf
Gambar 4. Rata-rata similaritas untuk query satu kata Gambar 3. Tahapan II
232
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
Hasil kajian menggunakan query satu kata menunjukkan bahwa pasangan paragraf dalam kelompok similaritas tinggi lebih banyak dibanding dengan pasangan paragraf dengan similaritas rendah dan sedang. Jumlah rata-rata pasangan paragraf dalam kelompok similaritas tinggi adalah 21,6 pasang, diikuti dengan kelompok similaritas rendah dan kelompok similaritas masing-masing bernilai 15,0 dan 8,2. Gambar 5 memperlihatkan diagram batang dari rata-rata similaritas untuk query dua kata.
Pasangan paragraf
Rata-rata Query Satu, Dua, dan Tiga Kata 500
499.4
400 300
201.8
200 100
5.4
0 Rendah
Sedang
Tinggi
Similaritas
Pasangan Paragraf
Query Dua Kata 1500
1461.6
Gambar 7. Rata-rata similaritas untuk semua query
1000 581
3.2 Prototipe Aplikasi Pendeteksian Plagiarisme
500
Prototipe dari aplikasi pendeteksian plagiarisme telah diimplementasikan dan diuji kemampuannya mendeteksi kemiripan pasangan paragraf. Gambar 8 memperlihatkan tampilan awal dari prototipe tersebut.
6 0 Rendah
Sedang
Tinggi
Similaritas
Gambar 5. Rata-rata similaritas untuk query dua kata
Gambar 5 memperlihatkan bahwa hasil query dua kata juga mirip dengan hasil query satu kata. Jumlah pasangan paragraf dengan similaritas tinggi lebih banyak bila dibanding dengan similaritas rendah dan sedang. Jumlah rata-rata pasangan paragraf dengan similaritas tinggi adalah 1461,6 pasang, diikuti dengan kelompok similaritas rendah dan kelompok similaritas sedang masing-masing 581,0 dan 6,0. Hasil kajian untuk query tiga kata (Gambar 6) dan semua query (Gambar 7) menunjukkan bahwa algoritma yang diusulkan berhasil mendeteksi dengan baik kemiripan dari pasangan paragraf. Hasil kajian memperlihatkan bahwa pasangan paragraf dengan similaritas tinggi dapat dideteksi dengan baik.
Gambar 8. Tampilan awal aplikasi
Pasangan Paragraf
Query Tiga Kata 15 15
9.4 10 5
2 Gambar 9. Keluaran dari aplikasi
0 Rendah
Sedang
Tinggi
Halaman awal menyediakan fasilitas untuk mengunggah file dalam format PDF untuk diperiksa tingkat similaritasnya dengan dokumen-dokumen yang ada dalam database. Pengguna juga harus menentukan query dan nilai k atau jumlah dokumen yang relevan yang ingin dicari (Gambar 9).
Similaritas
Gambar 6. Rata-rata similaritas untuk query tiga kata
233
Seminar Nasional dan ExpoTeknik Elektro 2013
ISSN: 2088-9984
4. Kesimpulan dan Saran
REFERENSI
4.1 Kesimpulan
[1]
Thejakartapost, 2013, ”Plagiarism”, www.thejakartapost. com/news/2010/02/04/plagiarism.html, akses 7 Jan 2013. [2] C. K. Kent, N. Salim, 2010, ”Features Based Text Similarity Detection”, Journal of Computing, vol 2 (1). [3] Z. P. Yang, Y. Zeng, Yanshan, 2010, ”The Design and Implementation of Document Similarity Detecting System”, Journal of Information and Computional Science, vol 7(3). [4] J. Robinowitz, 2004, ”Indexing Arbitary Data with Swishe”, The Proceedings of the 2004 USENIX Technical Conference. [5] C. Manning, P. Raghavan, H. Schutze, 2008, ”Introduction to Information Retrieval”, New York. [6] Departemen Pendidikan dan Kebudayaan, 1990, ”Kamus Besar Bahasa Indonesia”, Balai Pustaka, Jakarta. [7] B. Moseley, 2005, ”Swish-e Documentation”, Free Software Foundation, Inc., Boston, USA. [8] K. S. Jones, 2004, ”A Statistical Interpretation of Term Specify and Its Application in Retrieval”, Journal of Documentation, vol 60 (2), pp. 493-502. [9] J. Ramos, 2003, ”Using TF-IDF to Determine the Word Relevance in Document Queries”, Department of Computer Science, Rutgers University, NJ, USA. [10] Turney, P. D. Pantel, Patrick, 2010, ”From Frequency to Meaning: Vector Space Models of Semantics”, Journal of Artificial Intelegence Reseach, vol 37, pp. 141-188. [11] Witten I, Moffat A, Bell T., 1999, ”Managing Gigabytes: Compressing and Indexing Documents and Images”, 2nd edition, Morgan Kaufmann: San Francisco, CA. [12] J. Han, M. Kamber, 2006, ”Data Mining Concepts and Techniques”, Morgan Kaufmann, Oxford.
Hasil kajian menunjukkan bahwa algoritma yang diusulkan dapat mendeteksi dengan baik kesamaan antar dua dokumen. Penentuan similaritas dokumen dilakukan dengan memecah dokumen menjadi paragraf-paragraf. Hasil kajian menggunakan query satu kata, dua kata, dan tiga kata memperlihatkan bahwa pasangan paragraf dengan similaritas tinggi lebih banyak ditemukan dalam dokumen. Temuan ini membuktikan secara empirik bahwa algoritma yang diusulkan dapat mendeteksi dengan baik kesamaan dokumen melalui kesamaan paragraf dalam dokumen.
4.2 Saran Penyempurnaan terhadap prototipe aplikasi masih harus dilakukan. Saat ini, pengguna hanya dapat membandingkan sebuah dokumen dalam format PDF dengan sejumlah dokumen dalam database yang telah disediakan dan belum dapat menentukan database pembanding sesuai keinginan. Analisa terhadap waktu perbandingan juga perlu dilakukan. Selain itu, dalam menghitung kemiripan paragraf, algoritma belum dapat mempertimbangkan posisi kata sehingga kata dalam urutan A dan B akan sama similaritasnya dengan kata dalam urutan B dan A. Pada kajian lanjutan, urutan dan posisi kata dalam tulisan akan diperhitungkan.
234