''J ,?.
.]
q,
PROSIDING
SET
20
rr
Seminar Teknik lnformatika
& Sistem lnformasi
Bandung, 24 September 201 I
Seminar Teknik lnformatika & Sistem lnformasi Fakultas Teknoloei lnformasi Universitas Kristen Maranatha
setisi.itmaranatha.org
PROSIDING
sETrst 2011 Seminar Teknik Informatika & Sistem Informasi
Bandung, z4 September
zorr
Seminar Teknik Informatika & Sistem Informasi Fakultas Teknologi informasi Universitas Kristen Maranatha
PROSIDING Informasi SETISI 2Of 1 Seminar Teknik Informatika & slstem Penvusun: Fakunas Teknologi lformasi
I
Universitas Kdslen Maranatha
Penerbit:
lnlomatika Bandung Cetakan Pertama: Ptember 2011 ISBN:
978- 602'8758-376 CoPYrtgM@ 2011
KOMITE Penanggung Jawab Dekan Fakultas Teknologi Informasi
Universitas Kristen Maranatha
,
Ketua Pelaksana Djoni Setiawan K', S.T., M.T.
Komite Program
.
Ir. Kridanto Surendro, M.Sc., Ph.D (lTB) Dr. dr. Oerip Setiono Iman Santoso, M.Sc. (lTB) Dr. Ir. Husni Setiawan Sastramihardja, M.T. (lTB) Prof. Drs. Jazi Eko lstiyanto, M.Sc., Ph.D (UGM) Drs. Retantyo Wardoyo, M.Sc., Ph.D (UGM) lr. Dana lndra Sensuse, MLIS, Ph.D (Ul) Ito Warsito, Ph.D (UI) Dr. lr. Mewati AYub, MT' (UKM) Teddy Marcus Zakaria, S.Kom., M.T. (UKM)
Komite Pelaksana
,
Radiant V.Imbar, S. Kom., M.T. Adelia, S.Kom. Doro Edi, S.T., M.Kom. Tanti Kristanti, S.T., M.T. Saron K. Yefta, S.Kom.,
M'T.
Diana Trivena Yulianti, S.Kom., M.T. Niko Ibrahim, S.Kom., MIT' Maresha Caroline Wijanto, S.Kom. Wilfridus Bambang, S.T.' M'Cs. Laurentius Risal S, S.T.
,
Meliana Christianti Johan, S'Kom., M.T' Tiur Gantini, S.T. Daniel Jahja Surjawan, S.Kom., M.T. Timotius Witono, S.Kom., M.T. 'ljatur Kandaga, S.Si', M.T. Erico Darmawan Handoyo, S.Kom., M'T' RobbY Tan, S.T., M.Kom. WennY Franciska SenjaYa, S.Kom' Andi Wahju Rahardjo Emanuel, BSEE'' MSSE' Bemard Renaldy Suteja, S'Kom.' M'Kom Hapnes Toba, M.Sc. Sulaeman Santoso, S.Kom. Oscar Karnalim, S.T.
lsBN: 9?8-602-8758-37-6
Serninar Teknik Informatika dan Sistem Informasi Bandung, 24 September 201I
KATA PENGANTAR
Puji dan syukur kami panjatkan ke hadirat Allah Yang Maha Kuasa, karena oleh dan berkat karuniaNya Seminar Teknologi Informatika & Sistem Informasi (seTISI) 2011 dapat dilaksanakan. Saya juga berterima kasih kepada seluruh pemakalah, tim reviewer, dan tim panitia atas kerja keras dan kerja samanya sehingga seminar ini dapat terlaksana. Tak lupa iepada pihak-pihak lain relah membantu rim panita secara langsung atau tidak langsung, saya ucapkan terima kasih Pula.
SeTISI merupakan seminar tahurran yang diselenggarakan oleh Fakultas Teknologi Informasi Universitas Kristen Maranatha Bandung. Seminar tahun ini merupakan titik awal seluruh rangkaian kegiatan yang sedianya akan dilaksanakan secara rutin setiap tahunnya. Seminar ini meirpakan sibuah seminar. yang mempertemukan bidang Teknik Informatika dan Sistem Informasi secara langsung. karena kedua bidang ini merupakan dua bidang yang saling kait mengait dan saling mendukung satu dengan yang lain. oleh karena kuatnya kaitan dan dukringan masing-masing bidang tersebut, membuat kami merasa perlu untuk memp;fiemukannyi secari langsung dan tidak menjadikannya terpisah satu dengan yang lain. Saya, mewakili sigenap panitia, mengharapkan seminar ini dapat menjadi sarana untuk saling membangun, mengimbingkan, dan memperkaya penelitian dari para pemakalah, ygrta mgnjalil tali kekeiluargaan- dan kebersamaan yang lebih erat-diantara para peneliti bidang Teknik lnformatika dan Sistern Irtformasi. Saya ucapkan terima kasih kepada para pemakalah yang telah bersedia mengirimlankan makalah penelitiannya kepada kami dan mengucapkan selamat kepada para pemakalah yang makalahnya dinyatakan layak untuk diterbitkan dalam ptoceeding Seminar Teknik lnformatika dan Sistem Informasi 2011. Sebagaimana layaknya tak ada gading yang tak retak, maka saya mewakili seluruh panitia SeTISI 2011, memohon maaf sebesar-besamya jika dalam proceeding ini terdapat hal-hal yang kurang berkenan kepada para pembaca sekalian'
Bandung, 24 September 20 t 1
Djoni Setiawan K., S.T., M.T. Ketua Panitia Seminar Teknik lnformatika & Sistem Informasi 2011 Fakultas Teknologi Informasi Universitas Kristen Maranatha
Seminar
Tekni\ Informatika dan Sistem Informasi
Bandung,
Z
ISBN: 9?8-602-8758-37-6
September 2011
SAMBUTAN DBKAN
Puji Syukur ke hadirat Tuhan Yang Maha Esa, atas rahmat dan karuniaNya sehingga Seminar Nasional Teknik Informatika dan Sistem Informasi (SETISI) yang diselenggarakan oleh Fakultas Teknologi Informasi, Universitas K-risten Maranatha dapat terlaksana. SETISI ini merupakan seminar nasional pertama yang diselenggarakan oleh Fakultas IT. Kami mengharapkan SeTISI ini sebagai salah satu sarana yang dapat dipergunakan oleh para peneliti dari Universitas Kristen Maranatha dan perguruart tinggi lainnya, khususnya yang memiliki bidang penelitian teknik informatika dan sistem informasi, untuk dapat menyebarluaskan atau mernpublikasikan gagasan-gagasan atau hasil-hasil penenelitian yang telah diperoleh, sehingga dapat saling memperkaya pengetahuan diantara para peneliti, akademisi dan praktisi di bidang teknologi informasi. Selain itujuga diharapkan hasi! penelitian ini dapat memajukan kesejahteraan bangsa. Selamat mengikuti SeTISI 2011, senoga kegiatan
ini dapat memberikan
kemajuan ilmrr pengetahuan di bidang teknologi informasi di lndonesia.
Bandung, 20 September 201
I
Radiant Victor Imbar, S.Kom., M.T. Dekan Fakultas Teknologi Informasi Universitas Kfi sten Maranatha
sumbangsih kepada
Seminar Teknik Informatika dan Sistem Informasi Bandung, 24 September 2011
ISBN: 978-602-8758-3?-6
DAFTAR ISI
1
iv
I KELOMPOK JARINGAN KOMPUTER DAN KEAMANAN SISTEM Pemodelan Aplikasi Remote Desktop Menggunakan Protokol UDP dan MD5 Checksum Serta Mime Base 64 Encoding Sebagai Keamanan Komunikasi Wiwin Sulisryo, Dion W. Chandra, Heru Setyawan
Modul Enkripsi/Dekripsi RUFT Sebagai Alternatif Pengamanan Informasi Pada Media Komunikasi GPRS Sandromedo Christa Nugroho, Wahyu Indah Rahmawati, Neo Fajar Bawarw Konla Deh'a Danu .......,.....'..'......
11
Pengembangan Aplikasi Microblogging Twitter Berbasis Desktop Brajaseta Yamatlirr*a, Wilfridus Bambang Triadi Handaya
19
Kajian Manajernen Antrian Pada Jaringan Multiprotocol Label Switching Timotius Witono
II KELOMPOK KOMPUTASI CERDAS Implementasi Algoritma OKAPI BM25 dan K-MEANS Untuk Mencarl Re6vansi Artikel Pada Bebelapa Situs Berita Danny Sebastian, Antonius Rachmat, Willy Sudiarto Raharjo ... ...........
3r
Implementasi Algoritma Genetika Pada Aplikasi Penjadwalan dengan Studi Kasus Pada SMP X Radiant Victor Inbar, Jayanti
36
Pemanfaatan Fu zz! I'ogic Untuk Memprediksi Prestssi Mahasiswa Berdasarkan Nilai Ujian Nasional (Studi Kasus: STMIK IBBI)
Harlono ....,,........
42
Pemeringkatan Program Studi Petguruan Tinggi Berbasis Data EPSBED dan Webomatrics Ddengan Metode Pembelajaran Berbasis Kasus M arzuki. Ahmad C ucus .......................
48
Sistem Deteksi Kelainan Jantung Menggunakan Sinyal Elektrokardiogran! dengan Metode Empirical Mode Decomposition Rosita Dewi, Bambang Hidayat, Achmad Rizal
54
Seminar
T€kik Infornatika dan
rsBN: 9?8-602-E758-37-6
Sistem Informasi
Bandung, 24 September 2011
Implementasi Metode Fuzzy Rule Base Pada Kasus Job'Shop dengan Penjadwalan AdaPtif soixt u, Huinut
59
Pendekatan Penyelesaian Masalah Knapsack Dalam Pembuatan Menu Makanan Sehat Oscar Wongso, Mewati
66
Hakim
iiioa
AYub
Sistem Pakar Diagnosa Penyakit Paru'paru pada Anak dengan Metode
Dempster-Shafer Noor latifah, Eko Darmanto
74
Rancangan Sistem Rekomendasi Pencarian Kerja dengan Pendekatan Content-Based Flltering Herastia Maharani,,,.,,,.......,....,,',,
78
Pembentukan Pola Genetik Kalimat Tanya Pada Sistem Tanya Jawab Melalui Pembelajaran Analogi Hapnes Toba..........;.................
84
/ Penerapan Algoritma Jaringan Saraf Tiruan Sef Pengenalan Pola Pada Tulisan Tangan Tjatur Kandaga, Ardy Gunawan
92
O rganizing
Map untttk
Pengenalan Bahasa Isyarat Tangan Merfadi Huruf Alfabet Dengan Jaringan
Syaraf Tiruan Sofian, Amold Aribowo, Reza Adianus ............'.-.......
99
III
KELOMPOKPENGOLAHAN CITRA DAN GAME Sistem Perolehan Citra Mammogram Berdasarkan Ciri Tekstur Menggunakan
Gray Level Co-Occurrence Matrix Shofwatul'Uyun, Agus Harjoko ..............
.
.
.
......
''
....'.
'
''''
' ''' '''
'''
107
.
Komputasi Simbolik Representasi Titik Dengan Metode Region-Based Mx Quadtree Untuk Pengenalan Daerah Sawah Rawan Banjir Eko Darmanto, Noor Latifah
lt3
Metode Adaptive Background Extraction-Gaussian Mixture Models Untuk Aplikasi Penghitung Kendaraan Berbasis Video Rismana Liml Rayriond Sutjiadi, Endang
118.
Setyati
Game Bergenre Simulation-Action Untuk Pembelajaran Keamanan Jaringan Komputer Dengan Pendekatan Discovery
Anteig
"'
Widod.o,-Supriyono
Pembangunan Perangkat Lunak Game Maker X dengan Mengimplementasikan Teknik Reflection Dan Object Reuse
129
osci Kimalim
Pemanfaatan Fitur Warna Pada Aplikasi Penghitung Sel Kanker
R;;^;h"i";'ra,
Binti
sotihah
124
Interaktif 135
Seminar Teknik lnformatika dan Sistem lnformasi Bandung, 24 September 2011
ISBN: 9?8-602-8758-37'6
Deteksi Gerak Satu Obyek Pada Video AVI Arif Setiawan, Pratomo Setiaji
141
Iv KELOMPOK SISTEIVI INFORMASI DAN SISTEM ENTER.PRISE Membangun Aplikasi Perbankan Sebagai Kontrol Optimal Internal Pada Operasional Bank"XYZ" ... . . . ' . . . ' ' ' ' ' ' ' ' ' ' ' Johannes Petrus, Suwirno Mawlan : .
.
Strategi Integrasi Data dan Aplikasi Enterprais Menggunakan Enterprise Application Integration Studi Kasus: DSS BAPPENAS Gede Karya Analisis Efektivitas Penerapan E-Government Terhadap Peningkatan Pelayanan Masyarakat Studi Kasus: Pemerintahan Kabupaten Banyuasin Mulyati, Desy Iba Ricoidn .... '......... Integrasi Model Tata Kelola Teknologi Informasi Antara ISO 38500' RISK IT, dan VAL IT Meliana Christianti Johan, Kridanto Surendro .... .. .,.,. Model Konseptual E-Health Pada Departemen Ilmu Kesehatan Anak di Indonesia Oktri Mohammad Firdaus, Eki Rakhmah fukiyyah
Taint Anallsis dan Eksploitasi Perangkat Lunak
t47
152
158
r64
174
179
Suryo Bramasto
Sistem Informasi Geografis Tata Letak Pengairan Sungai dan Irigasi Pada Balai PSDA SELUNA Pratomo Setiaii, Arif Setiawan
Studi Empiris Model Pemrediksian Popularitas Situs Jejaring Sosial Henri Agustin Sistem Informasi Pemetaan Penanganan Ibu Hamil dan Neonatal Sup riy ono, Ant e ng Wi do do
Studi Pengaruh Aktivitas Twitter Terhadap Tingkat Pengaruh Seseorang Kepada Lingkungan Pada Media Sosial Digital
186
r91
t97
20r
IglDl
(Studi Kasus: Pengembangan Arsitektur Aplikasi Enterprise dengal 2'0'2) Codeignlter tenf,emban[an ERP Menggunakan Mysql 2005 dan Gerald Kevin Suoth .......'. ..,,,.',..,..' Sistem Penunjang Kegiatan Operasional Klinik Bahtera Medika Ririn lkana Desanti, Arnold Aribowo' Agustinus Chandra Pembuatan Aplikasi Sistem Informasi Berbasis C#'Net Pada Toko Besi Baja Mulia DalamManqiemen Transaksi dan Manajemen Persediaan Wenny Franciska Senjaya, Nico Budi Darmawan
204
209
215
Seminar Teknik lrformatika dan Sistem Informasi Bandury, z September 2011
ISBN: 9?8{02-8758-37-6
Sistem Pengelolaan Surat dan Paket Compassion@ Indonesia Rt Sony Saksono Harso S.. Tiur Gantini
222
Perllaku Wanita Dalam Pemanfaatan Teknologi Informasi (Identilikasi Faktor-faktor Motivasional Wanita Karir Dalam Penggunaan Internet Sebagai Penunjang Kesuksesan Kerja) Endang Raino Wirjono .................
t1()
Sistem Informasi Manajemen Dokumen Mutu (SIDOKLD Sebagai Pendukung Implementasi Sistem Penjaminan Mutu di Laboratorium Terpadu Teknik
Informatika UII Lizda Iswari, Rio Kiswandaru, Rahadian Faiz Kurniawan, Akhyar Amarullah ,.,.....
239
Perancangan dan Pembuatan Website Paid To Click Andy Sentosa, Djoni Setiawan K
245
Website Peqiualan dan Lelang Meubel Online Pada Toko Meubel 3X', Rudy Susanto, Tanti Kistanti ....
251
Pembuatan WeDsire Pariwisata Jawa Tengah Wijayanri Santoso Gandhi, Robby Tan ..-..................
256
Pembuatan Sistem Informasi Akademik Sekolah Menengah Atas Swasta XYZ Menggunakan Java Enterprise Edition Niko lbrahim, Sendy Ferdian Sujadi
260
Pembangunan Sistem Manajemen Ujian "Chiron" Dengan Meneibpkan Teknologi LINQ dan Windows Presentation Foundation Eico Datmawan Handoyo, Sulaeman Santoso
265
Model Perencanaan Bisnis Adopsi Cloud Computing Andy Prasetyo Utomo, Kridanto Surendro ...............
269
Website E-Commerce dan Inventory Management Perusahaan Cutting Tools Diana Trivena Yulianti, Andrianus ......................... Website Peqiuafan dan Lelang Spare Part Komputer Dengan Teknologi PHP dan SMS Gateway Teddy Marcus hkaia, Kevin Tedja ..................
279
Analisis Information Economic Untuk Implementasi SAP di Universitas Kristen Maranatha (UKM) J e s s ic a S us ant o, Sar on Kumi aw ati Yefta ...................
285
Aplikasi Piranti Lunak Pembelian, Penjualan Dan Stok Barang Pada Toko Suka Sari Ririn Ikana Desanti, ArnoW Aribowo, Tomy Oscar
289
Pengawasan Implementasi Monitoring Center
(Studi Kasus: Kejaksaan Agung RI) Maniah
292
KOMPUTASI CERDAS
Seminar Tcknik Informatika dan Sistem lnformasi Bandung, 24 SePtembcr 2011
ISBN: 978-602-8758-37-6
DAN K'MEANS IMPLEMENTASI ALGORITMA OKAPIBM2s UNTUK MENCARI RELEVANSI ARTIKEL PADA BEBERAPA SITUS BERITA Raharjo3 Danny Sebastianr, Antonius Rachmat2' willy Sudiarto Kristen Duta wacana IJniversitas Infonnatika.' Teknik Fakultas Teknologi Informasi' r'"g)ii s'"ai willysr@ ti'ukdr'''ac id ac id'
[email protected]'dw'ac'id, antor@ti'ukdt
ABSTRAK
,H i1l1:T::tlltiffiffi m i::llil: H3*truf;;igfililH:.X":ilffi K-means argorirma uni-r'"ils'aungkan :T:*:"'j:ililiiiil"[:f;"ili';'^;ilil;'il':;;i;;;u r.*l aun kualitas
,nfomasi yang ber,eb'l-
algoritma unr'rk meningkatkan
clustering u dJ;;;;;lj;;;'ini' rombinasi.kedua tomuinasi algoritma bkapi BM25 dan K-Means dapat pencarian. Penelilian ini mengtrasitta-n t'esimpulan cenuoid awal dan besamya dimensi vector
meruDakan algorirrna
t"nentu'. pencntuan meninskatkan kualilas pencaflan peou o"ht"pu ku'u' evaluusi precisior dan recall sistem tarrpa menggunakan Puda oosisi dapat mempengaruhi ttu,it p'o'"i cf'u't"ln! p.*iri"^ a"r recall dengan menggunakan proses clustering aan proses clustering ada '"nrz..lzq" 7 2.1 6% dan 80. lO% ^d^lah infon&tion rctrietal' clusterinS' k-means' okapi bm25
silti-i"lfigl-
Keywotdsi
1.
PENDAHULUAN Information retie|al adalah salah satu melode
untuk menampilkan sebuah dokumen yang sesuai dengan Pern;ntaan user. Infomntion retrietal
banyat< metode. beberapa di antaranya adalah Okapi BMI I, Okapi BM 15. Vector Space Model, Oiapi 8M25. dan lain sebagainya
meriitiki
Sedangkan cfvsteing merupakan pengelompokan dokurien sehingga dokumen dapat lebih mudah untuk dicari. siberapa fi:rlrode clustering adalah
K-means, C-Means, Fuzzy C-Means, dan lain sebagainya.
Terlalu banyaknya anikel berita sehingga m.-Uuut -utyalutat yang mencari informasi
kesulitan mendaPatkan artikel yang sesuai Sistem
vane dibuat adalah sebuah uebsite dengan iuyin"n y*g mengumpulkan artikel berita dari b.beraoa'suliber
tibtit,
beita
secara online, dan
rn.nuapilkun artikel berita berdasarkan
kara
kunci vans dimasukkan oleh pengguna Algoritma u*p aic;nakan di clalam pengujian ini adalah
atgiritni otapi
2.
slu125 dan K-Means'
MODEL, ANALISA, DESAIN, DAN
IMPLEMENTASI 2.1 Information Retrieval iifori.tion Retieval diartikan sebagai ilmu untuk menemukan rnaterial yang umumnya meruDakan dokumen-dokumen. yang ditujukan untuk memenuhi kebutuhan informasi dari aser rtvranins. 2008). Dimana informasi tersebut i.rseb"i di dalam koleksi dokumen yang besar
temu dan tidak terstrultur. Dengan adanya sistem pengguna arau information relrieval'
kembali ticlak lagi pe u melakukan pencarian dokumen
secara manual, tetapi dapat dengan cepat mendapatkan informasi yang diinginkan melalui
kueri.
Kueri merupakan token penting yang mewakili kebutuhan informasi dari seolang pengguna' Kueri di inputkan untuk diolah menggunakan metode yang diterapkan dalam sistem temu kembali melalui red rch engine
.
2.2 Clustering
Clustering aJalah metode untuk melakukan cluster dan fengelomiokan data berdasarkan data mengorganisasikrn untuk -.,ioutcan teknik suatu data
',,,"nniidut terstruktur tersebut menjadi nilai. Tujuan dari algoritma ini y-i -.rnpunyul lJa-an uniuk membuat cluster yang memiliki
kesamaan, tetapi berbeda satu sama lain' Dengan taia lain, Ootumen dalam I cluster akan memiliki
,-"l"uunri ,utu sama lain, tetapi tidak memiliki
,"i"u"n.i d"ngun dokumen di dalam cluster lain' (Maning, 2008) proses yang baik, data yang dihasilkan Dalam ^satu clusier uk* memiliki tingkat dalam memiliki t"*uun daya yang tinggi, dan akan tendah yang kesamaan niUi a.ngun tingkat
data yang denean clisrcr" yang lainnya Sehingga antar sama yang ciri-ciri mempunyai ainalsittan
data dalam sebuih cluster yang dihasilkan'
2.3 Aleoritlna Okapi BNt25
;i d;i"t Information Retieval' okapi yang digunakan oleh ii.*putun 'ririn t"uuui unruk "lgoritma relevansi menentukan ,ngin, "etgo.itma ini menggunakan tf-idf ;;;;"".
ISBN: 978-602-8758'37-6
lnformasi Semioar Teknik lnformatika dan Sistem Bandung, 24 SePtember 20 I I
untuk melakukan prosesnya OkaPi merupakan dari metode Binary salah satu penge;bangan -Modet ke dalam termasuk dan Indeoendenie oleh yang dikembangkan Proiabilistic Model Robedso.
Tuiuan akhir dari metode Okapi BM25 sendiri
,artah melakukan pembobotan
dokumen
i"iau.*tun kueri (atau dokumen yang menjadi natokan) vang dirnasukkan dengan menghitung
'
ioefisien
kJmiripan (Similarity
Coefisien)
Koefisien kemiripan dihitung dengan rumus:
ri,q(c"e)=[[n" (;(s, s) * i, (r F(q,,D)
lDi avPdl ki b
: konstanla (biasanya 0 75) range:
data stabil.
Metode K-means menerirna parameter masukan k
dan sebuah obiect Panisi data
rendah antar clrster yang berbeda' Proses dari metode K-means adalah:
secara random dokumen yang akan digunakan sebagai centroid awal sebanyak k'
1. Pilih
Cari centroid yang paling dekat dari
3. Hitung vektot posisi centroid
untuk cluster' setiap dari menentukan centroid baru Lakukan langkah 2 dan 3 hingga centroid
4. s0:b>l
tidak mengalarnj Perubahan lagi'
Rumus perhitungan centroid baru dari setiap cluster dicari dengan menggunakan rumus:
dibutuhkan proses:
u.=
Penghitungan
jumlah token dari
dokumen yang akan di-rangting, perhitungan dari jumlah tersebut
2. 3.
tiap hasil akan
disimpan dalam laricble D. Menghitung jumlah dokumen yang memuat
tokenqn(qj). Kernudian menghitung (ct 'D) yaitu banyaknya sebuah to&en dalam masingmasing dokumen.
4.
Hitung IDF Yang memiliki rumus:
;a{t,).leeffi :jumlah seluruh dckumen dalam korpus
n(Q, ): jumlah dokumen yang memuat token q
5.
Menghitung rata-rata panjang dokumen:
.. Erfl
rr urt -
K"t"rungun,
N
I dl
(1]l**
KelemnSan:
g.
i!
:
Nilai
sebuah dimensi centroid dari suatu cluster
k
cluster : jumlah dokumen yang berada dalam s6tu
i{,! : nila; TF-IDF untuk ssbuah dimensi dari sample dokumen ke-i yang termasuk cenlroid cluster k Sedangkan untuk menemukan jarak dua dokumen digunakan rumus euclidian distance:
(,.t)=
- r;J + (16-.,J*..+('6-r1l)
Keteransan:
drij ):ja;ak dokumeD ke-i ke dokumen ke-j
Keterangan:
N
"
: iomtch dolumen yang memuat token q :jumlah seluruh Panj,ng dokumen dalam korpus
6. tangkah terakhir adalah menghitung relevansi tiap dokumen berdasarkan kueri/anikel yang menjadi dokumen uji'
r. (n):
I
kata ke n di dokumen ke_i
(n): kata ke n di dokumen ke-j
3. HASIL DAN ANALIS$ 3.1 Evaluasi Keakuratan Sistem (Tanpa Proses Clasterirg)
Evaluasi keakuratan iist"- y"ng pertama adalah melakukan evaluasi menggunakat precision dan recall untuk kasus searching ke dalam korpus tanpa menggunakan proses clustering, dokumen yung Oigutiakan adalah dokumen yang memiliki
2.4 Algoritma K-Means
status 1 atau aktif.
banyak dignnakan untuk melakukan clusteri S' Metode k-means memproses kelompok data
Evaluasi dilakukan menggunakan
Metode K-means merupakan metode yang paling
sebanyak k-cluster yang berisikan dengan kondisi data dimasukkan ke dalam claster tertentu secara acak, sebagai inisial c/,srei' yang pertama' Kemudian secara terus-menerus menghasilkan sample kelompok data yang baru yang t€rgantung dari kesamaan arftaft santple dan claster' Kondisi
ini diulang
setiaP
dokumetr.
Untuk dapat menghitung koefisien kemiripan'
l.
Yang
dikelompokkan menjadi k-cluster, sehingga akan menyebabkan tingkat kesamaan yang tinggi di dalam cluster itu sendiri' dan kesamaan yang
2.
(1i
(rn : Frekuen\i kemunculan Token D : panjanS ilokumen : rrla-rata Panjang Dokumen : kon\lantr (biasrnya 1.2)
euclidian yang dipenuhi atau setiap kelompok
secara terus-menerus sampai fungsi
penguiian yang berjum.lah
6
korpus
korpus. dimana
3
i.omu, u"t^.ui dari bulan April dan 3 korpus berasal dari bulan Mei. Dokumen diambil oleh sistem secara otomatis dari situs kompas' vivanews, dan bbc, serta dokumen tersebut
memiliki tanggal terbit yang sesuai untuk masingmasing korPus.
seminar Teknik Informatika dan Sistcm Informasi Bandung, 24 September 2011
ISBN: 978-602-8758"37-6
adalah tabel l, tabel hasil pengujian berdasarkan precision dat recall untuk korpus
Berikut
ini
yang diujikan:
Tabel 1. Hasil pengujian sistem tanpa cr&sterinS
Korpus Ke
Tanggal
Jumlah Prechinn Recall
Dokumen
2-5 Apr 2011
I
909o
54
88.5770
!0OVo
126
58.817o
IOOVo
r42
58.8%
lOOTo
85
8O.2'1Vo
too%
129
55.237o
94.28Vo
dan kueri.
Mean =
72.73Vo
97 .38Vo
Pengujian dilakukan dengan menggunakan Korpus dan kueri yang sama dengan semua
3.2 Evaluasi Keakuratan Sistem
t5-17 Aor 201 I 3-5 Mei
4
2QT1
6-8 Mei
5
zot1 9- 1l Mei
6
tersebar pada korpus dokumen.
8t.86%
20tl
3
Berdasarkan pengujian terhadap keenam korpus, dari data di atas, dihasilkan 2 kesimpulan, yaitu sistem pencarian dengan menggunakan algoritma Okapi BM25 dapat memberikan hasil keluaran yang relevan dengan kueri yang dimasukkan oleh pengguna untuk dokumen berita dari beberapa situs berita yang dibatasi dengan tanggal terbit.
Tabel 2. Hasil
I
2
J
4
5
6
Tanggal 2-5 Apr 201
(Menggunakan Pr oses Clustering\ Evaluasi keakuratan sistem yang kedua adalah melakukan evaluasi menggunakana precision da\ recall untuk kasus searching ke dalam korpus dengan menggunakan proses cl&.tt€rins tedebih
dahulu, dokumen yang digunakan
adalah
dokumen yang memiliki status 1 atau aktif. Yang
melalui proses clusteing adalah korPus data aktif
2011
Korpu sKe
sistem menganggap sebuah dokumen memiliki relevansi dengan kued ketika terdaPat minimal sebuah kata yang sama dengan kueri yang
105
8-10 Apr
2
Sistem memiliki kelemahan, dimana sistem hanya melakukan perhitungan dengan memperhitungkan kata yang sama pada dokumen dengan kata dalam kueri tanpa mblihat arti kata yang sesungguhnya di dalam sebuah kalimat. Hal ini menyebabkan
I
8-10 Apr
2011 15-17 Apr 2011 3-5 Mei
2011 6-8 Mei
20tl 9-11Mei 2011
Jurnlah Dokumen
evaluasi pertama, tanPa menggunakan proses clustering. Pada pengujian lJi, nilai threshold yang dip;kai adalah 807o, dan nilai n yang dipakai uaututt Z. Nilai n diambil dari kelompok besar dokumen yang terdapat di dalam korpus melalui pengamatan penulis. Dokumen yang menjadi ientroid awal adalah dokumen yang termasuk ke dalam kelompok dokumen.
ian sistem
Kelompok Dokumen
Cluster
Precisio
n
Recall
Kilang Minyak Penamina(O), 105
54
126
142
DPR(l), Malinda Dee(2), TKw(3). Gempa Cilacap(4) Mobil Freeport ditembaki(0), PT sarwahita(1), bdptu norman(2), merapi(3), Derompak somalia(4) bom cirebon(o), PeromPak somalia(1), cirus sinaga(2), KPK(3). bentok di kebumen(4) osama tewas(O), NII(l), umar patek(2), TKI(3), panji
4
77 .19V0
60.9V0
2
85.147o
80.83%
1
68.SVo
73.370
2
60.47V0
90%
2
8O.834o
84.16%
64.4840
9l.42Vo
zumilans(4) 85
129
pansel KPK(O), cirebon(l), pesawat merPati(2), ganja leeal(3), sinar kudus(4)
panitia seleksi PimPinan KPK(o), terori(1), merPati(2)' NII dan pancasila(3), al zaytun dan NII(4)
ISBN: 978-602-8758-37-6
Seminar Teknik Informatika dan Sistem Informasi Bandung, 24 SePtember 20 I 1
Berdasarkan Pengujian sist€m menggunakan keenam korpus di atas, terdaPat kekurangan pada sistem. Kekurangan ini dikarenakan proses clustering yang tidak optimal. Pada penelitian ini' korpus yang besar menghasilkan vector posisi yang besar. Dan dengan besarnya dimensi tersebut, maka pergeseran posisi centroid tidak terlalu terlihat dan akibatnya hasil akhir clusteting ddak memberikan hasil pengelompokan dokumen
cenhoid awal menjadi kurang baik untuk mengelompokkan dokumen berdasarkan kemiripannya.
Dengan memperkecil lingkup Pencarian, sistem pencarian dapat meningkatkan precision dan reccll untuk beberapa kasus. Contohnya pada korpus 6.
yang optimal, tetaPi justu mengurangi nilai
3.3 Pembandingan Hasil Evaluasi Sistern
keakuratan.
Pada bagian
Selain masalah besarnya dimensi vector posisi. kekurangan sistem juga dikarenakan pemilihan
centroid awal yang kurang baik. Posisi awal
centroid berdasarkan kelompok cluster yang terdapat pada korpus dan diharapkan terbentuk di dalam korpus yang diujikan. Dan dengan menggunakan pemilihan sepe i ini, posisi
2 3
4 5
6
Tanggal
antara sistem yang tidak penuosesan clustering dan sistem yang menggunakan pemrosesan clustering. Perbandingan
akan dilakukan
dengan
membandingkan hasil precision dan recall dai kedua sistem dan melakukan analisis terhadap hasil tersebut
Tanpt ClusterinR Precision
Recall
Menpgunakan Clusterirg Precisiort
Recall
2-5 Apr 201 I
8l.86Vc
907c
7'1
.197c
6O.94o
8- 10
Apr 201I Apr 201I 3-5 Mei 2011 6-8 Mei 201 I 9-l I Mei 201I
88.57 7o
100V"
85.t4%
80.837o
15- 17
58.8lVo
l0Q7o
68.59a
73.39o
s8.8%
100q.
60.477a
907o
8O.279o
1007o
8O.839o
84.t6%
Mean =
Pada beberapa kasus, pemrosesan
pembandingan menggunakan
hasil evaluasi sistem
Tabel 3. Korpus Ke
ini, akan dilakukan
55.239o
94.28Vc
64.48V0
91.4270
12.73Vo
97 .387o
't2.16%
80.107o
dengan
menggunakan clustering memberikan hasil yartg lebih baik. Misalnya pada kueri "mahasiswa di tembak" pada korpus 6. Pada pemrosesan tanpa
cfustertng, dokumen yang relevan hanya 1,, sedangkan keluaran sistem adalah 7, sehingga
Apabila kita bandingkan pengurutan antara tanpa
menggunakan clustering
dan
menggunakan
clustering, keduanya memiliki hasil yang relatif
sama. Dimana keduanya menampilkan hasil
terdapat
pencarian pada peringkat atas. Hanya pada korpus 3 dan 6. hasil pencarian ditampilkan pada bagian tengah dan bawah. Tetapi secara keseluruhan
menggunakan c/aslerizg, keluaran berjumlah 4.
hasil pengurutan dokumen relevan memiliki
6 dokumen yang tidak relevan. Seaangkan pada Perruosesan dengan
tingkat yang baik. Berdasarkan hasil pengujian tersebut, kesimpulan
yang dihasilkan adalah kombinasi
4,
pada beberapa kasus.
KESIMPULAN Pada penelitian yang telah dilakukan, sistem mampu menampilkan artikel berita yang memiliki
3,4 Evaluasi menggvla^kan Interpolated
pengguna dengan menggunakan korpus berita
kedua
algoritma dapat meningkatkan kualitas pencarian
Precision
Evaluasi ini bertujuan untuk melihat apakah sistem meniberikan dokumen yang memiliki relevansi di awal kumpulan dokumen yang di rerieved atau tidak. Evaluasi ini dilakukan untuk masing-masing korpus.
Secara keseluruhan, sistem dapat memberikan pengumtan yang baik, dimana dokumen yang dianggap relevan berada di perinkat atas. Hal ini ditunjukkan pada beberapa grafik yang memiliki rata-rata di atas 80%-1007c.
relevansi dengan kueri yang dimasukkan
yang dibatasi dengan tanggal terbit. Metode Okapi BM25 mampu menarnpilkan artikel berita yang memiliki relevansi dengan kueri pada peringkat atas. Pada pengujian menggunakan kombinasi kedua
algoritma, okapi BM25 dan K-Means, sistem mampu mengelompokkan artikel berita menjadi cluster-cluster dengan baik ketika memiliki pemilihan nilai centroid awal baik' Dan pada
beberapa kasus, pengkombinasian
kedua
algoritma dapat meningkatkan kualitas pencarian
ISBN: 9?8602-8758-37-6
Okapi BM25 ketika memiliki pemilihan centroid awal baik. Pada evaluasi menggunakan precision dan recall
sistem tanpa menggunakan proses clusteing adalah 72.13% dan 9'1.38Vo. Sedangkan evaluasi precision dan recall dengan menggunakan proses
cfustertng adalah 72.7 6Vo dan 80.10Vo. Secara fungsional, sistem yang dibangun dapat memudahkan pengguna yang hendak mencari
berita dari beberapa situs berita yang beda, Karena sistem dapat melakukan pengumpulan berita dari beberapa situs berita, khususnya Kompas, VivaNews, dan BBC.
5. [1]
[2]
[3] [4]
[5] [6]
DAF'IARPUSTAKA Candra Dewi, Rukmana. (2010). Pencarian Dokumen Teks dengan Metode Okapi 8M25. Universitas Kristen Duta Wacana,
Yogyakarta. Clough, Paul. (2001). Filtering Meter Corpus Documents Using a Probabilistic IR System (Ot@pi). Regent Coult, University of Steffield, 201I Ponobello Street, Sheffield Sl 4DP. Grossman, David A, Dan Ophinr Frieder. (2004).lnfomation R etrieval, algorithm and He u ris tic. 2"d F,ilition. Springer. Kathuria, Ashish.Jansen, Bernard J. and Hafemik, Carolyn. Spink, Amanda. (2011).Classifying the User Intgnt of Web Queries Using K-Means Clustering. Maning, Christoper D. (2008). lntroduction to Infornation RetievaL Cambridge University Press, New York. Ramos, Juan. Using TFJDF to Determine Word Rele,vance tn Docurnent Queries, Department of Computer Science, Rutgers University, 23515 BPO Way, Piscataway, NJ, 088s5
SemiDar Teknik Informatika dan Sistem Informasi Bandung, 24 September 201 I
;.d.-firffi
J-
' .-
,'' '
qfr
.I-txp il?fsl
,--t!
irE -eltE lr-6a-FlkE
"l
-.'
-r 'r
t
* * '/ ,*
"t
r
-'
t
,P*'*lxiourrrrf
'" ;' ;,; . .;"I r .'.'' l":,.-,*_ ..-_.
.'.
, lffrwlsilqgKrittsn Maranatba' _". / -- **__-,-_ lf;ilillfiriltifr!1,'iltl#li.ila 1,' ..*" &hoLdre.SuripSupailrilgstBildune -Ql'U
"-;;-,J;,#-;
t -v'
"n
*
;,, .#tuil;yiffiruu*r:*:*
'':l
'.
-
".
s'Ns,6{@{,!6\,r.
i
llllllllllllilllllllllll
. llilililffiililll
)