PRQTQTIPE SPECIFIC DOMAIN SEARCH ENGINE DENGAN MENGGUNAKAN METQDE ICLUSTER BERHIRARICI
ADE LIANA
JURUSAN ILMU KOMPUTER FAKULTAS MATEMATll
BOGOR 2001
Ade Liana. Prototipe Specfic Do~rroi~i Search Engine Dengan Menggunaka~~ Metode Kluster Berhirarki (Specijc Donlain Search E~iginel'rotoppe Using lfierarchical Clr~steringMethod). Dibimbing oleh JULIO ADISANTOSO dan YEN1 I4ERDIYENI. General purpose search engine rnemang tnenawarkan banyak informasi bagi penggunanya, namun ~nemilikisatu kekuranga~iyaitu nilai precision dari hasil a:mu ke~nbalinyakecil. Salali satu alternatif solusinya adalah dengan menggonaka~lsl)ecijic do~~toiri search engine, sehingga sistem telnu kembali dibatasi hanya pada domain tertentu saja. I'enelitiar~ ini bettujua~lurlluk inenelaah penggunaan metode kluster berhirarki dalam sistem temu ke~nbaliuntuk me~nhangu~~ spec* c/o~r,,rlair~ search engine dan kinerja metode kluster berhiraki dala111 is tern temu kembali. Dokumen yang digunakan dalam pcnelitian ini berjumlah 107 buali dokomen yalig berupa ringkasan karya ilmiah mahasiswa SI IPB. Metode kluster berhirarki digunakan untuk rnengelompokkan istilah berdasarkan frekuensi setiap istilah dala~ndokumen. Pengelompokan ini dilakukan dengan menggunakan SPSS 9.0, dimana metode yang digunakan adalah metode pautan rata-rata dalam kelompok yang baru (average linkage within the new grotrp) dan output yang dihasilkan dala~nproses ini berupa dendogrcrnr istilah. Kluster yang terbentuk akan diyunnkan untr~kmeml~erluas kueri dala~npencarian dokumen, di mana istilah-istilah yang berada dalam satu kluster dianggap memiliki tnakna sania, sellingga ~nemperbesarpeluang terambilnya dokumen yang relevan. Untuk analisis kinerja search engine digunakan rnetode perhitungan recall dan precision, yang masing-masing merupakan perbandingan antara dokumen relevan yang terambil dengan jumlali keseluruhan dokumen yang relevan dan dengan jumlah doku~nenyang terambil.
PliOTOTIPE SPECIFIC DOMAIN SEARCH ENGlNE DENCAN MENGGUNAKAN METODE KLUSTER BERHIRARKI
ADE LIANA
Skripsi sebagai salah satu syarat untuk me~nperolel~ gelar Sarjana Komputer pada Progn1111Studi llmu Kornputer
JURUSAN ILMU KORIPUTER FAKULTAS MATEMATIIU DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAPq BOGOR BOGOR 2001
Judul Nama NIM
: Prototipe S,>ecijic ~olllaillSenrch Engi~leDellgall M e ~ ~ g g ~ i ~ l aMetode k a l l Kluster Berhirarki : Ade Liana : GO6497025
en' tlerdi eni S.Kom
Tanggal Lulus :
,j L
\t;[y,i 200'3
.
RIWAYAT IIIDUI' Penulis dilaliirkan di Jakarta pada tanggal 25 Agustus 1979 sebagai anak kedua dari empat bersaudara, anak dari pasangan Tjong Wie Soeng dan Susi Mclawati Wiryana. Pada tahun 1997 penulis lulus dari SMU Negeri 68 Jakarta dan pada tahun sama lulus seleksi masuk IPB melalui jalur U~idaiiganSeleksi Masuk IPB (USMI), dengan pilihan Program Studi IImu Komputer. Pada tahun 1998 penulis niulai rnendalanii bidang ilmu kon~puterdi Jurusan Ilmii Komputer, Fakultas Matematika dan ll~nuPengetaliuan Alam. Selama mengikuti perkulialian penulis ~iienjadiasisten mata kuliah Algoritma dan Pemrograrnan pada tahun ajaran 199912000 serta mata kulial~Organisasi Komputer pada taliun ajaran 1999/2000.
PRAKATA Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa, karena atas segala karunia-Nya karya ilmiah ini dapat diselesaikan. T e ~ n ayang dipilili dalam penelitian ini adalali search engine dengan judul Prototipe Domain Specific Searcli Engine Dengnn Merigguriakan Metode Kluster Berliirarki. Terima kasih penulis sampaikan kepada berbagoi piliak yang telali membantu penyelesaian karya ilmiah ini, antara lain adalali Bapak Ir. Julio Adisantoso, M.Komp den lbu Ye~iiI-lerdiyeni S. Konip selaku pembinibing. Di saniping itu terima kasih juga penuli!; sampaikan kepada rekan-rekan di Jurusan llmu Kon~puter atas bantuanoya, kliususnya kepada Ronaldo atas bantuan dan dukungan morilnya. Ungkapan terima kasih juga penulis llaturkan kepada kedua orang tua serta seluruli keluarga atas doa, dukungan dan kasih sayangnya. Penulis menyadari sepenuhnya baliwa karya ilmiah ini masih menliliki banyak kekurangan. Meskipurl demikian penulis berharap semoga karya ilmiah ini dapat ~nenienuhifungsi utama sebagai salah satu syarat memperoleh gelar,Sarjana Komputer pada Program Studi Ilmu Koniputer, Fakultas Mate~natikadan Ilmu Pengetahuan Alan~,lnstitut Pertanian Bogor. Selairi itu penulis juga berharap agar tulisan ini dapat bermanfaat di waktu mendatang.
Bogor, November 2001 Ade Lia~ia
DAPTAR IS1 vi . . . ...........................................................................................................
DAFTAR TABEL ..............
DAFTAR GAMBAR .......................................................................................................................... vi
. . . .................................................................................................... vi
DAFTAR LAMPIRAN ............
PENDAHULUAN .................... . . . ................................................................................................... I ................................................................................................. Latar Belakang .................... I Tujuan ..................... .................................................................................................................. I
. . . . . .
TINJAUAN PUSTAKA ..................................................................................................................... I ....................................................................................................... Search Engine .................... . . . I ................................................................................. Klasifikasi Otomatis ......................... ........ 1 ..................................................................................................... Kluster Berhirarki ............ 2 Efektivitas dan Efisiensi .................... ........................................................................................ 3
. . . .
. .
METODOLOGI PENELITIAN ............................................................................................................. 4 Pengumpulan Dokumen ................... ........................................................................................ 4 Ekstraksi lnformasi .......................................................................................................................... 4 ........................................................................................ Pembentukan Kluster ................... 4 ........................................................................................4 Pembuatan Search Engine .............
...
. . . . . . . .
HASlL DAN PEMBAHASAN Karakteristik Dokumen .................................................................................................................... 5 5 Pemilihan dan Perhitungan Istilah ............................................ Karakteristik Kelompok ................................................................................................................... 5 ................................................................................................. Seurch Engine ....................... 7 Recall dan Precisian .............. .................................................................................................. 7
. . . . . .
KESIMPULAN DAN SARAN .............................................................................................................. 8 Kesimpulan ........................ ................................................................................................ 8 Saran .................... ...................................................................................................................... 8
. .
DAFTAR PUSTAKA
. .
............................................................................................................................
9
. . ........................................................................................................................ 11
LAMPIRAN ............
DAFTAR TABEL
I . Deskripsi dokumen .............. . . . . ................................................................................................ 5
.
2 Daftar kondisi yang diterapkan dalaln perhitungan istilah .............................................................
5
3 . Ringkasan kluster yang terbentuk
6
...........................................
4 . Daftar beberapa kelompok yang terbentuk pada jarak 5 5 . Daftar istilah percobaan
.................................................................6
.....................................................
7
6. Precision dan recall ......................................................................................................................... 8
7. Jumlah dokumen yang terarnbil pada level koordir~asih ( B 1,
26
8. Julnlah dokumen yang tera~nbildan relevan pada level koordinasi h (A, n BD, )............................... 26 9. Jumlah seluruh dokumen yang relevan (A, ) ...............................
26
DAFTAR GAMBAR 7 I . Diagralll alur pencarian dokumeli .................................................................................................
8 ................................................................................................ 2 . Grafik recall dan precision ........... .
DAFTAR LAMPIRAN I . Hasil pengelompokan istilah ................... .......
......................................................................... II ...................:...... . . . .
2 . Detail liasil perhitungan data untuk evaluasi ............................................
26
PENDAHULUAN
Perluasan kueri itu sendiri dimaksudkan untuk nietnperbesar peluang tera~nbilnya dokumen relevan dengan cam memperbanyak istilali yang Latar Beluka~ig Seiring dengan bertambahnya informasi pada dilibatk.an dalam kueri, di luar istilali yang di World Wide Web, benambah pula kesulitan kita tentukan oleh pengguno (Adisantoso, 2001). Istilah untuk mencari informasi yang kita i~iginkan. yang tlilibatkan adalah istilali-istilah yang berada Memang tersedia beberapa general-ptrrpose search dalam satu kelompok dcligan istilali yang engine, seperti Altavista , HotBot &an sebagainya, dimasukkan oleh pengguna, karena dianggap yang memiliki cakupan luas, tapi hasil~iyakurang memiliki makna yang salna (Salton, 1989). memuaskan, dimana nilai precisiunnya kecil. Ketika kita menginginkan infor~nasipada bidang T u j u a r ~ Tujuan pe~ielitia~i ini adalall menciaah tertentu, spec.cijic donlain search engine kira~iya penggonnan nietodc kluster berhirarki dalam merupakan solusi yang lebih tepat. Pembuatan search engine dapat dikelo~npokkan siste~lltoiiu kembali u a h ~ kiiie~nbanganspc~ijic dalam tiga tahap fungsional, yaitu : mengumpulkan donrain search etigir~edan kinerja metode klt~ster informasi, mengekstrak infor~iiasi dan berhirarki dnlam sistco~tenill kcmbali. merepresentasikannya melalui sebuah web inreflace (McCallum el a/). lnformasi biasanya tersedia dala~n bentuk TINJAUAN I'USTAICA dokumen. Namun demikian, biasanya yang disimpan bukanlah teks keseluruhan dari dokulnen melainkan representasinya, sepeni ringkasan, judul Set~rcl:Et~girle atau kata kunci (Rijsbergen, 1979). Search engine adalali sebuah sistem basis data Banyak penelitian dilakukan untuk yang didesai~iuntuk mengindeks alamat-alan~atdi mendapatkan prosedur pengolahan doknmen yang internet, seperti : url, rtsenet.Jp, ala~natirlruge dan efektif dan efisien. Menurut Rijsberge~i(1979), ada sebagainya (Iittp://www.~iarthur~iwebs.co~ii/sct/). tiga area penelitian dalaln siste~n [e11111 ke~libali, yaitu : analisis isi dokumen, struktur i~il'or~nasi, d a ~ i I
-
Andenberg (1973) dalam Prasetyo (1998) dan Johnson & Wichern (1988) menyatakan bahwa jarak statistika dapat digunakan sebagai ukuran kesamaan antar vektor. Semakin dekat jarak antar sepasang vektor maka semakin erat hubungan antar vektor tersebut. Beberapa ukuran kesamaan menurut Johnson & Wichern (1988) adalah jarak Eticlideun dan Minkowski. Misalkan diketahui, x = [XI,x', ...,xP]' dan y = ly',y2, ...,y dimana x' adalah bobot istilah x dalam dokumen ke-i dan y' adalah bobot istilah y dalam dokumen ke-i, sedatigkan p adalah dimensi atau jumlah dokumen. Maka jarak Euclidean dinyatakan sebagai :
kesamilan antar obyek sampai akhirnya terbentuk suatu Itluster tunggal. Sedangkan pada proses pemisalian, yang terjadi adalah kebalikannya (Johnson & Wichern, 1988). Misalkan diketahui sebuail matriks jarak segitiga bawah sebagai berikut :
di mana, si, adalah jarak atau nilai kesatnaan antara obyek i dan j. Maka prosedur yang bias any;^ dipakai dalaln penggabungan kluster adalal~ (Anderberg, 1973) : sedangkan jarak Minkowski dinyatakan sebagai :
jika m=I, maka d(x,y) menjadi jarak city-block antara dua titik dalam p dimensi. Sedangkan jika m=2, d(x,y) menjadi jarak Esclidemz. Kluster Berlrirarki Teknik pengelompokan yang dilakukan melalui serangkaian penggabungan atau penlisal~andisebut dengan teknik kluster berhirarki (Johnson & Wichern, 1988). Menurut Bacelar & Nicolau (2000). pada analisis kluster berhirarki ada dua pendekatan utama untuk merepresentasikan struktur data. Pada level dasar yang paling sering digunakan adalah koefisien perbandingan yaitu kesamaan atau ketidaksamaan antar variabel, yang sama sekali tidak terkait dengan aspek peluang. Sedangkan pada level lebih lanjut, digunakan model peluang @robabilisric models) berdasarkan koefisienkoefisien peluang @robabilisric coeflsienls). Secara umum penyusunan birarki dapat dibedakan menjadi pemisahan (dili,.isive) atau penggabungan (agglornerurive). Pada proses awal penyusunan kluster berhirarki pada penggabungan. sebuah obyek dianggap sebagai satu kluster sehingga banyaknya kluster awal sa~iia dengan banyaknya obyek. Obyek-obyek yang paling salna adalah yang pertama dikelonlpokka~~.Proses penggabungan berlangsung terus berdasarkan
I.
Mulai dengar1 n kluster, yang masingtnasing terdiri dari satu obyek. Beri label setiap kluster dengan notnor dari I sall~pai n. 2. Mencari kluster yang paling sama ~nelalui matriks kesamaan (sir/rilurity n~ulris).Beri label kluster yang terpilih dengan huruf p dan q dan nilai kesamaan kluster tersebut adalal, s,, p q. 3. Junllali. kluster dikurang I karena sudali ada kluster yang bergabung. Beri label kluster hasil penggabungan tadi dez~gan huruf q dan ganti nilai dala~n matriks kesa~naan untuk merefleksikan nilai kesan~aanantar kluster q dengan klusterkluster yang lain. 4. Lanjutkan langkah 2 dan 3 sebanyak 11-1 kali, salnpai semua obyek metijadi snlu kluster. '
Beberapa metode yang digunakan dalam pembelltukan kluster berhirarki adalall :
I. Pautan Tunggal (Single Linkuge), dimana jarak antara kluster pq atau misalkan kluster t (yaog terbentuk pada langkali Inomor 2 di atas) dengall kluster r adalall : sir = ~niin(s,,,~,sqr) 2. Pautan Lengkap (Con~pleteLinkuge), yaitu jarak antara kluster pq atau kluster 1 dengan kluster r adalah : SL,= tnax (st,,, s,,,)
3. I'autan Rata-rata dalam Kelo~npolt ynng Baru (Average Linkage V i 1 1 i 1 Tlrc Nett, Gruiip), Ketika kluslcr p dari q berpbung, mak;~jarak antara lkluster y a ~ i gicrbentuk, misalkan t dellgan kluster lain, misslkan r mel~jadi: SS
= SI"
+
S
Misalkan SUM; adalali jumlall jarali antar dua elemen yalig terdapat dalam kluster i dan Ni adalah junllall elemen dalalil kluster i, maka ketika kluster p d a ~q ~bergabung, lnlisalkan lnenjadi kluster t : SUM, = SUM, + SUM,, + st,,, N, = N, + N,
Efcktivilas OIII Elisic~lsi Mcnurut l
Dan ketika mencari pasangall elemen yang paling sama, jarak antar elemennya, ~nisalkan aritar elemen t dan r, dil~itung sebagai berikut : SUM, + SUMr + s,,
In Bl -
RECALL =
d(t,r) =
(N,+ N,)(N,
+ N, .- 1) 1 2
4. Pautan Rata-rata antar Kelompok yang T2rgabung (Average Linkrrge Ucrivec/i Merged Grotcps). Metode ini l~ampirsama dengan lnetode sebelumnya, hanyi~ saja dalam mencari pasaogan yang paling sania, jarak alltar elemennya, misalkan elemen t dan r, dihitung sebagai berikut :
Salall satu mctodc p e ~ i y ~ ~ k ~e~f cr karni l i t ; ~ ~ dengan menggunakall nil;~i r ~ v . ~ rdan / l /,rcr.~.ir<~~r adalah teknik rata-lxti~. l i s ~ l k ; S~ od;~l:~h himpunan istilah yang di~ii:~sukk;~~i ole11 P ~ I I ~ ~ L I I I ~ I , dan As adalall Ilimp~tniundokunleli yalig releva~l dengan istilah s, maka : .
. ..
Jika A adalah level koordinasi, dan B;, adi~lali himpunan dokulncli y a l ~ g tcrambil pad;] i i i l t ~ i koordinasi A. maka : di mana s,, adalah jumlall t i i l i ~ i kesamaan antara pasangall kluster t d a l ~ kluster r, sedangkan N, adalah jumlah obyek yang ada pada Itluster I. Model dari kluster berhirarki dapat direpresentasikan secara grafis, yaitu dcligan diagram pohon atau d t ~ x l u g r u i r ~I'iida . niodcl penggabungan berhirarki, ( l o ~ ~ l o g r ~di~nulai ~ i r r dari bagiali dilnana semua elelneli berada pada Itlustcrkluster yarig bcrbcda, atau pada bagiall dilnana semua elemen tiielijadi sanl kluster. Patla sctiap level algoritma pengklustcra!~inenyetukan due atau lebih klr~steryang paling mirip (Bacclar 8: Nicol;~u, 2000).
. ... l'itik (I<,, P A )dapat dil~itungsebi~gaibel.ikut :
Menurutnya juga, jika pelnotongan kluster dilakukan pada awal hirarki, cenderung menghasilkan nilai precision yang tinggi, tetapi nilai recaN rendah. Dan sebalikoya, jika petnotongan kluster dilakukan pada level atas hirarki, maka akan menghasilkat~nilai precisio17 rendah dan nilai recall yang tinggi.
METODOLOGI PENELITIAN Penelitian dilakukan melalui beberapa tahap, yaitu: I . Pengu~npulandokumen. 2. Pengekstrakan informasi dalani dokumell. 3. Pembentukan kluster. 4. Pe~nbuatanprototipe search engine. 5. Analisis. Perangkat lunak yang digunokan dalam penelitian ini adalah Ms Access 97, Ms Excel 97, SPSS 9.0, dan bahasa pelnrogralnan Visual Basic 6.0. Sedangkan untuk prototipe serrrclt engine dibuat dengan ~nenggunakanASP (Active Server Pages).
3.
Modul untuk n~enghitung frekuensi masing-masing istilah dalam tiap dokume~l dan hasilnyaput~ dimasukkan ke dalan~ basis data.
Pelr~beatukaeKlustcr Data frekuensi istilah yang dihasilkan pada modul ketiga digunakan unluk ~nembentukmatriks istilah-dokumen, dilnana setiap baris dalam tnatriks menyimpan kumpulan frekuensi dari istilali tertentu pada senlua dokumen yang ada, seperti terlihat pada matriks A berikut irii : Dt D>
.....
D,,
ditllana Ii= istila11 kc-i, Di = dokunlen kc-i, dan fij= frekuensi istila11 kc-i dalam dokumen kc-j
Matriks istilah-dokun~e~i ini dibentuk menggunakan sebuah modul, yang men/rarzsji.r data frekuensi istila11 yatlg ada dalam basis data kc dalaln sebuall tile berfor~uatexcel. Setelah ~natriks istilah-dokumen terbentuk, maka dilakukan proses pengelompokan dengall menggunakan SPSS 9.0. Jellis pengelonlpokan yang dilakukan adalali mctode kluster berl~irarki dengan ugg/o~~reratiie prucedr~re yang menggunakan metode pautan rata-rata dalan~ kelompok yang baru, scdangkan pengukurnn jaraknya menggunakan perl~itungan jarak Elrclid~!an. 01rrp111 yang dil~:~silkan dalan~ proses Eltstr~tltsiI t ~ f o r r t ~ ~ l s i Yang dimaksud dengan proses ekstraksi ini berupa derldogrmrt istilali. Der~dograrrr yang terbentuk berupa kulnpulan infortnasi adalali proses penyirnpanan i~~l'ormasi yang terkal~dungdala~nmasing-masing dolturnen kluster-kluster yang berawul pada saat dimana setiap kluster dimulai dari satu istilali satnpai ke dalam suatu basis data. akhirnya setnua istilah rnenjadi satu kluster. Hal itu Proses ini lnelibatkan beberapa modul yaitu: memberikan banyak alternatif untuk me~~entitkan dan tnempelajari kluster man;] yang sesuai untuk I . Modul untuk memasukkan inforn~asikebutuhan (Salton, 1989). informasi yang ada pada dokumen, seperti judul, pengarang, ringkasan dan namaPembuatan Secrrclr Krrgi~rc nalna petnbi~nbingke dalam basis data. Setelah kluster-kluster terbentuk, maka tahap 2. Modul untuk me~nasukkan isrilall-istilah dalam bidang illnu ltotnputer yang tcrdapat selanjutnya adalali petnbuatan search egine. Serrrch dalaln masingmasing dokumen ke dala~ii engine dibuat dengan inenggunakan ASI' (,lctil,e Serve, Puges), dimana untuk sisi server digitrtak;~~~ basis data. vb scrip, dan untuk sisi clrerlr digut~akanj i ~ \ ~ i r scrip,.
Pe~iguinpulanDoltume~l Dokunien yang digutlakan sebagai sumbcr masukan untuk proses pengelompokan dalam temu ke~nbali adalah 107 dokutnen, yang berupa ringkasar~ (abs~racr) karya illniah mahasiswa S1 IPB. Iiarena penelitian dilakukan utltuk specijic dor~ruin,dala~n ha1 ini adalah bidat~gko~nputer, maka dilakukan pemilihan terhadap d o k u n l e ~yang ~ topiknya berkaitan dengan bidang imu ko~nputer.
.
Kluster istilah yang dihasilkan pada tahap sebelumnya digunakan untuk memperluas kueri yang akan digunakan dalani pengambilaci dokulnen (expunded booleu17 queries), dirnana istilah-istilah yang berada pada satu kluster dianggap rnernpul~yai makna sama. Hal ini dimaksudkan agar peluang dokumen yang terambil menjadi lebih besar.
c.
!ika ditemukan istilah "(record)", istilah tcrsebut juga akan dihitul~g.
rnaka
Tnbel 2. Daftar kondisi yang diterapkan dalam perhitungan istilah
HASIL DAN PEMBAHASAN I
...... Islilali dalani lnndil kuruug d;!a dinkhiri ,,ritil,,,,,, lnndn tilik Islilali dalatu lalids kurung d;~sdirllliri
h('.islilah")."
k"","
Kurnkteristik Kelor~ipok Istilah-istilah berhasil dikelo~npokkanke dalam 10 level birarki, yaitu pada jarak (dislcmce) 25. Jadi pada jarak tersebut seluruh istilah telali berhasil bergabung menjadi satu kluster tunggal. Kluster yang terpilil~adalah kltrster-kluster yang terbet~tuk pada level 2 hirarki atau pada jarak (disrance) 5. - dokulnen Pada jarak tersebut total kluster yang terbentuk Rataan istila11 dalam tiap dokumen 57,12 sebanyak 436 kluster dengan perincian seperti Rataan kata dalam tiap dokumen 239.44 tercantuln pada Tabel 3. I-lasil kluster Tabel 1 lnenunjukkan adanya perbedaali yang selengkapnya dapat dilihat pada Lalnpiran 1. Pcmililian kluster didasari ole11 pertimbangan cukup besar antara r~ilai rataan islilali dalam relevansi antar istila11 dan jumlah keanggotaan dokurnen dengan nilai rataan seluruh kata yang ada kluster. Pada jarak 4 belt1111ada kluster belgabur~g dalam dokumen. Hal il~ikarena istilali-istilall yang dimasukkan hanya yang berhubungan dengan ilmu dengall kluster lai1111yajadi setiap kluster masih koniputer saja da11 juga karena jurlilall kata dalam terdiri dari satu istilal~,dali pada jarak 6 istilallistila11 yang berllasil bergitbung mcl~jadi sattl suatu istilah bisa terdiri lebih dari satu kata. kluster sudah tidak relevall lagi atau melniliki rnakna yang tidak sama. Olell karena ilu kluster yang dipilih adalah yang terbentuk pada jarak 5. l'ea~ilihan d a l ~Perl~itullgat~ Istilali Dari T a b e l 3 terlihat bahwa jumlal~anggota pada Yang dimaksud dengan istilah adalah kata-kata kluster-kluster yang terbentuk berkisar mulai I yang mernpuriyai arti sehingga satu istilali bisa sampai 21 istilah dalaln satu kluster. lstilah yang terdiri lebih dari satu kata. Ada beberapa kondisi yang diterapkan dalam sudall membentuk kluster deligan istilali lainnya proses penghitungan istilah dalam dokumen, yaitu berjunllah 89 kluster, de~iganjunilah anggota pada suatu istilali akan dihitung jika kehadirannya dalam masing,-masing kluster antara 2 salnpai 21, dokumen memenuhi kcadaan seperti terca~ltum sedangkan sebagian besar kluster laionya yaitu sebanyak 347 kluster dari total 436 kluster hanya pada Tabel 2. Hal ini Sebagai contoh, jika modul iier~dak riiencari beranggotakan satu buah istilali. menandakan bahwa jarak E~rcliclecm yang istilali "record", ~ilaka kondisi-kondisi yang dillasilkan dari perhitungan frekuensi istilah dalalii ~iiuligkinditernukan adalah : a. Jika ditemukan istilab "recorder", istilali dokumen cukrlp bcsar otau bisa diartikan ketidaksaoiaan antar istilall-istil:~h tersebut crtkrlp tersebut akan diabaikan. b. Jika ditemukan istilah "record", maka istilali besar sehingga pada level dua dari proses tersebut akan dihitung.
aggregation, sebagian besar istilali belum membentuk kluster dengan istilali lainnya. Tabel 3. Ringkasan kluster yaiig terbcti~~ik
Tabel 4 menyajikan daftar beberapa kluster istilali yang terbentuk pada jarak 5, yang tiieiniliki jumlah anggota lebih dari satu. Dari beberapa daftar kluster pada Tabcl 4, bisa dililiat bahwa ada beberapa kluster yeng metniliki anggota berupa isrilah-istilah yang tidak me~niliki hubungan yang jelas walaupun sebagian besar dari kluster tersebut sudah terlihat memiliki liubungan yang jelas. Istilah-istilah yang tidak meiniliki hubungan yang jelas terliliat pada istilah "fuzzy trapezoidal" dan "overlap" dan pada istilah "sistem inforniasi pariwisata" dan "monitor vga". Hal ini disebabkan karena istilah-istilali tersebut lianya berada pada satu dokumen, dan frekuensi istilah-istilah tersebut dalam dokumen sama (kedua istilah sama-sama memiliki frekuensi 2), seliingga jarak Euclidean yang terbentuk pada saat proses pengelompokan kecil. Hal ini ~nengakibatkan kedua istilah tersebut dianggap memiliki kesamaaii yang cukup besar oleh sistem, seliingga dikelompokkan dalam kluster yang sama. Sedangkan kaitan antar istilah dalaln kluster yang cukup jelas terlihat antara lain pada istilah "bmp" dan "grey-level", "analisis sistem" dan "desain sistem". Dari kee~npatistilall tersebut ada yang hanya terdapat pada dokumen yang sama, d a ~ i ada pula yang terdapat pada doku~nell yang berbeda. Dua istilah pertama, yaitu "desain sistem" dan "analisis sistem" terdapat pada dokumen yang sama, sedangkan istilah "bmp" dan "grey-level" terdapat pada beberapa dokumen yang berbeda. Tapi setelah proses pengelompokan tertlyata kedua istilah tel.sebut berada pada kelotnpok yalig sama.
Tabcl 4. DaFtar beberapa kelo~lipok yaiig terbentuk pada jarak 5
Searcli E~igirtc Search engine yang dibuat berupa prototipe dari spec@ dunlain search engine. Jadi pengguna
hanya bisa memasukkan satu buah istilah yang dicari, kemudian akan ditampilkan judul dari dokumen-dokumen yang sesuai secara descending berdasarkan total frekuensi semua istilali yang terlibat dalam masing-masing dokumen. Istilahistilah yung dapat digunakan sebagai inpur, adalah istilah-istilah yang sudah terdaftar dala~nbasis data istilah.
r
Pengguna memasukkan istilah
I.
Pengguna Analisis Komponen Utalna dan Jaringan Syaraf Propagasi Balik untuk Pengenalan Wajah (The Use of Principal Conlponent Analysis and. Backplapagatior~ Neural Network for Face Recognition). 2. Perbandingan Metode Analitik dan Holistik pada Pengenalan Wajal~ Menggunakan Jaringan Syaraf Tiruali Propagasi Bt11ik Standar (The Comparison of Analytic and tlolistic Method on Face Recognition Using Standard Backpropagation Artificial Neural Network). Tnbel 5. Daftar istilah percobaan .--~ K IO Istilah .-. -. i Bnsis data - .--.
-
-.
-
.,
3 ,
-..
FUZZY
91
x!
3
3 3
5
Information rclricval Jnringan komputcr Kon~pulcrgrniik
6
Sii~~ulnsi
2
3 4
Pencarian id kelompok istila11
.[.. - .. . . DIX1 Dr .1I;;*,! ,
A ..
-i---Tiiulusi
4 . . .~~ .... .-
kon~puler 8-?%ics, infomlusi . 9 Sirtcnl inforlnusi eksckulif 10 Siras paknr I i Tcolio
,
.
x / ~
4
3
I I 7 3 - . . .2 2 27 24
~
I 3
3 27 I
dala~iisatu kluster
berdasarkan istilah
i + i selesai
G a ~ n b a 1. r Diagram alur pencarian dokumen Untuk pencarian dokumen berdasarkan istilah yang dimasukkan pengguna, diterapkan langkahlangkah seperti yang terdapat pada G a n ~ b a r1. Misalkan pengguna memasukkan istilah 'ljaringan syaraf tiruan", maka yang pertama dilakukan oleh search engine adalah ~nencariistilali lain yang berada dalam satu kluster dengan "jariringan syaraf tiruan", yaitu istilall "backpropagation". Setelah didapatkan kedua istilah tersebut, nlaka n~ulailah llecirll dull I'recisiorr Untuk inengukur efektivitas dari seorclr engi~le pencarian dokumen menggunakan istilah-istilah yang dibuar, digunakan rncrode pengukuran recall tersebut. Dan didapatkan doku111ei1-doku~nen dan precision. Unluk ~netidi~patkan nilai recull dan sebagai berikut : precision diperlukan data-data berupa jumiah
dokumen yang terambil, jumlah dokunien relevan yang terambil dan jumlah keseluruhan dokurnen yang relevan dalam setiap pengambilan dokumen. Karena itu dilakukan percobaan melalui serangkaian peiigambilan dokumen, yaitu sebanyak 30 kali pengambilan dengan menggunakan istilahistilah yang berbeda untuk niendapatkan data-data tersebut. Daftar istilah yang digunakan dalam percobaan dapat dilihat pada Tabel 5. Kolom istilah pada Tabel tersebut berisi istilah-istilah yang digunakan dalam pengambilan dokumen, kolom DA berisikan jumlah dokumen yang terambil, kolom D, berisikan jumlah dokumen relevan yang terambil, sedangkan kolom Dc berisi junilali seluruh dokumen yang relevan yang dihitung dari keseluruhan dokumen yang ada. Untuk perhitungan recall dan precision digunakan teknik rata-rata. Hasil perhitungan secara detail dapat dilihat pada Lanipiran 2. Tabel 7 berisi jumlah dokumen yang terambil pada setiap level koordinasi dan pada setiap istilali yang digunakan, yaitu 10 level koordinasi dan 30 buah istilah. Tabel 8 berisi jumlah dokumen relevan dari dokumen yang terambil pada setiap level koordinasi, sedangkan Tabel 9 jumlah doku~nen relevan pada tiap-tiap istilah. Dari nilai-nilai yang ada pada tabel-tabel tersebut bisa didapatkan nilainilai precision dan recall seperti pada Tabel 6. Tabel 6. Precision dan Recall A 1
Precison
Recall
0.97
0.26
2
0.97
0.31
3
0.96
0.38
4
0.93 0.89
0.43
5 6
0.87
0.46 0.54 0.60 0.70
7
0.85
8
0.82
9
0.80
0 . 7 r -
10
0.76
0.77
Dari nilai-nilai yang ada pada Tabel 6 dapat dibuat grafik recall dan precision seperti pada G a ~ l i b a r2. Pada grafik tersebut terlihat liubungan negatif antar recall dan precision. Jika lrilai recall rendah, maka nilai precision tioggi, scdangkan jika nilai recall tinggi, tnaka nilai precision ceridcrung rnenurun.
Nilai precision yang dillasilkan dari percobaan ini sangat tinggi di niana nilai yang terendali hanya 0.76 dan nilai tertinggi adalali 0.97. Sedangkan nilai recall cenderung lebil~rcndali dan bervariasi mulai dari 0.26 sanipai 0.77.
G a m b a r 2. Grafik recall dan precision Hasil ini, sesuai dengan teori yang diungkapkan oleh Rijsbergen (1997) bahwajika kluster dipotong pada awal hirarki ~ n a k anilai precision cenderung lebih tinggi dibandingkan nilai recallnya.
KESIMPULAN DAN SARAN I<esi~spulan Dari penelitian yang telah dilakukan dapat diambil kesimpulan sebagai berikut : I. Hasil pengelompokan yang kurang akurat sebagian besar disebabkan karena istilahistilah yang berhasil mengelompok tersebut hanya terdapat pada satu atau dua buah dokumen. Oleh karena itu jika frekuensi istilah-istilah tersebut snma, maka otoriiatis jarak antar istilah tersebut sangat kecil yaitu 0 (nal) dan sistem akan nienggabungkan istilahistilali tersebut ke dala~iisatu kluster. 2. Nilai precision dan recall ~nemilikihubungan yang negatif. Maksudnya adalah jika nilai recall rendah, maka nilai precision tinggi dan sebaliknya jika nilai recall tinggi maka nilai precision cenderung lebili kecil. 3. Pemotongan kluster pada awal hirarki, yaitu p~idajarak 5 aknn nienghasilkan nilai precision yang jauli lebili tinggi dari nilai recallnya, namun sebagian besar istila11 belum bergabung dengall istilali lainnya
Saran Kelemahan dalam sistem ini adalah adanya istilah-istilah yang berhasil dikelompokan dalaln satu kluster, walaupun istilah-istilah tersebut tidak memiliki kemiripan makna dengan istilah lain dalam kelompoknya. Karena it11 penulis menyarankan agar dalam pengembangan sistem lebih lalijut, donlain yang pakai dalam pengumpulan dokumen lebih spesifik, seliingga istilah-istilah yang dihasilkan akan icbili sedikit dan keliadiran istilah-istilali tersebut lebil~ bervariasi dalam dokumen-dokume~i, selii~lgga akan menghasilkan kluster-kluster istilali yang lebill tepat. Dalam proses pemiliha~idan pemasukan istilali penulis menyarankan agar terlebih dahulu melibatkan proses pe~nbentukankata dasar derigan menggunakan algoritma Steming, sehingga istilah yang akan dikelompokkan tidak akan terlalu banyak karena sebelumnya sudah dikelompokkan berdasarkan kata dasamya.
DAPTAR I'USTAKA Adisantoso, Julio. 2001. P e r l e ~ r s a ~Kueri ~ Menggunakan Peluung Bersyu~ut (Quey Expansion using Conditional Probability). Forum Statistika dun Konlpurasi. 6: 7-13. Andenberg, M.R. 1973. Cluster Analysis for Applications. Academic Press, Inc., New York. Bacelar, Helena and Nicolau. 2000. Closs~$~ing Variables By Hierarchical Clustering A4odels: Empirical and Probabilistic Approaches (http:I/ www, uni-bonn.de/ ~nathpsyc/doclBacelar/ Bacelar.htm). Jol~nson,R.A. and D.W.Wicl~ern. 1988. A plied Mutivariate Statistical Analysis. 2"' ed. Prentice-Hall, Inc. Penyus~man Tesaurus Prasetyo, Dwi. Menggunukan Analisis Cerosbol. Skripsi Jurusan llmu Komputer FMIPA IPB. Bogor. McCallum, Aodrew, K a ~ n a l N ~ ~ ~ I IJason II, Rennie nnd Kristie Seymorc. Building Donlain-SpeciJic Search Engine with hlachine Learning Techniques. School of Computer Science Carnegie Mcllo~i IJniversity, Pittsburgh.
Search Engine Ttrrorial /or
Web Designers,
htfo:ll\.\'ww.nor~liernwebs.co~ii/s~~l
Rijsbergen, C.J.va11 B.Sc., Pli.D., M.B.C.S. 1979. lnfirnlation Retrievcrl. Department of Computing Science, University of Glasgow. Selton, Ccrald. 1989. A ~ ~ I l o ~ T~ a~~Processing i Ic The Trans/ornlation, Analysis, and Retrieval of ln/ornration by Co~n/~rrter.Addison-Wesley Publishing Company, Inc.
LAMPIRAN
L a m p i r a n 1. Hasil pengelompokan istilah D e n d r o g r a m using Average Linltage ( W i t h i n G r o u p ) Rescalcd Distance Cluster C o m b i i i e C A S E
Label
Nu",
0
5 10 15 +---------+-.-..----+---------+---------+---------+
ms powerpoint msword cascade rnsexcel tile hard disk
692 693 689
prototype analisis sistem desain sistem front end backend furry trapezoidal overlap center of grafity defuzifikasi furry logic fuzifikasi f u u y min-max
4 72
691
690 170 53 54 212 213 492 497 495 496 490 493 494
sample decoder prosedurai simulation interaksi manusia teknik pernrograman multithreading muilimedla spasiai relasi furry model adiassnig-kolarz metode peringkat pernetaan bijektif kompieksitas algoritme rekord
491 687 211 273 146 150 152 147
asp active server pages plug-in developer geographic information system windows nt server
515 516 513 517 508 510
wysiwyg windows nt basisdata partial exact matching keywords personal web server
512 574 511 270 271 573
.
h J i l j -
148
381 38) 33 38 41
35
I
20
25
Lampiran
I . (La11jut;ln) odbc Browser professional home page skrip Sewer-side binary coded decimal adder Webtilaster hang
575 568 570 572 51,1 684 621
Webpage Webadmin Update Password Router access conlrol policy hacker privalc network parttioned iterated function systems
619 62" 77 315 641
62.'
642
64" 639 581
memory 583 iteraled function systems 580 resolusi 5 8 2 winexsys 376 exsys professional for microsofl 377 wlndows 408 microsofl wlndows 659 kompresi matriks sparse 660 sparse matrix compression 661 worst-case 602 vertex GOO worst case 291 run-length encoding 2 93 pixels dala digital dct *OL) 290 kuanlisasi 287 graphics interchange format 288 discrete cosine transfornr 282 redundancy 286 joint photographic experts group 593 discrete 674 marketing information system 4136 pereferensian compression 579 340 reasoning-trace explanations 538 power designer 6.0 dataanalyst 539 power desigtier 6.0dataarchitecl 537 help scribbel 80 s i s t e ~iiilortnasi ~i rnanajemen ~nleraklif 39'' .1 3.1 sisle~riinforrnasi parlwisala 'I 3 '> monitor vga ,135 n~acroinedlaauttionvare
"'
Lampi~.ar~ I.( l a ~ i j u t a i ~ ) SO~COPY 63 1 hardcopy 632 CmOS 62 3 acer 627 compaq 628 year 2 kilo 625 y2k 626 century byte 624 ibm 629 otomatisasi 1 2 1 model sanchez 382 berkas 34 1 microsoft visual basic 536 expert system 47 1 real time 7 0 datafeed 7 3 mullithread 71 multitasking 72 stokhastik 679 metode transformasi invers 680 simulasi ranlab markov 671 peiuang transis1 stasioner 678 triangulasi poligon 560 polygon triangulation 561 dynamic programming 550 matrix chain multiplication 5 5 9 kombinatorial 1 3 0 parallel 55.1 data struclure 453 reference dictionary 454 double-array 2 6 3 trie-list 265 trie-da 2 6 6 art-im 1 3 0 automated reasoning tool for in!ormation management 439 system development Ilfe cycle 442 SdlC 1 1 3 batch 64 5 lease line 64 6 ms excell 64 3 graphic user interface 644 user ~nterface3 1 3 object-based programming 666 entity relationship 667 bOttOlWUP 6 6 5 b a r 193 sistem inlormasi agroindustri 375 recover 3 1 0 inquiry 3 1 1 metodc alur maju 308
Lampirun 1. (la~ljutiln) ole automation 303 enuripsi help 3 1 2 visuailzalion q66 java3d
467
lava 3d tree3d
Gq
-
simple iight interception model liga dlmensi grafis
6a 6,, operasi penghapusan 4 1 8
operasi pengganlian melode kesarnaan string operasi penyisipan cluster analysis analisis gerombol knowledge discovery inheritance rules inherilance earliest-stalic-level earliesl-finish-lime graf asiklik berarah highest-static-level highest-dynamic-level directed acyclic graph virtual cartesian product form teks
-
417 447
306 663 664 441
552 553 545 550
551 6 55,,
,.,I
--.--
dot matriks l o g
sjstem manalemen basis data ibm rlsc 6000
17a
updaling 190 peluang bersyaral 4 4 5 metode pencarian 3,i prinler monitor PC java scrip1 realtim~ OICCI~OO~C cornrnerce visual basic script
,a,
-
-.
183
56G 5C.,
:,,,
565 hypertext markup language 11 e-commerce 5 6 3 java 1(1 online 3 9 9
.
--
1
Lampiron 1. (Lanjutan) .basis data reiasional lit data relasionai digitasi context-free grammar data retrieval speech recognition pengenalan ucapan sinyai single-user simultan
390
392 220 588 586 585 319 48.1 485
',I+ -
visual C++ 477 sound card 482 ppicard 483 sound recorder personal computer 481 jet audio q 7 q sistem berorientasi obyek 576 sistem pengelolaan 195 reasoning-trace explanalion 4gq microsoR access 97 29 inlorface
pelacakan ulan9 backtracking fungsi kendala np-complete
133 476 129 131
design 336 hypertext 338 statistika deskriplif 675 inferensia stalistika 676
L
-
-
-
--
-
-
:
--
-
-
-
sistem intelijen 502 neural 449 infarensia borland deiphi admin supervisor sybase sql anywhere full exact malching mulii-user offline
379 274
275
268 2 ~ q 272 67
---.
--
L a m p i r n ~I ~. (Lanjutan) matching 571 public 276 stand alone 577 skelelon-key 3 4 3 omission-key 344 precision 346 recall 347 model entiti-relasi 27 visual basic 5.0 31 model relasi 28 asimetrik 530 ciphertext 532 fronlal 119 correlation 4 62 automatic acces control g8 PCX 1 1 4 rgb I 15 bitmap 112 j ~ 113 g matlab 110 paint shop pro 111 security system 100 template matching 105 human computer interfaces 99 transformation 46) defuzzihkasi 6 8 8 executive information systems 540 jusl in Lime 391 sistem penunjang keputusan 228 decision support system 473 face recognition 10.1 ukuran kesamaan 107 fonetik 3 4 8 penemuan pengetahuan 662 hypermedia 498 pengambilan kepulusan 1 9 9 3d gif designer 656 animagic gif 657 e-business 649 gold java 654 applet button factory 655 modem 652 microsoff frontpage 653 harddisk 651 pentium 650 processor 562 sistem informasi e-marketing 647 mouse 188 delete 78 retrieval effectiveness 187
Lalnpirall I . (Lanjutan) delphi metode accrual multiprosesor blekclient broadcast email ring bleksewer bus star Ian topologi koneksi aciivex automation temu-kembali poligon protocol klien jaringan kompuler keyboard temu kembali sislem operasi program aplikasi memori algoritma simpleks algoritma ellipsoid pemrograman linear linear programming karmarkar algorithm algoritma karmarkar display biner sistem pendukung kepulusan microsoff access xml java virtual machine perlukaran data remote extensible markup lai3gUage html ClienUseNer markup tampilan network user penumpukan tesaurus makro pemrograman makro instruksi algoritma heuristik
L a m p i r a n 1. (Lanjutan) program akuntansi platinum 63.1 platinum basic 637 port disbursement 633 pemrograman dinamis algoritma nelder-mead multidirectional search anlarmuka operator paralel
-
4 14
533 534 380 135 151
struktur program object oriented programming
4 32
polimorfisme
429
numerika berorientasi objek
426
pelnrograman numerik
q2.1
objecl oriented
474
i I
682
bahasa pemrograman
retrieval melhods
669
oracle designer 324 Sistem informasi akuntansi 3 3 1 case tools
33)
computer assisted software engineering 3 3 2 ms access 325 management information system 464 tools 335 case 333 information system 4 5 2
gudang data data warehouse dbms
j70 371 3G2
-
-
oiap database engine on-line analytical processing oltp on.line transaction processing database management system heuristic algorithm &tern pakar berbasis pengetahuan kuantitatif paradox relationship perangkal keras on-line koelisien determinasi e-marketing temu-kembali peiuang sistem informasi geogralis autodesk mapguide P ~ P kueri metode ziegler microsoft windows 98 spoofed switch intrusion linux detection synflood prolotipe edit hierarki analitik decision making muitiplaiform chatting stream socket protokoi komunikasi numerik hardware output struktur data designer logika f u u y reduksi data relasi generalisasi generalisasi data
gugus rough set algoritma noyd algoritma dijkstra
Lampiran 1 . (La~ijutan)
-
access open addressing linear probing secondary storage decrement aslmtotik
173
pembenturan primary storage key to address transformation kat double hashing field entri
166
pemetaan sistem aplikasi
353
key subsistem visuaibasic visual pohon 3d slim visualisasi
163 49
ingar multistage median filter aigoritma dual space algoritma semi dual space windowing
?lo 321
algoritma modified cyrus-beck algoritma line clipping animasi
616 612 296
window grafik
61s 4s
poligon distributed database pseudo-code concurrency control two phase request distributed scheduler diskrit konlrol konkurensi simulasi komputer konkuren pemodtlan akses
15; 17.1 169 176 160 16.1
164 165 17s 162 171
158
142
-
681
53
--
67
62
- 7
61-1 618 61 .i
-
4 13
595 598
996 59"
591 695 597
323 I
---
Lsmpil.an 1 .
(La~ijutan) koefisien koreias 697 trigram 57 boolean 299 wet
.
pixe bilang'dn acak pengenaian poia koreiasi norm= transformasi fouriel orientas dimens pengenalan wajah komunikas intranel database non-relasiona manajemen database durable acio e-maim consistency isolation propert atomicity command connection string connection recordsel component object mode, corn oledl: activex data objects uda
9 116 120 101 96 97
118 106 123 197 75
-A I
--
I
-A
ad -
I
12 215 219 239 240 216 23-j 238 235 236 232 233 230 231
i -A -
-
-
224
-
225 222
-
object linking and embedding for databaser universal data access keamanan data spreadsheel korelasi pearson pemrograman liniel direct searcil multi usel
223 221 218
--
damerau-levenstein-metric data access record siklus hidup sistem metode gross-uC user friendly antar muka
342 470
226 227
217 696 683 535 440
172 52 638 314
223
perancangan sistem 51 objecl 460
-
:
-
.
-
--A:
1
--
A
L a m p i r i ~ n1. (Latljutan) pengaksesan data
50
berorientasi obyek 18 algorithm 468 parameter 69 diskriminall 541 sistem informasi eksekutif 244 firewall 39 sim 81 transaksi
16
perancangan penjadwalan internet sewer metode hashing koiisi mesin basis data respons
22 549 6
.
-
---
--
A _
79
I I
155 157 .$liq
I--
5.1%
--------------
element different moment of order k 2s4 keseragaman :GO anaiisis citra 251 matriks kookurensi 242 tingkat keabuan 243
-
texture 456 features 457 bmp entropi grey-level iedm kontras
249 259 455 257 258
invers of element different moment of order k edm txt peluang maksimum penginderaan jauh
255 256 250 253 252
adaptive multistage median filter link teori gugus bit matrix siklus lhidup
322 500 38s 42 215 360
-
---A
-
image 102 derajat kesamaan 5 9 format - 4 8 file
windows 18.1 implementasi 2 3 pengembangan sistem 55 Lekstur 2.16 perangkat lunak
-
137
138
-
---
.
-
La111l1il.a~1 . (Laiijotan) domain name system 349 domain name 352 ip protokol dinamid name server resolve host client host.txt
94 350 358 356 357 354
dns 355 tcplip 8 6 client 203 dinamis 154 host trie median filter rnodul
351 262 320 635
information retrieval 451 threshold 488 knowledge-based fuzzy 486 relevansi 300 korelasi 542 obyek hashing dokumen kriptogran data encryption standard encryption rivest sharnir adlernan simetrik waktu kornputasi komputasi kornpleksitas token bits
155 j2
IOSSY
huffman coding replika citra digital lossless
284 292 285 260 283
gif jpeg digital matriks
279 278 117 201
307
528 531 526 527 529 525 108 159 294 295
input 339 kunci 37 jaringan syaraf tiruan 125 backpropagation 461 artificial 4 4 8 neural nehrork 450 arskektur jaringan 1.26
Lampiran 1. (La~ijotan) propagasi balik neuron jaringan syaraf layer holistik epoh analitik galat ado sinkronisasi reiasi waktu pernampatan citra Fraktal Pernampatan Simuiasi Pemrograman basis data Aplikasi Jaringan Analisis Kinerja sistem pakar Fuzzy Median Algoritme Edge Node list scheduling Scheduling Graf Prosesor Chat List Blekdinet protokoi blekdinet iocai area network Local Protokoi Software Keputusan Relasi Query Kompulcr Relrieval Simpul Lintasan lintasan terpendek sistem informasi Tabei Program
.
Lampiran 1. (Lanjutan) Metode Citra
234 103
algoritma ,28 data l~ilornins~
7 1
I . . ..
J
Lampiran 2. Detail hasil perhitungan data untuk evaluasi
s = istilah yang digunakan, A
-d
6
= level
koordinasi
Tabel 9. Jumlah seluruh dokumen yang relevan (A,) S A
11 7
21 81
31 4
41 31
51 11
61 3
71 81 3 271
91 101 111 121 131 141 151 161 141 181 191 201 211 221 231 241 251 261 271 28/291 301 IA 3 121 31 1 2 4 11 91 11 11 3 11 11 11 31 3 31 41 41 4 11 I 2