PROTOTI PE SPECIFIC DOMAIN SEARCH ENGINE DENGAN MENGGUNAKAN
METODE KLUSTER BERHIRARKI
AIIE L I A S A
JUHUSAN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2001
RINGKASAN Ade Liana. Prototipe Specific Doinui~i Search Engine Dengan Menggunakan Metode Klusrcr Berhirarki (Specrfic Domuin Srrrrch Etigine I'rolotypr Usirrg liierurchicul C'llr.slrring h/clhoc/).Dibimbing oleh JULIO ADISANTOSO dan YEN1 HEKDIYENI. General purpose search engine memang menawarkan banyak informasi bagi penggunanya. narnun memiliki satu kekurangan yaitu nilai pi.ecision dari hasil t e ~ n ukernbalinya keci I. Salah satu alternati t' solusinya adalah dengan nienggunnkan s/~co/Jcdottloin seurch pngine, schingga sislem temu keriibali dibatasi hanya pada domain tertentu saja. Pcnelitian ini bertujuan untuk ~nenelaalipenggunaan rnetode kluster berhirarki dalam sistem t e n ~ ukelnbali untuk niembangun speci/ic rk)ttrtrin .seurc/i etlgine dull kinerja rnetode kluster berhiraki dalarii sisteni tcmu kcmbali. Dokumen yang digunakan dalam pcrielitiari ini berjulnlali 107 buah dokumen yarig berupa ringkusu~i karya ilmiah mahasiswa St IPB. Melode kluster berhirarki digunakan untuk niengelompokkan istilali berdasarkan frekuensi setiap istilah d a l a ~ ndokumen. Pengelompokan ini dilakukan dengan menggunakan SPSS 9.0, dimana metode yang digunakan adalah metode pautan rata-rata dalanl kelompok yang baru (average linkage within the new grurrp) dali output yang diliasilkan d a l a ~ nproses ini berupa dmdugrtrttr istilah. Kluster yang terbentuk akari digunakan untuk nlemperluas kueri dalarn pencarian dokumen, di mana istilah-istilah yang berada dalarn satu kluster dianggap merniliki makna sama, sehingga memperbesar peluang terambilnya dokumen yang relevan. Untuk analisis kinerja seurch etrgine digunakan tiletode perhitungan ~ L ' c ~ IdI aI ~ ipreci.sion, yang masing-rnasing merupakan perbandingan antara dokunieri relevan yang terambil dengan jumlah keseluruhan dokumen yang relevan dun tlenyan jumlah dokun~enyang terarlibil.
PROTOTlPE SPECIFIC DOMAIN SEARCH ENGINE DENGAN MENGGUNAKAN METODE KLUSTER BKRHIRARKI
.4DELIANA
Skripsi sebagai salah satu syarat untuk rnemperoleh grlar
Sarjana Koniputer pada Prog~';~m Studi Illnu Komput~.r
JURUSAN ILMU KOhIPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHU AN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2001
Judul
Nama
NIM
: Prototipe Specijic Dotlruin Search Engine Dengan Menggu~~akan Metode Kluster Berhirarki : Ade Liana : GO6497025
Menyetujui,
RIWAYAT HIDUP s sebagai anak kedua dari ernpat Penulis dilahirkan di Jakarta pada tanggal 25 A g u s t ~ ~1979 bersaudara, anak dari pasangan Tjong Wie Soeng dan Susi Melawati Wiryana. Pada tahun 1997 penulis lulus dari SMU Negcri 68 Jakarta dan pada tahun sanla lulus seleksi rnasuk IPB melalui jalur Undangan Seleksi Masuk IPB (USMI), dengan pilihan Program Studi llmu Komputer. Pada tahun 1998 penulis rnulai nlendalami bidang ilmu konlputer di Jurusan Ilmu Komputer, Fakultas Matematika dan llmu Pengetahuan Alarn. Selanla mengikuti perkuliahan penulis menjadi asisten nlata kuliah Algoritma dan Pemrogranlan pada tahun ajaran 199912000 serta mata kuliilll Organisasi Komputcr pada tahun ajaran 1999/2000.
Puji dan syukur penulis panjatkan kehadirat Tullan Yang Maha Esa, karena atas segala karunia-Nya karya ilrniah ini dapat diselesaikan. Tema yang dipilih dalam penelitian ini adalall search engine dengan judul Prototipe Domain Specific Search Engine Dengan Menggunakan Metode Kluster Berhirarki. Terirna kasih penu1is sarnpaikan kepada berbagai pihak yang telah mernbantu penyelesaian karya ilrniah ini, antara lain adalah Bapak
Ir. Julio Adisantoso, hA.Kornp dan Ibu Ycni Herdiyeni S. Komp
selaku pernbimbing. Di sarnping itu terirna kasili juga penuli:; sarnpaikan kepada rekan-rekan di Jurusan llmu Kornputer atas bantuannya, khususnya kepada Ronaldo atas bantuan dan dukungan morilnya. Ungkapan terirna kasih juga penulis liaturka~ikepada kedua orang tua sena seluruh keluarga atas doa, dukungan dan kasih sayangnya. Penulis rnenyadari sepenuhnya bahwa karya ilrniah ini masih rnemiliki banyak kekurangan. Meskipun dernikian penulis berharap sernoga karya il~niahini dapat lnernenuhi fungsi utarna sebagai salah satu syarat rnernperoleh gelar-Sarjana Kornputer pada Program Studi llrnu Kornputer, Fakultas Maternatika dan Illnu Pengetahuan Alarn, lnstitut Pertanian Bogor. Selain itu penulis juga berharap agar tulisan ini dapat berrnanfaat di waktu rnendatang.
Dogor, November 200 1 d ~ i eLiatiu
DAFTAR IS1
DAFTAR GAMBAR .............................................................................................................................vi DAFTAR LAMPIRAN ..........................................................................................................................vi
TINJAUAN PUSTAKA ....................................................................................................................
1 Search Engine ................................................................................................................................. I .............................................................................................. I Klasifikasi Otomatis ...................
. .
........................................................................................................ Kluster Berhirarki .......... . . 2 Efektivitas dan Efisiensi .......... ................................................................................................. 3
. .
METODOLOG1 P E N E L ~ I A ........................................................................................................... N 4 Pengumpulan Dokumen ................................................................................................................... 4 Ekstraksi Informasi ................................... ..................................................................................... 4 Pernbentukan Kluster .......................................................................................................................4 Pembuatan Search Engine................................................................................................................ 4 HASIL DAN PEMBAHASAN Karakteristik Dokumen .............................................................................................................. Pemilihan dan Perhitungan Istilah ............... ........................................................................... Karakteristik Kelompok .................................................................................................................
5
5 5 Search Engine ................................................................................................................................. 7 Recall dan Precision......................................................................................................................... 7
KESIMPULAN DAN SARAN .......................................................................................................... Kesimpulan .................................................................................................................................. Saran .................................................................................................................................................
8 8 8
............................................................................................ 9 DAFTAR PUSTAKA ........................ . . .
LAMPIRAN ..........................................................................................................................................
II
I . Deskripsi dokumen ........................................................................................................................... 5 7_ .
Daftar kondisi yang diterapkan dalam perhitungan istilah ............................................................... 5
3 . Ringkasan kluster yang terbentuk ....................................................................................................
6
4 . Daftar beberapa kelompok yany terbentuk pada jarak 5 .............................................................
6
5 . Daftar istilah percobaan .........................
. . . ................................................................................
7
6 . Precision dan recall ......................................................................................................................... 8
7 . Jumlah dokumen yang terambil pada level koordinasi A ( 6 L r ) ....................................................26
8. Jumlah dokumen yang terambil dan relevan pada level koordinasi A (A, n B, ) ............................... 26 9 . Jumlah seluruh dokumen yang relevan (A, ) ................... . . . ............................................................ 26
DAFTAR CAMBAR
I . Diagram alur pencari?n dokumen .................................................................................................
7
2 . Grafik recall dan precision ...............................................................................................................
8
DAFTAR LAMPIRAN
I . Hasil pengelompokan istilah .......................................................................................................... 2 . Detail hasil perhitungan data untuk evaluasi .............................................................................
II :
26
Perluasan kueri itu sendiri dilnaksudkan untuk rnempzrbesar peluang terambilnya dokumen relevan dengan cara memperbanyak istilah yang Latar Belakang dilibatkan dalam kueri, di luar istilah yang di Seiring dengan benambahnya informasi pada tentukan oleh pengguna (Adisantoso. 200 I ) . Istilah World Wide Web, bertambah pula kesuli~an kita yang d ilibatkan adalall istilah-istilah yang berada untuk mencari informasi yang kitn i~lginkan. Memang tersedia beberapa general-purpose .search dalarn satu kelornpok dengan istilah yang engine, seperti Altavista , HotBot dsn sebagainya. dimasukkan oleh peugguna, karer~a dianggap memiliki makna yang sama (Salton, 1989). yang memiliki cakupan luas, tapi hasilnya kurang memuaskan, dimana nilai precisiotinya kecil. Ketika kita rnenginginkan infonnasi pada bidang T u j u a ~ i Tujuan penelitian ini adalah menelaah tertentu, specific donlain search engine kiranya penggunaan metode kluster berhirarki dala~il rnerupakan solusi yang lebih tepat. Pernbuatan search engine dapat dikelompokkan sistem temu kernbali untuk nlembangun specfic domain search engine dan kinerja metode kluster dalam tiga tahap fungsional, yaitu : nlengumpulkan berhirarki dalam sistem temu kenlbali. informasi, rnengekstrak informasi dan melalui sebuah web merepresentasikannya interface (McCallum er a/). lnformasi biasanya tersedia dalaln bcntuk TINJAUAN PUSTAKA dokumen. Namun demikian, biasanya yang disimpan bukanlah teks keseluruhan dari dokumen melainkan representasinya, sepeni ringkasan, judul Seurcll Elrgilre Scorch e t ~ g i ~adalah ~e sebuah sistem basis data atau kata kunci (Rijsbergen. 1979). yang didesain untuk mengindeks alarilat-alsmat di Banyak penelitian dilakukan urituk inter~let,seperti : url, irsencr,jip, alarnat b r u g ~ da11 . mendapatkan prosedur pensolahan dokunlcn yang efektif dan efisien. Menurut Rijsbergen (1979), ada sebagainya ( I I I ~ I ~~t:N~ .; I\ ~ ~ I ~ ~ I I ~ . I I!I, ~ V). C I ~ ~ . C O I tiga area penelitian dalam sistem r e n ~ u kelllbali, Klasifikasi O t o ~ i i a t i s yaitu : analisis isi dokumen, strukrur inl'onnasi, dan Menurut Rijsbergen (1979), tujuan dari evaluasi. Analisis isi dokumen tcrkait dengan penggambaran isi dokurnen dalam bentuk yang pengelompokan dokumen adalah agar pengarnbilan sesuai untuk pemrosesan komputer, struktur dokumcn lebih cepat. Beberapa rnetode klasifikasi informasi terkait dengan kegiatan n~engeksploitasi didasarkan pada hubungan biner antar obyek. hubungan antar dokumen untuk rneninykatkan Berda~~srkanhubungan itulah sebuah metode efisiensi dan efektivitas dari strategi temu kembali, klasifik.asi dapat membentuk suatu siste~nkluster. dan evaluasi terkait dengan pcngukuran efektivitas Hu bungan tersebu t dapat digall1barkan sebagai ( i t ~ u r i ) dan ketidaksa~naan kesamaan dari sistem temu ke~nbali. Penelitian-penelitian awal sistenl tu111u ke~nbali (dissitn iluriry). kesamaarl ini dirancang untuk infor~nasi nlengadopsi seriul jile o r ~ ~ ~ n i z ~ ~ i o Ukurur~ t~, yang dihasilkan oleh metode klasilikasi otomatis. mengkuantifikasi kesanlsan (rlle likeness) antar obyek schingya dapat diasumsikan bahwa obyekGood & Fairthome (1958) d a l a ~ n Rijsbergen (1 979) merupakan salah satu orang ysng pertama obyek dapat dikrlonlpokkan sedcmikian rupa kali menyatakan bahwa klasifikasi otolnaris sangat sehingga obyek-obyek pada satu kluster lebih mirip berguna untuk temu kembali dokumen. Sela~ijutnya dibandingkan obyek-obyek pada kluster lain. banyak penelitian lain yang dilakukan u~ltuk Berbagai model matcmatika telah banyak mendapatkan prosedur yang lebih efektif dan digunakan untuk mercprescntasikan sisteni-sisteni efisien, di antaranya adalah Luhn (1957) dalam dan ~~roscdur-prosedur dalanl tcmu kelobali, Rijsbergen (1 979) yang menggunakan frekuer~si d i a ~ ~ t a r a n y a adalah model Booleon, model kata dalam dokumen untuk mencntukan kata yang probabilisric, dan model vec~or-spuce. Menurut tepat untuk rnerepresentasikan doku~nen. Spark- Salton (19X9), di antara model-model tersebut, Jones (1971) dalam Adisantoso (2001) yang model veclor-spoce yang paling mudah digunakan memperluas kueri menggunakan teknik kluster dan paling produktif. berdasarkan kemunculan kata dalam dokumcn.
PENDAHULUAN
j !
i
i
Prasetyo ( 1998) dan Andenberg ( 1 973) Johnson & Wichern (1988) menyatakan bahwa jarak statistika dapat digunakan sebayai ukuran kesamaan antar vektor. Semakin dekat jarak antar sepasang vektor maka semakin erat hubungan antar vektor tersebut. Beberapa ukuran kesamaan menurut Johnson & Wichern ( 1988) adalah jarak Eu~.lid:uti dan Minkowski. Misalkan diketahui, x = [ x ' , x', . . .,xPJ' dan y = [y',y2, ...,yP]'. dimana x' adalah bobot istilah x dalam dokumen ke-i dan y' adalah bobot l istilah y dalam dokumen ke-i, s e d n ~ ~ g k pa ~adalali dimensi atau jumlah dokumen. Maka jarak Euclidean dinyatakan sebagai :
kesamaan antar obyek sampai akhirnya terbentuk suatu kluster tunggal. Sedangkan pada proses pernisahan, yang terjadi adalah kebalikannya (Johnson & Wichern, 1988). Misalkan diketahui sebuah matriks jarak segitiga bawah sebagai berikut :
di mana, s,, adalah jnrak atau nilai kesarriaan antarii obyek i dan j. Maka prosedur yang biasanya dipakai dalani penggabungan kluster adiilali (Anderberg. 1973) : sedangkan jarak Minkowski dinyatakan sebagai :
jika m = l , maka d(x,y) menjadi jarak ciy-block antara dua titik dalam p dirnensi. Sedangkan jika m=2, d(x,y) menjadi jarak Euclideun.
i
I
I
I.
Mulai dengan n kluster, yang masingmasing terdiri dari satu obyek. Beri label setiap kluster dengan nomor dari 1 sampai n. 2 . Mencari kluster yang paling sama rnelalui matriks kesarnaan (similarity nrufrix). Beri label kluster yang terpilih dengan huruf p dan q dan nilai kesamaan kluster tersebut adalah s,,, p > q. 3. Jumlah kluster dikurang I karena sudah ada kluster yang bergabung. Beri label kluster hasil penggabungan tadi dengan huruf q dan ganti nilai d a l a ~ n niatriks kesamaan urituk merefleksikan nilai kesarnaan antar kluster q dengall kluslerkluster yang lain. 4. Lanjutkan langkah 2 dnn 3 sebanyak n- l kali, sampai seliiua obyek menjadi S;IILI kluster.
Kluster Berhirarki Teknik pengelompokan yang dilakukan nlelalui serangkaian penggabungan atau pernisalia~ldisebut dengan tekn ik kluster berhirarki (Johnson & Wichern, 1988). Menurut Bacelar & Nicolau (2000). pada analisis kluster berhirarki ada dua pendekatan utama untuk merepresentasikan struktur data. Pada level dasar yang paling sering diguniika~iadalah koefisien perbandingan yaitu kesamaiin atau ketidaksamaan antar variabel, yang samo sekali tidak terkait dengan aspek peluang. Sedangkan Betlerapa metode yang digunakan dalani pada level lebih larijut, digunakan model peluang pembentukan kluster berliirarki adalah : @robabilisric models) berdasarkan koefisienkoefisien peluang @robabilis(ic corflsienfs). I. Pautan Tunggal (Single Linkugc), diliiana Secara uniurn penyusunan hirarki dapat jarak anlara kluster pq atau nlisalkan dibedakan rnenjadi pernisahan (divi.vive) atau kluster t (yang terbentuk pada langkah penggabungan (agglotneru~ive). Pada proses awal nomor 2 di atas) derigan kluster r adalah : pcnyusunan kluster berhirarki pada penggnbungan, s, = niin (sp,,, sq,) sebuah obyek dianggap sebagai satu kluster sehingga banyaknya kluster awal sania dengan 2. Pautan Lengkap (Con~plereLinkage), yaitu banyaknya obyek. Obyek-obyek yang paling salna jarak alitara kluster pq atau kluster t adalah yang pcrtama dikelompokknn. Proses dengall kluster r adalah : penggabungan berlangsung tcrus bcrdi~sarkan su = IllilX (slly.s,,,)
l'autan Rata-rat;) dalani Keloliipok yang Uaru ( A v e r ~ g eLinkuge Wi~hiti TIic New Group). Ketika kluster p dan q bergabung, maka jarak antara kluster yang tcrbentuk, misalkan t dengan kluster lain, rnisulkan r nienjadi : SII = sl)l + Sqr Misalkan SUMi adalali junilah jasak antar dua cleniell yallg terdapat dalit~ir kluster i clan N, adalah junilah elenlen dala~ilkluster i, niaka ketika kluster p dan q bergabung, misalkan ~nenjadiklusler t : SUM, = SUM, + SUM,, t s,,, N, = N, + N,
Efcktivitas dali E f i s i e ~ ~ s i Menurut Rijsbergen (197'9), yang dinlaksud dengan efisiensi dalanl sisten~temu kenibali adalali pengukuran dalam ha1 penggunaali su~nbcrduyil konlputer. Sedarigkan uritilk ekktivitas, biasn~lya diukur dengall preci.rioti dari t.c~c~~rll. Yang dimaksud dcngnn /II.L,L.ISI~II ~ I U sc11dil.i adalall perba~~dingiinantara Junilall cloku~l~cri relevati yang teranibil dcng;ui jumlall dokurllcl~ keseluruhan yang tcranibil. Sedarigkiir~ r~,~.rrll adalali perbandingan antarn junilah dokunic~l relevall yang tcrambil dcngan ju~iilali kcsclurutl;~r~ dokutntn yang relevan. Misalkarl diketahui tZ adalali tiinipi~nat~ d o k u m ~ : ~yang ~ relcvan cl;lrl I3 adalall Iiilnpun;l~l dokumzn yang tcrarnbil, maka :
Dan ketika niencari pasangan clemen yaug pali~ng silnla, jarak antar elemennyn, ~iiisalkan alltar elerilrn t dan I., dillitung sebagai berikut :
d(t,r)
-
SUM, (N,
+
SUMr -+ s,,.
N,)(N, + N,
.-
1)12
Salilll satu nictodc ~ ) ~ l l ~ ~ l l i ~l Il ' rC~k lt i~l i t ; ~ ~ ~ I c n g a ~I iI ~ C I I ~ ~ U I ~~ ~i iI l ~; ~~ti I. ~I ~I ' ~ d~ai ~I /i/)t.eci,sioti 3. I'autan Rata-rata alltar Kelvlnpok yang adalilti tckliik r n - r t i ~ . hli5;llkan S adalall 'rergabung (Averugc Litiktr~cl U~~/\vc.cti ~iin;~)unan istila11 yang di~il,~\uhh;~n olcli pcngguna. Merged Grorrps). Mctodc ini Ilampir sama dan A,, atlalali Ilinlpurla~~ ~ l o k u ~ i i eyallg n rclcva~i dcngan nietode scbclumnya, hanya s ~ ~ j a dengan istilall S, maka : dalam niencari pasangan yang paling sanla, jarak antar elemennya, niisalkan elemen t dan r, dihitung sebagai berikut : Jika 2. adalah level koordinasi, dan Bh adillall hinlputlan dokume~l yang ttsanlbil pada nilai koordinasi A, ~liaka: di lnatia s,, adalah jumlal~ nilai kesamaan antara pasangan kluster t dan klustcr r, sedangkan N,-adalali jumlah vbyek yil~igad2 pada kluster t. Model dari kluster berllirnrki dapat direpresentasikan secara grafis, yaitu dengan diagram potion atau dendogrunr. I'ada niodcl penggabungan berhirarki, det7dogrut11 di~iiillaidari bagian diniana senlua elemen bcrada pad;) lilustcrkluster yarlg bcrbcda, atau pada bagiiul dimana selnua elemcn ~iienjadisatu klustcr. Padn sctiap level algoritma pengklusteran n~enya[ukandila atau lebih kluster yang paling nlirip (Rncclar Sr Nicolau, 2000).
1'~ I= \ G
v
1
II~A,
Titik (RA,I);,) dapat dihitung sebagai berikut :
1: =
"'
ifl I
C Iil,
r?
'
/1,,)
1 I j ,,1
Menurutnya juga, jika pelnotongan kluscer dilakukan pada awal hirarki, crnderung menghasilkan nilai precision yang linggi, tetapi nilai recull rendah. Dan sebaliknya. jika pernotongan kluster dilakukan pada lcvcl atas hirarki, maka akan rnenghasilka~~nilai precision rendah dan nilai recall yang tinggi.
I
i I I
Perielitia~idilakukan nielalui brbsrapa taliap, yaitu: I . Pengurnpulan dokumen. 2. Pengekstrakan informasi dalarii doku1iic.11. 3. Pernbentukan kluster. 4 . Pernbuatan prototipe svurch e r ~ g r t ~ ~ ~ . 5. Analisis. Perangkat lunak yang digunakan dalam penelitian ini adalah Ms Access 97, Ms Excel 97, SPSS 9.0, dan bahasa pemrograman Visual Basic 6.0. Sedangkan urltuk prototipe setrt~cli engine dibuat dengan menggunakan ASP (Active Server Pages).
3.
MoJul untuk nicngllitung Crskuensi tnasi~ly-~nasing is~ilalld i ~ l a ~tii~p i i cloliu1llc.11 dan liasilnyapun dinlasukkan ke dalalli basis data.
Pcmbcntukaa Kluster Data frekuensi istilall yang diliasilkan pada rnodul ketiga digunakan untuk menibentuk nlatriks istilah-dokutiien, diniana setiap bilri~dalani mrrtriks menyimpan kumpulan li.ckucllsi di11.i istili~l\ rertentt pada sernua d o k u ~ i i cyang ~ ~ acla, seper[i terlihat pada matriks A bcrikut i ~ i i:
-
diniana l i = istilah ke-i, Dl dokumen kc-i, dan fij= frekuensi istilah ke-i dala~iidokunlerl ke-j
Matriks istilah-dokumen ini diberituk menggunakan sebuah niodul, yang menlrut1.~2r data frekucnsi istilah yang ada dalam basis data ke dalani sebuah file berformat csccl. Se~elali ~natriks istilali-dokumcn tcrbc~i[uk. liiaka dilakukan proses pe~lgclonlpokan dcngan ~llcngguoaka~lSI'SS 0.0. Jcnib pengeloniookao 11'13. yang dilakukan adalal~ ~nctudc kluster bcrl~ir.ai.ki Karena psnelitian dilakukari untuk specrJc ugglui~rerurrv~. p~.ocedure yang (1011~uit7,dalam ha1 ini adalali bidang ko~npuler, dengall liiaka dilakukan pelnilillan terhadap dokunie~lyang menggunakan rnerode pautan rata-rata dalani kelompok yang baru, sedangkan pengukuran topiknya bcrkaitan drngan bidang iriiu konl(>uter. jaraknya ~uenggunakan perliitungan jarak Euclid~mn. 011lpul yang dihasilkan dalam proses Eltstralui I n f o r n ~ ; ~ s i Yang dimaksud dengan proses ekstraksi ini b e n ~ p adrt~dogrunristilall. De17dogrum yang terbentuk berupa ku~npulan inforriiasi adalah proses penyin~panati iril'or-masi kluster-kluster yang berawal pada saat dimana yang terkandung dalaln ~nasing-musingdokumen setiap kluster dinlulai dari satu istilah sa~npai ke dalalii suatu basis data. akhirnya selnua istilah menjadi satu kluster. Hal itu Proses ini melibatknn bebcrapa modul , yaitu: nienlberikan ban yak altcrr~atifurituk rnenentukan dan men~pelajari kluster miillil ymlg sesuai untuk I . Modul untuk ~ l l c ~ n a s u k k ai~iforliiasi~~ informasi yang ada pada dokumen, seperti kebutuhan (Salton, 1089). judul, pengarang, ringkasan dan namaI'cn~bua ti111Scarclr C:irgi~r~# nania pc~nbinibiligke d a l a ~ nbasis data. Sctrlali klustcr-klustcl. terbcl)cuk, ~iiakn taliap 2. MoJul untuk ~iie~iiasukkanislilall-istilali eginr. Secrrcl7 dalam bidang ilmu koniputrr yillig tcrdapat selalijutriya adalall pcnlbuatan .crc~rcl~ dala~iimasing-masing dokunlcn ke dalam engin(? dibuat dcngan menggunakan ASI) (rlclive Server I.'agc.r), ditiialla untuk sisi server digunakan basis data. vb scrip/ dan untuk sisi c ~ l r o l r digunaknn j(l\,tr scripl. I'cngutnpulan DOI~UII~CII Dokumen yang digu~iakan sebagai sumber masukan urituk proses pengelompokan dalalii temu ke~nbali adalali 107 dokumen, yang berupa ringkasan (ubsrrucr) karya ilnliall ~ni~liasiswa SI
Kluster istilah yang dihasilkan pada tahap sebelumnya digunakan untuk memperluas kueri yang akan digunakan dalam pengambililn dokurnen (expand~dboolean queries), dimana istilah-istilah yang berada pada satu kluster dianggap melipunyai niakna sama. Hal ini dimaksudkan agar peluang dokumen yang terambil merijadi lebih besar.
c.
Jika ditemukan istilah "(record)", istilah tcrsebut juga aka11 dihitung.
Tabel 2.
Daftar kondisi yang ditcrapkan dala~ll perhitungan istilah
lior~disi Lclcrangan "istilal~" Isiilih berada di antarn spesi "("islilah")" lslilah dalarl~tanda kurrlng "
"
"("istilnh"
HASIL DAN PEMBAHASAN
maka
"
.,
h Jialihiri spa51 Isiilah Jiaweli
5pi1s1 dull
diikuti Lurur~g
Denutun r
"
Karakteristik Dokucllcn Dokumen yang diproses berjullllah 107 dokumen yang selurullnya ~nernpuriyai rlorrruin subyek yang sama, yaitu komputer. Deskripsi dokumen dapat dilihat pada Tnbel I .
j
I i
Tabel I . Deskripsi dokumen
"islila)~","
., ..isliliJ1w,.o
.i s l i l l , , ,,(..istili,,,,,),,,
Istilah diawali spasi Jiikuti olch tilnda ho~iia 1slih.h dirbvali spiui d a l ~ diikuli olol~tande tilik
Istild~ daluln tilndn titik
I ~ I I IL Ju ~r u ~ ~ dill1 g
dinhlliri
Istilah dalanl landu kurung dnn diakl~iri knnla
Knrnkteristik Kelompok Istilah-istilah berhasil dikelompokkan kt: dalam I0 level hirarki, yaitu pada ji~rak(rli.s~unce)25. Jadi pada jarak tersebut seluruh istilah tclah berhasil bergabung menjadi satu kluster tunggal. Kluster yang terpilih adalah kluster-kluster yang terbentuk pada level 2 hirarki atau pada jarak (drslunce) 5. dokumen Pada j u a k tersebut total kluster yang terbentuk 37, I2 Rataan istilah dalam tiap dokumen sebanyak 436 kluster dcngan perincia11 seperti Kataan kata dalam tiap dokumen 239,44 tercantum pada Tabcl 3. Hasil kluster Tabel I menunjukkan adanya perbedaan yang selengkapnya dapat dililiat pada Lalnpirnrl I . Pemilihan kluster didasari oleh pcrtimbaogan cukup besar antara nilai rataan istilah dalarn dokumen dengan nilai rataan seluruh kata yang ada relevansi antar istilah dan jumlah keanggotaan dalarn dokumen. Hal ini karena istilah-istilah yang kluster. Pada jarak 4 belum ada kluster bergabu~ig dirnasukkan hanya yang berllubungan dengan ilmu dengall kluster lainnya jadi setiap kluster masih komputer saja darl juga karena jumlah kata dalam terdiri dari satu istilall, da11 pnda jnrak 6 istilahistilah yang berhasil bergabung rnenjadi sat11 suatu istilah bisa terdiri Iebill dari satu kata. kluster sudah tidak relevan lagi atau rnemiliki makna yang tidak sama. Oleh karena itu klustcr yang dipilih adalah yang terbentuk pada jarak 5. Pemilihan d a r ~I'crl~itungan Istila11 Dari Tnbel 3 terlihat bahwa jumlah anggota pada Yang dimaksud dengan istilah adalah kata-kata kluster-kluster yang terbentuk berkisar mulai I yang mempunyai arti sehingga satu istilah bisa sarnpai 21 istilah dalam satu klustcr. Istilnh yang terdiri lebih dari satu kata. sudall nlembentuk kluster dengan istilali lainayii Ada beberapa kondisi yang diterapkan dalam berjunllah 89 kluster, dengan junilah ariggota pada proses penghitungan istilah dalam dokumen, yaitu suatu istilah aka11 diliitung jika kehadirarlnya dalam masing-rnasing kluster antara 2 sarnpai 21. sedangkan scbagian bcsar klustcr laillllya yaitu dokumen memenuhi keadaan sepcni tercantunl sebnnyak 347 kluster dnri total 436 klustcr ha~iya padn Tilbel2. llal i ~ i i Sebagai contoh, jika modul llc~ldiik ~ncncari beranggotaka11 satu buali istilah. menandakan bahwa jarak Etrclickcun yilng istila11 "record", inaka kondisi-kondisi yalig dihasilkan dari perhitungan frekucnsi istilah dalam ~nungkinditemukan adillah : a. Jika ditemukan istilali "recorder", istila11 dokumen cukup besill. IlIiit1 bisa diartikall ketidaksaniaan antar istilali-istilah tersebut cukup tersebut akan diabaikan. b. Jika ditemukan istilah "record", mnka istilah besar sehingga pada level dua dari proses tersebut akan dihitung.
uggregarion, sebagian besar istilah belum membentuk kluster dengan istilah lainnya.
Tabel 4. Daftar beberapa kelompok terbentuk pada jarak 5 Istilnll Ms powerpoint, nis wod. cabcade, 111s
Tabel 3. Ringkasan kluster yang terbrriruk
1-
Junilah anggota
Junilah kluster '
4
5
78
9
I I
1
I I
t I
,
1
Tabel 4 menyajikan datfar beberapa kluster istilah yang terbentuk pada jarak 5, yang 11iemiliki junilah anggota lebih dari satu. Dari beberapa daftar kluster pada Tabel 4, bisa dilihat bahwa ada beberapa kluster yang merniliki anggota berupa istilah-istilali yang tidrrh nicrniliki hubungan yang jelas walaupun sebagian besar dari kluster tersebut sudah terlihat memiliki hubungan yang jelas. Istilah-istilah yang tidak me~niliki hubungan yang jelas terlihat pada istilah "fuzzy trapezoidal" dan "overlap" dan pada istilah "sistem informasi pariwisata" dan "monitor vga". Hal ini disebabkan karena istilah-istilah tersebut hanya berada pada satu dokumen, dan frekuensi istilah-istilah tersebut dalarn dokumen sama (kedua istilah sama-sarna memiliki frekuensi 2 ) , scl~ingga jarak Euclidean yang terbentuk pada saat proses pengelompokan kecil. Hal ini niengaki batkan kedua istilah tersebut dianggap memiliki kesamaali yang cukup besar oleh sistem, sehingga dikelompokkan dalam kluster yang sama. Sedangkan kaitan antar istilah d a l a ~ n kluster yang cukup jelas terlihat antara lain pada istilah "bmp" dan "grey-level", "analisis sistetn" dan "desain sistem". Dari keenrpat istilah tcrsebut ada yang hanya terdapat pada dokumen yang sama, dan ada pula yang terdapat pada doku~nen yang berbeda. Dua istilah pertallla, yaitu "desain sisteni" dan "analisis sistem" terdapat pada dokulnc11yang sama, sedangkan istilah "bmp" dan "grey-level" terdapat pada beberapa dokumen yang berbeda. Tapi setelah proses pengelompokan tertiyata kedua islilah tersebut berada pada kelompok yang sama.
10 II
I
' 15
16
17 I,,
l9
20 21
Front end. back end Fuzzy trapezoidal. overlap Center of gravity. dcfuzilikusi, Suuy logic, fuzifikasi. f u u y min-mnx. sample lntcralisi nianusia. teknik penlrograman Mrtode peringkat, pclnctaan bijaktil'
yang Ju~nlall 4
2 2 2 6
2 2
2
Partial exact matching. keywords I'ersonal web server. odbc, broussr. prol'essionel home page, shrip, servcr side Wcbmastcr, hang, wcbpage Rouler, access control policy, hacker Parti~ioncditcrated function systems. ~ memory. itcrutcd I L n c t i o ~ryslelns inrxys. exsys prokbsional for ticroso, wniv,s Kompresi t~~atriksspiirsc. sparrc matrix co~~lprcssion Vcncx, worst c u e Run-lcngth ctlcoding. pixels. data digital, Jct, kuantisui, graphics i~lterchnngc I'or~nat. discrcle cosi~lc triuislbrm, rcdudancy. joint pholopraphic experts group I'owcr designer 6.0 dataa~lalyst.potver designer b 0 dataarchitect. help rsribbel Sistc~ninfortnui p;~ri\+isata.tnonitor vgu 'ol copy. Ilardcopy. ctl~os. acer. :o~!pug, year 2 kilo. y?L. crntury byte Real tinie, datafeed Multilhread. t~~ulti~as!iing
22
Stokhaslic. ~netodc transhr~nai invcrs, s i r n u h i runtai marhov 'rriangulasi poligon. polygon 23 triiuigulation, dyna~llicprogranilillllg. malriks chain multiplication Texture, features, bnip, entropi, grc) level. iedm. kontras. inrcrs of'elemcnt 24 Jill'erent momctlc ol' order k. cdm, 1x1. peluang n~aksimum, pcngindcraan jaul~ I'clacaka~lula~lg,bi~cktrncking,fungsi 25 kcndala, np-con~ple~c Ulekclicllt, broadcast. cniail, ring, 26 blckscrvcr, bus. star. Ian. topoloyi. - koncksi
b
3 3
3
2
, -, 9
3
2 8
2 2 3 4
-
27
28
Struktur program. objcct oriented programn~ing, i~bstraksi. polimorlisnlc, kon~piliisi. ~lumcriha bcroricntasi objek. parsial. pcwarisa~~ Xnll. java virtual ~ ~ i i ~ c l i pcrtukari~~i i~ie. dam. rcmotu
13
4
10
'
I.
Searclr E~tgirte Search engine yang dibuat berupa prototipe dari speci/ic domain search engine. Jadi pengguna hanya bisa rnemasukkan satu buah istilall yang dicari, kemudian akan ditarnpilkan judul dari dokumen-dokumen yang sesuai secara descending berdasarkan total frekuensi sernua istilali yang terlibat dalarn rnasing-masing dokumen. Istilahistilah yang dapat digunakan sebagai it~pur,adalah istilah-istilah yang sudah terdaftar dalaln basis data istilah.
v mulni
Pengguna rnernasukkan istilah
Perlgguna Analisis Komponen Utarna dan Jaringan Syaraf Propagasi Balik untuk Pengenalan Wajah (The Use of Principal Component Analysis and Backpropagation Neural Network for Face Recognition). 2. Perbandingan Metode Analitik dan Holistik pada Pengenalan Wajah Menggunakan Jaringan Syaral' Tiruan Propagasi Balik Stalndar (The Comparison of Analytic and klolistic Method on Face Recognition Usirig Standard Backpropagation Artificial Neural Network). Tubcl !j. Daftar istilali percobaan - --
-- -.
...-..-
.
. .
basis data Fuvv
Information retrieval Jaringan komputcr
.-- .. , .
..I
,-
-.
! DA DU ..-,
Istilah -
.... ..
9 t
..
X
- ~ - - --
X -
3
3
4
4
31 31
istilah
Pencarian istilah-istilali dalarn satu kluster
Pencarian dokurnen berdasarkan istilah
fi selesai
Gambar 1. Diagram alur pencarian doku~nen Untuk pencarian dokurnen berdasarkan istilah yang dirnasukkan pengguna, diterapkan langkahlangkah seperti yang terdapat pada Carrlbar 1. Misalkan pengguna rnernasukkan istilah "jiiringan syaraf tiruan", rnaka yang pertarna dilakukan oleh search engine adalah niencari istilah lain yang berada dalam satu kluster dengan "jjsngan syaraf tiruan", yaitu istilah "backpropagation". Setelah didapatkan kedua istilah tersebut, niaka niulailah pencarian dokurnen menggunakan istilali-istilah tersebut. Dan didapatkan dokunicn-dokumen sebagai berikut :
Untuk meligukur c k k ~ i v i t a sdari secrrch et~gitw yang dibuat, digunakan mctode pengukuran rc.c.c~ll dan precisiun. Untuk mcndapatkrin nilai r~'ci11Idati prtcc-ision diperlukan data-data bcrupa junilah
dokurnen yang terarnbil, jumlah dokumen relevan yang terambil dan jumlah keseluruhan doku~nen yang relevan dalam setiap penga~nbilandokumen. melalui Karena itu dilakukan percobaan serangkaian pengarnbilan dokumen, yaitu sebanyak 30 kali pengambilan dengan menggunakan istilahistilah yang berbeda untuk rnendapatkan data-data tersebut. DaAar istilah yang digunakan dalam percobaan dapat dilihat pada Tabel 5. Kolorn istilali pada Tabel tersebut berisi istilah-istilah yang digunakan dalam pengambilan dokurnen, kolorn DA berisikan jurnlah dokumen yang terarnbil, koloni DU berisikan jumlah dokurnen relevan yang terambil, sedangkan kolorn Dc berisi junilah seluruh dokurnen yang relevan yang diliitung dari keseluruhan dokurnen yang ada. Untuk perhitungan recall dan p/.ccision digunakan teknik rata-rata. Hasil perhitungan secara detail dapat dilihat pada L n m p i r a ~ l2. Tabel 7 berisi jumlal~dokumen yang tera~nbilpada setiap level koordinasi dan pada setiap istilali yang digunakan, yaitu 10 level koordinasi dali 30 buali istilah. Tabcl 8 berisi julnlah dokumrn 1.eIcvn11dari dokurnen yang terarnbil pada sctiap level koordinasi, sedangkan Tabcl 9 jumlah dokumen relevan pada tiap-tiap istilah. Dari nilai-nilrri yang ada pada tabel-tabel tersebut bisa didapatkan nilainilai precision dan recall seperti pada T a b c l 6 . Tnbel 6. Precision dan Recall Precison 0.97
Recall
1
2
0.97
0.31
3
0.96
0.38
4
0.93
0.43
5
0.89
0.46
6
0.87
0.54
7
0.85
0.60
8
0.82
0.70
9
0.80
0.75
10
0.76
0.77
5
0.26
Dari nilai-nilai yang ada pada Tabel 6 dapat dibuat grafik recall dan precision seperti pada G a m b a r 2. Pada grafik tersebut terlihat hubungan negatif antar recall dan precision. Jikrr nilai recall rendah, rnaka nilai precision tinggi, sedangkan jika nilai recall tinggi, rnaka nilai precision cenderung menurun.
N i lai precision yang dillasilkan dari percobaan ini sangat tinggi di rnana nilai yang terendah hanya 0.76 dan nilai tertinggi adalah 0.97. Sedangkan nilai recall cenderung lebih rendah dan bervariasi rnulai dari 0.26 s a ~ n p a 0.77. i
0.7 0 I
0.2
04
06
01
1
Recall
G u m b a r 2. Grafik recrrll dan precision tlasil ini, srsuai dongan teori yang diungkapka~i oleh Rijsbergen (1997) billiwil jika kluster dipototig pada awn1 liirarki ~ n a k a11ili1i / ) ~ L ~ C ~ J . Icendcru~ig OII lebih tinggi dibandingkan liilai recullnya.
KESIMPULAN DAN SARAN Kesirripulan Dari penelitian yang telah dilakukan dapat dialnbil kesimpulan sebagai berikut : 1 . Hasil pengelompokan yang kurang akurat sebagian besar disebabkan karena istilahistilah yang berhasil rnengelompok tersebut hanya terdapat pada satu atau dua buah dokurnen. Oleh karena itu jika frekuensi istilah-istilah tersebut sama, maka otomatis jarak antar istilah tersebut sangat kecil yailu 0 (nol) dan siste~nakan nienggabungkan istilaliistilah tersebut ke dalam satu kluster. 2. Nilai precision dan recull memiliki hubungan yang negatif. Maksudnya adalah jika nilai recall rendah, rnaka nilai precisiott tinggi dan sebaliknya jika nilai recall tinggi rnaka nilai precision cenderung lebih kecil. 3. Pernotongan kluster pada awal liirarki, yaitu pada jarak 5 akan maigliasilkan nilai ~ ~ L ' C I S I O I I yalig jauli lebih linggi dari 11iIai rcculh~yil, nalnun sebagian besar islilali belu~iibergabutig dengan istilah lainnya
Saran Kelernahan dalam sistern ini adnlah adanya istilah-istilah yang berhasil dikelornpokan dalarn satu kluster, walaupun istilah-istilah tersebut tidak merniliki kemiripan rnakna dengan istilah lain dalarn kelornpoknya. Karena it11 penulis menyarankan agar dalarn pengembangan sistern lebih lanjut, donlain yang pakai dalarn pengurnpulan dokurnen lebih spesifik, sehingga istilah-istilah yang dihasilkan akan lebih sedikit dan kehadiran istilah-istilah tersrbut lebih bervariasi dalarn dokurnen-dokurnen, sehingga akan rnenghasilkan kluster-kluster istila11 yang lebih tepat. Dalarn proses pernilihan dan pernasukan istilah penulis rnenyarankan agar terlebih dahulu rnelibatkan proses pernbentukan kata dasar dengan rnenggunakan algoritrna S~en~ing, sehingga istilah yang akan dikelompokkan tidak akan terlalu banyak karena sebelurnnya sudah dikelornpokkarl berdasarkan kata dasamya.
DAFTAR I'USTAKA Julio. 200 1 . Perluir.suti Kueri Menggunukon Peluang Bersyurur (Quey Expunsion using Condi~ionul Pt.o6uhilrry). Forutn S ~ a ~ i s ~dun i k u Kon~purasi.6 : 7- 1 3 .
Adisaritoso,
Andenberg, M.R. 1973. CIusrrr At~aIy.sisfor Applicu~ions.Academic Press, Inc.. New York. Bacelar, Helena and Nicolau. 2000. Clrrssl/ying Variables By HHierarchical Clusreririg A.lodels: Enipiricul gtid Probabili~ricApprotr~,hes(http:l/
www, uni-bonn.de/ Bacelar.htrn).
n~athpsycldoclBacelar/
Johnson, R A . and D.W.Wicliern. 1988. A plied Mutivariare t a t i s i a Analysis. 2"' ed. Prentice-Hall, Inc. Prasetyo,
Dwi.
Menggunakan
Penyusunan Tesaurus Analisis Geronrho/. Skripsi
Jurusan llrnu Kornputer FMIPA IPB, Bogor. McCallu~n, A~idrew, Karrial Nigi~m, Jasoo Rennie and Kristic Seymorc. Birilding Dotjiuin-Specrpc Search Engine wirh klcrchine Learning Techniques. School of Computer
Science Carnegie Pittsburgh.
Mellon
University,
Search Engine
Turoriul for
Web Designers,
I~llp://www.~~ortl~crnwcbs.co~~~. sc~!
Rijsber-gen, C.J.van B.Sc., Ph.D., M.U.C.S. 1979. Infilrn~arion Rerrieval. Department of Colnpi~tingScience, University of Glasgow. Salton, Gerald. 1989. Airrot?raric T u r Proccrrrtig The Transforma~ion,Analysis, and Rr~rievulo j lnfi~rmu~ionby Cot~rpzrrer. Addison- Wesley
Publishing Company, Inc.
LAMPIRAN
Lampiran 1. Hasil pengelompokan istilah D r n d r o g r a t ~u ~ s i n g Average L i t ~ k n g e( W i t h i n G r o u p ) Itescaled Distance C l u s t e r C o n l b i n c C A S E
Label
Nu,"
ms powerpoint ms word cascade ms excel tile hard disk prototype analisis sistem desain sistem front end back end fuzzy trapezoidal overlap center of grafity defuzifikasi fuzzy logic fuzifikasi fuzzy min-max sample decoder prosedural simulation interaksi manusia teknik pemrograman multithreading multimedia spasial relasi fuzzy model adlassnig-kolarr metode peringkat pemetaan bijektif kompleksitas algoritme rekord asp active server pager plug-in developer geographic information system windows nt server wysiwyg windows nt basisdata partial exact matching keywords personal web server
0
5
10
15
+---------+---------*-----+----+---------+---------+
20
25
odbc
,7'
15
f3rWS.r proftssional horlle page
71,
skrip
7,
1l i
binary coded decirnal adder ;d.i Webmaster , 2 1
Wcbadrnln
,
:(,
---' -
Update
-
Password j l 3 Router
-.
..I 1
access control policy ~ 3 : : hacker "4,)
11-7
-
1 I
1 I
--
f
~
prlvate network t , 3 y
~
I-,
parltioned Iterated function systems memory
-
8,
Iterated function systems 5 d t ,
exsys p~ofesslonalfor ri~icrosoft 37-1 ' ~ l n d o w s .I I)t, r~llcrusofiwlndows koniprcsi nlatrrks sparse sparse matrix corlipression
Ldli
worsl-case
vertex L'C)5 ' ' worst case
L 0 i!
-
-.
'.Am -i
-
I --I
--J
run-length encodlng
'
data d ~ g ~ t a'al
dct
"'
kuantlsas~ graphlcs iriterchange format dlscrute cosine transform redundancy joint photographic experts group d~screte rriarketlrig ir~lorrnatior~ syslern pereferens~an conipresslon rudsonliig-trace explarlalrons power dus1gnt.r 6 0 dataanalyst power deslgller 6 0 dataarch~tect help scrlbbel slsterll lnforrnasr rnanajemen lnterakllf ~ ~ s t eiilforrnas~ in parlwisata moilitor vga lnacromedia autlrorware
',
4' I 33' '
43
I--
I
I I
softcopy , 3 i hardcopy ,,3: crnos acer
.,
1
,::
i
cornpaq year 2 k ~ l o, 5
.
y2k ,,L.!, cerllury byle ,.;.;
, ,
Ibm ,, ololnalisas~1;i .; model sanchez
2
j
berkas j , l 1 microsoft v~sualb a s ~ ci j , , expert system .I 7 I real l~rne 7:) dalafeed
s~rriulas~ ranla1 markov
73
,,-/.I
peluang lranslsl stasioner ;7 .$ tr~angulas~ poligon
j,,)
polygon Ir~angulation5,: dynamic programming 1:d malr~xcham rnull~pl~calion ;511 komb~natorial1 3 , ) parallel 5 5 ' 1 dala slructure 4 5 3 reference d~ctionaryj 5.1 double-array
,
;I6
trle-list 2 c; Ir~e-da2 ;,. art-irn .Ij :,
,
aulomaled reasoning loo1 for ~n,fornlallonrnanagemenl syslem developmenl l ~ f ecycle 4 .i:
.
S d l ~.I ,; balch
j
.; ,,
lease l ~ n e, .I ,.
.
rns excell ,, .;
graphic user inlerface .q ;
,
user lnlerface 1 1 objecl-based programming
,.,
erll~lyrelalionship ;,-I bollom-up
b,cj
layar 1 9 , slslem ~nlormaslagroindustr~37
#,
recover 3 1 inquiry 3 1 ; ri~clodealur malt1
,,:
;
Lampiran I . (lalljutan) ole aulomation 30', enkrips~ 3 12
visual~zation 6 6 java3d 4 6 7 lava 3d tree3d simple light interception model liga dimensi
64
65 6ti 68
$ ; A -
grafis 6,, operas) penghapusan operasi penggantian ., metode kesamaan string operas) peny~sipan cluster analysis analisis gerombol 3,,U
,,,
,
,
knowledge discovery inher~lancerules inheritance
66j 6,,,
1
d
earliesl-static-level 5 5 , earhest-fin~sh-lime 553 graf asiklik berarah 5 4
highest-static-level highest-dynamic-levd
55
direcled acycl~cgraph ;, virtual 55.1 cartesian product form leks dot matriks
slslem manalemen b a s ~ sdala ~ b mrlsc 6000 updating peluang bersyarat
143
,; 1, ,
;
90
metode pencarian printer
3,,
java script reallime
566
183
-
6-,
electron~ccommerce visual b a s ~ cscript
65
hypertext markup language e-commerce
563
lava online
.
-
13
,,
!
-
-
-
I
basis data telasional
390
data relas~onal Z L u d~gitasi 5 8 t : context-free grammar 5 8 ! , data retr~eval 58,, speech recognition pengenalan ucapan sinyal
,,8.1
58 ,,
--
., ,,,,
single-user q 8 slmultan 4 0 5 v~sualc++ sound card 4 8 2 PPl card 4 8 3 sound recorder 80 personal computer
A
-
~,
jet audio
reason~ng-traceexplaflation m~crosoftaccess 97 ~ntedace stokast~k pol~nomial pelacakan ulang backtracking fungsi kendala np-complete conslraints design hypertext statlst~kadcskrcptif inferensha sl~tlsthka sistem informasi pemasaran ~ntelligentsystem
.
-
-
479
-
423 57 6
--
'++
sistem berorientasl obyek sistem pengelolaan sound
-
95
-
-
------J
--
501
,
7
99
---..--
21,
___.
:
,
j,
jli 7b
z, .-_I 336 33U
-
i7
<.,, 50j
$\sten\ ~ntelijen 501 fuzzy-neural neural lrlrclensla b o i l a ~dclplrl ~l
sybase sql anywhere
,,., ,, , .
,.
-.
I
--..
-. -,.-
. .
A
--
-161:
n\ulLl-user
,,.,;,
offhne
.i6.1
-
1
matching 5 7 1 public .!7 b stand alone 57.1 skeleton-key j 4 3 omission-key 3 4 4 precision j 4 6 recall 3 4 7 model entiti-relasi 27 visual basic 5.0 3 1 model relasi 2 8 asimetrik 530 ciphertext 5 3 2 frontal 1 1 q correlalion b:: autornatlc acces control 3tj PCX ;1 .: rgb 1 1 5 bitmap 112 jpg :;3 matlab 110 paint shop pro 111 security system 1 0 0 template matching 1 0 5 human computer interfaces g g transformation 4 6 3 defuuifikasi 688 executive information systems 5 4 0 jusl in time j g 1 sistem penunjang keputusan 2 2 8 d,ecision support system 4 7 3 face recognition 1 0 q ukuran kesamaan 10'7 fonetik j q t j penemuan pengetahuan 6 6 2 hypermedia 490 pengambilan keputusan 3d gif designer an~magicgif e-business
199
65, 65.1 64 9
gold java 65.1 applet button factory 655 modem 65: microsoft frontpage 65 3 harddisk € 5 1 pentium € 5 0 processor 5 6 2 sistern informasi e-marketing 64-1 mouse 1 delete 7 8 retr~evaleflect~veness4 8.7
delphi metode accrual mulliprosesor blekclient broadcasl email ring blekserver bus star Ian topologi koneks~ activex automation temu-kembali poligon protocol klien jarlngan komputer keyboard temu kembali sistem operasi program aplikasi memori algoritma simpleks algorilma ellipsoid pemrograman linear linear programming karmarkar algor~thm algoritma karmarkar display biner satem pendukung keputusan microsoft access xml java virtual machine pertukaran data remote extensible markup language htrnl clienUseNer markup tampilan network user penumpukan tesaurus makro pemrograman makro instruksi algor~tmaheurist~k
-am akuntansi platrnum platinum basrc port disbursement Port pemrograman d ~ n a m ~ s algor~tmanelder-mead mull~d~rect~onal search anlarmuka operator paralei
151
elemen hingga
421
struktur program object orrenled programming
682
abstraksi polimofisme
429
kompilasi nurnerika berorientasi objek
430 42 6
parsial pewarisan pemrograman numerik pemrograman berorientasi objek objecl oriented
4z7
4 32
25
4 31
42.1 420 74
inverted list
61
metode akselerasi pbO 649242 bahasapemrograman 30 phonix4 soundex searching retrreval methods
669
phonix8 phonixe oracle designer s~stem~nformasiakuntansi
345 324 331
oracle case 1001s
323 337
prototyping compuler asslsted software engineering
330 332
m s access clipper management ~nformationsystem
325 32u 3 63
tools case inlormat~onsystem
333
-
--A -----L
135
670 672
668
&&
---
--
671
335 '1 '5
Ioxpro
-'zb
dbase gudang data data warehouse
j70 37 1
dbms
36?
327
I----
olap database engine on-l~neanalytical processing oltp on-line transaction processing dalabase management syslem heuristic algorithm siStem pakar berbasis pengetahuan kuantitatif paradox relationship perangkat keras on-line koefisien determlnasi e-market~ng temu-kernbali peluang s~steminformasi geografis autodesk mapguide
PhP kueri metode ziegler m~crosoftwindows 98 spoofed switch intrusion linux detection synflood prolotipe edit hierarki analitik decision making multiplatforrn chatting stream socket protokol komunikasi numerik hardware output struklur data designer logika fuzzy reduks~dala relasi general~sasi generalisasi data Q'Jg'JS rough set algor~tmafloyd algoritma dijkstra
Lam piran 1. (Lan.jutan) path shortest path sisi access open addressing linear probing
I-,
a,, LOO j
1
. a -
-
i
1 s,.,
:.7.r
..
secondary storage 169 decrement 1.l r, asimtot~k 1 6 ( ) pembenturan
166
primary storage
167
key to address transformation kat double hashing field entri
164
ram hash pemetaan
168
sistem aplikasi
15 8
165 175 1I;. 173
-
161 353
-
key 1 C J subs~stem 4 visual basic
I
-
2
14 2
I I
mult~stagemedian filter algoritma dual space algot~trnasemi dual space windowing algoritma modified cyrus-beck algoritma line clipping anlmasl kornputer grafik window grafik pol~gon
--A
3: 1 cd
i, 1 3
,:1,,
6 1.' ,
,
i,l
:
-
GI!,
--
.I H 15
distributed database pseudo-code
l-!g:J
concurrency control
:g j
basis data tersebar two phase request distributed scheduler diskrit kontrol konkurensi s~mulasikomputer konkuren pemodelan akses
F
--
-
;g:,
1 1 --
:g
-----------~
lj9,
,i, .,9,, r:
3
32 , ,
-. ...
-----.----
..-I
J
I
koefls~enkorelas trlgram boolean wet
plxe bllangan acak pengenalan pola korelasl norma transformas1 fourlel orlentas dlmens pengenalan wajah komunlkas lntranel database non-relaslona manajemen database durable acla e-ma1 conslslenc) ~solatron propert atomicity commana connection strlnc
connectlor recordsel component object mode corn ole d t actlvex data object: uds object llnklng and embedd~ngfor databases un~versaldata access keamanan data spreadsheel korelasr pearson pemrograrnan llnlel dlrect search multl use1 darnerau levenstem-nletr~c data acces? recorc slklus hldup s~stem lnetode gross-up user frlendl) a n t a ~muka perancangan alstern objecl
pengaksesan data berorlentasl obyek algorrthnl parameter d~skr~mlnan slrtng s~stem~ n f o r m a seksekut~f ~ firewall sim transaksl perancangan penjadwalan internet server
I
6
1
-19
rnetode hashing kolis~ rnesin basis data respons element different moment of order k keseragaman analisis citra matriks kookurensi tingkat keabuan texture features brnp entropi
249 2.3
4 :5
grey-level iedm
2.5 7
kontras
258
lnvers of element d~fferentmoment of order k
255
edm
"56
txt 2 5 0 peluang maks~murn 2 5 3
penginderaan jauli
2 52
adaptive multistage median filter link
-322
teori gugus b~t
:(,o (1 2
malrtx
24 j
siklus hidup
369 102
Image derajat kesamaan
r,q
format
: ;lu
file
1 .,7
w~ndows l , q implementasi pengembangan sistem tekstur perangkat lunak
23 k,b
24 6 j~
2 L --
I
Lampiran 1. (La11j~lta11) domain name system :,49
dornaln name 3 5 2 IP 4 4 protokol d~namld 3 5 0 name server 358 resolve 3 5 6 host client 3 5 7 host.txt 354 dns 3 5 5 ~CP/~P 86 client 203 d~namis 154 host 351 trie 2 6 2 median filter 320 modul 6 3 5 Information retr~evai 4 5 1 threshold knowledge-based fuzzy relevansi korelasi obyek hashing dokumeri kriptografi data encryption standard encryption rivest shamir adleman 527 simetrik 5 2 9 waktu komputasi 52 5 komputasi 108 ' kompleksitas 159
token 2 9 4 bits 235 lossy 284 huffrnan coding 2 32 repltka :a5 citra digital 280 lossless 283 gif 279 )peg 278 digital 117 matriks 24 1 input 1 3 9 kcnci 37 jaringan syaraf tiruan 12 3 backpropagation 4 61 artificial 4 4 8 neural network q 5 0 ars~lekturjaringan
1:
c,
propagasi balik neuron jarlngan syaraf layer holistik epoh analitik galat ado s~nkronisasi relasi waktu pernarnpatan c~tra Fraktal Pernampatan Simulasi Pernrograrnan basis data Aplikasi Jaringan Analisis Kinerja sistern pakar Fuzzy Median Algoritme Edgs Node list scheduling Scheduling Graf Prosesor Chat List Blekdinet protokol blekdinet local area network Local Protokol Software Keputusan Relasi Query Kornputer Retrieval Simpul L~ntasan lintasan terpendek sistem infor~nasi Tabel Program
Metode
103
algoritma
sau
ddta
;I
informas1
--
234
Citra
4 I
-
-. .
I __I