PENGEMBANGAN APLIKASI AMD-LSA MENGGUNAKAN
BEBERAPA PENDEKATAN SISTEM TERDISTRIBUSI
DEVELOPMENT OF APPLICATION AMD-LSA USING DISTRIBUTED SYSTEM APPROACH
Laporan ini disusun untuk memenuhi salah satu syarat menyelesaikan Pendidikan Diploma Program Studi D3 Teknik Informatika Jurusan Teknik Komputer dan Informatika
Disusun oleh Fajar Pradhana
091511045
Septian Muhamdani
091511064
POLITEKNIK NEGERI BANDUNG 2012
PENGEMBANGAN APLIKASI AMD-LSA MENGGUNAKAN
BEBERAPA PENDEKATAN SISTEM TERDISTRIBUSI DEVELOPMENT OF APPLICATION AMD-LSA USING DISTRIBUTED
SYSTEM APPROACH
Laporan ini disusun untuk memenuhi salah satu syarat menyelesaikan
Pendidikan Diploma Program Studi D3 Teknik Informatika
Jurusan Teknik Komputer dan Informatika
Disusun oleh Fajar Pradhana
091511045
Septian Muhamdani
091511064
POLITEKNIK NEGERI BANDUNG 2012
PENGEMBANGAN APLIKASI AMD-LSA MENGGUNAKAN
BEBERAPA PENDEKATAN SISTEM TERDISTRIBUSI
Disusun oleh
Fajar Pradhana
091511045
Septian Muhamdani
091511064
Tugas Akhir ini telah disidangkan pada tanggal 19 Juli 2012 dan
disahkan sesuai ketentuan
Pembimbing II,
Pembimbing I
Tati Susilawati, Dra., MT.
Urip Teguh Setijohatmo, BSCS, M.Kom.
NIP. 196404121993032001
NIP. 196009281994031001
Penguji II,
Penguji I,
Fitri Diani, S.Si, ST, MT.
Dewa Gede Parta, BSCS.
NIP. 198009162009122001
NIP. 195908251995121001
Ketua Program Studi D3 Teknik Informatika
Irwan Setiawan, S.Si, M.T NIP. 19800419 200501 1002
Nama : Fajar Pradhana NIM
Tempat, Tanggal Lahir
: Sragen, 26 Maret 1990
SD Lulus Tahun
: 2002
SLTP Lulus Tahun
: 2005
SLTA Lulus Tahun
: 2009
Prestasi yang pernah dicapai : -
: 091511045
Nama : Septian Muhamdani NIM
Tempat, Tanggal Lahir
: Garut, 27 September 1990
SD Lulus Tahun
: 2003
SLTP Lulus Tahun
: 2006
SLTA Lulus Tahun
: 2009
Prestasi yang pernah dicapai : -
: 091511064
ABSTRAK
Dewasa ini teknologi berkembang dengan pesat memberikan begitu banyak kemudahan, salah
satunya adalah kemudahan mendapatkan informasi termasuk yang berbentuk dokumen. Untuk mendapatkan kemudahan pencarian informasi, perlu dibuat sebuah mekanisme yang dapat menyimpan, mencari maupun mengelola dokumen-dokumen elektronik dengan cepat dan mudah. Selain kemampuan tersebut tentunya dibutuhkan sebuah sistem yang mampu menyimpan dan mencari sebuah dokumen yang dapat digunakan secara bersamaan. Aplikasi AMD-LSA adalah sebuah aplikasi yang dapat melakukan pengambilan (akuisisi) dokumen-dokumen elektronik, penyimpanan dokumen-dokumen elektronik, dan temu kembali dokumen elektronik tersebut di JTK POLBAN. Pada akuisisi aplikasi ini melakukan pembacaan dokumen elektronik untuk mendapatkan isi dokumen berupa term. Setelah itu dihitung bobot term menggunakan metode TF-IDF (Term Frequency – Inverse Document Frequency) dan dihitung tingkat kemiripan (similaritas) menggunakan metode LSA (Latent Semantic Analysis). Aplikasi AMD-LSA ini bekerja di komputer tunggal (stand alone). Tugas akhir ini adalah pengembangan aplikasi AMD-LSA tersebut menjadi aplikasi yang mampu bekerja pada beberapa server sekaligus dengan menggunakan metode sistem terdistribusi. Pengembangan aplikasi AMD-LSA mencakup identifikasi proses yang berpotensi dikembangkan menggunakan teori sistem terdistribusi. Implementasi sistem terdistribusi menggunakan teknologi Internet Communication Engine (ICE). Kata Kunci: terdistribusi, pencarian, tf-idf, lsa, similaritas.
ABSTRACT
Nowadays technology is growing rapidly which offered so much easiness, one of them is the easiest of getting information include in documents form. In order to get the easy way of searching information, a mechanism that can store, find and manage electronic documents as easily as possible needs to be created. Besides these capabilities, a system which quickly and is capable of storing and searching a document that can be used simultaneously is needed. AMD-LSA application is an application that capable of acquisitioning of electronic documents, storing electronic of documents, and retrieving electronic document back on JTK POLBAN. This acquisition application will execute the electronic documents to get the contents of the document in the form of term. After that, the process of calculating of the terms will use TF-IDF (Term Frequency – Inverse Document Frequency) method and calculate the similarities using LSA (Latent Semantic Analysis) method is needed. This AMD-LSA application works on a stand alone computer. This final project is a about development of AMD-LSA application into an application which is capable to work on some server at once using distributed system method. The development of AMD-LSA application includes the identifying process that potentially to be developed using the distributed system theory. The implementation of the distributed system is using the Internet Communication Engine ( ICE ) technology. Keywords: distributed, searching, tf-idf, lsa, similarity.
KATA PENGANTAR
Puji serta syukur penulis ucapkan kehadirat Tuhan Yang Maha Esa karena dengan rahmat dan
karunia-Nya penulis dapat menyelesaikan Tugas Akhir ini dengan judul Pengembangan
Aplikasi AMD-LSA menggunakan Sistem Terdistribusi
Tugas Akhir ini disusun untuk memenuhi syarat kelulusan pendidikan Diploma III di Jurusan
Teknik Komputer dan Informatika Politeknik Negeri Bandung. Penulis mengucapkan terima kasih kepada orang tua yang telah memberikan doa dan dukungan baik secara materi maupun
moril. Pada kesempatan ini, penulis juga mengucapkan terima kasih kepada pihak-pihak yang telah membantu dalam menyelesaikan Tugas Akhir:
1. Bapak Urip Teguh Setijohatmo, BSCS., M.Kom. dan Ibu Tati Susliawati, Dra., MT selaku pembimbing I dan pembimbing II yang telah memberikan bimbingan, dukungan dan kontribusi terbaik sejak awal hingga akhir penulis menyelesaikan Tugas Akhir ini. 2. Bapak Dewa Gede Patra, BSCS dan Ibu Fitri Diani, S.Si, ST, MT selaku penguji I dan penguji II yang telah mengevaluasi dan memberikan masukan-masukan berharga kepada penulis sebagai motivasi dalam menyelesaikan Tugas Akhir ini. 3. Bapak Iwan Awaludin, S.T., M.Tsebagai dosen wali yang telah membimbing penulis dalam menjalani studi di Jurusan Teknik Komputer dan Informatika Politeknik Negeri Bandung. 4. Staf administrasi Jurusan Teknik Komputer dan Informatika yang telah memberikan kelancaran administrasi selama penulis menyelesaikan Tugas Akhir ini. 5. Rekan-rekan mahasiswa Jurusan Teknik Komputer dan Informatika angkatan 2009 yang telah bersama-sama menuntut ilmu selama tiga tahun ini. 6. Seluruh pihak yang tidak dapat disebutkan satu per satu yang telah membantu penulis baik secara langsung maupun tidak langsung.
i
Penyusunan laporan Tugas Akhir ini masih memiliki kekurangan dan jauh dari
kesempurnaan. Saran dan kritik yang membangun sangatlah penulis junjung tinggi demi kemajuan pekerjaan di masa yang akan datang. Akhir kata, penulis berharap semoga Tugas
Akhir ini dapat menambah khasanah pengetahuan bagi para pembaca.
Bandung, Agustus 2012
KoTA209
ii
DAFTAR ISI
KATA PENGANTAR ................................................................................................................. i
DAFTAR ISI ............................................................................................................................. iii DAFTAR GAMBAR ................................................................................................................. vi DAFTAR TABEL ................................................................................................................... viii
DAFTAR RUMUS .................................................................................................................... xi
DAFTAR ISTILAH .................................................................................................................. xii
DAFTAR SINGKATAN DAN AKRONIM ............................................................................ xv DAFTAR SIMBOL ................................................................................................................. xvi
BAB I PENDAHULUAN .......................................................................................................... 1 Latar Belakang........................................................................................................... 2 Rumusan Masalah...................................................................................................... 3 Tujuan dan Manfaat ................................................................................................... 3 Ruang Lingkup .......................................................................................................... 4 1.4.1 Penyimpanan Dokumen ................................................................................... 4 1.4.2 Pengelolaan Dokumen ..................................................................................... 4 1.4.3 Pencarian Dokumen ......................................................................................... 4 1.5 Metodologi Pengembangan Sistem ........................................................................... 5 1.6 Sistematika Penulisan Laporan .................................................................................. 6 BAB II KAJIAN PUSTAKA ..................................................................................................... 8 1.1 1.2 1.3 1.4
2.1 Rujukan ....................................................................................................................... 8 2.2 Pembacaan Dokumen Berformat PDF ........................................................................ 8 2.3 Analisis Leksikal ......................................................................................................... 9 2.3.1 String ................................................................................................................ 9 2.3.2 Finite Automata.............................................................................................. 10 2.4 Pembobotan TF-IDF ................................................................................................. 12 2.5 Latent Semantic Analysis .......................................................................................... 13 2.6 Middleware ............................................................................................................... 14 2.7 RPC (Remote Procedure Call) .................................................................................. 15 2.7.1 Operasi Dasar RPC ........................................................................................ 16 2.7.2 Client and Server Stubs .................................................................................. 18 2.8 ICE Middleware ........................................................................................................ 20 2.8.1 Clients and Servers ........................................................................................ 21 2.8.2 Ice Objects...................................................................................................... 22 2.8.3 Proxies............................................................................................................ 23 2.8.4 Synchronous Method Invocation .................................................................... 23 2.8.5 Asynchronous Method Invocation .................................................................. 24 2.8.6 Bahasa Slice ................................................................................................... 24 2.9 Petri Net .................................................................................................................... 25 BAB III ANALISIS .................................................................................................................. 27 iii
3.1 Identifikasi proses pada AMD-LSA.......................................................................... 27 3.1.1 Indentifikasi Proses Upload Dokumen .......................................................... 28 3.1.2 Indentifikasi Proses Acquisition ..................................................................... 29 3.1.3 Indentifikasi Proses Computation .................................................................. 38 3.1.4 Indentifikasi Proses Pencarian ....................................................................... 46 3.2 Analisis Pengembangan AMD-LSA menggunakan Sistem terdistribusi.................. 47 Penerapan Konsep Sistem Terdistribusi.......................................................................... 49 3.2.1 Karakteristik sistem terdistribusi.................................................................... 49 3.2.2 Empat lasan utama untuk membangun sistem terdistribusi ........................... 50 3.2.3 Tantangan-tantangan yang harus dipenuhi oleh sebuah sistem terdistribusi: 50 3.2.4 Arsitektur AMD-LSA .................................................................................... 51 3.2.5 Arsitektur Terdistribusi .................................................................................. 51 3.2.6 Duplikasi Fungsi Server ................................................................................. 52 3.2.7 Memisahkan Proses Computation .................................................................. 53 3.3 Kebutuhan Sistem ..................................................................................................... 55 3.3.1 Acquisition...................................................................................................... 55 3.3.2 Computation ................................................................................................... 68 3.3.3 Update ............................................................................................................ 70 3.3.4 Search ............................................................................................................. 72 3.4 Analisis Model Data .................................................................................................. 74 3.4.1 Data Dokumen ............................................................................................... 74 3.4.2 Data Term....................................................................................................... 75 3.4.3 Data Bobot Term Terhadap Dokumen ........................................................... 75 3.4.4 Data Similaritas Antar Dokumen ................................................................... 75 3.4.5 Rancangan ER-Diagram Sistem ..................................................................... 76 BAB IV PERANCANGAN SISTEM ...................................................................................... 78 4.1 Tujuan Perancangan .................................................................................................. 78 4.2 Batasan Perancangan................................................................................................. 78 4.3 Deskripsi Perancangan .............................................................................................. 79 4.3.1 Perancangan Sistem ....................................................................................... 79 4.4 Perancangan Class Aplikasi Pengembangan Aplikasi AMD-LSA menggunakan Sistem Terdistribusi ........................................................................................................ 88 4.4.1 Package Diagram Client ................................................................................. 88 4.4.2 Class amd.services ......................................................................................... 89 4.4.3 Package Diagram Server Lokal ...................................................................... 91 4.4.4 Class amd.services ......................................................................................... 92 4.4.5 Package Diagram Server Komputasi ............................................................. 94 4.4.6 Class Diagram Services.................................................................................. 95 4.5 Arsitektur Aplikasi .................................................................................................... 95 4.5.1 Desain Komunikasi antara komputer client, Server Lokal, Server Remote dan Server Computation ....................................................................................... 95 4.6 Pemodelan Sistem Menggunakan Model Coloured Petri Net .................................. 97 4.6.1 Coloured Petri Net Upload Dokumen ............................................................ 97 4.6.2 Coloured Petri Net Acquisition Dokumen ..................................................... 99 4.6.3 Model CPN Tokenizing, Filtering dan Stemming: ...................................... 100 4.6.4 Coloured Petri Net Komputasi ..................................................................... 100 4.6.5 Coloured Petri Net Pencarian Dokumen Relevan dan Similar .................... 101 4.7 Perancangan Sequence Diagram Sistem Manajemen Dokumen Ilmiah Terdistribusi103 4.7.1 Sequence Diagram untuk Use Case Upload Dokumen................................ 103 iv
4.7.2 Sequence Diagram untuk Use Case Acquisition .......................................... 105
4.7.3 Sequence Diagram untuk Use Case Check Double ..................................... 106
4.7.4 Sequence Diagram untuk Use Case Term Extractor .................................... 107 4.7.5 Sequence Diagram untuk Proses Computation ............................................ 107 4.7.6 Sequence Diagram untuk Use Case Document Extractor ............................ 108 4.7.7 Sequence Diagram untuk Use Case Get New Document ............................ 109 4.7.8 Sequence Diagram untuk Use Case Query Document Relevan................... 111 4.7.9 Sequence Diagram untuk Query Document Similar .................................... 112 4.7.10 Sequence Diagram untuk Use Case Search & Download .......................... 113 4.8 Perancangan Modul ................................................................................................. 114 BAB V IMPLEMENTASI ..................................................................................................... 131
5.1 Batasan Implemantasi ............................................................................................. 131 5.2 Deployment Diagram Aplikasi Manajemen Dokumen ........................................... 132 5.3 Spesifikasi Perangkat Lunak dan Perangkat Keras Aplikasi Manajemen Dokumen135 5.3.1 Spesifikasi perangkat lunak dan perangkat keras......................................... 135 5.4 Implementasi Data .................................................................................................. 136 5.4.1 Database Server Local.................................................................................. 136 5.4.2 Database Server Computation ...................................................................... 136 5.5 Gambaran Umum Sistem ........................................................................................ 137 5.6 Tampilan Form ........................................................................................................ 139 5.6.1 Form Tampilan Awal Saat Aplikasi Dijalankan .......................................... 139 5.6.2 Form Upload ................................................................................................ 140 5.6.3 Form Extract................................................................................................. 141 5.6.4 Form Search ................................................................................................. 141 BAB VI Pengujian .................................................................................................................. 144 6.1 Batasan Pengujian ................................................................................................... 144 6.2 Perencanaan Pengujian............................................................................................ 144 6.2.1 Pelaku Pengujian .......................................................................................... 144 6.2.2 Pelaksanaan Pengujian ................................................................................. 144 BAB VII Penutup ................................................................................................................... 147 7.1 Kesimpulan ............................................................................................................. 147 7.2 Saran........................................................................................................................ 147 DAFTAR PUSTAKA ............................................................................................................. 148
v
DAFTAR GAMBAR
Gambar 1 Model Jaringan Komunikasi .................................................................................... 15
Gambar 2 Parameter passing di local procedure call............................................................... 17
Gambar 3 Prinsip RPC antara program Client dan Server ....................................................... 19
Gambar 4 Arsitektur ICE .......................................................................................................... 21 Gambar 5 Arsitektur SLICE ..................................................................................................... 25 Gambar 6. Use Case Model AMD-LSA ................................................................................... 28
Gambar 7. Flow proses stemming ............................................................................................ 32 Gambar 8 Ilustrasi Struktur Sistem Terdistribusi ..................................................................... 49
Gambar 9. Desain Sistem StandAlone ...................................................................................... 51
Gambar 10. Desain Server 1 ..................................................................................................... 52 Gambar 11. Desain Proses Computation Terpisah ................................................................... 53 Gambar 12. Sistem Multi-Computer dengan Shared Memory ................................................. 54 Gambar 13 CPN Acquisition .................................................................................................... 56 Gambar 14. Model Petrinet Proses upload .............................................................................. 58 Gambar 15 Flow Komunikasi Data Cek Double ...................................................................... 60 Gambar 16 Model proses check double per server lokal.......................................................... 62 Gambar 17. Model petrinet proses check double ..................................................................... 63 Gambar 18 CPN Prose Acquisition .......................................................................................... 65 Gambar 19 CPN Proses Pengembalian Data Dari Server Komputasi ...................................... 67 Gambar 20 CPN Proses Computation ...................................................................................... 69 Gambar 21 Proses Update DB Lokal Dari Server Komputasi ................................................. 71 Gambar 22 Proses Update DB Lokal Dari Server Komputasi ................................................. 71 Gambar 23 CPN Proses Search ................................................................................................ 73 Gambar 24 Model Data Dokumen............................................................................................ 74 Gambar 25 Model Data Term ................................................................................................... 75 Gambar 26 Model Data Term Dokumen .................................................................................. 75 Gambar 27 Model Data Doc Similarity .................................................................................... 76 Gambar 28. ER-Diagram Database Server Lokal .................................................................... 76 Gambar 29. ER-Diagram Database Server Computation ......................................................... 77 Gambar 30. Desain Sistem Terdistribusi .................................................................................. 79 Gambar 31 Use Case Sistem Manajemen Dokumen Ilmiah Terdistribusi ............................... 80 vi
Gambar 32 Package Diagram Client ........................................................................................ 88
Gambar 33 Class Diagram Client amd.services ....................................................................... 89 Gambar 34 Package Diagram Server Lokal ............................................................................. 91
Gambar 35 Class Diagram amd.services Server Lokal ............................................................ 92 Gambar 36 Package Diagram Server Komputasi ..................................................................... 94
Gambar 37 Class Diagram Server Komputasi .......................................................................... 95 Gambar 38 Desain komunikasi sistem ..................................................................................... 96 Gambar 39 CPN proses memindahkan file dokumen dari komputer client ke direktori upload ............................................................................................................................... 98 server lokal
Gambar 40 Model CPN Acquisition ........................................................................................ 99
Gambar 41 Model CPN Tokenizing, Filtering dan Stemming ............................................... 100 Gambar 42 Coloured Petri Net dari Proses Komputasi .......................................................... 101 Gambar 43 Coloured Petri Net untuk proses pencarian dokumen relevan dan pencarian dokumen similar ..................................................................................................................... 102 Gambar 44 Sequence Diagram untuk Use Case Upload Dokumen ....................................... 104 Gambar 45 Sequence Diagram untuk Use Case Acquisition ................................................. 105 Gambar 46 Sequence Diagram untuk Use Case Check Double ............................................. 106 Gambar 47 Sequence Diagram untuk Use Case Term Extractor ........................................... 107 Gambar 48 Sequence Diagram untuk Proses Computation.................................................... 108 Gambar 49 Sequence Diagram untuk Use Case Document Extractor ................................... 109 Gambar 50 Sequence Diagram untuk Use Case Get New Document .................................... 110 Gambar 51 Sequence Diagram untuk Use Case Query Document Relevan .......................... 111 Gambar 52 Sequence Diagram untuk Query Document Similar ........................................... 112 Gambar 53 Sequence Diagram untuk Use Case Search & Download ................................... 113 Gambar 54 Deployment Diagram Aplikasi Manajemen Dokumen ....................................... 133 Gambar 55 Struktur Menu Aplikasi Manajemen Dokumen ................................................... 138 Gambar 56 Form Tampilan Awal Saat Aplikasi Dijalankan .................................................. 139 Gambar 57 Form Upload ........................................................................................................ 140 Gambar 58 Notifikasi Upload................................................................................................. 140 Gambar 59 Notifikasi Extract Sukses ..................................................................................... 141 Gambar 60 Notifikasi Extract Gagal ...................................................................................... 141 Gambar 61 Form Search Relevan ........................................................................................... 142 Gambar 62 Form Search Similar ............................................................................................ 143 vii
DAFTAR TABEL
Tabel 1 Keterangan Rumus Finite Automata ........................................................................... 11 Tabel 2 Keterangan Rumus TF/IDF ......................................................................................... 13 Tabel 3 Keterangan Symbol CPN ............................................................................................ 26
Tabel 4 Requirement Upload Dokumen ................................................................................... 29 Tabel 5. Aturan Mereduksi Term Jamak Menjadi Bentuk Tunggal ......................................... 32
Tabel 6. Aturan Mereduksi Term dalam Bentuk Continuous / Participle ke Term Dasar ....... 33 Tabel 7. Aturan Mereduksi Term untuk Term Berakhiran –ed dan –ing ................................. 33 Tabel 8. Aturan Mereduksi Term Berakhiran Huruf ‘y’ .......................................................... 34
Tabel 9. Aturan Mereduksi Satu Akhiran untuk Term Berakhiran Banyak ............................. 34 Tabel 10. Aturan Mereduksi Akhiran ....................................................................................... 35 Tabel 11. Aturan Menghilangkan Akhiran Term (Last Suffix) ................................................ 35 Tabel 12. Aturan Menghilangkan Akhiran ‘e’ ......................................................................... 36 Tabel 13. Aturan Menghilangkan Huruf yang Dobel ............................................................... 36 Tabel 14. Requirement proses Acquisition ............................................................................... 37 Tabel 15. Matrix Inverted Index ............................................................................................... 39 Tabel 16 Keterangan Rumus Pembobotan Term ...................................................................... 41 Tabel 17. Matrix inverted index dengan bobot......................................................................... 42 Tabel 18. Hasil perhitungan bobot ........................................................................................... 43 Tabel 19 Keterangan Rumus Dekomposisi Matrkis ................................................................ 44 Tabel 20. Requirement proses Computation............................................................................. 45 Tabel 21. Requirement Pencarian Dokumen Relevan .............................................................. 46 Tabel 22 Pengembangan proses menggunakan sistem terdistribusi ......................................... 47 Tabel 23. Requirement Upload ................................................................................................. 58 Tabel 24. Requirement check double terdistribusi.................................................................... 64 Tabel 25. Requirement check double terdistribusi ................................................................... 66 Tabel 26. Requirement Save ke Database local ....................................................................... 68 Tabel 27. Requirement SendDataNewDoc ............................................................................... 68 Tabel 28. Requirement SendDataNewDoc ............................................................................... 70 Tabel 29. Requirement UpdateData Server Local .................................................................... 71 Tabel 30. Requirement Search & Download ............................................................................ 74 viii
Tabel 31 Use Case Realization Upload .................................................................................... 81
Tabel 32 Use Case Realization Acquisition ............................................................................. 81 Tabel 33 Use Case Realization Get New Document ................................................................ 82
Tabel 34 Use Case Realization Check Double ......................................................................... 83 Tabel 35 Realization InvertedIndex ......................................................................................... 84
Tabel 36 Realization Send Data New Document ..................................................................... 84 Tabel 37 Use Case Count Data ................................................................................................. 85 Tabel 38 Use Case Count TF-IDF & LSA ............................................................................... 85 Tabel 39 Use Case Realization Query Dokumen Relevan ....................................................... 86 Tabel 40 Use Case Realization Query Dokumen Similar ........................................................ 87
Tabel 41 Deskripsi Package Diagram Client ............................................................................ 89 Tabel 42 Deskripsi Class Diagram amd.services Client........................................................... 90 Tabel 43 Deskripsi Package Diagram Server Lokal ................................................................. 91 Tabel 44 Deskripsi Diagram Server Lokal ............................................................................... 93 Tabel 45 Deskripsi Package Diagram Server Komputasi ........................................................ 94 Tabel 46 Deskripsi Class Diagram Server Komputasi ............................................................. 95 Tabel 47 Modul Transfer File ................................................................................................. 114 Tabel 48 Modul Client Upload ............................................................................................... 115 Tabel 49 Module CekDoubleDBI........................................................................................... 116 Tabel 50 Module QueueCekDoubleI.isInQueue .................................................................... 116 Tabel 51 Modul QueueCekDoubleI.addToQueue .................................................................. 117 Tabel 52 QueueCekDoubleI.remoceFromQueue ................................................................... 117 Tabel 53 Module ClientCekDoubleDB.createProxy .............................................................. 118 Tabel 54 Modul CallbackCekDoubleDB.completed .............................................................. 118 Tabel 55 Modul Nama Modul ClientCekDoubleDB.run ....................................................... 119 Tabel 56 Modul ServerQueueCekDouble.run ........................................................................ 121 Tabel 57 Modul ServerLokal.run ........................................................................................... 121 Tabel 58 Modul GetDocTermsI.getDocTerms ....................................................................... 122 Tabel 59 Modul GetDocTermsI.getIdDoc.............................................................................. 123 Tabel 60 Modul GetDocTermsI.getTerms ............................................................................. 124 Tabel 61 Modul UpdateDocTermsI.updateDocTerm ............................................................. 124 Tabel 62 Modul UpdateDocTermsI.updateSimilarity ............................................................ 125 Tabel 63 Modul SearchRelevantI.createProxy ....................................................................... 126 ix
Tabel 64 Modul SearchRelevantI.callBack ............................................................................ 126
Tabel 65 Modul SearchRelevantI.run ..................................................................................... 127 Tabel 66 Modul ClientSeachRelevant.run.............................................................................. 128
Tabel 67 Modul SearchSimilarI ............................................................................................. 128 Tabel 68 Modul ClientSeachSimilar.run ................................................................................ 129
Tabel 69 Modul DownloadDokumenI .................................................................................... 129 Tabel 70 Modul ClientDownloadDocument.run .................................................................... 130 Tabel 71 Fitur - fitur yang telah berhasil diimplementasi ...................................................... 131 Tabel 72 Deskripsi Deployment Diagram Aplikasi Manajemen Dokumen ........................... 134 Tabel 73 Spesifikasi perangkat lunak dan perangkat keras .................................................... 135
Tabel 74 Deskripsi Database Server Local............................................................................. 136 Tabel 75 Database Server Computation ................................................................................. 136 Tabel 76 Penjelasan Struktur Menu Aplikasi Manajemen Dokumen .................................... 138 Tabel 77 Skenario Pengujian Upload ..................................................................................... 145 Tabel 78 Skenario Check Double ........................................................................................... 145
x
DAFTAR RUMUS
Rumus 1 Finite Automata ......................................................................................................... 11
Rumus 2 TF/IDF ....................................................................................................................... 12
Rumus 3 TF/IDF Modifikasi .................................................................................................... 13
Rumus 4 Rumus Pembobotan Term ......................................................................................... 41 Rumus 5 Dekomposisi Matriks ............................................................................................... 44
xi
DAFTAR ISTILAH
No.
Istilah
Deskripsi
Actor
Pelaku yang ada dalam use case. Pelaku dapat berupa sistem maupun manusia.
Ascending
Pengurutan berdasarkan sesuatu dari kecil ke besar.
Black box testing
Pengujian untuk menyatakan kesesuaian antara input dengan output yang diharapkan.
Class diagram
Diagram yang memperlihatkan struktur kelas dan keterhubungannya dengan kelas yang lain
5.
Computer Client
Komputer yang terhubung dengan server lokal. Komputer tersebut digunakan sebagai komputer yang berhubungan langsung dengan user
6.
Conceptual Data Model
Diagram yang digunakan untuk menggambarkan logika struktur dalam database.
7.
Corpus
Kumpulan kata atau term.
8.
Cosine Similarity
Salah satu metode perhitungan similarity.
9.
Deployment Diagram
Diagram yang digunakan untuk menunjukkan keterhubungan antar subsistem dalam suatu sistem.
10.
Descending
Pengurutan berdasarkan sesuatu dari besar ke kecil.
11.
File
Data/arsip digital dalam disk.
12.
Folder
Jenis file yang digunakan untuk membungkus file lain.
13.
Foreign key
Nilai yang diturunkan dari tabel lain.
14.
ICE
Sebuah middleware yang membantu proses distribusi
15.
Indexing
Proses pengalamatan atau pengindeksan.
1.
2.
3.
4.
xii
No.
Istilah
Deskripsi
Information retrieval
Penelusuran informasi.
16.
Apabila A dan B masing-masing adalah matriks persegi berordo sama dan berlaku hubungan:
17.
Inverse matriks
Maka A adalah invers B atau B adalah invers A atau A dan B merupakan dua matriks yang saling invers.
18.
Keyword
A. B = B. A = I
Sebuah kata atau phrase yang digunakan untuk menemukan informasi.
19.
Matriks orthogonal
Sebuah matriks disebut matriks orthogonal jika A A T = AT A = I.
20.
Path
Lokasi/alamat dari suatu file.
21.
Physical data model
Model yang digunakan untuk melihat implementasi struktur fisik dan data query.
22.
Porter algorithm
Salah satu Algoritma yang digunakan untuk proses stemming.
23.
Primary key
Nilai yang dijadikan sebagai penunjuk/identitas data dalam tabel. Primary key tidak dapat null dan harus unik dalam satu tabel.
24.
Query
Suatu permintaan yang diberikan user untuk mengambil informasi yang tersimpan pada tempat penyimpanan data.
25.
Relevan
Sesuai/sama.
26.
Requirement
Kebutuhan sistem.
27.
Search engine
Perangkat lunak yang membantu pencarian terhadap kumpulan dokumen.
28.
Sequence Diagram
Diagram yang digunakan untuk menelusuri perilaku proses.
29.
Similar
Mirip.
30.
Similarity
Nilai kemiripan antar dokumen dengan dokumen.
31.
Server Local
Server yang terletak pada masing masing jurusan.
xiii
No.
Istilah
Deskripsi
Server Computation
Server yang bertugas melakukan proses komputasi
32.
33.
Term
Term weighting
34.
Suatu kata yang telah melewati proses parsing. Pembobotan term untuk menentukan ranking. TF-IDF adalah metode yang sering digunakan dalam termweighting.
35.
Transpose matriks
Matriks baru yang didapat dengan menukar nilai pada kolom dengan nilai pada baris yang bersesuaian.
36.
Use case
Merepresentasikan sebuah interaksi antara aktor dengan sistem.
xiv
No.
DAFTAR SINGKATAN DAN AKRONIM
Akronim / Singkatan
Deskripsi
1.
AMD-LSA
Aplikasi Manajemen Dokumen menggunakan metode Latent semantic analysis.
2.
ASCII
American Standard Code for Information Interchange.
3.
DBMS
Database Management System.
4.
ICE
Internet Communications Engine
5.
JTK
Jurusan Teknik Komputer.
6.
LSA
Latens Semantic Analysis. Merupakan suatu metode pencarian nilai similarity term dan dokumen.
7.
N/A
Not available.
8.
OMG
Object Management Group. Merupakan sebuah organisasi internasional yang dibentuk pada tahun 1989, didukung lebih dari 800 anggota, terdiri dari perusahaan sistem informasi, software developer dan para user sistem komputer.
9.
PDF
Portable document format.
10.
POLBAN
Politeknik Negeri Bandung.
11.
SQL
Structured Query Language.
12.
SVD
Singular value decomposition.
13.
TA
Tugas Akhir.
14.
TF-IDF
Term Frequency – Inverse Document Frequency. Merupakan suatu metode pembobotan term terhadap dokumen.
15.
UI
User Interface.
16.
UML
Unified Modelling Language.
xv
DAFTAR SIMBOL
NO SIMBOL
NAMA SIMBOL
DESKRIPSI
PENGGUNAAN
Actor
Melambangkan pengguna aplikasi.
Usecase Diagram, Sequence Diagram
Actor
Melambangkan pengguna aplikasi.
Use case Diagram
Use Case
Menggambarkan tentang interaksi yang terjadi antara aktor dengan aplikasi.
Use case Diagram
1 ud Actors
2
3
«actor» Extractor System
4
Include
5
Extend
6
Associate
7
Class
8
Mengindikasikan bahwa suatu case sumber mencakup fungsionalitas dari use case target. Mengindikasikan bahwa suatu case mempunyai perilaku dari case lain. Mengasosiakan dua elemen model yang memiliki keterhubungan. Merupakan representasi dari obyek yang mencerminkan struktur dan perilaku mereka di dalam sistem. Menggambarkan sebuah project dengan beberapa elemen didalamnya yang dapat berhubungan dengan yang lainnya.
Package
xvi
Use case Diagram
Use case Diagram Use case Diagram, Class Diagram, Deployment Diagram
Class Diagram
Class Diagram
NAMA SIMBOL
DESKRIPSI
PENGGUNAAN
Lifeline
Merepresentasikan hubungan suatu elemen.
Sequence Diagram
Boundary
Merupakan stereotyped class yang memodelkan beberapa sistem boundarykhususnya sebuah layar interface.
Sequence Diagram
Control
Menggambarkan pengendalian sebuah entity atau manager.
Sequence Diagram
Message
Merupakan tipe dari elemen message yang meng-extend level suatu aktivasi dari pesan sebelumnya.
Sequence Diagram
Self-Message
Mencerminkan proses atau metode dalam melibatkan pemanggilan lifeline awal.
Sequence Diagram
Node
Merupakan sebuah bagian fisik dari suatu perlengkapan yang mana sistem akan dideploy.
Deployment Diagram
15
Component
Merupakan bagian modular dari sistem, yang mana perilaku didefinisikan dengan interface yang dibutuhkan dan disediakan.
Deployment Diagram
16
Deployment
Menggambarkan ketergantungan
Deployment Diagram
NO SIMBOL
9
10
11
12
13
14
xvii
NO SIMBOL
NAMA SIMBOL
DESKRIPSI hubungan antara sebuah artifak dan node.
Entity
Merupakan mekanisme penyimpanan atau persistence yang menangkap informasi atau ilmu pengetahuan dari sebuah sistem.
Conceptual Data Model
One to One (mandatory)
Hubungan satu ke satu antar dua tabel.
Conceptual Data Model
19
Many to Many
Hubungan banyak ke banyak antar dua tabel.
Conceptual Data Model
20
Many to One
Hubungan banyak ke satu antar dua tabel
Conceptual Data Model
21
One to Many (mandatorydependency)
Hubungan satu ke banyak antar dua tabel.
Conceptual Data Model
22
Tabel
Berisi data-data yang digunakan beserta atributnya.
Physical data model
Relationship
Menghubungkan tabeltabel yang memiliki keterhubungan.
Physical data model
17
18
23
xviii
PENGGUNAAN