BAB I PENDAHULUAN
Pesatnya perkembangan dunia teknologi sekarang ini memberikan banyak kemudahan bagi manusia di berbagai bidang. Selain itu, kebutuhan manusia untuk mendapatkan ilmu pengetahuan pun dapat dilakukan dengan mudah. Hal itu dapat dilihat dengan banyaknya dokumen-dokumen elektronik yang dapat menjadi sumber dari ilmu pengetahuan. Untuk
mendapatkan kemudahan dari kekayaan informasi tersebut, perlu dibuat sebuah mekanisme
yang dapat mengelola dokumen-dokumen elektronik tersebut. Pada pengelolaan dokumen biasanya terdapat beberapa proses seperti penyimpanan dokumen dan proses pencarian
dokumen yang cepat dan mudah.
Saat ini telah terdapat aplikasi yang berguna untuk membantu manusia dalam mencari informasi tersebut. Aplikasi tersebut dinamakan search engine. Prosedur kerja dari search engine yaitu dengan memanfaatkan suatu inputan keyword dari user sebagai parameter dalam pencarian tersebut. Namun, masalah baru muncul ketika ada banyak dokumen yang ada serta jika sumber informasi ada dalam jumlah yang sangat banyak dan terus bertambah. Menurut Rachmat, Setiawan dan Setijohatmo (2010) di dalam penelitiannya yang berjudul Sistem Manajemen Dokumen: Pengorganisasian dan Temu Kembali Dokumen Artikel Ilmiah Elektronik mengungkapkan “lautan informasi ini mengandung 2,3 miliar dokumen digital dan para analis memprediksi jumlah dokumen pada Web akan berkembang delapan kali pada tahun 2000 - dan 100 kali pada dekade berikutnya”. Dengan banyaknya dokumen yang ada maka hasil pencarian menjadi kurang tepat dan relevan. Dengan kondisi tersebut, user yang melakukan pencarian dokumen merasa kurang puas. Terutama jika user tersebut adalah dosen dan mahasiswa, karena untuk membantu proses kegiatan belajar mengajar dibutuhkan dokumen atau informasi yang tepat sehingga proses pembelajaran menjadi lebih optimal. Masalah tersebut juga terjadi di lingkungan Politeknik Negeri Bandung yang sebagian besar dosen memiliki dokumen penting yang seharusnya dapat diakses bersama. Maka dari itu dibutuhkan sebuah sistem yang mampu mengatasi masalah tersebut. Jika terdapat banyak dokumen serta tersimpan di berbagai tempat yang berada dalam sebuah jaringan, maka dibutuhkan pengelolaan dokumen yang baik.
Hal ini dibutuhkan untuk
mempermudah user dalam menggunakan sistem tersebut. Kemapuan pencarian dokumen yang berada di berbagai tempat tersebut dapat ditunjang menggunakan metode sistem terdistribusi. 1
2 BAB I PENDAHULUAN
Dengan demikian, dokumen tersebut dapat diakses secara bersamaan, serta dapat dicegah
adanya penggandaan dokumen sehingga kapasistas storage yang digunakan untuk menyimpan dokumen menjadi lebih efisien.
1.1 Latar Belakang Dokumen mengenai ilmu pengetahuan dapat digunakan dalam proses kegiatan belajar
mengajar, terutama dokumen ilmiah. Seiring berjalannya waktu dan berkembangnya teknologi membuat jumlah dokumen tersebut terus bertambah. Dengan semakin banyaknya
dokumen yang ada, pencarian dokumen yang sesuai dengan harapan user pun menjadi tidak mudah. Maka dari itu dibutuhkan search engine yang mempu menangani masalah tersebut.
Dalam mencari dokumen, user menggunakan suatu input-an berupa keyword sebagai parameter dalam pencarian tersebut. Search engine yang baik tentunya didukung oleh metode yang baik yang salah satunya adalah TF-IDF. Dalam metode TF-IDF, pencarian dokumen dilakukan berdasarkan bobot pada terms yang diekstrak dari isi dokumen. Pertama kali ketika ada dokumen yang masuk, keseluruhan isi dokumen tersebut dibaca tiap term-nya yang kemudian kemunculan tiap term tersebut akan dihitung dan diberi bobot berdasarkan jumlah halaman pada dokumen tersebut. Berdasarkan bobot inilah query menghasilkan daftar dokumen – dokumen yang mengandung term dari keyword yang diinputkan secara descending. Namun setelah mendapatkan dokumen yang dicari, sebagian user masih merasa kurang puas dengan informasi pada dokumen yang didapatnya. Kebutuhan untuk mendapatkan informasi yang lebih dari dokumen itulah yang kemudian mendorong user untuk mendapatkan dokumen lain yang similar dengan dokumen yang sudah didapatnya. Pencarian dokumen yang similar tersebut terkadang tidak sesuai jika ditangani dengan menggunakan metode TF-IDF. Pencarian dokumen yang similar (similarity document) dapat dilakukan dengan berbagai metode, diantaranya adalah Latent semantic analysis (LSA) dan Cosine. Metode LSA pernah diimplemenasikan pada Tugas Akhir sebelumnya, yaitu aplikasi AMD-LSA. Aplikasi tersebut hanya mampu melakukan pencarian pada sebuah komputer (stand-alone). Aplikasi tersebut masih dapat dikembangkan menjadi aplikasi yang bekerja pada beberapa komputer sekaligus sebagai sistem terdistribusi. Salah satunya adalah mampu melakukan pencarian dokumen ke beberapa komputer secara terpisah dan bersamaan. Pengembangan Aplikasi AMD-LSA Menggunakan Beberapa Pendekatan Sistem Terdistribusi
3 BAB I PENDAHULUAN
Menurut Coulouris, sitem terdistribusi yaitu "a system in which hardware or software
components located at networked computers communicate and coordinate their actions only by message passing." Maksudnya sebuah sistem yang terdapat beberapa komponen perangkat
keras maupun perangkat lunak yang terletak dalam sebuah jaringan komunikasi komputer dan bertindak berdasarkan
message
passing.
Hasil
pengembangan
aplikasi
ini
akan
diimplementasikan di lingkungan Politeknik Negeri Bandung.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah dijelaskan diatas, maka terdapat permasalahan yang akan diselesaikan adalah cara pengembangan suatu perangkat lunak yang dapat bertindak sebagai suatu sistem manajemen dokumen yang mengatur, mendistribusikan, menyimpan dan
menemukan kembali dokumen-dokumen elektronik yang bersifat pengetahuan atau akademik. Secara lebih detail permasalahan yang harus ditangani adalah: 1. Bagaimana mengembangkan mekanisme penyimpanan, perhitungan dan pencarian dokumen pada aplikasi AMD-LSA menjadi aplikasi yang berjalan secara client-server. 2. Melakukan identifikasi tentang proses - proses pada aplikasi AMD-LSA yang berpotensi bekerja secara terdistribusi.
1.3 Tujuan dan Manfaat Tujuan pengembangan aplikasi ini adalah sebagai berikut: 1. Memudahkan pencarian suatu dokumen pada beberapa tempat yang berada dalam sebuah jaringan komunikasi komputer, berdasarkan term dari keyword yang diinputkan oleh user. 2. Memudahkan pencarian dokumen yang similar pada beberapa tempat yang berada dalam sebuah jaringan komunikasi komputer berdasarkan parameter berupa sebuah dokumen yang dihasilkan pada nomor 1. 3. Proses peyimpanan, proses perhitungan dan pencarian dokumen, karena sistem bekerja secara terdistribusi.
Pengembangan Aplikasi AMD-LSA Menggunakan Beberapa Pendekatan Sistem Terdistribusi
4 BAB I PENDAHULUAN
1.4 Ruang Lingkup Sistem yang dibangun mampu melakukan penyimpanan dokumen, pengelolaan dokumen dan
pencarian dokumen. Dibawah ini adalah penjelasan tentang fitur yang ada pada
pengembangan sistem yang dibangun.
1.4.1 Penyimpanan Dokumen Dalam proses penyimpanan dokumen membutuhkan beberapa sub proses. Sub proses ini
berfungsi untuk mendapatkan informasi yang terdapat di dalam dokumen. Sub proses tersebut
diantaranya adalah ekstraksi dokumen, pembobotan term dan inverse indexing. Didalam
bagian ini informasi seperti nama file, judul dokumen, abstrak dokumen, author, path, dan jumlah halaman digunakan sebagai parameter untuk memeriksa keberadaan dokumen
tersebut. Jika dokumen tersebut belum tersedia, maka dokumen tersebut disimpan. Sebaliknya, jika dokumen sudah tersedia, maka dokumen tersebut secara otomatis gagal dan memberikan notifikasi bahwa dokumen tersebut telah tersedia.
1.4.2 Pengelolaan Dokumen Dalam proses ini terdapat beberapa hal yang dikelola, antara lain; informasi lokasi dokumen, jumlah replika dokumen, pengkategorian dokumen, serta pengelolaan hak akses dokumen. Didalam pengelolaan hak akses dokumen memiliki tiga bagian, yakni upload, update dan delete dokumen.
1.4.3 Pencarian Dokumen Proses pencarian dokumen menggunakan input-an berupa keyword. Dokumen dari hasil pencarian dengan parameter input-an keyword tersebut dijadikan parameter untuk menampilkan dokumen lain yang similar. Proses pencarian dokumen juga menggunakan metode TF-IDF sedangkan untuk proses pencarian dokumen similar menggunakan LSA dan Cosine. Proses pencarian dokumen dalam pengembangan aplikasi ini melakukan pencarian ke beberapa tempat yang berada dalam sebuah jaringan menggunakan konfigurasi terdistribusi, bukan terpusat. Didalam proses ini suatu query akan membuat semua server melakukan pemrosesan secara serentak dan mengembalikan hasil pencarian kepada user (Rachmat, Setiawan & Setijohatmo, 2010).
Pengembangan Aplikasi AMD-LSA Menggunakan Beberapa Pendekatan Sistem Terdistribusi
5 BAB I PENDAHULUAN
Batasan masalah untuk perangkat lunak ini antara lain: 1. Artikel ilmiah berbahasa Inggris.
2. Dokumen yang digunakan adalah dokumen ilmiah berformat file PDF. 3. Dokumen memiliki abstrak didalamnya.
4. Font pada dokumen menggunakan font Times New Roman.
5. Query hanya mampu memproses inputan keyword alphanumeric.
4. Metode similarity menggunakan LSA. 5. Kemampuan pencarian aplikasi ini dapat mencari dokumen pada tempat yang berbeda jika berada dalam sebuah jaringan komunikasi komputer.
1.5 Metodologi Pengembangan Sistem Metodologi yang akan digunakan dalam pengembangan aplikasi ini adalah Iterative Development. Model pengembangan Iterative dikemukakan dalam buku Applying UML and Pattern: Third Edition oleh Craig Larman. Pada metode Iterative Development dilakukan pengorganisasian beberapa tahap pengerjaan yang terkait pada waktu. Satu tahap pengerjaan dari tahap-tahap pekerjaan tersebut merupakan satu iterasi. Adapun tahap-tahapnya adalah sebagai berikut: 1.
Pencarian Topik Tugas Akhir
Tahap ini merupakan tahap awal dalam pengerjaan tugas akhir, setelah tahap ini dilewati maka dapat mengetahui hal-hal apa saja yang harus dilakukan berikutnya. Pada tahap ini ditentukan topik tugas akhir, topik yang digunakan adalah sistem terdistribusi. 2.
Pendifinisian Masalah
Tahap ini dilakukan ketika topik tugas akhir telah diputuskan. Hal-hal yang dilakukan dalam tahap ini yaitu mendifinisikan latar belakang, tujuan, batasan masalah, serta lingkup pengerjaan tugas akhir. 3.
Pencarian Referensi
Tahap ini merupakan tahap untuk mencari references yang dibutuhkan untuk mendukung pengerjaan tugas akhir, misalnya mencari informasi mengenai bahasan-bahasan yang diperlukan untuk dipelajari dan diketahui 4.
Studi Pustaka
Pengembangan Aplikasi AMD-LSA Menggunakan Beberapa Pendekatan Sistem Terdistribusi
6 BAB I PENDAHULUAN
Tahap ini merupakan tahap untuk mempelajari, mengkaji dan membaca untuk mengetahui
informasi tentang hal-hal yang berhubungan dengan tugas akhir. Hal-hal yang berhubungan dengan dua metode yang dipakai dalam tugas akhir ini yaitu TF-IDF, LSA dan teori Sistem
Terdistribusi.
5.
Requirement
Requirement merupakan tahap untuk memahami sistem yang ada dan yang akan dibuat. Agar mencapai tujuan dilakukan pemodelan sistem dengan menggunakan modelling tools. Setelah memodelkan sistem, selanjutnya adalah melakukan evaluasi terhadap sistem yang sedang
berjalan. Aktivitas yang dilakukan dalam tahap ini adalah analisa pengguna aplikasi, analisa
format file yang akan dibaca, analisa struktur penyimpanan file, analisa logika proses TF-IDF dan LSA, dan analisa kegiatan sistem. 6.
Design
Design merupakan tahap untuk merancang sistem yang sesuai dengan requirement yang telah ditentukan. Aktivitas yang dilakukan dalam tahap ini adalah perancangan basis data, perancangan struktur data, perancangan user interface dan perancangan arsitektur aplikasi. 7.
Implementation, Test, Integration & Design
Implementation, Test, Integration & More Design merupakan tahap mengimplementasikan komponen-komponen yang telah dibuat pada tahap perancangan ke dalam bahasa pemrograman, melakukan test pada hasil implementasi, mengintegrasikan hasil dari berbagai tahap pekerjaan baik dalam iterasi yang sama maupun dari iterasi yang sebelumnya, dan melakukan perancangan ulang apabila terdapat ketidaksesuaian dengan sistem yang diharapkan. 8.
Final Integration and System Test
Final integration and system test merupakan tahap pengitegrasian sistem baik pada iterasi yang sama setelah didisain ulang maupun pada iterasi yang sebelumnya dan pengujian pada sistem yang telah di integrasikan.
1.6 Sistematika Penulisan Laporan
Pengembangan Aplikasi AMD-LSA Menggunakan Beberapa Pendekatan Sistem Terdistribusi
7 BAB I PENDAHULUAN
Berikut ini sistematika dalam penulisan laporan pembuatan sistem manajemen dokumen
dengan sistem terdistribusi : 1. BAB 1 PENDAHULUAN Pada bab ini ditulis mengenai latar belakang masalah, rumusan masalah, tujuan,
batasan sistem, metodologi pengembangan, dan sistematika penulisan laporan.
2. BAB 2 KAJIAN PUSTAKA Bab ini berisi penjelasan mengenai teori-teori yang menjadi landasan dalam penulisan laporan tugas akhir. 3. BAB 3 ANALISIS
Bab ini berisi analisis dan evaluasi terhadap sistem yang sedang berjalan, untuk dijadikan landasan pada tahap perancangan sistem. 4. BAB 4 PERANCANGAN SISTEM Bab ini berisi desain dari hasil analisis dan evaluasi terhadap sistem yang sedang berjalan. 5. BAB 5 IMPLEMENTASI Bab ini berisi tentang implementasi dari hasil perancangan yang sebelumnya telah dibuat. 6. BAB 6 PENGUJIAN Bab ini berisi tentang hasil pengujian kinerja sistem. 7. BAB 7 PENUTUP Bab ini berisi kesimpulan dan saran.
Pengembangan Aplikasi AMD-LSA Menggunakan Beberapa Pendekatan Sistem Terdistribusi