PERANCANGAN INFORMATION RETRIEVAL SYSTEM DENGAN METODE EXTENDED BOOLEAN DAN SAVOY
SKRIPSI
Oleh :
DELAVENIA LUIS 1145028
PROGRAM STUDI SISTEM INFORMASI SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER STMIK TIME MEDAN 2015
ABSTRAK Information Retrieval System digunakan untuk menemukan kembali informasi - informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Salah satu hal yang perlu diingat adalah bahwa informasi yang diproses terkandung dalam sebuah dokumen yang bersifat tekstual. Pengguna information retrieval system sangat bervariasi dengan kebutuhan informasi. Akan tetapi, yang menjadi masalah adalah bagaimana teknik mendapatkan informasi tersebut, teknik pengindeksan istilah, teknik pembobotan dokumen dan bagaimana memilih dokumen yang paling relevan sesuai dengan query yang diberikan. Metode penelitian yang digunakan adalah metode Waterfall. Dalam penelitian ini, yang dijelaskan adalah pengindeksan berdasarkan istilah indeks. Pemberian bobot dokumen dilakukan untuk mengetahui tingkat relevansi dokumen sesuai query yang diberikan dan akan dilakukan secara frekwensi dan rumus savoy. Kemudian, dokumen yang telah diindeks dan ditentukan bobotnya, untuk mendapatkan informasi (dokumen) yang dibutuhkan, dilakukan teknik boolean peringkat. Hasil penelitian ini adalah sebuah aplikasi information retrieval system yang dapat melakukan pencarian dokumen yang relevan dengan kata kunci yang dimasukkan.
Kata Kunci : Information retrieval system, metode Savoy
i
ABSTRACT Information Retrieval System is used to retrieve information that is relevant to user needs automatically from a set of information. The information that will be processed are textual documents. The user could retrieve variants information according to the needs. Whereas, the problem is how to achieve those information, indexing technique, document weighted technique, and how to choose the relevant document according to the given query. This research aims to generate index and weight from a file that is needed in indexing process, find and determine file which is relevant to query given with savoy method. This research used Waterfall model. The result of this research is an application of information retrieval system that could be used to search relevant document with input keywords.
Keywords : information retrieval system, Savoy method
ii
KATA PENGANTAR
Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa yang telah memberikan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi ini dengan judul : “Perancangan Information Retrieval System dengan Metode Extended Boolean dan Savoy” Skripsi ini disusun untuk melengkapi persyaratan studi program Strata 1 (S-1) Sekolah Tinggi Manajemen Informatika Komputer (STMIK) TIME Medan. Penulis menyadari bahwa dalam penulisan skripsi ini banyak menemukan kesulitan-kesulitan dan kekurangan pada penulisan. Namun, berkat bantuan dan dorongan dari berbagai pihak, akhirnya penulis dapat menyelesaikannya dengan baik. Oleh karena itu, dalam kesempatan ini penulis ingin mengucapkan terima kasih yang sebesar-besarnya kepada : 1. Bapak Hendri, M.Kom, selaku Pembimbing I yang telah memberikan saran dan masukan, pendidikan serta bimbingan dalam penulisan skripsi ini maupun pemrograman skripsi ini. 2. Bapak Huliman, M.Kom, selaku Pembimbing II yang telah memberikan saran dan masukan, pendidikan serta bimbingan dalam penulisan skripsi ini. 3. Bapak Simon Kanggali, selaku Ketua Yayasan STMIK TIME Medan 4. Bapak Prof. Chainur Arrasyid, S. H. , selaku Ketua BPH STMIK TIME Medan
iii
5. Bapak Prof. Harlem Marpaung, Ph. D, selaku Ketua STMIK TIME Medan 6. Bapak Jackri Hendrik, ST, M.Kom, selaku Pembantu Ketua I STMIK TIME Medan 7. Ibu Feriani Astuti Tarigan, S. Kom, M.Kom, selaku Ketua Program Studi Sistem Informasi STMIK TIME Medan 8. Kepada staf perusahaan yang selama ini telah membantu penulis dalam menyelesaikan penulisan skripsi 9. Orangtua dan teman-teman mahasiswa serta seluruh dosen di STMIK TIME yang telah banyak memberikan dukungan dan saran untuk penulis Penulis menyadari tanpa adanya dukungan dari teman-teman sekalian semua ini tidak akan terwujud. Hanya dengan doa kepada Tuhan Yang Maha Esa penulis memohon agar kebaikan dan bimbingan dari teman-teman semua dapat dibalas dengan kebahagiaan dan kesehatan. Akhir kata, penulis mengucapkan terimakasih sebesar-besarnya kepada semua pihak yang telah membantu terhadap penyelesaian penulisan skripsi ini.
Medan, Mei 2015 Penulis,
Delavenia Luis
iv
DAFTAR ISI
ABSTRAK ..........................................................................................................
i
ABSTRACT.......................................................................................................... ii KATA PENGANTAR ......................................................................................... iii DAFTAR ISI ....................................................................................................... v DAFTAR GAMBAR ........................................................................................... vii DAFTAR TABEL ............................................................................................... viii DAFTAR LAMPIRAN ....................................................................................... ix BAB I
PENDAHULUAN ......................................................................... 01 1.1. Latar Belakang Masalah .......................................................... 01 1.2. Identifikasi Masalah ................................................................ 02 1.3. Batasan Masalah ...................................................................... 02 1.4. Tujuan dan Manfaat Penelitian ................................................ 03 1.5. Sistematika Penulisan .............................................................. 04
BAB II
LANDASAN TEORI .................................................................... 06 2.1. Perancangan ............................................................................ 06 2.2. Sistem ..................................................................................... 06 2.3. Pencarian ................................................................................. 7 2.4. Informasi .................................................................................. 8 2.5. Metode .................................................................................... 10 2.6. Information Retrieval System ................................................... 10 2.7. Metode Extended Boolean ....................................................... 16 2.8. Metode Savoy .......................................................................... 17 2.9. Bahasa Pemrograman .............................................................. 20
BAB III
METODE PENELITIAN ............................................................. 22 3.1. Tempat dan Jadwal Penelitian ................................................. 22 3.2. Kerangka Kerja ....................................................................... 22 3.2.1. Metode Pengumpulan Data ........................................... 23 3.2.2. Analisa Sistem .............................................................. 23 3.2.3. Perancangan Sistem ...................................................... 24
v
3.2.4. Pembangunan Sistem .................................................... 25 3.2.5. Uji Coba Sistem ............................................................ 26 BAB IV
ANALISIS DAN PERANCANGAN ............................................. 27 4.1. Analisa ................................................................................... 27 4.2. Perancangan ............................................................................ 32 4.2.1. Perancangan Proses ...................................................... 32 4.2.2. Perancangan Tabel Pada Database ................................ 34 4.2.3. Perancangan Antarmuka ............................................... 35
BAB V
HASIL DAN PEMBAHASAN ..................................................... 41 5.1. Hasil ......................................................................................... 41 5.2. Pembahasan ............................................................................ 46
BAB V1
KESIMPULAN DAN SARAN ..................................................... 50 6.1. Kesimpulan .............................................................................. 50 6.2. Saran ........................................................................................ 51
DAFTAR PUSTAKA LAMPIRAN
vi
DAFTAR GAMBAR
Gambar 2.1.
Ilustrasi Sistem Temu Kembali ....................................................... 11
Gambar 2.2.
Outline Information Retrieval System ............................................. 14
Gambar 2.3.
Komponen Information Retrieval System ........................................ 15
Gambar 2.4.
Interaksi anatara Pengguna dengan Sistem ..................................... 16
Gambar 3.1.
Kerangka Kerja Penelitian .............................................................. 22
Gambar 3.2.
Flowchart Sistem Usulan ................................................................ 25
Gambar 4.1.
Activity Diagram ............................................................................ 33
Gambar 4.2.
Use Case Diagram ......................................................................... 34
Gambar 4.3.
Rancangan Form Open ................................................................... 35
Gambar 4.4.
Form Teori ..................................................................................... 36
Gambar 4.5.
Form Input Data ............................................................................. 37
Gambar 4.6.
Form Proses ................................................................................... 38
Gambar 4.7.
Form Setting .................................................................................. 39
Gambar 4.8.
Form Tabel ..................................................................................... 40
Gambar 5.1.
Tampilan Menu Utama.................................................................... 41
Gambar 5.2.
Tampilan Form Teori Information Retrieval System Halaman 1 dari 4 ............................................................................................ 42
Gambar 5.3.
Tampilan Form Teori Information Retrieval System Halaman 2 dari 4 ............................................................................................ 43
Gambar 5.4.
Tampilan Form Teori Information Retrieval System Halaman 3 dari 4 ............................................................................................ 43
Gambar 5.5.
Tampilan Form Teori Information Retrieval System Halaman 4 dari 4 ............................................................................................ 44
Gambar 5.6.
Tampilan Form Input Data ............................................................. 45
Gambar 5.7.
Tampilan Form Kumpulan File ...................................................... 46
Gambar 5.8.
Tampilan Form Proses ................................................................... 46
Gambar 5.9.
Tampilan Form Open ..................................................................... 47
Gambar 5.10. Tampilan Form Tabel ..................................................................... 48
vii
DAFTAR TABEL
Tabel 2.1.
Teknik P-Norm .................................................................................. 16
Tabel 3.1.
Jadwal Penelitian ............................................................................... 22
Tabel 4.1.
Tabel Database .................................................................................. 34
viii
DAFTAR LAMPIRAN
Lampiran 1
: Daftar Riwayat Hidup Mahasiswa
Lampiran 2
: Surat Keputusan Dosen Pembimbing Skripsi
Lampiran 3
: Surat Keterangan dari Perusahaan
Lampiran 4
: Kartu Bimbingan Skripsi
Lampiran 5
: Listing Program CD
ix
BAB I PENDAHULUAN
1.1.
Latar Belakang Masalah Semakin banyaknya data dan informasi saat ini menyebabkan masyarakat
mengalami kesulitan memperoleh informasi yang cepat, padat, dan relevan dengan kebutuhannya. Untuk mengatasi hal tersebut, diperlukan suatu information retrieval system yang dapat mengakses dan menyediakan berbagai informasi sesuai kebutuhan pengguna. Saat ini, sumber informasi tersebut dapat diakses secara elektronik melalui World Wide Web (WWW) ataupun internet dengan menggunakan berbagai mesin penelusuran (search engine). Perbedaan mesin penelusuran yang satu dengan yang lain sangat tergantung pada teknik pencarian informasi dan teknik pengindeksan yang dipakai. Information retrieval system merupakan suatu sistem yang berfungsi untuk menemukan kembali informasi yang relevan dengan kebutuhan pemakai. Dalam hal ini, temu kembali informasi berkaitan dengan representasi, penyimpanan, dan akses terhadap representasi dokumen. Dokumen yang ditemukan tidak dapat dipastikan apakah relevan dengan kebutuhan informasi pengguna yang dinyatakan dalam query. Pengguna information retrieval system sangat bervariasi sesuai dengan kebutuhan yang berbeda-beda. Salah satu cara untuk mengurutkan dokumen pada information retrieval system adalah dengan menggunakan metode Savoy, dimana harus ditentukan terlebih dahulu jumlah kata dan dokumen yang ada. Setelah itu, akan dihitung bobot dari suatu dokumen untuk mengetahui tingkat relevansi dokumen tertentu.
1
2
Setelah itu, untuk mendapatkan informasi dari dokumen yang dibutuhkan akan dilakukan teknik extended boolean sesuai P-Norm. Teknik ini akan mengurutkan dokumen yang diinginkan dan nilai P-Norm akan menentukan di urutan ke berapakah dokumen tersebut berada. Berdasarkan uraian di atas, penulis tertarik untuk melakukan penelitian dengan mengambil judul “Perancangan Information Retrieval System dengan Metode Extended Boolean dan Savoy”.
1.2.
Identifikasi Masalah Berdasarkan latar belakang di atas, maka permasalahan dalam penelitian
ini dapat dirumuskan sebagai berikut. 1.
Bagaimana menentukan indeks dari suatu dokumen.
2.
Bagaimana menentukan bobot dari suatu dokumen.
3.
Bagaimana menentukan dokumen yang relevan sesuai dengan query yang diberikan.
4.
Bagaimana merancang suatu sistem dengan menggunakan metode savoy untuk menghasilkan dokumen terurut yang sulit dikerjakan dengan perhitungan manual akibat jumlah dokumen yang banyak.
1.3.
Batasan Masalah Ruang lingkup permasalahan dalam merancang sistem ini, yaitu :
a. Teknik pengindeksan dengan istilah indeks, dimana tahapannya adalah dengan pengambilan kata dari kumpulan dokumen, pembuangan kata yang tidak perlu serta pemotongan imbuhan suatu kata menjadi bentuk dasar.
3
b. Teknik pembobotan dilakukan dengan Metode Savoy. c. Penggunaan
Extended
Boolean
disesuaikan
dengan
P-Norm
untuk
mendapatkan informasi yang dibutuhkan. d. Pengujian menggunakan file berekstensi *.doc dan *.docx dengan kapasitas maksimum 2Mb. e. Pengujian file menggunakan Bahasa Indonesia. f. Peng-input-an nilai P-Norm memiliki batasan maksimal 3 digit bilangan bulat positif agar pada saat pencarian kata tidak memakan waktu yang terlalu lama. g. Pembobotan boolean hanya menggunakan operator “OR” dan “AND” saja karena pencarian dua buah kata secara sekaligus. h. Perangkat lunak akan menampilkan hasil perbandingan dari teknik yang digunakan sebanyak 1 dokumen per halamannya karena jika dokumennya banyak maka tidak akan mencukupi untuk menampilkan secara keseluruhan. i. Hasil proses perhitungan dari perangkat lunak akan disimpan ke dalam sebuah file data dengan ekstensi *.txt. j. Hasil pencarian dapat disimpan sehingga untuk pencarian query yang sama tidak harus mengulang kembali lagi. k. Perangkat lunak dibuat dengan menggunakan bahasa pemrograman Microsoft Visual Basic 2008.
1.4.
Tujuan dan Manfaat Adapun tujuan dari penelitian ini adalah untuk merancang sebuah
information retrieval system dengan metode savoy. Manfaat yang diperoleh dari penelitian ini adalah :
4
1.
Bagi penulis Penelitian ini akan meningkatkan wawasan dan pengetahuan penulis mengenai information retrieval system dan juga meningkatkan kemampuan penulis dalam membuat aplikasi dengan menggunakan Microsoft Visual Basic.NET 2008.
2.
Bagi STMIK TIME Penelitian ini dapat dijadikan sebagai referensi bagi mahasiswa lainnya yang ingin mengangkat topik mengenai information retrieval system.
3.
Bagi masyarakat Dapat mengetahui lebih jelas dan terperinci serta dapat menambah pengetahuan
mengenai
teknik
pengindeksan dan
pembobotan
pada
information retrieval system.
1.5.
Sistematika Penulisan Rincian penulisan laporan skripsi ini meliputi beberapa bab, yaitu :
BAB I
PENDAHULUAN Bab ini membahas tentang latar belakang masalah, identifikasi masalah, batasan masalah, tujuan dan manfaat serta sistematika penulisan.
BAB II
LANDASAN TEORI Bab ini berisi tentang penjelasan singkat mengenai perancangan, sistem, pencarian, informasi, metode Extended Boolean, metode Savoy, bahasa pemrograman.
5
BAB III
METODE PENELITIAN Bab ini berisi uraian tentang tempat dan jadwal penelitian, kerangka kerja, metode pengumpulan data, analisa sistem, perancangan sistem, pembangunan sistem, dan uji coba sistem.
BAB IV
ANALISA DAN PERANCANGAN SISTEM Bab ini berisi analisa sistem, perancangan activity diagram, perancangan use case diagram, perancangan tabel pada database, perancangan menu, dan perancangan antarmuka.
BAB V
HASIL DAN PEMBAHASAN Bab ini berisi kebutuhan sistem, tampilan output sistem yang dibuat, cara penggunaan, dan hasil penelitian.
BAB VI
KESIMPULAN DAN SARAN Bab ini berisi kesimpulan dan saran terhadap penelitian yang telah dilakukan.
BAB II LANDASAN TEORI
2.1.
Perancangan Perancangan
sistem
merupakan
penggambaran,
perencanaan
dan
pembuatan sketsa atau pengaturan dari beberapa elemen yang terpisah ke dalam satu kesatuan yang utuh dan berfungsi. (Hartono, 2009: 196) Tahap perancangan sistem mempunyai dua maksud atau tujuan utama yaitu: 1. Untuk memenuhi kebutuhan pemakai sistem. 2. Untuk memberikan gambaran yang jelas dan rancang bangun yang lengkap kepada pemrograman komputer dan ahli-ahli teknik lainnya yang terlibat. Untuk memahami tujuan ini, analisa sistem harus dapat mencapai sasaransasaran sebagai berikut: 1. Perancangan sistem harus berguna, mudah dipahami dan nantinya mudah digunakan. 2. Perancangan sistem harus dapat mendukung tujuan utama perusahaan sesuai dengan yang didefiniskan pada tahap perencanaan sistem yang dilanjutkan pada tahap analisa sistem.
2.2.
Sistem Sistem berasal dari bahasa Yunani yaitu “sistema” yang artinya kesatuan.
Suatu sistem adalah jaringan kerja dari prosedur-prosedur yang saling
6
7
berhubungan, berkumpul bersama-sama untuk melakukan kegiatan atau untuk mencapai suatu sasaran tertentu. Ada berbagai macam definisi mengenai sistem. Sistem pada dasarnya adalah sekelompok unsur yang erat hubungannya satu dengan yang lain, yang berfungsi bersama-sama untuk mencapai tujuan tertentu. (Sutabri, 2010: 9) Sistem adalah jaringan kerja dari prosedur-prosedur yang saling berhubungan, berkumpul bersama-sama untuk melakukan kegiatan dalam rangka mencapai tujuan tertentu. (Baridwan, 2008: 3) Sistem mempunyai beberapa komponen, diantaranya adalah : 1. Perangkat keras, meliputi CPU, disk, terminal, printer, dan tape. 2. Perangkat lunak meliputi sistem operasi, sistem database, program pengontrol komunikasi, dan program aplikasi. 3. Personil meliputi orang yang mengoperasikan sistem, menyediakan masukan, dan melakukan aktivitas manual yang mendukung sistem. 4. Data meliputi komponen yang harus tersimpan dalam sistem selama jangka waktu tertentu. 5. Prosedur meliputi instruksi dan kebijakan untuk mengoperasikan sistem. Jadi, sistem merupakan kumpulan dari bagian-bagian atau elemen-elemen yang saling berhubungan dan terpadu untuk mencapai suatu tujuan tertentu.
2.3.
Pencarian Pencarian (searching) merupakan pekerjaan yang sering dilakukan dalam
kehidupan sehari-hari. Dalam text editor, sering dilakukan pekerjaan untuk mencari kata, atau mencari “kata1” dan menggantikannya dengan “kata2”, atau
8
mencari kata tertentu dan menghitung frekuensi kemunculan kata tersebut dalam dokumen. Windows explorer dan internet explorer dalam sistem operasi Windows menggunakan prinsip pencarian dalam melakukan pekerjaan dimaksud. Dalam ilmu komputer, metode pencarian (searching) ada bermacammacam. Secara garis besar, metode pencarian data dapat dibagi menjadi 2 bagian, yaitu: 1. Metode pencarian data tanpa penempatan data, terdiri dari: a. Metode pencarian Linier (Linear / Sequential Search) b. Metode pencarian Biner (Binary Search) c. Metode pencarian Interpolasi (Interpolation Search) 2. Metode pencarian data dengan penempatan data, terdiri dari: a. Metode pencarian Langsung (Direct Search) b. Metode pencarian Relatif (Hash Search) Masing-masing metode memiliki kelebihan dan kekurangan. Metode pencarian (searching) yang memiliki efisiensi penggunaan tempat yang lebih baik adalah metode pencarian relatif (Hash Search). (gerlan1986.files.wordpress.com/2010/03/pencarian-searching.ppt)
2.4.
Informasi Istilah informasi berasal dari bahasa Inggris ”to inform” yang artinya
dalam Bahasa Indonesia adalah ”memberitahukan”. Informasi merupakan hal yang sangat penting bagi manajemen di dalam pengambilan keputusan. Informasi merupakan bagian yang terpenting di dalam sebuah organisasi. Tanpa adanya informasi, suatu organisasi tidak mungkin bisa maju. Suatu sistem
9
yang kurang memperoleh informasi akan ketinggalan dan akhirnya berakhir. Robert N. Anthony dan John Dearden menyebut keadaan dari sistem dalam hubungannya dengan keberakhirannya dengan istilah entropy yang disebut negative entropy. (Baridwan, 2008: 4) Informasi adalah data yang sudah diproses menjadi bentuk yang berguna bagi pemakai dan mempunyai nilai pikir yang nyata bagi pembuatan keputusan pada saat sedang berjalan atau untuk prospek masa depan. Definisi tersebut menekankan kenyataan bahwa data harus diproses dengan cara-cara tertentu untuk menjadi informasi dalam bentuk dan nilai yang berguna bagi pemakai. (Amsyah, 2009: 289) Informasi merupakan suatu data yang telah diproses dan mempunyai arti tertentu. (Mcleod, 2008: 12) Sumber dari informasi adalah data. Data merupakan bentuk jamak dari bentuk tunggal data, yaitu item ataupun datum. Data adalah kenyataan yang mengambarkan suatu kejadian-kejadian dan kesatuan nyata. Kejadian-kejadian nyata yang sering terjadi adalah perubahan dari suatu nilai yang disebut dengan transaksi. Jadi, hal yang terpenting untuk membedakan informasi dengan data, informasi itu mempunyai kandungan “makna” dan data tidak mempunyai “makna”. Makna artinya output (sebagai penunjang sistem). Pengertian makna di sini merupakan hal yang sangat penting, karena berdasarkan makna inilah penerima dapat memahami informasi tersebut dan secara lebih jauh dapat menggunakannya untuk menarik suatu kesimpulan atau bahkan mengambil keputusan.
10
2.5.
Metode Metode berasal dari bahasa Yunani “Methodos” yang berarti cara atau
jalan yang ditempuh. Upaya ilmiah berhubungan dengan metode yang menyangkut masalah cara kerja untuk dapat memahami objek yang menjadi sasaran ilmu yang bersangkutan. Fungsi metode adalah sebagai alat untuk mencapai tujuan. Menurut Kamus Besar Bahasa Indonesia, metode adalah cara kerja yang bersistem untuk memudahkan pelaksanaan suatu kegiatan guna mencapai tujuan yang ditentukan. Menurut artikata.com, metode adalah cara teratur yang digunakan untuk melaksanakan suatu pekerjaan agar tercapai sesuai dengan yang dikehendaki.
2.6.
Information Retrieval System Information Retrieval System merupakan sistem yang berfungsi untuk
menemukan informasi yang relevan dengan kebutuhan pemakai. Salah satu hal yang perlu diingat adalah bahwa informasi yang diproses terkandung dalam sebuah dokumen yang bersifat tekstual. Dalam konteks ini, temu kembali informasi berkaitan dengan representasi, penyimpanan, dan akses terhadap dokumen representasi dokumen. Dokumen yang ditemukan tidak dapat dipastikan apakah relevan dengan kebutuhan informasi pengguna yang dinyatakan dalam query. Pengguna Sistem Temu Kembali sangat bervariasi dengan kebutuhan informasi yang berbeda-beda. Misalkan ada sebuah kumpulan dokumen dan seorang user yang memformulasikan sebuah pertanyaan (request atau query). Jawaban dari
11
pertanyaan tersebut adalah sekumpulan dokumen yang relevan dan membuang dokumen yang tidak relevan. Secara matematis hal tersebut dapat dituliskan sebagai berikut: Q
2n
→
D ....................................................... (2.1)
Dimana : Q = pertanyaan (query) D = dokumen n = jumlah dokumen 2n = jumlah kemungkinan himpunan bagian dari dokumen yang ditemukan Sistem Temu Kembali pada dasarnya dibagi dalam dua komponen utama yaitu sistem pengindeksan (indexing) yang menghasilkan basis data sistem dan temu kembali yang merupakan gabungan dari user interface dan look-up-table. Pada bagian selanjutnya akan dijelaskan mengenai sistem pengindeksan dan teknik temu kembali informasi. Gambar 2.1 menunjukkan ilustrasi information retrieval system.
Gambar 2.1 Ilustrasi Sistem Temu Kembali Sumber : staf.cs.ui.ac.id/TKSI/MIK%20Bab%201%20konsep%20IRS.doc
12
Sistem Temu Kembali didesain untuk menemukan dokumen atau informasi yang diperlukan oleh masyarakat pengguna. Information retrieval system bertujuan untuk menghubungkan kebutuhan informasi pengguna dengan sumber informasi yang tersedia dalam situasi sebagai berikut. 1. Penulis
mempresentasikan
sekumpulan
ide
dalam
sebuah
dokumen
menggunakan sekumpulan konsep. 2. Terdapat beberapa pengguna memerlukan ide yang dikemukakan oleh penulis tersebut, tapi mereka tidak dapat mengidentifikasikan dan menemukannya dengan baik. 3. Information retrieval system bertujuan untuk mempertemukan ide yang dikemukakan oleh penulis dalam dokumen dengan kebutuhan informasi pengguna yang dinyatakan dalam bentuk pertanyaan (query). Berkaitan dengan sumber informasi di satu sisi dan kebutuhan informasi pengguna di sisi yang lain, information retrieval system berperan untuk: 1. Menganalisa isi sumber informasi dan pertanyaan pengguna. 2. Mempertemukan pertanyaan pengguna dengan sumber informasi untuk mendapatkan dokumen yang relevan. Adapun fungsi utama information retrieval system adalah sebagai berikut. 1. Mengidentifikasi sumber informasi yang relevan dengan minat masyarakat pengguna yang ditargetkan. 2. Menganalisa isi sumber informasi (dokumen). 3. Merepresentasikan isi sumber informasi dengan cara tertentu yang memungkinkan untuk dipertemukan dengan pertanyaan (query) pengguna.
13
4. Merepresentasikan pertanyaan (query) pengguna dengan cara tertentu yang memungkinkan untuk dipertemukan sumber informasi yang terdapat dalam basis data. 5. Mempertemukan pernyataan pencarian dengan data yang tersimpan dalam basis data. 6. Menemu-kembalikan informasi yang relevan. 7. Menyempurnakan unjuk kerja sistem berdasarkan umpan balik yang diberikan oleh pengguna. Information retrieval system terdiri dari 6 (enam) subsistem, yaitu: 1. Subsistem dokumen 2. Subsistem pengindeksan 3. Subsistem kosa kata 4. Subsistem pencarian 5. Subsistem antarmuka pengguna-sistem 6. Subsistem penyesuaian Dokumen sebagai objek data dalam Information retrieval system merupakan sumber informasi. Dokumen biasanya dinyatakan dalam bentuk indeks atau kata kunci. Kata kunci dapat diekstrak secara langsung dari teks dokumen atau ditentukan secara khusus oleh spesialis subjek dalam proses pengindeksan yang pada dasarnya terdiri dari proses analisa dan representasi dokumen. Pengindeksan dilakukan dengan menggunakan sistem pengindeksan tertentu, yaitu himpunan kosa kata yang dapat dijadikan sebagai bahasa indeks sehingga diperoleh informasi yang terorganisasi. Sementara itu, pencarian diawali dengan adanya kebutuhan informasi pengguna. Dalam hal ini, Information
14
retrieval system berfungsi untuk menganalisa pertanyaan (query) pengguna yang merupakan representasi dari kebutuhan informasi untuk mendapatkan pernyataanpernyataan pencarian yang tepat. Selanjutnya pernyataan-pernyataan pencarian tersebut dipertemukan dengan informasi yang telah terorganisasi dengan suatu fungsi penyesuaian (matching function) tertentu sehingga ditemukan dokumen atau sekumpulan dokumen (http://repository.ui.ac.id/dokumen/lihat/6396.pdf). Proses tersebut di atas dapat diilustrasikan pada gambar 2.2
Gambar 2.2 Outline Information Retrieval System Sumber : http://repository.ui.ac.id/dokumen/lihat/6396.pdf
Sementara itu, Information retrieval system dapat juga didefinisikan sebagai suatu proses yang terdiri dari 6 (enam) komponen utama yaitu: 1. Kumpulan dokumen 2. Pengindeksan 3. Kebutuhan informasi pemakai 4. Strategi pencarian 5. Kumpulan dokumen yang ditemukan
15
6. Penilaian relevansi Secara garis besar komponen - komponen information retrieval system dapat diilustrasikan pada gambar 2.3
Gambar 2.3 Komponen Information Retrieval System Sumber : http://repository.ui.ac.id/dokumen/lihat/6396.pdf
Proses pencarian informasi terjadi interaksi antara pengguna dengan sistem (mesin), baik secara langsung maupun tidak langsung. Interaksi antara pengguna dengan sistem dalam proses pencarian informasi dapat dinyatakan seperti pada gambar 2.4
16
Gambar 2.4 Interaksi antara Pengguna dengan Sistem Sumber : http://repository.ui.ac.id/dokumen/lihat/6396.pdf
2.7.
Metode Extended Boolean Model Extended Boolean berdasarkan model P-norm merupakan
pengembangan lebih lanjut dari model Boolean. Teknik ini memakai operator yang dikomputasi berdasarkan rumus Savoy (1993). Rumus masing-masing operator dapat dilihat pada tabel 2.2 Tabel 2.1 Teknik P-Norm Query
Retrieval Status Value (RSV)
A or
B
Wia + Wib RSVor = 2 p
p
p
A and
B
Not A
RSVand = 1 − p
(1 − Wia ) p + (1 − Wib ) p 2
RSVnot = 1 − Wia
17
Dimana : a. p adalah sebuah nilai yang dimasukkan pada query b. Wia adalah bobot istilah A dalam indeks pada dokumen Di c. Wib adalah bobot istilah B dalam indeks pada dokumen Di Untuk menentukan peringkat dapat dilakukan dengan dua cara, yaitu: 1.
Langsung mengurutkan dokumen (descending) berdasarkan bobot dokumen yang didapat dengan rumus Retrieval Status Value (RSV).
2.
Memakai rumus Learning Scheme : r
RSV(D i ) = RSVinit (D i ) + ∑ α ik ∫ norm * RSVinit (D k ) k =1
untuk i = 1, 2, ..., n
……………….. (2.2)
dimana : a. RSVinit(Di)
merupakan retrieval status value dari dokumen Di yang
dikomputasi berdasarkan rumus teknik retrieval P-norm model. b. ∝ik merupakan bobot keterhubungan antara dokumen i dan k. Bobot ketergantungan ini diperoleh dari nilai relevance link yang merupakan hasil dari proses pembelajaran.
2.8.
Metode Savoy Nama lengkap Savoy adalah Profesor Jacques Savoy. Berikut adalah
riwayat hidup dari beliau. a. Sejak 1992 : Profesor di University of Neuchatel, Fakultas Hukum dan Ilmu Ekonomi. Kunjungan profesor di Universitas Freiburg dan Universitas Jenewa (CESID).
18
b. 1992 : Asisten Profesor di University of Montreal, Fakultas Graduate Studies, Departemen Ilmu Komputer dan Riset Operasional. c. 1989-1991 : Asisten Profesor di University of Montreal, Departemen Ilmu Komputer dan Penelitian Operasional (lab incognito). d. 1987-1989 : Fellow penelitian dari Swiss Dana Nasional untuk Penelitian Ilmiah di University of Montreal. e. 1987 : Dr rer. pol. (Referensi : Summa cum laude), University of Freibourg. f. 1987 : Peluncuran pertama sistem hypertext francophone. g. 1982 : Sarjana
rer. pol. (Referensi :Summa cum laude), University of
Freiburg. Adapun kegiatan penelitiannya adalah sebagai penulis berbagai publikasi mengenai informasi dan khususnya tentang informasi di dalam hypertext, dan khususnya di Web, digunakan pendekatan yang logis serta analisa statistik dari hasil pencarian. Di dalam memberikan bobot pada sebuah istilah, terdapat berbagai macam teknik pembobotan. Teknik pembobotan berdasarkan rumus Savoy (1993), merepresentasikan bobot (Wik) dari setiap istilah k, dimana k=1, 2, …., t; dalam sebuah dokumen i adalah:
n Wik = tf ik * log = tf ik * idf k ; df k
Keterangan : a. Wik adalah bobot dari istilah k dalam dokumen i b. tfik adalah frekuensi dari istilah k dalam dokumen i.
……………….. (2.3)
19
c. n adalah jumlah dokumen dalam kumpulan dokumen. d. dfk adalah jumlah dokumen yang mengandung istilah k. Rumus di atas terdiri dari dua komponen yaitu tfik dan dfk, dimana kedua komponen ini dinormalisasi dalam rentang [0, 1], menjadi :
Wik = ntf ik * nidf k ……………………………….. (2.4) dimana :
ntf ik =
tf ik Max j tf ij
dan
n log df k ……. (2.5) nidf k = log( n)
dimana Maxjtfij adalah frekuensi istilah terbesar pada satu dokumen. Pada teknik pembobotan ini, bobot istilah telah dinormalisasi, dengan mempertimbangkan frekuensi kemunculan istilah di satu dokumen, tetapi juga memperhatikan frekuensi terbesar pada suatu istilah-istilah lain di dokumen yang sama. Selain itu, teknik ini juga memperhitungkan jumlah dokumen yang mengandung istilah yang bersangkutan dan jumlah keseluruhan dokumen. Hal ini berguna untuk mengetahui posisi relatif bobot istilah bersangkutan pada suatu dokumen dibandingkan dengan dokumen-dokumen lain yang memiliki istilah yang sama. Ini berarti, jika sebuah istilah mempunyai frekuensi kemunculan yang sama pada dua dokumen, belum tentu mempunyai bobot yang sama.
ntf k =
15 =1 15
1162 log 8 = 0,705373 nidf k = log(1162 )
Wik = 1 * 0,705373 = 0,705373
20
2.9.
Bahasa Pemrograman Bahasa pemrograman berdasarkan tingkat ketergantungannya dengan
mesin bisa meliputi: 1. Machine-code languages Merupakan bentuk terendah dari bahasa komputer. Setiap instruksi dalam program direpresentasikan dengan kode numerik, yang secara fisik berupa deretan angka 0 dan 1. Sekumpulan instruksi dalam bahasa mesin bisa dibentuk menjadi microcode, yaitu semacam prosedur dalam bahasa mesin. 2. Assembly languages Merupakan bentuk simbolik dari bahasa mesin. Setiap kode memiliki kode simbolik, misalnya ADD untuk penjumlahan (addition) dan MUL untuk perkalian (multiplication). Pada bahasa assembly tersedia alat bantu untuk diagnostik (debug) yang tidak terdapat pada bahasa mesin. contoh software yang ada untuk pengembangan dan debug bahasa assembly seperti Turbo
Assembler dari Borland, Macro Assembler dari Microsoft, Turbo Debugger. 3. High-level languages Disebut tingkat tinggi karena lebih dekat dengan manusia. Memberikan fasilitas yang lebih mudah, serta mudah dimengerti dan dipelajari oleh pengguna. Pengguna tidak perlu mengetahui bagaimana representasi data ke dalam bentuk internal di memori, karena pekerjaan tersebut ditangani oleh suatu sistem yang mentranslasikan program bahasa tingkat tinggi ke dalam bahasa mesin. contohnya Pascal, Visual Basic.
21
4. Problem-oriented language Memungkinkan penyelesaian untuk suatu masalah atau aplikasi yang spesifik, contohnya Structured Query Language (SQL) untuk aplikasi database, Query
by Example (QBE). (Junindar, 2008: 3) Visual Basic.NET adalah generasi selanjutnya dari Visual Basic. Visual
Basic.Net memungkinkan kita untuk membangun aplikasi database client atau server performa tinggi dan sangat cocok didampingkan dengan perangkat lunak SQL Server 2000. Pemilihan Visual Basic.NET sebagai program pengembang sistem ini adalah karena merupakan salah satu program aplikasi yang berada di bawah
platform .NET framework.
BAB III METODE PENELITIAN
3.1.
Tempat dan Jadwal Penelitian Penelitian dimulai dari tanggal 01 Desember 2014 dan berakhir pada
tanggal 30 April 2015. Tabel 3.1 Jadwal Penelitian Waktu Kegiatan Identifikasi Masalah
Desember Januari Februari Maret April 2014 2015 2015 2015 2015 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
Pengumpulan Data Analisa Sistem Perancangan Sistem Pembangunan Sistem Uji coba Sistem Penulisan Laporan Skripsi
3.2.
Kerangka Kerja Adapun kerangka kerja yang dibuat penulis seperti gambar 3.1. Identifikasi Masalah Pengumpulan Data Analisa Sistem Perancangan Sistem Pembangunan Sistem Uji Coba Sistem Gambar 3.1 Kerangka Kerja Penelitian
22
23
3.2.1. Metode Pengumpulan Data Teknik pengumpulan data dapat didefinisikan sebagai suatu cara yang digunakan untuk memperoleh data yang dibutuhkan sebagai bahan masukan bagi penulis dalam penyusunan skripsi ini. Proses dimulai dengan mengumpulkan data yang diperlukan dalam penelitian. Adapun metode pengumpulan data dalam penelitian dilakukan melalui Penelitian Kepustakaan (library research), yaitu penulis mengumpulkan data melalui internet dan buku-buku yang relevan yang berhubungan dengan topik yang dibahas, seperti buku Analisa Sistem Informasi karya Tata Sutabri dan Modern Information Retrieval karya Ricardo Baeza-Yates, Berthier Ribeiro-Neto.
Pencarian pada internet dapat menggunakan keyword information retrieval system dan metode Savoy.
3.2.2. Analisa Sistem Pada sistem operasi Windows, terdapat fasilitas pencarian file dengan menggunakan kata pencarian (keyword). Output yang dihasilkan berupa kumpulan file yang isinya mengandung kata pencarian yang dimasukkan. Namun, output yang dihasilkan tersebut tidak diurutkan berdasarkan derajat hubungan dari isi file dengan kata pencarian. Untuk itu, maka diperlukan sebuah information retrieval system. Proses analisa terhadap sistem tersebut akan dimulai dari proses pembacaan data input. Setelah itu, proses dilanjutkan dengan menampilkan langkah kerja proses perhitungan dengan menggunakan metode Extended Boolean dan Savoy. Terakhir, akan ditampilkan hasil perhitungan yang diperoleh.
24
3.2.3. Perancangan Sistem Perancangan perangkat lunak akan menggunakan metode Object Oriented Diagram (OOD). OOD adalah metode untuk mengarahkan arsitektur software yang didasarkan pada manipulasi objek-objek sistem atau subsistem. Objek oriented dekomposisi dan notasi untuk menggambarkan model dari sistem yang sedang dikembangkan. Struktur dikembangkan set objek dimana berkolaborasi untuk menyediakan perilaku yang memenuhi persyaratan dari masalah. Untuk melaksanakan OOD, ada beberapa langkah umum yang seharusnya dilakukan : a.
Gambarkan setiap subsistem dan alokasinya pada processor dan task.
b.
Pilih sebuah strategi desain untuk mengimplementasikan manajemen data, interface support, dan manajemen task.
c.
Desain suatu mekanisme kontrol yang tepat untuk sistem
d.
Lakukan desain objek dengan membuat suatu representasi prosedural untuk setiap operasi dan struktur data untuk setiap atribut klas.
e.
Lakukan desain message menggunakan kolaborasi di antara objek-objek dan hubungan objek (object relationships).
f.
Buat messaging model.
g.
Tinjau model desain dan ulangi jika dibutuhkan. Flowchart sistem usulan yang dibuat dapat digambarkan seperti terlihat
pada gambar 3.2
25
Start
Input kata pencarian
Input nilai p
Input lokasi pencarian
Hitung frekwensi kata dalam dokumen Hitung frekwensi terbesar 1 dokumen Hitung jumlah seluruh dokumen Jumlah dokumen yang mengandung kata yang dicari
If dicari bobot dokumen sesuai operator then
Tidak
Ya
Masukkan dokumen sebagai kandidat
Urutkan dokumen kandidat
End
Gambar 3.2 Flowchart Sistem Usulan
3.2.4. Pembangunan Sistem Proses dilanjutkan dengan melakukan coding terhadap perangkat lunak untuk melakukan koneksi ke database. Setelah itu, proses dilanjutkan dengan
26
merancang laporan yang diperlukan dengan menggunakan aplikasi Crystal Report 10. Jenis koneksi (data source) yang digunakan adalah koneksi Data Active Object (DAO). Sistem dibuat dengan menggunakan bahasa pemrograman Microsoft Visual Basic 2008 dan laporan dirancang dengan menggunakan aplikasi Crystal Report 10 dan database dirancang dengan aplikasi Microsoft Access 2007.
3.2.5. Uji Coba Sistem Proses dilanjutkan dengan melakukan coding terhadap perangkat lunak untuk melakukan koneksi ke database dan melakukan proses testing and debugging terhadap coding yang dirancang tersebut. Proses diakhiri dengan melakukan proses passing data dari Microsoft Visual Basic 2008 ke aplikasi Crystal Report 10 untuk menampilkan laporannya. Koneksi yang digunakan untuk melakukan passing data adalah koneksi Data Active Object (DAO). Dalam proses perancangan perangkat lunak juga diperlukan beberapa buah gambar yang digunakan sebagai dekorasi pada tombol dan icon dari perangkat lunak. Gambar-gambar tersebut dicari dari berbagai sumber seperti internet, buku teks, majalah dan sebagainya. Gambar tersebut diedit dan disimpan dengan menggunakan aplikasi Adobe Photoshop CS dengan format *.gif.
27
BAB IV ANALISA DAN PERANCANGAN
4.1.
Analisa Sebelum merancang information retrieval system ini, maka terlebih dahulu
perlu dilakukan proses analisa terhadap permasalahan yang muncul, analisa persyaratan yang harus dipenuhi oleh sistem, analisa proses dan pemodelan sistem. Hal ini dilakukan agar sistem yang dirancang dapat sesuai dengan kebutuhan yang diinginkan. Secara umum sistem yang akan dibangun adalah menggunakan metode Savoy, yaitu suatu metode yang bertujuan untuk menentukan bobot dari suatu dokumen dan mengurutkannya berdasarkan nilai indeksnya. Sistem ini akan dibangun menjadi sebuah alat bantu yang berkaitan dengan masalah pencarian kata didalam dokumen. Sistem ini dapat mempermudah proses pencarian kata yang
diinginkan
serta
untuk
mempermudah
pengelompokkan
dokumen
berdasarkan nilai indeksnya. Contoh sederhana berikut dapat digunakn untuk membantu pemahaman mengenai prosedur kerja dari metode Savoy, misalkan terdapat dua buah dokumen yang akan dilakukan pembobotan dan pengindeksan. Isi dari kedua dokumen yang digunakan tersebut dapat dirincikan sebagai berikut: File 1 : File1.doc Penelitian di Florida telah menemukan bahwa senyawa alami dalam buah semangka, yaitu citrulline, yang membantu melebarkan dan merilekskan pembuluh darah, sehingga jantung tidak harus bekerja keras untuk memompa
28
darah ke seluruh tubuh. Penelitian lain dari University Kentucky juga menunjukkan bahwa semangka baik dikonsumsi untuk menjaga berat badan dan membantu kesehatan jantung.
File 2 : File2.doc Melon dan semangka memiliki kandungan air yang cukup banyak sehingga baik untuk mengatasi dehidrasi. Sayangnya, kandungan gula dalam keduanya cukup tinggi (Indeks glikemik mencapai 65-100 persen), sehingga sangat tidak disarankan bagi mereka yang memiliki diabetes atau memiliki riwayat keluarga penderita diabetes untuk mengonsumsi buah ini.
Misalkan kata yang ingin dicari adalah: ‘melon’ dan ‘semangka’, maka proses perhitungannya adalah sebagai berikut: Jumlah File : melon = 1 (df1) semangka = 2 (df2)
File 1 : melon = 0 semangka = 2
File 2 : melon = 1 semangka = 1
29
Jumlah keseluruhan File (n) : 2 Nilai p = 100
Proses penyelesaian : File 1 : melon : log(n/dfk) = log(2/1) = 0.3010299956639812
nidfk1 = 0.3010299956639812 / log(2) = 1 keterangan : a. n adalah jumlah dokumen dalam kumpulan dokumen. b. dfk adalah jumlah dokumen yang mengandung istilah k. c. nidfk1 adalah normalisasi jumlah dokumen yang mengandung istilah k.
ntfk1 = 0/2 = 0 keterangan : a. tfik adalah frekwensi dari istilah k dalam dokumen i. b. ntfk1 adalah normalisasi frekwensi dari istilah k dalam dokumen i. c. Maxjtfij adalah frekwensi istilah terbesar pada satu dokumen. d. Wik adalah bobot dari istilah k dalam dokumen i
30
Wik = ntf ik * nidf k w1 = 0 x 1 = 0 semangka : log(n/dfk) = log (2/2) = 0
nidfk2 = 0 / log (2) = 0
ntfk1 = 2/2 = 1 Wik = ntf ik * nidf k w2 = 0.1 x 0 = 0 RSV = 1 – (((1 – w1)p + (1 – w2)p) / 2)1/np RSV = 1 – (((1 – 0)100 + (1 – 0)100 / 2)1/100 RSV = 0 Keterangan : a. RSVinit(Di)
merupakan retrieval status value dari dokumen Di yang
dikomputasi berdasarkan rumus teknik retrieval P-norm model. b. ∝ik merupakan bobot keterhubungan antara dokumen i dan k. Bobot ketergantungan ini didapat dari nilai relevance link yang merupakan hasil dari proses pembelajaran.
31
File 2 : melon : log(n/dfk) = log(2/1) = 0.3010299956639812
nidfk1 = 0.3010299956639812 / log(2) = 1
ntfk1 = 2/2 = 1 Wik = ntf ik * nidf k w1 = 1 x 1 = 1
semangka : log(n/dfk) = log (2/2) = 0
nidfk2 = 0 / log (2) = 0
ntfk2 = 1/2 = 0.5
32
Wik = ntf ik * nidf k w2 = 0.5 x 0 = 0
RSV = 1 – (((1 – w1)p + (1 – w2)p) / 2)1/np RSV = 1 – (((1 – 1)100 + (1 – 0)100 / 2)1/100 RSV = 0.006907504562964073
Berdasarkan nilai RSV yang diperoleh maka dokumen dapat diurutkan sebagai berikut: 1. File 2 : File2.txt 2. File 1 : File1.txt
4.2.
Perancangan Untuk menggambarkan dan memodelkan sistem yang dibuat, maka dapat
digunakan beberapa diagram Unified Modeling Language (UML), yang mencakup activity diagram dan use case diagram.
4.2.1. Perancangan Proses Untuk menggambarkan prosedur kerja dari sistem, maka akan digunakan activity diagram. Gambar 4.1 berikut menunjukkan activity diagram dari information retrieval system yang dibuat.
33
User
Sistem
Meng-input lokasi pencarian
Menampilkan lokasi pencarian yang dipilih
Meng-input kata kunci yang dicari Menentukan fungsi logika pencarian
Menentukan nilai p
Menghitung jumlah kemunculan kata dalam dokumen Menghitung jumlah kemunculan kata terbesar 1 dokumen Menghitung jumlah seluruh dokumen Menghitung jumlah dokumen yang mengandung kata yang dicari If dicari bobot dokumen sesuai operator then Tidak Ya
Masukkan dokumen sebagai kandidat
Urutkan dokumen kandidat
Gambar 4.1 Activity Diagram
Aktor yang terlibat dalam sistem ini hanya satu yaitu pemakai. Gambar 4.2 use case diagram dari sistem.
34
Gambar 4.2 Use Case Diagram
4.2.2. Perancangan Tabel pada Database Tabel 4.1 merincikan database yang digunakan pada sistem. Rincian dari database yang terdapat pada data flow diagram dari sistem ini dapat dilihat pada table 4.1 Tabel 4.1 Tabel Database Atribut
Tipe Data
Ukuran Data
Keterangan
Nfile
Text
25
Nama File
Nindeks
Number
10
Nilai Indeks
Jkata
Number
10
Jumlah Kata
NP
Number
10
Nilai P
ID
Text
10
Nomor ID
35
4.2.3. Perancangan Antarmuka Antarmuka ini dirancang menggunakan bahasa pemrograman Visual Basic 2008. Dalam antarmuka sistem ini terdapat beberapa form, yaitu : 1.
Form Open
2.
Form Teori
3.
Form Input Data
4.
Form Proses
5.
Form Setting
6.
Form Tabel Berikut ini adalah penjelasan mengenai form-form yang terdapat pada
perancangan antamuka, yaitu : 1.
Form Open Gambar 4.3 menunjukkan rancangan form Open.
Gambar 4.3 Rancangan Form Open Keterangan : 1. Button Exit, digunakan untuk keluar dari form open.
36
2. Text, digunakan untuk memberikan informasi mengenai file yang dimunculkan. 2.
Form Teori Gambar 4.4 menunjukkan rancangan form Teori.
Gambar 4.4 Rancangan Form Teori
Keterangan : 1. Button Back, digunakan untuk kembali kehalaman sebelumya. 2. Button Next, digunakan untuk lanjut kehalaman berikutnya. 3. Button Exit, digunakan untuk keluar dari form teori. 4. Text, digunakan untuk memberikan informasi mengenai teori dari information retrieval dan metode savoy. 3.
Form Input Data Gambar 4.5 menunjukkan rancangan form Input Data.
37
Gambar 4.5 Rancangan Form Input Data
Keterangan : 1. Textbox, digunakan untuk menampilkan lokasi folder yang dicari. 2. Button Tambahkan ke List, digunakan untuk menambahkan folder yang diinginkan kedalam list sistem. 3. Button Search, digunakan untuk memilih dan mengambil folder yang diinginkan. 4. Button Hapus dari List, digunakan untuk menghapus folder yang telah dipilih. 5. Rich Textbox, digunakan untuk menampilkan banyaknya folder yang telah dipilih. 6. Button Keluar, digunakan untuk keluar dari proses input data. 7. Button Proses, digunakan untuk melakukan proses penyimpanan data sementara untuk dapat dipergunakan kembali. 8. Check list, digunakan memilih apakah semua isi subfolder yang berekstensi .doc akan diproses atau hanya isi folder saja.
38
4.
Form Proses Gambar 4.6 menunjukkan rancangan form Proses.
Gambar 4.6 Rancangan Form Proses Keterangan : 1. Check list, digunakan untuk memilih apakah kata yang dicari ingin secara utuh atau berdasarkan huruf besar dan huruf kecil. 2. Progress bar, digunakan untuk mengetahui waktu pemrosesan. 3. Button Tampil, digunakan untuk menampilkan dokumen apa saja yang akan diproses oleh sistem. 4. Button Cari, digunakan untuk mencari kata yang diinginkan dan akan diurutkan berdasarkan nilai indeksnya. 5. Button Batal, digunakan untuk membatalkan proses kerja sistem ini. 6. Label, digunakan untuk menampilkan nama file, isi file, lokasi file, nilai indeks dan jumlah kata. 7. Button Next Page, digunakan untuk melanjutkan kehalaman berikutnya.
39
8. Button Back Page, digunakan untuk kembali kehalaman sebelumnya. 9. Button Show tabel, digunakan untuk menampilkan tabel hasil pencarian kata. 10. Combo box, digunakan untuk menampilkan jumlah halaman dan dapat dipilih untuk melompat kehalaman yang diinginkan. 5.
Form Setting Gambar 4.7 menunjukkan rancangan form Setting.
Gambar 4.7 Rancangan Form Setting
Keterangan : 1. Rich Textbox, digunakan untuk menampilkan dokumen yang telah dipilih untuk diproses nantinya. 2. Button Keluar, digunakan untuk keluar dari menu form setting. 6.
Form Tabel Gambar 4.8 menunjukkan rancangan form Tabel.
40
Gambar 4.8 Rancangan Form Tabel
Keterangan : 1. Nilai P, digunakan untuk menginput banyaknya jumlah P yang ingin dicari. 2. Hasil, digunakan untuk mengetahui informasi mengenai nama file, jumlah kata1 dan kata2 serta nilai indeks. 3. Button Simpan, digunakan untuk menyimpan data yang telah diproses. 4. Button Buka, digunakan untuk membuka data yang telah disimpan sebelumnya. 5. Button Proses, digunakan untuk menjalankan proses dari sistem tersebut. 6. Button Exit, digunakan untuk keluar dari form tabel ini.
41
BAB V HASIL DAN PEMBAHASAN
5.1
Hasil Saat sistem ini dijalankan, maka akan muncul tampilan menu utama
seperti .ada gambar 5.1
Gambar 5.1 Tampilan Menu Utama
Gambar 5.1, terdapat 3 menu utama, yaitu menu teori, menu penemuan kembali dan menu keluar. Dalam menu teori terdapat 2 sub menu, yaitu information retrieval dan metode savoy. Untuk mengetahui teori dari information retrieval dan metode savoy, pengguna dapat memilih menu teori. Untuk menjalankan program dapat memilih menu penemuan kembali, dimana pada saat memilih menu tersebut, pengguna akan meng-input lokasi dari folder yang akan digunakan. Setelah itu, akan
42
dilakukan proses penginputan kata dan nilai P maka hasilnya akan langsung dimunculkan. Untuk pencarian nilai P yang banyak maka pengguna harus memilih menu tampilkan tabel yang ada didalam sistem. Untuk mengetahui mengenai pembuat dapat memilih menu mengenai dan untuk keluar dari program dapat memilih menu keluar. Untuk penjelasan lebih lanjut dapat dilihat pada tampilan form seperti ditunjukkan gambar 5.2
Gambar 5.2 Tampilan Form Teori Information Retrieval System Halaman 1 dari 4
43
Gambar 5.3 Tampilan Form Teori Information Retrieval System Halaman 2 dari 4
Gambar 5.4 Tampilan Form Teori Information Retrieval System Halaman 3 dari 4
44
Gambar 5.5 Tampilan Form Teori Information Retrieval System Halaman 4 dari 4 Pada Form teori ini, pengguna dapat mengetahui informasi mengenai information retrieval dan metode savoy dengan cara memilih menu teori dan mengklik salah satu dari kedua submenu yang ada. Untuk meng-input data dan setting, pengguna memilih menu retrieval system seperti ditunjukkan gambar 5.6
45
Gambar 5.6 Tampilan Form Input Data
Pada form input data ini, pengguna akan mencari folder-folder mana saja yang diperlukan dan mengklik folder tersebut untuk diproses oleh sistem. Untuk mengecek secara keseluruhan isi dokumen maka pengguna harus menandai checkbox yang ada disudut kiri bawah form yang bertuliskan “Cek semua subfolder didalamnya” karena jika tidak menandainya, maka dokumen yang ada didalam subfolder tidak akan diproses juga. Setelah itu, pengguna mengklik button proses untuk menjalankannya.
46
Gambar 5.7 Tampilan Form Kumpulan File
Gambar 5.7 menunjukkan kumpulan-kumpulan file yang ada di dalam folder yang telah dipilih oleh pengguna untuk diproses. Di dalam folder ini terdapat data mengenai lokasi dokumen dan nama dokumen yang hanya berekstensi .doc. Untuk keluar dari proses ini, pengguna dapat mengklik button keluar.
Gambar 5.8 Tampilan Form Proses
47
Pada form proses seperti ditampilkan oleh gambar 5.8, pengguna akan meng-input nilai P dan kata-kata apa saja yang akan dicari serta operator-operator mana yang akan digunakan. Setelah itu, pengguna akan mengklik button cari dan sistem akan menjalankan prosesnya dan akan memunculkan hasil pencariannya, yaitu sistem akan memunculkan nama dokumen, lokasi dari file tersebut, nilai indeksnya serta jumlah kata yang terdapat pada dokumen tersebut yang sudah diurutkan berdasarkan nilai indeks dari yang terbesar ke yang paling kecil. Untuk melihat halaman berikutnya, pengguna dapat mengklik button halaman berikutnya dan jika pengguna ingin melihat secara acak halamannya maka dapat memilih untuk melihat dari button untuk lompat ke halaman yang diinginkan.
Gambar 5.9 Tampilan Form Open
Pada form open seperti ditampilkan oleh gambar 5.9, sistem akan menampilkan isi file dari dokumen yang telah dipilih oleh pengguna yang
48
kemudian hasilnya dapat dilihat oleh pengguna. Untuk keluar dari form ini, pengguna dapat mengklik button keluar yang ada di dalam sistem.
Gambar 5.10 Tampilan Form Tabel
Form tabel seperti ditampilkan oleh gambar 5.10, berfungsi untuk menampilkan hasil pencarian nilai P dalam jumlah banyak. Di sini, pengguna dapat menginput nilai P sesuai dengan keinginan ataupun sebanyak yang diinginkan oleh pengguna dan hasilnya akan langsung dimunculkan pada tabel ini. Dimana tabel ini akan menampilkan nama file, jumlah kata1, jumlah kata 2, dan nilai indeks berdasarkan nilai P. Setelah itu, pengguna dapat menyimpan file tersebut dengan mengklik button simpan. Untuk membuka file yang yang telah disimpan, pengguna dapat mengklik button buka.
5.2
Pembahasan Berdasarkan proses pengujian yang dilakukan, maka dapat diperoleh
informasi berikut.
49
1.
Nilai p yang berbeda dapat mempengaruhi tingkat relevansi dari suatu dokumen.
2.
Operator “OR” akan menghasilkan nilai indeks yang jauh lebih besar dari pada nilai indeks yang dihasilkan oleh operator “AND”. Dengan menggunakan operator “OR” maka hasil yang diperoleh merupakan dokumen yang memiliki salah satu atau kedua kata yang dicari;
3.
Operator “AND” akan menghasilkan nilai indeks yang lebih kecil daripada nilai indeks yang dihasilkan oleh operator “OR”. Dengan menggunakan operator “AND” maka hasil yang diperoleh merupakan dokumen yang memiliki kedua kata yang dicari;
4.
Hasil uji coba untuk operator “AND“ menunjukkan bahwa semakin tinggi nilai p menyebabkan nilai bobot dokumen semakin menurun. Karena nilai rentang untuk bobot [0,1] maka semakin tinggi nilai p mengakibatkan nilai bobot mendekati “0”. Dengan kata lain untuk p mendekati ∞ (tak hingga) mengakibatkan nilai bobot akan sama dengan 0. Tentu hal ini akan mempengaruhi tingkat relevansi dokumen. Demikian juga, karena rentang nilai bobot [0,1], maka nilai bobot yang lebih kecil bila dipangkatkan dengan nilai p-norm yang semakin besar akan menghasilkan nilai bobot yang semakin kecil, sehingga rumus RSV dari p-norm akan dipengaruhi oleh bobot istilah yang terbesar.
50
BAB VI KESIMPULAN DAN SARAN
6.1
Kesimpulan Setelah menyelesaikan penelitian pada skripsi ini, maka dapat ditarik
beberapa kesimpulan berikut: 1. Dengan menggunakan information retrieval system, maka dapat dilakukan pencarian dokumen yang relevan dengan kata kunci yang dimasukkan. 2. Aplikasi dapat digunakan untuk menghitung indeks dan bobot dari suatu dokumen. 3. Aplikasi yang dibuat dapat menerapkan metode Savoy untuk menghasilkan dokumen terurut yang sulit dikerjakan dengan perhitungan manual akibat jumlah dokumen yang banyak. 4. Keunggulan dari program yang dibuat mencakup: a. Program dapat digunakan untuk menguji pengaruh nilai p terhadap hasil pencarian. b. Program mampu melakukan pencarian terhadap file berekstensi *.txt dan *.doc. 5. Operator “OR” akan menghasilkan nilai indeks yang jauh lebih besar daripada nilai indeks yang dihasilkan oleh operator “AND”. Dengan menggunakan operator “OR” maka hasil yang diperoleh merupakan dokumen yang memiliki salah satu atau kedua kata yang dicari. 6. Operator “AND” akan menghasilkan nilai indeks yang lebih kecil daripada nilai indeks yang dihasilkan oleh operator “OR”. Dengan menggunakan
51
operator “AND” maka hasil yang diperoleh merupakan dokumen yang memiliki kedua kata yang dicari; 7. Untuk operator “AND“ pada metode Savoy, semakin tinggi nilai p menyebabkan nilai bobot dokumen semakin menurun.
6.2
Saran Beberapa saran yang berhubungan dengan pengembangan sistem lebih
lanjut adalah: 1. Untuk menemukan informasi yang akan dicari, user sebaiknya menggunakan rumus Savoy karena akan lebih memudahkan dan mempersingkat proses pencarian informasinya. 2. Perlu dicari teknik-teknik lain untuk memperbaiki kinerja teknik frekuensi dan savoy. 3. Perlu dikembangkan atau dicari alternatif lain untuk teknik Boolean peringkat dan extended Boolean.
DAFTAR PUSTAKA
Amsyah, Zulkifli, 2009, Manajemen Sistem Informasi, PT. Gramedia Pustaka Utama. Assauri, Sofyan, 2009, Manajemen Pemasaran (Dasar, Konsep dan Strategi), Penerbit PT. Grafindo Persada, Jakarta. Baridwan, Z. 2008, Sistem Akuntansi Penyusunan Prosedur dan Metode, Cetakan Kelima, Edisi Kelima, Penerbit BPFE, Yogyakarta. Hartono J, 2009, Analisis dan Desain Sistem Informasi, Penerbit Andi Offset, Yogyakarta. Junindar, 2008, Panduan Lengkap Menjadi Programmer Membuat Aplikasi Penjualan Menggunakan VB.Net. Cetakan ke-3. Media Kita, Jakarta. McLeod, Jr. R., 2008, Sistem Informasi Manajemen, Jilid 1, Edisi 7, Prenhallindo, Jakarta. Sutabri, T., 2010, Analisa Sistem Informasi, Andi Offset, Yogyakarta. gerlan1986.files.wordpress.com/2010/03/pencarian-searching.ppt http://repository.ui.ac.id/dokumen/lihat/6396.pdf http://www.cs.ui.ac.id/WebKuliah/textpro/PT08-MODEL.pdf
staf.cs.ui.ac.id/TKSI/MIK%20Bab%201%20konsep%20IRS.doc