ANALISIS DAN IMPLEMENTASI METODE LATENT SEMANTIC INDEXING PADA SISTEM PENCARIAN DOKUMEN
SKRIPSI
ARIANI 071401022
PROGRAM STUDI S1 ILMU KOMPUTER DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2011
Universitas Sumatera Utara
ANALISIS DAN IMPLEMENTASI METODE LATENT SEMANTIC INDEXING PADA SISTEM PENCARIAN DOKUMEN
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Komputer
ARIANI 071401022
PROGRAM STUDI S1 ILMU KOMPUTER DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN 2011
Universitas Sumatera Utara
PERSETUJUAN
Judul
Kategori Nama Nomor Induk Mahasiswa Program Studi Departemen Fakultas
: ANALISIS DAN IMPLEMENTASI METODE LATENT SEMANTIC INDEXING PADA SISTEM PENCARIAN DOKUMEN : SKRIPSI : ARIANI : 071401022 : SARJANA (S1) ILMU KOMPUTER : ILMU KOMPUTER : MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA Diluluskan di Medan,
Komisi Pembimbing
:
Pembimbing 2
Dra. Mardiningsih, M.Si NIP 196904051988112001
Pembimbing 1
Drs. James P. Marbun, M.Kom NIP 195806111986031002
Diketahui/Disetujui oleh Program Studi S1 Ilmu Komputer Ketua,
Dr. Poltak Sihombing, M.Kom NIP 196203171991021001
Universitas Sumatera Utara
PERNYATAAN
ANALISIS DAN IMPLEMENTASI METODE LATENT SEMANTIC INDEXING PADA SISTEM PENCARIAN DOKUMEN
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, 13 Desember 2011
Ariani 071401022
Universitas Sumatera Utara
PENGHARGAAN
Bismillahiraahmaanirrahiim Alhamdulillahirrabbil’alamin, penulis ucapkan rasa syukur yang tiada habisnya kehadirat Allah SWT yang telah memberikan rahmat serta hidayah-Nya dan segala kemurahan-Nya kepada penulis sehingga penulis dapat menyelesaikan tugas akhir ini. Shalawat dan salam kepada manusia paling agung, Rasulullah Muhammad SAW, beserta keluarganya, para sahabat dan pengikutnya yang setia meski tak pernah berjumpa. Ucapan terima kasih yang sebesar-besarnya penulis sampaikan kepada Bapak Drs. James Piter Marbun, M.Kom selaku Dosen Pembimbing I dan Ibu Dra. Mardiningsih, M.Si selaku Dosen Pembimbing II yang telah memberikan bimbingan, waktu, saran dan masukan kepada penulis sehingga dapat menyelesaikan skripsi ini. Selanjutnya kepada Bapak Drs. Marihat Situmorang, M.Kom selaku Dosen Penguji I dan Bapak Mohammad Andri Budiman, S.T, M.Comp.Sc, MEM selaku Dosen Penguji II, terima kasih atas saran dan kritikan yang sangat berguna bagi penulis. Ucapan terima kasih juga penulis tujukan kepada Ketua dan Sekretaris Program Studi SI Ilmu Komputer, Bapak Dr. Poltak Sihombing, M.Kom dan Ibu Maya Silvi Lydia B.Sc, M.Sc. Dekan dan para Pembantu Dekan FMIPA USU, dosen-dosen di Program Studi SI Ilmu Komputer FMIPA USU dan Staf Tata Usaha Program Studi S1 Ilmu Komputer FMIPA USU. Teristimewa penulis sampaikan ucapan terima kasih kepada kedua orang tua dan keluarga yang telah memberikan dukungan dan motivasi, Ayahanda Sumardi dan Ibunda Supini atas doa, kasih sayang dan yang selalu sabar dalam semua kondisi, sesungguhnya doa dari Ibunda menjadi pembuka jalan bagi penulis. Semoga Ayahanda dan Ibunda selalu berada dalam naungan cahaya iman. Penulis juga sampaikan terima kasih kepada Abangda terkasih, Armansyah atas segala dukungan yang telah diberikan. Selanjutnya kepada sahabat penulis, Dila, Nida, Nur dan Tika terima kasih atas doanya. Kepada teman-teman di Asrama Putri serta rekan-rekan stambuk 2007 yang sama-sama sedang berjuang mengerjakan skripsi dan khususnya Kom B 2007 terima kasih atas motivasi dan hari-harinya selama ini. Semoga Allah melindungi kita semua, amin. Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan, karena kesempurnaan hanyalah milik Allah semata. Oleh karena itu penulis menerima kritik dan saran dari semua pihak yang bersifat membangun dan menyempurnakan skripsi ini. Penulis berharap semoga skripsi ini bermanfaat bagi penulis sendiri pada khususnya dan pembaca pada umumnya.
Universitas Sumatera Utara
ABSTRAK
Keberadaan informasi yang jumlahnya tidak terhitung serta kebutuhan manusia akan penggunaan informasi-informasi tersebut mendorong berkembangnya suatu ilmu untuk melakukan pencarian. Salah satu bentuk information retrieval yang sering digunakan adalah search engine yang memfasilitasi pengguna untuk melakukan pencarian suatu informasi dari seluruh dokumen yang ada dengan query yang dimasukkan oleh pengguna yang biasanya berupa kata-kata kunci dari informasi yang diinginkan. penulisan tugas akhir ini bertujuan untuk membangun sebuah sistem pencarian dokumen relevan berdasarkan query yang dimasukkan, serta telah teranking berdasarkan tingkat relevansinya dengan menggunakan metode Latent Semantic Indexing (LSI). LSI adalah metode pengindeksan dan pencarian yang menggunakan teknik matematika yang disebut Dekomposisi Nilai Singular (SDV) untuk mengidentifikasi pola hubungan antara istilah dan konsep-konsep yang terkandung dalam sebuah koleksi teks yang tidak terstruktur. Sistem ini dibangun menggunakan perangkat lunak Borland Delphi 10. Metodologi untuk membentuk sistem menggunakan pendekatan model air terjun. Tahapan yang penulis lakukan untuk melakukan proses pembentukan sistem tersebut meliputi tahapan analisis permasalahan, perancangan aplikasi yang melibatkan diagram alir data, algoritma dan flowchart beserta desain antarmuka aplikasi, sehingga aplikasi yang terbentuk menjadi mudah dipergunakan dan memiliki fungsi yang optimal. Metode LSI bisa digunakan pada search engine, karena dengan metode ini search engine dapat mencari dokumen yang diinginkan oleh user. Keluaran yang dihasilkan dari sistem adalah dokumen relevan yang telah teranking yang ditampilkan dalam bentuk list file. Kata Kunci: Sistem Temu Kembali Informasi, Borland Delphi, Latent Semantic Indexing, Dekomposisi Nilai Singular, Algoritma.
Universitas Sumatera Utara
ANALYSIS AND IMPLEMENTATION OF LATENT SEMANTIC INDEXING METHOD ON DOCUMENT RETRIEVAL SYSTEM
ABSTRACT
The existence of information that there were not counted and the human need for the use of such information encourages the development of a science to perform information retrieval. One of information retrievers wich is often used are search engines that facilitate users to perform information retrieval from all documents to the entered query by a user who is usually in the form of key words of the desired information.
This writing final duty aim to build a document retrieval system the relevant based on the entered query, and the documents have ranked based on the relevancy level with using latent semantic indexing method. The system is built by using Borland Delphi 10 software. The methodologies to form the system is use the approach of waterfall model. The step which writer do to conduct the application forming process are covering the step analysis the problems, application scheme entangling data flow diagram, algorithm and flowchart therewith the user interface design, so that application formed become easy to use and own the optimal function. To ensure that the entire function which is there are in the information retrieval system work in an optimal. Keyword: Information retrieval system, Borland Delphi, Latent Semantic Indexing, Singular Value Decomposition, Algorithm.
Universitas Sumatera Utara
DAFTAR ISI
Halaman Persetujuan Pernyataan Penghargaan Abstrak Abstract Daftar Isi Daftar Tabel Daftar Gambar Bab 1 Pendahuluan 1.1 Latar Belakang 1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian 1.5 Manfaat Penelitian 1.6 Metodologi Penelitian 1.7 Sistematika Penulisan
ii iii iv v vi vii x xi
1 2 3 3 3 4 4
Bab 2 Tinjauan Pustaka 2.1 Pendahuluan 2.2 Information Retrieval 2.3 Searching 2.4 Pengantar Umpan Balik Relevansi 2.5 Istilah Pencarian 2.6 Preferensi Pencarian 2.7 Antarmuka Pencarian 2.8 Ranking 2.8.1 Cara Meranking 2.9 Algoritma Pencarian 2.10 Latent Semantic Indexing 2.10.1 Singular Value Decomposition 2.10.2 Eigenvalue dan Eigenvector Matriks 2.11 Term-Document Matriks 2.12 Text Mining 2.13 Bahasa Pemrograman Delphi 2.13.1 Mengenal Lingkungan Delphi 2.13.2 Kelebihan Borland Delphi
6 7 10 10 11 12 12 12 13 14 15 17 18 18 21 22 23 25
Bab 3 Analisis dan Perancangan Sistem 3.1 Pendahuluan 3.2 Analisis Masalah Umum 3.3 Cara Kerja Searching Dokumen 3.3.1 Searching
27 27 28 28
Universitas Sumatera Utara
3.4 Analisis Metode Latent Semantic Indexing 3.5 Blok Diagram Sistem 3.6 Arsitektur Sistem 3.7 Spesifikasi Umum Kebutuhan Sistem 3.7.1 Fungsi Sistem 3.7.2 Tujuan Sistem 3.7.3 Masukan dan Keluaran Sistem 3.7.4 Batasan Sistem 3.7.5 Model Fungsionalitas Sistem 3.7.5.1 Data Flow Diagram 3.7.5.1.1 Diagram Aliran Data Level 0 3.7.5.1.2 Diagram Aliran Data Level 1 3.7.5.1.3 Kamus Data DFD 3.7.5.2 Flowchart 3.8 Ranking Dokumen 3.9 Perancangan Aplikasi 3.9.1 Perancangan Antarmuka Pemakai 3.9.1.1 Perancangan Antarmuka Home 3.9.1.2 Perancangan Antarmuka Searching Dokumen 3.9.1.3 Perancangan Halaman Contact
30 34 34 35 35 36 36 36 37 37 38 39 40 41 44 47 47 48 49 51
Bab 4 Implementasi dan Pengujian Sistem 4.1 Implementasi Sistem 4.1.1 Lingkungan Implementasi 4.1.1.1 Kebutuhan Perangkat Keras 4.1.1.2 Kebutuhan Perangkat Lunak 4.1.2 Tampilan Sistem 4.1.2.1 Tampilan Utama Program 4.1.2.2 Halaman Searching Dokumen 4.1.2.3 Halaman Contact 4.2 Pengujian 4.2.1 Tujuan Pengujian 4.2.2 Data Pengujian 4.2.3 Pengujian Perankingan 4.2.3.1 Kriteria Pengujian 4.2.4 Hasil Pengujian
52 52 52 53 53 53 55 58 59 59 60 63 63 63
Bab 5 Kesimpulan dan Saran 5.1 Kesimpulan 5.2 Saran
66 67
DAFTAR PUSTAKA LAMPIRAN A : LISTING PROGRAM HOME LAMPIRAN B : LISTING PROGRAM SEARCHING LAMPIRAN C : LISTING PROGRAM RANKING LAMPIRAN D : LISTING PROGRAM CONTACT
Universitas Sumatera Utara
DAFTAR TABEL
Halaman 2.1 Contoh Matriks Kata-Dokumen 3.1 Kamus Data DFD 3.2 Simbol-Simbol Flowchart 3.3 Ranking Dokumen Menggunakan 3 Kata Kunci 3.4 Keterangan Tampilan Antarmuka Home 3.5 Keterangan Tampilan Antarmuka Searching Dokumen 3.6 Keterangan Tampilan Halaman Contact 4.1 Spesifikasi Kebutuhan Perangkat Keras 4.2 Hasil Pengujian 4.3 Hasil Pengujian 11 4.4 Analisis Hasil Pengujian 4.5 Analisis Hasil Pengujian 11
20 41 42 45 49 50 51 52 64 64 65 65
Universitas Sumatera Utara
DAFTAR GAMBAR
Halaman 2.1 Bagian-Bagian Sistem Temu Kembali Informasi 2.2 Contoh Teks untuk LSI 2.3 Tampilan Layar Delphi 2010 2.4 Layar Code Editor 3.1 Proses Searching 3.2 Hasil Dekomposisi Matriks 3.3 Diagram Algoritma LSI 3.4 Blok Diagram Sistem 3.5 Arsitektur Sistem 3.6 Diagram Konteks 3.7 Diagram Aliran Data Level 1 3.8 Flowchat Searching 3.9 Flowchart Ranking 3.10 Rancangan Tampilan Antarmuka Home 3.11 Rancangan Tampilan Halaman Searching 3.12 Rancangan Tampilan Halaman Contact 4.1 Tampilan Utama Program 4.2 Tampilan Halaman Searching 4.3 Tampilan Hasil Pencarian 4.4 Hasil Pencarian yang tidak ditemukan 4.5 Tampilan Halaman Contact 4.6 Tampilan Confirm untuk mengakhiri Program 4.7 Hasil Pencarian Dokumen 4.8 Hasil Pencarian dengan Kata Kunci yang berbeda
8 19 23 24 29 33 33 34 35 38 39 43 46 48 50 51 54 55 56 57 58 59 60 61
Universitas Sumatera Utara