BAB 1 PENDAHULUAN 1.1 Latar Belakang Permasalahan Teknik Struktur Data dan Data Mining merupakan salah satu ilmu komputer yang penting dan menarik perhatian teori informatika. Saat ini teknik ini sudah tidak asing bagi golongan orang teknik informatika maupun yang bukan golongan teknik informatika. Teknik pengolahan data baik untuk menyimpan, mengolah, menelusuri, mencari maupun melakukan seleksi terhadap suatu data semakin lama semakin sering digunakan oleh kita semua. Salah satu ilmu di dalam teknik struktur data dan pengolahan data itu adalah Search and Retrieve. Retrieve merupakan proses pengembalian sesuatu baik itu pengetahuan, barang, atau data yang dibutuhkan oleh user dalam situasi khusus untuk memecahkan permasalahan yang dimiliki oleh user. Sistem ini merupakan bagian dari Sistem Information Retrieval (IR). Berbeda dengan Sistem Database yang berupa skema pasti serta merupakan data yang terstruktur, data dan dokumen pada Sistem IR dapat dikatakan tidak terstruktur serta tidak ditemukan skema yang pasti pada Sistem IR. Untuk itu dibutuhkan metode-metode dan algoritma-algoritma yang dapat membantu Sistem IR untuk mengolah dokumendokumen yang ada berdasarkan seberapa relevan dokumen-dokumen tersebut dengan query dari user. Penggunaan algoritma dan metode di dalam sistem pencarian turut mempengaruhi hasil akhir dan cara kerja sistem. Setiap algoritma di dalam teknik pengolahan data pastilah menawarkan dan memberikan solusi yang lebih baik untuk mengakses data maupun mengolah data, namun tidak semua algoritma dan metode menghasilkan hasil yang sama tentunya.
1
Beberapa metode dan algoritma menawarkan keunggulan di dalam kecepatan proses , metode lain menawarkan keunggulan di dalam ketepatan hasil pencarian, juga memungkinkan metode yang unggul di dalam jumlah besarnya data yang dapat diproses. Di dalam penelusuran data, pengolahan data dan pencarian data, algoritma dan metode yang dipilih sangat menentukan hasil pencarian baik dalam kompleksitas waktu maupun kualitas dan jenis pencarian data tersebut. Pencarian informasi yang didasarkan dengan ketepatan hasil pencarian mendukung cara kerja dan efektifitas sistem secara keseluruhan. Untuk itu penelitian ini akan mencoba memecahkan permasalahan pencocokan pola (String Matching) dan kata yang merupakan perkembangan teknik struktur data dan pengolahan data di dalam IR untuk pecarian sebuah query data dari sebuah data yang lebih besar atau dari sebuah database / kumpulan data yang ada. Pencarian querry di dalam sebuah data ini difokuskan untuk mendukung pencarian kata/kumpulan huruf yang sama dengan yang dimasukkan dalam querry tersebut. Dengan pencarian yang dimaksud ini maka hasil pencarian kata/ huruf yang berulang sebagian namun tidak sama akan ditampilkan juga. Untuk itu dipilih metode Suffix Array dan Suffix Tree untuk memecahkan permasalahan String Matching di dalam Information Retrieval (IR) pada data text.
1.2 Rumusan Masalah Dengan melihat latar belakang masalah diatas, rumusan masalah dapat di jabarkan sebagai berikut : •
Bagaimana sistem menampilkan simulasi tabel metode suffix tree dan suffix array untuk proses pencarian kumpulan huruf yang dimaksud?
•
Bagaimana sistem mampu melakukan proses (search and retrieve) dan memberikan hasil yang sesuai menurut Querry yang diinputkan ?
•
Apakah sistem mampu menunjukkan kelebihan dan kelemahan dari metode Suffix Tree dan Suffix Array? 2
•
Bagaimana perbandingan dan keterkaitan pembentukan simulasi tabel dari Suffix Tree atau Suffix Array?
1.3 Batasan Masalah Batasan Permasalahan untuk aplikasi ini adalah sebagai berikut : •
Sistem membahas pengolahan berkas data dan analisis berkas berupa data text, tidak mencakup data berupa berkas video, music dan berkas lainnya.
•
Data text yang merupakan input maupun output dilihat berdasarkan kode ASCII.
•
Input berupa string,output bukan berupa informasi tentang querry tetapi output berupa string dan informasi tentang string.
•
Pembahasan dan penerapan Suffix Tree dan Suffix Array tidak dititikberatkan untuk kegunaan Suffix Tree dan Suffix Array yang lain seperti pencarian string terpanjang, pencarian string terpendek, string paling sering keluar dan lain sebagainya.
1.4 Tujuan Penelitian Tujuan penelitian Tugas Akhir yang diharapkan adalah : 1.
Menampilkan proses simulasi pembentukan tabel metode Suffix Tree dan Suffix Array serta pencarian Suffix Tree dan Suffix Array pada sebuah data.
2.
Mengimplementasikan metode/ algoritma Suffix Tree dan Suffix Array pada sebuah sistem pencarian informasi.
1.5 Metode Penelitian Dalam penelitian dan pembuatan program untuk Tugas Akhir ini,penulis menggunakan metode : •
Pengumpulan data Metode yang dilakukan adalah studi literatur, yaitu melakukan penelitian pustaka
dengan cara mencari literatur di perpustakaan, internet, jurnal-jurnal yang berkaitan dan 3
mendukung hal-hal yang berhubungan dengan algoritma Suffix Array dan Suffix Tree. Sehingga bahan dan teori yang ada didasarkan dari studi literatur yang didapat. •
Implementasi
1. Melakukan pendekatan linguistik untuk mengerti lebih jauh tentang metode Suffix Tree dan Suffix Array karena pendekatan yang mengacu pada tata bahasa dan ilmu pada bahasa manusia adalah ilmu linguistik. 2. Penggunaan algoritma Suffix Tree dan Suffix Array di dalam program dan mengimplementasikan aplikasi simulasi tabel Suffix Tree dan Suffix Array di dalam program. 3. Melakukan pengujian trial and error pada program yaitu ujicoba program secara terus menerus dan bertahap sehingga penemuan error/ kesalahan dapat ditekan.
1.6 Sistematika Penulisan Sistematika yang akan digunakan dalam penyusunan laporan Tugas Akhir ini adalah sebagai berikut : Bab 1 merupakan bab pendahuluan dan bab penghantar yang berisi uraian latar belakang masalah, batasan masalah, rumusan masalah, spesifikasi sistem, metodologi penelitian, data yang diperlukan dan sistematika penulisan. Bab 2 merupakan bab yang berisikan landasan teori yang menguraikan teori dan metode yang mendasari pembahasan masalah
yang mendukung dan yang berkaitan
dengan Penyusunan Tugas Akhir, yaitu meliputi Suffix Array, Suffix Tree, Information Retrieval. Bab 3 membahas program dan aplikasi yaitu perancangan program secara keseluruhan, yang meliput pemilihan perangkat lunak, gambaran algoritma dan diagram yang digunakan, perancangan pembentukan simulasi tabel Suffix Tree dan Suffix Array dan perancangan sistem pencarian dan hasil yang ditampilkan. Bab 4 membahas implementasi aplikasi system dan penggunaan aplikasi serta langkah-langkah implementasi aplikasi. 4
Bab 5 merupakan bab yang berisi kesimpulan dan saran sekaligus merupakan bab penutup yang membahas tentang hasil penulisan Tugas Akhir serta saran-saran yang dapat diberikan untuk perbaikan. Selanjutnya bagian terakhir berisi daftar pustaka dan lampiran-lampiran.
5