PENELUSURAN DAN VISUALISASI PENCARIAN RUJUKAN PADA DOKUMEN PENELITIAN
FIRNAS NADIRMAN
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa tesis berjudul Penelusuran dan Visualisasi Pencarian Rujukan pada Dokumen Penelitian adalah karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
Bogor, Juni 2014
Firnas Nadirman NIM G651100394
RINGKASAN FIRNAS NADIRMAN. Penelusuran dan Visualisasi Pencarian Rujukan pada Dokumen Penelitian. Dibimbing oleh AHMAD RIDHA dan WISNU ANANTA KUSUMA. Daftar pustaka adalah bagian penting dari dokumen penelitian. Daftar pustaka berisi daftar dokumen yang diacu dalam dokumen. Daftar ini berguna bagi pembaca, biasanya sesama ilmuwan, untuk mencari dokumen-dokumen terkait dan mengetahui penelitian ilmuwan lain pada sebuah bidang ilmu. Dokumen penting pada sebuah bidang ilmu tertentu akan lebih sering diacu oleh dokumen lain, maka sangat penting untuk menelusuri dan mendapatkan jumlah dokumen yang menggunakan sebuah rujukan sebagai acuan. Penelitian ini dimaksudkan untuk membuat sebuah modul yang dapat menelusuri acuan pada daftar pustaka dan menggambarkan hubungan antarpengarang untuk mempermudah penelusuran dokumen penelitian. Modul yang dibuat merupakan bagian dari sistem temu kembali dokumen penelitian. Hasil dari pembuatan modul ini, selain dapat menelusuri entri daftar pustaka pada dokumen penelitian juga dapat menampilkan visualisasi grafik hubungan antar-pengarang yang bertujuan untuk mempermudah mencari hubungan antara dokumen hasil penelitian dan dokumen yang digunakan sebagai rujukan. Penelitian dimulai dengan pengumpulan dokumen penelitian dalam bentuk file PDF sebanyak 246 dari Departemen Ilmu Komputer IPB. Setiap dokumen penelitian dalam bentuk file PDF dikonversi menjadi teks dan disimpan pada basis data dokumen penelitian. Setelah itu, teks dokumen penelitian diekstrak dan diidentifikasi entri daftar pustakanya. Hasil ekstraksi entri daftar pustaka disimpan pada basis data lalu digunakan untuk membangun sistem temu kembali dokumen penelitian Pengembangan sistem pada penelitian ini menggunakan beberapa modul. Modul pdftotext digunakan untuk melakukan konversi file PDF menjadi teks. Proses ekstraksi dan identifikasi entri daftar pustaka menggunakan modul ParaTools. Sphinx digunakan untuk membuat sistem temu kembali informasi. Pada penelitian ini juga dibuat visualisasi hasil pencarian berbasis web serta visualisasi hubungan antar-pengarang menggunakan Javascript Infovis Toolkit. Sistem yang dikembangkan pada penelitian ini sudah dapat melakukan ekstrak dan identifikasi entri daftar pustaka dengan cukup baik. Hal ini dapat dilihat pada pengujian ekstraksi dan identifikasi atribut entri daftar pustaka, yang menghasilkan 94.63% entri daftar pustaka yang tepat, dan 91.54% entri daftar pustaka dapat diidentifikasi atributnya dengan tepat. Selain pengujian ekstraksi dan identifikasi atribut entri daftar pustaka juga dilakukan pengujian untuk mengukur keberhasilan sistem dalam menghubungkan entri daftar pustaka dengan dokumen. Pengujian ini menghasilkan sebanyak 90.31% entri daftar pustaka berhasil dihubungkan secara tepat dengan dokumen. Kata kunci: ekstraksi entri daftar pustaka, ParaTools, pencarian dokumen penelitian, visualisasi hubungan pengarang
SUMMARY FIRNAS NADIRMAN. Search and Visualization of References in Research Documents. Supervised by AHMAD RIDHA and WISNU ANANTA KUSUMA. Bibliography is an important part of a research document as it lists references cited in the document. The list is useful for readers, usually fellow scientists, to locate other related documents and to know other scientists working on the topic. An important document in a field would be more likely to be cited, so it is also desirable to know the number of citations that a document has. This study aims to create a module that can extract references from the bibliography entries of research documents. A method is created to recognize the bibliography entries from the research documents. Once identified, the bibliography entries are stored into a database. The database is used to build an information retrieval system for searching research documents along with their references and to visualize the relationship between the authors. This study began with collecting 246 research documents as PDF files. Each file was converted into plaintext file and stored in a research document database. The text was extracted and identified to get the bibliography entries. The bibliography entries were stored into the database. The database was used to build an information retrieval system of research documents. A visualization module was created to display the relationships between the authors of the documents from bibliographic entries in the database. The development of the system in this study are using multiple modules. Pdftotext module is used for converting PDF files into text. The process of extraction and identification bibliographic entry is using a ParaTools module. Sphinx is used to make the information retrieval system. In this study also created a web-based visualization of search results as well as the visualization of relationships between author uses Javascript Infovis Toolkit. The system developed in this study has been able to extract and identification of a bibliography entry. In the measurement of extraction and attributes identification of the bibliography entries, 94.63% of bibliography entries are extracted accurately and 91.54% of the attributes of bibliography entries can be identified accurately. In addition to the measurement of extraction and attributes identification of the bibliography entries, assessment to measure the success of relating the bibliography entries to the documents through the system is also conducted. It indicates that 90.31% of the bibliography entries are successfully and accurately connected with the documents. Keywords: author relationship visualization, bibliography entries extraction, ParaTools, research documents search
© Hak Cipta milik IPB, tahun 2014 Hak Cipta dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan yang wajar bagi IPB. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh Karya tulis dalam bentuk apa pun tanpa izin IPB.
PENELUSURAN DAN VISUALISASI PENCARIAN RUJUKAN PADA DOKUMEN PENELITIAN
FIRNAS NADIRMAN
Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Komputer pada Program Studi Ilmu Komputer
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014
Penguji Luar Komisi pada Ujian Tesis: Dr Irman Hermadi, SKom MS
Judul Tesis Nama NIM
: Penelusuran dan Visualisasi Pencarian Rujukan pada Dokumen Penelitian : Firnas Nadirman : G651100394
Disetujui oleh Komisi Pembimbing
Ahmad Ridha, SKom MS Ketua
Dr Eng Wisnu Ananta Kusuma, ST MT Anggota
Diketahui oleh
Ketua Program Studi Ilmu Komputer
Dekan Sekolah Pascasarjana
Dr Eng Wisnu Ananta Kusuma, ST MT
Dr Ir Dahrul Syah, MScAgr
Tanggal Ujian : 3 Mei 2014
Tanggal Lulus :
PRAKATA Puji dan syukur penulis panjatkan kepada Allah Subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Penelitian ini disusun sebagai salah satu syarat meraih gelar master pada Program Studi Magister Ilmu Komputer, Sekolah Pascasarjana, Institut Pertanian Bogor. Tema yang dipilih dalam penelitian ini ialah Temu Kembali Informasi, dengan judul Penelusuran dan Visualisasi Pencarian Rujukan pada Dokumen Penelitian. Penulis mengucapkan terima kasih kepada Bapak Ahmad Ridha, SKom MS selaku ketua komisi pembimbing yang telah memberikan segenap bantuan dan bimbingan kepada penulis selama proses penelitian dan penyusunan penelitian ini, serta Bapak Dr Eng Wisnu Ananta Kusuma, ST MT selaku anggota komisi pembimbing yang telah memberikan saran, koreksi dan masukan kepada penulis. Terima kasih pula penulis ucapkan kepada Bapak Dr Irman Hermadi, SKom MS selaku penguji. Tak lupa penulis mengucapkan banyak terima kasih kepada kepada Ibu Annisa, SKom MKom yang pernah turut membimbing, memberikan masukan serta saran pada penelitian ini. Penulis juga mengucapkan terima kasih kepada teman-teman Pascasarjana Magister Ilmu Komputer, staf dan dosen Ilmu Komputer IPB atas pertemanan dan bantuannya selama penulis mengikuti perkuliahan. Penulis juga mengucapkan terima kasih kepada orang tua beserta keluarga yang telah memberikan dukungan moril dan doanya. Terkhusus terima kasih penulis sampaikan kepada istri tercinta Wida Lesmanawati dan anak-anakku tersayang (Reina dan Najib). Penulis juga mengucapkan terima kasih kepada Badan Pengkajian dan Penerapan Teknologi (BPPT) yang sudah memberikan kesempatan kepada penulis untuk melaksanakan pendidikan di IPB. Akhirnya kepada semua pihak yang telah memberikan kontribusi yang besar selama perkuliahan dan pengerjaan penelitian ini yang tidak dapat disebutkan satu per satu, penulis ucapkan terima kasih. Semoga penelitian ini dapat memberikan manfaat sebesar-besarnya.
Bogor, Juni 2014
Firnas Nadirman
DAFTAR ISI DAFTAR TABEL
vii
DAFTAR GAMBAR
vii
DAFTAR LAMPIRAN
viii
1 PENDAHULUAN Latar Belakang Tujuan Penelitian Manfaat Penelitian Ruang Lingkup Penelitian
1 1 2 2 2
2 TINJAUAN PUSTAKA Temu Kembali Informasi Sistem Temu Kembali Dokumen Penelitian Visualisasi Informasi Rujukan Perancangan Basis Data Penelitian Sebelumnya Metode Pengukuran Sistem Temu Kembali Informasi Sistem Temu Kembali Informasi Dokumen Penelitian yang Telah Ada
3 3 3 3 4 4 4 7 8
3 METODOLOGI PENELITIAN Kerangka Pemikiran Pengumpulan dan Pembuatan Basis Data Dokumen Penelitian Ekstraksi dan Identifikasi Atribut Entri Daftar Pustaka Pembangunan Sistem Temu Kembali Dokumen Penelitian Pembuatan Visualiasasi Hubungan Antar-Pengarang Pengujian Sistem Pengukuran Kinerja Ekstraksi dan Identifikasi Atribut Entri Daftar Pustaka pada Setiap Dokumen Penelitian Pengukuran Kinerja Hubungan Entri Daftar Pustaka dengan Dokumen
9 9 10 11 11 12 13
4 HASIL DAN PEMBAHASAN Pengumpulan Data Karakteristik Dokumen Skripsi Format Entri Daftar Pustaka Perancangan Basis Data Dokumen Penelitian Pengolahan Data Pengubahan File Dokumen Skripsi dalam Bentuk PDF Menjadi Teks Ekstraksi Entri Daftar Pustaka Identifikasi Atribut Entri Daftar Pustaka Penyimpanan Entri Daftar Pustaka ke Basis Data Modul Entri Data
15 15 15 16 16 19 20 20 22 25 27
13 14
Modul Identifikasi Kesamaan Nama pengarang Mesin Temu Kembali Pencarian pada Sistem Temu Kembali Informasi Dokumen Penelitian Visualisasi Hasil Pencarian Pengujian Waktu Proses Entri Dokumen Skripsi Kesalahan pada Hasil Konversi File PDF Kesalahan pada Hasil Identifikasi Atribut Entri Daftar Pustaka Pengujian Ekstraksi Entri Daftar Pustaka Pengujian Identifikasi Atribut Entri Daftar Pustaka Pengujian Hubungan Entri Daftar Pustaka dengan Dokumen
29 29 30 31 31 32 32 33 36 36 37
5 KESIMPULAN DAN SARAN Kesimpulan Saran
38 38 39
Daftar Pustaka
39
DAFTAR TABEL 1 2 3 4 5 6
Kolom umum dan spesifik entri daftar pustaka Kata-kata identifikasi entri daftar pustaka yang digunakan Tabel penyimpanan kolom spesifik dari entri daftar pustaka Kondisi entri daftar pustaka1 dan entri daftar pustaka2 yang dianggap sama Proses pengujian ekstraksi entri daftar pustaka Proses pengujian identifikasi atribut entri daftar pustaka
24 24 26 26 36 37
DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
Contoh tampilan BIRS (Ding et al. 2000). Framework DBL Browser (Klink et al. 2004). Sebuah visualisasi pengarang untuk peraih Nobel Herbert Simon, ditampilkan dalam format Kohonen (Lin et al. 2003) Pengarang bersama (kiri) dan pengarang bersama yang telah menulis setidaknya 2 dokumen (kanan) (Murray et al. 2006) Google Scholar Citations Ilustrasi Micorosoft Academic Search Metodologi penelitian Pembuatan basis data dokumen penelitian Arsitektur sistem temu kembali informasi dokumen penelitian Model proses sistem temu kembali informasi dokumen penelitian Visualisasi dokumen penelitian Entri daftar pustaka pada dokumen skripsi Perancangan konseptual basis data dokumen penelitian Supertype dan subtype pada dokumen Supertype dan subtype pada pengarang Perancangan logikal basis data dokumen penelitian Perancangan fisik basis data dokumen penelitian Konsep pengubahan file PDF menjadi format raw text Hasil pengubahan file PDF menjadi teks dengan format raw text Tahapan esktrak entri daftar pustaka Kolom entri daftar pustaka Form modul entri data dokumen skripsi Penyimpanan dokumen skripsi ke dalam basis data Hasil pengolahan entri daftar pustaka dari dokumen skripsi Proses pembuatan indeks dengan Sphinx Antarmuka pencarian Halaman hasil pencarian Visualisasi hasil pencarian Hasil konversi file PDF diubah menjadi teks yang bercampur (ditandai) dengan kumpulan entri daftar pustaka
5 5 7 7 8 9 10 11 12 12 13 16 17 18 18 19 19 21 21 23 23 27 28 28 30 30 31 32 33
DAFTAR LAMPIRAN 1 2 3 4
Contoh text layout pengubahan file PDF Proses membandingkan posisi entri daftar pustaka Format metadata entri daftar pustaka Model kalimat daftar pustaka yang digunakan untuk mengidentifikasi atribut entri daftar pustaka 5 Hasil dari proses identifikasi atribut entri daftar pustaka 6 Penyimpanan dokumen skripsi ke basis data 7 Proses identifikasi kesamaan nama pengarang 8 Stop words bahasa Indonesia 9 Stop words bahasa Inggris 10 Hasil recall dan precision pada pengujian ekstraksi entri daftar pustaka di semua dokuman 11 Hasil recall dan precision pada pengujian identifikasi atribut entri daftar pustaka di semua dokuman 12 Hasil pengujian hubungan dokumen dalam koleksi dengan entri daftar pustaka
41 42 44 45 52 53 54 55 58 61 68 75
1 PENDAHULUAN Latar Belakang Daftar pustaka adalah bagian penting dari dokumen penelitian. Daftar pustaka berisi daftar dokumen yang diacu dalam dokumen. Daftar ini berguna bagi pembaca, biasanya sesama ilmuwan, untuk mencari dokumen-dokumen terkait dan mengetahui penelitian ilmuwan lain pada sebuah bidang ilmu. Dokumen penting pada sebuah bidang ilmu tertentu akan lebih sering diacu oleh dokumen lain, maka sangat penting untuk menelusuri dan mendapatkan jumlah dokumen yang menggunakan sebuah rujukan sebagai acuan. Penelusuran dokumen hasil penelitian merupakan kegiatan penting bagi peneliti dan ilmuwan. Pada bidang temu kembali informasi, penelusuran dokumen hasil penelitian dianggap sebagai domain tersendiri karena dokumen penelitian berbeda fomatnya dengan jenis dokumen lain (Ding et al. 2001). Metode khusus diperlukan untuk mengekstrak isi dari dokumen penelitian agar informasi yang diinginkan dapat diperoleh. Dokumen penelitian acapkali memiliki pengacuan ke dokumen penelitian lain. Bagi seorang peneliti atau ilmuwan, pengacuan merupakan informasi yang bermanfaat karena yang diacu adalah rujukan yang digunakan oleh dokumen penelitian. Pada saat melakukan penelitian, mencari rujukan yang terkait dengan sebuah dokumen penelitian dapat menjadi tugas yang sulit. Untuk mencari rujukan yang relevan dengan sebuah dokumen penelitian, para peneliti atau ilmuwan harus membaca pada bagian daftar pustaka dari dokumen penelitian tersebut. Selanjutnya bila peneliti atau ilmuwan menemukan rujukan yang dibutuhkannya, pencarian dilanjutkan pada dokumen yang didapat dari daftar pustaka. Apabila sebuah dokumen rujukan memiliki isi yang bermanfaat, dokumen rujukan tersebut disimpan, lalu pencarian dilanjutkan untuk mendapatkan dokumen rujukan lainnya dan begitu seterusnya. Sebuah rujukan bisa dianggap sangat bermanfaat ketika dijadikan rujukan oleh banyak dokumen penelitian. Selain itu, bermanfaatnya sebuah dokumen rujukan juga disebabkan karena faktor pengarang. Dokumen rujukan yang ditulis oleh seseorang yang ahli pada tema (bidang) tertentu banyak digunakan oleh dokumen lainnya sebagai acuan pada bidang tersebut. Saat ini sudah dikembangkan sistem yang dapat menelusuri rujukan dari dokumen penelitian. Salah satu dari sistem tersebut juga sudah dapat menerima masukan berupa dokumen penelitian dari pengguna dan mengekstrak rujukan secara otomatis untuk ditelusuri. Akan tetapi, sistem yang sudah ada saat ini masih belum dapat mengekstrak rujukan dari dokumen penelitian yang memiliki format tertentu, seperti format dokumen penelitian yang digunakan di Institut Pertanian Bogor. Penelitian ini dimaksudkan untuk membuat sebuah modul yang dapat menelusuri acuan pada daftar pustaka dan menggambarkan hubungan antarpengarang untuk mempermudah penelusuran dokumen penelitian. Modul yang dibuat merupakan bagian dari sistem temu kembali dokumen penelitian. Hasil dari pembuatan modul ini, selain dapat menelusuri entri daftar pustaka pada dokumen penelitian juga dapat menampilkan visualisasi grafik hubungan antar-pengarang
2
yang bertujuan untuk mempermudah mencari hubungan antara dokumen hasil penelitian dan dokumen yang digunakan sebagai rujukan. Anegón et al. (2004) menyebutkan bahwa representasi dari informasi dalam bentuk grafik dapat dengan mudah direkam oleh otak manusia dibandingkan dengan representasi dalam bentuk teks. Dari hal itu, penelitian ini juga akan membuat grafik hubungan pengarang agar dapat memvisualisasikan hubungan antar-pengarang untuk membantu pencarian dokumen penelitian. Tujuan Penelitian Penelitian ini bertujuan untuk membuat sebuah modul di dalam sistem temu kembali dokumen penelitian yang dapat mengidentifikasi entri daftar pustaka dan mengekstraknya secara otomatis. Penelitian ini juga mengembangkan modul untuk menampilkan visualisasi dalam bentuk grafik yang berisi hubungan antara pengarang sebuah dokumen penelitian dan pengarang dokumen lainnya berdasarkan entri daftar pustaka. Manfaat Penelitian Penelitian ini menerapkan metode untuk mengenali entri daftar pustaka yang terdapat pada sebuah dokumen penelitian. Setelah dikenali, entri daftar pustaka tersebut disimpan ke dalam basis data. Entri daftar pustaka yang berhasil dikenali, selanjutnya divisualisasikan dalam bentuk grafik untuk menghubungkan antara pengarang dan pengarang lainnya. Hasil dari grafik hubungan pengarang dapat digunakan untuk mempermudah penelusuran dokumen lainnya yang memiliki kesamaan pada tema. Ruang Lingkup Penelitian Penelitian ini akan mengembangkan sebuah modul pada sistem temu kembali informasi dokumen penelitian yang memiliki batasan atau ruang lingkup yang harus dikerjakan dengan cakupan sebagai berikut: • Dokumen yang digunakan sebagai input berbentuk file PDF. Sistem tidak dapat memproses dokumen dalam bentuk citra. • Dokumen yang digunakan adalah dokumen skripsi Departemen Ilmu Komputer IPB 5 tahun terakhir (2007 s.d 2012). • Penelusuran rujukan hanya dibatasi pada bagian Daftar Pustaka setiap dokumen skripsi. • Format daftar pustaka yang digunakan pada penelitian ini mengikuti format yang digunakan pada Pedoman Penulisan Karya Ilmiah di Institut Pertanian Bogor edisi ke 1, 2, dan 3. • Hasil pencarian ditampilkan dalam bentuk daftar dan visualisasi hubungan antar-pengarang dokumen penelitian dengan pengarang pada dokumen rujukannya dalam bentuk grafik.
3
2 TINJAUAN PUSTAKA Temu Kembali Informasi Temu kembali informasi adalah menemukan bahan (dokumen) yang bersifat tidak terstruktur yang memenuhi kebutuhan informasi dari koleksi yang besar. Pada awalnya, temu kembali informasi merupakan kegiatan yang dilakukan beberapa orang yang hanya bergerak di bidang pustakawan. Pada saat ini ratusan juta orang terlibat dalam pengambilan informasi setiap hari menggunakan mesin pencari melalui internet. Temu kembali informasi menjadi bentuk dominan dari akses informasi, meninggalkan pencarian secara tradisional pada bidang pencarian informasi (Manning et al. 2008). Sistem temu kembali informasi merupakan sistem yang dapat menyimpan, mencari dan mengelola informasi. Informasi yang dimaksud dapat merupakan teks, gambar, audio, video, dan objek multimedia lainnya. Tujuan utama sebuah sistem temu kembali informasi adalah menemukembalikan informasi yang mungkin berguna atau relevan bagi pengguna sesuai dengan kata pencarian yang telah dimasukkannya, penekanannya adalah pada penemukembalian informasi, bukan data (Baeza-Yates dan Ribeiro-Neto 2011). Sebuah sistem temu kembali informasi adalah sebuah program perangkat lunak yang memfasilitasi pengguna dalam mencari informasi sesuai dengan kebutuhan pengguna. Tujuan sebuah sistem temu kembali informasi adalah meminimalkan overhead dari pengguna dalam mencari informasi yang dibutuhkan (Kowalski 1997). Sistem Temu Kembali Dokumen Penelitian Sistem temu kembali dokumen penelitian dirancang untuk membantu pengguna merumuskan dan memperluas permintaan untuk mencari informasi pada sejumlah media mulai dari basis data perpustakaan dan World Wide Web (WWW). Antarmuka sistem telah dirancang dan dibuat dengan fasilitas untuk membantu pengguna mendapatkan pemahaman, merumuskan, dan memperluas permintaan pencarian serta memvisualisasikan dokumen penelitian. Sebuah evaluasi terdahulu pada pengguna sistem temu kembali dokumen penelitian mengungkapkan bahwa pengguna umumnya merasa mudah untuk membentuk dan memperluas permintaan mereka. Sistem temu kembali dokumen penelitian juga dapat membantu pengguna memperoleh informasi latar belakang yang berguna tentang domain pencarian. Sistem juga dapat menunjukkan aspek visualisasi informasi, browsing, dan antarmuka pengguna sebagai karakteristik unik (Ding et al. 2000). Visualisasi Informasi Visualisasi informasi dalam bentuk abstrak akan lebih sulit untuk dilakukan. Bahasa adalah alat utama untuk mengkomunikasikan visualisasi tersebut. Meskipun sulitnya melakukan visualisasi tersebut, peneliti berusaha untuk mewakili aspek dari proses akses informasi menggunakan teknik visualisasi informasi. Ikon, warna sorotan, serta tata letak ruang dalam bentuk garis, batang, lingkaran, dan informasi kanvas dilakukan banyak sistem temu kembali informasi pada hasil pencarian untuk mempermudah penggunaannya (Baeza-Yates dan
4
Ribeiro-Neto 2011). Percobaan visualisasi untuk hasil pencarian telah diterapkan dalam cara berikut: • Visualisasi pada sintaks boolean • Visualisasi pada kata query dalam hasil pencarian • Visualisasi pada hubungan antara kata-kata dan dokumen • Visualisasi untuk text mining Pada penelitian ini, jenis visualisasi yang digunakan pada hasil pencarian adalah visualisasi pada hubungan antara kata-kata dan dokumen. Rujukan Rujukan atau referensi menurut Kamus Besar Bahasa Indonesia tahun 2008 merupakan bahan sumber yang dipakai untuk mendapatkan keterangan lebih lanjut; acuan. Pada sebuah dokumen penelitian terdapat beberapa sumber yang dijadikan rujukan. Sumber dari rujukan akan dituliskan pada bagian daftar pustaka yang merupakan daftar tulisan baik itu berupa buku, artikel, jurnal atau karangan dari seorang pengarang atau tentang suatu subjek (ilmu) (DEPDIKNAS 2008). Perancangan Basis Data Merancang basis data adalah dasar untuk membangun basis data yang memenuhi kebutuhan pengguna. Efektivitas dan efisiensi dari basis data secara langsung berhubungan dengan struktur basis data. Perancangan basis data dimulai dari tahap perancangan konseptual lalu dilanjutkan dengan perancangan logikal dan diakhiri dengan perancangan fisik (Hoffer et al. 2011). Perancangan konseptual menggambarkan basis data menjadi bentuk entitasentitas tunggal yang berhubungan, bertujuan untuk mewakili dari model data yang akan dirancang dalam bentuk diagram Entity Relationship (ER). Perancangan logikal dari basis data adalah mengubah rancangan konseptual menjadi rancangan yang menggambarkan data pada teknologi manajemen data yang akan digunakan untuk menerapkan basis data. Perancangan fisik menerjemahkan deskripsi logikal data ke dalam spesifikasi teknis untuk menyimpan dan mengambil data. Tujuannya adalah untuk membuat rancangan penyimpan data yang akan memberikan kinerja yang memadai dan menjamin integritas data. Penelitian Sebelumnya Penelitian mengenai pencarian dokumen penelitian sudah banyak dilakukan. Ding et al. (2000) mengembangkan Bibliometric Information Retrieval System (BIRS) yaitu sebuah sistem temu kembali informasi dokumen penelitian dengan antarmuka web. BIRS dirancang dan diimplementasikan sebagai sebuah perangkat lunak untuk memperluas dan memperbaiki pertanyaan pengguna dengan cara yang efisien, mudah, dan dapat diakses secara global. BIRS dihubungkan pada 3 jenis mesin pencari: mesin pencari di internet, perpustakaan, dan basis data yang dapat diakses secara online (lihat Gambar 1). Klink et al. (2004) mengembangkan sistem berbasis web untuk menelusuri dokumen penelitian dengan membagi sistem menjadi 3 buah modul sistem yaitu GUI layer, Visualization layer, dan Data Layer yang diberi nama Framework DBL Browser (lihat Gambar 2). Pada penerapan hasil pencarian, modul ini menggunakan visualisasi dalam bentuk teks dan grafik.
5
Gambar 1 Contoh tampilan BIRS (Ding et al. 2000).
Web Client
textual: - authors - publications - conferences
GUI Layer
graphical: - authors maps - coauthor nets - ...
Visualization Layer
Information Retrieval Support Data Layer
Memory-Database
Compressed Data-File
Gambar 2 Framework DBL Browser (Klink et al. 2004). Visualisasi dalam bentuk teks yang diterapkan menggunakan HTML dalam bentuk tabel yang berisi informasi dokumen dan pengarang. Sedangkan untuk visualisasi dalam bentuk grafik, dibuat 2 buah grafik. Grafik pertama menggambarkan hubungan antara seorang pengarang dan pengarang lainnya yang
6
sama-sama menulis pada dokumen yang sama (Coauthor Relationship Graph). Grafik kedua menggambarkan hubungan antar-jurnal dengan tujuan mendapatkan jurnal yang banyak dijadikan referensi oleh jurnal lainnya. Penelitian Klink et al. (2004) mengasumsikan bahwa jurnal yang banyak diminati merupakan jurnal yang menjadi dasar pengembangan ilmu pada sebuah tema tertentu. Penelitian yang berkaitan mengenai entri daftar pustaka sudah banyak dilakukan (Gardfield 1972, Day et al. 2005, Hetzner 2008). Algoritme sudah dikembangkan untuk mengenali pola kalimat daftar pustaka. Salah satunya adalah ParaTools yang merupakan sekumpulan koleksi fungsi berbasis bahasa pemrograman Perl yang menggunakan template untuk mengekstrak metadata dari entri daftar pustaka (Jewell 2011). Gupta et al. (2009) juga mengembangkan metode untuk mengekstrak dokumen penelitian yang menggunakan kombinasi dari ekspresi regular berdasarkan heuristik dan sistem pengetahuan untuk mencari entri daftar pustaka. Metode ekstraksi dokumen penelitian lainnya juga pernah dikembangkan oleh Huang et al. (2004) menggunakan Basic Local Alignment Search Tool (BLAST). BLAST adalah aplikasi pencarian kesamaan yang menggunakan pemrograman dinamik. Basis data digunakan untuk menyimpan format entri daftar pustaka. Basis data yang dibuat dapat memisahkan field dari entri daftar pustaka dengan baik. Penelitian lainnya yang berkaitan dengan penelitian ini ialah penelitian mengenai visualisasi dari hasil pencarian dokumen penelitian. Anegón et al. (2004) mengembangkan metode untuk membuat klasifikasi dari dokumen rujukan terhadap sebuah dokumen penelitian berdasarkan kelas dan kategori dari dokumen penelitian. Penelitian tersebut mengusulkan sebuah teknik baru yang menggunakan klasifikasi tematik (kelas dan kategori) sebagai entitas pengarang bersama. Lin et al. (2003) juga membuat prototipe sistem visualisasi hasil pencarian dokumen penelitian berdasarkan analisis co-author dan memvisualisasikan dalam bentuk peta dengan algoritme visualisasi seperti Kohonen's feature maps dan pathfinder network. Sistem yang dikembangkan disebut AuthorLink dan dapat menghasilkan grafik interaktif pengarang dari basis data. Visualisasi menunjukkan pengelompokan subjek dan hubungan antar-pengarang berdasarkan kesamaan bidang ilmu. Melalui antarmuka interaktif pengguna dapat memanfaatkan informasi tersebut untuk memperbaiki query dan mengambil dokumen (lihat Gambar 3). Penelitian lainnya dilakukan untuk memetakan disiplin dari ilmu untuk membandingkan dan memetakan keahlian dari pengarang dokumen penelitian berdasarkan arsip personal dari bibiliografi (Murray et al. 2006). Untuk melaksanakan pendekatan baru, penelitian tersebut meminta ahli pada bidang tertentu untuk berbagi file bibtex atau EndNote. Dengan menggunakan kedua jenis file tersebut diterapkan pengambilan data, pembersihan data, dan integrasi lalu disajikan statistik sederhana, analisis, dan hasil visualisasi grafik disiplin ilmu berdasarkan grafik pengarang bersama (lihat Gambar 4).
7
Gambar 3 Sebuah visualisasi pengarang untuk peraih Nobel Herbert Simon, ditampilkan dalam format Kohonen (Lin et al. 2003)
Gambar 4 Pengarang bersama (kiri) dan pengarang bersama yang telah menulis setidaknya 2 dokumen (kanan) (Murray et al. 2006) Metode Pengukuran Sistem Temu Kembali Informasi Pengukuran kinerja pada sistem temu kembali informasi menggunakan perhitungan recall dan precission. Recall merupakan rasio dari dokumen relevan pada koleksi yang berhasil ditemukembalikan oleh sistem dibandingkan dengan seluruh dokumen relevan yang seharusnya ditemukembalikan (Manning et al. 2008). Recall dapat dirumuskan sebagai berikut:
8
Recall =
jumlah dokumen relevan ∩ jumlah dokumen terambil jumlah dokumen relevan
Precision merupakan rasio dari jumlah dokumen yang relevan yang berhasil ditemukembalikan oleh sistem dibandingkan dengan jumlah dokumen yang ditemukembalikan. Precision dapat dirumuskan sebagai berikut: Precision =
jumlah dokumen relevan ∩ jumlah dokumen terambil jumlah dokumen terambil
Sistem Temu Kembali Informasi Dokumen Penelitian yang Telah Ada Google memiliki mesin pencari untuk mencari dokumen penelitian dengan alamat http://scholar.google.com. Mesin pencari tersebut memiliki aplikasi yang bernama Google Scholar Citations dengan alamat URL http://scholar.google.com/citations yang digunakan untuk memasukkan publikasi penelitian yang dimiliki oleh pengguna lalu menelusuri publikasi tersebut berdasarkan dokumen penelitian lain yang merujuk ke publikasi yang dimiliki. Ilustrasi aplikasi Google Scholar Citations dapat dilihat pada Gambar 5.
Gambar 5 Google Scholar Citations Selain Google, Microsoft juga membuat sebuah mesin pencari yang diberi nama Microsoft Academic Search untuk mencari dokumen penelitian dengan alamat URL http://academic.research.microsoft.com. Mesin pencari tersebut memiliki fasilitas untuk menampilkan Co-Author Graph, Co-Author Path, Citation Graph, dan Genealogy Graph yang dapat memvisualisasikan hubungan seorang pengarang dengan pengarang lainnya. Fasilitas tersebut dapat menyajikan hubungan antara seorang pengarang dan pengarang lainnya dari rujukan yang dimiliki pada setiap dokumen penelitian. Ilustrasi visualisasi Microsoft Academic Search dapat dilihat pada Gambar 6. Aplikasi yang dikembangkan oleh Google dan Microsoft dapat digunakan secara umum saat ini, namun aplikasi tersebut tidak dapat dimodifikasi untuk dapat mengekstrak entri daftar pustaka pada dokumen penelitian dengan format khusus. Penelitian ini diharapkan dapat melakukan ekstraksi entri daftar pustaka dari data berupa dokumen skripsi pada Departemen Ilmu Komputer, Institut Pertanian Bogor.
9
Gambar 6 Ilustrasi Micorosoft Academic Search
3 METODOLOGI PENELITIAN Penelitian ini akan membuat sebuah modul di dalam sistem temu kembali informasi dokumen penelitian. Modul yang dibuat nantinya akan mengambil masukan berupa informasi dari dokumen penelitian yaitu dokumen skripsi secara manual disertai dengan file PDF. File PDF akan diubah menjadi teks yang selanjutnya diidentifikasi untuk mendapatkan bagian entri daftar pustaka. Bagian entri daftar pustaka tersebut diekstrak untuk mendapatkan metadata yang diinginkan yang selanjutnya disimpan ke dalam basis data. Basis data yang menyimpan informasi entri daftar pustaka tersebut digunakan untuk menampilkan visualisasi dari hasil pencarian dokumen penelitian. Kerangka Pemikiran Penelitian dimulai dengan pengumpulan dokumen skripsi dalam bentuk file PDF. File PDF dikonversi menjadi teks dan disimpan ke dalam basis data dokumen penelitian. Bab daftar pustaka dari dokumen skripsi dipelajari formatnya untuk digunakan pada proses identifikasi entri daftar pustaka. Teks hasil konversi dokumen skripsi yang sudah tersimpan pada basis data diidentifikasi dan diekstrak untuk mendapatkan entri daftar pustaka dari dokumen skripsi. Entri daftar pustaka yang diperoleh lalu disimpan pada basis data sebagai sumber data pencarian pada sistem temu kembali dokumen penelitian. Selain itu, penelitian ini juga dibuat sebuah modul untuk menampilkan visualisasi hubungan antarpengarang dokumen dalam bentuk grafik. Pada tahap akhir penelitian, dilakukan pengukuran kinerja sistem yang menggunakan seluruh data dokumen skripsi dan entri daftar pustaka yang berhasil diekstrak yang sudah disimpan pada basis data. Metode penelitian yang dilakukan dapat dilihat pada Gambar 7.
10
Mulai
Pengumpulan dan pembuatan basis data dokumen penelitian
Ekstraksi dan identifikasi atribut entri daftar pustaka
Pembangunan sistem temu kembali dokumen penelitian
Pembuatan visualisasi hubungan antarpengarang
Pengujian sistem
Selesai
Gambar 7 Metodologi penelitian Pengumpulan dan Pembuatan Basis Data Dokumen Penelitian Proses pembuatan basis data dokumen penelitian dimulai dari proses pengumpulan dokumen penelitian yang merupakan dokumen skripsi dalam bentuk file PDF. Setiap file PDF dibaca dan dicatat secara manual untuk mendapatkan data utama dari dokumen. Data utama dari dokumen terdiri atas judul dokumen, pengarang, pembimbing, tahun, dan penerbit. Selanjutnya file PDF akan dikonversi menjadi teks, lalu data utama dokumen yang sudah dicatat beserta teks hasil konversi file PDF disimpan ke dalam basis data. Hal ini dilakukan pada setiap dokumen skripsi. Data yang sudah tersimpan pada basis data selanjutnya digunakan untuk proses ekstraksi dan identifikasi atribut entri daftar pustaka. Ilustrasi pembuatan basis data dokumen penelitian dapat dilihat pada Gambar 8. Setelah membuat basis data dokumen penelitian, proses selanjutnya adalah ekstraksi dan identifikasi atribut entri daftar pustaka pada dokumen penelitian. Setiap teks pada dokumen penelitian dibaca oleh sistem untuk mengekstrak kumpulan entri daftar pustaka yang terletak pada bab daftar pustaka. Kumpulan entri daftar pustaka selanjutnya disimpan ke dalam tabel pada basis data untuk dilanjutkan pada proses pengidentifikasian atribut entri daftar pustaka. Proses identifikasi atribut entri daftar pustaka dilakukan oleh sebuah modul pada sistem yang berfungsi mengenali model dari sebuah entri daftar pustaka serta setiap atributnya.
11
Dokumen skripsi berbentuk PDF
Konversi file PDF
Pencatatan data utama dokumen skripsi
Dokumen skripsi dalam bentuk teks
Basis data dokumen penelitian
Gambar 8 Pembuatan basis data dokumen penelitian Ekstraksi dan Identifikasi Atribut Entri Daftar Pustaka Atribut yang berhasil dikenali oleh sistem dari sebuah entri daftar pustaka disimpan ke dalam tabel dokumen. Sebelum proses penyimpanan dilakukan, setiap atribut entri daftar pustaka diperiksa untuk mendapatkan kemungkinan adanya entri daftar pustaka yang sama sudah tersimpan pada tabel dokumen. Hal ini bertujuan untuk menghindari adanya dokumen yang sama tersimpan beberapa kali pada tabel dokumen. Proses ekstraksi dan identifikasi atribut entri daftar pustaka untuk mendapatkan dilakukan dengan menggunakan aplikasi Perl bernama ParaTools (Jewell 2011). ParaTools memiliki 2 buah modul, yang pertama bernama Biblio Document Parser untuk melakukan ekstraksi entri daftar pustaka dan yang kedua bernama Biblio Citation Parser yang digunakan untuk mengindentifikasi atribut entri daftar pustaka. Kedua modul ParaTools tersebut dimodifikasi agar dapat melakukan ekstraksi dan identifikasi atribut entri daftar pustaka pada dokumen skripsi. Pembangunan Sistem Temu Kembali Dokumen Penelitian Sistem temu kembali yang dikembangkan terdiri atas 3 buah komponen yaitu backend, mesin pencari, dan antarmuka pengguna. Backend merupakan bagian dari sistem temu kembali yang digunakan untuk memasukkan dan memproses file dokumen penelitian menjadi basis data dokumen penelitian dan basis data entri daftar pustaka. Pada backend, dokumen penelitian dalam bentuk file PDF dibaca, diekstrak, dan diidentifikasi oleh sistem untuk mendapatkan data yang selanjutnya disimpan ke dalam basis data. Basis data digunakan oleh komponen mesin pencari untuk pembuatan kumpulan indeks yang digunakan untuk pencarian dokumen peneltian. Komponen mesin pencari merupakan sub sistem untuk melakukan proses pencarian dokumen. Mesin pencari melakukan proses pencarian dokumen
12
berdasarkan kata pencarian yang diperoleh dari pengguna yang dimasukkan pada komponen antarmuka. Komponen yang ketiga yaitu antarmuka pengguna merupakan sub sistem yang berhadapan langsung dengan pengguna dalam melakukan pencarian. Komponen antarmuka pengguna memiliki proses pembuatan visualisasi hasil pencarian dalam bentuk grafik. Arsitektur dari sistem temu kembali informasi dokumen penelitian dapat dilihat pada Gambar 9. Antarmuka Pengguna Teks
Urutan Hasil Pencarian Teks terstruktur Pengurutan Hasil Pencarian Hasil Pencarian
Teks
Operasi Teks
Pembuatan Kueri Kueri
Pencarian Dokumen
Basis data Dokumen Penelitian
Teks terstruktur Pembuatan Indeks Inverted Index
Basis data Indeks
Gambar 9 Arsitektur sistem temu kembali informasi dokumen penelitian Sistem temu kembali dokumen penelitian
Entri dokumen PDF
Pencarian dokumen penelitian
Operator
Pengguna Pencarian kesamaan nama pengarang
Visualisasi hasil pencarian
Visualisasi hubungan pengarang
Gambar 10 Model proses sistem temu kembali informasi dokumen penelitian Sistem temu kembali informasi yang dikembangkan memiliki 5 proses utama. Pada bagian antarmuka backend terdapat 2 proses yaitu entri dokumen PDF dan Pencarian kesamaan nama pengarang. Sedangkan, antarmuka frontend memiliki 3
13
proses yaitu pencarian dokumen penelitian, visualisasi hasil pencarian, dan visualisasi hubungan pengarang. Untuk lebih jelasnya dapat dilihat pada Gambar 10. Pembuatan Visualiasasi Hubungan Antar-Pengarang Data hasil ekstraksi dan identifikasi atribut entri daftar pustaka dari dokumen skripsi yang sudah tersimpan pada basis data dapat digunakan untuk menghasilkan grafik hubungan antar-pengarang. Seorang pengarang dapat dianggap sebagai node pusat dan pengarang yang merujuk atau dirujuk oleh menjadi node cabang. Hal ini membuat grafik yang dihasilkan berbentuk jaringan. Ilustrasi dari visualisasi hubungan antar-pengarang dapat dilihat pada Gambar 11. Merujuk Pengarang X
Merujuk Pengarang Y
…
Pengarang
Dirujuk oleh Pengarang A
Dirujuk oleh Pengarang B
…
Gambar 11 Visualisasi dokumen penelitian Pengujian Sistem Pengukuran Kinerja Ekstraksi dan Identifikasi Atribut Entri Daftar Pustaka pada Setiap Dokumen Penelitian Pengukuran ekstraksi dan identifikasi atribut entri daftar pustaka pada setiap dokumen dilakukan dengan mengukur recall dan precision dari setiap entri daftar pustaka yang dihasilkan oleh sistem. Selanjutnya setiap nilai recall dan precision digunakan untuk menghitung presentase recall dan precision. Pengukuran dari ekstraksi dan identifikasi atribut entri daftar pustaka dapat dinotasikan sebagai berikut: • Set entri daftar pustaka pada sebuah dokumen penelitian ke-i diberi notasi Bi • Set entri daftar pustaka yang berhasil diekstrak dan diidentifikasi dari dokumen penelitian ke-i oleh sistem diberi notasi Ei • Recall dari ekstraksi dan identifikasi atribut entri daftar pustaka pada dokumen penelitian ke-i diberi notasi Rbi • Precision dari ekstraksi dan identifikasi atribut entri daftar pustaka pada dokumen penelitian ke-i diberi notasi Pbi Dengan notasi tersebut dapat dibuat fungsi recall dan precision pada setiap dokumen menjadi:
14
Bi ∩ Ei Bi Rbi merupakan pengukuran rasio antara jumlah hasil ekstraksi dan identifikasi atribut entri daftar pustaka dengan jumlah entri daftar pustaka pada dokumen penelitian ke-i. Rbi akan bernilai 1 jika sistem dapat mengekstrak dan mengidentifikasi dengan benar seluruh entri daftar pustaka pada dokumen penelitian ke-i. Bi ∩ Ei Pbi = Ei Pbi mengukur rasio antara jumlah entri daftar pustaka yang terekstrak dan teridentifikasi oleh sistem dengan jumlah entri daftar pustaka pada dokumen penelitian ke-i. Pbi akan bernilai 1 jika jumlah hasil ekstraksi dan identifikasi atribut entri daftar pustaka sama dengan jumlah entri daftar pustaka yang terdapat pada dokumen penelitian ke-i. Dari kedua persamaan tersebut, maka dapat dihitung persentase recall dan precision dari hasil ekstraksi dan identifikasi atribut entri daftar pustaka pada seluruh dokumen dengan rumus sebagai berikut: Rbi =
PRb = PPb =
n i=1 Rbi
n
n i=1 Pbi
n
×100% ×100%
Keterangan: • PRb merupakan persentase recall dari entri daftar pustaka yang berhasil diekstrak dan diidentifkasi pada seluruh dokumen penelitian • PPb merupakan persentase precision dari entri daftar pustaka yang berhasil diekstrak dan diidentifikasi pada seluruh dokumen penelitian • n merupakan jumlah dari dokumen penelitian Pengukuran Kinerja Hubungan Entri Daftar Pustaka dengan Dokumen Pengukuran kinerja hubungan entri daftar pustaka dengan dokumen dilakukan dengan mengukur recall dan precision dari jumlah dokumen penelitian yang memiliki entri daftar pustaka tertentu pada sistem. Pengukurannya dapat dinotasikan sebagai berikut: • Set dokumen penelitian yang memiliki entri daftar pustaka ke-i diberi notasi Ci • Set dokumen penelitian yang memiliki entri daftar pustaka ke-i yang dihasilkan oleh sistem diberi notasi Fi • Recall dari dokumen penelitian yang memiliki entri daftar pustaka ke-i diberi notasi Rci • Precision dari dokumen penelitian yang memiliki entri daftar pustaka ke-i diberi notasi Pci Dengan notasi tersebut dapat dibuat fungsi recall dan precision menjadi: Rci =
Ci ∩ Fi Ci
Rci merupakan pengukuran rasio dari jumlah dokumen yang memiliki entri daftar pustaka ke-i dengan jumlah dokumen yang memiliki entri daftar pustaka
15
ke-i yang dihasilkan oleh sistem. Rci akan bernilai 1 jika seluruh anggota Ci merupakan anggota Fi. Ci ∩ Fi Pci = Fi Pci akan bernilai 1 jika seluruh anggota Fi merupakan anggota Ci. Dari kedua persamaan tersebut, maka dapat dicari persentase recall dan precision dari seluruh jumlah entri daftar pustaka yang terhubung ke dokumen dengan rumus sebagai berikut: n i=1 Rci PRc = ×100% n n i=1 Pci ×100% PPc = n Keterangan: • PRc merupakan persentase recall dari dokumen penelitian yang memiliki entri daftar pustaka • PPc merupakan persentase precision dari dokumen penelitian yang memiliki entri daftar pustaka • n merupakan jumlah dari dokumen penelitian
4 HASIL DAN PEMBAHASAN Pengumpulan Data Data yang digunakan pada penelitian ini adalah dokumen hasil penelitian mahasiswa sarjana (dokumen skripsi) Departemen Ilmu Komputer Institut Pertanian Bogor dalam bentuk file PDF. Dokumen skripsi diperoleh dari Perpustakaan Departemen Ilmu Komputer sebanyak 246. Seluruh dokumen skripsi yang diperoleh digunakan sebagai sumber data utama serta sebagai bahan pengujian pada sistem temu kembali dokumen penelitian yang dikembangkan pada penelitian ini. Karakteristik Dokumen Skripsi Dokumen skripsi yang diperoleh memiliki karakteristik yang harus dipelajari terlebih dahulu sebelum melakukan proses ekstraksi entri daftar pustaka. Secara umum karakteristik dokumen skripsi yang berkaitan dengan entri daftar pustaka adalah sebagai berikut: 1 Isi tulisan sebagian besar memiliki format dua kolom, kecuali halaman judul, halaman pengesahan, halaman kata pengantar, halaman riwayat penulis, halaman daftar isi, halaman daftar gambar, halaman daftar tabel, halaman daftar lampiran, dan halaman lampiran. 2 Pergantian bab tidak menggunakan halaman baru. Hal ini memungkinkan terdapatnya 2 bab pada halaman yang sama. 3 Kumpulan entri daftar pustaka terletak diantara bab daftar pustaka dan sebuah halaman yang bertuliskan kata Lampiran. 4 Dokumen skripsi yang diperoleh memiliki judul bab yang berupa kalimat dengan diawali huruf besar (contoh: Daftar Pustaka) atau dapat berupa kalimat yang memiliki huruf besar semua (contoh: DAFTAR PUSTAKA).
16
Format Entri Daftar Pustaka Penulisan skripsi pada Institut Pertanian Bogor menggunakan aturan dari buku Pedoman Penulisan Karya Ilmiah yang diterbitkan oleh IPB Press. Buku Pedoman Penulisan Karya Ilmiah digunakan sebagai panduan setiap mahasiswa dalam menulis dokumen ilmiah seperti laporan, skripsi, tesis, disertasi, dan dokumen ilmiah lainnya di lingkungan IPB. Entri daftar pustaka pada dokumen skrispsi yang diperoleh seharusnya menggunakan format daftar pustaka yang terdapat pada buku Pedoman Penulisan Karya Ilmiah. Buku Pedoman Penulisan Karya Ilmiah yang digunakan sebagai acuan untuk melakukan ekstraksi entri daftar pustaka pada penelitian ini menggunakan Pedoman Penulisan Karya Ilmiah edisi ke 1, 2, dan 3 (IPB 2001, IPB 2004, IPB 2012). Entri daftar pustaka pada dokumen skripsi Departemen Ilmu Komputer memiliki format dua kolom. Sebuah entri daftar pustaka dapat menjadi beberapa baris. Baris kedua dan seterusnya pada sebuah entri daftar pustaka memiliki posisi lebih menjorok ke kanan dibandingkan dengan baris pertama. Gambar 12 merupakan contoh tampilan dari entri daftar pustaka pada dokumen skripsi.
Gambar 12 Entri daftar pustaka pada dokumen skripsi Perancangan Basis Data Dokumen Penelitian Tahap selanjutnya dari penelitian ini adalah perancangan basis data dokumen penelitian. Perancangan basis data dimulai dari perancangan konseptual yang merupakan proses identifikasi entitas yang ada pada sistem temu kembali dokumen penelitian. Entitas utama dari sistem adalah dokumen skripsi yang memiliki pengarang, pembimbing, dan entri daftar pustaka. Identifikasi dari entitas sistem temu kembali dokumen penelitian adalah sebagai berikut: 1 Skripsi memiliki seorang pengarang, pengarang hanya dapat menulis sebuah skripsi. 2 Skripsi memiliki seorang pembimbing. 3 Skripsi memiliki 1 atau beberapa entri daftar pustaka. 4 Entri daftar pustaka merupakan dokumen. 5 Format entri daftar pustaka dapat menjadi beberapa jenis.
17
6
Jenis dokumen entri daftar pustaka dapat berupa buku, jurnal, prosiding, dan dokumen web. 7 Setiap dokumen dapat memiliki beberapa pengarang, dan seorang pengarang dapat menulis beberapa dokumen. 8 Seorang pengarang dapat menjadi pembimbing skripsi dan mahasiswa atau bukan keduanya. Berdasarkan hasil identifikasi entitas pada perancangan basis data dokumen penelitian, rancangan konseptual disajikan pada Gambar 13. Membimbing
Dibimbing Skripsi
Pengarang Menulis
Jurnal
o
Pembimbing Mahasiswa
Ditulis d
Dokumen
Prosiding
Website
Gambar 13 Perancangan konseptual basis data dokumen penelitian Dari perancangan konseptual basis data dokumen penelitian diketahui bahwa dokumen dapat digolongkan menjadi beberapa jenis. Dari hal ini, basis data dokumen penelitian yang dibuat dapat menerapkan teknik Enhanced Entity Relationship (EER). EER digunakan untuk mengidentifikasi model yang telah dihasilkan dengan memperluas model ER asli. Teknik ini membuat model EER mirip dengan pemodelan data berorientasi objek (Hoffer et al. 2011). Pada perancangan konseptual, entitas dokumen dapat dibuat menjadi relasi supertype dan subtype. Relasi ini membuat model umum (supertype) dari dokumen dan membuat dokumen tersebut menjadi beberapa jenis yang lebih spesifik (supertype). Setiap subtype memiliki atribut yang diwarisi dari supertypenya. Entitas dokumen dapat dijadikan supertype dengan mengambil atribut yang dimiliki oleh setiap atribut subtype-nya. Ilustrasi dari supertype dan subtype dokumen dapat dilihat pada Gambar 14. Pada perancangan konseptual, entitas pengarang dapat dibuat menjadi relasi supertype dan subtype. Relasi ini membuat model umum (supertype) dari pengarang dan membuat pengarang tersebut menjadi beberapa jenis yang lebih
18
spesifik (supertype). Ilustrasi dari supertype dan subtype pengarang dapat dilihat pada Gambar 15. Perancangan logikal dari basis data dokumen penelitian menambahkan informasi data sebagai penghubung antar-entitas pada rancangan konseptual untuk disimpan pada aplikasi basis data. Rancangan logikal dari basis data dokumen penelitian dapat dilihat pada Gambar 16 serta perancangan fisik basis data dokumen penelitian dapat dilihat pada Gambar 17. Dokumen ID Dokumen Judul Pengarang File Isi Tahun column_n data_t Penerbit ame ype Tipe Dokumen
Tipe Dokumen = d "jurnal"
"skripsi"
"prosiding"
Jurnal
Skripsi
Nama Jurnal column_nam data_typ Volume eHalaman e
Pembimbing column_ data_ name type
"website"
Prosiding
Website
Nama Prosiding column_na data_ty Lokasi me pe Tanggal
URL column_n data_t ame ype
Gambar 14 Supertype dan subtype pada dokumen
Pengarang ID Pengarang nama pengarang Tipe Pengarang
Tipe Pengarang = o "pembimbing" pembimbing column_ data_ name type
"mahasiswa" mahasiswa NIM
Gambar 15 Supertype dan subtype pada pengarang
19
Jurnal Pustaka
DokumenID Nama Jurnal Volume
PustakaID
Halaman
DokumenID
DokumenSumberID Entri Daftar Pustaka
Prosiding DokumenID Nama Prosiding
Dokumen d
DokumenID
DokumenPengarang
Judul
Lokasi Tanggal
DokumenID
TipeDokumen File
PengarangID
Isi Penerbit
Website
Pengarang
Tahun
DokumenID
PengarangID
URL
Nama
o
Skripsi Pembimbing
DokumenID PembimbingID
Mahasiswa
PengarangID
PengarangID NIM
Gambar 16 Perancangan logikal basis data dokumen penelitian Jurnal int
DokumenID
varchar
nama_jurnal
Pustaka
varchar
volume
int
varchar
halaman
int
DokumenSumberID
int
DokumenID
text
rujukan
Dokumen
Prosiding
PustakaID
int
DokumenID
int
DokumenID
varchar
nama_prosiding
varchar
judul
varchar
lokasi
enum
tipe
date
tanggal
varchar
file
int
DokumenID
text
teks
int
PengarangID
varchar
penerbit
year
tahun
Website int
DokumenID
varchar
url
d
DokumenPengarang
Pengarang int
PengarangID
varchar
nama_pengarang
o
Skripsi int
DokumenID
int
PembimbingID
Pembimbing int
PengarangID
Mahasiswa int
PengarangID
varchar
nim
Gambar 17 Perancangan fisik basis data dokumen penelitian Pengolahan Data Setelah mengumpulkan dan mempelajari dokumen skripsi serta merancang basis data, hal yang dilakukan adalah membangun modul pada sistem yang dapat
20
mengenali kumpulan entri daftar pustaka dari setiap dokumen skripsi dan menyimpan entri daftar pustaka pada basis data. Kumpulan entri daftar pustaka pada dokumen skripsi terletak pada bab Daftar Pustaka dengan format penulisan 2 kolom. Sebuah entri daftar pustaka dapat seluruh barisnya terletak pada sebuah kolom dan dapat sebagian barisnya terletak pada kolom yang berbeda. Modul yang dibuat harus dapat mengenali setiap entri daftar pustaka dengan kondisi tersebut. Agar dapat melakukan hal tersebut, maka pada proses pengolahan data pada modul yang dibuat meliputi 3 tahap yaitu pengubahan file dokumen skripsi dari bentuk file PDF menjadi teks, ekstraksi entri daftar pustaka, dan identifikasi atribut entri daftar pustaka. Pengubahan File Dokumen Skripsi dalam Bentuk PDF Menjadi Teks Proses mengubah file dokumen skripsi dalam bentuk PDF menjadi teks menggunakan aplikasi pdftotext. Proses ini hanya dapat dilakukan untuk file PDF yang tidak dibatasi pada proses penyalinan isi. Sebuah file PDF dokumen skripsi diubah menjadi 2 bentuk teks dengan format berbeda. Pengubahan yang pertama menghasilkan format raw text dan pengubahan yang kedua menghasilkan format layout text. Aplikasi pdftotext akan membaca setiap baris kalimat pada file PDF lalu menyimpan setiap baris kalimat tersebut ke dalam file teks. Pengubahan file PDF menjadi format raw text dilakukan untuk mendapatkan teks dalam bentuk berurut dengan format satu kolom. Pada file PDF dokumen skripsi yang memiliki 2 kolom, pdftotext akan membaca dan memindahkan setiap baris pada halaman pertama kolom pertama, halaman pertama kolom kedua, halaman kedua kolom pertama, halaman kedua kolom kedua, dan begitu seterusnya hingga halaman terakhir dari file PDF (lihat Gambar 18). Format raw text juga mengubah 2 atau lebih spasi yang berdekatan pada tulisan menjadi sebuah spasi. Hasil dari pengubahan file PDF menjadi teks dengan format raw text dapat dilihat pada Gambar 19. Pengubahan file PDF yang menghasilkan format layout text digunakan untuk mendapatkan posisi dari teks pada dokumen skripsi yang digunakan untuk mengidentifikasi sebuah entri daftar pustaka. Hasil konversi aplikasi pdftotext dengan menerapkan format layout text akan menghasilkan file teks yang berisi tulisan yang sama bentuknya dengan file PDF. Pada file PDF dokumen skripsi yang memiliki dua kolom, maka akan dihasilkan file teks dengan bentuk dua kolom (lihat Lampiran 1). Ekstraksi Entri Daftar Pustaka Setelah dokumen skripsi dalam bentuk PDF diubah menjadi teks, tahap selanjutnya adalah melakukan ekstraksi entri daftar pustaka. File teks berformat raw text hasil konversi dokumen skripsi digunakan untuk memisahkan kumpulan baris entri daftar pustaka dengan baris lainnya. Pada dokumen skripsi, baris kumpulan entri daftar pustaka terletak di antara baris yang berisi kata Daftar Pustaka dan Lampiran. Proses pemisahan kumpulan entri daftar pustaka menggunakan modul dari ParaTools yang bernama Biblio Document Parser. Modul Biblio Document Parser awalnya digunakan untuk mendapatkan setiap baris entri daftar pustaka pada dokumen-dokumen dengan format standar internasional. Modul ini akan memeriksa setiap kalimat pada file berformat raw text dari baris pertama hingga baris terakhir. Agar dapat digunakan untuk mengekstrak dokumen skripsi Institut Pertanian Bogor, modul Biblio Document
21
Parser dimodifikasi untuk mendapatkan setiap baris yang terletak di antara baris yang hanya berisi kata Daftar Pustaka dan kata Lampiran karena baris-baris yang terletak di antara kedua baris tersebut dianggap sebagai kumpulan entri daftar pustaka. Modul ini selanjutnya menyimpan setiap baris yang dianggap sebagai kumpulan entri daftar pustaka. Benefits
div.text-col-intro div.text-col-1 h3
Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, p dapibus eget, nulla: Good value for money
h3
A
Benefits
Halaman 1
div.text-col-intro div.text-col-1 h3
Features
div.text-col-intro Text div.text-col-2 Box Columns h3
Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, p dapibus eget, nulla:
Nam turpis massa, congue ac, aliquam et. Quisque sed tellus quis nunc ultricies ultricies p congue ac, aliquam et.:
Good value for money
Transactional activation
h3
A
Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla. Quisque sed tellus quis nunc ultricies ultricies. Donec lectus lorem, laoreet vel, p venenatis id, pellentesque eget, leo. Sed tortor purus, consequat id, placerat id, lacinia id, purus. Ut mi. Fusce quis sapien.
Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla. Quisque sed tellus quis nunc ultricies ultricies. Donec lectus lorem, laoreet vel, p venenatis id, pellentesque eget, leo. Sed tortor purus, consequat id, placerat id, lacinia id, purus. Ut mi. Fusce quis sapien.
Features
div.text-col-2 div.text-col-intro h3
Nam turpis massa, congue ac, aliquam et. Quisque sed tellus quis nunc ultricies ultricies p congue ac, aliquam et.:
h3
B
Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla. Quisque sed tellus quis nunc ultricies ultricies. Donec lectus lorem, laoreet vel, venenatis id, p pellentesque eget, leo. Sed tortor purus, consequat id, placerat id, lacinia id, purus. Ut mi. Fusce quis sapien.
Transactional activation
h3
B
Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla. Quisque sed tellus quis nunc ultricies ultricies. Donec lectus lorem, laoreet vel, venenatis id, p pellentesque eget, leo. Sed tortor purus, consequat id, placerat id, lacinia id, purus. Ut mi. Fusce quis sapien. div.text-col-1 h3
Unlimited support div.text-col-1 h3
Unlimited support
Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla. Quisque sed tellus quis nunc ultricies ultricies. Donec lectus lorem, laoreet vel, venenatis id, pellentesque eget, leo. Sed tortor purus, consequat p
Halaman 2
id, placerat id, lacinia id, purus. Ut mi. Fusce quis sapien. Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla.
C
Product liability and guarantees
h3
Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla. Quisque sed tellus quis nunc ultricies ultricies. Donec p lectus lorem, laoreet vel,
Text div.text-col-2 Box Columns
Advanced cache strategies
h3
Sed tortor purus, consequat id, placerat id, lacinia id, purus. Ut mi. Fusce quis sapien. Aliquam consequat nulla sed mauris. Nam p turpis massa, congue ac, aliquam et, dapibus eget, nulla.
Scheduled backups
D
h3
Fusce quis sapien. Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla. Quisque sed tellus quis nunc ultricies ultricies. Donec lectus lorem, p laoreet vel, venenatis id, pellentesque eget, leo. Sed tortor purus, consequat id, placerat id, lacinia id, purus. Ut mi.
venenatis id, pellentesque eget, leo. Sed tortor purus, consequat id, placerat id, lacinia id, purus.
Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla. Quisque sed tellus quis nunc ultricies ultricies. Donec lectus lorem, laoreet vel, venenatis id, pellentesque eget, leo. Sed tortor purus, consequat p id, placerat id, lacinia id, purus. Ut mi. Fusce quis sapien. Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla.
C
Product liability and guarantees
h3
Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla. Quisque sed tellus quis nunc ultricies ultricies. Donec p lectus lorem, laoreet vel, venenatis id, pellentesque eget, leo. Sed tortor purus, consequat id, placerat id, lacinia id, purus. div.text-col-2
Advanced cache strategies
h3
Sed tortor purus, consequat id, placerat id, lacinia id, purus. Ut mi. Fusce quis sapien. Aliquam consequat nulla sed mauris. Nam p turpis massa, congue ac, aliquam et, dapibus eget, nulla.
PDF 2 kolom
D
Scheduled backups
h3
Fusce quis sapien. Aliquam consequat nulla sed mauris. Nam turpis massa, congue ac, aliquam et, dapibus eget, nulla. Quisque sed tellus quis nunc ultricies ultricies. Donec lectus lorem, p laoreet vel, venenatis id, pellentesque eget, leo. Sed tortor purus, consequat id, placerat id, lacinia id, purus. Ut mi.
Format Raw Text
Gambar 18 Konsep pengubahan file PDF menjadi format raw text
Gambar 19 Hasil pengubahan file PDF menjadi teks dengan format raw text Baris-baris kumpulan entri daftar pustaka yang berhasil didapatkan oleh sistem selanjutnya diidentifikasi untuk mendapatkan setiap kalimat entri daftar pustaka. Proses ekstraksi entri daftar pustaka dilakukan dengan menggunakan bantuan file teks berformat layout text hasil konversi file PDF. Setiap baris kumpulan entri daftar pustaka dibandingkan posisinya dengan baris file teks berformat layout text. Pada dokumen skripsi yang memiliki 2 kolom, sistem yang dibuat harus mengenali entri daftar pustaka dengan kondisi sebagai berikut: 1 Entri daftar pustaka seluruhnya terletak pada kolom pertama 2 Entri daftar pustaka seluruhnya terletak pada kolom kedua
22
3
Entri daftar pustaka bagian awalnya terletak pada kolom pertama dan bagian lainnya terletak pada kolom kedua 4 Entri daftar pustaka bagian awalnya terletak pada kolom kedua dan bagian lainnya terletak pada kolom pertama Dari kondisi posisi entri daftar pustaka tersebut, maka proses mengenali entri daftar pustaka menggunakan proses yang digambarkan pada Lampiran 2. Setelah diperoleh entri daftar pustaka dari kumpulan entri daftar pustaka, setiap entri daftar pustaka diproses untuk penyeragaman kalimat. Proses penyeragaman dilakukan karena terdapat beberapa karakter, kata, serta kalimat pada entri daftar pustaka memiliki kesalahan yang sudah ada pada penulisan entri daftar pustaka atau kesalahan dapat terjadi pada saat proses memisahkan entri daftar pustaka dari kumpulan entri daftar pustaka. Penyeragaman entri daftar pustaka bertujuan untuk mempermudah proses identifikasi atribut entri daftar pustaka pada tahap berikutnya. Proses penyeragaman entri daftar pustaka adalah sebagai berikut: 1 Menghilangkan karakter spasi di awal dan akhir entri daftar pustaka. 2 Mengubah 2 karakter spasi atau lebih yang berdekatan menjadi sebuah karakter spasi. 3 Memberikan titik (.) pada setiap akhir entri daftar pustaka. 4 Mengubah kata/karakter “hlm”, “halaman”, “pp”, “h”, “pages” yang diikuti dengan nomor halaman menjadi hlm. 5 Mengubah kata Vol, Volume yang diikuti dengan digit menjadi vol. 6 Mengubah kalimat “proceedings of”, “Proc. of”, “proceeding of” menjadi “Proceedings of”. 7 Mengubah kata-kata format skripsi, tesis, disertasi, thesis, dissertation menjadi [skripsi], [tesis], [disertasi]. 8 Mengubah kata “dalam:”, “di dalam:”, “in:” menjadi “Di dalam:”. 9 Mengubah kata Editor, (editor), (eds) menjadi editor. 10 Menyeragamkan format versi dari nama aplikasi (contoh: oracle 9. 0. 1 menjadi oracle 9.0.1 ) Identifikasi Atribut Entri Daftar Pustaka Modul identifikasi atribut entri daftar pustaka dibuat untuk mendapatkan kolom-kolom dari sebuah entri daftar pustaka. Kolom-kolom hasil idetifikasi atribut entri daftar pustaka terdiri atas 2 kategori yaitu umum dan spesifik. Kolom-kolom yang dihasilkan oleh proses ini selanjutnya disimpan ke dalam basis data. Tahapan ekstrak entri daftar pustaka dapat dilihat pada Gambar 20. Pada sebuah entri daftar pustaka akan berisi kolom-kolom yang merupakan metadata. Kolom-kolom akan dibatasi oleh tanda titik dilanjutkan dengan spasi (. ), koma dilanjutkan dengan spasi (, ), titik dua (:), titik koma (;), terletak di dalam kurung, dan lain sebagainya. Contoh kolom pada entri daftar pustaka dapat dilihat pada Gambar 21. Pengenalan kolom pada entri daftar pustaka dilakukan dengan cara membandingan kalimat entri daftar pustaka dengan beberapa model entri daftar pustaka yang sudah dibuat. Sebuah entri daftar pustaka yang formatnya sama dengan sebuah model, kemungkinan besar akan menghasilkan kolom-kolom yang benar. Sebuah entri daftar pustaka dapat memiliki format sama dengan beberapa model, sehingga sistem harus dapat menentukan model yang dianggap paling
23
sesuai dengan entri daftar pustaka yang dibandingkan. Proses pemilihan model yang paling sesuai oleh sistem akan dibahas selanjutnya. Mulai
Entri daftar pustaka
Perbandingan entri daftar pustaka dengan model entri daftar pustaka
Model entri daftar pustaka
Model-model entri daftar pustaka yang cocok
Pemilihan model entri daftar pustaka yang paling sesuai
Ekstrak kolom entri daftar pustaka
Penyimpanan kolom entri daftar pustaka ke basis data
Selesai
Gambar 20 Tahapan esktrak entri daftar pustaka Setiawan, D. 2003. Teknologi Selular dan CDMA. Jakarta: PT Elex Media Komputindo. Kolom 1 : Setiawan, D Kolom 2 : 2003 Kolom 3 : Teknologi Selular dan CDMA Kolom 4 : Jakarta Kolom 5 : PT Elex Media Komputindo
Gambar 21 Kolom entri daftar pustaka Hasil identifikasi atribut entri daftar pustaka adalah kolom-kolom yang terdiri atas 2 jenis yaitu umum dan spesifik. Kolom-kolom berjenis umum yang dihasilkan oleh proses ini adalah kolom yang terdapat pada hampir setiap entri daftar pustaka. Kolom berkategori spesifik merupakan kolom entri daftar pustaka yang hanya dimiliki oleh jenis entri daftar pustaka tertentu. Kolom-kolom spesifik juga digunakan untuk mengklasifikasikan entri daftar pustaka. Klasifikasi entri daftar pustaka yang terdapat pada dokumen skripsi terdiri atas buku,
24
skripsi/tesis/disertasi, jurnal, prosiding, dan website. Kolom umum dan spesifik dari entri daftar pustaka dapat dilihat pada Tabel 1. Tabel 1 Kolom umum dan spesifik entri daftar pustaka Jenis Kolom Umum
Nama Kolom Nama pengarang, Judul, Penerbit, Tahun terbit
Spesifik
Nama Jurnal, Volume, Halaman, Nama Prosiding (Publikasi), Lokasi, URL
Proses identifikasi atribut entri daftar pustaka dilakukan dengan menggunakan modul Biblio Citation Parser dari aplikasi ParaTools. Modul ini dapat mengidentifikasi setiap entri daftar pustaka dan menghasilkan atribut dari entri daftar pustaka pada dokumen-dokumen yang banyak digunakan di luar negeri. Pada penelitian ini, karena menggunakan format entri daftar pustaka dari Pedoman Penulisan Karya Ilmiah IPB, maka modul Biblio Citation Parser harus dimodifikasi agar dapat digunakan. Pada buku Pedoman Penulisan Karya Ilmiah IPB, setiap kolom entri daftar pustaka dipisahkan oleh tanda titik dilanjutkan dengan spasi (. ), kecuali untuk kolom volume, issue, dan halaman. Penjelasan dari setiap format Metadata entri daftar pustaka dapat dilihat pada Lampiran 3. Proses identifikasi atribut pada entri daftar pustaka dilakukan dengan cara membandingkan entri daftar pustaka dengan model entri daftar pustaka. Sebuah model entri daftar pustaka akan berisi beberapa kata identifikasi kolom entri daftar pustaka. Kata-kata identifikasi kolom entri daftar pustaka yang digunakan pada penelitian ini dapat dilihat pada Tabel 2. Tabel 2 Kata-kata identifikasi entri daftar pustaka yang digunakan Kata Identifikasi _AUTHORS_ _YEAR_ _TITLE_ _PUBLISHER_ _PUBLICATION_ _PUBLOC_ _VOLUME_ _ISSUE_ _PAGES_ _EDITOR_ _URL_ _EDITORTITLE_ _EDISI_ _ANY_
Kolom Pengarang dokumen Tahun terbit Judul dokumen Penerbit Publikasi Lokasi Nomor volume Nomor isu Nomor halaman Nama Editor Alamat situs di internet Judul buku dari editor Edisi Sembarang kata
Bobot 0.65 0.65 0.65 0.65 0.9 0.65 0.9 0.9 0.9 0.9 0.9 0.65 0.65 0.1
Modifikasi modul Biblio Citation Parser pada model kalimat daftar pustaka dilakukan agar dapat mengenali format kalimat daftar pustaka pada dokumen skripsi yang digunakan. Pada penelitian ini dibuat beberapa model kalimat daftar pustaka. Model kalimat daftar pustaka yang digunakan dapat dilihat pada Lampiran 4. Modul Biblio Citation Parser akan melakukan perbandingan format
25
sebuah entri daftar pustaka dengan model kalimat daftar pustaka. Sebuah entri daftar pustaka dapat memiliki kesamaan format dengan beberapa model kalimat daftar pustaka yang sudah dibuat karena beberapa kolom entri daftar pustaka memiliki format yang sama. Kolom judul, penerbit, dan lokasi memiliki format berupa kalimat. Selain itu, kolom nomor volume, isu, dan halaman sama-sama memiliki format berupa nomor. Kata identifikasi dari model entri daftar pustaka memiliki bobot. Kata-kata identifikasi yang dianggap membedakan kategori sebuah entri daftar pustaka akan diberi bobot lebih tinggi, sedangkan kata identifikasi yang tidak membedakan kategori entri daftar pustaka diberi bobot lebih rendah. Pada Tabel 2, bobot sebesar 0.65 diberikan pada pengarang, tahun terbit, judul dokumen, penerbit, lokasi, judul buku dari editor, dan edisi. Bobot sebesar 0.9 diberikan kepada publikasi, volume, isu, halaman, nama editor, dan alamat situs di internet. Katakata identifikasi yang memiliki bobot 0.65 merupakan kata identifikasi yang tidak membedakan kategori dari sebuah entri daftar pustaka, sedangkan kata identifikasi yang memiliki bobot 0.9 adalah kata-kata identifikasi yang mengkategorikan entri daftar pustaka. Modul Biblio Citation Parser menggunakan bobot dari kata-kata identifikasi untuk memilih model yang paling sesuai dengan entri daftar pustaka jika terdapat beberapa model yang dianggap sama dengan entri daftar pustaka. Kata-kata identifikasi yang dihasilkan dari beberapa model yang dianggap sama dengan entri daftar pustaka dijumlahkan bobotnya. Model yang memiliki bobot paling besar dianggap sebagai model yang paling sesuai dengan entri daftar pustaka. Sebagai contoh bila pada sistem mendapatkan entri daftar pustaka sebagai berikut: Purnama PB. 2004. Kiat Praktis Menjadi Desainer Web Profesional. Jakarta: PT Elex Media Komputindo.
Dari entri daftar pustaka tersebut, sistem menghasilkan beberapa model entri daftar pustaka yang cocok, yaitu: 1 buku=>_AUTHORS_. _YEAR_. _TITLE_. 2 buku=>_AUTHORS_. _YEAR_. _TITLE_. _PUBLISHER_. 3 buku=>_AUTHORS_. _YEAR_. _TITLE_. _PUBLOC_: _PUBLISHER_. Model 1 memiliki jumlah bobot sebesar 1.95, model 2 memiliki jumlah bobot sebesar 2.6 dan model 3 memiliki jumlah bobot sebesar 3.25. Sistem akan memilih model 3 sebagai model yang digunakan mengidentifikasi atribut dari entri daftar pustaka. Contoh hasil dari identifkasi atribut entri daftar pustaka dapat dilihat pada Lampiran 5. Saat ini model entri daftar pustaka yang terdapat pada sistem berjumlah sebanyak 45255. Model format entri daftar pustaka untuk mengidentifikasi atribut entri daftar pustaka dapat disesuaikan dengan kebutuhan. Model-model ini disimpan pada sebuah file pada sistem sehingga model entri daftar pustaka yang baru dapat ditambahkan secara manual. Penyimpanan Entri Daftar Pustaka ke Basis Data Setelah melakukan proses identifikasi atribut entri daftar pustaka, data yang dihasilkan disimpan pada tabel supertype dan subtype-nya. Penyimpanan kolom-
26
kolom entri daftar pustaka yang merupakan subtype menggunakan nama tabel yang dapat dilihat pada Tabel 3. Tabel 3 Tabel penyimpanan kolom spesifik dari entri daftar pustaka Nama Tabel Jurnal
Kolom Nama Jurnal Volume Halaman
Prosiding
Nama Prosiding Lokasi
Website
URL
Proses lainnya sebelum melakukan penyimpanan entri daftar pustaka ke basis data adalah melakukan pemeriksaan kesamaan entri daftar pustaka dengan entri daftar pustaka yang sudah tersimpan pada basis data. Hal ini dilakukan agar tidak ada entri daftar pustaka yang sama disimpan beberapa kali pada basis data. Pemeriksaan kesamaan dokumen dilakukan pada kolom nama pengarang, judul, dan tahun dokumen. Proses pemeriksaan kesamaan dokumen dilakukan dengan fungsi jarak levensthein pada kolom judul dan nama pengarang entri daftar pustaka dengan seluruh entri daftar pustaka yang sudah tersimpan pada basis data. Kondisi 2 entri daftar pustaka yang dianggap sama dapat dilihat pada Tabel 4. Tabel 4 Kondisi entri daftar pustaka1 dan entri daftar pustaka2 yang dianggap sama Kolom Tahun Judul
Kondisi tahun1 = tahun2 levensthein (judul1 ,judul2 ) panjang karakter (judul1 )
Nama Pengarang
×100%
≤ 10%
levensthein (nama pengarang1 , nama pengarang2 ) ≤ 2
Sebelum memproses fungsi levensthein, dilakukan proses penyeragaman setiap kolom pada entri daftar pustaka yang sudah disimpan pada basis data. Penghilangan spasi di awal dan di akhir pada setiap isi kolom dilakukan. Isi setiap kolom dibuat menjadi huruf kecil semua dan apabila terdapat 2 karakter spasi maka dijadikan sebuah karakter spasi. Pada kolom nama pengarang dilakukan hal berikut: 1 Apabila terdapat nama gelar pada pengarang, gelar awal dan akhir dari nama pengarang dihilangkan. 2 Nama pengarang dibuat menjadi format “[Nama akhir ] ([Huruf awal nama pertama] [Huruf awal nama kedua] [Huruf awal nama ketiga] …)”, contoh: • Ir. Julio Adisantoso, M.Kom menjadi Adisantoso J • Abdul Kadir Hakim menjadi Hakim AK Hal ini tidak dilakukan pada nama pengarang yang dianggap sebagai lembaga, organisasi atau institusi.
27
3
Setiap entri daftar pustaka yang memiliki lebih dari 1 nama pengarang, namanama tersebut digabungkan terlebih dahulu dengan dibatasi oleh karakter koma (,) serta mempertahankan urutan pengarang (contoh: Adisantoso J, Ridha A). Entri daftar pustaka hasil identifikasi atribut entri daftar pustaka diperiksa kesamaan datanya dengan seluruh entri daftar pustaka yang sudah tersimpan pada basis data. Jika terdapat entri daftar pustaka yang isinya sama pada basis data, maka entri daftar pustaka tidak perlu disimpan. Sebaliknya apabila tidak ada entri daftar pustaka yang sama, entri daftar pustaka disimpan ke dalam basis data. Modul Entri Data Bagian terpenting dari sistem temu kembali dokumen penelitian adalah modul entri data. Modul entri data dibuat dengan tujuan untuk memasukkan data dokumen skripsi ke dalam sistem. Modul ini, selain mengentri data dokumen skripsi, juga melakukan proses ekstraksi dan identifikasi atribut entri daftar pustaka yang sudah dibuat. Proses entri data dimulai dengan mengentri data utama dokumen skripsi serta mencantumkan file dokumen skripsi pada form yang dapat dilihat pada Gambar 22.
Gambar 22 Form modul entri data dokumen skripsi Selanjutnya 4 tahap proses dilakukan untuk menyimpan sebuah dokumen skripsi ke dalam basis data. Tahap pertama adalah menyimpan data utama dokumen skripsi ke dalam tabel Dokumen. Tahap kedua adalah melakukan proses ekstraksi entri daftar pustaka dari dokumen skripsi. Tahap kedua menghasilkan kumpulan entri daftar pustaka yang disimpan dalam tabel Pustaka. Tahap ketiga adalah melakukan identifikasi atribut entri daftar pustaka dari kumpulan entri daftar pustaka yang sudah dihasilkan pada tahap kedua. Tahap terakhir adalah menyimpan entri daftar pustaka yang sudah diekstrak beserta atributnya ke dalam basis data. Seluruh tahapan penyimpanan dokumen skripsi dapat dilihat pada Gambar 23. Kumpulan entri daftar pustaka yang didapatkan dari dokumen skripsi disimpan kedalam basis data satu per satu. Tahapan proses penyimpanan entri daftar pustaka dapat dilihat pada Lampiran 6. Pada proses penyimpanan entri daftar pustaka terdapat sebuah subproses penyimpanan nama pengarang ke tabel Pengarang. Nama pengarang yang dihasilkan oleh proses identifikasi atribut entri daftar pustaka dapat berupa nama dari seorang pengarang atau gabungan beberapa nama pengarang yang dibatasi oleh tanda koma (,). Sebelum melakukan
28
penyimpanan nama pengarang, sistem mengidentifikasi setiap nama yang didapat. Nama pengarang yang merupakan nama dari seorang pengarang langsung disimpan ke dalam basis data, namun nama pengarang yang merupakan gabungan dari beberapa nama, diekstrak menjadi beberapa nama lalu setiap nama disimpan ke dalam basis data. Entri daftar pustaka yang berhasil diekstrak dan diidentifikasi pada setiap dokumen skripsi ditampilkan dalam bentuk tabular seperti pada Gambar 24. Mulai
Dokumen skripsi Metadata umum
Penyimpanan metadata umum
Dokumen
Metadata spesifik
Penyimpanan metadata spesifik
Skripsi
Kumpulan entri daftar pustaka
Penyimpanan kumpulan Entri daftar pustaka
Pustaka
Penyimpanan metadata utama
Identifikasi entri daftar pustaka
Ekstrak entri daftar pustaka
Penyimpanan entri daftar pustaka
Selesai
Gambar 23 Penyimpanan dokumen skripsi ke dalam basis data
Gambar 24 Hasil pengolahan entri daftar pustaka dari dokumen skripsi
29
Modul Identifikasi Kesamaan Nama pengarang Pada saat identifikasi atribut entri daftar pustaka pada modul entri data dilakukan, masih ada seorang pengarang yang disimpan berkali-kali karena penulisan nama yang salah pada dokumen skripsi. Misalkan C D Manning dengan C Manning harusnya merupakan nama pengarang yang sama, tetapi karena penulisan yang berbeda, maka sistem mengidentifikasi sebagai nama pengarang yang berbeda. Modul identifikasi kesamaan nama pengarang dibuat untuk menggabungkan beberapa nama pengarang yang seharusnya sama. Tahapan dari modul identifikasi kesamaan nama pengarang dapat dilihat pada Lampiran 7. Awal dari proses modul dilakukan oleh sistem untuk mencari nama pengarang yang kira-kira dianggap sama. Proses identifikasi kesamaan nama pengarang dilakukan oleh sistem dengan cara membandingkan sebuah nama pengarang dengan seluruh nama pengarang yang sudah disimpan pada basis data. Proses membandingkan nama pengarang ini menggunakan fungsi jarak levensthein antara kedua nama pengarang. Fungsi jarak levensthein yang digunakan adalah: levensthein (nama pengarang1 , nama pengarang2 ) ≤ 2
Apabila ditemukan 2 nama pengarang yang dianggap sama, sistem akan menampilkan kedua nama pengarang tersebut beserta daftar judul dokumen yang terhubung dengan masing-masing nama pengarang, lalu dibutuhkan interaksi oleh pengguna untuk menentukan sama tidaknya kedua nama pengarang tersebut. Pengguna harus memilih salah satu nama pengarang sebagai nama yang benar, lalu sistem akan menghapus nama pengarang yang salah dan memindahkan dokumen yang terhubung pada nama pengarang yang salah ke nama pengarang yang benar. Mesin Temu Kembali Penelitian ini menggunakan mesin temu kembali yang bernama Sphinx (Ali A, 2011). Sphinx merupakan sebuah mesin temu kembali bersifat open source yang dapat melakukan proses dasar pada sistem temu kembali seperti pembuatan indeks, pencarian dokumen, serta perhitungan bobot hasil pencarian. Pada Sphinx juga dapat ditentukan stop words, yaitu kata-kata yang umum dalam jumlah besar dan dianggap tidak signifikan dalam pencarian. Kata-kata yang dianggap sebagai stop words yang digunakan pada penelitian ini terdiri atas 2 bahasa yaitu bahasa Indonesia dan bahasa Inggris. Stop words dalam bahasa Indonesia yang digunakan pada penelitian ini diadaptasi dari Handayani (2012) (lihat Lampiran 8) dan stop words dalam bahasa inggris yang digunakan dalam penelitian ini bersumber dari http://www.csc.kth.se/~markusos/data/stopwords.txt (lihat Lampiran 9). Sphinx dapat dikonfigurasi untuk dihubungkan ke basis data yang sudah dibuat sebagai sumber data. Sphinx selanjutnya melakukan proses pembuatan indeks (lihat Gambar 25) dari isi tabel atau hasil dari query SQL. Indeks pada Sphinx disimpan pada file yang terletak pada sebuah direktori, File ini digunakan oleh Sphinx untuk membantu proses pencarian dokumen serta menentukan urutan hasil pencarian berdasarkan bobot relevannya.
30
Gambar 25 Proses pembuatan indeks dengan Sphinx Pencarian pada Sistem Temu Kembali Informasi Dokumen Penelitian Komponen pencarian merupakan bagian dari sebuah sistem temu kembali informasi yang digunakan untuk mencari informasi dari data yang dimiliki. Tanpa adanya komponen ini, sebuah sistem temu kembali tidak dapat melakukan pencarian informasi. Sistem temu kembali informasi dokumen penelitian memiliki sebuah komponen pencarian yang digunakan untuk mencari dokumen hasil ekstraksi entri daftar pustaka yang sudah tersimpan pada basis data. Antarmuka sistem temu kembali dokumen penelitian memiliki sebuah sebuah form untuk memasukkan kata pencarian dan sebuah tombol untuk memproses pencarian (lihat Gambar 26). Pengguna dapat memasukkan kata pencarian untuk mencari entri daftar pustaka. Pengguna yang sudah mengisi kata pencarian dan memproses pencarian akan memperoleh hasil pencarian pada halaman hasil pencarian (lihat Gambar 27). Proses pencarian pada sistem menggunakan modul pencarian dari Sphinx untuk mendapatkan dokumen yang relevan dari kata pencarian yang dimasukkan oleh pengguna. Sphinx menghasilkan bobot dokumen yang digunakan untuk menampilkan urutan hasil pencarian.
Gambar 26 Antarmuka pencarian
31
Gambar 27 Halaman hasil pencarian Visualisasi Hasil Pencarian Salah satu tujuan dari penelitian ini adalah membuat visualisasi hasil pencarian yang merupakan grafik yang menghubungkan pengarang. Entri daftar pustaka yang disimpan pada basis data digunakan untuk membuat visualisasi ini. Dari basis data yang sudah dibuat dapat dihasilkan 2 jenis hubungan pengarang, yaitu hubungan pengarang yang menulis pada dokumen yang sama dan hubungan pengarang yang dokumennya dirujuk atau merujuk dokumen yang ditulis oleh pengarang lain. Kedua jenis hubungan antar-pengarang tersebut dapat dibuat visualisasinya. Pembuatan visualisasi hubungan antar-pengarang dibuat dengan menggunakan perkakas yang bernama JavaScript InfoVis Toolkit yang memanfaatkan HTML 5 Canvas (lihat Gambar 28). Pengujian Pengujian dilakukan untuk mendapatkan akurasi dan efisiensi dari sistem yang dikembangkan. Pengujian menggunakan dokumen skripsi berbentuk file PDF sebanyak 246 yang didapatkan dari perpustakaan Departemen Ilmu Komputer Institut Pertanian Bogor. Dari 246 file PDF dokumen skripsi terdapat 4 buah dokumen yang hasil pengubahan menjadi teks oleh aplikasi pdftotext tidak sesuai dengan keinginan. Hal ini diduga karena ada kesalahan pada saat membuat file PDF dari aplikasi pengloah kata, namun dugaan tersebut belum dapat dipastikan. Hanya sebagian entri daftar pustaka dari 4 buah dokumen tersebut dapat dikenali oleh sistem. Selain itu, terdapat sebuah dokumen skripsi berbahasa inggris yang daftar pustakanya terletak di antara bab bernama References dan sebuah halaman bertuliskan Appendix. Dokumen skripsi berbahasa inggris
32
tersebut masih dapat dikenali oleh sistem dengan mengubah kata Daftar Pustaka menjadi References dan Lampiran menjadi Appendix pada kode program sistem untuk dapat mengenali kumpulan entri daftar pustaka.
Gambar 28 Visualisasi hasil pencarian Waktu Proses Entri Dokumen Skripsi Proses entri sebuah dokumen skripsi dimulai dari proses konversi file PDF menjadi teks, ekstraksi entri daftar pustaka, identifikasi atribut entri daftar pustaka hingga penyimpanan seluruh entri daftar pustaka ke dalam basis data dari sebuah dokumen dapat memakan waktu minimal selama 10 detik dan waktu maksimal selama 3 jam dengan rata-rata selama 1 menit 20 detik. Lamanya waktu proses entri dokumen skripsi terjadi pada bagian identifikasi atribut entri daftar pustaka yang menggunakan banyak model untuk membandingkan format entri daftar pustaka. Semakin banyak model entri daftar pustaka yang dibandingkan, sistem akan lebih akurat dalam mengidentifikasi atribut setiap entri daftar pustaka, namun waktu yang diperlukan menjadi lebih lama. Kesalahan pada Hasil Konversi File PDF Proses identifikasi atribut entri daftar pustaka sangat dipengaruhi oleh hasil ekstraksi entri daftar pustaka. Kesalahan pada saat ekstraksi entri daftar pustaka akan mempengaruhi hasil identifikasi entri daftar pustaka. Kesalahan ekstraksi entri daftar pustaka terjadi karena hasil konversi file PDF menjadi teks oleh
33
aplikasi pdftotext tidak sesuai dengan yang diinginkan. Kesalahan konversi file PDF menjadi teks yang terjadi adalah terdapatnya teks diluar daftar pustaka yang tercampur dengan teks entri daftar pustaka (lihat Gambar 29).
Gambar 29 Hasil konversi file PDF diubah menjadi teks yang bercampur (ditandai) dengan kumpulan entri daftar pustaka Kesalahan pada Hasil Identifikasi Atribut Entri Daftar Pustaka Kesalahan juga terjadi pada saat mengenali kolom entri daftar pustaka. Pada entri daftar pustaka yang berhasil ekstraksi, bisa terdapat entri daftar pustaka yang tidak sesuai dengan format penulisan. Kesalahan penulisan berpengaruh terhadap hasil identifikasi atribut entri daftar pustaka. Beberapa kesalahan penulisan di antaranya: 1. Tahun tidak ada, tidak terletak pada kolom kedua atau tidak dibatasi oleh titik (.). Pada kasus ini sistem tidak akan mengenali tahun atau tahun akan dianggap sebagai bagian dari kolom judul. Contoh entri daftar pustaka dengan kesalahan ini dapat dilihat sebagai berikut: a. Duda, R. O, et al. Pattern Classification. 2001. John Wiley and Sons. Canada. b. Tanenbaum AS. Computer Network. 3rd Edition. Prentice Hall. 1996. c. Sheikholeslami G, Srihari SN, Govindaraju V. Computer Aided Graphology. USA:University of New York d. Dalli, A, Adaptation of the F-measure to Cluster Based Lexicon Quality Evaluation. Department of Computer Science, University of Sheffield. e. [GNOME]. The GNOME Project, 2005. The beginning. [terhubung berkala]. http://www.gnome.org/about [18 Maret 2011].
34
2.
Pada sistem yang dikembangkan, identifikasi atribut entri daftar pustaka menggunakan format daftar pustaka di IPB dimana format daftar pustaka di IPB seluruhnya menggunakan tahun pada kolom ke-2 dan judul pada kolom ke-3. Sistem yang diharapkan dapat mengenali tahun pada kolom kedua entri daftar pustaka. Apabila tidak terdapat tahun pada kolom kedua, maka sistem tidak mengenali kolom tahun. Pada kesalahan ini entri daftar pustaka yang diidentifikasi akan diidentifikasi menjadi tidak memiliki kolom tahun (lihat nomor 1a, 1b, 1c, dan 1d) atau tahun akan dianggap sebagai bagian dari kolom judul (lihat nomor 1e). Terdapat entri daftar pustaka yang merupakan kutipan dokumen di dalam dokumen lain yang tidak sesuai dengan format. Sistem akan menganggap bagian judul dokumen yang mengutip adalah penerbit dokumen, seperti pada contoh berikut: Chen A Y, McLeod D. 2006. Collaborative Filtering for Information Recommendation Systems. Encyclopedia of E-commerce, Egovernment, and Mobile Commerce. Idea Group Publishing. Pennsylvania. hlm. 118-123.
Dokumen berjudul Collaborative Filtering for Information Recommendation System (dokumen 1) sebenarnya ada di dalam dokumen berjudul Encyclopedia of E-commerce, Egovernment and Mobile Commerce (dokumen 2). Karena kesalahan penulisan, sistem akan menganggap judul dokumen 2 adalah penerbit, lalu penerbit akan diidentifikasi sebagai lokasi dan sisa kolom lainnya akan diabaikan oleh sistem. Seharusnya penulisan dokumen 1 yang dikutip oleh dokumen 2 ditulis dengan kata Di dalam:, sehingga penulisan yang benar seharusnya adalah sebagai berikut: Chen A Y, McLeod D. 2006. Collaborative Filtering for Information Recommendation Systems. Di dalam: Encyclopedia of E-commerce, Egovernment, and Mobile Commerce. Idea Group Publishing. Pennsylvania. hlm. 118-123.
3.
Terdapat entri daftar pustaka yang tidak memiliki penerbit, namun memiliki lokasi penerbit. Selain itu, terdapat entri daftar pustaka yang posisi penerbit dan lokasinya terbalik. Contoh entri daftar pustaka sebagai berikut: a. Williams, Laurie. 2004. Testing Overview and Black-Box Testing Techniques. UK. b. Rencher AC. 1995. Methods of Multivariate Data Analysis. Wiley : New York.
4.
Kesalahan penulisan entri daftar pustaka yang salah menempatkan penerbit pada kolom lokasi (contoh a) dapat menyebabkan sistem mengenali lokasi sebagai penerbit. Selain itu untuk entri daftar pustaka yang memiliki lokasi tapi tidak memiliki penerbit (contoh b), sistem akan mengenali kolom lokasi sebagai penerbit dan kolom penerbit sebagai lokasi. Terdapat alamat internet yang tidak diawali oleh http://, https://, www., ftp://, atau ftp. Contoh entri daftar pustaka yang ditemukan sebagai berikut: Dalam format 2 kolom: Boneh D. 1999. Twenty Years of Attack on The RSA Cryptosystem. crypto.stanford. edu/~dabo/papers/RSA-survey. pdf. [23 November 2005].
Dalam format 1 kolom:
35
Boneh D. 1999. Twenty Years of Attack on The RSA Cryptosystem. crypto.stanford. edu/~dabo/papers/RSA-survey. pdf. [23 November 2005].
5.
Alamat internet seharusnya diawali dengan format kata http://, https://, atau ftp://. Sistem sebenarnya dapat mengenali alamat internet dengan baik jika awal alamat internet diawali oleh kata http://, https://, atau ftp://. Sistem yang dibuat juga sudah menambahkan awalan format kata www. dan ftp. untuk alamat internet. Apabila terdapat kata www. atau ftp. pada suatu entri daftar pustaka, sistem akan mengenalinya sebagai alamat internet. Pada contoh entri daftar pustaka, alamat internet tidak menggunakan kata http://, https://, atau ftp://. Alamat internet yang terdapat pada contoh adalah crypto.stanford.edu/~dabo/papers/RSA-survey.pdf yang tidak diawali oleh format alamat internet yang sudah ditentukan sehingga sistem tidak mengenali bagian entri daftar pustaka tersebut sebagai alamat internet. Selain itu, pada kasus tertentu, terdapat alamat internet yang panjang digunakan sebagai referensi dari dokumen skripsi. Bila alamat tersebut ditulis apa adanya, halaman pada skripsi akan menjadi tidak bagus tampilannya, terutama untuk dokumen skripsi pada Departemen Ilmu Komputer IPB yang menggunakan format penulisan 2 kolom. Untuk mengatasi hal tersebut, banyak penulisan skripsi melakukan pemotongan alamat internet yang panjang dengan spasi agar dapat telihat lebih rapi. Pemotongan alamat internet dengan spasi sebagian besar dilakukan setelah karakter titik (.) dari alamat internet. Pada contoh juga terdapat pemisahan alamat internet dengan spasi. Pemisahan alamat internet dengan spasi pada contoh membuat alamat internet menjadi tiga bagian, yaitu “crypto.stanford.”, “edu/~dabo/papers/RSA-survey.”, dan “pdf” sehingga bagian-bagian pada alamat internet tersebut dikenali sebagai penerbit dan lokasi penerbit pada sistem. Akibat tidak dikenalinya alamat internet pada contoh entri daftar pustaka, sistem tidak mengenali entri daftar pustaka sebagai kategori website. Terdapat nama pengarang berupa institusi yang tidak menggunakan singkatan yang menyebabkan nama institusi dianggap sebagai nama orang. Sistem akan memproses nama institusi tersebut seperti nama orang, sebagai contoh: Promise Software Engineering Repository http://www.promisedata.org.
data
set.
2004.
Berdasarkan buku Pedoman Penulisan Karya Ilmiah IPB, apabila terdapat nama pengarang berupa institusi, awalnya harus ditulis menggunakan singkatan yang berada di dalam kurung siku lalu dilanjutkan dengan nama lengkapnya, contoh: [IPB] Institut Pertanian Bogor. Pada contoh nomor 6, entri daftar pustaka yang penulisnya merupakan institusi tidak dicantumkan singkatannya. Sistem akan menganggap pengarang tersebut sebagai nama orang dan mengubahnya dengan format nama belakang (nama keluarga) dilanjutkan dengan huruf pertama dari setiap nama. Pada contoh, nama Promise Software Engineering Repository data set akan dibuat menjadi Set PSERD oleh sistem. Seharusnya contoh tersebut ditulis sebagai berikut: [PSER] Promise Software Engineering Repository data set. 2004. Tersedia pada: http://www.promisedata.org
36
Pengujian Ekstraksi Entri Daftar Pustaka Pengujian ekstraksi entri daftar pustaka pada sebuah dokumen i dilakukan dengan menggunakan rumus recall (Rbi) dan precision (Pbi). Proses pengujian ekstraksi entri daftar pustaka diawali dengan membaca secara manual entri daftar pustaka pada dokumen skripsi i serta mencatat jumlah entri daftar pustaka yang dimiliki dokumen tersebut (Ei). Setelah itu, entri daftar pustaka yang sudah dibaca dibandingkan dengan jumlah hasil ekstraksi entri daftar pustaka yang terdapat pada sistem (Bi). Entri daftar pustaka pada sistem yang sama dengan entri daftar pustaka yang terdapat pada dokumen diberi nilai 1 (benar) dan, apabila berbeda diberi nilai 0 (salah) seperti pada Tabel 5. Tabel 5 Proses pengujian ekstraksi entri daftar pustaka Entri daftar pustaka
Hasil ekstraksi entri daftar pustaka
Benar/ Salah
Albahari B, Drayton P, Merrill B. 2001. C# Essentials. Ed ke-2. California: O’Reilly Media.
Albahari B, Drayton P, Merrill B. 2001. C# Essentials. Ed ke-2. California: O'Reilly Media.
1
[Conceiva]. 2006. Download Managers – A Better Downloading Experience (http://www.conceiva.com). [6 Januari 2006].
(Conceiva). 2006. Download Managers - A Better Downloading Experience http://www.conceiva.com). KESIMPULAN DAN SARAN.
0
Hasil pengujian ekstraksi entri daftar pustaka secara lengkap dapat dilihat pada Lampiran 10. Dari pengujian ekstraksi entri daftar pustaka, didapatkan PRb sebesar 94.63% dan PPb sebesar 98.92%. Hasil tersebut menunjukkan bahwa sebanyak 94.63% entri daftar pustaka berhasil diekstrak secara tepat dan sebanyak 98.92% dari entri daftar pustaka yang berhasil diekstrak oleh sistem merupakan entri daftar pustaka yang diinginkan. Dari hasil Rb dan Pb, tidak seluruh entri daftar pustaka pada dokumen dapat diidentifikasi secara tepat. Hal ini dikarenakan karena terdapat kesalahan pada hasil konversi file PDF menjadi teks yang sudah dibahas sebelumnya. Pengujian Identifikasi Atribut Entri Daftar Pustaka Selain pengujian ekstrak entri daftar pustaka juga dilakukan pengujian untuk mendapatkan nilai keberhasilan identifikasi atribut entri daftar pustaka dengan cara melihat jumlah entri daftar pustaka yang berhasil diidentifikasi atributnya secara tepat pada setiap dokumen skripsi oleh sistem. Proses pengujian identifikasi atribut entri daftar pustaka, caranya hampir sama dengan pengujian proses ekstraksi entri daftar pustaka. Perbedaannya adalah perbandingan dilakukan pada setiap kolom entri daftar pustaka. Setiap entri daftar pustaka pada sebuah dokumen yang berhasil diidentifikasi secara tepat dibandingkan setiap kolomnya dengan kolom sebenarnya pada dokumen. Apabila seluruh kolom entri daftar pustaka tepat diidentifikasi oleh sistem, maka entri tersebut diberi nilai 1 (benar) dan apabila tidak maka diberi nilai 0 (salah). Contoh pengujian identifikasi atribut entri daftar pustaka dapat dilihat pada Tabel 6.
37
Tabel 6 Proses pengujian identifikasi atribut entri daftar pustaka Entri daftar pustaka
Hasil identifikasi atribut entri daftar pustaka
Benar/ Salah
Xie X, Beni G. 1991. A Validity Measure for Fuzzy Clustering. IEEE Trans Patt Anal Mach Intel. 13(8):841-847.
Xie XL, Beni G <judul>A Validity Measure for Fuzzy Clustering
1991 IEEE Trans on Pattern Anal Machine IntellIEEE Trans on Pattern Anal Machine Intell13 8 841-847
1
Papineni K, Roukos S, Ward T, Zhu WJ. 2002. BLEU: a Method for Automatic Evaluation of Machine Translation. Di dalam: Steven Bird, editor. The 40th Annual Meeting of the Association for Computational Linguistics; Philadelphia, 7-12 Juli. Stroudsburg: The Association for Computational Linguistics. 311-318.
Papineni K, Roukos S, Ward T, Zhu WJ<judul>BLEU: a Method for Automatic Evaluation of Machine Translation
2002 The Association for Computational Linguistics
0
Pengujian identifikasi atribut entri daftar pustaka dilakukan dengan menggunakan rumus recall (Rbi) dan precision (Pbi). Hasil pengujian identifikasi atribut entri daftar pustaka dapat dilihat pada Lampiran 11. Berdasarkan nilai Rbi dan Pbi pada pengujian identifikasi atribut entri daftar pustaka dihasilkan PRb sebesar 91.54% dan PPb sebesar 99.84%. Hasil tersebut menunjukkan bahwa terdapat 91.54% entri daftar pustaka yang berhasil diidentifikasi atributnya secara tepat dan 99.84% entri daftar pustaka yang berhasil diidentifikasi atributnya oleh sistem merupakan entri daftar pustaka yang diinginkan. Dari hasil Rbi dan Pbi, diketahui bahwa tidak seluruh entri daftar pustaka dapat diidentifikasi atributnya secara tepat oleh sistem. Hal ini dikarenakan terdapatnya kesalahan penulisan entri daftar pustaka pada dokumen yang sudah dibahas sebelumnya. Pengujian Hubungan Entri Daftar Pustaka dengan Dokumen Sebuah entri daftar pustaka dapat dirujuk oleh beberapa dokumen. Pengujian hubungan entri daftar pustaka dengan seluruh dokumen dilakukan untuk mengukur jumlah keberhasilan sistem dalam menghasilkan entri daftar pustaka yang seharusnya dirujuk dokumen. Proses pengujian dilakukan pada 50 pengarang entri daftar pustaka yang paling banyak dirujuk oleh dokumen skripsi. Pengujian diawali dengan menghitung jumlah entri daftar pustaka milik pengarang ke-i yang dirujuk oleh dokumen skripsi (Ci) dan jumlah entri daftar pustaka miliki pengarang ke-i yang dihasilkan oleh sistem (Fi). Nilai Ci dan Fi kemudian dihitung dengan rumus Rci dan Pci. Hasil pengujian dari hubungan dokumen dalam koleksi dengan rujukan dengan menggunakan 50 pengarang dapat dilihat pada Lampiran 12. Berdasarkan nilai Rc dan Pc pada seluruh perhitungan, dihasilkan PRc sebesar 90.31% dan PPc sebesar 95.19%. Hasil tersebut menunjukkan bahwa terdapat 90.31% entri daftar pustaka yang berhasil dihubungkan ke seluruh dokumen secara tepat oleh sistem dan 95.19% entri daftar pustaka yang berhasil dihubungkan ke dokumen oleh sistem adalah
38
benar. Entri daftar pustaka yang tidak berhasil dihubungkan ke dokumen secara benar dikarenakan terdapatnya 2 atau lebih nama pengarang yang ditulis tidak sama seperti contoh berikut ini: a. Pressman R. 2001. Software Engineering: A Practitioner's b. c.
Approach. Ed ke-5. New York: McGraw-Hill. Pressman. 2001. Software Engineering: A Approach. New York: McGraw-Hill. Pressman RS. 2001. Software Engineering: A Approach 5th Edition. New York: McGraw-Hill.
Practitioner's Practitioner's
Contoh a dan b adalah penulisan nama pengarang yang salah, yaitu Pressman R dan Pressman, sedangkan pada contoh c nama pengarang ditulis benar yaitu Pressman RS. Dari contoh tersebut, sistem menganggap ada 3 pengarang yang berbeda lalu menyimpan ketiga record pengarang tersebut sehingga jumlah dokumen yang ditulis oleh Presman RS tidak sama dengan jumlah sebenarnya.
5 KESIMPULAN DAN SARAN Kesimpulan Penelitian ini membuat sistem temu kembali dokumen penelitian dan memfokuskan pada ekstraksi dan identifikasi atribut entri daftar pustaka dari dokumen skripsi Departemen Ilmu Komputer IPB dalam bentuk file PDF. Sistem yang dibuat dapat mengetahui bagian dari kumpulan entri daftar pustaka pada dokumen skripsi. Setiap entri daftar pustaka juga dapat dikenali kolomnya dan dikategorikan secara otomatis oleh sistem. Hasil dari ekstraksi entri daftar pustaka divisualisasikan oleh sistem dalam bentuk grafik. Visualisasi hasil pencarian dibuat menjadi 2 macam. Visualisasi yang pertama adalah visualisasi grafik hubungan antara pengarang dan pengarang lainnya yang menulis pada sebuah dokumen yang sama. Visualisasi yang kedua adalah visualisasi grafik hubungan antara pengarang dan pengarang lainnya yang dijadikan rujukan (entri daftar pustaka). Tidak semua dokumen dapat diekstrak entri daftar pustaka-nya secara tepat. Hal ini karena adanya beberapa kesalahan, yaitu kesalahan pada saat melakukan konversi file PDF menjadi teks, kesalahan penulisan posisi tahun pada entri daftar pustaka, kesalahan penulisan dokumen sumber, kesalahan penulisan alamat internet dan kesalahan penulisan institusi pada entri daftar pustaka di dalam dokumen skripsi. Pada pengukuran identifikasi entri daftar pustaka, 94.63% entri daftar pustaka dapat diekstrak dengan tepat, dan 91.54% entri daftar pustaka dapat diidentifikasi atributnya dengan tepat. Dari hasil pengujian dapat disimpulkan bahwa keberhasilan ekstraksi dan identifikasi atribut entri daftar pustaka dipengaruhi konversi dari PDF ke teks dan penulisan setiap daftar pustaka pada dokumen skripsi. Selain pengujian ekstrak dan identifikasi atribut entri daftar pustaka juga dilakukan pengujian untuk mengukur keberhasilan hubungan antara entri daftar pustaka dan dokumen pada sistem. Pengujian ini menghasilkan sebanyak 90.31% entri daftar pustaka yang berhasil dihubungkan secara tepat dengan dokumen. Keberhasilan menghubungkan entri daftar pustaka dengan dokumen dipengaruhi penulisan nama pengarang pada entri daftar pustaka pada dokumen.
39
Saran Sistem temu kembali dokumen penelitian dapat mengenali entri daftar pustaka yang pada dokumen skripsi di Departemen Ilmu Komputer, Institut Pertanian Bogor. Diharapkan ke depannya dilakukan penelitian untuk mengenali entri daftar pustaka pada dokumen skripsi yang terdapat pada seluruh Departemen di Institut Pertanian Bogor. Selain itu, kelemahan-kelemahan yang terdapat pada penelitian ini dapat dijadikan bahan penelitian yang bertujuan untuk memperbaiki hasil dari identifikasi dan ekstrak entri daftar pustaka. Visualisasi pengarang pada sistem yang dibuat menggunakan JavaScript InfoVis Toolkit. Grafik dapat dibuat pada browser yang mendukung HTML 5. Pada beberapa browser yang menggunakan mesin HTML WebKit, JavaScript InfoVis Toolkit terkadang tidak berjalan lancar dalam pembuatan grafik. Pada penelitian selanjutnya diharapkan pembuatan grafik dapat menggunakan metode lain yang berjalan lancar di setiap browser. Kedepannya penelitian ini juga dapat dikembangkan dan digunakan pada bidang lainnya. Pada bidang pengenalan pola, dapat dikembangkan teknik untuk mengenali pola entri daftar pustaka beserta kolom-kolom-nya agar lebih tepat dalam melakukan identifikasi dan ekstrak entri daftar pustaka. Data-data hasil ekstrak entri daftar pustaka pada penelitian ini juga dapat digunakan pada penelitian bidang data mining.
Daftar Pustaka Ali A. 2011. Sphinx Search Beginner's Guide. Packt Publishing Ltd. Anegón FM, Quesada BV, Solana VH, Rodríguez ZC, Álvarez EC, Fernández M, José F. 2004. A new technique for building maps of large scientific domains based on the cocitation of classes and categories. Scientometrics 61:129-145. Budapest [HU]: Akademiai Kiado and Dordrecht: Kluwer Academic Publisher. Baeza-Yates R, Ribeiro-Neto B. 2011. Modern Information Retrieval: The Concepts and Technology Behind Search. New Jersey [US]: Pearson Higher Education. Day MY, Tsai TH, Sung CL, Lee CW, Wu SH, Ong CS, Hsu WL. 2005. A Knowledge-based Approach to Citation Extraction. IRI-2005 IEEE International Conference on Information Reuse and Integration, Conf, 2005; 2005 Agu 15-17; Las Vegas [US]. Ding Y, Chowdhury G G, Foo S, Qian W. 2000. Bibliometric information retrieval system (BIRS): A web search interface utilizing bibliometric research results. Journal of The American Society for Information Science, 51(13):1190–1204. New Jersey [US]: John Wiley & Sons Inc. Ding Y, Chowdhury G G, Foo S. 2001. Bibliometric cartography of information retrieval research by using co-word analysis. Information Processing & Management 37(6):871-842. Gardfield E. 1972. Citation analysis as a tool in journal evaluation. Science, 178(60):471-479. Gupta D, Morris B, Catapano T, Sautter G. 2009. A new approach towards bibliographic reference identification, parsing and inline citation matching. IC3
40
of Communications in Computer and Information Science 40:93-102. London: Springer. [Google] Google. 2012. Google Scholar Citations. [internet]. [diunduh 2012 Februari 16]. Tersedia dari: http://scholar.google.com/citations. Handayani S. 2012. Mesin Pencari Dokumen Bahasa Indonesia Menggunakan Latent Semantic Indexing dengan Pembobotan Global [Skripsi]. Bogor [ID]: Institut Pertanian Bogor. Hetzner E. 2008. A simple method for citation metadata extraction using hidden markov models. JCDL '08 Proceedings of the 8th ACM/IEEE-CS joint conference on Digital libraries; 2008 Jun 16-20; Pennsylvania [US]. New York [US]: ACM. Hoffer JA, Ramesh V, Topi H. 2011. Modern Database Management 10th Edition. New York [US]: Pretince Hall. Huang IA, Ho JM, Kao HY, Lin SH. 2004. Extracting citation metadata from online publication lists using BLAST. PAKDD of Lecture Notes in Computer Science 3056:539-548. London [GB]: Springer. [IPB] Institut Pertanian Bogor. 2001. Pedoman Penulisan & Penyajian Karya Ilmiah. Ed ke-1. Bogor [ID]: IPB Press. [IPB] Institut Pertanian Bogor. 2004. Pedoman Penyajian Karya Ilmiah. Ed ke-2. Bogor [ID]: IPB Press. [IPB] Institut Pertanian Bogor. 2012. Pedoman Penulisan Karya Ilmiah. Ed ke-3. Bogor [ID]: IPB Press. Jewell M. 2011. Paratools - paracite developers [internet]. [diunduh 2012 Februari 16]. Tersedia dari: http://paracite.eprints.org/developers/. [DEPDIKNAS] Departemen Pendidikan Nasional, Pusat Bahasa. 2008. Kamus Besar Bahasa Indonesia Daring [internet]. [diunduh 2012 Februari 16]. Tersedia dari: http://badanbahasa.kemdiknas.go.id/kbbi/. Klink S, Ley M, Rabbidge E, Reuther P, Walter B, Weber A. 2004. Browsing and visualizing digital bibliographic data. Di dalam: Deussen O, Hansen C, Kleim D, Saupe D, editor. Browsing and visualizing digital bibliographic data. IEEE TCVG Symposium on Visualization; 2004 Mei 19-21; Konstanz [DE]. Konstanz: Eurographics Association. Kowalski G. 1997. Information Retrieval Systems: Theory and Implementation. Norwell [US]: Kluwer Academic Publishers. Lin X, White HD, Buzydlowski J. 2003. Real-time author co-citation mapping for online searching. Information Processing and Management 39:689-706. Elsevier Ltd. Manning CD, Raghavan P, Schütze H. 2008. Introduction to information retrieval. New York [US]: Cambridge University Press. [Microsoft] Microsoft Corporation, All rights reserved. 2011. Micorosft Academic Search [internet]. [diunduh 2012 Februari 16]. Tersedia dari: http://academic.research. microsoft.com. Murray C, Ke W, Börner K. 2006. Mapping scientific disciplines and author expertise based on personal bibliography files. 10th International Conference on Information Visualisation (IV06). London [GB]: IEEE Computer Society.
41
Lampiran 1. Contoh text layout pengubahan file PDF
42
Lampiran 2 Proses membandingkan posisi entri daftar pustaka Mulai
i=0, posisi=-1, backloop = 0, curr_reff="", ref = (), tmp="", tmppos = -1
a = baris ke-i pada kumpulan entri daftar pustaka
1
j=0
b = baris ke-j pada format layout text
j=j+1
dapatkan posisi a pada b
tidak
posisi > -1 tidak
ya
3
backloop = 1
b = baris terakhir pada format layout text
tidak
2
backloop = 1 ya
ya
43
Lampiran 2 Lanjutan 3
posisi = 0
posisi > 5 tidak
tmppos=-1
ya
ya
tmppos = posisi, tmp = a
tidak ya posisi >= tmp1pos curr_reff = ""
tidak
tidak
tidak
ya
curr_ref = curr_ref + a, tmp= "", tmppos = -1
ya
push curr_reff ke ref, curr_ref = "", tmp= "", tmppos = -1
curr_ref = a
i = baris terakhir pada kumpulan entri daftar pustaka
2
curref <> "" ya
ya tidak
tidak i=i+1, posisi=-1, backloop = 0
1
curr_ref = curr_ref + a, push curr_reff ke ref
Selesai
44
Lampiran 3 Format metadata entri daftar pustaka Metadata Pengarang
Format − Nama orang atau lembaga/institusi/organisasi. − Boleh diawali oleh angka, namun harus diikuti oleh huruf. − Dapat terdiri atas beberapa pengarang yang dibatasi oleh tanda koma (,).
Contoh − Manning CD − (IPB) Institut Pertanian Bogor − 3Dcafe
Tahun
− Terdiri atas angka 4 digit dan bisa memiliki sebuah huruf pada akhir − Tidak boleh diawali oleh angka 0
− 2000 − 2007a
Judul
Kalimat
Penerbit
− Kalimat − Nama Penerbit, nama jurnal
Publikasi
− Kalimat − Didalamnya harus terdapat kata-kata seperti: Seminar, Prosiding, Proceedings, Workshop, Conference, Congress, Symposium, dan Meeting. − Hanya digunakan pada jenis prosiding − Kalimat − Bisa terletak di awal penerbit dengan dibatasi tanda titik dua (:) − Bisa terletak setelah penerbit dengan dibatasi oleh koma (,) atau (.)
Lokasi
− USA: McGraw-Hill − Universitas Indonesia, Depok.
Volume
− Angka − Biasanya ditulis setelah penerbit − Dapat diawali oleh kata vol.
− 51(13) − vol. 51
Issue
− Angka − Issue dituliskan setelah volume didalam tanda kurung − Dapat diawali dengan kata no.
− 51(13) − vol. 51, no. 13
Halaman ke-
− Angka − Beberapa posisi halaman dapat dipisahkan dengan tanda minus (-) − Posisi halaman ditulis setelah volume(issue) dengan dibatasi oleh tanda titik dua (:) − Diawali oleh http:// atau https://, ftp://, www., ftp.
− − − −
Alamat internet
51(13): 389-401 389 389-401 vol. 51, no. 13, hlm. 389-401
45
Lampiran 4 Model kalimat daftar pustaka yang mengidentifikasi atribut entri daftar pustaka
digunakan
untuk
# PROSIDING, WORKSHOP 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_. _ANY_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_, _PUBLOC_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_. _PUBLOC_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_. _PUBLOC_, _ANY_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_, _PUBLOC_. _PUBLISHER_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_. _PUBLOC_: _PUBLISHER_. hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_; _ANY_ hlm. _PAGES_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_. _ANY_ hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _SUBTITLE_. _PUBLICATION_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _SUBTITLE_. _PUBLICATION_; _ANY_ hlm. _PAGES_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_. _PUBLICATION_. _PUBLOC_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLOC_: _PUBLICATION_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLOC_: _PUBLICATION_. _PUBLISHER_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_: _PUBLICATION_, _PUBLOC_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_ hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_: _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _PUBLICATION_; _ANY_ hlm. _PAGES_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _PUBLICATION_; _PUBLOC_, _ANY_', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _PUBLICATION_; _PUBLOC_, _ANY_. _PUBLISHER_.', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_,#?#_VOLUME_(_ISSUE_):_PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_,#?#_VOLUME_: _ISSUE_ hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_,#?#_VOLUME_(_ISSUE_)#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_,#?#_VOLUME_: _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_.#?#_VOLUME_(_ISSUE_):_PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_.#?#_VOLUME_: _ISSUE_ hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_.#?#_VOLUME_(_ISSUE_)#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_.#?#_VOLUME_#?#: _PAGES_#?#',
46
Lampiran 4 Lanjutan 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_,#?#_VOLUME_, _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_,#?#_VOLUME_, _ISSUE_, _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_ _VOLUME_(_ISSUE_):_PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_ _VOLUME_(_ISSUE_)#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_ _VOLUME_: _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_, vol.#?#_VOLUME_(_ISSUE_):_PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_, vol.#?#_VOLUME_(_ISSUE_)#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_, vol.#?#_VOLUME_ _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_ vol.#?#_VOLUME_#?#no. _ISSUE_#?#hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_, vol.#?#_VOLUME_#?#no. _ISSUE_#?#hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_, vol.#?#_VOLUME_#?#no. _ISSUE_#?#pp. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_ vol.#?#_VOLUME_#?#hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_ vol.#?#_VOLUME_#?#no. _ISSUE_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_, vol.#?#_VOLUME_#?#no. _ISSUE_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_: vol.#?#_VOLUME_#?#no. _ISSUE_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_, vol.#?#_VOLUME_#?#hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_, vol.#?#_VOLUME_#?#pp. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLICATION_, vol. _VOLUME_#?#no. _ISSUE_#?#hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_ vol.#?#_VOLUME_(_ISSUE_):_PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_ vol.#?#_VOLUME_(_ISSUE_)#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_ vol.#?#_VOLUME_: _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_: hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_ hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_, hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_. hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLICATION_. _ANY_ hlm. _PAGES_#?#', 'prosiding=>_AUTHORS_. _TITLE_. _PUBLICATION_. _PUBLISHER_#?#', 'prosiding=>_AUTHORS_. _TITLE_. _PUBLICATION_. _PUBLISHER_. _PUBLOC_.',
47
Lampiran 4 Lanjutan # MAKALAH, JOURNAL 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_, vol. _VOLUME_, no. _ISSUE_#?#hlm. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. Journal of _PUBLISHER_#?#_VOLUME_(_ISSUE_)#?#_PAGES_.', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. Journal of _PUBLISHER_#?#_VOLUME_(_ISSUE_).', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_,#?#_VOLUME_(_ISSUE_):_PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_,#?#_VOLUME_: _ISSUE_ hlm. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_,#?#_VOLUME_(_ISSUE_)#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_,#?#_VOLUME_: _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_.#?#_VOLUME_(_ISSUE_):_PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_.#?#_VOLUME_: _ISSUE_ hlm. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_.#?#_VOLUME_(_ISSUE_)#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_.#?#_VOLUME_#?#: _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_,#?#_VOLUME_, _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_,#?#_VOLUME_, _ISSUE_, _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_ _VOLUME_(_ISSUE_):_PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_ _VOLUME_(_ISSUE_)#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_ _VOLUME_: _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_.#?#hlm. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_, vol.#?#_VOLUME_(_ISSUE_):_PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_, vol.#?#_VOLUME_(_ISSUE_)#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_, vol.#?#_VOLUME_ _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_ vol.#?#_VOLUME_#?#no. _ISSUE_#?#hlm. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_, vol.#?#_VOLUME_#?#no. _ISSUE_#?#hlm. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_, vol.#?#_VOLUME_#?#no. _ISSUE_#?#pp. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_ vol.#?#_VOLUME_#?#hlm. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_ vol.#?#_VOLUME_#?#no. _ISSUE_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_, vol.#?#_VOLUME_#?#no. _ISSUE_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_: vol.#?#_VOLUME_#?#no. _ISSUE_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_, vol.#?#_VOLUME_#?#hlm. _PAGES_#?#',
48
Lampiran 4 Lanjutan 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_, vol.#?#_VOLUME_#?#pp. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_ vol.#?#_VOLUME_(_ISSUE_):_PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_ vol.#?#_VOLUME_(_ISSUE_)#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_ vol.#?#_VOLUME_: _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_ hlm. _PAGES_.', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_. _ANY_ _PAGES_.', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_, vol.#?#_VOLUME_(_ISSUE_):_PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_, vol.#?#_VOLUME_(_ISSUE_)#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_, vol.#?#_VOLUME_ _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_ vol.#?#_VOLUME_#?#no. _ISSUE_#?#hlm. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_, vol.#?#_VOLUME_#?#no. _ISSUE_#?#hlm. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_, vol.#?#_VOLUME_#?#no. _ISSUE_#?#pp. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_ vol.#?#_VOLUME_#?#hlm. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_ vol.#?#_VOLUME_#?#no. _ISSUE_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_, vol.#?#_VOLUME_#?#no. _ISSUE_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_: vol.#?#_VOLUME_#?#no. _ISSUE_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_, vol.#?#_VOLUME_#?#hlm. _PAGES_#?#', 'jurnal=>_AUTHORS_.#?#_YEAR_. _TITLE_, _PUBLISHER_, vol.#?#_VOLUME_#?#pp. _PAGES_#?#', #SKRIPSI, TESIS, DISERTASI 'skripsi=>_AUTHORS_.#?#_YEAR_. _TITLE_ [skripsi]. _PUBLOC_: _PUBLISHER_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _TITLE_ [skripsi]. _ANY_: _PUBLISHER_, _PUBLOC_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _TITLE_ [skripsi]. _ANY_: _PUBLISHER_. _PUBLOC_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _TITLE_ [skripsi]. _PUBLISHER_, _PUBLOC_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _TITLE_ [skripsi]. _PUBLISHER_. _PUBLOC_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _TITLE_ [skripsi]. _PUBLISHER_._ANY_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _TITLE_ [skripsi]. _PUBLISHER_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _TITLE_ [tesis]. _PUBLOC_: _PUBLISHER_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _TITLE_ [tesis]. _ANY_: _PUBLISHER_, _PUBLOC_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _TITLE_ [tesis]. _ANY_: _PUBLISHER_. _PUBLOC_.',
49
Lampiran 4 Lanjutan 'skripsi=>_AUTHORS_.#?#_YEAR_. _PUBLOC_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _PUBLOC_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. 'skripsi=>_AUTHORS_.#?#_YEAR_. 'skripsi=>_AUTHORS_.#?#_YEAR_. _PUBLISHER_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _PUBLISHER_, _PUBLOC_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _PUBLISHER_. _PUBLOC_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _PUBLOC_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _PUBLOC_.', 'skripsi=>_AUTHORS_.#?#_YEAR_. _ANY_.', 'skripsi=>_AUTHORS_.#?#_YEAR_.
_TITLE_ [tesis]. _PUBLISHER_, _TITLE_ [tesis]. _PUBLISHER_. _TITLE_ [tesis]. _PUBLISHER_. _ANY_.', _TITLE_ [tesis]. _PUBLISHER_.', _TITLE_ [disertasi]. _PUBLOC_: _TITLE_ [disertasi]. _ANY_: _TITLE_ [disertasi]. _ANY_: _TITLE_ [disertasi]. _PUBLISHER_, _TITLE_ [disertasi]. _PUBLISHER_. _TITLE_ [disertasi]. _PUBLISHER_. _TITLE_ [disertasi]. _PUBLISHER_.',
#WEBSITE 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_ _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_, _PUBLOC_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLOC_: _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_. #?#dissertation, _PUBLOC_. _URL_#?#', 'website=>_AUTHORS_. _TITLE_. #?#dissertation, _URL_#?#', 'website=>_AUTHORS_. _TITLE_. #?#dissertation, _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_. _TITLE_. _EDISI_. _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_. _TITLE_. _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_. _TITLE_. _PUBLISHER_: _URL_#?#', 'website=>_AUTHORS_. _TITLE_. _URL_#?#', 'website=>_AUTHORS_. _TITLE_ _URL_#?#', 'website=>_AUTHORS_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_#?#. _TITLE_. #?#request for comments#?#. _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_ [terhubung berkala]. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. [terhubung berkala]. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_ [terhubung berkala]. _PUBLOC_: _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_ [terhubung berkala]. _PUBLISHER_, _PUBLOC_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_ [terhubung berkala]. _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_ [terhubung berkala]. #?#dissertation, _PUBLOC_. _URL_#?#', 'website=>_AUTHORS_. _TITLE_ [terhubung berkala]. _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_. _TITLE_ [terhubung berkala]. _URL_#?#', 'website=>_AUTHORS_. [terhubung berkala]. _URL_#?#',
50
Lampiran 4 Lanjutan 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_. [terhubung berkala]. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_. [terhubung berkala]. _PUBLOC_: _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_. [terhubung berkala]. _PUBLISHER_, _PUBLOC_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_. [terhubung berkala]. _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_.#?#_YEAR_. _TITLE_. [terhubung berkala]. 'website=>_AUTHORS_. _TITLE_. [terhubung berkala]. _PUBLISHER_. _URL_#?#', 'website=>_AUTHORS_. _TITLE_. [terhubung berkala]. _URL_#?#', #BUKU 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _PUBLOC_: _PUBLISHER_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _ANY_: _PUBLISHER_, _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _PUBLISHER_, _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _PUBLISHER_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_, _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_. _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_. _PUBLOC_, _ANY_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_. _PUBLISHER_. _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLOC_: _PUBLISHER_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLOC_: _PUBLISHER_. _ANY_', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_: _PUBLISHER_, _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_. _PAGES_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_ hlm. _PAGES_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_: _PAGES_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _PUBLISHER_. _ANY_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. #?#Technical Report#?#. _PUBLISHER_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. #?#Technical Report#?#. _PUBLISHER_, _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. #?#Technical Report#?#. _PUBLISHER_. _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. #?#Technical Report#?#. _PUBLISHER_. _PUBLOC_, _ANY_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. #?#Technical Report#?#. _PUBLOC_: _PUBLISHER_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. #?#Technical Report#?#. _ANY_: _PUBLISHER_, _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. #?#Technical Report#?#. _PUBLISHER_. _PAGES_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. #?#Technical Report#?#. _PUBLISHER_: _PAGES_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. #?#Technical Report#?#. _PUBLISHER_. _ANY_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _ANY_, editor. #?#_PUBLISHER_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _ANY_, editor. #?#_PUBLISHER_, _PUBLOC_.',
51
Lampiran 4 Lanjutan 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _ANY_, editor. #?#_PUBLISHER_. _PUBLOC_.','buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _ANY_, editor. #?#_PUBLOC_: _PUBLISHER_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _ANY_, editor. _ANY_: _PUBLISHER_, _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _ANY_, editor. #?#_PUBLISHER_. _PAGES_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _ANY_, editor. #?#_PUBLISHER_: _PAGES_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _ANY_, editor. #?#_PUBLISHER_. _ANY_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_, penerjemah. #?#_PUBLISHER_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_, penerjemah. #?#_PUBLISHER_, _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_, penerjemah. #?#_PUBLISHER_. _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_, penerjemah. #?#_PUBLOC_: _PUBLISHER_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_, penerjemah. #?#_PUBLOC_: _PUBLISHER_. _ANY_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_, penerjemah. _ANY_: _PUBLISHER_, _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_, penerjemah. #?#_PUBLISHER_. _PAGES_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_, penerjemah. #?#_PUBLISHER_: _PAGES_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _ANY_, penerjemah. #?#_PUBLISHER_. _ANY_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _ANY_, penerjemah. #?#_PUBLISHER_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _ANY_, penerjemah. #?#_PUBLISHER_, _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _ANY_, penerjemah. #?#_PUBLISHER_. _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _ANY_, penerjemah. #?#_PUBLOC_: _PUBLISHER_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _ANY_, penerjemah. #?#_PUBLOC_: _PUBLISHER_. _ANY_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _ANY_, penerjemah. _ANY_: _PUBLISHER_, _PUBLOC_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _ANY_, penerjemah. #?#_PUBLISHER_. _PAGES_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _ANY_, penerjemah. #?#_PUBLISHER_: _PAGES_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. _EDISI_. _ANY_, penerjemah. #?#_PUBLISHER_. _ANY_.', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _ANY_; _PUBLISHER_, _ANY_ hlm. _PAGES_#?#', 'buku=>_AUTHORS_.#?#_YEAR_. _TITLE_. Di dalam: _ANY_: _PUBLISHER_ hlm. _PAGES_#?#',
52
Lampiran 5 Hasil dari proses identifikasi atribut entri daftar pustaka
Balasuriya, L S and Kodikara, N D. 2000. Frontal View Human Face Detection and Recognition. Srilanka: Department of Statistic and Computer Science, University of Colombo. http://www.dcs.gla.ac.uk/~sumitha/papres/FaceRecognition.pdf [6 Oktober 2004].websiteBalasuriya, L S and Kodikara, N D.
2000.
Frontal View Human Face Detection and Recognition.
Srilanka: Department of Statistic and Computer Science,
University of Colombo.
http://www.dcs.gla.ac.uk/~sumitha/papres/FaceRecognition.pdf< /url>#?# Buono, Agus. 2000. Sistem Pendeteksian Wajah 3D dalam Ruang Eigen dengan Metode Pendugaan Kemungkinan Maksimum Menggunakan Algoritma EM [tesis]. Depok: Fakultas Pascasarjana Program Studi Ilmu Komputer, Universitas Indonesia.skripsiBuono, Agus. 2000. Sistem Pendeteksian Wajah 3D dalam Ruang Eigen dengan Metode Pendugaan Kemungkinan Maksimum Menggunakan Algoritma EM [tesis]. Depok: Fakultas Pascasarjana Program Studi Ilmu Komputer, Universitas Indonesia. Dillon, William R and Goldstein, Matthew. 1984. Multivariate Analysis Method and Applications. New York: John Wiley & Sons.bukuDillon, William R and Goldstein, Matthew. 1984. Multivariate Analysis Method and Applications. New York: John Wiley & Sons. Fauset, L. 1994. Fundamentals of Neural Network. New Jersey: Prentice-Hall.bukuFauset, L. 1994. Fundamentals of Neural Network. New Jersey: Prentice-Hall. Fu, LiMin. 1994. Neural Network in Computer Intelligence. McGraw-Hill Inc.bukuFu, LiMin. 1994. Neural Network in Computer Intelligence. McGraw-Hill Inc.
53
Lampiran 6 Penyimpanan dokumen skripsi ke basis data Mulai
Entri Daftar Pustaka
Metadata Umum
Ektrak metadata
Metadata Spesifik
Tipe = Jurnal
Ya
Penyimpanan Metadata
Dokumen
Penyimpanan Metadata Spesifik
Jurnal
Penyimpanan Metadata Spesifik
Prosiding
Tidak
Tipe = Prosiding
Ya
Tidak
Tipe = Web
Ya
Penyimpanan Metadata Spesifik
Web
Tipe = Skripsi
Ya
Penyimpanan Metadata Spesifik
Skripsi
Tidak
Penyimpanan Nama Pengarang
Selesai
Pengarang
54
Lampiran 7 Proses identifikasi kesamaan nama pengarang Mulai
n=jumlah pengarang i=1 j=1
Identifikasi kesamaan nama pengarang ke i dan pengarang ke j
j=j+1
Tidak
Tidak
Apakah pengarang dianggap sama?
Tidak
Apakah j=n ?
Ya
i=i+1 j=0
Apakah i=n ?
Ya Ya Pengarang ingin digabungkan? Ya Penggabungan nama pengarang
Tidak Ingin melanjutka n Proses? Tidak
Selesai
Ya
55
Lampiran 8 Stop words bahasa Indonesia (Handayani 2012) ada adakah adakan adalah adanya adapun aduh agak agaknya agar aja akalan akan akankah akhir akhirnya akibat akibatkan akibatnya aku ala alangkah alasan alasannya alih alihkan amat amatlah ambil anda andai anggap anggapan antar antara antaranya apa apabila apakah apalagi apalah apanya apapun arti artian
berhubung berhubungan beri berikan berikanlah berikut berikutnya berjumlah berkat berkenaan berkesan berkesempatan berkesimpulan berlalu berlalunya berlama berlangsung bermula bersama bersamaan bertepatan beruntun berupa besarnya beserta besok besoknya betapa biar biarlah biasa biasanya bicarakan bicaranya bila bilamana bilang bisa bisakah bisanya boleh boro buat buatnya bukan
dikata dikatakan dikatakannya dikategorikan dikembangkan diketahui diketahuinya dilaksanakan dilakukan dimana dimulai dimulailah dimulainya dimungkinkan dipaparkan dipersilahkan disaat disebabkan disejumlah diseluruh disertai disertakan disimpulkan disitulah ditanggapi ditanya ditanyakan dituturkan diucapkan dkk dll dsb dua dulu dulunya empat enggak engkau esok gimana habis habisan habiskan habisnya hal
pun rata relevankah rendah saat saatnya saatnyalah saja salah sama sambil sambutannya sampai sana sang sangat sangatlah satunya saya sayangnya seakan seandainya seantero sebab sebabkan sebabnya sebagai sebagaimana sebagainya sebagian sebaik sebaiknya sebaliknya sebanyak sebelum sebelumnya sebenarnya seberapa seberat sebesar sebetulnya sebuah secara sedalam sedang
sesuai sesuatu sesuatunya sesudah sesudahnya sesukanya sesungguhnya setelah setelahnya seterusnya setiap setidak setidaknya seusai sewaktu seyogyanya sia sialnya siap siapa siapakah siapapun silahkan singkatnya sini sinilah situ sosok sosoknya suatu sudah sulit sungguh sungguhpun supaya tak tambahnya tanggapan tanggapannya tanggapnya tanpa tapi tatkala telah tempat
56
Lampiran 8 Lanjutan artinya asalan asalkan asumsi asumsinya atas atasnya atau ataukah ataupun awal bagai bagaikan bagaimana bagaimanakah bagaimanapun bagi baginya bagus bagusnya bahkan bahwa baik baiknya balik banding bandingkan banyak banyaknya barangkali baru bawah bawahnya beberapa begini beginilah begitu begitulah begitupula begitupun belakang belakangan belum belumlah benar
bukankah bukanlah bukannya buktikan cara cerita ceritanya contoh contohkan contohnya cukup Cuma daerah dahulu dalam dan dapat dapatkah dapatkan dapatlah dari darinya daripada dekat dekatnya demi demikian demikianlah dengan dengannya depan depannya di dia dialah dialami dialihkan diambil diambilkan diambilnya dianggap diantara diantaranya diapakan dibagi
hampir hanya hanyalah hari harus haruskah haruslah harusnya hendak hendaklah hendaknya hingga how ialah ingin ini inilah inipun itu itulah kali mulanya muncul mungkin mungkinkah namun nanti negara nilai nyaris nyiakan oleh orang pada padahal padanannya paling panjangnya papar paparan paparkan paparnya para pasti pastilah
sedangkan sedapat sedemikian sedikit sedikitnya segera sehabis seharusnya seharusnyalah sehingga sehubungan sejak sejauhmana sejumlah sekalian sekaligus sekalipun sekarang sekata sekedar sekeliling seketika sekian sekitar selagi selain selalu selama selanjutnya selesai selesaikah seluruh seluruhnya semakin semampunya semenjak sementara semestinya semisal semoga semua semuanya semula seolah seorang
tengah tentang tentu tentunya tepatnya terbagi terbalik terbiasa terbilang terdapat terdapat tergolong terhadap terjadi terjadilah terjadinya terkadang terkait terkecuali terlalu terlebih termasuk ternyata tersebut tertentu terus tetap tetapi tiap tiba tidak tidaklah tidaknya tiga tinggi tutur tuturnya ucap ucapan ucapannya ucapkan ucapnya ujar ujarnya umpamanya
57
Lampiran 8 Lanjutan benarkah benarnya berada berakhir berakhirnya berakibat berakibatkan beralasan beralih beralihnya beranggapan berapa berapanya berapapun berarti berasumsi berbagai berbagi berbanding berbeda berdampak berdasarkan berhadapan berharap
dibagikan dibeberapa diberbagai diberi diberikan diberinya dibiarkan dibiasakan dibilang dicontoh dicontohkan dicontohkannya didapat didapati didapatkan didapatnya didasarkan digolongkan digunakan diharapkan dijadikan dijadikannya dikarenakan dikasih
pastinya pelak pelbagai pemaparan pembagian pembagiannnya pendapat pengalihan pengambil pengambilan pengandaian per peralihan percuma peri perihal perlahan perlu pernah persen pertamanya pinggir pula pulalah
seorangpun sepadan sepanjang sepasang sepele sependapat seperti sepertinya seputar seraya serba serentak sering seringkali seringkalinya seringlah seringnya serta sertanya sesaat sesama sesamamu sesedikit seseorang
umum umumnya ungkap ungkapan ungkapkan ungkapnya untuk usah usahlah usai usianya waktu waktulah waktunya walau walaupun warga yaitu yakni yang
58
Lampiran 9 Stop words bahasa Inggris a able about above abst accordance according accordingly across act actually added adj affected affecting affects after afterwards again against ah all almost alone along already also although always am among amongst an and announce another any anybody anyhow anymore anyone anything anyway anyways anywhere
didn't different do does doesn't doing done don't down downwards due during e each ed edu effect eg eight eighty either else elsewhere end ending enough especially et et-al etc even ever every everybody everyone everything everywhere ex except f far few ff fifth first
immediate immediately importance important in inc indeed index information instead into invention inward is isn't it itd it'll its itself i've j just k keep keeps kept kg km know known knows l largely last lately later latter latterly least less lest let lets like
not noted nothing now nowhere o obtain obtained obviously of off often oh ok okay old omitted on once one ones only onto or ord other others otherwise ought our ours ourselves out outside over overall owing own p page pages part particular particularly past
several shall she shed she'll shes should shouldn't show showed shown showns shows significant significantly similar similarly since six slightly so some somebody somehow someone somethan something sometime sometimes somewhat somewhere soon sorry specifically specified specify specifying still stop strongly sub substantially successfully such sufficiently
try trying ts twice two u un under unfortunately unless unlike unlikely until unto up upon ups us use used useful usefully usefulness uses using usually v value various 've very via viz vol vols vs w want wants was wasn't way we wed welcome
59
Lampiran 9 Lanjutan apparently approximately are aren arent arise around as aside ask asking at auth available away awfully b back be became because become becomes becoming been before beforehand begin beginning beginnings begins behind being believe below beside besides between beyond biol both brief briefly but by
five fix followed following follows for former formerly forth found four from further furthermore g gave get gets getting give given gives giving go goes gone got gotten h had happens hardly has hasn't have haven't having he hed hence her here hereafter hereby herein
liked likely line little 'll look looking looks ltd m made mainly make makes many may maybe me mean means meantime meanwhile merely mg might million miss ml more moreover most mostly mr mrs much mug must my myself n na name namely nay nd
per perhaps placed please plus poorly possible possibly potentially pp predominantly present previously primarily probably promptly proud provides put q que quickly quite qv r ran rather rd re readily really recent recently ref refs regarding regardless regards related relatively research respectively resulted resulting results
suggest sup sure t take taken taking tell tends th than thank thanks thanx that that'll thats that've the their theirs them themselves then thence there thereafter thereby thered therefore therein there'll thereof therere theres thereto thereupon there've these they theyd they'll theyre they've think
we'll went were weren't we've what whatever what'll whats when whence whenever where whereafter whereas whereby wherein wheres whereupon wherever whether which while whim whither who whod whoever whole who'll whom whomever whos whose why widely willing wish with within without won't words world would
60
Lampiran 9 Lanjutan c ca came can cannot can't cause causes certain certainly co com come comes contain containing contains could couldnt d date did
heres hereupon hers herself hes hi hid him himself his hither home how howbeit however hundred i id ie if i'll im
near nearly necessarily necessary need needs neither never nevertheless new next nine ninety no nobody non none nonetheless noone nor normally nos
right run s said same saw say saying says sec section see seeing seem seemed seeming seems seen self selves sent seven
this those thou though thoughh thousand throug through throughout thru thus til tip to together too took toward towards tried tries truly
Sumber: http://www.csc.kth.se/~markusos/data/stopwords.txt (2013)
wouldn't www x y yes yet you youd you'll your youre yours yourself yourselves you've z zero
61
Lampiran 10 Hasil recall dan precision pada pengujian ekstraksi entri daftar pustaka di semua dokuman Dokumen G06400011 G06400036 G06400039 G06498041 G06499025 G06499031 G06499040 G64050119 G64050214 G64050444 G64050478 G64050639 G64051082 G64051906 G64052049 G64052291 G64052587 G64052892 G64053109 G64053204 G64054230 G64060063 G64060068 G64060199 G64060223 G64060282 G64060617 G64060956 G64061132 G64061161 G64061254 G64061423 G64061439 G64061611 G64061749 G64061812 G64061815
Jumlah entri daftar pustaka Teridentifkasi Teridentifikasi Sebenarnya secara tepat oleh sistem sistem 5 5 5 10 10 10 11 11 11 19 19 19 7 7 7 7 7 7 9 8 8 18 18 18 15 15 15 7 7 7 6 6 6 14 14 14 7 7 7 11 10 10 6 6 6 17 16 16 11 11 11 9 9 9 8 6 6 7 7 6 18 14 14 4 4 4 22 19 19 9 9 9 7 6 6 9 8 8 9 8 8 6 5 5 13 12 12 11 11 11 9 9 9 16 15 15 14 14 14 14 14 14 12 12 12 4 4 4 14 13 13
Rb
Pb
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.8889 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9091 1.0000 0.9412 1.0000 1.0000 0.7500 0.8571 0.7778 1.0000 0.8636 1.0000 0.8571 0.8889 0.8889 0.8333 0.9231 1.0000 1.0000 0.9375 1.0000 1.0000 1.0000 1.0000 0.9286
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.8571 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
62
Lampiran 10 Lanjutan Dokumen G64062002 G64062226 G64062227 G64062250 G64062937 G64063196 G64063246 G64063315 G64063750 G64066005 G64066011 G64066020 G64070002 G64070003 G64070008 G64070013 G64070014 G64070015 G64070017 G64070023 G64070024 G64070025 G64070027 G64070031 G64070037 G64070040 G64070043 G64070050 G64070054 G64070059 G64070060 G64070061 G64070062 G64070063 G64070066 G64070069 G64070070
Jumlah entri daftar pustaka Teridentifkasi Teridentifikasi secara tepat oleh Sebenarnya sistem sistem 18 18 18 9 9 9 8 6 6 13 9 9 17 17 17 12 12 12 15 15 15 10 9 9 12 12 12 11 11 11 8 8 8 13 12 12 12 12 12 18 17 17 14 14 14 14 14 14 12 11 11 15 13 13 18 18 18 15 14 14 8 8 8 8 8 8 14 14 14 22 19 19 7 7 7 10 10 10 13 13 13 18 11 11 12 12 12 10 8 8 5 5 5 11 10 10 17 16 16 16 15 15 12 12 12 16 16 16 12 12 12
Rb
Pb
1.0000 1.0000 0.7500 0.6923 1.0000 1.0000 1.0000 0.9000 1.0000 1.0000 1.0000 0.9231 1.0000 0.9444 1.0000 1.0000 0.9167 0.8667 1.0000 0.9333 1.0000 1.0000 1.0000 0.8636 1.0000 1.0000 1.0000 0.6111 1.0000 0.8000 1.0000 0.9091 0.9412 0.9375 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
63
Lampiran 10 Lanjutan Dokumen G64070071 G64070073 G64070074 G64070075 G64070077 G64070080 G64070083 G64070087 G64070088 G64070096 G64070100 G64070101 G64070102 G64070109 G64070113 G64070114 G64070115 G64070116 G64070117 G64070119 G64070120 G64070122 G64070128 G64070129 G64076001 G64076003 G64076004 G64076009 G64076011 G64076015 G64076016 G64076018 G64076022 G64076027 G64076029 G64076034 G64076042
Jumlah entri daftar pustaka Teridentifkasi Teridentifikasi secara tepat oleh Sebenarnya sistem sistem 9 9 9 19 18 18 10 10 10 12 12 12 5 5 5 11 11 8 8 8 8 9 7 7 12 11 11 6 6 6 10 10 10 13 11 11 15 12 12 7 7 7 10 10 10 15 14 14 9 9 8 11 9 9 11 11 11 10 8 8 9 8 8 17 14 14 12 11 11 14 13 13 9 7 7 11 10 10 10 9 9 6 6 6 11 11 11 10 10 9 8 7 7 8 7 7 20 20 19 12 19 2 11 10 10 7 7 7 10 7 7
Rb
Pb
1.0000 0.9474 1.0000 1.0000 1.0000 0.7273 1.0000 0.7778 0.9167 1.0000 1.0000 0.8462 0.8000 1.0000 1.0000 0.9333 0.8889 0.8182 1.0000 0.8000 0.8889 0.8235 0.9167 0.9286 0.7778 0.9091 0.9000 1.0000 1.0000 0.9000 0.8750 0.8750 0.9500 0.1667 0.9091 1.0000 0.7000
1.0000 1.0000 1.0000 1.0000 1.0000 0.7273 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.8889 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9000 1.0000 1.0000 0.9500 0.1053 1.0000 1.0000 1.0000
64
Lampiran 10 Lanjutan Dokumen G64078001 G64080001 G64080003 G64080003 G64080009 G64080012 G64080019 G64080034 G64080036 G64080040 G64080042 G64080044 G64080047 G64080048 G64080064 G64080065 G64080066 G64080068 G64080071 G64080076 G64080077 G64080081 G64080086 G64080099 G64080114 G64080122 G64080124 G64080125 G64086006 G64086020 G64086023 G63086037 G64086045 G64086046 G64086061 G64096012 G64096031
Jumlah entri daftar pustaka Teridentifkasi Teridentifikasi secara tepat oleh Sebenarnya sistem sistem 22 21 21 25 24 23 15 14 14 15 14 14 6 6 6 11 11 9 12 12 12 5 5 5 7 7 7 11 10 10 7 7 7 6 6 6 10 9 9 8 8 8 12 12 12 17 17 17 11 11 11 14 14 14 6 6 6 7 7 7 12 9 9 19 19 19 12 12 12 17 16 16 8 7 7 6 6 6 13 13 13 8 7 7 10 10 10 6 5 5 11 10 10 6 6 6 8 8 8 11 7 7 7 7 7 11 11 11 9 9 9
Rb
Pb
0.9545 0.9200 0.9333 0.9333 1.0000 0.8182 1.0000 1.0000 1.0000 0.9091 1.0000 1.0000 0.9000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.7500 1.0000 1.0000 0.9412 0.8750 1.0000 1.0000 0.8750 1.0000 0.8333 0.9091 1.0000 1.0000 0.6364 1.0000 1.0000 1.0000
1.0000 0.9583 1.0000 1.0000 1.0000 0.8182 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
65
Lampiran 10 Lanjutan Dokumen G64096036 G64096043 G64096056 G64096066 G64101007 G64101013 G64101014 G64101019 G64101025 G64101028 G64101030 G64101032 G64101038 G64101039 G64101062 G64101065 G64101066 G64101069 G64101070 G64102002 G64102008 G64102011 G64102014 G64102015 G64102019 G64102020 G64102021 G64102022 G64102025 G64102026 G64102027 G64102029 G64102032 G64102033 G64102038 G64102044 G64102049
Jumlah entri daftar pustaka Teridentifkasi Teridentifikasi secara tepat oleh Sebenarnya sistem sistem 10 9 9 7 7 7 9 9 9 10 10 10 15 15 15 8 8 8 12 12 12 8 8 8 7 7 7 7 7 7 13 13 13 9 9 9 6 6 6 14 12 11 11 10 10 12 12 12 9 8 7 7 6 6 10 10 10 10 10 10 10 10 10 10 10 10 9 9 9 13 12 12 8 8 8 7 11 4 11 5 5 8 8 8 9 9 9 9 9 9 12 12 12 9 8 8 7 7 7 7 7 7 11 11 11 8 8 8 9 9 9
Rb
Pb
0.9000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.7857 0.9091 1.0000 0.7778 0.8571 1.0000 1.0000 1.0000 1.0000 1.0000 0.9231 1.0000 0.5714 0.4545 1.0000 1.0000 1.0000 1.0000 0.8889 1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9167 1.0000 1.0000 0.8750 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.3636 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
66
Lampiran 10 Lanjutan Dokumen G64102050 G64102053 G64102064 G64103002 G64103003 G64103005 G64103006 G64103008 G64103009 G64103011 G64103014 G64103015 G64103020 G64103023 G64103024 G64103025 G64103026 G64103027 G64103028 G64103029 G64103032 G64103033 G64103040 G64103041 G64103044 G64103046 G64103047 G64103050 G64103053 G64103055 G64103056 G64103058 G64103059 G64103065 G64103066 G64103071 G64103072
Jumlah entri daftar pustaka Teridentifkasi Teridentifikasi secara tepat oleh Sebenarnya sistem sistem 11 11 11 17 17 17 6 6 6 23 22 22 10 10 10 6 6 6 9 9 9 7 7 7 7 6 6 6 6 6 20 19 19 11 10 10 13 13 13 9 7 7 8 8 8 8 8 8 10 10 10 8 8 8 11 11 11 10 10 10 6 6 6 7 6 6 12 12 12 17 16 16 10 10 10 7 7 7 7 7 7 10 10 10 12 12 12 12 12 12 8 8 8 8 8 8 12 12 12 15 12 12 19 19 19 12 12 12 16 16 16
Rb
Pb
1.0000 1.0000 1.0000 0.9565 1.0000 1.0000 1.0000 1.0000 0.8571 1.0000 0.9500 0.9091 1.0000 0.7778 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.8571 1.0000 0.9412 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.8000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
67
Lampiran 10 Lanjutan
Dokumen G64103077 G64104003 G64104006 G64104007 G64104008 G64104011 G64104013 G64104017 G64104019 G64104030 G64104035 G64104037 G64104044 G64104045 G64104046 G64104051 G64104055 G64104060 G64104064 G64104067 G64104082 G64104086 G64104103
Jumlah entri daftar pustaka Teridentifkasi Teridentifikasi Sebenarnya secara tepat oleh sistem sistem 11 11 11 14 14 14 7 7 7 6 6 6 5 4 4 11 11 11 5 5 5 8 7 7 12 12 12 11 11 11 14 14 14 8 8 8 10 10 10 9 9 9 9 8 8 5 5 5 10 10 10 10 10 10 8 8 8 7 7 7 8 8 8 4 3 3 6 6 6
Rb
Pb
1.0000 1.0000 1.0000 1.0000 0.8000 1.0000 1.0000 0.8750 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.8889 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.7500 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
68
Lampiran 11 Hasil recall dan precision pada pengujian identifikasi atribut entri daftar pustaka di semua dokuman Dokumen
G06400011 G06400036 G06400039 G06498041 G06499025 G06499031 G06499040 G64050119 G64050214 G64050444 G64050478 G64050639 G64051082 G64051906 G64052049 G64052291 G64052587 G64052892 G64053109 G64053204 G64054230 G64060063 G64060068 G64060199 G64060223 G64060282 G64060617 G64060956 G64061132 G64061161 G64061254 G64061423 G64061439 G64061611 G64061749 G64061812 G64061815
Jumlah entri daftar pustaka teridentifikasi sistem 5 10 11 19 7 7 8 18 15 7 6 14 7 10 6 16 11 9 6 7 14 4 19 9 6 8 8 5 12 11 9 15 14 14 12 4 13
Jumlah kategori entri daftar pustaka teridentifikasi secara tepat oleh sistem 4 10 11 19 6 7 5 18 15 7 6 13 7 10 6 15 10 9 6 7 14 3 19 9 6 8 8 4 12 11 9 15 14 14 12 4 12
Rb
0.8000 1.0000 1.0000 1.0000 0.8571 1.0000 0.6250 1.0000 1.0000 1.0000 1.0000 0.9286 1.0000 1.0000 1.0000 0.9375 0.9091 1.0000 1.0000 1.0000 1.0000 0.7500 1.0000 1.0000 1.0000 1.0000 1.0000 0.8000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9231
Pb
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
69
Lampiran 11 Lanjutan Dokumen
G64062002 G64062226 G64062227 G64062250 G64062937 G64063196 G64063246 G64063315 G64063750 G64066005 G64066011 G64066020 G64070002 G64070003 G64070008 G64070013 G64070014 G64070015 G64070017 G64070023 G64070024 G64070025 G64070027 G64070031 G64070037 G64070040 G64070043 G64070050 G64070054 G64070059 G64070060 G64070061 G64070062 G64070063 G64070066 G64070069 G64070070
Jumlah entri daftar pustaka teridentifikasi sistem 18 9 6 9 17 12 15 9 12 11 8 12 12 17 14 14 11 13 18 14 8 8 14 19 7 10 13 11 12 8 5 10 16 15 12 16 12
Jumlah kategori entri Rb Pb daftar pustaka teridentifikasi secara tepat oleh sistem 17 0.9444 1.0000 6 0.6667 1.0000 6 1.0000 1.0000 9 1.0000 1.0000 16 0.9412 1.0000 12 1.0000 1.0000 12 0.8000 1.0000 9 1.0000 1.0000 12 1.0000 1.0000 11 1.0000 1.0000 8 1.0000 1.0000 12 1.0000 1.0000 12 1.0000 1.0000 17 1.0000 1.0000 12 0.8571 1.0000 12 0.8571 1.0000 10 0.9091 1.0000 12 0.9231 1.0000 18 1.0000 1.0000 12 0.8571 1.0000 8 1.0000 1.0000 8 1.0000 1.0000 12 0.8571 1.0000 19 1.0000 1.0000 6 0.8571 1.0000 10 1.0000 1.0000 12 0.9231 1.0000 10 0.9091 1.0000 11 0.9167 1.0000 8 1.0000 1.0000 5 1.0000 1.0000 9 0.9000 1.0000 16 1.0000 1.0000 15 1.0000 1.0000 12 1.0000 1.0000 16 1.0000 1.0000 12 1.0000 1.0000
70
Lampiran 11 Lanjutan Dokumen
G64070071 G64070073 G64070074 G64070075 G64070077 G64070080 G64070083 G64070087 G64070088 G64070096 G64070100 G64070101 G64070102 G64070109 G64070113 G64070114 G64070115 G64070116 G64070117 G64070119 G64070120 G64070122 G64070128 G64070129 G64076001 G64076003 G64076004 G64076009 G64076011 G64076015 G64076016 G64076018 G64076022 G64076027 G64076029 G64076034 G64076042
Jumlah entri daftar pustaka teridentifikasi sistem 9 18 10 12 5 8 8 7 11 6 10 11 12 7 10 14 8 9 11 8 8 14 11 13 7 10 9 6 11 9 7 7 19 2 10 7 7
Jumlah kategori entri daftar pustaka teridentifikasi secara tepat oleh sistem 7 18 10 11 3 9 7 6 11 6 10 11 12 7 10 14 8 9 11 8 8 14 11 13 8 10 9 6 11 9 7 7 19 2 10 5 7
Rb
0.7778 1.0000 1.0000 0.9167 0.6000 1.0000 0.8750 0.8571 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.7143 1.0000
Pb
1.0000 1.0000 1.0000 1.0000 1.0000 0.8889 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.8750 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
71
Lampiran 11 Lanjutan Dokumen
G64078001 G64080001 G64080003 G64080009 G64080012 G64080019 G64080034 G64080036 G64080040 G64080042 G64080044 G64080047 G64080048 G64080064 G64080065 G64080066 G64080068 G64080071 G64080076 G64080077 G64080081 G64080086 G64080099 G64080114 G64080122 G64080124 G64080125 G64086006 G64086020 G64086023 G63086037 G64086045 G64086046 G64086061 G64096012 G64096031 G64096036
Jumlah entri daftar pustaka teridentifikasi sistem 21 23 14 6 9 12 5 7 10 7 6 9 8 12 17 11 14 6 7 9 19 12 16 7 6 13 7 10 5 10 6 8 7 7 11 9 9
Total kategori entri Rb Pb daftar pustaka teridentifikasi secara tepat oleh sistem 14 0.6667 1.0000 22 0.9565 1.0000 14 1.0000 1.0000 6 1.0000 1.0000 9 1.0000 1.0000 11 0.9167 1.0000 5 1.0000 1.0000 6 0.8571 1.0000 10 1.0000 1.0000 7 1.0000 1.0000 6 1.0000 1.0000 9 1.0000 1.0000 8 1.0000 1.0000 11 0.9167 1.0000 17 1.0000 1.0000 11 1.0000 1.0000 13 0.9286 1.0000 6 1.0000 1.0000 7 1.0000 1.0000 8 0.8889 1.0000 19 1.0000 1.0000 12 1.0000 1.0000 16 1.0000 1.0000 7 1.0000 1.0000 6 1.0000 1.0000 13 1.0000 1.0000 7 1.0000 1.0000 9 0.9000 1.0000 5 1.0000 1.0000 8 0.8000 1.0000 5 0.8333 1.0000 8 1.0000 1.0000 5 0.7143 1.0000 7 1.0000 1.0000 9 0.8182 1.0000 9 1.0000 1.0000 9 1.0000 1.0000
72
Lampiran 11 Lanjutan Dokumen
G64096043 G64096056 G64096066 G64101007 G64101013 G64101014 G64101019 G64101025 G64101028 G64101030 G64101032 G64101038 G64101039 G64101062 G64101065 G64101066 G64101069 G64101070 G64102002 G64102008 G64102011 G64102014 G64102015 G64102019 G64102020 G64102021 G64102022 G64102025 G64102026 G64102027 G64102029 G64102032 G64102033 G64102038 G64102044 G64102049 G64102050
Jumlah entri daftar pustaka teridentifikasi sistem 7 9 10 15 8 12 8 7 7 13 9 6 11 10 12 7 6 10 10 10 10 9 12 8 4 5 8 9 9 12 8 7 7 11 8 9 11
Jumlah kategori entri daftar pustaka teridentifikasi secara tepat oleh sistem 7 9 10 15 8 12 8 7 6 13 9 6 11 9 12 7 6 10 10 9 10 9 12 8 4 4 8 9 9 12 8 7 7 11 7 9 11
Rb
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.8571 1.0000 1.0000 1.0000 1.0000 0.9000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9000 1.0000 1.0000 1.0000 1.0000 1.0000 0.8000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.8750 1.0000 1.0000
Pb
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
73
Lampiran 11 Lanjutan Dokumen
G64102053 G64102064 G64103002 G64103003 G64103005 G64103006 G64103008 G64103009 G64103011 G64103014 G64103015 G64103020 G64103023 G64103024 G64103025 G64103026 G64103027 G64103028 G64103029 G64103032 G64103033 G64103040 G64103041 G64103044 G64103046 G64103047 G64103050 G64103053 G64103055 G64103056 G64103058 G64103059 G64103065 G64103066 G64103071 G64103072 G64103077
Jumlah entri daftar pustaka teridentifikasi sistem 17 6 22 10 6 9 7 6 6 19 10 13 7 8 8 10 8 11 10 6 6 12 16 10 7 7 10 12 12 8 8 12 12 19 12 16 11
Jumlah kategori entri Rb Pb daftar pustaka teridentifikasi secara tepat oleh sistem 17 1.0000 1.0000 6 1.0000 1.0000 22 1.0000 1.0000 9 0.9000 1.0000 6 1.0000 1.0000 9 1.0000 1.0000 7 1.0000 1.0000 6 1.0000 1.0000 6 1.0000 1.0000 19 1.0000 1.0000 9 0.9000 1.0000 13 1.0000 1.0000 7 1.0000 1.0000 7 0.8750 1.0000 8 1.0000 1.0000 10 1.0000 1.0000 8 1.0000 1.0000 11 1.0000 1.0000 9 0.9000 1.0000 5 0.8333 1.0000 6 1.0000 1.0000 12 1.0000 1.0000 16 1.0000 1.0000 10 1.0000 1.0000 7 1.0000 1.0000 7 1.0000 1.0000 10 1.0000 1.0000 12 1.0000 1.0000 12 1.0000 1.0000 8 1.0000 1.0000 8 1.0000 1.0000 12 1.0000 1.0000 12 1.0000 1.0000 18 0.9474 1.0000 12 1.0000 1.0000 16 1.0000 1.0000 11 1.0000 1.0000
74
Lampiran 11 Lanjutan Dokumen
G64104003 G64104006 G64104007 G64104008 G64104011 G64104013 G64104017 G64104019 G64104030 G64104035 G64104037 G64104044 G64104045 G64104046 G64104051 G64104055 G64104060 G64104064 G64104067 G64104082 G64104086 G64104103
Jumlah entri daftar pustaka teridentifikasi sistem 14 7 6 4 11 5 7 12 11 14 8 10 9 8 5 10 10 8 7 8 3 6
Jumlah kategori entri Rb Pb daftar pustaka teridentifikasi secara tepat oleh sistem 14 1.0000 1.0000 7 1.0000 1.0000 6 1.0000 1.0000 4 1.0000 1.0000 11 1.0000 1.0000 5 1.0000 1.0000 6 0.8571 1.0000 12 1.0000 1.0000 10 0.9091 1.0000 13 0.9286 1.0000 8 1.0000 1.0000 10 1.0000 1.0000 9 1.0000 1.0000 8 1.0000 1.0000 5 1.0000 1.0000 10 1.0000 1.0000 10 1.0000 1.0000 8 1.0000 1.0000 7 1.0000 1.0000 8 1.0000 1.0000 3 1.0000 1.0000 6 1.0000 1.0000
75
Lampiran 12 Hasil pengujian hubungan dokumen dalam koleksi dengan entri daftar pustaka Nama Pengarang
Ci
Fi
Rc
Pc
Han J Kamber M Manning CD Raghavan P Schutze H Baeza-Yates R Demiroz G Ribeiro-Neto B Ridha A Pressman R Gonzales RC Fauset L Woods RE Kusumadewi S Sommerville I Fu LM Hoede C Zhang L Vanstone S Nurdiati S Mitchell T Steinbach M Jain AK Adisantoso J Romadoni D Buono A Barus B Connolly TM Kumar V Schneier B Sarle W Tan P Lapoliwa H Acharya T Ray AK Wiradisastra US Begg CE Do MN Munir R
52 46 26 23 15 20 5 17 17 24 14 6 22 15 14 19 18 16 12 16 9 11 10 9 9 8 8 11 11 9 8 16 5 8 8 7 12 7 7
48 44 23 22 22 21 21 20 18 17 16 14 14 14 13 13 12 12 11 10 9 9 9 9 9 8 8 8 8 8 8 8 8 8 8 7 7 7 7
0.9231 0.9565 0.8846 0.9565 1.0000 1.0000 1.0000 1.0000 1.0000 0.7083 1.0000 1.0000 0.6364 0.9333 0.9286 0.6842 0.6667 0.7500 0.9167 0.6250 1.0000 0.8182 0.9000 1.0000 1.0000 1.0000 1.0000 0.7273 0.7273 0.8889 1.0000 0.5000 1.0000 1.0000 1.0000 1.0000 0.5833 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 0.6818 0.9524 0.2381 0.8500 0.9444 1.0000 0.8750 0.4286 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.6250 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
76
Lampiran 12 Lanjutan Nama Pengarang
Ci
Fi
Rc
Pc
Prahasta E Menezes A Cox E Kantardzic M Alwi H Dardjowidjojo S Moeliono AM Rusiyamti Sukoco H Larose DT Croft WB
7 12 7 7 7 7 7 7 6 7 6
7 7 7 7 7 7 7 7 6 6 6
1.0000 0.5833 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.8571 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
77
RIWAYAT HIDUP Penulis dilahirkan di Bogor pada tanggal 13 Januari 1985 merupakan anak kedua dari tiga bersaudara dari pasangan Nadirman Haska dan Roswita Bunas. Pada tahun 2004 penulis menyelesaikan pendidikan Diploma 3 pada program studi Teknik Teknik Informatika di Institut Pertanian Bogor. Pada tahun yang sama penulis melanjutkan ke pendidikan Sarjana pada program studi Ilmu Komputer di Universitas Gadjah Mada. Penulis pernah bekerja sebagai staf pengajar pada program keahlian Manajemen Informatika dan Teknik Komputer di Direktorat Program Diploma, Institut Pertanian Bogor pada tahun 2006 s/d 2008. Pada tahun 2009 penulis menjadi Pegawai Negeri Sipil sebagai Staf Sub Bidang Data di Pusat Pembinaan, Pendidikan dan Pelatihan, Badan Pengkajian dan Penerapan Teknologi (BPPT). Penulis tercatat sebagai mahasiswa Program Pascasarjana di Departemen Ilmu Komputer, IPB pada tahun ajaran 2010/2011. Pada tahun 2012 Penulis mendapatkan beasiswa pendidikan dari BPPT untuk menyelesaikan studi.