VISUALISASI DAN NAVIGASI SEMANTIK PADA SUBJEK TESIS IPB MENGGUNAKAN PELUANG BERSYARAT
CHUSNUL ARIFIN RASUANDAR
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Visualisasi dan Navigasi Semantik pada Subjek Tesis IPB Menggunakan Peluang Bersyarat adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Agustus 2013 Chusnul Arifin Rasuandar NIM G64090113
ABSTRAK CHUSNUL ARIFIN RASUANDAR. Visualisasi dan Navigasi Semantik pada Subjek Tesis IPB Menggunakan Peluang Bersyarat. Dibimbing oleh FIRMAN ARDIANSYAH dan BADOLLAHI MUSTAFA. Pencarian dan penelusuran dokumen menggunakan istilah subjek pada dokumen merupakan cara yang efektif dalam mendapatkan informasi penelitian yang ada di IPB, misalnya dokumen tesis. Hasil pencarian dan penelusuran akan menjadi lebih interaktif jika ditambahkan visualisasi informasi. Penelitian ini bertujuan untuk membangun sistem penelusuran dokumen berdasarkan subjek pada tesis IPB dan memvisualisasikan keterhubungan antaristilah subjeknya. Dilakukan proses stemming pada istilah subjek menggunakan algoritme Porter Stemmer dan selanjutnya dibuat daftar istilah subjek menggunakan teknik thresholding. Analisis dilakukan terhadap nilai threshold untuk menentukan nilai threshold yang menghasilkan waktu komputasi yang efisien dan jumlah istilah subjek yang optimal. Hasil penelitian menunjukkan nilai threshold yang baik ialah 4 dengan waktu komputasi 334 detik dan 381 istilah subjek. Selanjutnya, dihitung besar peluang keterhubungan antaristilah subjeknya menggunakan rumus peluang bersyarat untuk kemudian dirancang bentuk visualisasinya. Kata kunci: visualisasi, subjek tesis, penelusuran dokumen, peluang bersyarat, Institut Pertanian Bogor
ABSTRACT CHUSNUL ARIFIN RASUANDAR. Visualization and Semantic Navigation on Bogor Agricultural University (IPB) thesis subject using conditional probability. Supervised by FIRMAN ARDIANSYAH and BADOLLAHI MUSTAFA. Searching and browsing research documents, such as thesis, using subject terms in document is an effective way to obtain information about existing research in IPB. These two tasks results will be more interactive when a visualization module is added. This research aims to build a document browsing system based on subjects of the IPB’s thesis metadata and to visualize the relations among subject terms. Subject terms are stemmed using the Porter Stemmer algorithm and the list of subject term are created using the thresholding technique. Analysis on threshold values is performed to determine the threshold level which gives efficient computation time and the optimal number of subject terms. The experimental results show that the threshold value of 4 provides the computation time of 334 seconds and results in 381 subject terms. Furthermore, the probabilities of subject terms are calculated using the conditional probability formula and a visualization module is designed. Keywords: visualization, thesis subjects, documents browsing, conditional probability, Bogor Agricultural University
VISUALISASI DAN NAVIGASI SEMANTIK PADA SUBJEK TESIS IPB MENGGUNAKAN PELUANG BERSYARAT
CHUSNUL ARIFIN RASUANDAR
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
Penguji: Irman Hermadi, Phd
Judul Skripsi: Visualisasi dan Navigasi Semantik pad a Subjek Tesis IPB Menggunakan Peluang Bersyarat Nama : Chusnul Arifin Rasuandar : G64090113 NIM
Disetujui oleh
titla()~ Finnan Ardiansyah, SKom MSi Pembimbing I
Tanggal Lulus:
2 6 AUG 2013
Dr~~ustafa, Pembimbing II
MLib
Judul Skripsi : Visualisasi dan Navigasi Semantik pada Subjek Tesis IPB Menggunakan Peluang Bersyarat Nama : Chusnul Arifin Rasuandar NIM : G64090113
Disetujui oleh
Firman Ardiansyah, SKom MSi Pembimbing I
Drs Badollahi Mustafa, MLib Pembimbing II
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Desember 2012 ini ialah visualisasi informasi, dengan judul Visualisasi dan Navigasi Semantik pada Subjek Tesis IPB Menggunakan Peluang Bersyarat. Dalam pelaksanaan tugas akhir ini banyak pihak yang selalu memberikan dukungan dan bantuan. Oleh karena itu, penulis ingin menyampaikan terima kasih kepada: 1 Papa Albert Zultanair, Mama Masayu Tuti Hawa, Adit, dan Poppy yang senantiasa memberikan dukungan, kasih sayang, doa, dan semangat yang luar biasa. 2 Bapak Firman Ardiansyah, SKom MSi dan Bapak Drs Badollahi Mustafa, MLib selaku dosen pembimbing yang selalu memberikan bimbingan dan nasihat selama pengerjaan tugas akhir. 3 Bapak Irman Hermadi, Phd selaku dosen penguji atas kesediaannya sebagai penguji pada ujian tugas akhir. 4 Toto Haryanto, SKom Msi selaku dosen pembimbing akademik yang telah membimbing penulis selama masa perkuliahan. 5 Teman-teman satu bimbingan: Bimo, Nadya, Riandi, Nathan, dan Kevin yang senantiasa saling memberikan semangat dan bersedia menjadi teman diskusi. 6 Fahri, Erwin, Haqqi, Doddy, Rangga, Hanna, Iis, Fara, Nurul, Rini, Wulan, Luksi, dan rekan-rekan Ilkom 46 yang selalu memberikan dukungan dan bantuan satu sama lain. Semoga karya ilmiah ini bermanfaat. Bogor, Agustus 2013 Chusnul Arifin Rasuandar
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Perumusan Masalah
2
Tujuan Penelitian
2
Manfaat Penelitian
2
Ruang Lingkup Penelitian
3
METODE
3
Pengumpulan Data
3
Pembersihan Data
4
Indexing
4
Perhitungan Peluang Antaristilah
4
Perancangan Visualisasi
6
Perancangan Antarmuka
6
HASIL DAN PEMBAHASAN
6
Pengumpulan Data
6
Pembersihan Data
7
Indexing
8
Perhitungan Peluang Antaristilah
12
Perancangan Visualisasi
13
Perancangan Antarmuka
14
SIMPULAN DAN SARAN
15
Simpulan
15
Saran
16
DAFTAR PUSTAKA
16
LAMPIRAN
18
RIWAYAT HIDUP
21
DAFTAR TABEL 1 2 3 4 5
Matriks perhitungan banyak istilah dalam satu subjek Matriks perhitungan peluang antaristilah Contoh istilah yang mengandung anomali Contoh istilah yang sudah dikenai proses stemming Contoh nilai peluang
5 5 8 9 12
DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9
Metode penelitian Format INDOMARC CDS/ISIS Contoh record data yang mengalami kesalahan parsing Grafik keterhubungan jumlah data dengan waktu komputasi Grafik keterhubungan jumlah data dengan jumlah istilah yang dihasilkan Grafik keterhubungan jumlah data dengan jumlah pasangan subjek yang lolos threshold Visualisasi keterhubungan istilah subjek forestry Tampilan antarmuka bagian visualisasi Tampilan antarmuka bagian back-end processing
3 6 7 10 10 11 13 15 15
DAFTAR LAMPIRAN 1 Contoh record yang mengandung kesalahan pengetikan 2 Hasil perhitungan nilai threshold terhadap waktu komputasi, jumlah pasangan subjek yang lolos threshold dan jumlah subjek yang dihasilkan 3 Perhitungan persentase keragaman istilah subjek
17
18 19
PENDAHULUAN Latar Belakang Pencarian (searching) dan penelusuran (browsing) dokumen merupakan kegiatan yang sering terjadi di perpustakaan. Dalam proses mendapatkan informasi, pencarian dan penelusuran dokumen pada suatu koleksi merupakan dua hal yang berbeda. Pencarian adalah proses memasukkan query ke dalam suatu search engine yang menghasilkan dokumen-dokumen yang sudah diurutkan berdasarkan tingkat kecocokan dengan query. Penelusuran adalah proses melihat suatu halaman secara berurutan dengan menggunakan hyperlink (Olston & Chi 2003). Pencarian dan penelusuran dokumen merupakan kegiatan yang mudah untuk mendapatkan suatu informasi. Akan tetapi, keduanya memiliki keterbatasan. Menurut Manber et al. (2007), pencarian terkadang sulit dilakukan oleh pengguna yang belum menentukan query yang akan dimasukkannya, sedangkan penelusuran dapat membuat konten dalam koleksi menjadi lebih hidup sehingga pengguna yang belum menentukan query akan menjadi tertuntun namun membutuhkan waktu yang lama dalam mendapatkan informasi. Proses pencarian berdasarkan subjek atau topik pada metadata dokumen merupakan cara yang efektif jika pengguna ingin mencari dokumen yang sesuai dengan topik yang diinginkan. Hasil pencarian dan penelusuran tersebut akan lebih interaktif jika ditambahkan visualisasi informasi. Menurut Chase et al. (1998), visualisasi dapat mendukung interaksi yang efisien dan efektif untuk beragam pekerjaan kognitif pengguna seperti menganalisis, meringkas, dan menarik kesimpulan atas informasi yang didapat. Akan tetapi, kebutuhan pengguna dalam mencari infomasi semakin meluas dan rumit sehingga visualisasi sederhana tidak cukup untuk mengatasi masalah tersebut. Terkadang informasi keterhubungan antardokumen tidak terilustrasikan dengan baik sehingga pengguna sulit untuk menelusuri informasi dari satu dokumen ke dokumen lainnya (Kboubi et al. 2010). Oleh karena itu, perlu dibuat sistem yang memudahkan pengguna untuk mendapatkan informasi yang diinginkan dengan menelusuri keterhubungan antardokumen. Pada penelitian yang sudah dilakukan oleh Rizky (2010), sistem pencarian dokumen berdasarkan subjek sudah dibuat dengan basis desktop serta penambahan fitur visualisasi keterhubungan antaristilah (term) dari subjek. Sistem tersebut menggunakan perhitungan peluang bersyarat untuk memeringkat hasil pencarian dari query yang dimasukkan oleh pengguna dan hasil tersebut ditampilkan dalam visualisasi. Sistem tersebut sudah berjalan dengan baik akan tetapi masih memiliki kelemahan. Kelemahannya yaitu waktu eksekusi sistem dianggap kurang efisien. Setelah query dimasukkan oleh pengguna, sistem menjalankan proses perhitungan peluang bersyarat dengan koleksi data yang sangat banyak sehingga waktu eksekusinya menjadi tinggi. Kelemahan tersebut memang sudah berlaku pada sistem pencarian secara umum karena untuk melakukan pemeringkatan, sistem akan meminta pengguna memasukkan query.
2 Selain waktu eksekusi, sistem juga memiliki kelemahan lain, yakni melakukan proses pemenggalan subjek berdasarkan kata sehingga terdapat beberapa frase di dalam koleksi dokumen yang dipenggal dan menghasilkan dua atau lebih kata yang berbeda. Hal ini dapat menimbulkan kejanggalan pada hasil yang akan divisualisasikan. Misalnya, frase Jawa Barat nantinya akan dipenggal menjadi kata Jawa dan kata Barat. Jika terdapat istilah yang seharusnya berhubungan dengan frase Jawa Barat, misalnya Animal, maka hasilnya adalah Animal-Jawa dan Animal-Barat. Hasil keterhubungan antara Animal dengan Barat inilah yang dikatakan janggal. Oleh karena itu, diperlukan penelitian untuk mengurangi kelemahan-kelemahan dari sistem tersebut. Pada penelitian ini, sistem akan dibangun untuk penelusuran istilah subjek tidak untuk pencarian sehingga sistem tidak perlu melakukan pemeringkatan hasil query. Selain itu, perhitungan peluang bersyarat dan pembuatan daftar istilah untuk query dilakukan pada saat proses pembuatan koleksi data (indexing). Jadi, pada saat pengguna memasukkan query untuk penelusuran, sistem hanya menampilkan hasil visualisasi berdasarkan nilai peluang yang sudah dihitung sebelumnya.
Perumusan Masalah Pada penelitian ini, akan dibuat sistem penelusuran yang diharapkan dapat mengatasi keterbatasan sistem pencarian secara umum. Masalah yang mungkin menjadi perhatian dalam penelitian ini adalah: 1 Bagaimana membangun struktur sistem yang efektif sehingga hasil yang ditampilkan tidak menimbulkan kejanggalan dan waktu eksekusinya menjadi efisien? 2 Kapan dilakukannya perhitungan peluang bersyarat?
Tujuan Penelitian Tujuan penelitian ini ialah membangun sistem penelusuran dokumen berdasarkan subjek yang dipisahkan berdasarkan frase dan menampilkan visualisasi keterhubungan antaristilahnya.
Manfaat Penelitian Manfaat penelitian ini ialah membantu pengguna dalam mendapat ide dan topik untuk melakukan pencarian dokumen yang lebih spesifik. Dengan adanya visualisasi, nantinya pengguna akan menjadi lebih mudah menelusuri keterhubungan antardokumen tesis IPB melalui keterhubungan subjek tesis. Selain itu, sistem yang akan dibuat diharapkan dapat menunjukkan kekayaan intelektual dan penelitian yang dilakukan oleh IPB.
3 Ruang Lingkup Penelitian 1 2 3
Ruang lingkup penelitian ini ialah: Data yang digunakan adalah data tesis perpustakaan pusat IPB tahun 19632013 dengan format CDS/ISIS. Pembuatan index istilah subjek berdasarkan frase bukan kata. Proses perhitungan peluang hanya untuk dua istilah, yaitu istilah yang akan ditelusuri dan istilah yang ada di koleksi dokumen (daftar istilah).
METODE Pengumpulan Data Secara umum, metode penelitian ini meliputi pengumpulan data, pembersihan data, tahap indexing, perhitungan peluang antaristilah, perancangan visualisasi, dan perancangan antarmuka. Tahapan metode penelitian ini dapat dilihat pada Gambar 1. Pada penelitian ini, data yang digunakan adalah metadata tesis IPB tahun 1963 sampai tahun 2013. Data diambil dari perpustakaan pusat IPB dalam bentuk data CDS/ISIS (Computerised Documentation Service/Integrated Set Information Systems). CDS/ISIS adalah sistem temu kembali dan penyimpanan informasi yang didesain secara spesifik untuk manajemen terkomputerisasi dari database nonnumerik yang terstruktur (UNESCO 2004). Format metadata di dalam data CDS/ISIS tersebut mengikuti aturan format INDOMARC (Indonesia-Machine Readable Cataloging). Format INDOMARC merupakan implementasi dari International Standar Organization (ISO) Format ISO 2709 untuk Indonesia, sebuah format untuk pertukaran informasi bibliografis melalui magnetic tape, compact disk, atau media machine-readable lainnya. Informasi bibliografis secara umum mencakup pengarang, judul, subjek, catatan, data penerbitan, dan deskripsi fisik (PNRI 2005). Data dalam CDS/ISIS tersebut nantinya akan diekspor ke dalam format CSV (Comma Separated Values) atau XLS (Microsoft Excel Spreadsheet) terlebih dahulu sebelum dilakukan proses pembersihan data.
Gambar 1 Metode penelitian
4 Pembersihan Data Pembersihan data dilakukan untuk membenahi data hasil ekspor dari bentuk data CDS/ISIS menjadi CSV. Data hasil ekspor akan memiliki field yang tidak terisi. Data yang akan digunakan dalam penelitian ini haruslah berupa data CSV yang memiliki field yang lengkap atau terisi semua. Selain bagian field yang lengkap, data yang digunakan harus memiliki jumlah istilah yang cukup pada field subjek di dalam data CSV tersebut. Dalam penelitian ini, ditetapkan istilah minimum dalam satu data ialah dua istilah.
Indexing Proses indexing dilakukan untuk membuat daftar istilah yang diambil dari field subjek pada data XLS. Untuk mengambil istilah-istilah tersebut, diperlukan proses parsing pada data XLS menggunakan script PHP ke dalam database MySQL. Setelah proses parsing dilakukan, diperoleh kumpulan istilah subjek metadata tesis. Kumpulan istilah subjek tersebut akan digunakan untuk membuat inverted index. Inverted index adalah index yang selalu memetakan dari suatu istilah (terms) ke dalam bagian dokumen dimana istilah tersebut berada (Manning et al. 2008). Index tersebut dapat digunakan untuk menunjukkan dokumen yang direpresentasikan oleh kumpulan istilah tersebut.
Perhitungan Peluang Antaristilah Proses dimulai dengan menghitung peluang masing-masing istilah terhadap jumlah dokumen secara keseluruhan. Proses perhitungannya sesuai dengan rumus berikut: ∑ P a dengan ∑ adalah jumlah istilah a dalam kumpulan istilah keseluruhan dan ( ) adalah jumlah dokumen secara keseluruhan. Setelah itu, dilakukan perhitungan banyaknya istilah satu dengan istilah yang lainnya yang berada dalam satu subjek metadata tesis. Proses perhitungannya dapat digambarkan dengan matriks seperti pada Tabel 1, dengan adalah istilah a, adalah istilah b dan ∑ a adalah jumlah a dan yang a berada dalam satu subjek metadata tesis. Setelah itu dilakukan perhitungan peluang antaristilah menggunakan rumus perhitungan peluang bersyarat. Proses perhitungannya dapat digambarkan dengan matriks seperti pada Tabel 2, dengan rumus peluang bersyarat sebagai berikut: P( a | ) dengan
P
a
P
5 ∑
)
P( a
a
Peluang antaristilah dihitung untuk menunjukkan kedekatan satu istilah dengan istilah lainnya. Misalkan istilah a dan istilah b memiliki peluang yang besar, maka dapat dikatakan bahwa istilah a dekat dengan istilah b atau banyak tesis IPB yang memiliki subjek dengan pasangan istilah tersebut. Tabel 1 Matriks perhitungan banyak istilah dalam satu subjek Istilah
fa
fb
fc
fa
-
a
a
fb fc
c
a
-
a
c
c c
-
Dengan melihat Tabel 1, maka proses perhitungan banyaknya istilah fa dan fb dalam satu subjek tesis adalah dengan menggunakan rumus ∑( a ), dengan a adalah istilah a dan adalah istilah b. Untuk hasil perhitungan banyaknya istilah yang sama dalam satu subjek tesis (misal fa dan fa) yang berarti tesis hanya berjumlah satu istilah subjek, dianggap tidak ada karena dalam penelitian ini tesis yang digunakan harus memiliki minimal dua buah istilah subjek. Tabel 2 Matriks perhitungan peluang antaristilah Istilah
fa
fa
-
fb P
fb
P
a
fc
P
c a
P
fc
a
P
a c
-
P
c
c
-
Dengan melihat Tabel 2, maka proses perhitungan peluang istilah fa dengan dengan adalah istilah yang istilah fb adalah dengan menggunakan rumus P a akan ditelusuri keterhubungannya dan a adalah istilah yang mempunyai keterhubungan dengan istilah yang ditelusuri.
6 Perancangan Visualisasi Perancangan visualisasi dimulai dengan memilih bentuk dasar dari visualisasinya, contohnya graph, tree, atau vector. Pada penelitian ini, bentuk dasar yang dipilih adalah graph dengan bentuk seperti matahari. Graph tersebut mempunyai dua node, yaitu parent dan child. Node parent merupakan node yang merepresentasikan istilah yang akan ditelusuri keterhubungannya sedangkan node child merupakan node yang merepresentasikan istilah yang mempunyai keterhubungan dengan istilah yang ditelusuri. Visualisasi dilakukan dengan mempertimbangkan besaran nilai peluang dari istilah yang akan ditelusuri. Perbedaan besaran nilai peluang dapat digambarkan dengan dengan membedakan warna atau ukuran node child.
Perancangan Antarmuka Penambahan fitur interaksi dalam antarmuka dapat memudahkan pengguna dalam menggunakan aplikasi. Contoh interaksi yang akan terjadi selama penggunaan aplikasi ialah proses pemilihan istilah yang akan ditelusuri keterhubungannya (node parent) dan proses penelusuran keterhubungan antaristilah melalui hasil visualisasi. Fitur interaksi yang akan dibuat dapat berupa search box untuk pencarian istilah pada daftar istilah atau penambahan animasi pada hasil visualisasi.
HASIL DAN PEMBAHASAN Pengumpulan Data Data yang digunakan dalam penelitian ini adalah metadata tesis IPB mulai dari tahun 1963 sampai 2013. Data tersebut sudah terkumpul dalam format CDS/ISIS yang dapat dilihat menggunakan program Winisis. Data yang terkumpul berjumlah 12 109. Data tersebut merupakan data CDS/ISIS yang diambil dari perpustakaan pusat IPB. Format penulisan data tersebut sudah mengikuti format INDOMARC. Gambar 2 merupakan contoh format INDOMARC dari data tersebut.
Gambar 2 Format INDOMARC CDS/ISIS
7 Format INDOMARC dalam data CDS/ISIS tersebut memiliki beberapa tag yang menunjukkan kode atribut dari suatu data. Sebagai contoh tag 245 merupakan judul dari tesis dan tag 100 merupakan penulis tesis. Dalam penelitian ini, tag-tag yang akan digunakan adalah tag 245 yang merupakan judul tesis, tag 102 yang merupakan penulis utama tesis, tag 260 yang merupakan tahun terbit tesis, tag 300 yang merupakan atribut tambahan seperti jumlah halaman dari tesis, tag 710 yang merupakan departemen asal penulis utama, serta tag 650 yang merupakan subjek dari tesis dan yang akan menjadi fokus penelitian ini. Tag 650 memiliki beberapa simbol-simbol tertentu yang membedakan arti dari subjek, seperti ^a yang berarti subjek besar (umum), ^x berarti subjek kecil (khusus), ^y berarti tahun yang terkait pada penelitian, dan ^z berarti tempat yang terkait pada penelitian. Dalam penelitian ini, simbol yang digunakan adalah ^a dan ^x. Setelah itu, data tersebut dikonversikan ke dalam format XLS menggunakan operasi print pada program Winisis.
Pembersihan Data Kumpulan data CDS/ISIS yang sudah dikonversikan ke dalam format XLS masih mengandung record data yang tidak bersih atau kurang sesuai dengan yang diinginkan. Oleh karena itu, perlu dilakukan proses pembersihan data, yaitu menghilangkan record data yang hanya memiliki satu subjek, memperbaiki record data yang mengalami kesalahan parsing saat proses konversi dari CDS/ISIS, dan menghilangkan tanda baca. Data awal yang dikonversikan dari CDS/ISIS berjumlah 12 109 record data. Setelah menghilangkan record data yang hanya memiliki satu subjek, data keseluruhan menjadi 9304 record data dan selanjutnya dilakukan penghilangan tanda baca pada record data. Setelah itu, data sudah dapat dianggap bersih dan siap untuk diolah. Jumlah data bersih secara keseluruhan berjumlah 9304 record data. Akan tetapi, di dalam data bersih tersebut masih mengandung 1499 record data yang mengalami kesalahan parsing saat proses konversi. Gambar 3 menunjukkan contoh satu field record data yang mengalami kesalahan parsing. Dari Gambar 3, dapat dikatakan bahwa record data yang mengalami kesalahan parsing adalah record yang memiliki camel case (karakter lowercase dan uppercase yang berdekatan) pada datanya. Camel case di sini menunjukkan bahwa jumlah subjek dari record data tersebut lebih dari satu subjek, misalnya
Gambar 3 Contoh record data yang mengalami kesalahan parsing
8 pada record “ProstaglandinsOestrous cycle” yang memiliki dua subjek, yaitu “Prostaglandins” dan “Oestrous cycle”. Hal ini terjadi akibat keterbatasan pada sintaks operasi print pada program Winisis sehingga terjadi kesalahan dalam memisahkan subjek yang berjumlah lebih dari satu di dalam tag 650^a atau 650^x. Oleh karena itu, perlu dilakukan perbaikan record data dengan cara menghilangkan camel case pada record tersebut. Proses penghilangan camel case dibuat dalam script PHP dan dilakukan pada awal proses indexing berlangsung. Untuk memudahkan proses penghilangan camel case, perlu dilakukan perbaikan pada 20 record subjek yang mengandung kesalahan pengetikan seperti pada Lampiran 1. Perbaikan record tersebut dilakukan secara manual karena jumlah data hanya sedikit.
Indexing Proses indexing dimulai dengan mengimpor data XLS ke dalam database MySQL. Selanjutnya, dilakukan proses penghilangan camel case pada record data yang mengalami kesalahan parsing. Setelah itu, dibuat daftar istilah berdasarkan subjek dan dihitung frekuensinya. Perhitungan frekuensi dilakukan untuk mengetahui jumlah setiap pasang istilah yang ada. Selain itu, perhitungan dilakukan untuk memeriksa istilah yang mengandung anomali yang mungkin terjadi akibat kesalahan pengetikan atau perbedaan persepsi pustakawan yang memberikan subjek tesis. Tabel 3 dapat menunjukkan anomali tersebut. Dapat dilihat dari Tabel 3, terdapat dua pasangan istilah yang hanya berjumlah 1, sedangkan pasangan istilah lainnya berjumlah 4 sehingga dapat dikatakan bahwa dua pasangan istilah tersebut mengandung anomali. Hal ini disebabkan jumlah tesis kedua istilah tersebut hanya berjumlah 1 yang sangat memungkinkan adanya suatu kesalahan dalam pengetikan atau perbedaan persepsi pustakawan dalam memberi subjek tesis. Di lain sisi, tesis yang mengandung subjek agricultural economics dan agribusiness dianggap tidak ada anomali karena berjumlah 4 yang artinya sulit dikatakan mengandung kesalahan. Akan tetapi, sesungguhnya tesis-tesis tersebut bersubjek sama. Karena adanya anomali, sistem menganggap istilah subjek tersebut menjadi berbeda. Oleh karena itu, perlu dilakukan tindakan pembenahan istilah subjek yang mengandung anomali. Tabel 3 Contoh istilah yang mengandung anomali Subjek1 agricultural economic agricultural economics agricultural economy
Subjek2 agribusiness agribusiness agribusiness
Jumlah 1 4 1
Tindakan pembenahan istilah tersebut dapat dilakukan dengan dua pilihan, yaitu dengan memperbaiki istilah yang mengandung anomali menjadi bentuk istilah subjek yang sesuai atau membuat ketiga istilah tersebut menjadi seragam. Idealnya, tindakan yang paling tepat ialah memperbaiki istilah yang mengandung anomali menjadi bentuk istilah subjek yang sesuai, namun diperlukan suatu pedoman atau kamus istilah untuk membandingkan bentuk yang sesuai dengan
9 bentuk yang tidak sesuai tadi. Karena keterbatasan ini, maka dipilih tindakan yang kedua, yaitu membuat ketiga istilah tersebut menjadi seragam. Cara sederhana yang dapat dilakukan untuk menyeragamkan ketiga istilah tersebut ialah dengan memenggal imbuhan pada istilah tersebut. Salah satu algoritme yang dapat menghilangkan imbuhan adalah algoritme Porter Stemmer. Oleh karena itu, maka dilakukan proses stemming pada daftar istilah yang sudah dibuat. Tabel 4 merupakan hasil stemming dari istilah-istilah pada Tabel 3. Tabel 4 Contoh istilah yang sudah dikenai proses stemming
No 1 2 3 4 5
Subjek1 agricultur econom agricultur econom agricultur econom agricultur econom agricultur economi
Subjek2 agribusi agribusi agribusi agribusi agribusi
Pada Tabel 4 dapat terlihat kekurangan dari algoritme Porter Stemmer, yaitu pada istilah nomor 5. Istilah pada Subjek1 yang mulanya agricultural economy berubah menjadi agricultural economi bukan agricultural econom sehingga istilah nomor 5 menjadi berbeda dengan yang istilah lainnya. Oleh karena itu, perlu dilakukan thresholding jumlah istilah yang bertujuan untuk mengurangi istilahistilah yang kurang sesuai atau tidak seragam dengan istilah-istilah yang ada seperti istilah agricultural economi. Dalam penelitian ini, nilai threshold perlu diperhatikan karena akan memengaruhi hasil dari daftar istilah dan waktu komputasi dari proses indexing. Pada penelitian ini, dilakukan beberapa kali (trial and error) percobaan proses indexing menggunakan empat buah koleksi data dengan jumlah data yang berbeda. Percobaan ini bertujuan melihat keterhubungan antara jumlah data dan nilai threshold dengan waktu komputasi saat indexing, keterhubungan antara jumlah data dan nilai threshold dengan jumlah istilah subjek yang dihasilkan, serta keterhubungan antara jumlah data dan nilai threshold dengan jumlah data yang lolos threshold. Selain itu, percobaan ini bertujuan menentukan nilai threshold yang dapat menghasilkan waktu komputasi yang efisien dan jumlah istilah yang optimal. Dalam percobaan ini, disiapkan empat buah koleksi data, yaitu data tahun 1963-2013, 1993-2013, 2003-2013, dan 2008-2013 dengan jumlah data masingmasing sebanyak 9304, 7419, 5450 dan 3329 record data. Setelah dilakukan percobaan dengan menggunakan 10 threshold, maka didapatkan grafik seperti pada Gambar 4, Gambar 5, dan Gambar 6. Hasil percobaan selengkapnya dapat dilihat pada Lampiran 2. Dengan melihat Gambar 4, dapat disimpulkan bahwa semakin besar data yang akan diindeks, semakin besar pula waktu komputasi yang dihasilkan. Waktu komputasi sangat tinggi untuk threshold=1 sedangkan untuk threshold=2 dan seterusnya waktu komputasi menurun. Hal ini terjadi karena tidak ada data yang tersisihkan dari nilai threshold yang diberikan atau dapat dikatakan bahwa semua data diindeks secara keseluruhan sehingga waktu komputasi menjadi sangat tinggi. Akan tetapi, perbedaan tidak begitu terlihat antara waktu komputasi yang
10
Gambar 4 Grafik keterhubungan jumlah data dengan waktu komputasi dihasilkan threshold=3 sampai threshold=10. Dengan demikian, dapat dikatakan bahwa nilai threshold tidak mempengaruhi waktu komputasi secara signifikan. Dengan melihat Gambar 5 dan Gambar 6, dapat disimpulkan bahwa semakin besar data yang akan diindeks, semakin banyak pula istilah subjek yang akan dihasilkan dan semakin banyak pasangan subjek yang lolos threshold. Jumlah istilah semakin menurun seiring bertambahnya nilai threshold. Hal ini terjadi karena semakin tinggi nilai threshold, semakin banyak pasangan subjek yang tersisihkan dan tidak mencukupi untuk lolos dari threshold yang ditentukan sehingga jumlah istilah subjek yang dihasilkan semakin sedikit. Oleh karena itu, dapat dikatakan bahwa nilai threshold mempunyai pengaruh yang signifikan terhadap jumlah istilah subjek yang dihasilkan.
Gambar 5 Grafik keterhubungan jumlah data dengan jumlah istilah yang dihasilkan
11
Gambar 6 Grafik keterhubungan jumlah data dengan jumlah pasangan subjek yang lolos threshold Berdasarkan Gambar 4, Gambar 5 dan Gambar 6, dapat dianalisis bahwa nilai threshold yang dapat menghasilkan waktu komputasi yang efisien berkisar antara 3 sampai 10 karena waktu komputasinya cenderung sama. Untuk menentukan nilai threshold yang menghasilkan jumlah istilah subjek yang optimal, perlu dianalisis terlebih dahulu berapa jumlah istilah yang dianggap optimal dengan cara menghitung persentase keragaman. Persentase keragaman menunjukkan banyaknya istilah yang dihasilkan terhadap jumlah pasangan subjek yang lolos threshold. Misalkan dalam suatu koleksi data terdapat 10 buah data dan terdapat 10 istilah di dalam koleksi tersebut, maka persentase keragamannya bernilai 100%. Jika hanya terdapat 1 buah istilah di dalam 10 data tersebut, maka persentase keragamannya bernilai 0%. Dalam penelitian ini, persentase keragaman dapat dihitung dengan menggunakan rumus sebagai berikut: Pe sentase
te m te m
dengan term1 adalah jumlah istilah subjek yang dihasilkan dan term2 adalah jumlah pasangan subjek yang lolos threshold. Misalkan untuk data tahun 19632013 dengan nilai threshold=3, jumlah pasangan subjek yang lolos threshold berjumlah 4245 dan jumlah istilah yang dihasilkan sebanyak 545 subjek, maka persentasenya sebesar 12.84%. Untuk data yang sama, nilai threshold=4 persentasenya 10.68% dan untuk nilai threshold=5 persentasenya sebesar 9.07%. Hasil perhitungan selengkapnya dapat dilihat Lampiran 3. Tujuan dilakukannya perhitungan persentase ragam ini ialah mendapatkan persentase yang terkecil dengan mempertimbangkan jumlah pasangan subjek yang lolos threshold dan jumlah dokumen yang digunakan. Selain itu, persentase keragaman yang kecil dipilih karena koleksi data yang dihasilkan akan memiliki sedikit data dengan subjek yang mengandung kesalahan. Oleh karena itu, pada penelitian ini ditetapkan data yang digunakan adalah data tahun 1963-2013. Untuk
12 mendapatkan nilai threshold yang dipilih, dilakukan perhitungan rata-rata persentase keragaman pada data tahun 1963-2013, yaitu sebesar 12.48%, lalu dicari nilai threshold yang memiliki nilai persentase keragaman mendekati nilai rata-rata. Dengan demikian, nilai threshold yang dipilih adalah 4 sebagai nilai threshold yang menghasilkan jumlah istilah subjek yang optimal. Selanjutnya, dilakukan proses thresholding terhadap data yang sebelumnya sudah dikenai proses stemming. Setelah itu, akan didapat daftar istilah baru yang memungkinkan bersih dari data yang kurang sesuai. Selanjutnya, dilakukan proses pembuatan inverted index.
Perhitungan Peluang Antaristilah Proses perhitungan peluang dimulai dengan membuat kombinasi antaristilah dari daftar istilah yang sudah dibuat. Kombinasi tersebut merupakan pasanganpasangan istilah yang mungkin berpasangan pada satu field subjek tesis. Proses perhitungannya sebagai berikut: 1 Subjek yang nantinya akan dilihat keterhubungannya dinamakan subjek parent dan subjek-subjek berhubungan dinamakan subjek child. 2 Merujuk ke rumus (2), maka yang bertindak sebagai a adalah child dan parent bertindak sebagai b. 3 Pertama, dihitung jumlah tesis yang mengandung istilah subjek parent pada daftar istilah, lalu dihitung juga jumlah tesis yang mengandung istilah subjek parent dan child yang berada pada satu tesis. Setelah nilai keduanya sudah diketahui, dihitung perbandingan antara jumlah tesis yang mengandung istilah subjek parent dan child yang berada pada satu tesis dengan jumlah tesis yang mengandung istilah subjek parent pada daftar istilah. Perbandingan antara jumlah keduanya disebut peluang subjek child jika subjek parent yang dipilih. Jika nilai peluang antaristilah tersebut sudah dihitung, nilai peluang tersebut disimpan beserta istilah yang bersangkutan ke dalam database. Tabel 5 adalah contoh nilai peluang beserta istilah yang bersangkutan. Subjek2 merupakan subjek parent sedangkan Subjek1 adalah subjek child. Diketahui bahwa istilah subjek agribusi pada daftar istilah berjumlah 18 sedangkan istilah subjek agricultur econom berjumlah 51. Istilah subjek agribusi dan agricultur econom yang terletak pada satu tesis berjumlah 5. Hasil perhitungan peluangnya seperti pada Tabel 5. Tabel 5 Contoh nilai peluang Subjek1 agribusi agricultur econom
Subjek2 agricultur econom agribusi
Peluang 0.09803 0.27777
13 Perancangan Visualisasi Proses perancangan visualisasi dimulai dengan pembuatan script PHP untuk mengumpulkan data yang sesuai dengan query yang dimasukkan pengguna. Query yang dimasukkan oleh pengguna akan dikenai proses stemming terlebih dahulu menggunakan algoritme Porter Stemmer. Setelah itu, dicari nilai peluang dan istilah-istilah pasangan yang sudah dikenai proses stemming dari query tersebut di dalam database. Selanjutnya, dicari istilah asli dari istilah-istilah pasangan tersebut. Setelah istilah asli didapatkan, istilah tersebut ditandai sebagai child dan query yang dimasukkan pengguna sebagai parent. Setelah didapatkan data parent dan child, selanjutnya dibuat script PHP untuk menghubungkan data parent dan child dengan script untuk visualisasi. Pada penelitian ini, script untuk visualisasi menggunakan script JQuery JIT. Setelah koleksi data sudah terhubung dengan script visualisasi, dilakukan pengaturan terhadap atribut-atribut visualisasi, seperti ukuran dan bentuk node, warna node dan edge, jarak antara node parent dan node child, serta warna background visualisasi. Dapat dilihat dari Gambar 7, visualisasi yang ditampilkan adalah hasil visualisasi dari query forestry. Istilah forestry bertindak sebagai node parent dengan jumlah node child sebanyak 19 buah. Hasil visualisasi tersebut mengandung makna bahwa istilah subjek forestry memiliki keterhubungan dengan 19 istilah lainnya. Oleh karena itu, dapat dikatakan bahwa 19 child tersebut memiliki kesamaan, yaitu berada dalam satu field subjek dengan subjek forestry di dalam metadata tesis IPB. Terdapat perbedaan pada setiap node child baik segi warna maupun ukuran.
Gambar 7 Visualisasi keterhubungan istilah subjek forestry
14 Pada penelitian ini, perbedaan warna menunjukkan range nilai peluang, sedangkan ukuran node menunjukkan rasio dari peluang untuk setiap child yang berhubungan dengan parent. Selain itu, arah putar berlawanan jarum jam pada node-node child dari hasil visualisasi membentuk urutan peluang dari peluang terkecil hingga yang terbesar. Jadi, dapat disimpulkan bahwa istilah subjek forest management memiliki hubungan paling erat dengan subjek forestry dibandingkan dengan istilah subjek lainnya.
Perancangan Antarmuka Menurut Zhang (2008), terdapat tiga paradigma sistem dalam menampilkan visualisasi informasi, yaitu QB (Query searching and Browsing), BQ (Browsing and Query searching), dan BO (Browsing Only) paradigm. Sistem yang telah dibuat dalam penelitian ini mengikuti sistem dengan paradigma QB paradigm, yaitu pengguna akan diminta memasukkan query berupa istilah subjek, lalu sistem akan menampilkan hasil pencarian tersebut, selanjutnya pengguna akan menelusuri istilah-istilah yang terhubung dengan istilah yang dimasukkan sebagai query pada visualisasi yang ditampilkan. Oleh karena itu, telah dibuat antarmuka yang sesuai dengan paradigma sistem tersebut. Antarmuka pengguna terbagi menjadi dua bagian, yaitu bagian untuk visualisasi dan bagian untuk back-end processing. Antarmuka bagian visualisasi adalah bagian yang mencakup antarmuka utama untuk menampilkan visualisasi dari keterhubungan istilah query yang dimasukkan pengguna beserta fitur-fitur interaksi visualisasi, sedangkan antarmuka bagian back-end processing adalah bagian yang mencakup antarmuka untuk pengguna yang menangani koleksi data yang akan ditampilkan dalam visualisasi. Fitur-fitur interaksi yang terdapat pada bagian visualisasi antara lain search box untuk pencarian istilah pada daftar istilah, halaman yang memuat daftar istilah untuk memudahkan pengguna memilih istilah yang akan dimasukkan sebagai query, link untuk menampilkan dokumen-dokumen yang terkait dengan query dan istilah yang berhubungan, penambahan animasi dan link pada child, serta fitur panning, dragging dan zooming untuk hasil visualisasi. Antarmuka bagian back-end processing terdiri atas halaman untuk menampilkan informasi tentang koleksi data yang sedang digunakan, halaman untuk melakukan proses indexing termasuk proses impor data dari XLS ke MySQL, dan halaman untuk menampilkan daftar istilah yang digunakan saat ini. Gambar 8 adalah tampilan antarmuka bagian visualisasi dan Gambar 9 adalah tampilan antarmuka salah satu halaman pada bagian back-end processing. Sistem dengan visualisasi yang dibuat dalam penelitian ini dapat membantu pengguna menelusuri keterhubungan antardokumen tesis IPB melalui keterhubungan subjek tesis. Sistem ini tidak hanya menampilkan dokumen yang sesuai dengan query yang dimasukkan pengguna, tetapi juga menampilkan dokumen-dokumen yang berhubungan dengan subjek yang dicari. Dengan fitur visualisasi dari sistem, pengguna dapat mengetahui subjek-subjek yang sudah pernah diteliti oleh IPB dan jumlah penelitian yang menggunakan subjek tersebut.
15
Gambar 8 Tampilan antarmuka bagian visualisasi
Gambar 9 Tampilan antarmuka bagian back-end processing
SIMPULAN DAN SARAN Simpulan Penelitian ini telah berhasil membangun sistem penelusuran dokumen berdasarkan istilah subjek dan menampilkan hasil visualisasinya. Penelitian ini juga berhasil membuat struktur sistem yang dapat mengurangi waktu eksekusi dan mengurangi kejanggalan dalam menampilkan hasil visualisasi. Pada penelitian ini, dapat disimpulkan bahwa nilai threshold tidak memengaruhi waktu komputasi saat proses indexing secara signifikan, namun memengaruhi jumlah istilah subjek yang dihasilkan sehingga persentase ragam dari istilah subjekpun ikut terpengaruh. Proses penyeragaman istilah menggunakan Porter Stemmer dan proses thresholding masih memiliki kekurangan dalam membuat koleksi data, yaitu masih menyisakan data yang tidak terpakai yang jumlahnya cukup signifikan.
16 Saran Pada penelitian ini, sebaiknya pada saat proses indexing dilakukan perbaikan istilah yang mengandung anomali menjadi bentuk istilah subjek yang sesuai. Untuk melakukan proses ini, dibutuhkan kamus istilah atau thesaurus yang harus dibuat sebelumnya.
DAFTAR PUSTAKA Chase P D’Amo e R Ge shon N Holland R, Hyland R, et al. Semantic Visualization. ACL-COLING Workshop on Content Visualization and Intermedia Representations. 1998 Agustus 15; Montreal, Canada. New Brunswick(US): ACL. hlm 52-62. Kboubi F, Habacha A, BenAhmed M. 2012. Semantic visualization and navigation in textual corpus. International Journal of Information Sciences and Techniques. 2(1):53-62. Manber U, Smith M, Gopal B. 1997. Webglimpse: Combining browsing and searching. USENIX 1997 Annual Technical Conference; 1997 Jan 6-10; Anaheim, California. Berkeley(US): USENIX Association. hlm 195-206. Manning CD, Raghavan P, Schutze H. 2008. Introduction to Information Retrieval. New York(US): Cambridge University Press. Olston C, Chi E. 2003. ScentTrails: integrating browsing and searching on the web. ACM Transactions on Computer-Human Interaction. 10(3):177-197. [PNRI] Perpustakaan Nasional Republik Indonesia. 2005. INDOMARC Format MARC Indonesia. Jakarta(ID): Perpustakaan Nasional Republik Indonesia. Rizky R. 2010. Visualisasi keterhubungan antaristilah subjek pada metadata tesis IPB menggunakan peluang bersyarat [skripsi]. Bogor (ID): Institut Pertanian Bogor. [UNESCO] United Nations Educational, Scientific dan Cultural Organization. 2004. CDS/ISIS for Windows Reference Manual (Version1.5). Nelson(NZ): UNESCO. Zhang J. 2008. Visualization for Information Retrieval. Berlin(DE): SpringerVerlag.
17 Lampiran 1 Contoh record yang mengandung kesalahan pengetikan No.
Record subjek sebelum diperbaiki
Record subjek setelah diperbaiki
1
AGriculture
Agriculture
2
AGronomy
Agronomy
3
AGronomy
Agronomy
4
MArine ecologi
Marine ecologi
5
STatistic analysis
Statistic analysis
6
PLankton
Plankton
7
GeneraL GEOLOGY
General GEOLOGY
8
OIl
Oil
9
HUnting
Hunting
10
FOrestry
Forestry
11
FIscal policy
Fiscal policy
12
MOlecular biology
Molecular biology
13
EConomics
Economics
14
FiIsheries
Fisheries
15
LOcal planning
Local planning
16
aBotany
Botany
17
DFisheries
Fisheries
18
FIies
Flies
19
SSavage Treatment
Savage Treatment
20
Animal HUsbandry
Animal Husbandry
18 Lampiran 2 Hasil perhitungan nilai threshold terhadap waktu komputasi, jumlah pasangan subjek yang lolos threshold dan jumlah subjek yang dihasilkan Threshold Data a 19632013
19932013
20032013
20082013
1
2
3
4
5
6
7
8
9
10
921
385
373
334
349
343
342
327
342
329
b
13296 5477 4245 3567 3075 2775 2535 2353 2209 1984
c
5352
947
545
381
279
224
187
161
146
115
a
603
216
204
193
182
188
179
186
193
192
b
10073 4018 3040 2575 2191 1981 1825 1706 1602 1467
c
4683
804
426
294
212
164
138
122
106
87
a
182
82
72
63
57
59
60
56
57
52
b
5822
3249 2551 2215 1871 1716 1590 1450 1362 1272
c
2804
660
363
259
184
151
126
105
92
78
a
76
39
32
31
29
30
30
29
29
29
b
3613
1902 1422 1176
940
865
799
715
667
604
c
1974
488
114
98
82
67
57
47
259
181
Keterangan : a = Waktu komputasi (detik), b = Jumlah pasangan subjek yang lolos threshold, c = Jumlah istilah subjek yang dihasilkan
19 Lampiran 3 Perhitungan persentase keragaman istilah subjek Threshold 1 2 3 4 5 6 7 8 9 10 a
1963-2013 40.25 17.29 12.84 10.68 9.07 8.07 7.38 6.84 6.61 5.80
Persentase Keragaman(%)a 1993-2013 2003-2013 46.49 48.16 20.01 20.31 14.01 14.23 11.42 11.69 9.68 9.83 8.28 8.80 7.56 7.92 7.15 7.24 6.62 6.75 5.93 6.13
2008-2013 54.64 25.66 18.21 15.39 12.13 11.33 10.26 9.37 8.55 7.78
Jumlah istilah subjek yang dihasilkan dibagi jumlah pasangan subjek yang lolos threshold
20
RIWAYAT HIDUP Penulis lahir di kota Jakarta pada tanggal 21 Mei 1992 sebagai anak pertama dari 3 bersaudara dari pasangan Albert Zultanair dan Masayu Tuti Hawa. Penulis menghabiskan seluruh masa kecilnya serta mengenyam pendidikan di kota Bekasi. Penulis merupakan lulusan dari Sekolah Menengah Atas Negeri 9 Bekasi (2006–2009), Sekolah Menengah Pertama Negeri 26 Bekasi (2003–2006), Sekolah Dasar Negeri Pedurenan 6 Bekasi (1999–2003) dan Sekolah Dasar Negeri Cibening 2 Bekasi (1997-1999). Pada tahun 2009, penulis diterima sebagai Mahasiswa Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Pada tanggal 1 Juli 2012, penulis melaksanakan Praktik Kerja Lapangan di Perseroan Terbatas Pertamina Region Unit VI Balongan Indramayu sampai tanggal 14 Agustus 2012. Selama mengikuti perkuliahan, penulis pernah menjadi asisten praktikum untuk Mata Kuliah Algoritma dan Pemrograman pada tahun 2011, 2012 dan 2013, asisten praktikum untuk Mata Kuliah Rekayasa Perangkat Lunak pada tahun 2012 dan 2013, dan asisten praktikum untuk Mata Kuliah Basis Data pada tahun 2013 di Departemen Ilmu Komputer Institut Pertanian Bogor. Penulis merupakan seorang pencinta olahraga, khususnya sepakbola dan basket. Penulis juga merupakan seorang pencinta musik dan menekuni alat musik gitar bass serta olah vokal.