Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016
ISSN 2502-6968 (Media Cetak)
IMPLEMENTASI SUFFIX TREE CLUSTERING UNTUK PENGELOMPOKAN DOKUMEN YANG TELAH DI AKSES MELALUI MESIN PENCARIAN GOOGLE Heru Sutadi Mahasiswa Program Studi Teknik Informatika STMIK Budi Darma Medan Jl. Sisingamangaraja No. 338 Sp. Limun Medan http : // www.stmik-budidarma.ac.id // Email :
[email protected] ABSTRAK Implementasi adalah tindakan-tindakan oleh individu publik dan swasta atau kelompok yang diarahkan pada prestasi tujuan yang diterapkan dalam keputusan kebijakan sebelumnya. Sehingga dapat tercapainya sebuah kebijakan yang memberikan hasil tindakan tersebut.Pengelompokkan dokumen adalah aktifitas untuk membentuk suatu kelompok dokumen. Pengelompokkan terutama digunakan untuk klasifikasi data. Pengelompokkan telah terbukti menjadi unsur penting dalam pengolahan data terutama data-data mentah yang diinginkan untuk suatu bentuk pola-pola kumpulan data.Metode Suffix Tree Clustering adalah metode yang sering digunakan untuk pengelompokkan dokumen. Suffix Tree Clustering memiliki dua kunci utama dan dua langkah utama dalam prosesnya. Katakunci : Implementasi, Pengelompokan dokumen, metode Suffix Tree Clustering. 1. Pendahuluan 1.1 Latar Belakang Masalah Perkembangan teknologi saat ini semakin memudahkan pengguna mendapatkan informasi yang digunakan. Salah satu sumber yang mudah digunakan untuk mendapatkan informasi tersebut adalah search engine (mesin Pencari). History mesin pencari adalah salah satu tempat dimana pengguna dapat mencari seluruh informasi hasil dari download melalui google apapun dengan mudah, terutama bagi pengguna internet. Tetapi tidak sedikit pengguna internet merasa kebingungan dalam mengakses ulang, terutama masalah pengelompokkan dokumen yang telah di download melalui google seperti jejaring sosial, pendidikan, pekerjaan, yang kini tersimpan di history mesin pencarian, jika pengguna ingin menelusuri hasil dari history mesin pencarian mereka merasa kebingungan karena di history tersebut masih dalam keadaan acak jadi sangat menyulitkan bagi pengguna media sosial. Solusi untuk permasalahan di atas adalah dengan mengorganisasikan hasil history mesin pencarian yang telah diakses melalui google. Solusi di pilih berdasarkan hasil topik yang dimiliki. Pengguna dapat melihat dan menelusuri ringakasan dari hasil pencarian tersebut secara lebih cepat. Solusi ini diharapkan dapat membuat waktu yang digunakan pengguna lebih efektif dan efisien saat melakukan penelusuran dari hasil history mesin pencarian, Penerapan solusi ini dapat dilakukan dengan metode suffix tree clustering. Clustering untuk melakukan pengelompokkan dokumen history mesin pencarian.
1.2 Perumusan Masalah Berdasarkan latar belakang masalah di atas, maka dapat dirumuskan masalah yang akan menjadi pokok pembahasan sebagai berikut : 1. Bagaimana prosedur pengelompokkan dokumen yang telah diakses melalui mesin pencarian google? 2. Bagaimana menerapkan metode suffix tree clustering untuk pengelompokan dokumen yang telah diakses melalui mesin pencarian google? 3. Bagaimana membangun aplikasi pengelompokan metode dokumen yang telah diakses melalui mesin pencarian google? 1.3 Batasan Masalah Adapun batasan masalah dalam penulisan skripsi ini adalah sebagai berikut : 1. Sumber data yang di clustering adalah halaman yang telah ditelusuri oleh mesin pencari google 2. Dokumen yang difilter adalah dokumen jejaring sosial, pendidikan, kesehatan, pariwisata. 3. Proses clustering dilakukan melalui aplikasi yang terpisah dari mesin pencari dan dibuat dengan bahasa pemrograman visual basic 2008. 1.4 Tujuan Penelitian Adapun tujuan dari penelitian ini adalah sebagai berikut : 1. Mengetahui prosedur pengelompokkan dokumen yang telah diakses melalui mesin pencari google. 2. Menerapkan metode suffix tree clustering untuk mengelompokkan dokumen yang telah diakses melalui mesin pencari google. 3. Membangun aplikasi pengelompokkan dokumen yang telah diakses melalui mesin pencari google.
Implementasi Suffix Tree Clustering Untuk Pengelompokan Dokumen Yang Telah Di Akses Melalui Mesin Pencarian Google. Oleh : Heru Sutadi
49
Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016
2. Landasan Teori 2.1 Implementasi Implementasi dapat juga diartikan sebagai tindakan-tindakan oleh individu publik dan swasta atau kelompok yang diarahkan pada prestasi tujuan yang diterapkan dalam keputusan kebijakan sebelumnya. Jadi implementasi dimaksud sebagai tindakan individu publik yang diarahkan pada tujuan serta ditetapkan dalam keputusan dan memastikan terlaksan dan tercapainya suatu kebijakan serta memberikan hasil yang bersifat praktis terhadap sesama. 2.2 Pengelompokkan Pengelompokkan adalah istilah dalam bahasa inggris yang berarti usaha atau aktifitas untuk membentuk kelompok. Kelompok sendiri adalah suatu grup tertutup atau sekumpulan obyek yang mirip (similar). Pengelompokkan terutama digunakan untuk klasfikasi data. Pengelompokkan telah terbukti menjadi unsur penting dalam pengolahan data terutama data-data mentah yang diinginkan untuk menjadi suatu bentuk pola-pola kumpulan data ( Agus Widodo, 2003, 2 ). Pengelompokkan disebut sebagai pengendalian alat dan berlaku sebagai ulangan. Tujuan pengelompokkan adalah untuk memperoleh materi percobaan sehomogen mungkin dalam tiap kelompok sehingga perbedaan respon sebagian besar disebabkan karena pengaruh perlakuan. Pengelompokkan hasil pencarian dapat membantu pengguna dalam tiga hal, yakni pertam, memudahkan pencarian informasi yang dibutuhkan, kedua, membantu pengguna sehingga lebih cepat menyadari bahwa query yang diformulasikan kurang tepat (misalnya, bersifat terlalu umum) mengurangi fraksi atau tingkat kuantitas tertentu dimana pengguna ‘menyerah’ sebelum menemukan informasi yang diinginka (Agus Widodo, 2003, 2). 2.2.1 Dokumen Dokumen adalah menurut bahasa Inggris berasal dari kata “document” yang mempunyai arti suatu yang tertulis atau yang tercetak dan segala benda yang memiliki berbagai keterangan dipilih untuk di disusun, di kumpulkan, di sediakan ataupun untuk disebarkan. Dokumentasi adalah berasal dari istilah internasional, dalam bahasa Inggris disebut dengan “documentation”. Sedangkan dalam bahasa Belanda disebut dengan “documentatie”, lalu dalam bahasa Latin disebut “documentum” yang dapat di artiken pencarian, penyelidikan, pengumpulan, penyusunan, pemakaian dan juga penyediaan dokumen untuk mendapatkan berbagai keterangan serta penerapanpenerapan dan bukti. Bisa disimpulkan berarti kumpulan dari berbagai dokumen dapat memberikan keterangan ataupun bukti yang berkaitan dengan proses pengumpulan serta
ISSN 2502-6968 (Media Cetak)
pengelolaan dokumen secara sistematis dan menyebar luaskan kepada pemakai informasi tersebut, atau bisa juga disimpulkan dokumentasi adalah suatu pekerjaan yang bertugas mengumpulkan, menyusun, mencari, menyelidiki, meneliti, dan mengolah serta memelihara dan juga menyiapkan sehingga menjadi dokumen baru yang bermanfaat. ( Dea Anggraeni Utomo, 2013, 4). 2.2.2 Mesin Pencarian Mesin pencarian yaitu kombinasi perangkat keras dan perangkat lunak komputer yang disediakan oleh perusahaan tertentu melalui website tang telah ditentukan. Banyak peneliti dan survey menunjukkan bahwa google adalah search engine nomor satu diikuti oleh yahoo. Search angine mengumpulkan informasi dari web melalui program bot (robot) web crawler yang secara periodik menelusuri web. Proses pengambilan informasi dari website-website yang ada ini disebut dengan web scraping, web screping adalah proses pengambilan sebuah dokumen semi struktur dari internet, umumnya berupa halaman-halaman web dalam bahasa markup seperti HTML atau XHTML, dalam menganalisa dokument tersebut ( Ahmad Josi, 2014, 1). 2.3 Metode Suffix Tree Clustering Suffix tree clustering memiliki dua langkah utama, langkah pertama adalah pencarian shared phrase untuk semua dokumen berita yang dikoleksi. Hal tersebut dapat disebut shared phrase sebagai phrase cluster atau base claster, yang ditemukan dengan menggunakan suatu struktur data yang dinamakan suffix tree. Dalam langkah kedua, kita mengkombinasikan base cluster-base antar dua base cluster ke dalam suatu cluster. Penggabungan antar dua base cluster didasarkan pada jumlah dokumen yang melakukan overlap diantara kedua base cluster tersebut. Suatu phrase yang dimaksud dalam konteks algoritma ini adalah urutan satu atau lebih kata. Suffix tree clustering memiliki empat langkah utama sumber (Agus Zainal 2008, 2 ).yaitu : 1. Pembersihan dokumen 2. Steaming data 3. Indentifikasi base cluster 4. Kombinasi base cluster Bebrapa karakteristik yang membuat suffix tree clustering cocok digunakan untuk pengelompokkan dokumen. Pertama adalah mangenerate clustercluster untuk pengelompokkan dokumen berdasarkan phrase. Phrase juga bermanfaat untuk membangun uraian dan keakuratan deskripsi dari cluster-cluster. Kedua, tidak tergantung pada model data. Hal itu mengasumsikan hanya dokumendokumen dengan topik yang sama yang akan memiliki shared phrase. Ketiga, STC memperolehkan adanya overlaping cluster. Hal itu sangat penting untuk menghindari pembatasan
Implementasi Suffix Tree Clustering Untuk Pengelompokan Dokumen Yang Telah Di Akses Melalui Mesin Pencarian Google. Oleh : Heru Sutadi
50
Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016
bahwa setiap dokumen hanya memiliki satu cluster saja, karena setiap kita jumpai satu dokumen mempunyai lebih dari satu topik dan dengan begitu terdapat kemiripan yang lebih dari satu kelompok dokumen. Keempat, STC menggunakan defenisi cluster yang sederhana. Semua dokumen yang berisi salah satu phrase cluster akan menjadi anggota dari cluster tersebut. (Agus Zainal Arifin, 2008, 2). 2.4 Alat Bantu Perancangan Sistem Berdasarkan tahapan di atas, maka dalam membuat alur juga dibutuhkan alat bantu untuk dapat melakukan proses pemodelan dari sebuah sistem. Alat bantu tersebut adalah bagan alir (flowchart), DFD (Data Flow Diagram), dan UML. Dalam hal ini penulis hanya akan membahas alat bantu yang digunakan untuk membuat sebuah alur pengelompokkan dokumen jejaring sosial yang diakses melalui google yaitu bagan alir (flowchart) dan juga UML (Unified Modelling Language). 2.5 Data Data merupakan fakta mentah tentang orang, tempat, kejadian dan apapun yang penting bagi perusahaan, dimana data itu sendiri tidak memiliki arti. Data adalah sebuah sumber yang harus dikontrol, dikelola dan data juga adalah fakta-fakta atau observasi yang mentah, biasanya mengenai kejadian atau transaksi bisnis. Pengertian data lainnya adalah rekaman data, konsep atau instruksi pada sebuah media penyimpanan untuk komunikasi dan pemrosesan secara otomatis yang dapat memberikan informasi yang mudah dimengerti oleh pemiliknya atau pihak yang bersangkutan. Dari hal di atas, dapat diambil kesimpulan bahwa data adalah fakta-fakta mentah yang harus dikelola untuk menghasilkan suatu informasi yang dimiliki arti bagi suatu organisasi atau perusahaan. 2.5.1 Basis Data Basis data adalah kumpulan data yang saling berhubungan yang disimpan/ diorganisasi secara bersama dalam bentuk sedemikian rupa dan tanpa redudansi (perulangan) yang tidak perlu supaya dapat dimanfaatkan kembali dengan cepat dan mudah untuk memenuhi berbagai kebutuhan (Ema Utami dan Anggi Dwi Hartanto, 2012 : 3). Sistem basis data dapat terbagi dalam beberapa komponen penting, yakni : 1. Data 2. Hardware 3. Sistem operasi 4. Basis data 5. Database Management System (DBMS) 6. User 7. Aplikasi lain Database planning merupakan manajemen untuk merealisasikan tahapan database aplication lifecycle secara efektif dan efisien. Perencanaan
ISSN 2502-6968 (Media Cetak)
basis data mencakup cara pengumpulan data, format data, dokumentasi yang diperlakukan, cara membuat membuat desain dan implementasi. Perencanaan basis data terintegrasi dengan keseluruhan strategi sistem informasi organisasi (Indrajani, 2015 : 70). Terdapat tiga hal yang berkaitan dengan strategi sistem informasi, yaitu : 1. Identifikasi rencana dan sasaran dari organisasi termasuk mengenai sistem informasi yang dibutuhkan. 2. Evaluasi sistem organisai yang ada untuk menetapkan kelebihan dan kekurangan yang memiliki oleh sistem tersebut. 3. Penaksiran kesempatan teknik informatika yang mungkin memberikan keuntungan kompetitif Desain basis data adalah proses membuat desain yang akan mendukung operation dan tujuan perusahaan. Tujuan desain basis data (Indrajani, 2012 : 73) adalah sebagai berikut : 1. Menggambarkan relasi data antara data yang dibutuhkan oleh aplikasi dan user view 2. Menyediakan model data yang mendukung seluruh transaksi yang diperlukan 3. Menspesifikasikan desain dengan struktur yang sesuai dengan kebutuhan sistem Ada beberapa pendekatan yang dapat digunakan dalam mendesain basis data (Indrajani, 2012 : 73), yaitu : 1. Top-down Diawali dengan membuat data model. Pendekatan top-down dapat diilustrasikan menggunakan entity-relationship (ER) model yang high level, lalu mengidentifikasikan entity dan relationship antar-entity organisasi. Pendekatan ini sesuai bagi basis data yang kompleks. 2. Bottom-up Dimulai dari level dasar attribute (properti entity dan relationship), menganalisa hubungan antar-attibute, mengelompokkannya dalam suatu relasi yang menggambarkan tipe entity dan relasi antara entity. Pendekatan ini sesuai bagi basis data dengan jumlah attribute yang sedikit. 3. Inside-out Mirip seperti pendekatan bottom-up, perbedaannya adalah pada tahap awal mengidentifikasi major entity lalu menguraikannya menjadi entity relasi-relasi dan attribute-attribute yang berhubungan dengan yang sedikit 4. Mixed Menggunakan pendekatan bottom-up dan topdown. 3. Analisa dan Perancangan 3.1 Analisa Sistem Analisa sistem didefinisikan sebagai penguraian dari sistem utama ke dalam sub-sub sitem dengan tujuan untuk mengidentifikasi
Implementasi Suffix Tree Clustering Untuk Pengelompokan Dokumen Yang Telah Di Akses Melalui Mesin Pencarian Google. Oleh : Heru Sutadi
51
Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016
permasalahan-permasalahan yang ada dan kebutuhan-kebutuhan yang diperlukan agar dapat diusulkan dan diciptakan sistem baru yang lebih baik. Analisa terhadap sistem lama yang sedang berjalan perlu dilakukan sebagai dasar perancangan sistem baru, agar dapat dibuat sistem yang lebih efektif dan efesien.Analisa sistem yang dibangun bertujuan mengimplementasikan metode Suffix Tree Clustering pada pengelompokkan dokumen hasil pencarian Google. 3.1.1 Prosedur Pengelompokkan Dokumen Yang Telah Diakses Melalui Google Cara utama untuk melakukan pencarian terhadap suatu dokumen atau kata kunci dalam mesin pencari Google adalah sebagai berikut : 1. Pengguna memasukkan kata kunci pencarian ke dalam antarmuka sistem 2. Sistem kemudian akan meneruskan pencarian berdasarkan kata kunci tersebut. Sebelum pencarian dilakukan, aturan khusus untuk pencarian berdasarkan sistem yang dipilih akan diterapkan tterhadap kata kunci tersebut. 3. Hasil pencarian yang didapat kemudian dikembalikan kepada pengguna. Data-data ini akan diolah berdasarkan algoritma STC. Pengolahan data hasil pencarian dilakukan dengan melalui beberapa langkah. Keluaran dari algoritma ini adalah dari hasil pencarian dan topik utama yang terdapat dalam hasil pencarian tersebut. Topik ini diekstrak dari dokumen hasil pencarian. 3.1.2 Penerapan Metode Suffix Tree Clustering Proses pengelompokkan dokumen yang telah di akses melalui mesin pencarian google yang akan diujikan menggunakan Suffix Tree Clustering. Contoh kasus yang akan dijelaskan merupakan pengelompokkan berdasarkan Suffix Tree Clustering, langkah-langkah pengelompokkan adalah sebagai berikut : 1. Document Cleaning Document cleaning adalah tahap awal dalam algoritma Suffix Tree Clustering. Pada tahap ini, dokumen yang telah didapat dari proses download akan dibersihkan dan dipersiapkan untuk tahap selanjutnya. Proses untuk mempersiapkan dokumen meliputi proses pembersihan dokumen dari tag-tag HTML, proses analisa leksikal teks, proses penghapusan stopword dan proses stemming. 2. Stemming Dalam morfologi kata Bahasa Inggris dikenal adanya tiga imbuhan yaitu awalan (prefiks), sisipan dan akhiran (sufiks). Untuk penanganan dokumen yang mengandung kata jadian pada tugas akhir ini hanya akan menghilangkan awalan dan akhiran. Metode ini didahului dengan pembacaan tiap kata dari kata sampel
ISSN 2502-6968 (Media Cetak)
dokumen teks sehingga input algoritma ini adalah sebuah kata yang kemudian dilakukan : a. Pengecekan kata pada kamus irregular verb yang sudah disiapkan. Apakah kata tersebut berjenis irregular verb. Bila kata tersebut berjenis irregular verb maka dikembalikan dalam bentuk kata dasarnya (infinitive). Bila tidak maka dilanjutkan pada proses selanjutnya. b. Mengambil kata terakhir dari pasangan kata (kata majemuk), karena yang memiliki arti yang utama adalah pada kata terakhir. Sebagai contoh kata ”half-life”, maka yang diambil adalah kata ”life”. c. Kata yang sifatnya plural diubah menjadi singular, sebagai contoh : classes menjadi class, studies menjadi study, cats menjadi cat d. Menghilangkan akhiran –ed dan –ing pada kata yang memiliki akhiran tersebut. e. Mengubah kata-kata dengan akhiran seperti (tional, izer, ization, ation, ator, alism, fulness, ousness, ical, dll) ke bentuk dasarnya. f. Menghilangkan akhiran seperti (fullness, ence, er, ic, able, ible, ment, ent, ion, ism, lain-lain). 3. Identifikasi Base Cluster Tahap dari algoritma STC adalah tahap pembentukan cluster dasar. Pembentukan cluster dasar dilakukan dengan cara menemukan kesamaan frasa-frasa yang ditemukan dalam dokumendokumen yang diteliti menggunakan strukur data suffix tree. Dengan cara ini maka setiap dokumen dapat dipresentasikan menjadi suatu kalimat. 3.2 Perancangan Tujuan dari perancangan adalah untuk memberikan gambaran kepada user dan memberikan gambaran perancangan sebagai penuntun bagi programmer dalam membangun aplikasi. Perancangan ini meliputi perancangan use case diagram, activity diagram dan perancangan antar muka aplikasi. 3.2.1 Use Case Diagram Use case merupakan fungsionalitas dari suatu sistem, sehingga user atau pengguna aplikasi dapat mengerti mengenai aplikasi yang akan dibangun. 3.2.2 Activity Diagram Activity diagram merupakan salah satu cara memodelkan event-event yang terjadi dalam use case. Suatu diagram activitas pada dasarnya bertindak seperti diagram alir (flowchart) biasa kecuali diagram aktivitas memungkinkan terjadinya kendali kongruen sebagai tambahan pada kendali seksuensial biasa.
Implementasi Suffix Tree Clustering Untuk Pengelompokan Dokumen Yang Telah Di Akses Melalui Mesin Pencarian Google. Oleh : Heru Sutadi
52
Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016
ISSN 2502-6968 (Media Cetak)
Activity diagram berfungsi untuk memvisualisasikan, menspesifikasikan, mengkonstruksi serta mendokumentasikan sifat dari sekumpulan objek, selain itu juga dapat digunakan memodelkan aliran kendali dari suatu operasi
Tahap implementasi sistem merupakan tahap untuk mengaplikasikan apa yang telah dirancang pada tahap perancangan sistem berdasarkan hasil analisa sistem. Implementasi sistem ini dilakukan sebagai wujud nyata hasil analisan dan perancangan sistem ke dalam bahasa pemograman untuk diterapkan pada keadaan yang sesungguhnya. Hasil dari penerapan tersebut diharapkan dapat menjadi sebuah sistem yang siap di uji dan digunakan.
3.3 Perancangan Antar Muka Perancangan tampilan perangkat lunak bertujuan untuk memberikan gambaran-gambaran tentang perangkat lunak yang akan dibangun, sehingga akan mempermudah dalam mengimplementasikan perangkat lunak dan juga akan mempermudah pembuatan perangkat lunak yang user friendly. 4. Algoritma dan Imlementasi 4.1 Algoritma Algoritma adalah suatu cara yang digunakan untuk memperoleh /menerangkan suatu keadaan tertentu sehingga bisa lebih mudah dimengerti dan dalam skiripsi ini juga penulis membuat algoritma untuk menjelaskan kepada pembaca bagaimana sistem yang dibangun dapat berjalan. 1. Algoritma dari prosedur document cleaning Deklarasi Kumpulan stopword : array [1..100] of string {berisi dari kumpulan daftar stop word terdefenisi dengan jumlah anggota 100} Deskripsi : Input Kata string ← string Output Key word Proses If kata != kumpulan_stopWord then Return kata Endif 2. Algoritma dari prosedur stemming Deklarasi Langkah 1-5 dalam proses stemming menggunakan algoritma porter stemming terdefenisi Deklarasi : Input kata string ← string output hasil dari penghapusan stop word Proses If length (kata) <= 2 then {length digunakan untuk mengetahui jumlah huruf dari kata} Return kata Endif If kata mengandung tanda baca then Hapus tanda baca dari kata Return kata Endif
5. Kesimpulan dan Saran 5.1 Kesimpulan Berikut ini adalah kesimpulan yang dapat diambil dari hasil pengujian terhadap perangkat lunak implementasi algoritma Suffix Tree Clustering : 1. Pengelompokan tree clustering terdiri dari beberapa prosedur diantara nya, Documen cleaning, steming data, identifikasi base cluster, dan pengkombinasian base cluster 2. Untuk menerapka metode STC ada beberapa langkah di antara nya dengan pencarian shared phrase untuk semua berita yang dikoleksi,dan mengkobinasikan dua base cluster kedalam satu cluster 3. Bahasa pemrograman yang di bangun dalam pengelompokan metode STC yaitu visual basic 2008. 5.2 Saran Berikut merupakan saran yang dapat digunakan dalam pengembangan perangkat lunak implementasi algoritma Suffix Tree Clustering : 1. Dengan menggunakan algoritma suffing tree clustering yang dapat menangani irreguler verb, cluster yang dihasilkan akan lebih baik 2. Dapat menangani lebih dari satu bahasa untuk pengelompokkan hasil pencarian 3. Kalau ada kelemahan sistem yang di bangun, sarankan memperbaiki sistem/aplikasi yang ada. Daftar Pustaka 1. Adi Nugroho (2010). “Rekayasa Perangkat Lunak Beriontasi Objek Dengan Metode USDP”. Jakarta, ANDI . 2. Agus Widodo (2003). “Rancang Bangun Pencarian Dokumen Berbasis Web Menggunakan Metode Suffix Cactus Clustering”. 3. Agus Zainal Arifin (2008). “Klasifikasi Online Dokumen Berita Dengan Menggunakan Algoritma Suffix Tree Clustering”. 4. Ahmad Josi (2014). “Penerapan Teknik Web Scraping Pada Mesin Pencari Artikel Ilmiah”. 5. C. Widyo Hermawan (2009). “Visual Basic 2008”. Yogyakarta, ANDI.
4.2 Implementasi Sistem
Implementasi Suffix Tree Clustering Untuk Pengelompokan Dokumen Yang Telah Di Akses Melalui Mesin Pencarian Google. Oleh : Heru Sutadi
53
Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016
ISSN 2502-6968 (Media Cetak)
Dea Aggraeni Utomo (2013). “Motif Pengguna Jejaring Sosial Google Di Indonesia”. 7. Efri Darwis (2012). “Implementasi Basis Data Terdistribusi Menggunakan MySQL Pada PT Thamrin Brothers Palembang. 8. Ema Utami dan Anggit Dwi Hartanto (2012). “Sistem Basis Data Menggunakan SQL Server 2005”. Yogyakarta, ANDI. 9. Indrajani (2015). “Database Design”. Jakarta, PT. Elex Media Komputindo. 10. Lastri Nadeak (2014). “Implementasi Metode Simpleks Untuk Maksimasi Pendistribusian Baran Kiriman”. 11. Yuni Sugiarti (2013). “Analisis dan Perancangan Unified Modelling Laguage (UML) Generate VB.6”. yogyakrta, Graha Ilmu 6.
Implementasi Suffix Tree Clustering Untuk Pengelompokan Dokumen Yang Telah Di Akses Melalui Mesin Pencarian Google. Oleh : Heru Sutadi
54