IMPLEMENTASI AGGLOMERATIVE HIERARCHICAL CLUSTERING PADA SISTEM PROMOSI KATALOG BUKU BARU UNTUK MEMBER BERPOTENSI BERDASARKAN JUDUL BUKU TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Disusun oleh : Yuni Fitriyah 07560280
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2013
LEMBAR PERSETUJUAN
IMPLEMENTASI AGGLOMERATIVE HIERARCHICAL CLUSTERING PADA SISTEM PROMOSI KATALOG BUKU BARU UNTUK MEMBER BERPOTENSI BERDASARKAN JUDUL BUKU
TUGAS AKHIR
Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Menyetujui,
Pembimbing I
Pembimbing II
Mahmud Effendi, S.T., M.Eng.
Ali Sofyan Kholimi, S.Kom.
NIDN. 0715067402
NIDN. 0701038202
LEMBAR PENGESAHAN
IMPLEMENTASI AGGLOMERATIVE HIERARCHICAL CLUSTERING PADA SISTEM PROMOSI KATALOG BUKU BARU UNTUK MEMBER BERPOTENSI BERDASARKAN JUDUL BUKU TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Disusun oleh : Yuni Fitriyah 07560280 Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji Pada : 03 Agustus 2013 Menyetujui, Penguji I
Penguji II
Nur Hayatin, S. ST. NIP. 108.0907.0476
Sofyan Arifianto, S. Si., M. Kom.
Mengetahui, Ketua Jurusan Informatika
Eko Budi Cahyono, S.Kom., M.T. NIDN. 0717027001
LEMBAR PERNYATAAN Yang bertanda tangan dibawah ini : NAMA
: YUNI FITRIYAH
NIM
: 07560280
FAK./JUR.
: TEKNIK/INFORMATIKA
Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul “Implementasi Agglomerative Hierarchical Clustering pada Sistem Promosi Katalog Buku Baru untuk Member Berpotensi Berdasarkan Judul” beserta seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis orang lain, baik sebagian maupun seluruhnya, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya. Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini maka saya siap menanggung segala bentuk resiko/sanksi yang berlaku.
Malang, 14 Juli 2013 Yang Membuat Pernyataan
Yuni Fitriyah
Menyetujui, Pembimbing I
Pembimbing II
Mahmud Effendi, S.T., M.Eng.
Ali Sofyan Kholimi, S.Kom.
NIDN. 0715067402
NIDN. 0701038202
LEMBAR PERSEMBAHAN Syukur Alhamdulillah atas kehadirat Allah SWT dengan limpahan hidayah dan rahmad-Nya, shalawat serta salam senantiasa tercurahkan kepada junjungan Nabi besar Rasullullah Muhammad SAW sang revolusioner. Tiada kata selain puji syukur dan terima kasih karena penulis dapat menyelesaikan Tugas Akhir ini. Oleh karena itu, dengan rendah hati penulis menyampaikan ucapan terima kasih yang sebesar-besarnya kepada: 1.
Kedua orang tua tercinta Bapak Supeno Hanfi dan Ibu Sri Sulikhah, serta adik tercinta Faridah Hanum. yang senantiasa tanpa lelah mendo’akan dan memberi dukungan, semoga berkah dan rahmad-Nya selalu menyertai beliau setiap waktu;
2.
Bapak Mahmud Effendi, S.T., M.Eng. dan Bapak Ali Sofyan Kholimi, S.Kom., selaku dosen pembimbing dalam tugas akhir. yang selalu membimbing dengan kesabaran dan mengarahkan pemahaman;
3.
Bapak Eko Budi Cahyono, S.Kom., M.T. selaku Ketua Jurusan Teknik Informatika, Fakultas Teknik, Universitas Muhammadiyah Malang;
4.
Bapak/Ibu Dosen Fakultas Teknik, Universitas Muhammadiyah Malang yang senantiasa menjadi pendidik tanpa tanda jasa;
5.
Immawan dan Immawati IMM (Ikatan Mahasiswa Muhammadiyah) “Aufklärung” Teknik, Universitas Muhammadiyah Malang, KakandaKakanda, Ayunda-Ayunda, serta Adinda-Adinda saudara se-ikatan yang selalu mendukung, membersamai perjuangan, dan penyemangat atas setiap harapan;
6.
Saudara-saudara sepergerakan SMART (Solidaritas Mahasiswa untuk Rakyat Tertindas) atas kebersamaannya dan motivasi perubahan selama ini;
7.
Teman-Teman Mahasiswa Teknik Informatika angkatan 2007;
8.
Dan seluruh pihak yang tidak bisa disebutkan satu persatu, yang telah banyak membantu selama ini.
Semoga segala bantuan, motivasi, dan do’a yang diberikan kepada penulis diridhoi dan mendapat imbalan yang berlipat ganda dari Allah SWT, Amiin ya Rabbal’alamin.
KATA PENGANTAR
Alhamdulillahirrobbil’alamin, segala puji bagi Allah SWT Tuhan semesta alam yang telah memberi hidayah dan rahmat-Nya sehingga penulis dapat menyelesaikan
penelitian
tugas
akhir
dengan
judul
“Implementasi
Agglomerative Hierarchical Clustering pada Sistem Promosi Katalog Buku Baru untuk Member Berpotensi Berdasarkan Judul”. Pada penelitian tugas akhir ini, dirancang sebuah sistem perangkat lunak yang bertujuan sebagai media untuk memberikan kemudahan bagi user (Administrator) dalam melakukan promosi katalog buku baru di perpustakaan. Sehingga dengan adanya perancangan perangkat lunak (sistem aplikasi promosi katalog) ini, user (Administrator) dapat mengoptimalisasi promosi katalog buku baru untuk setiap member yang berpotensi. Penulis menyadari bahwa penelitian ini masih jauh dari kesempurnaan. Oleh karena itu, penulis mengharapkan saran, kritik, dan auto-kritik yang membangun untuk pengembangan aplikasi/perangkat lunak yang jauh lebih innovatif ke depannya. Perangkat lunak ini juga masih membutuhkan pengembangan lebih lanjut sehingga dapat bermanfaat. Akhir kata penulis mengucapkan terima kasih kepada semua pihak yang telah membantu hingga tugas akhir ini terselesaikan.
Malang, Juli 2013
Penulis
DAFTAR ISI
HALAMAN JUDUL .............................................................................................. i LEMBAR PERSETUJUAN ................................................................................. ii LEMBAR PENGESAHAN ................................................................................. iii LEMBAR PERNYATAAN ................................................................................. iv LEMBAR PERSEMBAHAN ................................................................................v KATA PENGANTAR ......................................................................................... vii ABSTRAKSI ...................................................................................................... viii ABSTRACT .......................................................................................................... ix DAFTAR ISI...........................................................................................................x DAFTAR GAMBAR .......................................................................................... xiii DAFTAR TABEL ............................................................................................. xvii DAFTAR GRAFIK ......................................................................................... xviii BAB I PENDAHULUAN .......................................................................................1 1.1
Latar Belakang ..........................................................................................1
1.2
Rumusan Masalah .....................................................................................4
1.3
Batasan Masalah ........................................................................................4
1.4
Tujuan Penelitian.......................................................................................5
1.5
Sistematika Penulisan ................................................................................5
BAB II LANDASAN TEORI ................................................................................7 2.1
Data Mining...............................................................................................7
2.1.1 2.2
Definisi Data Mining .........................................................................7
Clustering ..................................................................................................7
2.2.1
Metode Clustering ............................................................................10
2.2.2
Faktor Pengukur ...............................................................................12
2.2.3
Cluster Validation ............................................................................13
2.2.4
Cluster Analysis ...............................................................................14
2.3
Agglomerative Hierarchical Clustering ..................................................15
2.3.1 2.4
Metode Agglomerative Hierarchical Clustering .............................17
Text Mining .............................................................................................20
2.4.1
Case Folding ....................................................................................21
2.4.2
Tokenizing/Parsing ..........................................................................21
2.4.3
Filtering ...........................................................................................22
2.4.4
Steaming ...........................................................................................23
2.4.5
Analyzing..........................................................................................28
2.5
Perpustakaan............................................................................................28
2.5.1
Promosi Perpustakaan ......................................................................29
BAB III ANALISA DAN PERANCANGAN SISTEM.....................................31 3.1
Analisa .....................................................................................................31
3.1.1
Analisa Masalah ...............................................................................31
3.1.2
Analisa Sistem..................................................................................32
3.2
Perancangan Sistem.................................................................................33
3.2.1
Desain Flowchart Aplikasi dan Algoritma ......................................33 3.2.1.1 Desain Flowchart Aplikasi Sistem Clustering Member .........33 3.2.1.2 Desain Flowchart Algoritma Agglomerative Hierarchical Clustering ................................................................................35
3.2.2
Pre-processing ..................................................................................36 3.2.2.1 Tahap Case Folding ................................................................37 3.2.2.2 Tahap Tokenizing.....................................................................38 3.2.2.3 Tahap Filtering ........................................................................38 3.2.2.4 Tahap Steaming .......................................................................39 3.2.2.5 Tahap Analyzing ......................................................................39 3.2.2.6 Tahap Clustering .....................................................................41
3.3
UML (Unified Modeling Language) Diagram........................................42
3.3.1
Use Case Diagram ...........................................................................42
3.3.2
Activity Diagram ..............................................................................47
3.3.3
Sequence Diagram Level .................................................................51
3.3.4
Class Diagram .................................................................................53
3.4
ERD (Entity Relationship Diagram) .......................................................53
3.5
Desain Tabel ............................................................................................54
3.6
Desain Interface .....................................................................................55
3.6.1
Desain Interface “Login” .................................................................55
3.6.2
Desain Interface “Menu Utama”......................................................56
3.6.3
Desain Interface “Hasil Clustering AHC” .......................................56
3.6.4
Desain Interface “Data Buku” .........................................................57
BAB IV IMPLEMENTASI DAN PENGUJIAN ...............................................58 4.1
Implementasi Perangkat Lunak ...............................................................58
4.2
Pegujian Perangkat Lunak .......................................................................66
4.2.1
Pengujian Fitur Perangkat Lunak .....................................................67
4.2.2
Pengujian Fungsi Steaming terhadap Kata.......................................68
4.2.3
Pengujian Klaster Data.....................................................................69
4.2.4
Pengujian Jumlah Data terhadap Waktu Klasterisasi ......................73
4.2.5
Pengujian Jumlah Klaster terhadap Waktu Klasterisasi ..................74
4.2.6
Pengujian Minimum Support terhadap Hasil Klaster .......................75
4.2.7
Pengujian Minimum Support terhadap Waktu Klasterisasi..............82
4.3
Analisa Member Potensial ......................................................................84
BAB V PENUTUP................................................................................................85 5.1
Kesimpulan..............................................................................................85
5.2
Saran Pengembangan ..............................................................................85
DAFTAR PUSTAKA ...........................................................................................87 LAMPIRAN-LAMPIRAN ..................................................................................89 A.
Daftar Stoplist .........................................................................................88
B.
Contoh Perhitungan Manual Studi Kasus ...............................................92
DAFTAR GAMBAR
Gambar 2.1 Klasterisasi Berdasarkan Similaritas (Kesamaan) Bentuk ..........9 Gambar 2.2 Klasterisasi Berdasarkan Similaritas (Kesamaan) Warna .........10 Gambar 2.3 Klasterisasi Berdasarkan Similaritas (Kedekatan) Jarak ..........10 Gambar 2.4 Dendogram Agglomerative Hierarchical Clustering dan Divisive Hierarchical Clustering ........................................................................................11 Gambar 2.5 Langkah-Langkah Analysis Cluster ..............................................15 Gambar 2.6 Dendogram Hierarchical Clustering .............................................16 Gambar 2.7 Matriks Jarak .................................................................................17 Gambar 2.8 Ilustrasi Single Linkage ..................................................................20 Gambar 2.9 Proses Case Folding pada Ekstraksi Dokumen ...........................21 Gambar 2.10 Proses Tokenizing pada Ekstraksi Dokumen .............................22 Gambar 2.11 Proses Tokenizing pada Ekstraksi Dokumen .............................22 Gambar 2.12 Proses Steaming pada Ekstraksi Dokumen ................................25 Gambar 3.1 Desain Flowchart SDLC (System Development Life Cycle) .........31 Gambar 3.2 Desain Flowchart Aplikasi Sistem Clustering Member ...............33 Gambar 3.3 Desain Flowchart Algoritma Agglomerative .................................35 Gambar 3.4 Desain Flowchart Konversi Data Teks ke Numerik ....................36 Gambar 3.5 Desain Flowchart Case Folding .....................................................37 Gambar 3.6 Contoh Proses Case Folding ..........................................................38 Gambar 3.7 Flowchart Klasterisasi AHC ..........................................................42 Gambar 3.8 Use Case Diagram Sistem...............................................................42 Gambar 3.9 Activity Diagram Login ...................................................................47 Gambar 3.10 Activity Diagram Insert Data ........................................................48 Gambar 3.11 Activity Diagram Update Data ......................................................49
Gambar 3.12 Activity Diagram Delete Data ........................................................49 Gambar 3.13 Activity Diagram Cluster AHC......................................................50 Gambar 3.14 Activity Diagram Lihat Hasil Cluster ...........................................51 Gambar 3.15 Sequence Diagram Level Login ....................................................51 Gambar 3.16 Sequence Diagram Level Insert Data ...........................................52 Gambar 3.17 Sequence Diagram Level Update Data .........................................52 Gambar 3.18 Sequence Diagram Level Delete Data ..........................................52 Gambar 3.19 Sequence Diagram Level Cluster AHC ........................................52 Gambar 3.20 Sequence Diagram Level Lihat Hasil Cluster..............................53 Gambar 3.21 Class Diagram Level ......................................................................53 Gambar 3.22 Entire Relationship Diagram.......................................................54 Gambar 3.23 Desain Interface Login .................................................................55 Gambar 3.24 Desain Interface Menu Utama ....................................................56 Gambar 3.25 Desain Interface Hasil Clustering AHC ......................................56 Gambar 3.26 Desain Interface Data Buku .........................................................57 Gambar 4.1 Interface Menu Awal ......................................................................59 Gambar 4.2 Interface Halaman Setelah Login ..................................................59 Gambar 4.3 Interface Halaman Upload Data ....................................................60 Gambar 4.4 Interface Halaman Pencarian File ................................................60 Gambar 4.5 Interface Halaman Upload (Simpan) File .....................................61 Gambar 4.6 Interface Kutipan Script Upload....................................................61 Gambar 4.7 Interface Form Konfirmasi (Data Belum Terinput)....................62 Gambar 4.8 Interface Interface Form Konfirmasi Data Terklaster................62 Gambar 4.9 Interface Interface Hasil Jumlah Klaster .....................................62 Gambar 4.10 Interface Konfirmasi Dokumen Kosong .....................................63 Gambar 4.11 Interface Halaman Dokumen Terklaster....................................63
Gambar 4.12 Interface Halaman Form Klaster Ulang .....................................64 Gambar 4.13 Kutipan Script Pengklasteran ......................................................65 Gambar 4.14 Interface Halaman Form Hapus Klaster ....................................65 Gambar 4.15 Interface Halaman Form Lihat Data ..........................................66 Gambar 4.16 Hasil Fungsi Steaming terhadap Kata ........................................69 Gambar 4.17 Hasil Cluster Data ........................................................................70 Gambar 4.18 Hasil Cluster Data (id_hasil 1) .....................................................71 Gambar 4.19 Hasil Cluster Data (id_hasil 2) .....................................................72 Gambar 4.20 Daftar Kata pada Minimum Support ..........................................72 Gambar 4.21 Kutipan Script Perhitungan Minimum Support .........................73 Gambar 4.22 Hasil Klaster dengan Minimum Support = 2 ..............................76 Gambar 4.23 Daftar Kata Minimum Support = 2..............................................76 Gambar 4.24 Hasil Klaster pada Klaster Ke - 1 (Minimum Support = 2) .......77 Gambar 4.25 Hasil Klaster pada Klaster Ke - 2 (Minimum Support = 2) .......77 Gambar 4.26 Hasil Klaster pada Klaster Ke - 3 (Minimum Support = 2) .......77 Gambar 4.27 Hasil Klaster pada Klaster Ke - 4 (Minimum Support = 2) .......77 Gambar 4.28 Hasil Klaster pada Klaster Ke - 5 (Minimum Support = 2) .......77 Gambar 4.29 Hasil Klaster dengan Minimum Support = 5 ..............................78 Gambar 4.30 Daftar Kata Minimum Support = 5..............................................78 Gambar 4.31 Hasil Klaster pada Klaster Ke - 1 (Minimum Support = 5) .......79 Gambar 4.32 Hasil Klaster pada Klaster Ke - 2 (Minimum Support = 5) .......79 Gambar 4.33 Hasil Klaster pada Klaster Ke - 3 (Minimum Support = 5) .......79 Gambar 4.34 Hasil Klaster pada Klaster Ke - 4 (Minimum Support = 5) .......79 Gambar 4.35 Hasil Klaster pada Klaster Ke - 5 (Minimum Support = 5) .......79 Gambar 4.36 Hasil Klaster dengan Minimum Support = 7 ..............................80 Gambar 4.37 Daftar Kata Minimum Support = 7..............................................80
Gambar 4.38 Hasil Klaster pada Klaster Ke - 1 (Minimum Support = 7) .......80 Gambar 4.39 Hasil Klaster pada Klaster Ke - 2 (Minimum Support = 7) .......81 Gambar 4.40 Hasil Klaster pada Klaster Ke - 3 (Minimum Support = 7) .......81 Gambar 4.41 Hasil Klaster pada Klaster Ke - 4 (Minimum Support = 7) .......81 Gambar 4.42 Hasil Klaster pada Klaster Ke - 5 (Minimum Support = 7) .......81
DAFTAR TABEL
Tabel 2.1 Perbedaan Klasterisasi dan Klasifikasi ...............................................8 Tabel 2.2 Contoh Awalan Akhiran Yang Tidak Diijinkan .............................27 Tabel 3.1 Contoh Hasil Tahapan Tokenizing ....................................................38 Tabel 3.2 Contoh Hasil Tahapan Filtering ........................................................39 Tabel 3.3 Contoh Hasil Perhitungan Support ....................................................40 Tabel 3.4 Contoh Hasil Perhitungan Support (dengan nilai support >= 50%) ................................................................................................................................40 Tabel 3.5 Contoh Hasil Perhitungan Kata Kunci yang Sering Muncul Pada Dokumen ...............................................................................................................41 Tabel 3.6 Skenario Login ....................................................................................43 Tabel 3.7 Skenario Cluster AHC ........................................................................44 Tabel 3.8 Skenario Insert Data ...........................................................................45 Tabel 3.9 Skenario Update Data ..........................................................................45 Tabel 3.10 Skenario Delete Data .........................................................................46 Tabel 3.11 Skenario Lihat Hasil Cluster ............................................................47 Tabel 3.12 Tabel data_buku................................................................................54 Tabel 3.13 Tabel numerik ...................................................................................54 Tabel 3.14 Tabel temp_buku ..............................................................................55 Tabel 4.1 Pengujian Fitur Perangkat Lunak ....................................................67 Tabel 4.2 Kutipan Dokumen Contoh .................................................................71 Tabel 4.3 Hubungan Jumlah Data terhadap Waktu Klaster ..........................73 Tabel 4.4 Hubungan Jumlah Klaster terhadap Waktu Klaster ......................74 Tabel 4.5 Hubungan Jumlah Klaster terhadap Waktu Klaster ......................83
DAFTAR GRAFIK
Grafik 4.1 Pengaruh Jumlah Data Terhadap Waktu.......................................74 Grafik 4.2 Pengaruh Jumlah Klaster terhadap Waktu Klaster .....................75 Grafik 4.3 Pengaruh Jumlah Minimum Support terhadap Waktu Klaster ....83
DAFTAR PUSTAKA [1]. Astuti, Listya Tri. (Sistem Pendukung Keputusan Untuk Promosi Katalog Buku Baru dengan Menggunakan Algoritma Agglomerative Clustering) Sekolah Tinggi Ilmu Komputer Surabaya. (Jurnal Penelitian. Didownload pada Tanggal 26 Januari 2012 : 12.10 PM) [2]. Budhi, Gregorius S. (Hierarchical Clustering Untuk Aplikasi Automated Text Integration) Universitas Kristen Petra Jurusan Teknik Informatika. (Jurnal Penelitian, Didownload pada Tanggal 26 Januari 2012 : 12.10 PM) [3]. Gita, Yoga Bhagawad & Ahmad Saikhu.(Implementasi Deteksi Outlier pada Algoritma Hierarchical Cluetring) Institut Teknologi Surabaya (ITS) (Jurnal Penelitian. Didownload pada Tanggal 26 Maret 2012 : 11.37 AM) [4]. Handayani, Susi. 2012. (Mesin Pencari Dokumen Bahasa Indonesia Menggunakan latent semantic Indexing dengan Pembobotan Global) Institute Pertanian Bogor, Fakultas Matematika dan Ilmu Pengetahuan Alam, Departemen Ilmu Komputer. Bogor (Jurnal Penelitian, Didownload pada Tanggal 10 April 2013 : 02.49 PM) [5]. Han, Jiawei & Micheline Kamber. 2007. Data Mining, Concept and Techniques. San Francisco : mogan Kaufman Publishers. [6]. Hartini, Entin. “Metode Clustering Hirarki”. 2 Pebruari 2005 [7]. Helmy, Hasniawati. 2007. (Image Clustering Berdasarkan Warna Untuk Identifikasi Buah Dengan Metode Valley Tracing), Tugas Akhir Jurusan Teknologi Informasi Politeknik Elektronika Negeri Surabaya. Surabaya. [8]. Rohanda. 2000. Fungsi dan Peranan Perpustakaan Sekolah. (Makalah disampaikan dalama rangka seminar sehari Ikatan Pustakawan Indonesia. Pustakawan dan Guru) [9]. Sucahyo, Yudho Giri. 2003. Data Mining : Menggali Informasi yang Terpendam. Jakarta : IlmuKomputer.com. [10]. Tan, Pang-Ning. & Steinbech, M. 2006. INTRODUCTION TO DATA MINING (edisi pertama, cetakan ke-2). Boston : Pearson Education.
[11]. Wijayati, Luki. 2004. Perpustakaan Perguruan Tinggi : Buku Pedoman Edisi Ketiga. Jakarta : Departemen Pendidikan Nasional RI Direktorat Jendral Pendidikan Tinggi.