ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)
ANALYSIS RELATIONSHIP TRANSACTION DATA OF BOOKSELLING USING APRIORI ALGORITHM AND CENTROID LINKAGE HIERARCHICAL METHOD (CLHM) ALGORITHM
Nurani, Andani Achmad, Amil Ahmad Ilham
Program Studi Teknik Elektro, Konsentrasi Teknik Informatika, Fakultas Teknik, Universitas Hasanuddin Makassar
Alamat Korespondensi : Nurani Program Studi Teknik Elektro Konsentrasi Teknik Informatika Fakultas Teknik Universitas Hasanuddin Makassar HP: 081343646568 Email:
[email protected]
Abstrak Saat ini penempatan barang pada etalase barang di toko buku tidak sesuai dengan perilaku belanja konsumen disebabkan karena manajemen produk, dalam hal ini pengaturan penempatan letak produk yang tidak sesuai dengan perilaku belanja, sehingga perputaran barang tidak terjadi secara maksimal. Penelitian ini bertujuan untuk mencari keterkaitan atau hubungan antara item-item yang berbeda dalam suatu set data dengan menggunakan teknik data mining, dalam hal ini keterkaitan antara satu buku dengan buku lain pada sebuah toko buku, dimana tujuan akhir penelitian ini adalah sebagai sistem yang mampu memberikan informasi tentang solusi-solusi pendukung pengambilan keputusan dan kebijakan di dalam sebuah toko buku. Metode algoritma yang digunakan pada penelitian ini adalah algoritma Apriori yang berfungsi untuk mendapatkan pola-pola item yang saling berkaitan kemudian algoritma CLHM untuk klasterisasi data agar data yang digunakan tidak memiliki variasi data yang tinggi. Hasil dari penelitian ini adalah informasi berupa pola yang dihasilkan menggunakan algoritma kombinasi algoritma CLHM dan Apriori yaitu jika konsumen membeli buku pendidikan dasar dan pelajaran maka ia membeli buku teknologi dengan nilai confidence 0.75 itu artinya nilai confidence yang dihasilkan lebih besar dibandingkan nilai confidence yang ditetapkan yaitu sebesar ≥ 0.75. Dari hasil tersebut dapat disimpulkan bahwa kombinasi algoritma CLHM dan Apriori menghasilkan keterkaitan yang lebih tinggi. Kata kunci : Data Mining, CLHM, Apriori.
Abstract Current placement of goods on the goods in the storefront bookstore does not comply with consumer shopping behavior due to product management in terms of setting the location of product placement that does not comply with the spending behavior, so that the velocity of the goods does not occur to the fullest. This study aimed to explore the linkages or relationships between different items in a set of data by using data mining techniques, in this case the relationship between the book with another book in a bookstore, where the ultimate goal of this research is a system that is capable of providing information about solutions and policy decision support in a bookstore. Algorithm method used in this study is the Apriori algorithm that is used to obtain patterns related items then CLHM algorithm for clustering the data so that the data used do not have a high variation in the data. The results of this study is the information in the form of patterns produced using a combination of algorithm and Apriori algorithm CLHM ie if consumers buy books and basic educational lessons so he bought the book value of the technology with confidence 0.75 that means confidence value is greater than the specified value is equal confidence ≥ 0.75. From these results it can be concluded that the combination of CLHM and Apriori algorithm produces a higher relevance. Keywords: Data Mining, CLHM, Apriori.
PENDAHULUAN Pengolahan informasi data mining adalah Association rule mining yang digunakan untuk menemukan hubungan diantara data atau bagaimana suatu kelompok data mempengaruhi suatu keberadaan data yang lain (Kantardzic, 2003). Metode ini dapat membantu mengenali pola-pola tertentu di dalam kumpulan data yang besar. Aturan keterkaitan (association rules) adalah suatu prosedur untuk mencari hubungan antar item dalam suatu data set yang ditentukan (Han dan Kamber, 2001). Association rule mining dipergunakan untuk mencari kaidah asosiasi antara suatu kombinasin item. Mendeteksi kumpulan-kumpulan atribut yang muncul bersamaan (co-occur) dalam frekuensi yang sering, dan membentuk sejumlah kaidah dari kumpulan-kumpulan tersebut. Association Rules seringkali disebut dengan "Market Basket Analysis", yang digunakan untuk menemukan relasi atau korelasi diantara himpunan item-item. Market Basket Analysis adalah Analisis dari kebiasaan membeli customer dengan mencari asosiasi dan korelasi antara itemitem berbeda yang diletakkan customer dalam keranjang belanjaannya. Salah satu potensi penerapan association rules adalah pada pengaturan penempatan jenis-jenis buku pada rak di toko buku. Saat ini penempatan barang pada etalase barang di toko buku tidak sesuai dengan perilaku belanja konsumen. Hal inilah yang menjadi masalah yang sering dihadapi oleh perusahaan. Perusahaan mengalami masalah dalam manajemen produk serta kesulitan dalam hal pengaturan penempatan letak produk, sehingga perputaran barang tidak terjadi secara maksimal. Aturan keterkaitan (association rules) merupakan suatu prosedur untuk mencari hubungan antar item dalam suatu set data yang ditentukan (Han dan Kamber, 2001) dan (Jiawei dan Micheline, 2000). Dengan menggunakan teknik pengolahan informasi Data Mining yaitu Association rule mining (Ulmer, 2002) yang digunakan untuk menemukan hubungan antara data atau bagaimana suatu kelompok data yang mempengaruhi suatu keberadaaan data yang lain (Kantardzic, 2003) Metode ini dapat membantu mengenali polapola tertentu di dalam kumpulan data yang besar. Umumnya data yang digunakan untuk proses association rules atau aturan keterkaitan sangat besar dan terdapat variasi data yang sangat tinggi. Hal ini dapat mengurangi kualitas dari kaidah yang dihasilkan. Oleh karena itu, pada penelitian ini digunakan teknik clustering terlebih dahulu menggunakan algoritma clustering Centroid Linkage Hierarchical Method
(CLHM) (Usmaida, 2007), agar data yang digunakan untuk aturan asosiasi sudah terklaster dengan baik (Martiana, 2010) dan (Barakbah dan Arai, 2004). Sistem yang dibuat diharapkan menjadi sebuah solusi dari latar belakang permasalahan diatas. Sehingga berdasarkan latar belakang masalah yang dijelaskan, maka dapat dirumuskan tujuan penelitian ini adalah untuk mencari keterkaitan atau hubungan antara itemitem yang berbeda dalam suatu set data dengan menggunakan teknik data mining, dalam hal ini keterkaitan antara satu buku dengan buku lain pada sebuah toko buku, dimana tujuan akhir penelitian ini yaitu sebagai sistem yang mampu memberikan informasi tentang solusi-solusi pendukung pengambilan keputusan dan kebijakan di dalam sebuah toko buku.
BAHAN DAN METODE Lokasi dan Waktu Penelitian Penelitian ini dilaksanakan disalah satu toko buku gramedia yang ada di kota Makassar dan dilakukan selama 6 (Enam) bulan dimulai bulan Oktober 2013 sampai bulan Maret 2014. Sumber Data Data yang digunakan pada penelitian ini adalah real dataset yaitu data penjualan yang diambil secara langsung dari laporan harian penjualan toko buku gramedia. Rancangan Penelitian Secara umum penelitian yang dilakukan adalah merancang suatu aplikasi menggunakan teknologi data mining menggunakan algoritma Apriori untuk mendapatkan pengetahuan berupa pola asosiasi pembelian item oleh konsumen yang bisa digunakan sebagai strategi penjualan. Pada penelitian ini proses pencarian kaidah asosiasi menggunakan algoritma kombinasi antara CLHM dan Apriori. Proses dari pencarian keterkaitan item tersebut dapat dilihat pada gambar 1. Perangkat lunak yang digunakan pada penelitian ini terdiri dari MySQL. Selanjutnya terdapat Aplikasi Web dimana aplikasi web yang digunakan disini yaitu bahasa pemrograman PHP, Javascript, HTML, jquery dan CSS serta Macromedia Dreamweaver sebagai editor untuk membangun listing program.
Metode Analisis Data Metode analisis data yang di gunakan adalah algoritma CLHM dimulai dengan pemilihan secara acak K, dimana K disini merupakan banyaknya klaster yang ingin dibentuk. Kemudian tetapkan nilai-nilai K secara random, untuk sementara nilai tersebut menjadi pusat dari klaster atau biasa disebut dengan centroid, yang memiliki mean atau “means”. Hitung jarak setiap data yang ada terhadap masing-masing centroid menggunakan rumus Euclidian hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. Klasifikasikan setiap data berdasarkan kedekatannya dengan centroid. Lakukan langkah tersebut hingga nilai centroid tidak berubah (stabil) (Witten, et al., 2005). Hasil cluster dari algoritma CLHM ini selanjutnya dimasukkan kedalam algoritma Apriori dimana algoritma ini bekerja untuk melakukan pencarian frequent itemset dengan menggunakan teknik association rule. (Moertini, 2007) dan (Yova dan Fahrian,2008).
HASIL PENELITIAN Hasil dari penelitian yang menggunakan dataset transaksi pembelian dari sebuah toko buku dimana satu record paling sedikit memuat satu item pembelanjaan yaitu berupa polapola keterkaita item. Pada data transaksi penjualan terdapat beraneka ragam kategori item yang dibeli oleh konsumen. Dalam penelitian ini, diambil 15 kategori item sebagai bahan penelitian. Sehingga pada tahap penyeleksian data ini akan mengambil data transaksi yang mengandung kategori item yang sudah ditentukan dan transaksi yang tidak mengandung kategori item yang diteliti akan dibuang. Adapun 15 kategori item yang akan diteliti dapat dilihat pada tabel 1. Item-item dikonversikan ke dalam angka-angka yang menunjukkan kode item yang dibeli pelanggan. Berikutnya adalah melakukan proses pencarian kaidah asosiasi untuk dataset yang tidak diklaster dan data yang diklaster. Dataset tersebut diklaster dengan menggunakan algoritma CLHM dengan jumlah klaster 5 dan hasilnya dapat dilihat pada tabel 2. Pada tabel 3 menunjukkan hasil dari algoritma Apriori dengan nilai minimum support support 0.2 atau sama dengan 20 % dan confidence 0.75 atau sama dengan 75%. Dengan menggunakan kombinasi algoritma CLHM dan Apriori dihasilkan berupa pola-pola keterkaitan data serta nilai keterkaitannya. Pola-polanya yaitu jika konsumen membeli buku pendidikan dasar dan pelajaran maka ia membeli buku teknologi dengan nilai confidence 0.75, dan seterusnya seperti yang terlihat pada tabel 3.
PEMBAHASAN Penelitian ini menunjukkan bahwa nilai confidence dari data yang di-cluster, dengan menggunakan algoritma CLHM yang kemudian dicari keterkaitannya menggunakan algoritma Apriori menghasilkan confidence yang lebih besar dibandingkan dengan data yang tidak dicluster. Hal ini menunjukkan bahwa proses clustering akan menghasilkan kaidah-kaidah asosiasi dengan kualitas yang lebih baik. Sesuai dengan tujuan penelitian ini yaitu menghasilkan penggalian kaidah asosiasi multi obyektif yang baik, dengan menggunakan sampel yang dilakukan proses clustering terlebih dahulu akan menghasilkan kaidah-kaidah asosiasi yang lebih baik, hal ini ditunjukkan dengan nilai rata-rata yang diperoleh mempunyai nilai yang lebih besar dibandingkan data yang tidak melalui proses clustering terlebih dahulu. Kemudian dengan hasil yang diperoleh maka bisa dimanfaatkan menghasilkan pengetahuan tentang pola pembelian konsumen yang selama ini jarang diketahui, penulis berasumsi bahwa hasil tersebut dapat dimanfaatkan untuk membantu membuat strategi bisnis, diantaranya : Menyusun layout yang baik didasarkan pada pola pembelian item yang memiliki nilai confidence tinggi. Letak item Buku yang memiliki nilai confidence tinggi sehingga bisa diatur berdekatan agar memudahkan konsumen dalam membeli kedua item tersebut dan dapat meningkatkan penjualan keduanya. Selanjutnya hasil pola yang didapat juga bisa digunakan dalam membantu manajer sebuah took buku dalam menentukan keputusan persediaan barang. Sebagai contoh item Buku kesehatan dan Buku pendidikan memiliki keterkaitan. Dari data tersebut, maka manajer pemasaran setidaknya harus menjaga ketersediaan stok kedua item tersebut agar tetap sama. Serta memberikan paket diskon terhadap pola pembelian item yang memiliki nilai confidence tinggi namun memiliki nilai support yang kecil. Hal ini berguna untuk menarik minat konsumen yang sering membeli item-item yang terdapat pada pola tersebut agar lebih bertambah. Adapun asumsi dari penulis untuk memanfaatkan pola yang dihasilkan yaitu dengan merubah penataan item saat ini, yang diharapkan mampu meningkatkan nilai penjualan.
KESIMPULAN DAN SARAN Dengan menerapkan algoritma CLHM dan Apriori pada data transaksi penjualan di toko buku, dapat menghasilkan sebuah pengetahuan berupa keterkaitan data item-item yang sering dibeli secara bersamaan. Hasil dari pengolahan pada penelitian ini dengan nilai support sebesar 0.2 dan confidence sebesar 0.75, Hasil dari kombinasi algoritma Apriori dan CLHM terdapat beberapa pola yang memenuhi syarat yaitu jika konsumen membeli buku pendidikan dasar dan pelajaran maka ia membeli buku teknologi dengan nilai confidence 0.75. Jika konsumen membeli buku pendidikan dasar dan buku pelajaran maka ia membeli buku cerita dengan nilai confidence 0.75. Agar mendapatkan hasil yang lebih baik, saran yang dapat diberikan berkaitan dengan penelitian ini untuk pengembangan selanjutnya adalah menambah volume data yang digunakan untuk uji coba serta lebih memadatkan jenis kriteria item sehingga dapat menghasilkan pola yang lebih efisien. Menggunakan algoritma clustering lain seperti K-NN serta menggunakan teknik pengembangan aturan keterkaitan yang lain.
UCAPAN TERIMA KASIH Penulis menyadari bahwa penyusunan penelitian ini banyak mengalami hambatan, rintangan dan halangan, penulis juga menyadari bahwa masih banyak kekurangan pada penelitian ini, namun dengan bantuan dari berbagai pihak, penelitian ini dapat terselesaikan dengan baik, Oleh karena itu, pada kesempatan ini penulis ingin menyampaikan rasa terima kasih dan penghargaan yang setinggi-tingginya kepada Bapak Dr. Ir. Andani Achmad, MT dan Bapak Amil Ahmad Ilham, ST., M.Eng., Ph.D selaku pembimbing yang banyak meluangkan waktunya memberikan petunjuk dan bimbingan sehingga kesulitan penulis dalam membuat tesis ini dapat terselesaikan. Terima kasih juga yang sebesar-besarnya kepada Bapak dan Ibu Dosen yang telah memberikan banyak masukan dan bimbingannya selama penulis menempuh perkuliahan.
DAFTAR PUSTAKA Barakbah, A.R. dan Arai, K. (2004). Identifying Moving to make automatic clustering for normal data set, In. Proc. IECI Japan Workshop, Musashi Institute of Technology, Tokyo. Han, J. dan Kamber, M. (2001). Data Mining Concepts and Techniques. Morgan Kaufmann, California. Jiawei, H dan Micheline, K, (2000). Data Mining: Concepts and Techniques : Chapter 6. Mining Association Rules in Large Database, Simon Fraser University. Kantardzic, M. (2003). Data Mining Concepts Models, and Algorithms. New Jersey : IEEE. Moertini, V dan Marsela, Y. (2007). Analisis Keranjang Pasar Dengan Algoritma HashBased Pada Data Transaksi Penjualan Apotek. Jurusan Ilmu Komputer, Universitas Katolik Parahyangan, Bandung. Martiana, E, et al., (2010). Mesin Pencari Dokumen Dengan Pengklasteran Secara Otomatis. Telkomnika Vol. 8, No. 1, April 2010. Ulmer, David. (2002). Mining an Online Auctions Data Warehouse. The Mid-Atlantic Student Workshop on Programming Languages and Systems, Pace University. Usmaida, A. (2007). Web Mining Untuk Pencarian Berdasarkan Kata Kunci Dengan Teknik Clustering, Tugas Akhir Jurusan Teknologi Informasi Politeknik Elektronika Negeri Surabaya. Witten, et al., (2005). Data Mining Practical Machine Learning Tools and Techniques, Second Edition. Morgan Kaufmann, San Fransisco. Yova, R. dan Fahrian, M. (2008). Implementasi Algoritma-Algoritma Association Rules Sebagai Bagian Dari Pengembangan Data Mining Algorithms Collection. Konferensi Nasional dan Sistem Informatika.
Tabel 1. Kategori Item Kode item
Nama item
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Kesehatan Pendidikan Dasar Pelajaran Sains Teknologi Cerita Kejiwaan Agama Resep Fiksi Hidup_Sehat Pemerintahan Ensiklopedi Hiburan
15
Majalah
Tabel 2. Hasil Cluster Algoritma CLHM Transaksi
Item
1
{2,3,5,6}
3
{2,3,5,6,9}
11
{2,3,5}
13
{2,3,5,6}
17
{2,3,5,6}
22
{2,3,5,6}
23
{3,5,7,9}
27
{2.3}
28
{2,3,5,9}
30
{2,3,5,6}
Tabel 3. Nilai confidence item-item yang memenuhi syarat menggunakan algoritma Apriori Item-item
Nilai confidence
2,3->5
0.75
2,3->6
0.75
2,5->3
0.75
2,5->6
0.65
2,6->3
0.75
2,6->5
0.75
3,5->2
0.75
3,5->6
0.65
3,6->2
0.65
3,6->5
0.75
5,6->2
0.65
5,6->3
0.75
Keterangan Jika konsumen membeli item 2 (Pendidikan Dasar) dan item 3 (Pelajaran) maka ia membeli item 5 (Teknologi) Jika konsumen membeli item 2 (Pendidikan Dasar) dan item 3 (Pelajaran) maka ia membeli item 6 (Cerita) Jika konsumen membeli item 2 (Pendidikan Dasar) dan item 5 (Teknologi) maka ia membeli item 3 (Pelajaran) Jika konsumen membeli item 2 (Pendidikan Dasar) dan item 5 (Teknologi) maka ia membeli item 6 (Cerita) Jika konsumen membeli item 2 (Pendidikan Dasar) dan item 6 (Cerita) maka ia membeli item 3 (Pelajaran) Jika konsumen membeli item 2 (Pendidikan Dasar) dan item 6 (Cerita) maka ia membeli item 5 (Teknologi) Jika konsumen membeli item 3 (Pelajaran) dan item 5 (Teknologi) maka ia membeli item 2 (Pendidikan Dasar) Jika konsumen membeli item 3 (Pelajaran) dan item 5 (Teknologi) maka ia membeli item 6 (Cerita) Jika konsumen membeli item 3 (Pelajaran) dan item 6 (Cerita) maka ia membeli item 2 (Pendidikan Dasar) Jika konsumen membeli item 3 (Pelajaran) dan item 6 (Cerita) maka ia membeli item 5 (Teknologi) Jika konsumen membeli item 5 (Teknologi) dan item 6 (Cerita) maka ia membeli item 2 (Pendidikan Dasar) Jika konsumen membeli item 5 (Teknologi) dan item 6 (Cerita) maka ia membeli item 3 (Pelajaran)
Gambar 1. Arsitektur Sistem
Data transaksi penjualan
CLHM
Apriori
Keterkaitan data