JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 – 4981 VOL. 5 NO. 2 SEPTEMBER 2012
IMPLEMENTASI DATA MINING DENGAN METODE MARKET BASKET ANALYSIS Julius Santony1
ABSTRACT Information is seen as something very important and very valuable, because it controls the information will easily be able to achieve the desired goal is so important piece of information in life, making every race looking for in order to survive and survive life itself. Likewise for businesses especially in trade, information used as material analysis that aims to increase corporate profits. Market basket analysis with the Association Rules is an application of data mining that aims to find patterns of associations based on the pattern of consumer spending, so it will be known to those items any item purchased at the same time, and later can be used as an ingredient in the decision analysis , to increase profits or determine marketing strategies. Variables used in this method later the support and confidence. Keywords: Data Mining, Association Rule, Market Basket Analysis INTISARI Informasi dipandang sebagai sesuatu hal yang sangat penting dan sangat berharga, karena dengan menguasai informasi maka dengan mudah akan dapat mencapai tujuan yang diinginkan Begitu pentingnya sebuah informasi dalam kehidupan ini, membuat setiap orang berlomba mencarinya agar bisa tetap bertahan dan selamat dari kehidupan itu sendiri. Demikian juga bagi kalangan bisnis khususnya bidang perdagangan, informasi dipakai sebagai bahan analisa yang bertujuan untuk meningkatkan keuntungan perusahaan. Market basket analysis dengan Association Rules merupakan salah satu aplikasi data mining yang bertujuan untuk mencari pola assosiasi berdasarkan pola belanja yang dilakukan konsumen, sehingga nantinya bisa diketahui item-item barang apa saja yang dibeli secara bersamaan, dan nantinya bisa dipakai sebagai bahan analisa dalam pengambilan keputusan, untuk meningkatkan keuntungan atau menentukan strategi pemasaran. Variabel yang digunakan dalam metode ini nantinya yaitu support dan confidence. Kata Kunci : Data Mining, Assosiation Rule, Market Basket Analysis
1
Dosen Fakultas Ilmu Komputer Universitas Putra Indonesia “YPTK” Padang
56
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 – 4981 VOL. 5 NO. 2 SEPTEMBER 2012 PENDAHULUAN Di era sekarang ini untuk mendapatkan informasi tidaklah sulit, sebab banyak sekali media yang menawarkan beragam informasi yang dapat digunakan untuk bermacammacam keperluan. Salah satunya adalah dalam hal penjualan suatu produk.Dalam penjualan suatu produk diperlukan tindakan kongkrit yang dapat dilakukan oleh perusahaan, antara lain secara proaktif menawarkan produk yang akan dijual tersebut. Market Basket Analysis adalah suatu metode yang bekerja mencari dan menemukan pola-pola yang berassosiasi diantara produk-produk yang dipasarkan [1], misalnya menemukan bahwa produk A biasanya dibeli bersamaan dengan produk B dalam waktu tertentu dan jumlah tertentu. Teknik ini merupakan salah satu cara untuk melakukan data mining yang berguna untuk menemukan knowledge dari datadata yang ada. Knowledge tersebut dapat digunakan oleh perusahaan untuk meningkatkan produksi maupun penjualan produk-produknya [2]. Tujuan penelitian ini agar dapat membantu manajer dalam mengambil suatu keputusan yang akan meningkatkan penjualan produk-produknya dengan cara membuat suatu perancangan untuk mencari pola assosiasi menggunakan Metode Market Basket Analysis.
PENDEKATAN PEMECAHAN MASALAH Secara umum kerangka kerja penelitian adalah seperti Gambar 1. Berikut ini : Pencarian Literatur Pengumpulan Data Analisis
Perancangan Pengujian
Gambar 1. Kerangka Kerja PenelitianPencarian Literatur Dalam tahap ini, dilakukan pencarian literatur mengenai teori data mining dengan menggunakan metode market basket analysis. Tujuan dari market basket analysis ini adalah untuk menentukan produkproduk apa saja yang dibeli oleh seorang konsumen secara bersamaan. Didalam pencarian literature juga melakukan wawancara dengan karyawan sebuah Mini Market. Pengumpulan Data Data yang diperoleh adalah data dalam bentuk hard copy tentang barang-barang yang sering dibeli oleh konsumen. Analisis dan Perancangan Dengan menggunakan aturan asosiasi dalam 2 langkah proses, yaitu [3]: 1. Temukan semua frequent itemset; Berdasarkan definisi, masing-masing dari itemset maka muncul sedikitnya dengan frequency sebesar diberikan dalam minimum support count. 2. Munculkan strong association rule dari frequent itemset,
57
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 – 4981 VOL. 5 NO. 2 SEPTEMBER 2012 Berdasarkan definisi, aturan ini harus memenuhi minimum support dan minimum confidence. Nilai support dari 2 item diperoleh dari rumus berikut : Support (A,B) = ∑ Transaksi mengandung A dan B ∑ Transaksi
Nilai Confidence dari 2 item diperoleh dari rumus berikut : Confidence = P(B|A) = ∑ Transaksi mengandung A dan B ∑ Transaksi Mengandung A
Setelah dilakukan 2 langkah di atas maka maka dibuat Use Case Diagram untuk menggambarkan rancangan sistem yang didalamnya terdapat actor-actor yang bekerja dalam sistem tersebut Pengujian Melihat kesesuaian antara output yang didapat sebagai hasil analisis dari aturan asosiasi dengan kondisi yang sebenarnya.
22 Pepsodent,Oral-B 23 Susu,Roti,Kopi 24 Lux,Clear 25 Teh,Gula,Kopi 26 Pantene,clear,sunsilk 27 Pulpen,pensil,buku 28 HVS,tinta,buku 29 Penghapus,pensil 30 Buku,pulpen Sumber : Mini Market MD (2012)
HASIL DAN PEMBAHASAN Aturan Asosiasi Dari pengumpulan data di sebuah mini market didapat data seperti Tabel 1. berikut ini : Tabel 1. Contoh Transaksi Transaksi Item yang dibeli 1 Susu,Teh,Gula 2 Roti,Margarin 3 Attack, clear, Lux 4 Teh,Gula,Roti 5 Teh,Gula,Roti 6 Kopi,Susu 7 Pepsodent,Oral-B 8 Cappuccino,Susu,Roti 9 Gula,Susu,Roti 10 Cappuccino,Susu Margarin, Roti, 11 Cappuccino 12 Susu,Gula,Roti 13 Teh,Gula 14 Gula,Susu,Roti 15 Attack,Pepsodent 16 Gula,Kopi,Susu 17 Clear,Pepsodent,Lux 18 Cappuccino,Kopi,Susu 19 Margarin 20 Gula,kopi,Susu 21 Lux,Pepsodent
Ada dua metode utama dalam merepresentasikan tipe data dalam analisa proses asosiasi yaitu format data transaksional dan format data tabular. 1. Bentuk tabel data transaksional berdasarkan transaksi-transaksi yang ada, seperti dapat dilihat pada Tabel 2 berikut ini : Table 2. Contoh Data Transaksional Transaksi Item yang dibeli 1 2 1 Susu 1 Teh 1 Gula 2 Roti 2 Margarin 3 Attack 3 Clear 3 Lux 4 The 4 Gula 4 Roti 5 Kopi 5 Susu
58
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 – 4981 VOL. 5 NO. 2 SEPTEMBER 2012 6 6 6 7 7 8 8 8 9 9 9 10 10 11 11 11 12 12 12 13 13 14 14 14 15 15 16 16 16 17 17 17 18 18 18 19 20 20 20 21 21 22 22
The Gula Roti Pepsodent Oral-B Cappuccino Susu Roti Gula Susu Roti Cappuccino Susu Margarin Roti Cappuccino Susu Gula Roti The Gula Gula Susu Roti Attack Pepsodent Gula Kopi Susu Clear Pepsodent Lux Cappuccino Kopi Susu Margarin Gula Kopi Susu Lux Pepsodent Pepsodent Oral-B
2.
59
23 Susu 23 Roti 23 Kopi 24 Lux 24 Clear 25 The 25 Gula 25 Kopi 26 Pantene 26 Clear 26 Sunsilk 27 Pulpen 27 Pensil 27 Buku 28 HVS 28 Tinta 28 Buku 29 Pensil 29 Penghapus 30 Buku 30 Pulpen Sumber : Mini Market MD Bentuk tabel format tabular data transaksi berdasarkan transaksi-transaksi yang ada, seperti Tabel 3 berikut ini :
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 – 4981 VOL. 5 NO. 2 SEPTEMBER 2012 Tabel 3. Format Tabular Data Transaksi
Misalkan D adalah himpunan transaksi yang direpresentasikan dalam table 4 dimana setiap transaksi T dalam D merepresentasikan himpunann item yang berada dalam I. I adalah himpunan item yang dijual{ Teh, Gula, Kopi, Susu, Roti }. Misalkan kita memiliki himpunan item A( misal susu dan gula ) dan himpunan item lain B ( misal Kopi) kemudian aturan asosiasi akan berbentuk: Jika A, maka B ( A -> B ) Dimana antecedent A dan consequent B merupakan subset dari I dan A dan B merupakan mutually exclusive dimana aturan: Jika A, Maka B Tidak berarti: Jika B, Maka ADefinisi ini tidak berlaku untuk trivial seperti:Jika Beans maka Squash, maka Beans Aturan yang kuat adalah
aturan-aturan yang melebihi kriteria support dan confidence minimum. Misalnya seorang analisis menginginkan aturan yang memiliki support lebih dari 20%, dan confidence lebih dari 35%. Sebuah itemset adalah himpunan item-item yang ada dalam I, dan k-itemset adalah itemset yang berisi k-item. Misalnya {Teh, Gula} adalah sebuah 2-itemset dan {Teh, Gula, Roti} merupakan 3-itemset.Frequent itemset adalah itemset yang terjadi paling sedikit pada jumlah tertentu, mempunyai itemset frequency ≥ Φ. Misalkan, Φ = 4, itemset yang terjadi lebih dari 4 disebut frequent. Notasi set of frequent k-itemsets adalah Fk. Hasil calon 2-item set dapat dilihat seperti Tabel 4.
60
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 – 4981 VOL. 5 NO. 2 SEPTEMBER 2012 Tabel 4.Calon 2-item set dari tabel 3. Kombinasi Jumlah Susu,The Susu,Gu a Susu,Roti Susu,Kopi Susu,Pepsodent Teh,Gula Teh,Roti Teh,Kopi Teh,Pepsodent Gula,Roti Gula,Kopi
1 2 5 1 0 5 1 1 0 5 3
Gula,Pepsodent Roti,Kopi Roti,Pepsodent Kopi,Pepsodent
0 1 0 0
Pembentukan Aturan Asosiasi Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan asosiasi yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan asosiatif A→B.
Nilai Confidence dari aturan A→B diperoleh dari rumus : Confidence = P(B|A)= Ʃ Transaksi mengandung A dan B Ʃ ( Susu, Roti)
=
5
Ʃ
Transaksi Mengandung A Ʃ ( Teh, Gula )
= 45,45 %
5
=
= 100 %
Ʃ ( Gula, Roti )
=
5
=
50 % Ʃ ( Susu )
11
Ʃ (Teh )
Ʃ ( Gula )
5
10
Merupakan confidence yang didapat dari calon kombinasi 2 item set yang terdapat pada Tabel 5. Tabel 5. Confidence dari F2 Aturan Confidence Jika membeli Susu, maka akan membeli Roti 5/11 45,45% Jika membeli Teh, maka akan membeli Gula
5/5
100%
Jika membeli Gula, maka akan membeli Roti
5/10
50%
Nilai Support dari aturan A→B diperoleh dari rumus : Support (A,B) = ∑ Transaksi mengandung A dan B Ʃ ( Susu, Roti )
=
5
∑ Transaksi
= 16,66 %
Ʃ (Teh, Gula )
5
=
= 16,66%
Ʃ ( Gula, Roti )
=
5
= 16,66 % Ʃ ( Transaksi )
Ʃ (Transaksi )
30
Merupakan support yang didapat dari calon kombinasi 2 item set yang terdapat pada Tabel 6. Tabel 6. Support dari F2 Aturan Support Jika membeli teh, maka akan membeli gula Jika membeli
5/10
50%
5/10
50%
30
Ʃ (Transaksi )
30
gula, maka akan membeli the Jika membeli gula, maka 3/10 30% akan membeli kopi Aturan asosiasi final terurut berdasarkan Support x Confidence terbesar dapat dilihat pada Tabel 7.
61
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 – 4981 VOL. 5 NO. 2 SEPTEMBER 2012 Tabel 7. Aturan Asosiasi Final Aturan Support Confidence Jika membeli susu, maka 16,66% 45.45% akan membeli roti. Jika membeli teh, maka 16,66% 100% akan membeli gula. Jika membeli gula, maka 16,66% 50% akan membeli roti Berdasarkan aturan asosiasi final di atas (Support x Confidence), maka dapat di lihat item mana yang paling cocok untuk di kombinasikan. Use Case Diagram Use case diagram digunakan untuk memodelkan berdasarkan perspektif pengguna sistem yang didalamnya terdapat actor yang mengoperasikan aplikasi dapat dilihat pada Gambar 2 :
Login
<< Include >>
Entry Barang << Include >>
<< Include >>
Admin
Entry Penjualan
<< Include >> Analisa
Logout
Gambar 2. Use Case Diagram Keterangan: a. ADMIN adalah orang yang akan mengoperasikan aplikasi. b. LOGIN adalah untuk melakukan validasi data untuk aplikasi. c. ENTRY BARANG adalah untuk menginputkan data barang. d. ENTRY PENJUALAN adalah untuk menginputkan transaksi yang ada. e. PROSES ASOSIASI adalah untuk melakukan proses association. f. LOGOUT adalah untuk keluar dari aplikasi. KESIMPULAN 1. Dari sistem aplikasi data mining ini terlihat bahwa barangbarang yang berdekatan harus diletakan bersamaan agar mudah dibeli oleh konsumen. 2. Dari aplikasi data mining ini manajer atau pembuat keputusan dapat mengetahui barang-barang apa saja yang dibeli secara bersamaan, sehingga informasi tersebut dapat dipakai sebagai bahan pertimbangan dalam mengambil keputusan yang berkaitan dengan peningkatan penjualan pada Mini Market dan keuntungan dari item-item yang banyak terjual.
62
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : 2086 – 4981 VOL. 5 NO. 2 SEPTEMBER 2012 3.
Fakultas Teknologi Industri – Universitas Kristen Petra. http://cpanel.petra.ac.id/ejournal/i ndex.php/inf/article/viewFile/1631 9/16311 (sumber diakses pada : 9 Juni 2012)
Sistem aplikasi ini mampu mengolah data transaksi untuk menemukan pola assosiasi yang memenuhi syarat minimum support, dan confidence berdasarkan item yang ada dalam transaksi.
DAFTAR PUSTAKA [1] Gregorius S. Budhi, Resmana Lim. 2005. Penggunaan Metode Fuzzy c-Covering Untuk Analisa Market Basket Pada Supermarket. Jurnal Informatika Vol. 6, NO. 1, Mei 2005: 51 – 58. Jurusan Teknik Informatika,
[2] Berry dan Linoff. 2005. Data mining Technigue for Marketing, Sales, and Costomers Support. Larose [3] Kc99, Lounge. 2010. Data Mining, http://kc99lounge.blogspot.com/2 010/07/data-mining.html
63