Analisa Keranjang Pasar dengan Algoritma Apriori pada Data Transaksi Mini Market Lima Bintang Johan E-mail :
[email protected] ABSTRAK Algoritma apriori termasuk jenis aturan asosiasi pada data mining. Algoritma apriori atau association rule mining adalah teknik data mining untuk menemukan aturan asosiatif antara satu kombinasi item, dari analisa pembelian di suatu pasar swalayan dapat diketahuinya berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut, pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu. Berdasarkan uji coba Nilai Support dapat diambil kesimpulan bahwa semakin kecil nilai support maka jumlah itemset yang dihasilkan semakin banyak, dan jumlah kaidah asosiasi yang dibentuk semakin banyak pula. Kata kunci : Data Mining, Association Rules, Algoritma Apriori
ABSTRACT Apriori is an algorithm provided in association rules in data mining. Apriori or association rule mining is data mining techniques to discover the associative rules between one combination of items, from analysis of the purchase in a supermarket can know how likely a customer buys bread with milk. With this knowledge, a supermarket owner can manage the placement of merchandise or designing marketing campaigns using a combination of discount coupons for certain items. Based on the experimental value of Support can be concluded that the smaller the value of support then the number of itemset generated more and more, and the number of association rules established more and more also. Keyword : Data Mining, Association Rules, Apriori Algorithm
I. PENDAHULUAN I.1 LATAR BELAKANG Data mining adalah kombinasi secara logis antara pengetahuan data, dan analisa statistik yang dikembangkan dalam pengetahuan bisnis atau suatu proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, tiruan dan machine-learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat bagi pengetahuan yang terkait dari berbagai database besar.
2010 - Johan
Algoritma apriori adalah algoritma analisis keranjang pasar yang digunakan untuk menghasilkan aturan asosiasi, dengan pola “if-then”. Algoritma apriori menggunakan pendekatan iteratif yang dikenal dengan level-wise search, dimana k-kelompok produk digunakan untuk mengeksplorasi (k+1)-kelompok produk atau (k+1)-itemset. Dalam penelitian ini peneliti mencoba menganalisa data transaksi penjualan pada toko Mini Market Lima Bintang Pekanbaru. Data yang diambil sebagai contoh kasus adalah data transaksi penjualan di mini market. Melalui Page 1
penelitian ini diharapkan dapat ditemukan langkah-langkah dan masalah (sebagai model) dalam menerapkan algoritma apriori ini dan diketahui apakah data transaksi penjualan mini market cukup Implementasi sistem analisis keranjang pasar dengan algoritma apriori, dan eksperimen penggunaan sistem dengan data transaksi penjualan toko Mini Market Lima Bintang Pekanbaru. I.2 PERUMUSAN MASALAH Berdasarkan latar belakang di atas, dapat dirumuskan masalahnya, sebagai berikut : 1. Bagaimana menganalisa data untuk keperluan strategi pemasaran, desain katalog dan proses pembuatan keputusan bisnis ? 2. Bagaimana menemukan pola-pola himpunan data yang sifatnya tersembunyi ? 3. Bagaimana menerapkan algoritma apriori dalam data market ? Tujuan analisis keranjang pasar pada transaksi penjualan adalah untuk merancang strategi penjualan atau pemasaran yang efektif dengan memanfaatkan data transaksi penjualan yang telah tersedia di perusahaan. Dengan menggunakan teknologi data mining, orang tidak perlu melakukan analisis data secara manual, melainkan dapat menggunakan teknik data mining untuk ini. I.3 TUJUAN PENELITITAN
Tujuan analisis keranjang pasar pada transaksi penjualan adalah untuk merancang strategi penjualan atau pemasaran yang efektif dengan memanfaatkan data transaksi penjualan yang telah tersedia di mini market. Dengan menggunakan teknologi data mining, orang tidak perlu melakukan analisis data secara manual, melainkan dapat menggunakan teknik data mining untuk ini. Teknik analisis keranjang pasar 2010 - Johan
berharga untuk ditambang dengan teknik analisis data market. Penelitian ini membahas algoritma apriori, analisis , imp bertujuan untuk menemukan pola yang berupa produk-produk yang sering dibeli bersamaan (atau cenderung muncul bersama dalam sebuah transaksi) dari data transaksi yang pada umumnya berukuran sangat besar. Perusahaan lalu dapat menggunakan pola ini untuk menempatkan produk yang sering dibeli bersamaan ke dalam sebuah area yang berdekatan, merancang tampilan produk di katalog, merancang kupon diskon (untuk diberikan kepada pelanggan yang membeli produk tertentu), merancang penjualan paket produk, dll. Penelitian ini bertujuan untuk mengaplikasikan algoritma apriori yang merupakan hasil penelitian yang baru, sebagai teknik analisis keranjang pasar. Data yang diambil sebagai contoh kasus adalah data transaksi mini market. Melalui penelitian ini diharapkan dapat ditemukan langkahlangkah dan masalah (sebagai model) dalam menerapkan algoritma ini dan diketahui apakah data mini market cukup berharga untuk ditambang dengan teknik analisis keranjang pasar. II. TINJAUAN PUSTAKA Knowledge Discovery and Data Mining(KDD) adalah proses yang dibantu oleh komputer untuk menggali dan menganalisis sejumlah besar himpunan data dan mengekstrak informasi dan pengetahuan yang berguna. Data mining tools memperkirakan perilaku dan tren masa depan, memungkinkan bisnis untuk membuat keputusan yang proaktif dan berdasarkan pengetahuan. Data mining tools mampu menjawab permasalahan bisnis yang secara tradisional terlalu lama untuk diselesaikan. Data mining tools menjelajah database untuk mencari pola Page 2
tersembunyi, menemukan infomasi yang prediktif yang mungkin dilewatkan para pakar karena berada di luar ekspektasi mereka. Proses dalam KDD adalah proses yang digambarkan pada dan terdiri dari rangkaian proses iteratif sebagai berikut: 1. Data cleaning, menghilangkan noise dan data yang inkonsisten. 2. Data integration, menggabungkan data dari berbagai sumber data yang berbeda 3. Data selection, mengambil data yang relevan dengan tugas analisis dari database 4. Data transformation, Mentransformasi atau menggabungkan data ke dalam bentuk yang sesuai untuk penggalian lewat operasi summary atau aggregation. 5. Data mining, proses esensial untuk mengekstrak pola dari data dengan metode cerdas. 6. Pattern evaluation, mengidentifikasikan pola yang menarik dan merepresentasikan pengetahuan berdasarkan interestingness measures. 7. Knowledge presentation, penyajian pengetahuan yang digali kepada pengguna dengan menggunakan visualisasi dan teknik representasi pengetahuan.
Algoritma apriori adalah algoritma analisis keranjang pasar yang digunakan untuk menghasilkan aturan asosiasi, dengan pola “if-then”. Algoritma apriori menggunakan pendekatan iteratif yang dikenal dengan level-wise search, dimana k-kelompok produk digunakan untuk mengeksplorasi (k+1)-kelompok produk atau (k+1)-itemset. Beberapa istilah yang digunakan dalam algoritma apriori antara lain: a. Support (dukungan): probabilitas pelanggan membeli beberapa produk secara bersamaan dari seluruh transaksi. Support untuk aturan “X=>Y” adalah probabilitas atribut atau kumpulan atribut X dan Y yang terjadi bersamaan. b. Confidence (tingkat kepercayaan): probabilitas kejadian beberapa produk dibeli bersamaan dimana salah satu produk sudah pasti dibeli. Contoh: jika ada n transaksi dimana X dibeli, dan ada m transaksi dimana X dan Y dibeli bersamaan, maka confidence dari aturan if X then Y adalah m/n. c. Minimum support: parameter yang digunakan sebagai batasan frekuensi kejadian atau support count yang harus dipenuhi suatu kelompok data untuk dapat dijadikan aturan. d. Minimum confidence: parameter yang mendefinisikan minimum level dari confidence yang harus dipenuhi oleh aturan yang berkualitas. e. Itemset: kelompok produk. f. Support count: frekuensi kejadian untuk sebuah kelompok produk atau itemset dari seluruh transaksi. g. Kandidat itemset: itemset-itemset yang akan dihitung support count-nya. h. Large itemset: itemset yang sering terjadi, atau itemset-itemset yang sudah melewati batas minimum support yang telah diberikan. Sedangkan notasi-notasi yang digunakan dalam algoritma apriori antara lain:
Gambar 2.1 Tahap-tahap Data Mining 2010 - Johan
Page 3
a. Ck adalah kandidat k-itemset, dimana k menunjukkan jumlah pasangan item. b. Lk adalah large k-itemset.
Contoh tahapan pembangkitan C1, L1, C2, L2, C3, L3 ditunjukkan pada Gambar 2. Pembangkitan aturan asosiasi dari large itemset:
c. D adalah basis data transaksi penjualan dimana |D| adalah banyaknya transaksi di tabel basis data. Ada dua proses utama yang dilakukan algoritma apriori, yaitu: 1. Join (penggabungan): untuk menemukan Lk, Ck dibangkitkan dengan melakukan proses join Lk-1 dengan dirinya sendiri, Ck=Lk-1*Lk-1, lalu anggota Ck diambil hanya yang terdapat didalam Lk-1. 2. Prune (pemangkasan): menghilangkan anggota Ck yang memiliki support count lebih kecil dari minimum support agar tidak dimasukkan ke dalam Lk. Tahapan yang dilakukan algoritma apriori untuk membangkitkan large itemset adalah sebagai berikut: 1. Menelusuri seluruh record di basis data transaksi dan menghitung support count dari tiap item. Ini adalah kandidat 1-itemset, C1. 2. Large 1-itemset L1 dibangun dengan menyaring C1 dengan support count yang lebih besar sama dengan minimum support untuk dimasukkan kedalam L1. 3. Untuk membangun L2, algoritma apriori menggunakan proses join untuk menghasilkan C2. 4. Dari C2, 2-itemset yang memiliki support count yang lebih besar sama dengan minimum support akan disimpan ke dalam L2. 5. Proses ini diulang sampai tidak ada lagi kemungkinan k-itemset.
2010 - Johan
Gambar 2.2 Ilustrasi Algoritma Apriori Dari beberapa large itemset yang telah ditemukan, dapat dibangkitkan aturan-aturan asosiasi yang berkualitas. Syarat aturan asosiasi yang adalah harus memenuhi minimum support dan minimum confidence yang telah ditentukan. Confidence dari setiap aturan yang dibangkitkan dapat dihitung dengan menggunakan rumus peluang Confidence(A=>B) = P(B|A) = support_count(A∩B) / support_count(A) dengan support_count (A∩B) adalah jumlah transaksi yang berisi itemset A dan B, dan support_count(A) adalah jumlah transaksi yang berisi itemset A. Berdasarkan rumusan diatas, aturan asosiasi dapat dibangkitkan dengan langkah: 1. Untuk setiap itemset l, bangkitkan seluruh subset l yang tidak kosong. 2. Untuk setiap subset s dari l yang tidak kosong, buat aturan „s => (l- s)‟ jika support_count(l)/support_count(s) >= minimum confidence. Algoritma apriori memiliki masalah yaitu harus membangkitkan kandidat itemset, Ck, dalam jumlah besar. (Banyaknya Ck yang dibangkitkan adalah kombinasi k dari jumlah itemset Lk-1 atau C .) Setelah Ck terbentuk, k (Σ itemset Lk-1) Page 4
apriori melakukan penelusuran seluruh record di basis data untuk menghitung support count masing-masing itemset sehingga waktu komputasinya lama. (Semakin besar jumlah kandidat itemset semakin besar komputasinya.) Bentuk Dasar Aturan Asosiatif Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support (nilai penunjang) yaitu persentase kombinasi item tsb. dalam database dan confidence(nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif. Aturan assosiatif biasanya dinyatakan dalam bentuk : {roti,mentega} -> {susu} (support = 40%, confidence = 50%) Yang artinya : ”50% dari transaksi di database yang memuat item roti dan mentega juga memuat item susu. Sedangkan 40% dari seluruh transaksi yang ada di database memuat ketiga item itu”. Dapat juga diartikan : "Seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari catatan transaksi selama ini." Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence). Metodologi dasar analisis asosiasi terbagi menjadi dua tahap : 1. Analisa pola frekuensi tinggi Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Sebagai contoh, ada database dari transaksi belanja pasar swalayan seperti berikut :
2010 - Johan
ID Transaksi 1 2 3 4 5
item terjual Pena, roti, mentega Roti, mentega, telur, susu Buncis, telur, susu Roti, mentega Roti, mentega, kecap, telur, susu
Syarat minimum dari nilai support untuk pola frekuensi tinggi dalam contoh ini adalah 30%. Diketahui bahwa jumlah transaksi yang memuat {roti,mentega} ada 4 (support 80%), sedangkan jumlah transaksi yang memuat {roti,mentega,susu} ada 2 (support 40%), transaksi yang memuat {buncis} hanya 1 (support 20%) dsb. Sehingga diperoleh pola frekuensi tinggi yang memenuhi syarat minimum nilai support adalah : Kombinasi item {roti} {mentega} {telur} {susu} {roti,mentega} {telur,susu} {roti,susu} {mentega,susu} {roti,telur} {mentega,telur} {roti,mentega,susu} {roti,mentega,telur,susu}
Support 80% 80% 60% 60% 80% 60% 40% 40% 40% 40% 40% 40%
2. Pembentukan aturan assosiatif Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A->B. Dari support pola frekuensi tinggi A dan B dengan menggunakan rumus berikut : confidence(A->B) = support(B) / support (A U B) Disini A U B adalah union dari pola A dan B Page 5
Bila syarat minimum untuk confidence dari contoh diatas adalah 50% maka salah satu aturan assosiatif yang dapat ditemukan adalah : {telur,susu} -> {roti,mentega} dengan nilai confidence 66.6% karena support({roti,mentega})/support({roti,me ntega,telur,susu}) = 40%/60% = 66.6% Aturan assosiatif lain yang dapat ditemukan diantaranya adalah : aturan assosiatif
support
confidence
{telur,susu} -> {roti,mentega} {roti,mentega} -> {susu} {mentega,susu} -> {roti}
40% 40% 40%
66.6% 50% 100%
Perlu dicatat bahwa tahap pertama untuk mencari pola frekuensi tinggi biasanya paling banyak menghabiskan waktu III. METODE PENELITIAN
3.1. Kerangka Kerja Penelitian Kerangka kerja adalah merupakan prosedur kegiatan, mulai dari awal sampai akhir dari tulisan tesis ini. Kerangka kerja tersebut digambarkan seperti berikut ini gambar 3 : Data Generation Penentuan Tujuan Literatur Analisa Data Analisa data dengan algoritma apriori Implementasi Pembahasan Hasil
Gambar 3.1 Kerangka Kerja Penelitian 3.2. Data Generation Metode pengumpulan data adalah cara-cara dan prosedur yang dilakukan dalam penelitian untuk memperoleh data yang dibutuhkan. Beberapa metode pengumpulan data yang 2010 - Johan
dilakukan dalam penelitian ini adalah sebagai berikut : a. Melakukan observasi dan kajian tentang data transaksi penjualan toko mini market Lima Bintang. Kajian lapangan ini untuk mengetahui secara langsung permasalahan yang ada, sehingga diharapkan penerapan disain dan konsep analisa data market menggunakan algoritma apriori dapat dilakukan dengan tepat. b. Library Research (tinjauan kepustakaan) Library research (tinjauan kepustakaan) dilakukan untuk mengumpulkan informasi tentang literature dan pedoman dalam penentuan hasil analisa data market menggunakan algoritma apriori. c. Laboratory Research (Penelitian Laboratorium) Penelitian laboratorium adalah untuk pengujian data penentuan hasil analisa data market yang telah didapatkan dengan menggunakan algoritma apriori 3.3. Penentuan Tujuan Yang menjadi tujuan pada tesis ini untuk menentukan hasil analisa data market menggunakan algoritma apriori. Setelah melakukan kajian, maka sasaran terakhir dari tesis ini adalah sebagai berikut : a. Mendisain suatu konsep penentuan hasil analisa data market dengan menggunakan algoritma apriori, sehingga dapat menemukan pola dari data yang tersembunyi. b. Memberikan kemudahan atau solusi bagi pengambil keputusan dalam menemukan produk-produk yang sering dibeli bersamaan dari data transaksi sehingga dapat menempatkan produk yang sering dibeli bersamaan kedalam suatu area yang berdekatan, merancang tampilan Page 6
produk dikatalog, merancang kupon diskon dan lain-lain. c. Hasil dari penelitian yang dilakukan ini nantinya dapat diuji dengan menggunakan software association rule. 3.4 . Literatur Literatur yang dimaksud disini adalah literatur yang digunakan untuk mendapatkan suatu cara atau prosedur yang akan digunakan untuk menganalisa data market menggunakan algoritma apriori agar nantinya dapat diterima oleh semua pihak yang membutuhkan. Sumber literatur didapatkan dari buku-buku yang membahas tentang teknik data mining, analisa data market, algoritma apriori dan jurnal-jurnal dari web site (internet). Judul buku dan alamat situs di internet yang dijadikan sebagai sumber literatur, nantinya dilampirkan pada daftar pustaka di akhir tesis ini. Dari hasil studi literatur diketahui ada penerapan apriori di bidang mini market untuk mengelompokkan barang berdasarkan kecenderungan kemunculan bersama dalam satu transaksi, juga data mining pada tabel absensi elektronik untuk mendeteksi kecurangan absensi, dan analisa keranjang pasar dengan algoritma hash-based pada data transaksi penjualan apotek. 3.5 . Analisa Data Data-data yang sudah diperoleh pada tahap pengumpulan data, akan dianalisis pada bagian ini. Berdasarkan hasil kajian literatur dan observasi lapangan, data disusun dan dikelompokkan dalam bentuk tabel multikriteria sederhana. Hal ini dimaksudkan untuk mempermudah dalam analisa dan proses penentuan hasil analisa data market menggunakan algoritma apriori.
2010 - Johan
3.6 . Pengolahan Data Dengan Algoritma Apriori Pada tahap ini akan dilakukan analisa yaitu; analisa terhadap algoritma apriori pada data market dari data transaksi penjualan untuk menentukan alternatif yang terbaik dari sekumpulan alternatif yang ada melalui suatu proses seperti yang terjadi pada proses yang terstruktur. 3.7. Implementasi Pada penelitian ini penulis mengimplementasikan pengujian model dari hasil analisa data menggunakan algoritma apriori dengan menggunakan alat bantu komputer dengan operating system windows dan menggunakan software shoping cart analyzer. Model yang dirancang ini akan dibuat sebagai sebuah aplikasi yang siap pakai. 3.8. Pembahasan Hasil Evaluasi sistem yang telah di uji perlu dilakukan, dengan tujuan untuk mengetahui apakah sistem yang diuji tersebut sudah sesuai dengan yang diharapkan. Evaluasi dilakukan dengan cara membandingkan hasil yang didapatkan pada tahap implementasi sistem dengan hasil yang dibuat secara manual. IV. ANALISA DAN PERANCANGAN
Tahapan yang cukup penting pada data mining adalah tahapan data preparation atau tahapan persiapan data. Dimana nantinya data yang didapatkan akan dipergunakan pada tahapan selanjutnya yaitu modelling. Apabila data yang didapatkan tidak benar maka nantinya model yang dihasilkan tidak akan maksimal hasilnya. 4.1 Data Preparation Data yang didapatkan merupakan data primer yaitu data yang didapatkan langsung dari data transaksi penjualan toko mini market lima bintang pekanbaru, berupa data transaksi penjualan dalam beberapa bulan. Page 7
Terdapat delapan(8) atribut yang harus diisi yang ada pada transaksi penjualan toko mini market lima bintang pekanbaru yaitu : 1. Tanggal Kegiatan kapan terjadinya transaksi 2. No_Nota Nomor kegiatan transaksi yang harus diisi disaat transaksi terjadi 3. Konsumen Nama pelanggan yang membeli item barang 4. Nama_Barang Pendefinisian item-item barang untuk membedakan item barang yang satu dengan item barang yang lain. 5. QTY 6. Jumlah item barang yang dimasukkan pelanggan ke dalam keranjang belanjaanya.
2010 - Johan
7. Satuan Bentuk item barang 8. Harga_Satuan(@) Harga per item barang yang dibeli pelanggan 9. Jumlah Harga yang harus dibayar oleh pelanggan 4.1.1 Select Data Dari 8 atribut yang ada pada data transaksi penjualan yang dapat dijadikan parameter pada penelitian ini hanya No_Nota dan Nama_Barang. Dimana kita hanya melihat item barang mana yang sering dibeli oleh pelanggan.
Page 8
Tabel 4.1 Data Transaksi Mini Market Tanggal 2-Jan-10
No_Nota 1704
Konsumen Café Bintang
2-Jan-10
1705
Warung Restu
Nama Barang Qty 1 Indomie Goreng Special 5 Indomie Kari Ayam 2 Indomie Ayam Bawang 2 Indomie Soto Medan 1 Indomie Kaldu Ayam 1 Indomie Goreng Sate 2 Indomie Goreng Pedas Tepung Terigu Tepung Terigu 2
2-Jan-10 2-Jan-10
1704 1704
Café Bintang Café Bintang
2-Jan-10 2-Jan-10 2-Jan-10 2-Jan-10
1704 1704 1704 1704
Café Bintang Café Bintang Café Bintang Café Bintang
2-Jan-10
1705
Warung Restu
Tepung KanjiTepung Terigu 3
Kg
Rp
5,500
Rp
16,500
1705
Warung Restu
Super BuburTepung Rasa Sapi Terigu 1
Dus
Rp
40,000
Rp
40,000
2-Jan-10
1705
Warung Restu
2 ABC Mie Semur Pedas Tepung Terigu
Dus
Rp
49,000
Rp
98,000
2-Jan-10
1705
Warung Restu
Royco AyamTepung Sachet Terigu 2
Renceng
Rp
6,000
Rp
12,000
2-Jan-10
1705
Warung Restu
Royco Sapi Sachet Tepung Terigu 2
Renceng
Rp
6,000
Rp
12,000
2-Jan-10
1705
Telor Ayam Tepung Terigu 2
Papan
Rp
22,000
Rp
44,000
Air Galon SPA Aqua Cup Beras Belida 20Kg Indomie Goreng Pedas Lifebuoy Cair 450ml Milo Sachet Kecap Manis Bango Refill 85ml Roti Bobo Sampoerna Mild 16 Lucky Strike Black Indomilk Susu Kental Manis Coklat Kaleng Teh Celup Sari Wangi @50sch Ajinomoto @500 Rinso 900gr Telor Ayam Roti Bobo
1 5 5 5
Galon Dus Bgks Bgks
Rp Rp Rp Rp
9,500 15,000 80,000 48,000
Rp Rp Rp Rp
9,500 75,000 400,000 240,000
5 10 5
Bgks Bgks Bgks
Rp Rp Rp
2,000 2,500 8,000
Rp Rp Rp
10,000 25,000 40,000
10 5 3 2
Bgks Bgks Bgks klg
Rp Rp Rp Rp
1,000 10,000 11,000 5,600
Rp Rp Rp Rp
10,000 50,000 33,000 11,200
3
Bgks
Rp
6,000
Rp
18,000
2 2 1 12
Bgks Pack Papan Bgks
Rp Rp Rp Rp
7,500 7,500 22,000 1,000
Rp Rp Rp Rp
15,000 15,000 22,000 12,000
Daia Putih 1Kg
1
Kg
Rp
18,000
Rp
18,000
Indomie Kari Ayam
2
Dus
Rp
50,000
Rp
100,000
Indomie Goreng Special Indomie Goreng Pedas ABC Mie Semur Pedas Telor Ayam Milo Sachet Indomie Soto Medan
1
Dus
Rp
49,000
Rp
49,000
1
Dus
Rp
48,000
Rp
48,000
2 3 6 3
Dus Papan Bgks Dus
Rp Rp Rp Rp
49,000 22,000 2,500 46,000
Rp Rp Rp Rp
98,000 66,000 15,000 138,000
2-Jan-10
2-Jan-10 2-Jan-10 2-Jan-10 2-Jan-10
1706 1706 1706 1706
Warung Restu Salon Van Beauty Salon Van Beauty Salon Van Beauty Salon Van Beauty
2-Jan-10 3-Jan-10 3-Jan-10
1706 1707 1707
Salon Van Beauty Warung Wiwi Warung Wiwi
3-Jan-10 3-Jan-10 3-Jan-10 3-Jan-10
1707 1707 1707 1708
Warung Wiwi Warung Wiwi Warung Wiwi Ridho Jaya
3-Jan-10
1708
Ridho Jaya
3-Jan-10 3-Jan-10 3-Jan-10 3-Jan-10
1708 1708 1708 1709
3-Jan-10
1709
3-Jan-10
1709
3-Jan-10
1709
3-Jan-10
1709
3-Jan-10 3-Jan-10 3-Jan-10 3-Jan-10
1710 1710 1710 1710
Ridho Jaya Ridho Jaya Ridho Jaya MM Masakan Medan MM Masakan Medan MM Masakan Medan MM Masakan Medan MM Masakan Medan Kedai Kopi Lin's Kedai Kopi Lin's Kedai Kopi Lin's Kedai Kopi Lin's
2010 - Johan
Satuan Dus
Harga_Satuan(@) Rp 49,000
Jumlah Rp 49,000
Dus Dus
Rp Rp
50,000 47,000
Rp Rp
250,000 94,000
Dus Dus Dus Dus
Rp Rp Rp Rp
46,000 46,000 48,000 48,000
Rp Rp Rp Rp
92,000 46,000 48,000 96,000
Kg
Rp
6,000
Rp
12,000
Page 9
4.1.2 Pembersihan Data Pembersihan data biasanya dipergunakan untuk mengisi data-data yang masih kosong atau ada kesalahan pengisian. Pada data mining ada teknikteknik yang dapat dipergunakan untuk melakukan pembersihan data. Akan tetapi untuk penelitian ini, penulis tidak mempergunakan teknik-teknik pada data mining tersebut. Karena parameterparameter yang ada, dibutuhkan data yang sebenarnya, bukan data yang dibuat berdasarkan rata-rata yang ada. 4.1.3 Integrasi Data Data-data yang dikumpulkan dalam proses transaksi seringkali ditempatkan pada lokasi yang berbedabeda. Maka dari itu dibutuhkan kemampuan dari sistem untuk dapat mengumpulkan data dengan cepat. Tabel 4.2 Contoh Database Transaksional No_Fak Item Bought tur Goreng Special, 1704 Indomie Indomie Kari Ayam, Indomie Ayam Bawang, Indomie Soto Medan, Indomie Kaldu Ayam, Indomie Goreng Sate, Indomie Goreng Pedas 1705 Tepung Terigu, Tepung Kanji, Super Bubur Rasa Sapi, ABC Mie Semur Pedas, Royco Ayam Sachet, Royco Sapi Sachet, Telor Ayam 1706 Air Galon SPA, Aqua Cup, Beras Belida 20Kg, Indomie Goreng Pedas, Lifebuoy Cair 450ml 1707 Milo Sachet, Kecap Manis Bango Refill 85ml, Roti Bobo, Sampoerna Mild 16, Lucky Strike Black 1708 Indomilk Susu Kental Manis Coklat Kaleng, Teh Celup Sari Wangi @50sch, Ajinomoto @500, Rinso 900gr, Telor Ayam 2010 - Johan
1709
Roti Bobo, Daia Putih 1Kg, Indomie Kari Ayam, Indomie Goreng Special, Indomie Goreng Pedas 1710 ABC Mie Semur Pedas, Telor Ayam, Milo Sachet, Indomie Soto Medan Dengan menggunakan tabel transaksi diatas, akan ditunjukkan bagaimana cara kerja dari algoritma apriori. Minimum support (minsupp) yang ditetapkan untuk menjalankan algoritma ini adalah sebesar 20% , dikarenakan akan terjadi transaksi dengan banyak item sehingga supportnya di kecilkan. Langkah 1 : menelusuri seluruh record di basis data transaksi dan menghitung support count dari tiap item. Ini adalah kandidat 1-itemset, C1 Support
Jumlah Transaksi Mengandung A
Total Transaksi (A) Tabel 4.3 Candidat 1-itemset C1 Candidate 1-itemset Support Indomie Goreng Special Indomie Kari Ayam Indomie Soto Medan Roti Bobo ABC Mie Semur Pedas Milo Sachet Indomie Goreng Pedas Telor Ayam Indomie Ayam Bawang Indomie Kaldu Ayam Indomie Goreng Sate
2/7 (28,6%)
Frequen t Ya
2/7 (28,6%)
Ya
2/7 (28,6%)
Ya
2/7 (28,6%) 2/7 (28,6%)
Ya Ya
2/7 (28,6%) 3/7 (42,8%)
Ya Ya
3/7 (42,8%) 1/7 (14,3%)
Ya Tidak
1/7 (14,3%)
Tidak
1/7 (14,3%)
Tidak
Page 10
Tepung Terigu 1/7 (14,3%) Tidak Tepung Kanji 1/7 (14,3%) Tidak Super Bubur Rasa 1/7 (14,3%) Tidak Sapi Royco Ayam 1/7 (14,3%) Tidak Sachet Royco Sapi Sachet 1/7 (14,3%) Tidak Air Galon SPA 1/7 (14,3%) Tidak Aqua Cup 1/7 (14,3%) Tidak Beras Belida 20Kg 1/7 (14,3%) Tidak Lifebuoy Cair 1/7 (14,3%) Tidak 450ml Kecap Manis 1/7 (14,3%) Tidak Bango Refill 85ml Sampoerna Mild 1/7 (14,3%) Tidak 16 Lucky Strike Black 1/7 (14,3%) Tidak Indomilk Susu 1/7 (14,3%) Tidak Kental Manis Coklat Kaleng Teh Celup Sari 1/7 (14,3%) Tidak Wangi @50sch Ajinomoto @500 1/7 (14,3%) Tidak Rinso 900gr 1/7 (14,3%) Tidak Daia Putih 1Kg 1/7 (14,3%) Tidak Adapun keterangan dari tabel 4.4 adalah sebagai berikut. Nilai Support Indomie Goreng Special dapat dihitung dengan menggunakan rumus, yaitu : Support
Jumlah Indomie Goreng Special
= Support
Total Transaksi 2 7
=
Support = 2 / 7 = 28,6 % Nilai Support Indomie Kari Ayam dapat dihitung dengan menggunakan rumus, yaitu : Support = Jumlah Indomie Kari Ayam Total Transaksi 2 Support =
Support = 2 / 7 = 28,6 % Nilai Support Indomie Soto Medan dapat dihitung dengan menggunakan rumus, yaitu : Support =
Jumlah Indomie Soto Medan Total Transaksi 2
Support =
7
Support = 2 / 7 = 28,6 % Nilai Support Telor Ayam dapat dihitung dengan menggunakan rumus, yaitu : Support =
Jumlah Telor Ayam Total Transaksi
Support =
3 7
Support = 3 / 7 = 42,8 %
Langkah 2 : large1_itemset L1 dibangun dengan menyaring C1 (tabel 4.4) dengan support count yang lebih besar atau sama dengan minimum support untuk dimasukkan ke dalam L1 Tabel 4.4 Frequent 1-itemset L1 Frequent 1-Itemset Indomie Goreng Special 28,6 % Indomie Kari Ayam
28,6 %
Indomie Soto Medan
28,6 %
Roti Bobo
28,6 %
ABC Mie Semur Pedas
28,6 %
Milo Sachet
28,6 %
Indomie Goreng Pedas
42,8 %
Telor Ayam
42,8 %
7 2010 - Johan
Page 11
Langkah 3 : untuk membangun L2, algoritma apriori menggunakan proses join untuk menghasilkan C2.
Indomie Goreng Pedas
Untuk candidat 2-itemset, dari 8 item dapat menghasilkan kombinasi 2-itemset yang memungkinkan sebanyak :
Ayam Semur
0/7 (0%)
Tidak
0/7 (0%)
Tidak
0/7 (0%)
Tidak
Indomie Kari Ayam, ABC
Indomie Goreng Special, Indomie Kari Ayam, Telor Ayam
= 28 kombinasi
C82 =
Indomie Goreng Special,
Langkah 4 : dari C2 (tabel 4.6), 2itemset yang memiliki support count yang lebih besar atau sama dengan minimum support akan disimpan ke dalam L2.
Indomie
Kari
Ayam,
Indomie
Goreng
Pedas,
Telor Ayam
Adapun keterangan dari tabel 4.8 adalah sebagai berikut. Nilai Support Indomie Goreng Special, Indomie Kari Ayam, Indomie Goreng Pedas dapat dihitung dengan menggunakan rumus, yaitu :
Tabel 4.5 Frequent 2-itemset L2 Frequent 2-itemset Indomie Goreng Special, Indomie Kari Ayam Indomie Goreng Special, Indomie Goreng Pedas Indomie Kari Ayam, Indomie Goreng Pedas ABC Mie Semur Pedas, Telor Ayam
28,6 % 28,6 %
Support A,B,C = P(A ∩B∩C) Jumlah transaksi Indomie Goreng Special AND Indomie Kari Ayam AND Indomie Goreng Pedas Total Transaksi
28,6 %
2 7
Support =
28,6 % Support = 2 / 7 = 28,6 %
Langkah 5 : proses ini diulang sampai tidak ada lagi kemungkinan k-itemset Untuk candidat 3-itemset, dari 4 item dapat menghasilkan kombinasi 3-itemset yang memungkinkan sebanyak :
Tabel 4.7 frequent 3-itemset Frequent 3-itemset Indomie Goreng Special, Indomie 28,6 % Kari Ayam, Indomie Goreng Pedas
C43
= 4 kombinasi
=
Tabel 4.6 Candidat 3-itemset C3 Candidate 3-itemset Support
Frequent
Indomie Goreng Special,
2/7
Ya
Indomie
(28,6%)
Kari
2010 - Johan
Ayam,
Karena tidak memungkinkan lagi dibentuk frequent 4-itemset dari frequent 3-itemset, maka proses pencarian dihentikan dan maximal frequent itemsetnya adalah {Indomie Goreng Special, Indomie Kari Ayam, Indomie Goreng Pedas}. Untuk pembangkitan aturan asosiasi dari Large itemset, harus memenuhi minimum support dan minimum confidence yang telah ditentukan. Confidence dari setiap aturan Page 12
yang dibangkitkan dapat dihitung dengan menggunakan rumus peluang : Confidence (A B) = P (B/A) = support count (A∩ B)/support count (A), dengan support count (A ∩ B) adalah jumlah transaksi yang berisi itemset A dan B, dan support count (A) adalah jumlah transaksi yang berisi itemset A. Berdasarkan rumus diatas, aturan asosiasi dapat dibangkitkan dengan langkah : support count(l)/support count(s) = minimum confidence. 4.2 Pembangkitan Association Rule Setelah proses penghitungan confidence selesai dilakukan maka kita dapat menghasilkan association rule berdasarkan data yang ada. Sebagai contoh akan dihasilkan association rule dari 2 itemset seperti yang diperlihatkan pada tabel 4.10 maka association rule yang dihasilkan adalah sebagai berikut. 1. Jika konsumen membeli Indomie Goreng Special juga akan membeli Indomie Kari Ayam , maka nilai support = 28,6% dan nilai confidence = 100% - item A dan B dibeli bersamaan sebesar 28,6% dari keseluruhan data transaksi yang dianalisis dan 100% dari semua konsumen yang membeli item A juga membeli item B. 2. Jika konsumen membeli Roti Bobo juga akan membeli Indomie Goreng Special, maka nilai support = 14,3% dan nilai confidence = 50% 3. Jika konsumen membeli Indomie Soto Medan juga akan membeli Indomie Goreng Special, maka nilai support = 14,3% dan nilai confidence = 50% 4. Jika konsumen membeli Indomie Goreng Special juga akan membeli Indomie Goreng Pedas, maka nilai support = 14,3% dan nilai confidence = 100% 2010 - Johan
5. Jika konsumen membeli Indomie Goreng Pedas juga akan membeli Indomie Goreng Special, maka nilai support = 14,3% dan nilai confidence = 66,7% 6. Jika konsumen membeli Indomie Kari Ayam juga akan membeli Indomie Goreng Pedas, maka nilai support = 14,3% dan nilai confidence = 66,7% 7. Jika konsumen membeli Indomie Kari Ayam juga akan membeli Indomie Soto Medan, maka nilai support = 14,3% dan nilai confidence = 50% 8. Jika konsumen membeli Roti Bobo juga akan membeli Indomie Kari Ayam, maka nilai support = 14,3% dan nilai confidence = 50% 9. Jika konsumen membeli Telor Ayam juga akan membeli Indomie Soto Medan, maka nilai support = 14,3% dan nilai confidence = 33,3%
10.Jika konsumen membeli Milo Sachet juga akan membeli Telor Ayam, maka nilai support = 14,3% dan nilai confidence = 50% Sebagai contoh akan dihasilkan association rule dari 3 itemset seperti yang diperlihatkan pada tabel 4.8 maka association rule yang dihasilkan adalah sebagai berikut. -
Jika Konsumen membeli Indomie Goreng Special juga akan membeli Indomie Kari Ayam dan juga akan membeli Indomie Goreng Pedas, maka nilai support = 28,6% dan nilai confidence = 100%
Artinya item A,B dan C dibeli bersamaan sebesar 28,6% dari keseluruhan data transaksi yang dianalisis dan 100% dari semua konsumen yang membeli item A dan item B juga membeli item C.
Page 13
V. KESIMPULAN DAN SARAN 5.1 Kesimpulan Berdasarkan penelitian yang penulis lakukan pada Toko Mini Market Lima Bintang Pekanbaru, maka penulis dapat menarik kesimpulan bahwa data transaksi penjualan toko mini market Lima Bintang Pekanbaru dapat ditambang dengan teknik association rule dan menghasilkan rule-rule yang bermanfaat bagi perusahaan. Atas analisis dan pembahasan yang penulis lakukan pada system analisa data market maka penulis dapat mengambil kesimpulan sebagai berikut: 1.
Berdasarkan uji coba Nilai Support dengan nilai support 0.25%, 0.5%.0.75% dan 1 % dapat diambil kesimpulan bahwa semakin kecil nilai support maka jumlah itemset yang dihasilkan semakin banyak, dan jumlah kaidah asosiasi yang dibentuk semakin banyak pula.
2. Data transaksi sebaiknya diambil pada periode-periode tertentu (misalnya awal tahun, pertengahan tahun, akhir tahun), sebab aturan-aturan yang dibangkitkan pola pembelian pelanggan dapat berbeda dari satu periode ke periode lainnya. Aturan-aturan asosiasi yang dihasilkan tidak selalu mengandung informasi yang penting (karena sudah umum diketahui), dan aturan yang berharga adalah yang berupa informasi “baru” yang dapat dimanfaatkan untuk meningkatkan penjualan. 5.2 Saran Dari hasil pembahasan ini, maka penulis dapat menyampaikan saran-saran sebagai berikut: 1. Agar perusahaan dapat memanfaatkan gudang data mereka untuk informasi dalam dunia bisnis, 2. Informasi yang ditemukan sebaiknya dapat diaplikasikan untuk aplikasi manajemen dan pengambilan keputusan.
2010 - Johan
DAFTAR PUSTAKA [1] Gregorius Satia Budhi; Felicia Soedjianto (2007) ”APLIKASI DATA MINING MARKET BASKET ANALYSIS PADA TABEL DATA ABSENSI ELEKTRONIK UNTUK MENDETEKSI KECURANGAN ABSENSI (CHECKLOCK) KARYAWAN DI PERUSAHAAN”. Jurnal Teknik Informatika, Fakultas Teknologi Industri, Universitas Kristen Petra, Surabaya. [2] Gregorius S. Budhi, Resmana Lim (2005) ”PENGGUNAAN METODE FUZZY cCOVERING UNTUK ANALISA MARKET BASKET PADA SUPERMARKET”. Jurnal Teknik Informatika, Universitas Kristen Petra, Surabaya. [3] Hwung Su J., Yang Lin W. 2004, CBW: An Efficient Algorithm for Frequent Itemset Mining. Proceedings of the 37th Hawaii International Conference on System Sciences. [4] Iko Pramudiono (2003), “ Pengantar Data Mining Menambang Permata Pengetahuan di Gunung Data”. Ilmu komputer.com1-4 [5] Marsela Yulita dan Veronica S. Moertini (2004) ”ANALISIS KERANJANG PASAR DENGAN ALGORITMA HASH-BASED PADA DATA TRANSAKSI PENJUALAN APOTEK”. Jurnal Ilmu Komputer, Universitas Katolik Parahyangan, Bandung. [6] Mewati Ayub (2007) ”Proses Data Mining dalam Sistem Pembelajaran Berbantuan Komputer”. Jurnal Sistem Informasi Vol. 2 No.1. [7] Philips Kokoh Prasetyo (2006) “Data Mining & Knowledge Discovery”. https://philips.wordpress.com/2006/06/22 /association-rule-mining. [8] Ravindra Patel, D. K. Swami and K. R. Pardasani (2006) “Lattice Based Algorithm for Incremental Mining of
Association Rules”. International Journal of Theoretical and Applied Computer Sciences. [9] Veronika S. Moertini (2002) “DATA MINING SEBAGAI SOLUSI BISNIS”. vol. 7 no.1. Page 14