TESIS
ALGORITMA APRIORI MODIFIKASI DENGAN TEKNIK COMBINATION REDUCTION DAN ITERATION LIMITATION PADA KERANJANG BELANJA
ADIE WAHYUDI OKTAVIA GAMA NIM 1291761013
PROGRAM MAGISTER PROGRAM STUDI MAGISTER TEKNIK ELEKTRO PROGRAM PASCASARJANA UNIVERSITAS UDAYANA DENPASAR 2016
TESIS
ALGORITMA APRIORI MODIFIKASI DENGAN TEKNIK COMBINATION REDUCTION DAN ITERATION LIMITATION PADA KERANJANG BELANJA
Tesis untuk Memperoleh Gelar Magister pada Program Magister, Program Studi Teknik Elektro, Program Pascasarjana Universitas Udayana
ADIE WAHYUDI OKTAVIA GAMA NIM 1291761013
PROGRAM MAGISTER PROGRAM STUDI MAGISTER TEKNIK ELEKTRO PROGRAM PASCASARJANA UNIVERSITAS UDAYANA DENPASAR 2016
ii
Lembar Pengesahan
TESIS INI TELAH DISETUJUI TANGGAL 22 APRIL 2016
Pembimbing I,
Pembimbing II,
Prof. Dr. IKG Darma Putra, S.Kom., MT. NIP. 197404241999031003
Dr. Eng. I Putu Agung Bayupati, S.T., M.T. NIP. 197504232003121002
Mengetahui
Ketua Program Magister Program Studi Teknik Elektro Program Pascasarjana Universitas Udayana
Direktur Program Pascasarjana Universitas Udayana
Prof. Ir. Ida Ayu Giriantari, M.EngSc., Ph.D NIP. 196512131991032001
Prof. Dr. dr. A.A. Raka Sudewi, Sp.S (K) NIP. 195902151985102001
iii
Tesis Ini Telah Diuji dan Dinilai Oleh Panitia Penguji pada Program Pascasarjana Universitas Udayana pada Tanggal 22 April 2016
Berdasarkan SK Rektor Universitas Udayana No.
: 1860/UN.14.4/HK/2016
Tanggal
: 21 April 2016
Panitia Penguji Tesis adalah Ketua
: Prof. Dr. I Ketut Gede Darma Putra, S.Kom., M.T.
Anggota
:
1.
Dr. Eng. I Putu Agung Bayupati, S.T., M.T.
2.
Dr. Ir. Made Sudarma, M.A.Sc.
3.
Ir. Linawati, M.Eng.Sc., Ph.D.
4.
Ni Made Ary Esta Dewi Wirastuti, S.T., M.Sc., Ph.D.
iv
SURAT PERNYATAAN BEBAS PLAGIAT
Saya yang bertandatangan di bawah ini : Nama
: Adie Wahyudi Oktavia Gama
NIM
: 1291761013
Program Studi
: Magister Teknik Elektro
Judul Tesis
: Algoritma
Apriori
Modifikasi
Dengan
Teknik
Combination Reduction Dan Iteration Limitation Pada Keranjang Belanja
Dengan ini menyatakan bahwa karya ilmiah Tesis ini bebas plagiat. Apabila dikemudian hari terbukti plagiat dalam karya ilmiah ini, maka saya bersedia menerima sanksi sesuai peraturan Mendiknas RI No. 17 Tahun 2010 dan Peraturan Perundang-undangan yang berlaku.
Denpasar, 22 April 2016 Yang membuat pernyataan
Adie Wahyudi Oktavia Gama
v
KATA PENGANTAR
Puji dan syukur kehadirat Ida Sang Hyang Widhi Wasa, oleh karena berkat Asung Kertha Wara NugrahaNya Penulis dapat menyelesaikan Tesis ini dengan judul “Algoritma Apriori Modifikasi dengan Teknik Combination Reduction dan Iteration Limitation pada Keranjang Belanja”. Penulis menyadari, bahwa tanpa berbekal ilmu pengetahuan, dorongan dan motivasi serta bantuan dari berbagai pihak, Tesis ini tidak akan terselesaikan dengan baik dan tepat pada waktunya. Oleh karena itu, disertai dengan kerendahan hati dan rasa hormat, Penulis mengucapkan terimakasih dan penghargaan yang setinggi-tingginya kepada : Rektor Universitas Udayana, Prof. Dr. dr. Ketut Suastika, Sp.PD. KEMD yang telah memberikan waktu dan fasilitas yang baik dalam mengikuti dan menyelesaikan pendidikan pada Program Studi Magister Teknik Elektro. Direktur Pascasarjana Universitas Udayana, Prof. Dr. dr. A.A. Raka Sudewi, Sp.S (K) serta Ketua Program Studi Teknik Elektro, Prof. Ir. Ida Ayu Giriantari,
M.EngSc., Ph.D yang juga telah memberikan ruang dan waktu kepada penulis selama mengikuti perkuliahan.
Pembimbing I, Prof. Dr. IKG Darma Putra, S.Kom., M.T. serta Pembimbing II, Dr.Eng. I Putu Agung Bayupati, S.T., M.T. yang dengan sepenuh hati membimbing dan selalu mengarahkan penulis sehingga tesis ini dapat terselesaikan dengan baik. Bapak dan Ibu dewan penguji proposal dan tesis yang membuat karya ini menjadi lebih sempurna serta seluruh Dosen Pengajar yang memberikan tambahan ilmu pengetahuan dan wawasan penulis. vi
Kedua Orang Tua yang telah mengasuh dan membesarkan penulis dan memberikan falsafah hidup hingga menjadi seperti sekarang ini, kakak tercinta, seluruh keluarga dan yang terkasih yang tidak henti-hentinya memberi dukungan penuh demi terselesaikannya tesis ini dengan baik. Teman-teman dan rekan-rekan seangkatan penulis yang bersama-sama menempuh perkuliahan yang selalu saling membantu dan penuh motivasi. Semua pihak yang telah membantu hingga Tesis ini dapat selesai, terutama kepada pemilik minimarket Toko Tujuh
Belas, Sesetan-Denpasar atas
kesediaannya memberikan data untuk ujicoba program. Penulis menyadari, bahwa Tesis ini masih jauh dari kesempurnaan oleh karena keterbatasan serta kemampuan yang Penulis miliki, Penulis mengharapkan kritik serta saran yang membangun dari berbagai pihak demi kesempurnaan Tesis ini.
Denpasar, 22 April 2016 Penulis,
Adie Wahyudi Oktavia Gama
vii
ABSTRAK
Analisis asosiasi digunakan untuk menemukan hubungan menarik antara suatu kombinasi item yang tersembunyi dalam transaksi. Hubungan ini direpresentasikan dalam bentuk aturan asosiasi. Aturan asosiasi berbentuk if antecedent then consequent. Algoritma apriori merupakan salah satu metode asosiasi yang menggunakan pendekatan iteratif dimana k-itemset digunakan untuk mengeksplorasi (k+1)-itemset. Calon (k+1)-itemset yang mengandung frekuensi subset yang jarang muncul tidak dipakai dalam menentukan aturan asosiasi. Implementasi algoritma apriori didahului dengan persiapan database transaksi serta penentuan batas minimum support dan confidence. Algoritma apriori akan menemukan kombinasi dengan cara proses iterasi yaitu scaning database yang berulang-ulang, memasangkan satu item dengan item lainnya dan mencatat jumlah kemunculan kombinasi dalam keseluruhan transaksi. Frequent itemset ditentukan dengan cara memilih kombinasi atau itemset yang nilai kemuculannya diatas atau sama dengan nilai minimum support dan kemudian menjadi calon aturan asosiasi. Persentase nilai support dan confidence dari masing-masing calon aturan asosiasi kemudian dihitung. Aturan asosiasi yang berlaku dipilih dari yang memenuhi syarat minimum support dan confidence. Aturan asosiasi yang dibentuk dari frequent itemset tersebut kemudian dapat dipakai sebagai pendukung keputusan dalam penjualan seperti mengatur penempatan barang, mengatur persediaan atau membuat promosi pemasaran dengan menerapkan diskon untuk kombinasi barang-barang tertentu yang sering muncul dalam transaksi. Apriori akan melambat terhadap database yang bertambah besar dalam menentukan aturan asosiasi. Teknik-teknik modifikasi digunakan untuk melakukan optimasi terhadap kinerja algoritma apriori sehingga mendapatkan frequent itemset dalam waktu yang singkat. Modifikasi pada penelitian ini menggunakan penggabungan teknik combination reduction dan iteration limitation. Hasil perbandingan algoritma apriori tanpa modifikasi dengan yang sudah dimodifikasi diujicoba dengan sample data dari 100 transaksi sampai dengan 500 transaksi terbukti lebih cepat mendapatkan frequent itemset dan kualitas aturan asosiasi yang dibentuk tetap terjaga. Kata kunci: Data Mining, Analisis Asosiasi, Algoritma Apriori, Frequent Itemset, Modifikasi Apriori, Combination Reduction, Iteration Limitation.
viii
ABSTRACT
Association analysis is used to find interesting relationship between hidden combination of items in the transaction. This relationship is represented in the form of association rules. Association rules is formed by “if antecedent then consequent”. Apriori algorithm is one of association method that uses an iterative approach where k-itemset used to explore (k+1)-itemset. Candidates of (k+1)itemset containing frequency subset that rarely appear is not used in determining association rules. Apriori algorithm implementation was preceded by the preparation of database transactions and determination of minimum support and confidence. Implementation of the apriori algorithm was preceded by the preparation of transactions database and determination of minimum support and confidence. Apriori algorithm scanned the database repeatedly, pair one item to another and record the number of occurrences in the overall transaction. Frequent itemset is determined by selecting a combination or itemset that the count value greater than or equal to the minimum support and then calculated the percentage value of support and confidence of each candidate. The association rules selected from which qualified the minimum support and confidence. Association rules formed from the frequent itemset then can be used as decision support in sales as it regulates the placement of goods, organize supplies or create marketing promotions by applying discounts to the combination of certain items that often appear in the transaction. Apriori performance to find association rule will become slower when used to analyze database that grows continuously in size. Modification techniques is then use to perform the optimization of the apriori algorithm performance to find frequent itemset more effectively. Modifications techniques used in this study is using the combination technique that use both combination reduction and iteration limitation. The comparison of the apriori algorithm without modification and with the modified algorithm with sample data from 100 transactions to 500 transactions proved to be faster for getting frequent itemset and the association rules quality is still maintained. Keyword : Data Mining, Asosiasi Analysis, Apriori Algorithm, Frequent Itemset, Apriori Modified, Combination Reduction, Iteration Limitation.
ix
DAFTAR ISI SAMPUL DEPAN ............................................................................................. SAMPUL DALAM ............................................................................................ LEMBAR PENGESAHAN ................................................................................ PENETAPAN PENGUJI .................................................................................... SURAT PERNYATAAN BEBAS PLAGIAT.................................................... KATA PENGANTAR ........................................................................................ ABSTRAK .......................................................................................................... ABSTRACT........................................................................................................ DAFTAR ISI ...................................................................................................... DAFTAR TABEL .............................................................................................. DAFTAR GAMBAR .......................................................................................... DAFTAR ISTILAH ............................................................................................
i ii iii iv v vi viii ix x xii xiii xiv
BAB I PENDAHULUAN.................................................................................. 1.1 Latar Belakang ....................................................................................... 1.2 Rumusan Masalah .................................................................................. 1.3 Tujuan Penelitian ................................................................................... 1.4 Manfaat Penelitian ................................................................................. 1.5 Ruang Lingkup Penelitian ...................................................................... 1.6 Keaslian Penelitian ................................................................................. BAB II TINJAUAN PUSTAKA ...................................................................... 2.1 State of The Art ...................................................................................... 2.2 Pengertian Data Mining ......................................................................... 2.3 Tahapan Data Mining.............................................................................. 2.4 Tugas Utama Data Mining...................................................................... 2.4.1 Deskripsi...................................................................................... 2.4.2 Prediksi ........................................................................................ 2.4.3 Etimasi......................................................................................... 2.4.4 Klasifikasi.................................................................................... 2.4.5 Clustering .................................................................................... 2.4.6 Asosiasi........................................................................................ 2.5 Aplikasi Data Mining ............................................................................. 2.5.1 Penerapan Data Mining pada CRM ............................................ 2.5.2 Data Mining dalam Kerangka CRM ........................................... 2.6 Metode Asosiasi ...................................................................................... 2.7 Algoritma Apriori.................................................................................... 2.7.1 Struktur Kombinasi ..................................................................... 2.7.2 Perhitungan Waktu Iterasi........................................................... BAB III METODOLOGI DAN PERANCANGAN ....................................... 3.1 Sumber Data............................................................................................
1 1 6 6 7 8 9 12 12 15 17 20 20 21 21 22 23 24 25 26 27 31 34 35 37 38 38
x
3.2 Tempat dan Waktu Penelitian ................................................................. 3.3 Rancangan Penelitian .............................................................................. 3.3.1 Gambaran Umum Sistem ............................................................ 3.3.1.1 Database Transaksi............................................................ 3.3.1.2 Algoritma Apriori .............................................................. 3.3.1.3 Penerapan Algoritma Apriori pada Transaki Penjualan .... 3.3.1.4 Aturan Asosiasi .................................................................. 3.3.1.5 Modifikasi Algoritma Apriori............................................ 3.3.2 Rancangan Database ................................................................... 3.3.3 Relasional Database.................................................................... 3.4 Sistematika Pengujian Kinerja Algoritma Apriori.................................. 3.5 Instrumen Penelitian ............................................................................... BAB IV HASIL DAN PEMBAHASAN .......................................................... 4.1 Identifikasi Awal ..................................................................................... 4.1.1 Menentukan Batas Minimum Support dan Minimum Confidence 4.1.2 Database Sampel Transaksi ........................................................ 4.2 Pembentukan Kombinasi Calon (K+1) Itemset....................................... 4.3 Menentukan Frequent (K+1) Itemset ...................................................... 4.4 Pembentukan Aturan Asosiasi ................................................................ 4.4.1 Analisa Pola Frekuensi Tinggi .................................................... 4.4.2 Menentukan Aturan Asosiasi ...................................................... 4.5 Modifikasi Apriori................................................................................... 4.5.1 Combination Reduction ............................................................... 4.5.1.1 Menentukan Item-Item yang digunakan Membangkitkan Kombinasi (1-itemset)........................................................ 4.5.1.2 Membangkitkan Kombinasi Itemset berdasarkan Frequent Itemset Sebelumnya ........................................................... 4.5.2 Iteration Limitation ..................................................................... 4.6 Hasil Perbandingan Algoritma Apriori dengan Apriori Modifikasi ....... 4.6.1 Pengukuran dari Segi Waktu ....................................................... 4.6.2 Pengukuran dari Segi Kualitas Aturan Asosiasi.......................... 4.6.2.1 Kualitas Aturan dengan Sampel 100 Transaksi ................. 4.6.2.2 Kualitas Aturan dengan Sampel 200 Transaksi ................. 4.6.2.3 Kualitas Aturan dengan Sampel 300 Transaksi ................. 4.6.2.4 Kualitas Aturan dengan Sampel 400 Transaksi ................. 4.6.2.5 Kualitas Aturan dengan Sampel 500 Transaksi ................. BAB V PENUTUP............................................................................................. 5.1 Simpulan ...................................................................................................... 5.2 Saran ............................................................................................................. DAFTAR PUSTAKA
xi
38 39 39 41 42 45 51 51 55 59 59 60 62 62 62 64 65 70 71 72 72 75 75 76 78 81 82 83 86 86 87 88 89 90 92 92 93
DAFTAR TABEL Tabel 2.1 Tabel 3.1 Tabel 3.2 Tabel 3.3 Tabel 3.4 Tabel 3.5 Tabel 3.6 Tabel 3.7 Tabel 3.8 Tabel 3.9 Tabel 3.10 Tabel 3.11 Tabel 3.12 Tabel 3.13 Tabel 3.14 Tabel 3.15 Tabel 3.16 Tabel 4.1 Tabel 4.2
Penelitian yang Sudah Dilakukan Sebelumnya................................ Data Transaksi Penjualan ................................................................. Penjabaran Transaksi dalam Bentuk 1-Itemset ................................ Calon Kandidat 2-Itemset yang Mungkin ........................................ Calon Kandidat 3-Itemset yang Mungkin ........................................ Calon Aturan Asosiasi dari F2 ......................................................... Calon Aturan Asosiasi dari F3 ......................................................... Aturan Asosiasi Final ....................................................................... Item yang Memenuhi Minimum Support.......................................... Calon Kandidat 3-Itemset yang Mungkin ........................................ Data Transaksi dengan Set Size untuk Pembatasan Transaksi ......... Struktur Database Master Data Barang ........................................... Contoh Data Master Data Barang .................................................... Struktur Database Transaksi Penjualan ........................................... Contoh Data Transaksi Penjualan .................................................... Struktur Database Detail Transaksi Penjualan ................................ Contoh Data Detail Transaksi Penjualan ......................................... Calon Aturan Asosiasi dari F2 ......................................................... Perbandingan Waktu Algoritma Apriori dengan Beberapa Sampel Transaksi ..........................................................................................
xii
14 45 46 47 48 49 50 50 52 53 55 56 56 57 57 58 58 71 84
DAFTAR GAMBAR Gambar 1.1 Gambar 2.1 Gambar 3.1 Gambar 3.2 Gambar 3.3 Gambar 4.1 Gambar 4.2 Gambar 4.3 Gambar 4.4 Gambar 4.5 Gambar 4.6 Gambar 4.7 Gambar 4.8 Gambar 4.9 Gambar 4.10 Gambar 4.11 Gambar 4.12 Gambar 4.13 Gambar 4.14 Gambar 4.15 Gambar 4.16 Gambar 4.17 Gambar 4.18
Fish Bone Menemukan Frequent Itemset Menggunakan Algoritma Apriori ......................................................................................... 10 Tahapan Data Mining.................................................................. 18 Gambaran Umum Menemukan Frequent Itemset Menggunakan Algoritma Apriori........................................................................ 40 Flowchart Algoritma Apriori ...................................................... 43 Relasional Database yang Dirancang untuk Data Mining Menggunakan Algoritma Apriori ................................................ 59 Tampilan Menentukan Nilai Minimum Support dan Minimum Confidence................................................................................... 63 Calon Kombinasi dengan 2-Itemset............................................. 67 Calon Kombinasi dengan 3-Itemset............................................. 68 Itemset dengan Nilai Kemunculan di Atas atau Sama dengan Minimum Support ........................................................................ 70 Pembentukan Aturan Asosiasi..................................................... 74 Seleksi Item-Item yang Memenuhi Minimal Support.................. 77 Frequent Itemset dari 2-Itemset untuk Membangkitkan Itemset Selanjutnya .................................................................................. 78 Hasil dari Penerapan Combination Reduction pada Calon 3Itemset.......................................................................................... 80 Jumlah Transaksi yang Sering Muncul Sebagai Pembatas Transaksi...................................................................................... 82 Grafik Perbandingan Waktu Algoritma Apriori ......................... 85 Aturan Asosiasi Algoritma Apriori tanpa Modifikasi Ujicoba Sampel 100 Transaksi.................................................................. 86 Aturan Asosiasi Algoritma Apriori dengan Modifikasi Ujicoba Sampel 100 Transaksi.................................................................. 87 Aturan Asosiasi Algoritma Apriori tanpa Modifikasi Ujicoba Sampel 200 Transaksi.................................................................. 87 Aturan Asosiasi Algoritma Apriori dengan Modifikasi Ujicoba Sampel 200 Transaksi.................................................................. 87 Aturan Asosiasi Algoritma Apriori tanpa Modifikasi Ujicoba Sampel 300 Transaksi.................................................................. 88 Aturan Asosiasi Algoritma Apriori dengan Modifikasi Ujicoba Sampel 300 Transaksi.................................................................. 88 Aturan Asosiasi Algoritma Apriori dengan Modifikasi Ujicoba Sampel 400 Transaksi.................................................................. 90 Aturan Asosiasi Algoritma Apriori dengan Modifikasi Ujicoba Sampel 500 Transaksi.................................................................. 91
xiii
DAFTAR ISTILAH Confidence
: Hubungan keterkaitan antar satu barang dengan barang lainnya dalam suatu transaksi. Combination Reduction : Pengurangan jumlah kombinasi yang dibangkitkan berdasarkan frequent itemset dan item yang memenuhi minimum support. Customer Relationship Management : Strategi bisnis yang berbasis hubungan baik terhadap pelanggan yang bertujuan memaksimalkan daya beli pelanggan. Data Mining : Proses menemukan pengetahuan baru dalam sejumlah data yang besar. Frequent Itemset : Kombinasi barang-barang yang sering muncul pada setiap transaksi. Modifikasi Algoritma : Melakukan perubahan baik seluruh atau sebagian dari algoritma yang tidak menyimpang dari konsep dasar algoritma tersebut dengan harapan memperoleh hasil yang lebih baik. Itemset : Kombinasi barang-barang dalam suatu transaksi. Iterasi : Proses yang digunakan secara berulangulang untuk menyelesaikan masalah tertentu. Iteration Limitation : Pembatasan iterasi sampai dengan nilai batas yang ditentukan. Mapping : Menempatkan atau memetakan data dari data sumber ke suatu data target yang ditentukan. Market Basket Analysis : Analisa keranjang belanja pelanggan tetang kebiasaan barang-barang yang dibeli. Missing Value : Nilai atau data yang hilang akibat kesalahan proses. Scanning Database : Melakukan analisa terhadap suatu simpanan data atau membaca simpanan data. Support : Jumlah kemunculan barang atau kombinasi barang pada sejumlah transaksi. xiv
Transaction Reduction
: Pengurangan jumlah transaksi dengan melakukan pemangkasan terhadap transaksi yang jumlah kombinasi item / barangnya kurang dari dengan nilai yang ditentukan.
xv