APLIKASI SEQUENTIAL PATTERN DISCOVERY USING EQUIVALENCE CLASSES (SPADE) PADA DATA TRANSAKSI PENJUALAN (Studi Kasus Produk Kecantikan dan Perawatan Tubuh)
ANISAH MUFIDATUSH SHALIHAH
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2016
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Aplikasi Sequential Pattern Discovery using Equivalence Classes (SPADE) pada Data Transaksi Penjualan (Studi Kasus Produk Kecantikan dan Perawatan Tubuh) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Juli 2016 Anisah Mufidatush Shalihah NIM G14120078
ABSTRAK ANISAH MUFIDATUSH SHALIHAH. Aplikasi Sequential Pattern Discovery using Equivalence Classes (SPADE) pada Data Transaksi Penjualan (Studi Kasus Produk Kecantikan dan Perawatan Tubuh). Dibimbing oleh AGUS MOHAMAD SOLEH dan LA ODE ABDUL RAHMAN. Setiap toko ritel memiliki data transaksi penjualan yang besar yang dihimpun setiap harinya. Data-data transaksi tersebut dapat diolah sehingga diperoleh informasi-informasi berguna, di antaranya pola belanja konsumen. Pola belanja konsumen dapat digunakan sebagai bahan untuk perancangan strategi pemasaran. Analisis yang biasa digunakan yaitu analisis asosiasi pada transaksi penjualan. Penelitian ini menggunakan metode pola sekuensial dengan algoritme SPADE βSequential PAttern Discovery using Equivalence classesβ. Data yang digunakan adalah data riil transaksi penjualan toko ritel produk kecantikan dan perawatan tubuh sejak 1 Januari-22 April 2015. Minimum support (batas minimum banyaknya pembeli) yang digunakan 0.01% dan minimum confidence (batas minimum peluang kejadian) sebesar 1%, kedua nilai tersebut ditentukan berdasarkan keadaan data. Berdasarkan hasil yang diperoleh, menunjukkan item yang paling diminati adalah sabun pencuci muka dan minyak penghilang jerawat berbahan kayu putih, grup yang paling diminati adalah grup make up bibir dan make up dasar. Pada data latih dan data uji yang relatif seimbang, semakin panjang periode penjualan dan semakin banyak transaksi maka semakin baik pula akurasi pembelian kembali yang diduga. Kata kunci: data transaksi, pola sekuensial, SPADE, strategi pemasaran.
ABSTRACT ANISAH MUFIDATUSH SHALIHAH. Application of Sequential Pattern Discovery using Equivalence Classes (SPADE) on Sales Transaction Data (Case Study for Beauty and Body Treatment Product). Supervised by AGUS MOHAMAD SOLEH and LA ODE ABDUL RAHMAN. Every retail store has a big transaction data which is collected everyday. It can be used to mining many informations, such as consumer shopping pattern. Consumer shopping pattern will be useful for marketing strategy making. The analysis that commonly used is association rule mining. In order to mine better pattern, this research use sequential pattern mining using SPADE algorithm. This research use real transaction data at beauty and treatment retail store from January 1st until April 22nd 2015. This research use 0.01% minimum support and 1% minimum confidence, both of these values were determined based on the data condition. Based on the results of this research, the items that costumer likely to buy are teatree facewash and teatree oil. The groups that costumer likely to buy are lip make up and base make up. For the training and test data that have a balance length of selling period and transactions, the longer selling period and the more transaction, the better prediction can be made. Keywords: marketing strategy, sequential pattern, SPADE, transactional data.
APLIKASI SEQUENTIAL PATTERN DISCOVERY USING EQUIVALENCE CLASSES (SPADE) PADA DATA TRANSAKSI PENJUALAN (Studi Kasus Produk Kecantikan dan Perawatan Tubuh)
ANISAH MUFIDATUSH SHALIHAH
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2016
PRAKATA Puji dan syukur penulis panjatkan kepada Allah SWT karena berkat rahmat dan karunia-Nya lah penulis dapat menyelesaikan karya ilmiah yang berjudul Aplikasi Sequential Pattern Discovery using Equivalence Classes (SPADE) pada Data Transaksi Penjualan (Studi Kasus Produk Kecantikan dan Perawatan Tubuh). Terselesaikannya penyusunan karya ilmiah ini tentunya tidak terlepas dari bantuan, motivasi, saran, dan kerja sama dari berbagai pihak. Oleh karena itu, penulis mengucapkan terima kasih kepada: 1. Bapak Agus Mohamad Soleh, SSi, MT selaku ketua komisi pembimbing atas kesempatan yang telah diberikan kepada penulis untuk dapat mengembangkan diri pada topik yang penulis teliti, serta masukan dan nasihat kepada penulis untuk dapat menghasilkan karya ilmiah yang baik. 2. Bapak La Ode Abdul Rahman, SSi, MSi selaku anggota komisi pembimbing yang sangat sabar dan teliti dalam memberikan masukan dan nasihat kepada penulis untuk dapat menghasilkan karya ilmiah yang baik. 3. Ibu Pika Silvianti, SSi, MSi selaku penguji yang sangat baik dan teliti dalam memberikan saran-saran untuk perbaikan. 4. Ibu, nenek, adik-adik serta seluruh keluarga atas segala motivasi, nasihat, dan doanya yang selalu ditujukan kepada penulis sehingga penulis selalu bersemangat untuk menyelesaikan karya ilmiah ini. 5. Seluruh Dosen Departemen Statistika IPB atas ilmunya yang tak ternilai sehingga penulis dapat menerapkan ilmu Statistika dengan baik dan benar. 6. Seluruh Staf Tata Usaha Departemen Statistika IPB yang selalu bersedia direpotkan sehingga segala proses administrasi berjalan dengan lancar. 7. Teman-teman bertukar pikiran dan berkeluh kesah (Adam Muhammad Ridwan, Lani Ulung Imuno, dan Muhammad Fauzan SN) atas bantuan, motivasi, dan doa mereka sehingga penulis dapat menyelesaikan karya ilmiah ini. 8. Teman-teman Statistika 49, GSB IPB (terutama departemen DBC), Ayumas IPB, dan Lorong 1 Asrama A2 (2012/2013) atas kesediaannya untuk saling bekerja sama, berbagi keceriaan, berbagi pengetahuan, dan berbagi pengalaman kepada penulis selama penulis menempuh pendidikan S1 di IPB. Semoga karya ilmiah ini bermanfaat.
Bogor, Juli 2016 Anisah Mufidatush Shalihah
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
DAFTAR ISTILAH
vii
PENDAHULUAN
1
METODE
2
Data
2
Tahapan Penelitian
2
HASIL DAN PEMBAHASAN
7
Gambaran Umum Data
7
Penentuan Pola Sekuensial
8
Pembentukan Aturan
14
SIMPULAN
17
DAFTAR PUSTAKA
18
LAMPIRAN
19
RIWAYAT HIDUP
24
DAFTAR TABEL 1 2 3 4 5
Rancangan pembagian periode penjualan untuk data latih dan data uji 6 Notasi keluaran cSPADE pada package βarulesSequencesβ di program R 7 Dasar pembagian grup dalam kategori 8 Beberapa aturan yang terbentuk (data per item) 15 Beberapa aturan yang terbentuk (data per grup) 16
DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9 10 11
Tahapan penelitian seperti pada proses KDD Distribusi item dalam tiap kategori Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.1) Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.2) Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.3) Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.1) Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.2) Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.3) Sekuens berukuran 1-3 dengan nilai support terbesar (T31) Sekuens berukuran 1-3 dengan nilai support terbesar (T32) Sekuens berukuran 1-3 dengan nilai support terbesar (T33)
2 7 9 10 10 11 12 12 13 14 14
DAFTAR LAMPIRAN 1 2 3 4
Daftar kategori dan grup serta jumlah item yang termasuk di dalamnya Daftar grup dan item Aturan dengan nilai support terbesar tiap kelompok panjang sekuens (data per item) Aturan dengan nilai support terbesar tiap kelompok panjang sekuens (data per grup)
19 20 21 22
DAFTAR ISTILAH 1 2
Antecedent Confidence
3 4 5
Consequent Frequent Lift
6 7
Prefix Sekuens
8
Support
: kejadian awal; pembelian sebelumnya : peluang consequent terjadi jika antecedent terjadi (pada suatu aturan); nilainya berkisar antara 0 sampai 1 : kejadian akhir; pembelian berikutnya : memenuhi kriteria : ukuran korelasi antecedent dan consequent; nilainya berkisar antara 0 sampai tak hingga : awalan suatu sekuens; (k-1)-sekuens pada k-sekuens : satu set kejadian berurutan; sekuens berukuran k dinotasikan sebagai k-sekuens : frekuensi relatif terjadinya suatu kejadian; nilainya berkisar antara 0 sampai 1
PENDAHULUAN Berkembangnya zaman menyebabkan kebutuhan masyarakat berkembang dan semakin banyak pula. Toko ritel pun banyak dibangun untuk memenuhi kebutuhan masyarakat. Menjamurnya toko ritel menimbulkan persaingan yang luar biasa bagi para pemilik ritel sehingga diperlukan suatu strategi pemasaran untuk meningkatkan penjualan maupun pelayanan terhadap konsumen. Setiap toko ritel memiliki data transaksi penjualan yang besar yang dihimpun setiap harinya. Namun belum banyak yang mengetahui apa yang bisa digali dari banyaknya himpunan data tersebut. Data-data tersebut dapat sangat berguna untuk menentukan strategi pemasaran apabila diolah dengan baik. Salah satu analisis yang sering digunakan yaitu dengan analisis asosiasi pada transaksi penjualan. Analisis asosiasi atau biasa disebut Association Rule Mining (ARM) adalah suatu metode deskriptif lain pada teknik penambangan data (data mining) yang dapat digunakan untuk menganalisis produk-produk yang dibeli pada sekali transaksi (Tuffery 2011). Algoritme yang biasa digunakan pada ARM dalam penelitian-penelitian sebelumnya adalah apriori (Han et al. 2011), karena merupakan algoritme yang paling sederhana dan mudah. Pada perkembangannya mulai digunakan analisis pola sekuensial atau Sequential Pattern Mining, yaitu suatu teknik menambang data yang membentuk pola dari suatu rentetan data yang berulang. Penelitian mengenai penentuan pola pada data transaksi menggunakan metode pola sekuensial sudah banyak dilakukan terutama dari ranah studi ilmu komputer. Seperti penelitian Sijabat (2011), menggunakan algoritme SPADE untuk menentukan pola sekuensial dari transaksi penjualan pada suatu toko ritel yang berhasil menemukan pola yang paling diminati yakni snack dan susu. Penelitian serupa juga dilakukan oleh Juliastio dan Gunawan (2015) untuk menentukan pola sekuensial dari transaksi penjualan suatu toko spare part dan aksesori komputer. Metode pola sekuensial untuk prediksi juga digunakan oleh Wright et al. (2015) mengenai prediksi obat yang diresepkan berikutnya bagi penderita diabetes. Penelitian Wright et al. (2015) menghasilkan kesimpulan bahwa metode pola sekuensial sangat berguna dalam mengidentifikasi hubungan sementara antar obatobatan dan hubungan sementara ini berguna untuk membuat prediksi mengenai obat yang diresepkan berikutnya. Tujuan dari penelitian ini adalah menemukan pola belanja konsumen sekaligus memprediksi item yang cenderung dibeli berikutnya selama periode penjualan yang ditentukan. Oleh karena itu metode pola sekuensial sangat cocok digunakan dalam penelitian ini. Algoritme yang digunakan dalam penelitian ini adalah Sequential PAttern Discovery using Equivalence classes (SPADE) karena SPADE merupakan algoritme yang efisien untuk menambang sekuens berulang (Zaki 2001).
2
METODE Data Data yang digunakan pada penelitian ini merupakan data riil transaksi penjualan suatu perusahaan toko ritel produk kecantikan dan perawatan tubuh yang direkam setiap harinya sejak tanggal 1 Januari sampai 22 April 2015. Tidak semua data akan digunakan dalam penelitian ini, namun hanya transaksi yang dilakukan oleh member toko ritel saja, sehingga terdapat 1216849 baris data. Peubah yang digunakan dalam analisis ialah EID (kode tanggal transaksi), SID (kode pembeli), dan ITEM (item yang dibeli). Format data berupa numerik untuk peubah EID dan SID, sedangkan untuk peubah ITEM berupa karakter. Pada penelitian ini penentuan pola sekuensial tidak hanya dilakukan pada data per item namun juga dilakukan pada data per grup untuk melihat potensi pemasaran di kedua tingkatan item. Tahapan Penelitian Tahapan penelitian yang akan dilakukan seperti pada proses knowledge discovery in database (KDD). KDD merupakan suatu proses memperoleh ilmu pengetahuan yang berasal dari sekumpulan data besar (Han et al. 2011). Tahapan penelitian seperti pada Gambar 1. Mulai
Penentuan pola sekuensial
Praproses data
Pola sekuensial belanja konsumen
Data target
Interprestasi hasil
Selesai Gambar 1 Tahapan penelitian seperti pada proses KDD 1. Praproses data a. Pembersihan data Data yang langsung berasal dari mesin kasir harus disesuaikan dengan format yang digunakan pada program analisis. Pada tahap ini peubah pada data sudah direduksi sehingga tersisa peubah SID, EID, ITEM. b. Pemilihan data Pemilihan data dilakukan berdasarkan kebutuhan untuk melakukan analisis. Pada penelitian ini analisis pola sekuensial dilakukan pada data member (anggota) agar sekaligus dapat diketahui
3 pembelian kembalinya. Kemudian item pada transaksi juga diseleksi. Item yang merupakan hadiah atau bonus dihilangkan dari daftar. c. Manajemen data Manajemen data diperlukan untuk menyiapkan data agar siap untuk dianalisis. Manajemen data yang dilakukan pada penelitian ini adalah membentuk data sedemikian rupa sehingga dapat langsung diproses oleh program, serta pembuatan kode untuk tiap item dan grup barang agar lebih efisien. 2. Penentuan pola sekuensial a. Association Rule Mining Pada kasus toko ritel dapat diketahui item apa saja yang berulang kali (sering) dibeli secara bersamaan. Association Rule Mining (ARM) atau dalam hal ini biasa disebut Market Basket Analysis merupakan suatu analisis, yang sesuai namanya digunakan untuk menghasilkan rule (aturan) frequent itemset. Frequent itemset dapat diartikan sebagai satu set item yang berulang dengan support lebih dari atau sama dengan minimum support. Penentuan aturan asosiasi yang baik dilihat berdasarkan nilai support, confidence, dan lift. Semakin tinggi nilainya semakin baik aturan tersebut, karena pada dasarnya nilai support, confidence, dan lift diperoleh dari nilai peluang. Misalkan A dan B adalah item yang dibeli, maka : i) Support Support merupakan peluang bersama item dalam sekuens. Support menunjukkan frekuensi atau banyaknya pembeli yang membeli item tersebut dalam semua transaksi. Minimum support adalah nilai support terkecil yang ditetapkan oleh peneliti untuk memotong daftar sekuens sehingga hanya sekuens yang sesuai kriteria peneliti saja yang digunakan. Support dinotasikan sebagai berikut: Support(π΄ β π΅) = π(π΄ β© π΅), artinya support asosiasi item A dan B adalah peluang A irisan B (Han et al. 2011). ii) Confidence Confidence menunjukkan peluang item pada lajur kiri dibeli bersamaan dengan item pada lajur kanan. Minimum confidence adalah nilai confidence terkecil yang ditetapkan oleh peneliti untuk memotong daftar aturan sehingga hanya aturan terbaik dan terkuat yang digunakan. Confidence dinotasikan sebagai berikut: Confidence(π΄ β π΅) = π(π΅|π΄), artinya confidence asosiasi item A dan B adalah peluang B syarat A (Han et al. 2011). iii) Lift Lift merupakan peluang rasio peluang bersama item dalam sekuens dengan peluang bersama item apabila item saling bebas. Lift menunjukkan kekuatan aturan yang dihasilkan. Apabila nilai lift lebih dari 1 artinya item pada lajur kanan dan kiri berkorelasi positif. Apabila nilai lift kurang dari 1 artinya item pada lajur kanan dan kiri berkorelasi negatif, dan jika bernilai 1 maka item pada lajur kanan dan kiri saling bebas (Zaki dan Meira 2014). Lift dinotasikan sebagai berikut:
4 π(π΄β©π΅)
Lift(π΄ β π΅) = π(π΄) π(π΅) =
π(π΅|π΄) π(π΅)
, artinya lift asosiasi item
A dan B adalah peluang B syarat A dibagi peluang B (Ledolter 2013). b. Algoritme Apriori Apriori adalah algoritme pada ARM yang paling sering digunakan karena sederhana dan mudah. Sesuai namanya apriori menggunakan prior itemset untuk menentukan aturan. Apriori memiliki beberapa kelebihan diantaranya cepat, meminimalkan pembacaan basis data, dan menggunakan format data vertikal. c. Sequential Pattern Mining Penentuan pola sekuensial menggunakan metode Sequential Pattern Mining (SPM). SPM pertama kali dikenalkan oleh Agrawal dan Srikant pada tahun 1995 berdasarkan studinya mengenai sekuens pembelian oleh pembeli. SPM adalah metode yang digunakan untuk mencari pola yang berulang dengan urutan waktu dalam suatu data besar. Istilah dan notasi yang digunakan pada penelitian ini adalah sebagai berikut (Han et al. 2011): i) πΌ = {πΌ1 , πΌ2 , β¦ , πΌπ } adalah semua itemset, itemset adalah suatu set yang berisi item. ii) π = β©π1 π2 β¦ ππ βͺ adalah sekuens, sekuens yaitu daftar kejadian yang berurutan dimana π1 terjadi sebelum π2 dan seterusnya. iii) (π₯1 π₯2 β¦ π₯π ) adalah sekumpulan item, π₯π adalah sebuah item. Jumlah item dalam sebuah sekuens disebut panjang sekuens, sekuens dengan panjang π disebut π-sekuens. iv) πΌ = β©π1 π2 β¦ ππ βͺ adalah subskuens dari suatu supersekuens. v) π½ = β©π1 π2 β¦ ππ βͺ adalah supersekuens dari πΌ , dimana πΌ adalah himpunan bagian dari π½. vi) π adalah basisdata sekuens, yaitu satu set ID sekuens (SID) dan sekuens (π ) dinotasikan sebagai β©ππΌπ·, π βͺ. vii) Support dari suatu sekuens πΌ dalam basisdata π adalah jumlah baris pada basisdata yang mengandung πΌ , dinotasikan sebagai supportS (πΌ) = |{β©ππΌπ·, π βͺ|(β©ππΌπ·, π βͺ β π)πΌβπ }|. viii) minimum support threshold (min_sup) adalah nilai batas yang ditentukan untuk membentuk pola sehingga sekuens πΌ frequent (berulang) dalam basisdata π jika supportS (πΌ) β₯ min_sup , sekuens yang frequent disebut pola sekuensial. d. Algoritme SPADE Penelitian ini menggunakan algoritme SPADE, yaitu algoritme dengan pendekatan seperti apriori pada analisis asosiasi. Algoritme SPADE menggunakan format data vertikal, kemudian akan menghasilkan sepasang set (SID, EID) yang membentuk ID list. Kelebihan penggunaan algoritme SPADE adalah dapat meminimalkan penggunaan I/O dengan pengurangan database scan, meminimalkan penggunaan komputasi dengan menggunakan skema pencarian yang lebih efisien, serta dapat menentukan support dari ksekuens dengan menggabungkan ID list dari dua atau lebih (k-1)subsekuensnya (Han et al. 2011). Berikut langkah-langkah mencari
5 sekuens yang frequent kemudian menentukan aturan menggunakan algoritme SPADE (Zaki 2001): i) Frequent 1-sekuens Sejatinya frequent 1-sekuens adalah daftar item yang frequent. Sekuens dikatakan frequent apabila nilai supportnya lebih dari minimum support. Menentukan frequent 1-sekuens adalah dengan memeriksa setiap itemset basisdata sekuens. Pasangan SID dan EID (ID list) dari setiap itemset disimpan terlebih dahulu, dilanjutkan memeriksa masing-masing ID list. Nilai support bertambah ketika ditemukan SID baru pada ID list. ii) Frequent 2-sekuens Frequent 2-sekuens diperoleh dengan menggabungkan tiaptiap frequent 1-sekuens. Kemudian pada penggabungan tersebut diperiksa masing-masing ID list dari frequent 1-sekuens. Pada SID yang sama, jika EID pada kedua sekuens sama maka hubungan kedua item dinotasikan dengan koma. Contohnya {A, B}, artinya item A dan B dibeli pada waktu yang sama atau 1 transaksi yang sama. Jika EID item A lebih besar daripada EID item B (dinotasikan sebagai {B βΆ A}) maka item B dibeli lebih dulu kemudian membeli item A. Jika EID item B lebih besar daripada EID item A (dinotasikan sebagai {A βΆ B}) maka item A dibeli lebih dulu kemudian membeli item B. Nilai support bertambah ketika ditemukan SID baru untuk EID yang sama pada ID list. iii) Frequent k-sekuens Penggabungan tiap-tiap (k-1)-sekuens dengan prefix yang sama akan membentuk k-sekuens. Prefix ialah item ke-1 sampai ke-(n-1) dalam n-sekuens. Terdapat tiga kemungkinan hasil pembentukan k-sekuens. Misalnya untuk membentuk 3-sekuens digabungkan 2-sekuens {A,B} dan {A,C} maka hasilnya adalah {A,B,C}. Jika menggabungkan 2-sekuens {A,B} dan {AβΆC} maka hasilnya adalah {{A,B} βΆ C}. Jika menggabungkan 2sekuens {AβΆB} dan {AβΆC} maka terdapat tiga kemungkinan hasilnya, yaitu: {AβΆ{B,C}}, {AβΆBβΆC}, atau {AβΆCβΆB}. Pencarian frequent k-sekuens dihentikan ketika tidak ada lagi (k1)-sekuens yang dapat digabungkan. iv) Rule Rule atau aturan dibentuk dari sekuens dengan panjang sekuens lebih dari 1. Pada rule atau aturan terdapat istilah antecedent (penyebab) dan consequent (akibat). 1-sekuens hanya terdiri dari 1 item oleh karena itu tidak dapat membentuk aturan. Lain halnya dengan 2-sekuens dengan elemen berbeda waktu, item pertama sebagai antecedent sedangkan item kedua sebagai consequent. Pada 3-sekuens, item pertama dan kedua sebagai antecedent sedangkan item ketiga sebagai consequent. Untuk ksekuens, item pertama sampai item ke-(k-1) sebagai antecedent dan item ke-k sebagai consequent. Jika ukuran kebaikan sekuens adalah support maka selain itu ukuran kebaikan untuk aturan adalah confidence.
6 e. Uji coba Pada penelitian ini dilakukan uji coba penentuan pola sekuensial dan pembentukan rule atau aturan dari data latih lalu dibandingkan dengan hasil dari data uji. Data dibagi menjadi data latih (Trainx.y) dan data uji (Testx.y). Indeks x menyatakan data per item (1) atau data per grup (2), sedangkan indeks y menyatakan periode penjualan yang digunakan. Rancangan pembagian data untuk data latih dan data uji disajikan dalam Tabel 1. Masing-masing indeks berlaku untuk 2 versi kode barang, yaitu berdasarkan item dan grup. Sehingga terdapat 6 set data latih dan 6 set data uji. Contoh penulisan notasi set data yang digunakan sebagai berikut: Train1.1 (set data latih untuk data per item dengan periode penjualan 1-15 Januari 2015), Train2.1 (set data latih untuk data per grup dengan periode penjualan 1-15 Januari 2015). Tabel 1 Rancangan pembagian periode penjualan untuk data latih dan data uji Notasi Trainx.1 Trainx.2 Trainx.3 Testx.1 Testx.2 Testx.3
Periode Penjualan 1-15 Januari 2015 1-31 Januari 2015 1 Januari-28 Februari 2015 16-31 Januari 2015 1-28 Februari 2015 1 Maret-22 April 2015
Keterangan 70393 transaksi 142162 transaksi 280683 transaksi 71769 transaksi 138521 transaksi 281904 transaksi
Uji coba ini untuk mengetahui karakteristik data latih yang paling baik untuk menduga pembelian berikutnya. Selain itu, melalui uji coba ini juga dapat diketahui item yang paling populer pada periode penjualan yang digunakan. Penentuan karakteristik data latih yang baik dilihat dari banyaknya aturan frequent (memiliki nilai confidence lebih dari sama dengan minimum confidence) berdasarkan data latih yang frequent pada data uji, semakin banyak maka semakin baik data latih tersebut. Karena meskipun terbukti, jika confidence pada data latih kurang dari minimum confidence yang digunakan maka banyaknya pembeli yang berperilaku seperti aturan tersebut kurang dari yang diharapkan oleh peneliti. 3. Interpretasi hasil Interprestasi hasil yaitu menerjemahkan keluaran program menjadi informasi yang bermakna. Keluaran program berupa pola sekuensial item-item yang dibeli konsumen (dalam hal ini member). Pola sekuensial hasil uji coba lalu dianalis kemudian dirancang strategi pemasaran, seperti penempatan rak item, diskon, dan sebagainya. Pada tahap ini pula dihasilkan simpulan penelitian. Praproses data, penentuan pola sekuensial dan pembuatan aturan pada penelitian ini menggunakan perangkat lunak R 3.1.2 dengan package βarulesSequencesβ. Pada Tabel 2 disajikan contoh notasi pada keluaran program.
7 Tabel 2 Notasi keluaran cSPADE pada package βarulesSequencesβ di program R Notasi <β―>
Ukuran 1 sekuens 1 elemen, < {β¦ } > panjang sekuens 1 1 elemen, < {β¦ , β¦ } > panjang sekuens 2 2 elemen, < {β¦ }, {β¦ } > panjang sekuens 2 < {β¦ } >β< {β¦ } > 1 aturan
Keterangan 1 set kejadian 1 objek terjadi dalam satu waktu 2 objek terjadi dalam waktu bersamaan 2 objek terjadi dalam waktu saling berurutan 2 kejadian terjadi berurutan
HASIL DAN PEMBAHASAN Gambaran Umum Data Terdapat sebanyak 562587 transaksi oleh 369335 member pada periode penjualan 1 Januari sampai 22 April 2015. Terdapat 1032 item dengan berbagai merek, ukuran, warna, dan aroma. Item-item tersebut terbagi dalam 9 kategori, yaitu kategori Aksesori (peralatan perawatan), Khusus (item edisi terbatas), Make up, Perawatan Kulit, Perawatan Rambut, Perawatan Tubuh, Wewangian Pria, Wewangian Rumah, dan Wewangian Wanita. Distribusi 1032 item ke dalam 9 grup dapat dilihat pada Gambar 2. Selain itu, item-item tersebut juga terbagi dalam 92 grup (dapat dilihat pada Lampiran 1). 2% 2%
9%
10% 10%
23%
31%
2% 11% Aksesori
Khusus
Make up
Perawatan Kulit
Perawatan Rambut
Perawatan Tubuh
Wewangian Pria
Wewangian Rumah Wewangian Wanita
Gambar 2 Distribusi item dalam tiap kategori Pembagian grup dalam kategori dapat dilihat pada Tabel 3. Grup dalam kategori Aksesori dibagi berdasarkan penggunaannya, seperti aksesori untuk mandi, perawatan kulit, dan sebagainya. Kategori dan grup pada penelitian ini berdasarkan kategori dan grup oleh toko dengan sedikit penyesuaian.
8 Tabel 3 Dasar pembagian grup dalam kategori Kategori
Dasar pembagian grup Penggunaan aksesori (alat mandi, alat-alat penunjang Aksesori perawatan, dan sebagainya) Khusus Reguler dan event Penggunaan make up (untuk mata, bibir, base, dan Make up sebagainya) Bahan kandungan dalam produk (Vitamin C, Vitamin E, Perawatan Kulit dan lain-lain) Perawatan Rambut Merek Bahan kandungan atau aroma dalam produk (Stroberi, Perawatan Tubuh Coklat, dan lain-lain) Wewangian Pria Aroma Wewangian Rumah Aroma Wewangian Wanita Aroma
Penentuan Pola Sekuensial Penentuan pola sekuensial pada penelitian ini menggunakan minimum support sebesar 0.0001 atau 0.01%. Data transaksi yang cukup besar, produk yang sangat beragam, serta pembelian kembali produk dalam jangka waktu yang tidak sebentar, support yang kecil secara subjektif dianggap wajar sehingga digunakan minimum support yang sangat kecil untuk menjaring pola sekuensial yang menarik namun memiliki support yang kecil. Pola berdasarkan data per item Pembentukan pola dengan data latih tanggal 1-15 Januari 2015 per item (Train1.1) dihasilkan sebanyak 4235 sekuens yang frequent, yaitu memiliki nilai support lebih dari atau sama dengan 0.0001. Terdapat 754 sekuens yang memiliki panjang sekuens (banyaknya item dalam sekuens) 1. Hal ini menunjukkan bahwa dari 1032 item, 754 di antaranya memiliki support lebih dari atau sama dengan 0.0001, artinya 754 item tersebut merupakan item yang diminati oleh pembeli pada periode penjualan 1-15 Januari 2015. Sekuens dengan panjang lebih dari 1 merupakan gabungan sekuens dengan panjang 1. Terdapat 3481 sekuens dengan panjang lebih 1. Support terbesar yang dihasilkan sebesar 3.77% yaitu item bubuk pembersih wajah berbahan daun perilla (I102). Hal ini menunjukkan bahwa item bubuk pembersih wajah berbahan daun perilla merupakan item paling diminati yang dibeli oleh 3.77% pembeli selama periode penjualan tersebut. Pada Gambar 3 dapat dilihat 5 sekuens berukuran 1, 5 sekuens berukuran 2, dan 5 sekuens berukuran 3 yang memiliki nilai support terbesar. Selain item bubuk pembersih wajah berbahan daun perilla (I102), terdapat item sabun pencuci wajah berbahan kayu putih (I41), minyak penghilang jerawat berbahan kayu putih (I37), wewangian wanita beraroma kasturi putih (I419), dan sabun pencuci wajah bervitamin E (I16). Berdasarkan Gambar 3 diketahui 0.38% pembeli pada periode penjualan 1-15 Januari 2015 lebih suka membeli item bubuk pembersih wajah berbahan daun perilla (I102) bersama item serum wajah merek βNβ (I99). Hal tersebut dapat
9 dikatakan sekitar 10% dari pembeli item bubuk pembersih wajah berbahan daun perilla (I102) membeli item bubuk pembersih wajah berbahan daun perilla bersama item serum wajah merek βNβ (I99). Sebanyak 13.26% pembeli item sabun pencuci muka berbahan kayu putih (I41) juga membeli item minyak penghilang jerawat berbahan kayu putih (I37). Selain itu terdapat sekuens yang mengandung item dalam satu grup seperti sekuens <{I124,I125}> dan <{I32,I33}> yang menunjukkan bahwa pembeli cenderung membeli suatu produk bersama produk yang lain dalam satu grup. Pola pembelian 3 item yang paling banyak dilakukan oleh pembeli pada periode ini didominasi oleh sekuens pembelian bersama item serum mata (I124) dan masker malam (I125) merek βDβ serta sekuens pembelian bersama item losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih. Hal ini dapat dilihat pada sekuens berukuran 3 yang mana prefixnya adalah kedua sekuens tersebut. Keterangan mengenai item lain dalam penelitian ini dapat dilihat pada Lampiran 2. 3.77
Support (%)
2.79
2.55 2.16
2.00
0.38 0.37 0.35 0.33 0.33
0.13 0.11 0.11 0.10 0.09
Gambar 3 Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.1) Pola yang terbentuk dengan data latih Train1.2 sebanyak 4656 sekuens yang frequent. Sama seperti pada data latih Train1.1, terdapat 754 sekuens yang memiliki panjang sekuens 1. Sekuens berukuran 1-3 dengan support terbesar pada periode penjualan 1-31 Januari 2015 dapat dilihat pada Gambar 4. Pada periode penjualan 16-31 Januari 2015 pembeli yang melakukan pembelian item krim penghalus wajah merek βDβ (I126) bersama bubuk pembersih wajah berbahan daun perilla (I102) meningkat sehingga supportnya meningkat pula dan masuk dalam 5 besar support terbesar pada periode penjualan 1-31 Januari 2016. Hal yang sama terjadi pada sekuens pembelian bersama item serum mata merek βDβ (I124) dengan bubuk pembersih wajah berbahan daun perilla (I102). Pola pembelian yang paling banyak dilakukan oleh pembeli pada periode ini didominasi oleh sekuens pembelian item bubuk pembersih wajah berbahan daun perilla (I102) bersama item serum wajah merek βNβ (I99) serta sekuens pembelian bersama item sabun pencuci muka berbahan kayu putih (I41) dan minyak penghilang jerawat berbahan kayu putih (I37). Pola pembelian 3 item didominasi oleh sekuens pembelian bersama item losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih. Berdasarkan hal-hal tersebut dapat dikatakan tren penjualan 2 minggu pertama dan
10 2 minggu kedua bulan Januari 2015 masih sama. Item-item dalam sekuens pada Gambar 4 didominasi oleh item dalam grup perawatan kulit berbahan kayu putih (T3) dan perawatan kulit bermerek βDβ (T12). Semua item pada Gambar 3 dan 4 merupakan item perawatan kulit (khususnya kulit wajah) kecuali item wewangian wanita beraroma kasturi putih (I419). 4.07 3.15 2.84
Support (%)
2.29 2.28
0.58 0.47 0.46 0.43 0.41
0.20 0.13 0.12 0.11 0.11
Gambar 4 Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.2) 3.41 2.97
Support (%)
2.71 2.46 2.36
0.47 0.38 0.37 0.34 0.34
0.13 0.13 0.12 0.10 0.10
Gambar 5 Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.3) Pembentukan pola dengan data latih Train1.3 menghasilkan 4732 sekuens dengan nilai support terbesar 3.41%. Terdapat 811 item dibeli oleh lebih dari 0.01% pembeli pada periode penjualan 1 Januari-28 Februari 2015. Sekuens berukuran 1 dan 2 dengan nilai support terbesar dapat dilihat pada Gambar 5. Gambar 5 dan berdasarkan hasil sekuens data latih sebelumnya terlihat beberapa perbedaan, seperti item yang paling banyak diminati bukan lagi bubuk pembersih wajah berbahan daun perilla (I102) namun sabun pencuci wajah berbahan kayu putih (I41). Pada pola pembelian dengan item lebih dari 1, sekuens pembelian bersama
11 item sabun pencuci muka berbahan kayu putih (I41) dan minyak penghilang jerawat (I37) serta item losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih masih mendominasi. Sekuens pada Gambar 5 didominasi oleh itemitem dalam grup perawatan kulit berbahan kayu putih (T3). Tren pola pembelian mulai berubah memasuki bulan Februari. Pola berdasarkan data per grup Pembentukan pola juga dilakukan pada data per grup. Menggunakan data latih Train2.1, dihasilkan sebanyak 5323 sekuens yang frequent. Terdapat 75 sekuens yang memiliki panjang sekuens 1, artinya item-item dalam 75 grup tersebut lebih diminati oleh pembeli. Sekuens frequent yang dihasilkan dengan data per grup lebih banyak daripada dengan data per item. Hal ini dapat terjadi karena objek unik yang dianalisis pada data per grup lebih sedikit daripada pada data per item, sehingga support yang dihasilkan lebih besar dan menyebabkan lebih banyak sekuens yang frequent dengan minimal support yang sama, yaitu 0.0001. Berdasarkan Gambar 6, sebanyak 10.58% pembeli membeli item dalam grup make up bibir (T61). Lebih dari 7.33% pembeli membeli item dalam grup make up dasar (T62), perawatan kulit berbahan kayu putih (T3), wewangian wanita beraroma kasturi putih (T44), maupun item edisi khusus Natal (T43). Lebih dari 10% pembeli item dalam grup make up bibir turut membeli item dalam grup make up dasar, make up mata (T65), maupun edisi khusus Natal dalam satu transaksi. Lebih dari 9.67% pembeli item dalam grup make up dasar membeli item dalam grup make up mata (T65) maupun item dalam grup aksesori make up (T58) dalam transaksi yang sama. Selain itu, sekuens berukuran 3 dengan nilai support terbesar terdiri dari grup make up bibir (T61), make up dasar (T62), make up mata (T65), dan grup item edisi khusus Natal (T43) sehingga dapat dikatakan pola pembelian pada periode penjualan 1-15 Januari 2015 didominasi keempat grup tersebut. 10.58 9.92 9.51
Support (%)
8.16
7.33
1.50 1.43 1.06 1.06 0.96
0.38 0.33 0.32 0.29 0.26
Gambar 6 Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.1) Gambar 7 menunjukkan sekuens berukuran 1-3 dengan support terbesar yang dihasilkan menggunakan data latih Train2.2. Terdapat 6927 sekuens dan 77 di antaranya merupakan sekuens berukuran 1. Tren pada 2 minggu kedua Januari nampaknya sedikit berubah, grup make up dasar lebih diminati oleh mayoritas
12 pembeli (11.39% dari seluruh pembeli). Pada periode penjualan ini pula lebih banyak pembeli item dalam grup perawatan kulit bervitamin E (T2) daripada item dalam grup edisi khusus Natal (T43). Meskipun item dalam grup edisi khusus reguler (T22) maupun Natal tidak masuk dalam 5 besar yang paling diminati, kombinasi item dalam kedua grup tersebut dengan grup lain memiliki nilai support yang cukup besar, seperti 1.36% dari seluruh pembeli membeli item dalam grup edisi khusus Natal (T43) bersama dengan item dalam grup perawatan kulit bermerek βDβ (T12), dan 1.16% dari seluruh pembeli membeli item dalam grup edisi khusus reguler (T22) bersama dengan item dalam grup make up dasar (T62). Pola pembelian berdasarkan grup pada periode penjualan 1-31 Januari 2015 didominasi pembelian bersama dengan item dalam grup make up bibir (T61), make up dasar (T62), dan grup item edisi khusus Natal (T43). 11.39 11.11 9.80 8.59
Support (%)
7.75
1.68 1.56 1.36 1.19 1.16
0.42 0.36 0.34 0.31 0.31
Gambar 7 Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.2) 11.85 11.60
Support (%)
9.82
9.03
8.20
1.67 1.67 1.28 1.17 1.06
0.42 0.33 0.31 0.28 0.25
Gambar 8 Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.3)
13 Item dalam grup make up bibir masih menjadi tren selama periode penjualan Januari-Februari 2015. Sebanyak 7865 sekuens terbentuk pada pembentukan pola dengan data latih Train2.3. Terdapat 79 grup yang peminatnya lebih dari 0.01% dari seluruh pembeli pada periode penjualan tersebut. Selain grup make up bibir, grup make up dasar, perawatan kulit berbahan kayu putih, dan wewangian wanita beraroma kasturi putih selalu menjadi grup dengan pembeli terbanyak pada setiap periode penjualan yang digunakan. Pada Gambar 8 terlihat 2 grup yang paling banyak dibeli bersamaan merupakan kombinasi dari grup make up bibir, make up dasar, make up mata, dan aksesori make up dengan nilai support lebih dari 1%. Begitu pula pada sekuens berukuran 3, keempat grup tersebut masih mendominasi. Pola pembelian pada periode Januari-Februari 2015 dapat dikatakan merupakan kombinasi dari 4 grup berkategori make up, yaitu grup make up bibir, make up dasar, make up mata, dan aksesori make up. Terdapat perbedaan tren pola pembelian bulan Januari dan Februari 2015 ditandai dengan tidak masuknya grup item edisi khusus Natal (T43) maupun grup item edisi khusus reguler (T22) dalam sekuens pada Gambar 8. Pola berdasarkan data per item (dalam grup T3) Pencarian pola berdasarkan item dalam grup T3 dilandasi kesimpulan bahwa setiap periode penjualan didominasi item perawatan kulit berbahan kayu putih (T3), untuk dapat melihat pola item dalam grup. Terdapat 19 item di dalam grup perawatan kulit berbahan kayu putih (T3). Data per item dalam grup T3 pada periode penjualan y dinotasikan sebagai T3y dengan nilai y adalah 1, 2, dan 3. Gambar 9 menunjukkan sekuens berukuran 1-3 dengan nilai support terbesar pada periode penjualan 1-15 Januari 2015. Item-item yang paling banyak diminati dari 19 item dalam grup tersebut adalah item sabun pencuci muka (I41) dengan sekitar 29% pembeli, 26.77% pembeli membeli minyak penghilang jerawat (I37), dan 12.09% pembeli losion pembersih (I32). Pembeli banyak membeli kombinasi ketiga item bersama-sama, namun item sabun pencuci muka (I41) dan minyak penghilang jerawat (I37) lebih banyak dibeli satuan atau bersama item dari grup lain. <{I31,I32,I33}>
0.95
<{I32,I33,I37}>
1.10
<{I41,I32,I33}>
1.11
<{I41,I32}> <{I32,I33}> <{I41,I37}> <{I32}>
2.88 3.52 3.93 12.09
<{I37}>
26.77
<{I41}>
29.30
Support (%) Gambar 9 Sekuens berukuran 1-3 dengan nilai support terbesar (T31)
14
<{I41,I32,I37}>
1.01
<{I41,I32,I33}>
1.17
<{I32,I33,I37}>
1.23
<{I41,I31}>
2.86
<{I32,I33}>
3.55
<{I41,I37}>
4.41
<{I32}>
12.01
<{I37}>
28.97
<{I41}>
32.14
Support (%) Gambar 10 Sekuens berukuran 1-3 dengan nilai support terbesar (T32) Gambar 10 menunjukkan sekuens berukuran 1-3 dengan nilai support terbesar pada periode penjualan 1-31 Januari 2015, dan Gambar 11 menunjukkan sekuens berukuran 1-3 dengan nilai support terbesar pada periode penjualan Januari-Februari 2015. Pola sekuensial yang paling banyak terjadi pada ketiga periode penjualan secara umum sama. Item-item yang paling banyak diminati pun masih sama, yaitu item sabun pencuci muka (I41), minyak penghilang jerawat (I37), dan losion pembersih (I32). Item sabun pencuci muka (I41) paling banyak dibeli bersama item minyak penghilang jerawat (I37). <{I31,I32,I33}>
1.05
<{I41,I32,I33}>
1.23
<{I32,I33,I37}>
1.37
<{I33,I37}> <{I32,I33}> <{I41,I37}> <{I32}>
3.10 3.83 4.76 12.81
<{I37}>
30.30
<{I41}>
34.70
Support (%) Gambar 11 Sekuens berukuran 1-3 dengan nilai support terbesar (T33) Pembentukan Aturan Setelah penentuan pola sekuensial lalu dibentuk aturan yang dapat menunjukkan pola pembelian dari satu waktu ke waktu berikutnya. Aturan terdiri dari antecedent dan consequent. Misal antecedent adalah suatu kejadian, maka
15 consequent dapat diartikan suatu kejadian berikutnya jika antecedent terjadi. Aturan dibentuk dari pola sekuensial yang memiliki panjang lebih dari 1. Pada pembentukan aturan ini digunakan minimum confidence sebesar 0.01 atau 1%. Confidence adalah peluang terjadinya consequent jika antecedent terjadi. Confidence dapat pula diartikan sebagai nilai rasio banyaknya pembeli yang berperilaku sesuai aturan dengan banyaknya pembeli yang membeli barang sesuai antecedent. Pembentukan aturan dengan data latih menghasilkan 33-1286 aturan. Aturan yang dihasilkan dengan data per grup lebih banyak karena sekuens yang dihasilkan dengan data per grup pun lebih banyak. Beberapa aturan dengan nilai support terbesar dapat dilihat pada Lampiran 3 dan 4. Aturan dengan nilai support yang besar menunjukkan bahwa banyak pembeli berperilaku sesuai aturan tersebut. Pada penelitian ini aturan dengan consequent yang sama digabung membentuk 1 aturan saja, nilai supportnya merupakan penjumlahan support begitu pula nilai confidencenya merupakan penjumlahan confidence. Aturan berdasarkan data per item Pada Tabel 4 disajikan aturan dengan nilai support terbesar yang memiliki antecedent sekuens berukuran lebih dari 1, dalam hal ini sekuens dapat berupa pembelian lebih dari 1 produk atau pembelian lebih dari 1 waktu. Aturan seperti itu cenderung memiliki nilai confidence yang lebih besar atau lebih akurat. Terlihat pada Tabel 4 nilai confidence data uji cenderung lebih besar menandakan aturan tersebut terbukti dengan baik. Berdasarkan contoh aturan yang dibentuk pula terlihat dominasi item dalam grup perawatan kulit berbahan kayu putih (T3). Itemitem yang terdapat pada Tabel 4 yaitu toner (I31), losion pembersih (I32), losion penghilang noda (I33), minyak penghilang jerawat (I37), dan sabun pencuci muka (I41) berbahan kayu putih. Item-item tersebut memang item yang sering muncul seperti dijelaskan pada penentuan pola item dalam grup perawatan kulit berbahan kayu putih (T3) sebelumnya. Tabel 4 Beberapa aturan yang terbentuk (data per item) Periode Antecedent Consequent Penjualan 1 I32,I41 I37 2 I32,I33 I37 I41 I31,I32,I33 I37 3 I32,I33 I37 I41 I31 I31,I32,I33 I37
Support 0.00011 0.00029 0.00011 0.00066
0.00013
Confidence Lift Train Test 0.01447 0.03922 1.51959 0.06594 0.09211 1.78487 1.02366 0.01164 0.03883 4.14244 0.17548 0.18258 2.62653 1.51759 4.12351 0.12174 0.12778 4.09282
Berdasarkan Tabel 4 dapat disimpulkan tren pola pembelian kembali pada bulan Januari dan Februari 2015 sama. Pola tersebut yaitu pembelian minyak penghilang jerawat (I37) atau sabun pencuci muka (I41) berbahan kayu putih setelah pada kedatangan sebelumnya membeli losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih, serta pembelian minyak penghilang
16 jerawat berbahan kayu putih (I37) setelah pada kedatangan sebelumnya membeli toner (I31), losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih. Lift menunjukkan ukuran nilai korelasi antar pembelian pada 2 waktu yang berurutan. Contohnya nilai lift aturan pembelian minyak penghilang jerawat berbahan kayu putih (I37) setelah membeli losion pembersih (I32) dan sabun pencuci muka (I41) berbahan kayu putih pada periode penjualan 1-15 Januari 2015 ialah 1.51959. Nilai tersebut berarti kedua pembelian tersebut berkorelasi positif atau dapat pula dikatakan kejadian bersama kedua pembelian lebih banyak daripada kejadian yang diharapkan (dalam hal ini diartikan sebagai kejadian bersama dengan kedua pembelian saling bebas). Nilai lift juga mengindikasikan kemampuan aturan untuk memprediksi pembelian berikutnya. Pada Tabel 4 semua lift bernilai lebih dari 1 sehingga aturan-aturan tersebut dapat dikatakan mampu untuk memprediksi pembelian berikutnya. Aturan berdasarkan data per grup Sama halnya dengan Tabel 4 yang menyajikan aturan dengan nilai support terbesar yang memiliki antecedent sekuens berukuran lebih dari 1, Tabel 5 pun menyajikan hal serupa berdasarkan data per grup. Tabel 5 Beberapa aturan yang terbentuk (data per grup) Periode Antecedent Penjualan 1 T61,T65 2
3
0.00038
Confidence Train Test 0.02643 0.03058
0.00151
0.09004 0.09506
0.00012 0.00090
0.03827 0.00000 0.12796 0.21386
0.00062
0.14759 0.15566
Consequent Support
T62 T65 T61,T62 T61 T65 T62 T58 T3 T12 T43,T12,T14 T14 T3=>T3 T3 T62 T61 T58 T23 T61,T62,T65 T65 T62 T61 T57 T58
Lift 0.14921 0.17783 0.17153 0.23696 0.13387 0.36029 0.13121 0.19203 0.88872 0.63879 0.15989 0.14575 0.30327 0.17936 0.46624 0.28572 0.22560 0.52894 0.52901
17 Seperti telah disebutkan di atas bahwa aturan dengan antecedent berupa sekuens yang berukuran lebih dari 1 cenderung memiliki nilai confidence yang lebih besar atau lebih akurat. Namun pada Tabel 5 terdapat 1 aturan yang nilai confidence pada data latihnya cukup besar namun nilai confidence pada data uji justru nol, atau tidak ada pembeli yang melakukan pembelian sesuai aturan tersebut, yaitu aturan ke-3 yang menunjukkan pembelian item dalam grup perawatan kulit berbahan daun perilla (T14) setelah pembelian item dalam grup edisi khusus Natal bersama (T43) dengan item dalam grup perawatan kulit merek βDβ (T12) dan grup perawatan kulit berbahan daun perilla (T14). Hal tersebut dapat terjadi apabila terjadi perubahan tren pada periode penjualan data uji, atau pembeli tersebut belum melakukan pembelian kembali. Pada Tabel 5 terdapat aturan yang menarik yaitu pembelian kembali hingga 3 waktu pembelian. Aturan tersebut diawali dengan pembelian ulang item dalam grup perawatan kulit berbahan kayu putih (T3) kemudian pada kedatangan berikutnya membeli lagi item dalam grup perawatan kulit berbahan kayu putih (T3). Berdasarkan Tabel 5 diketahui banyak pembeli yang membeli produk make up bibir (T61) bersama dengan produk make up dasar (T62) dan pada kedatangan berikutnya berpeluang besar membeli ulang produk dalam grup tersebut maupun membeli produk make up jenis lainnya seperti make up mata (T65) dan aksesori (T58). Nampak pula pada Tabel 5 semua lift bernilai kurang dari 1, sehingga dapat diartikan bahwa semua aturan pada Tabel 5 berkolerasi negatif. Uji coba pada penelitian ini juga bertujuan untuk mengetahui karakteristik data latih yang baik untuk menduga pola dengan menghitung banyaknya aturan yang terbukti dan frequent pada data uji. Sehingga meskipun aturan tersebut terbukti namun nilai confidencenya kurang dari minimum confidence maka aturan tersebut dianggap gagal terprediksi karena jumlah kejadian tidak sesuai yang diharapkan. Berdasarkan uji coba yang dilakukan dengan periode penjualan dan jumlah transaksi untuk masing-masing data latih dan data uji yang relatif sama, diketahui banyaknya aturan yang terbukti dan frequent pada data uji untuk data periode 1-15 Januari 2015 ialah 66.67% (data per item) dan 77.27% (data per grup). Sedangkan untuk periode 1-31 Januari 2015 adalah 74.36% (data per item) dan 92.59% (data per grup), serta untuk periode 1 Januari-28 Februari 2015 adalah 90% (data per item) dan 98.25% (data per grup). Nilai akurasi pada data per grup yang lebih besar, menunjukkan bahwa objek yang lebih sedikit memiliki akurasi lebih tinggi dengan minimum confidence yang sama. Dapat disimpulkan semakin panjang periode dan semakin banyak transaksi yang terjadi maka semakin banyak aturan yang dapat dibentuk. Semakin banyak aturan yang terbentuk pada data latih, semakin banyak pula aturan yang terbukti dan frequent pada data uji.
SIMPULAN Item yang paling diminati dengan nilai support lebih dari 2% pada semua periode penjualan dari toko ritel tersebut adalah produk sabun pencuci muka (I41) dan minyak penghilang jerawat berbahan kayu putih (I37) yang ternyata juga banyak dibeli secara bersamaan oleh sekitar 0.4% pembeli. Tren pembelian mulai berubah memasuki bulan Februari, namun tren pembelian kembali masih sama
18 yaitu pembelian minyak penghilang jerawat (I37) atau sabun pencuci muka (I41) berbahan kayu putih setelah pada kedatangan sebelumnya membeli losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih, serta pembelian minyak penghilang jerawat berbahan kayu putih (I37) setelah pada kedatangan sebelumnya membeli toner (I31), losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih. Sedangkan grup yang paling diminati pada semua periode penjualan adalah grup make up bibir (T61) dan make up dasar (T62), keduanya berpeluang paling besar ditemui dalam satu transaksi. Tren pola berdasarkan data per grup juga mulai mengalami perubahan memasuki bulan Januari, namun secara keseluruhan masih didominasi grup dari kategori make up. Tren pembelian kembali berdasarkan grup yaitu banyak pembeli yang membeli produk make up bibir (T61) bersama dengan produk make up dasar (T62) dan pada kedatangan berikutnya berpeluang besar membeli ulang produk dalam grup tersebut maupun membeli produk make up jenis lainnya seperti make up mata (T65) dan aksesori (T58). Karakteristik data yang memiliki akurasi pendugaan pembelian berikutnya yang baik adalah semakin panjang periode penjualan dan semakin banyak transaksi yang terjadi. Namun hal tersebut tentu saja disesuaikan sesuai kebutuhan penelitian.
DAFTAR PUSTAKA Han J, Kamber M, Pei J. 2011. Data Mining: Concepts and Techniques, 3rd Ed. San Francisco (US): Morgan Kaufmann. Juliastio R, Gunawan. 2015. Sequential Pattern Mining dengan SPADE untuk Prediksi Pembelian Spare Part dan Aksesori Komputer pada Kedatangan Kembali Konsumen. Seminar Nasional Inovasi dalam Desain dan Teknologi β IdeaTech. 314:325. Ledolter J. 2013. Data Mining and Business Analytics with R. West Sussex (GB): J Wiley. Sijabat R. 2011. Penentuan Pola Sekuensial Data Transaksi Pembelian Menggunakan Algoritme SPADE [skripsi]. Bogor (ID): Institut Pertanian Bogor. Tuffery S. 2011. Data Mining and Statistics for Decision Making 2nd Edition. West Sussex (GB): J Wiley. Wright AP, Wright AT, McCoy AB, Sittig DF. 2015. The use of sequential pattern mining to predict next prescribed medications. Journal of Biomedical Informatics. 53:73-80. Zaki, MJ. 2001. SPADE: An efficient algorithm for mining frequent sequences. Machine Learning. 42:31-60. Zaki MJ, Meira W. 2014. Data Mining and Analysis: Fundamental Concepts and Algorithms. New York (US): Cambridge Univ Pr.
19 Lampiran 1 Daftar kategori dan grup serta jumlah item yang termasuk di dalamnya Kategori
Grup
Aksesori
T87 T88 T89 T90 T91 T92 T22 T43 T58 T59 T60 T61 T62 T63 T64 T65 T66 T67 T68 T1 T2 T3 T6 T7 T8 T9 T10 T11 T12 T13 T14 T15 T76 T77 T78 T79 T69 T70 T71 T72 T73 T74 T75 T80 T81 T82
Khusus Make up
Perawatan Kulit
Perawatan Rambut
Wewangian Pria
Wewangian Rumah
Item (jumlah) 6 49 10 21 13 3 42 63 25 13 3 89 39 5 13 81 30 17 6 8 21 19 5 14 9 1 1 7 5 1 16 8 1 4 2 14 2 2 1 4 8 3 3 8 3 4
Kategori
Grup
Perawatan Tubuh
T4 T5 T16 T17 T18 T19 T20 T21 T23 T24 T25 T26 T27 T28 T29 T30 T31 T32 T33 T34 T35 T36 T37 T38 T39 T40 T41 T42 T83 T84 T85 T86 T44 T45 T46 T47 T48 T49 T50 T51 T52 T53 T54 T55 T56 T57
Wewangian Wanita
Item (jumlah) 10 4 10 16 7 9 2 15 18 12 14 13 14 8 9 2 9 10 6 5 6 4 1 1 3 4 4 5 4 3 2 5 17 2 10 1 5 1 11 6 8 7 5 7 6 9
20 Lampiran 2 Daftar grup dan item Item I16
I20
Keterangan Sabun Vitamin E pencuci muka Toner Vitamin E
Grup T1
Keterangan Perawatan Vitamin C Kulit
Grup T44
Keterangan Wewangian Kasturi Wanita putih
T2
Perawatan Kulit
Vitamin E
T46
Wewangian Wanita
Sakura Jepang
I27
Pelembab wajah
Vitamin E
T3
Perawatan Kulit
Kayu putih
T50
Wewangian Wanita
I30
Busa pembersih wajah Toner
Kayu putih
T4
Perawatan Tubuh
Merek "B"
T56
Wewangian Wanita
Kayu putih
T6
Perawatan Kulit
Merek "NC"
T57
Wewangian Wanita
Kasturi putih (khusus) Teratai air Fijian Kasturi merah
Losion pembersih wajah Losion penghilang noda Minyak penghilang jerawat Sabun pencuci muka Pembersih wajah Daily Scrub BB Cream Light
Kayu putih
T7
Perawatan Kulit
Lidah buaya
T58
Make up
Aksesori
Kayu putih
T8
Perawatan Kulit
Rumput laut
T61
Make up
Bibir
Kayu putih
T11
Perawatan Kulit
Merek "N"
T62
Make up
Base
Kayu putih
T12
Perawatan Kulit
Merek "D"
T64
Make up
Pipi
Kayu putih
T14
Make up
Mata
T15
T66
Make up
Kuku
Kayu putih
T16
Daun Perilla Buah delima Zaitun
T65
Kayu putih
Perawatan Kulit Perawatan Kulit Perawatan Tubuh
T79
Perawatan Rambut
Merek "R"
Serum wajah Bubuk pembersih wajah Serum mata Masker malam
Merek "D"
T17
Shea
T88
Aksesori
Bath & Body
Daun perilla
T21
Perawatan Tubuh Perawatan Tubuh
Merek "D"
T22
Khusus
Regular
Merek "D"
T23
Perawatan Tubuh
Strawberry
Krim penghalus wajah Wewangian wanita
Merek "D"
T27
Perawatan Tubuh
Kelor
Kasturi putih
T30
Perawatan Tubuh
Panili
BB Cream shade 02 BB Cream shade 01
Merek "A"
T31
Madu
Merek "A"
T43
Perawatan Tubuh Khusus
I31 I32
I33
I37
I41
I43 I44 I46 I99 I102
I124 I125 I126
I419 I650 I652
Mangga
Natal
21 Lampiran 3 Aturan dengan nilai support terbesar tiap kelompok panjang sekuens (data per item) Periode Penjualan
1
Consequent
Support
I33 I41 I32 I32,I41 I37
I37/I32/I41/I31 I37/I32 I37/I31/I33/I41 I37 I37/I41/I33/I32 /I31
0.00074 0.00071 0.00065 0.00011 0.00226
Confidence Train Test 0.09076 0.07535 0.04980 0.01871 0.06436 0.06860 0.01447 0.03922 0.14980 0.07882
I41 I33
I37/I31/I32/I33 I37/I41/I32/I31 /I44/I99/I30
0.00197 0.00182
0.06397 0.18934
0.04520 0.15721
I32,I33 I124,I125 I37,I41 I31,I32,I33 I37
I37/I41 I126/I99 I32/I31 I37 I37/I41/I33/I32 /I31/I44/I30
0.00029 0.00022 0.00021 0.00011 0.00485
0.06594 0.02430 0.02062 0.01164 0.16302
0.09211 0.05882 0.03711 0.03883 0.20317
I41
I37/I31/I41/I33 /I32
0.00412
0.12102
0.11489
I33
I37/I41/I32/I31 /I44/I43/I47/I3 0/I99/I36/I46/I 33/I37,I41
0.00395
0.33772
0.27618
I32,I33 I37,I41 I33,I37 I31,I32,I33 I32,I33,I37
I37/I41/I31 I37/I31/I33/I32 I37/I41/I32/I31 I37 I37
0.00066 0.00065 0.00064 0.00013 0.00012
0.17548 0.13926 0.20982 0.12174 0.09091
0.18258 0.16302 0.20287 0.12778 0.11416
Antecedent
2
3
22 Lampiran 4 Aturan dengan nilai support terbesar tiap kelompok panjang sekuens (data per grup) Periode Penjualan
1
2
Confidence Antecedent
Consequent
Support
Train
Test
T3
T3/T12
0.00200
0.02100
0.04553
T14
T12/T14
0.00110
0.02624
0.03599
T79
T12/T62/T79
0.00060
0.03445
0.02926
T61,T65
T62/T65
0.00038
0.02643
0.03058
T12,T14
T14/T12
0.00027
0.04358
0.04493
T43,T14
T12/T14
0.00024
0.03265
0.03155
T43
T62/T12/T61/T3/T65/T22/T 2/T88/T23
0.00768
0.12157
0.09638
T12
T12/T3/T62/T61/T14/T2/T6 5
0.00672
0.10032
0.13940
T3
T3/T62/T12
0.00661
0.06741
0.08090
T61,T62
T61/T65/T62/T58/T3/T12
0.00151
0.09004
0.09506
T43,T61
T61/T12/T65/T58/T22/T43/ T3/T2
0.00144
0.14041
0.10938
T12,T14
T14/T12/T61/T3/T62/T65/T 43/T2/T1
0.00138
0.16732
0.14583
T43,T12,T14
T14
0.00012
0.03827
0.00000
T61,T62,T65
T65
0.00012
0.02868
0.02353
T3,T43,T12
T3
0.00011
0.06931
0.15789
T12
T3/T62/T14/T61/T57/T2/T1 2/T65/T58/T23/T1/T44/T22/ T88/T7/T16/T15/T11/T8/T4 6/T64/T31/T27/T66/T17/T7 9/T4/T43
0.02871
0.56673
0.49438
T62
T61/T62/T65/T3/T2/T57/T5 8/T23/T14/T44/T12/T22/T8 8
0.02529
0.21797
0.23719
T43
T62/T57/T61/T23/T3/T65/T 22/T12/T58/T2/T14/T88/T4 4/T1/T31/T46/T16/T17/T27/ T21/T66/T43/T79/T56/T64/ T4/T7/T8/T50
0.02436
0.58422
0.55232
3
23 Lanjutan... Periode Penjualan
Confidence Antecedent
Consequent
Support
Train
Test
T43,T12
T57/T3/T61/T14/T62/T12/T 65/T58/T22/T1/T23/T44/T7/ T15/T11/T31/T16/T79/T17/ T88/T64/T46/T66/T43
0.00526
0.63344
0.69697
T61,T62
T61/T62/T65/T58/T57/T23/ T14/T2/T3/T12/T46/T44/T2 2/T1/T88
0.00428
0.25671
0.26043
T12,T62
T57/T61/T65/T12/T62/T3/T 14/T58/T2/T44/T23/T64/T1/ T66/T6/T46/T22
0.00352
0.45212
0.41765
T3=>T3
T3/T62/T61/T58/T23
0.00090
0.12796
0.21386
T61,T62,T65
T65/T62/T61/T57/T58
0.00062
0.14759
0.15566
T43,T12,T14
T14/T61
0.00025
0.13002
0.16667
3
24
RIWAYAT HIDUP Penulis dilahirkan di Wonogiri pada tanggal 30 November 1995 dari pasangan Bapak (Alm.) Suwarno dan Ibu Fitri Noerhajati. Penulis adalah anak pertama dari tiga bersaudara. Tahun 2012 penulis lulus dari SMA Negeri 3 Surakarta dan pada tahun yang sama diterima sebagai mahasiswa baru jenjang S1 pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA), Institut Petanian Bogor (IPB) melalui jalur Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) Tulis. Selama mengikuti perkuliahan, penulis menjadi asisten praktikum Algoritme dan Pemrograman pada semester ganjil tahun ajaran 2014/2015, asisten praktikum Penerapan Komputer pada semester genap tahun ajaran 2014/2015 dan semester ganjil tahun ajaran 2015/2016, asisten pratikum Teknik Optimasi dan Komputasi pada semester ganjil tahun ajaran 2015/2016, dan asisten praktikum Komputasi Numerik pada semester genap tahun ajaran 2015/2016. Dalam bidang organisasi, penulis pernah menjadi sekretaris Departemen Database Center di Gamma Sigma Beta (GSB) IPB masa kepengurusan 2014/2015. Dalam bidang kepanitian, penulis pernah menjadi ketua Divisi Humas & Sponsorship Kompetisi Statistika Junior dalam rangkaian Pesta Sains Nasional 2015. Pada Bulan Juni-Agustus 2015 penulis melaksanakan praktik lapang di PT. MARS Indonesia, Rawamangun, Jakarta Timur.