UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
PRAKTIKUM 4 ANALISA AR-MBA (ASSOCIATION RULE - MARKET BASKET ANALYSIS)
Tujuan Praktikum 1. Mahasiswa dapat mengetahui salah satu metode asosiasi dalam data mining. 2. Memberikan pemahaman mengenai prosedurMarket Basket Analysis. 3. Mahasiswa dapat mengolah suatu data yang cukup besar sehingga data tersebut dapat digunakan dengan menggunakan Association Rule. Latar Belakang AR-MBA Dewasa ini, penggunaan mesin pencatat dan pemroses transaksi berteknologi barcode telah umum digunakan pada penjual eceran maupun kecil (toko atau swalayan). Dengan mesin ini, penjual eceran dapat menyimpan data transaksinya dalam suatu basisdata transaksi. Tiap informasi pada transaksi memuat tanggal dan item apa saja yang dibeli. Data ini disebut sebagai basket data. Market Basket Analysis (MBA) merupakan studi mengenai analisis basket data. Salah satu metode yang banyak digunakan dalam MBA adalah association rule mining yang bertujuan menemukan aturan-aturan asosiasi di antara himpunan besar data item dalam basisdata transaksi. Apabila diimplementasikan dalam basis data transaksi, aturanaturan asosiasi ini akan sangat berguna dalam menentukan strategi bisnis seperti mendesain katalog, menata layout, serta merancang kampanye pemasaran dan promosi. Salah satu kemungkinan contoh dari asosiasi misalnya adalah bahwa 80% pelanggan yang membeli produk A juga membeli produk B. Dalam hal ini produk A dan B disebut dengan istilah frequent itemset. Dari frequent itemset tersebut kita dapat menentukan aturan asosiasi antar item dalam frequent itemset .
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
Menggali aturan asosiasi dari basis data transaksi bukan merupakan masalah trivial. Pertama, jumlah transaksi yang terdapat dalam basis data umumnya sangat banyak. Kedua, jumlah kemungkinan frequent itemset meningkat secara eksponensial terhadap jumlah jenis item. Terdapat berbagai algoritma yang dapat digunakan untuk aplikasi AR-MBA, antara lain yaitu algoritma apriori dan algoritma FP-growth. Berikut penjelasan dari kedua algoritma tersebut:
Algoritma Apriori Algoritma apriori merupakan suatu algoritma untuk mengurangi ruang pencarian kombinasi item, sehingga analisis dapat dilakukan dengan lebih cepat. Lebih lanjut lagi, aturan-aturan yang dihasilkan dari algoritma apriori dapat diidentifikasi lagi untuk menentukan aturan mana yang dapat memberikan informasi lebih banyak dengan menggunakan ukuran support dan lift ratio. Kemudian, aturan-aturan asosiasi yang telah dihasilkan dapat digunakan sebagai bahan pertimbangan untuk pengambilan keputusan dalam strategi bisnis. Adapun dua proses utama yang dilakukan dalam algoritma Apriori (Han & Kamber, 2006), yaitu : 1. Join (penggabungan). Pada proses ini setiap item dikombinasikan dengan item yang lainnya sampai tidak terbentuk kombinasi lagi. 2. Prune (pemangkasan). Pada proses ini, hasil dari item yang telah dikombinasikan tadi lalu dipangkas dengan menggunakan minimum support yang telah ditentukan oleh user.
Algoritma FP-Growth Algoritma FP-Growth merupakan pengembangan dari algoritma Apriori. Sehingga kekurangan dari algoritma Apriori diperbaiki oleh algoritma FP-Growth. Frequent Pattern Growth (FP-Growth) adalah salah satu alternatif algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data (David Samuel, 2008). Pada algoritma Apriori diperlukan generate candidate
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
untuk mendapatkan frequent itemsets. Akan tetapi, di algoritma FP-Growth generate candidate tidak dilakuka karena FP-Growth menggunakan konsep pembangunan tree dalam pencarian frequent itemsets. Hal tersebutlah yang menyebabkan algoritma FP-Growth lebih cepat dari algoritma Apriori. Karakteristik algoritma FP-Growth adalah struktur data yang digunakan adalah tree yang disebut dengan FP-Tree. Dengan menggunakan FP-Tree, algoritma FP-growth dapat langsung mengekstrak frequent Itemset dari FP-Tree. Penggalian itemset yang frequent dengan menggunakan algoritma FP-Growth akan dilakukan dengan cara membangkitkan struktur data tree atau disebut dengan FPTree. Metode FP-Growth dapat dibagi menjadi 3 tahapan utama yaitu sebagai berikut (Han & Kamber 2006): 1. Tahap pembangkitan conditional pattern base, 2. Tahap pembangkitan conditional FP-Tree, dan 3. Tahap pencarian frequent itemset.
Association Rule Asociation dalam data mining adalah pekerjaan untuk menentukan mana atribut yang akan didapatkan bersamaan. Dalam dunia bisnis lazim dikenal istilah affinity analysis. Tugas dari asociation rule adalah mencari aturan yang tidak mengcover untuk mengukur hubungan antara dua atau lebih atribut. Association
Rule
adalah
bentuk
jika
“kejadian
sebelumnya”
kemudian
“konsekuensinya”. (IF antecedent, THEN consequent). Bersamaan dengan perhitungan aturan support dan confidence. Pola asosiasi menjadi salah satu fungsionalitas yang paling menarik dalam penggalian data (Kumar dan Wahidabanu, 2007). Association Rule adalah teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item. Contoh dari Association Rule dari analisa pembelian di suatu pasar swalayan adalah bisa diketahui berapa besar kemungkinan seorang pembeli membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut Pemilik pasar swalayan dapat mengatur penempatan barangnya atau
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu (Wiwin Suwarningsih, 2008). Menurut Leo Susanto (2003) penggalian kaidah asosiasi mempunyai peranan penting dalam proses pengambilan keputusan. Salah satu contoh penerapan Association Rule adalah Market Basket Analysis. Association Rule menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang belanja di pasar swalayan, sehingga Association Rule juga sering disebut dengan istilah Market Basket Analysis. Association Rule juga dikenal sebagai salah satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya.
Konsep Market Basket Analysis
Gambar 1. Ilustrasi Penggunaan MBA Market Basket Analysis merupakan salah satu contoh penerapan Association Rule. Untuk menyampaikan ide mendasar dari Market Basket Analysis, dimulai dengan melihat gambar keranjangan belanjaan pada gambar 3.1 yang berisi bermacam-macam barangbarang yang dibeli oleh seseorang disebuah supermarket. Keranjang ini berisi bermacammacam barang-barang seperti roti, susu, sereal, telur, mentega, gula, dan sebagainya. Sebuah keranjang memberitahukan kepada kita tentang apa saja yang dibeli oleh seorang konsumen dalam satu waktu. Sebuah daftar belanjaan yang lengkap yang diperoleh dari
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
semua konsumen memberikan kita informasi yang sangat banyak, dan ini dapat menjelaskan barang-barang apa saja yang paling penting dari bisnis penjualan yaitu ”apa barang yang dibeli oleh konsumen dan kapan”. Setiap konsumen membeli seperangkat barang-barang yang berbeda, dalam jumlah yang berbeda, dan dalam waktu yang berbeda. Market Basket Analysis menggunakan informasi apa yang dibeli oleh konsumen-konsumen untuk menyediakan tanda/informasi yaitu siapa mereka dan mengapa mereka melakukan pembelian tersebut? Market Basket Analysis menyediakan pengertian tentang barang dagangan dengan memberitahukan kepada kita produk-produk mana yang memungkinkan untuk dibeli secara bersamaan dan produk mana yang lebih disetujui untuk di promosikan. Karena dalam Market Basket Analysis tidak hanya memahami kuantitas dari item yang dibeli dalam keranjang itu, tapi bagaimana item yang dibeli dalam hubungannya satu dengan yang lain. Informasi ini dapat digunakan dalam: 1. Lebih
menguntungkan
periklanan
dan
promosi.
Market
Basket
Analysis
menggunakan iklan dan promosi agar lebih memahami bagaimana pembeli menanggapi dan berkomunikasi atas produk-produk yang ditawarkan, karena tujuan dari retailer adalah ”Bagaimana mengubah penjualan ini? Apa lagi yang dijual dan apa yang diiklankan?”. 2. Penargetan yang lebih tepat dalam mengembalikan ROI (Return of Investment). Market Basket Analysis digunakan untuk mengoptimalkan kampanye dan promosi untuk peningkatan penjualan dan margin dengan penargetan lebih tepat. 3. Loyalitas kartu promosi dengan analisis longitudinal. Longitudinal pengguna Market Basket Analysis memungkinkan pengecer untuk membeli karakter perilaku pelanggan seiring waktu. Retailer menggunakan kartu loyalitas pelanggan untuk menangkap lifecycle data sehingga mereka dapat menganalisis pelanggan dari masa pembelian perilaku seperti belanja. Misalnya, satu mainan pengecer menjelaskan bahwa ia tidak masuk akal untuk menjual satu mesin permainan (dengan sedikit margin) kecuali pelanggan yang juga membeli aksesoris dan perangkat lunak
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
permainan (tinggi dengan margin). Mereka menggunakan Market Basket Analysis terhadap loyalitas kartu data mereka secara keseluruhan untuk menentukan margin pada video game dan penjualan untuk membuat ingatan promosi pelanggan dan mempengaruhi pembeli untuk membeli permainan dan aksesoris dari mereka dan tidak dari pengecer lain. 4. Menentukan tata letak toko yang baru (new store layouts) atau menarik lebih banyak lalu lintas ke toko, menetapkan produk-produk mana yang akan diletakan dalam tempat yang khusus. Market Basket Analysis juga menggunakan ruang untuk meningkatkan perencanaan dan visual merchandising lintas untuk meningkatkan penjualan. 5. Mengidentifikasi ketika persoalannya berpasangan/kupon (issue coupons). Untuk meningkatkan penjualan atau menghabiskan barang yang menjadi inventory.
Definisi Market Basket Analysis Bebrapa definisi dari MBA adalah sebagai berikut:
Market Basket Analysis adalah teknik matematis yang biasa digunakan oleh marketing yang profesional untuk menyatakan kesamaan antara produk individu atau produk kelompok.
Market Basket Analysis berkenaan dengan sekumpulan permasalahan bisinis yang berkaitan untuk mengetahui point of sale dari data transaksi.
Market Basket Analysis adalah istilah umum untuk metodologi yang mempelajari tentang komposisi keranjang belanjaan yang dibeli oleh rumah tangga selama 1 kali berbelanja.
Market Basket Analysis adalah kumpulan kombinasi produk yang dibeli bersamaan.
Market Basket Analysis adalah analisis kecenderungan suatu item terbeli oleh costumer yang sama pada waktu yang bersamaan.
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
Tiga Level Market Basket Data Market Basket Data adalah data transaksi yang menjelaskan tiga perbedaan entitas yang mendasar yaitu : 1. Customers 2. Orders/pembelian 3. Items (barang-barang) Dalam sebuah relational database, struktur data dari market basket data sering terlihat sama. Data Struktur ini didalamnya terdapat empat entitas yang penting.
Gambar 2. Relational database
Permintaan adalah stuktur data yang fundamental untuk Market Basket Data. Permintaan dapat berupa kejadian suatu pembelian oleh customer. Pembelian juga dapat dilakukan melalui website, grosir, ataupun dari catalog. Semua ini dapat termasuk dalah sebuah pembelian, pembelian tambahan, tipe dari pembayaran, dan data lain yang termasuk dalam suatu transaksi. Beberapa transaksi diberikan identitas khusus. Namun ada beberapa identitas khusus tersebut harus digabungkan dengan data yang lainnya. Sebagai contoh, kita perlu mengkombinasikan empat lahan untuk mendapatkan empat identitas khusus untuk penjualan di toko. Waktu dimulai ketika customer membayar, chain ID, store ID dan lane ID.
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
Barang dalam suatu pembelian digambarkan dalam line items. Data ini termasuk harga pembayaran barang, jumlah barang, pajak yang harus dibayar, mungkin juga termasuk harga (yang digunakan untuk penghitungan margin). Meja barang (item table) biasanya mempunyai hubungan dengan product reference table yang memberikan gambaran lebih jelas mengenai produk yang ada. Gambaran informasinya termasuk hierachy produk dan informasi lain yang mungkin memudahkan dalam menganalisis. Customer table (meja customer) adalah meja pilihan dan harus bisa digunakan ketika customer dapat di identifikasikan. Contoh, di dalam sebuah web site, ada sebuah syarat dalam melakukan registrasi atau ketika customer menggunakan kartu anggota (affinity card) dalam melakukan pembayaran. Walaupun customer table mempunyai area yang menarik, tetapi yang paling penting adalah identitas tersebut. Sebab ini merupakan dasi dari sebuah transaksi setiap waktu. Pengenalan customer setiap saat membuat mungkin untuk dikenali secara cepat, seperti frekuensi pembelian yang dilakukan oleh customer. Tiga level dari market basket data yang penting yang secara cepat dapat memahami permintaan. Ada beberapa dasar pengukuran yaitu: 1. Berapa rata-rata pembelian yang dilakukan customer? 2. Berapa rata-rata barang yang khusus setiap pembelian? 3. Berapa rata-rata barang setiap pembelian? 4. Untuk produk tertentu, proporsi customer apa yang telah membeli produk? 5. Untuk produk tertentu, berapa rata-rata dari pembelian setiap customer yang termasuk dalam barang? 6. Untuk produk tertentu, berapa rata-rata jumlah pembelian dalam suatu pembelian ketika produk dibeli? Pengukuran ini memberikan gambaran untuk sebuah bisnis. Dalam beberapa kasus, ada beberapa pembeli yang berulang, sehingga proporsi dari sebuah pembelian setiap customer mendekati 1. Saran ini digunakan suatu perusahaan untuk meningkatkan penjualan setiap customers. Atau jumlah dari produk setiap pembelian mendekati 1, penyaranan akan kesempatan untuk penjualan silang selama proses pembelian.
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
Hal ini dapat berguna untuk membandingkan pengukuran ini terhadap yang lainnya. Kita telah menemukan bahwa jumlah pembelian dapat menjadi acuan untuk membedakan diantara para customer (costumer yang sesungguhnya/membeli lebih sering dari pada hanya sekedar customer). Gambar 2 menggambarkan tentang hubungan antar customer (jumlah barang khusus setiap pembelian) dengan seberapa dalam hubungannya (jumlah yang dibeli) untuk customer yang membeli lebih dari 1 barang. Data ini bisa berasal dari retailer yang kecil. Bulatan yang paling besar menunjukan jumlah customer yang membeli dua barang sekaligus dalam waktu yang bersamaan., dalam gambar juga dapat dilihat bulatan yang besar menunjukan jumlah customer yang membeli barang yang sama dalam dua kali pembelian. Customers yang baik–yaitu mereka yang melakukan pembelian kembali berulang kali. Cenderung untuk membeli bermacam-macam barang dalam jumlah besar. Walaupun, beberapa dari mereka kembali dan membeli barang yang sama sepeti ketika mereka pertama kali membeli. Bagaimana retailer dapat mendorong customers untuk datang kembali dan membeli lebih dan juga barang yang berbeda? Market Basket Analysis tidak dapat menjawab pertanyaan ini, tetapi Market Basket Analysis dapat sedikit dorongan untuk meminta itu dan mungkin menbeikan isyarat yang dapat membantu.
Support dan Confidence Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support (nilai penunjang) yaitu persentase kombinasi item tersebut dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif. Aturan assosiatif biasanya dinyatakan dalam bentuk : {roti,mentega} → {susu} (support = 40%, confidence = 50%) Yang artinya : ”50% dari transaksi di database yang memuat item roti dan mentega juga memuat item susu. Sedangkan 40% dari seluruh transaksi yang ada di database memuat ketiga item itu”. Dapat juga diartikan : "Seorang konsumen yang membeli roti dan mentega
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari catatan transaksi selama ini." Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence).
Metode Dasar Association Rule Metodologi dasar analisis asosiasi terbagi menjadi dua tahap : 1. Analisa pola frekuensi tinggi Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database, yang dapat dirumuskan sebagai berikut:
Contohnya pada database transaksi belanja pasar swalayan berikut:
Tabel 1. Data Transaksi
Diketahui bahwa jumlah transaksi yang memuat {roti,mentega} ada 4 (support 80%), sedangkan jumlah transaksi yang memuat {roti,mentega,susu} ada 2 (support 40%), transaksi yang memuat {buncis} hanya 1 (support 20%) dan sebagainya.
Bila ditetapkan syarat
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
minimum dari nilai support untuk pola frekuensi tinggi dalam contoh ini adalah 30%, diperoleh pola frekuensi tinggi yang memenuhi syarat minimum nilai support adalah : Tabel 2. Data Transaksi dengan Frekuensi Tertinggi
2. Pembentukan aturan assosiatif Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A→ B dengan menggunakan rumus berikut :
Bila syarat minimum untuk confidence dari contoh diatas adalah 50% maka salah satu contoh aturan assosiatif yang dapat ditemukan adalah : {telur,susu} → {roti,mentega} dengan nilai confidence:
Aturan assosiatif lain yang dapat ditemukan diantaranya adalah : Tabel 3. Tabel Association Rule
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
3. Lift / Improvement Ratio Lift Ratio adalah parameter penting selain support dan confidence dalam association rule. Lift Ratio mengukur seberapa penting rule yang teleh terbentuk berdasarkan nilai support dan confidence. Lift Ratio merupakan nilai yang menunjukkan kevalidan proses transaksi dan memberikan informasi apakah benar produk A dibeli bersamaan dengan produk B. Lift / Improvement Ratio dapat dihitung dengan rumus:
Sebuah transaksi dikatakan valid jika mempunyai nilai Lift / Improvement lebih dari 1, yang berarti bahwa dalam transaksi tersebut, produk A dan B benar-benar dibeli secara bersamaan.
Pemanfaatan Aturan Asosiasi Sesuai namanya, aturan asosiasi yang dihasilkan dalam proses Market Basket Analysis umumnya digunakan pada bisnis retail. Untuk bagian pemasaran, peningkatan penjualan dapat dicapai dengan mengorganisasikan ulang item-item sehingga item-item yang terjual bersama-sama selalu ditemukan bersama. Hal ini akan memicu pembelian dan membantu memastikan pelanggan untuk membeli sebuah item tidak lupa untuk membelinya karena tidak melihatnya. Organisasi retail juga dapat memberikan kupon diskon untuk pembelian item B jika pelanggan membeli item A (jika aturan asosiasi A => B merupakan aturan asosiasi yang kuat). Situs e-commerce juga dapat menggunakan aturan asosiasi untuk memberikan saran (recommender system/suggestive sell) bagi pembeli berdasarkan item-item apa saja yang sudah berada dalam keranjang belanja (shopping cart) mereka. Situs e-commerce terkenal seperti Amazon.com menggunakan sistem pemberi saran ini untuk meningkatkan penjualan.
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
Untuk pemasaran langsung, promosi kepada pelanggan yang sudah ada lebih disukai, karena data pembelian mereka telah diketahui. Perusahaan telah memiliki data para pelanggan dalam basis datanya, dan mengetahui informasi yang signifikan mengenai mereka. Setelah menjalankan Market Basket Analysis, staf pemasaran dapat menghubungi pelanggan atau mengirimkan katalog produk untuk mempromosikan produk yang kira-kira akan menarik untuk mereka beli dengan berdasarkan catatan riwayat pembelian mereka. Amazon.com juga menggunakan sistem ini. Perusahaan tersebut mengirimkan e-mail kepada pelanggan untuk menawarkan produk-produk yang kemungkinan menarik untuk mereka beli dengan melihat produk apa saja yang telah mereka beli sebelumnya. Selain dalam bisnis retail, Market Basket Analysis juga dapat diaplikasikan dalam bidang-bidang yang lain. Market Basket Analysis dapat digunakan dalam spam filtering, fraud detection (pendeteksi kecurangan, dalam klaim asuransi misalnya), analisis pembelian kartu kredit, analisis pola panggilan telepon, analisis penggunaan layanan telekomunikasi, dan sebagainya. Situs Google Reader yang merupakan aplikasi web di mana pengguna dapat berlangganan feed dari situs-situs berita atau blog (pengguna akan dapat mengetahui apakah sebuah situs sudah di-update atau belum tanpa harus mengunjungi masingmasing situs) juga menggunakan Market Basket Analysis. Aturan asosiasi yang dihasilkan bersama daftar situs yang dilanggani feed-nya digunakan untuk memberikan saran bagi pengguna mengenai situs lain yang kira-kira menarik untuk ditambahkan dalam daftar feed.
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
Gambar 3. Flowchart Tahapan MBA
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
Studi Kasus Cara mengolah data AR-MBA menggunakan software rapidminer. Contoh data yang dimiliki adalah sebagai berikut: Tabel 3. Sampel data No
Dept 1
Dept 2
Dept 3
Dept 4
Dept 5
Dept 6
Dept 7
Dept 8
1
1
1
0
0
0
0
0
0
2
1
0
1
0
1
0
1
0
3
1
1
0
0
1
0
0
0
4
1
1
0
0
0
0
0
0
5
1
1
0
0
0
0
0
0
6
1
1
0
0
0
0
0
0
7
1
0
0
0
0
0
1
0
8
1
1
0
0
0
0
0
0
9
1
1
0
0
0
0
0
0
10
0
0
1
0
0
0
1
0
11
1
1
0
0
0
0
0
0
12
1
1
0
0
1
0
0
0
13
1
1
0
0
0
0
0
0
14
1
0
0
0
0
0
1
0
15
1
1
0
0
0
0
1
0
16
1
1
0
0
0
0
0
0
17
0
0
1
0
0
0
1
0
18
1
1
0
0
1
0
0
0
19
1
0
0
0
0
0
1
0
20
1
1
0
0
1
0
1
0
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
Langkah-langkah yang dilakukan dalam software adalah sebagai berikut: 1. Buka software rapid miner, klik New Process 2. Pilih File – Import Data – Import Excel Sheet… 3. Kemudian cari data excel tersebut di dalam computer, pilih, klik Next
Gambar 4. Membuka data
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
4. Klik Next
Gambar 5. Data import step 1 5. Klik Next
Gambar 6. Data import step 2
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
6. Klik Next
Gambar 7. Data import step 3 7. Klik Next
Gambar 8. Data import step 4
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
8. Simpan data di folder latihan1 dengan nama training
Gambar 9. Data import step 5 9. Klik Finish, akan muncul output seperti gambar di bawah ini
Gambar 10. Output import data
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
10. Kemudian drag file training ke dalam kotak Main Process
Gambar 11. Drag training file 11. Cari Select Attributes, kemudian drag ke dalam kotak Main Process
Gambar 12. Drag select attribute
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
12. Hubungkan training dengan Select Attributes
Gambar 13. Menghubungkan data training dengan select attribute 13. Klik Select Attributes, ganti attribute filter by… dengan subset. Kemudian klik menu Select Attributes di attributes. Pindahkan semua departemen ke dalam kotak sebelah kanan
Gambar 14. Select Attributes: attributes
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
14. Cari Numerical to Binominal, kemudian drag ke dalam kotak Main Process
Gambar 15. Proses drag Numerical to Binominal 15. Cari Remap Binominals, kemudian drag ke dalam kotak Main Process
Gambar 16. Proses drag Remap Binominals
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
16. Hubungkan Select Attributes dengan Numerical to Binominal, dan Numerical to Binominal dengan Remap Binominals. Kemudian ganti negative value dengan nilai 0 dan positive value dengan nilai 1
Gambar 17. Proses Numerical to Binominal, dan Numerical to Binominal dengan Remap Binominals
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
17. Cari FP-Growth, kemudian drag ke dalam kotak Main Process
Gambar 18. Proses drag FP-Growth 18. Cari Create Association Rules, kemudian drag ke dalam kotak Main Process. Lalu hubungkan Remap Binominals ke FP-Growth dan FP-Growth (fre) ke Create Association Rules
Gambar 19. Proses Create Assosiate Rules
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
19. Hubungkan FP-Growth (exa) ke res pertama (sebelah kanan) dan Create Association Rules (rul) ke res kedua (sebelah kanan)
Gambar 20. Proses menghubungkan FP-Growth ke ras pertama dan Create Association Rules ke res kedua 20. Klik FP-Growth, ganti min support dengan nilai 0.05
Gambar 21. Min Support bernilai 0.05
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
21. Klik Create Association Rules kemudian ganti min confidence dengan nilai 0.05
Gambar 22. Min Confidence bernilai 0.05 22. Lalu klik Run, akan muncul output seperti gambar di bawah ini
Gambar 23. Output
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
23. Apabila nilai support diganti 0.2 kemudian klik Run, akan muncul output seperti gambar di bawah ini
Gambar 24. Output apabila nilai support diganti 0.2 24. Rule yang valid adalah yang memiliki nilai Lift Ratio > 1
Gambar 25. Rule valid jika nilai Lift Ratio > 1
UNIVERSITAS ISLAM INDONESIA
FM‐UII‐AA‐FKA‐07/R0
MATERI PRAKTIKUM Fakultas : Teknologi Industri Jurusan/Program Studi : Teknik Industri Kode Mata Kuliah : 52224603 Nama Mata Kuliah : Analisis Keputusan dan Data Mining
Pertemuan ke : 4 Modul ke : 4 Jumlah Halaman : 28 Mulai berlaku : 2014
Dari hasil output di atas, dapat diketahui rules sebagai berikut: 1. Dept1 akan terbeli bersama dengan dept2, dengan tingkat kepercayaan 64,9% dan didukung oleh 50% dari data keseluruhan. 2. Dept2 akan terbeli bersama dengan dept1, dengan tingkat kepercayaan 79,4% dan didukung oleh 50% dari data keseluruhan. 3. Dept1 akan terbeli bersama dengan dept5, dengan tingkat kepercayaan 27,3% dan didukung oleh 21% dari data keseluruhan. 4. Dan seterusnya….
DAFTAR PUSTAKA David Samuel. 2008. Penerapan Stuktur FP-Tree dan Algoritma FPGrowth dalam Optimasi Penentuan Frequent Itemset. Institut Teknologi Bandung. Han Jiawei, and M. Kamber. 2006. Data Mining: Concepts and Techniques, Morgan Kaufmann, USA. Wiwin Suwarningsih. 2008. Penerapan Association Rule Mining untuk Perancangan Data Mining BDP (Barang Dalam Proses) Obat. Pusat Penelitian Informatika LIPI