Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015
157
Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop) Elly Muningsih AMIK BSI Yogyakarta E-Mail :
[email protected] Abstrak Berkembangnya E-Commerce menjadikan pelaku online shop harus bisa menempatkan pelanggannya dengan baik, karena pelanggan merupakan salah satu sumber keuntungan. Mengetahui nilai potensial pelanggan melalui pelaksanaan CRM (Customer Relationship Management) dapat membantu dalam pemahaman nilai pelanggan. Clustering pelanggan merupakan salah satu cara mengetahui pemetaan pelanggan untuk strategi pemasaran yang lebih baik. Metode Fuzzy C-Means dengan model Fuzzy RFM (Recency, Frequency, Monetary) yang merupakan salah satu metode clustering dimana metode Fuzzy C-Means memberikan hasil yang smooth (halus), artinya bahwa objek pengamatan tidak mutlak untuk menjadi satu kelompok saja, tetapi juga bisa menjadi anggota kelompok lain dengan tingkat keanggotaan yang berbeda-beda. Percobaan menghasilkan clustering pelanggan menjadi 3 kelompok dengan iterasi sebanyak enam kali dan nilai fungsi objektif sebesar 20,75202212. Kata kunci: nilai pelanggan, Fuzzy C-Means, model Fuzzy RFM, clustering
1.
PENDAHULUAN
Pelanggan merupakan sumber keuntungan dalam perusahaan karena menduduki posisi penting dalam pengembangan strategi bisnis. Menurut Chai
mengalami kesulitan dalam menentukan pelanggan yang potensial. Penentuan yang dilakukan selama ini adalah secara manual dan hasil yang di dapat tidak akurat. Untuk dapat mengatasi
Gambar 1. Tahapan proses KDD dalam database dan Chan [1] dijelaskan bahwa permasalahan permasalahan yang terjadi, maka online shop yang sering dihadapi pemasar adalah membutuhkan suatu metode untuk kesulitan dalam mengidentifikasi pelanggan mengidentifikasi dan mengelompokkan atau nasabah yang tepat, sehingga pelanggan potensial menjadi beberapa cluster menyebabkan perusahaan dapat kehilangan atau kelompok dengan teknik yang disebut pelanggan potensial yang akan merugikan Data Mining. Teknik data mining pada perusahaan itu sendiri. Hal ini yang juga penelitian menggunakan metode Fuzzy Cterjadi pada sebuah online shop di Jogja yang Means dengan model Fuzzy RFM (Recency, Frequency dan Monetary).
ISBN: 979-26-0280-1
158
Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015
Data mining merupakan sebuah inti dari proses Knowledge Discovery in Database (KDD) yang memiliki sifat otomatis, dapat didefinisikan sebagai pengorganisasian proses untuk pengidentifikasian yang benar, berguna dan penemuan pola dari kumpulan data yang besar dan komplek [2]. Tahapan pada proses KDD pada database ditampilkan pada Gambar 1[2] : Ada banyak metode atau fungsi data mining yang bisa digunakan untuk menemukan, menggali dan menambang pengetahuan, namun menurut [3][4] ada enam fungsi utama data mining, yaitu : Description (deskripsi), Estimation (estimasi), Prediction (prediksi), Classification (klasifikasi), Clustering (pengelompokan), dan Association (asosiasi). Pada tahun 1981, Jim Bezdek [5] memperkenalkan untuk pertama kalinya metode Fuzzy C-Means (FCM), salah satu metode clustering yang termasuk dalam penggolongan fuzzy clustering berdasarkan uncertainty data. Metode ini menerapkan model pengelompokkan fuzzy agar data bisa menjadi anggota semua cluster dengan tingkat atau derajad keanggotaan yang berbeda yaitu 0 dan 1 yang akan menentukan tingkat keberadaan data dalam suatu cluster atau kelas FCM merupakan pengembangan dari metode non hierarki K-Means cluster, karena pada awalnya ditentukan dulu jumlah kelompok Z atau cluster yang akan dibentuk kemudian dilakukan iterasi sampai mendapatkan keanggotaan kelompok tersebut [5].
2. ALGORITMA FUZZY C-MEANS (FCM) Algoritma FCM adalah sebagai berikut [6][7]: 1. Input data yang akan di cluster X, berupa matriks berukuran n x m (n = jumlah sampel data, m = atribut setiap data). Xij = data sampel ke-i (i=1,2,...,n), atribut kej (j=1,2,....,m). X=[ 2. a. b. c.
]
(1)
Tentukan nilai dari : Jumlah cluster = c; Pangkat/Derajat kefuzzy-an= w; Maksimum iterasi = MaxIter;
ISBN: 979-26-0280-1
d. e. f. 3.
Error terkecil yang diharapkan= ᶓ; Fungsi objektif awal = P0 = 0; Iterasi awal = t = 1; Bangkitkan bilangan random µik i = 1, 2, ..., n; k = 1, 2, ..., c; sebagai elemenelemen matriks awal U. Hitug jumlah setiap kolom (atribut) : ∑
( )
Dengan i=1, 2, ..., n. Hitung : ( ) 4. Dengan pusat klaster ke-k: Vkj, dengan k = 1, 2, ..., c; dan j = 1, 2, ..., m
( ) 5. Hitung fungsi obyektif pada iterasi ke-t, Pt :
( ) 6. Hitung perubahan matriks partisi :
( ) 7. Cek kondisi berhenti : Jika : ( | Pt – Pt-1 | < ᶓ ) atau ( t > MaxIter ) maka berhenti; Jika tidak : t = t+1, ulangi langkah ke-4 Membahas tentang pelanggan potensial, dapat diartikan bahwa pelanggan potensial adalah pelanggan yang loyal terhadap perusahaan [8]. Pelanggan yang potensial umumnya akan melanjutkan pembelian produk dan jasa yang ditawarkan seller meskipun ada pilihan produk atau jasa lain yang lebih baik atau populer. Konsumen yang loyal menurut Kotler dalam [8] tidak hanya dilihat dari berapa banyak konsumen tersebut membeli, tetapi dari berapa sering dia melakukan transaksi ulang, termasuk merekomendasikan kepada orang lain untuk membeli.
159
Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015
Penelitian ini bertujuan untuk mengetahui pelanggan potensial melalui proses clustering metode Fuzzy C-Means dengan model Fuzzy RFM (Recency, Frequency dan Monetary) berdasarkan transaksi penjualan pelanggan online shop sehingga diharapkan bisa menerapkan strategi pemasaran yang lebih baik sehingga dapat meningkatkan penjualan produk yang pada gilirannya akan akan memberikan efek positif bagi perkembangan perusahaan.
3.
METODE PENELITIAN
Metode yang digunakan dalam penelitian adalah metode Fuzzy C-Means dengan model fuzzy RFM dimana parameter yang digunakan adalah variabel Recency, Frequency dan Monetary yang masingmasing dibagi menjadi 3 kelompok fuzzy yaitu : 1. Recency dibagi menjadi kelompok fuzzy Baru Saja dengan nilai 3, Agak Lama dengan nilai 2 dan Lama dengan nilai 1. 2. Frequency dibagi menjadi kelompok fuzzy Sering dengan nilai 3, Agak Sering dengan nilai 2 dan Jarang dengan nilai 1. 3. Monetary dibagi menjadi kelompok fuzzy Tinggi dengan nilai 3, Sedang dengan nilai 2 dan Rendah dengan nilai 1. Detail nilai fuzzy dan parameter ditampilkan pada Tabel 1. berikut :
Dalam penelitian ini, data diperoleh dari data transaksi penjualan pada online shop Ragam Jogja dan atribut data yang digunakan adalah data transaksi bulan Januari – Juni 2015. Setelah data terkumpul kemudian diolah melalui beberapa tahap pengolahan awal data (preparation data) yaitu validasi data, transformasi data dan seleksi atribut. Tabel 1. Parameter dan Nilai Fuzzy Parameter Nilai Fuzzy Recency Frequency Monetary Rendah 1 0 < r < 31 hr 0
= 60 hr f>=6 m > = 1.500.000
Untuk penerapan metode Fuzzy C-Means menggunakan nilai : 4. HASIL DAN PEMBAHASAN a. Jumlah cluster (c) = 3; Pengolahan data yang dilakukan pada b. Pangkat/Derajat kefuzzy-an (w) = 2; penelitian berhenti pada iterasi ke-6 dengan c. Maksimum iterasi (Maxter) = 10; hasil seperti ditampilkan pada Tabel 2. d. Error terkecil yang diharapkan (ᶓ)= 10-5 berikut : e. Fungsi objektif awal (P0) = 0; f. Iterasi awal (t) = 1; Tabel 2. Hasil Iterasi Terakhir Nilai RFM Kecenderungan Cluster Kode Pelanggan R F M C1 C2 C3 C1
2
3
2
0,39572208
0,383710503
0,220567417
C2
3
3
3
0,449354136
0,445867836
0,104778028
C3
3
3
2
0,452091559
0,44967003
0,098238411
C4
1
1
1
0,072655573
0,073141381
0,854203046
C5
2
1
1
0,123656799
0,142443381
0,73389982
C6
3
1
1
0,335898875
0,356150976
0,307950148
C7
1
1
1
0,072655573
0,073141381
0,854203046
C8
2
2
2
0,37139356
0,361820808
0,266785632
C9
1
2
2
0,19304383
0,174486871
0,632469299
C10
2
1
1
0,123656799
0,142443381
0,73389982
C11
2
1
3
0,362216172
0,364267912
0,273515916
ISBN: 979-26-0280-1
160
Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015
C12
1
2
1
0,127197825
0,11600061
0,756801565
C13
3
2
3
0,469904657
0,471313033
0,05878231
C14
3
2
2
0,491557311
0,498907445
0,009535244
C15
3
1
2
0,420123332
0,438590026
0,141286642
C16
3
3
2
0,452091559
0,44967003
0,098238411
C17
1
1
1
0,072655573
0,073141381
0,854203046
C18
1
2
2
0,19304383
0,174486871
0,632469299
C19
3
1
2
0,420123332
0,438590026
0,141286642
C20
3
1
2
0,420123332
0,438590026
0,141286642
C21
1
1
1
0,072655573
0,073141381
0,854203046
C22
2
1
2
0,235678685
0,25038837
0,513932945
C23
3
1
2
0,420123332
0,438590026
0,141286642
C24
2
3
3
0,413139709
0,403344288
0,183516003
C25
1
2
1
0,127197825
0,11600061
0,756801565
C26
1
1
1
0,072655573
0,073141381
0,854203046
C27
3
2
1
0,39492599
0,405544745
0,199529266
C28
3
2
2
0,491557311
0,498907445
0,009535244
C29
1
2
2
0,19304383
0,174486871
0,632469299
C30
3
2
2
0,491557311
0,498907445
0,009535244
C31
1
1
2
0,126641998
0,121976751
0,751381251
C32
3
1
2
0,420123332
0,438590026
0,141286642
C33
3
3
3
0,449354136
0,445867836
0,104778028
C34
2
1
1
0,123656799
0,142443381
0,73389982
C35
3
2
3
0,469904657
0,471313033
0,05878231
C36
2
2
2
0,37139356
0,361820808
0,266785632
C37
3
1
1
0,335898875
0,356150976
0,307950148
C38
3
1
3
0,429980962
0,437830718
0,13218832
C39
3
2
2
0,491557311
0,498907445
0,009535244
C40
3
2
2
0,491557311
0,498907445
0,009535244
C41
1
1
1
0,072655573
0,073141381
0,854203046
C42
1
1
1
0,072655573
0,073141381
0,854203046
Cluster yang terbentuk berdasarkan faktor recency(R), frequency(F) dan monetary(M). Semakin besar nilai R menunjukan bahwa pelanggan sering melakukan transaksi, semakin besar nilai F menunjukan pelanggan setia terhadap terhadap produk yang digunakan, dan semakin besar nilai M, menunjukan bahwa nominal transaksi yang dibayarkan semakin besar.
ISBN: 979-26-0280-1
1.
2.
Cluster 1 : 8 anggota pelanggan kode C1,C2, C3, C8, C16, C24, C33 dan C36 dengan pusat cluster ( 1,488612328; 1,333801551; 1,375878298 ), memiliki nilai yang besar dari ketiga faktor, sehingga dapat digolongkan sebagai pelanggan yang sangat potensial. Cluster 2 : 17 anggota pelanggan kode C6, C11, C13, C14, C15, C19, C20, C23, C27, C28, C30, C32, C35, C37, C38, C39 dan C40 dengan pusat cluster
Seminar Nasional Teknologi Informasi dan Komunikasi Terapan (SEMANTIK) 2015
3.
( 1,45119347; 1,371706172; 1,391145768 ), memiliki nilai frequency dan rata-rata ketiga nilai yang cukup besar, sehingga dapat digolongkan sebagai pelanggan yang potensial. Cluster 3 : 17 anggota pelanggan C4, C5, C7, C9, C10, C12, C17, C18, C21, C22, C25, C26, C29, C31, C34, C41 dan C42 dengan pusat cluster ( 2,863003043; 1,938097976; 2,194617752 ), memiliki nilai rata-rata ketiga faktor yang kecil, sehingga dapat digolongkan menjadi nasabah yang tidak atau kurang potensial.
5.
KESIMPULAN
Dari penelitian yang dilakukan, metode Fuzzy C-Means dengan model Fuzzy RFM terbukti dapat melakukan clustering pelanggan dengan mengelompokkannya ke dalam pelanggan sangat potensial, pelanggan potensial atau dan pelanggan tidak atau kurang potensil. Walaupun hasil yang diharapkan sudah terpenuhi, namun untuk penelitian lebih lanjut bisa dikembangkan dengan penentuan jumlah cluster dengan metode tertentu, melakukan pengukuran atau validasi untuk hasil yang sudah ada atau membandingkan penerapan menggunakan metode lain agar diketahui keakuratannya.
ISBN: 979-26-0280-1
6.
161
DAFTAR PUSTAKA
[1]. Widiarini, & Wahono, R. S. Algoritma Cluster Dinamik untuk Optimasi Cluster pada Algoritma K-Means dalam Pemetaan Nasabah Potensial. Journal of Intelligent Systems , Vol. 1, No. 1, 3235. 2015. [2]. Maimon, O., & Rokach, L. Data Mining and Knowledge Discovery Handbook. London: Springer Science+Business Media. 2010 [3]. Larose, D. T. Discovering Knowledge in Data : An Introduction to Data Mining. Hoboken, New Jersey: John Wiley & Sons, Inc. 2005 [4]. Susanto, S., & Suryadi, D. Pengantar Data Mining : Menggali Pengetahuan dari Bongkahan Data. Yogyakarta: Penerbit ANDI. 2010. [5]. Kusumadewi, Sri; Hartati, Sri. NeuroFuzzy : Integrasi Sistem Fuzzy dan Jaringan Syaraf.Yogyakarta. Graha Ilmu. 2009 [6]. Kusumadewi, S., Purnomo, H., Aplikasi Fuzzy Untuk Pendukung Keputusan, Graha Ilmu, Jakarta. 2010 [7]. Setiawan, F. H. Penerapan Fuzzy CMeans Dan Apriori Untuk Rekomendasi Promosi Produk Berdasarkan Segmentasi Konsumen. Semarang. 2011. [8]. Zulkarnain. Ilmu Menjual. Yogyakarta : Graha Ilmu. 2012.