BAB II TINJAUAN PUSTAKA
2.1 Customer Relationship Management (CRM) Pelanggan adalah aset yang paling penting dari sebuah organisasi. Tidak mungkin terdapat prospek bisnis tanpa memuaskan pelanggan yang loyal dan menggembangkan hubungan yang baik terhadap perusahaan. Itulah sebabnya perusahaan harus merencanakan dan menggunakan strategi yang tepat dalam pelayanan pelanggan. CRM (Customer Relationship Management) adalah strategi untuk membangun, mengelola, dan memperkuat hubungan perusahaan dengan pelanggan yang loyal agar dapat tecipta hubungan yang tahan lama. CRM harus merupakan pendekatan customer-centric berdasarkan pandangan pelanggan. Ruang lingkup penanganan pelanggan dalam CRM harus bersifat personal karena setiap pelanggan merupakan entitas yang unik, upaya tersebut dilakukan untuk mengidentifikasi dan memahami perbedaan kebutuhan, prefensi dan perilaku dari tiap pelanggan yang berbeda-beda (Tsiptsis & Chorianopoulos, 2009). Pembangunan bisnis dengan memusatkan pada hubungan terhadap pelanggan
merupakan
perubahan
yang
revolusioner
untuk
kebanyakan
perusahaan. Perusahaan kini telah merubah tujuan dalam pemahaman pelanggan secara individual menjadi melihat nilai yang dimiliki tiap pelanggan sehingga pihak perusahaan mengetahui pelanggan mana yang memiliki nilai yang tinggi dan layak dijadikan investasi dan dipertahankan dan pelanggan mana yang memiliki nilai yang rendah. (Berry & Linoff, 2004). Diperkirakan dalam riset American Management Association
bahwa
untuk menarik pelanggan baru membutuhan biaya lima kali lebih banyak dibandingkan mempertahankan pelanggan yang telah ada. (Kotler, 1994; Peppers & Rogers, 1996). Karena lebih tidak memakan biaya untuk menjual produk tambahan kepada pelanggan yang telah ada sehingga dapat dikatakan pelanggan yang telah ada memberikan keuntungan lebih besar dibandingkan pelanggan baru dalam penjualan produk tambahan. Perusahaan dapat mempersingkat daur penjualan dan meningkatkan loyalitas pelanggan untuk membangun hubungan
7
yang dekat dengan pelanggan sehingga kemudian dapat mendatangkan keuntungan. Penerapan CRM yang baik membantu perusahaan tetap menjaga pelanggan yang telah ada dan menarik pelanggan baru (Peppard, 2000). Perusahaan harus berkonsentrasi untuk menganalisa nilai yang dimiliki pelanggan dan memahami apa yang pelanggan inginkan dan mempertahankan pelanggan untuk memaksimalkan keuntungan. CRM tidak hanya dilihat sebagai sebuah produk atau layanan tetapi sebagai sebuah filosofi bisnis untuk mengelola nilai pelanggan dalam jangka waktu yang lama (customer lifetime value).
2.2 Data Mining Secara
sederhana,
data
mining
merujuk
pada
ekstraksi
atau
"pertambangan" pengetahuan dari sejumlah besar data. Data mining juga dikatakan sebagai kegiatan menemukan pola yang menarik dari data dalam jumlah besar, data dapat disimpan dalam database, data warehouse, atau penyimpanan informasi lainnya. Data mining berkaitan dengan bidang ilmu-ilmu lain, seperti database system, data warehousing, statistik, machine learning, information retrieval, dan komputasi tingkat tinggi. Selain itu, data mining didukung oleh ilmu lain seperti neural network, pengenalan pola, spatial data analysis, image database, signal processing (Han, 2006). Data mining adalah langkah dalam KDD (Knowledge Discovery in Database) yang terdiri dari penerapan analisis data dan penemuan algoritma untuk menghasilkan daftar pola atau model tertentu terhadap data yang dianalisa (Fayyad, 1996). Pada gambar 2.1 menunjukkan data mining merupakan bagian dari KDD.
8
Gambar 2.1 Overview proses data mining dalam hubungan dengan KDD (Fayyad, 2000)
Data mining banyak diterapkan untuk memecahkan masalah kepentingan intelektual, ekonomi, dan bisnis. Data mining dapat dibagi kedalam enam tugas, yaitu sebagai berikut (Berry & Linoff, 2004). : 1.Klasifikasi Klasifikasi
terdiri
dari
tindakan
pengujian
pada
fitur
baru
dan
mengelompokkannya ke dalam salah satu dari sekumpulan kelas yang telah diidentifikasi. 2.Estimasi Estimasi berhubungan dengan nilai kontinyu, jika terdapat beberapa input data, estimasi akan bekerja dengan nilai dari beberapa variabel kontinyu yang tidak diketahui seperti misalkan pendapatan, tinggi, atau credit card balance. 3.Prediksi Prediksi adalah tugas yang sama seperti pada klasifikasi dan estimasi perbedaannya prediksi mengelompokkan berdasarkan beberapa prediksi yang berkaitan dengan waktu mendatang atau perkiraan waktu mendatang. 4.Afinitas Tugas dari afinitas didefinisikan sebagai tindakan untuk mengelompokkan hal mana yang akan dikelompokkan ke dalam kelompok yang sama.
9
5.Clustering Tugas dalam clustering yaitu mensegmentasi populasi heterogen ke dalam sub grup homogen atau clusters. Perbedaan dengan klasifikasi adalah pada clustering tidak ditentukan target pengelompokkan. 6.Deskripsi dan penentuan profil Sebuah deskripsi yang baik seringkali memberikan penjelasan yang baik juga sehingga proses deskripsi dan penentuan profil ini sangat berguna untuk mengetahui pengetahuan yang terdapat pada basis data yang rumit. Tiga tugas pertama merupakan contoh data mining yang terarah, di mana tujuannya adalah untuk menemukan nilai dari variabel target tertentu. Afinitas dan clustering adalah tugas tidak diarahkan, tujuannya adalah untuk mengungkap pengetahuan yang ada. Profiling adalah tugas deskriptif yang mungkin akan baik diarahkan atau tidak diarahkan.
2.3 Data Mining Dalam Kerangka Kerja CRM Data mining dapat menyediakan pandangan dari segi pelanggan dimana merupakan elemen penting untuk mebangun CRM yang efektif. Hal ini dapat meningkatkan interaksi dengan pelanggan sehingga memaksimalkan tingkat kepuasan pelanggan serta dapat memberikan keuntungan melalui analisis pada data. Hal ini dapat mendukung manajemen pelanggan secara individual dan mengoptimalkan seluruh semua fase siklus hidup pelanggan mulai dari akuisisi dan membentuk hubungan yang kuat untuk mencegah pengurangan pelanggan. Bagian pemasaran berusaha untuk mendapatkan pangsa pasar yang lebih besar dan mendapatkan pangsa pelanggan yang lebih besar, dengan kata lain bagian pemasaran memiliki tanggung jawab untuk mendapatkan, mengembangkan dan menjaga pelanggan. Secara lebih spesifik aktivitas pemasaran yang dapat didukung dengan data mining meliputi topik berikut (Tsiptsis & Chorianopoulos, 2009): 1. Segmentasi Pelanggan Segmentasi adalah proses untuk membagi pelanggan ke dalam grup homogen yang unik dalam rangka pengembangan strategi pasar yang berbeda
10
berdasarkan karakteristiknya. Terdapat banyak perbedaan tipe dalam segmentasi pelanggan berdasarkan kriteria dan atribut yang spesifik untuk segmentasi. 2. Kampanye Pemasaran Langsung Bagian pemasaran menggunakan kampanye pemasaran langsung untuk mengkomunikasikan pesan kepada pelanggan mereka menggunakan surat, internet, e-mail dan telepon (tele marketing) untuk mengarahkan pelanggan untuk membeli produk yang ditawarkan. Secara lebih spesifik metode ini untuk mendapatkan pelanggan potensial. 3. Keranjang pemasaran dan analisa urutan Data mining dan asosiasi model dapat digunakan untuk mengidentifikasikan hubungan antara produk yang biasanya dibeli secara bersamaan hal ini digunakan untuk mengetahui produk mana yang dapat dijual secara bersamaan. Hubungan data mining dan CRM dalam perusahaan retail yaitu dapat membantu untuk mengidentifikasi sifat pembelian pelanggan, mempertahankan pelanggan dan memberi kepuasan terhadap pelanggan, meningkatkan rasio konsumsi barang, merancang tranportasi barang yang baik dan aturan pendistribusian serta mengurangi biaya bisnis (Han, 2006).
2.4 Model RFM Model RFM membagi data kedalam tiga aspek dimensi variabel yaitu : Recency (R), Frequency (F) , Monetary (M). Deskripsi lengkap dari RFM adalah sebagai berikut (Hughes, 1994) : 1. Recency – Definisi Recency adalah interval waktu antara transaksi terakhir yang dilakukan pelanggan dengan waktu sekarang atau selama periode tertentu. Semakin dekat interval waktu antara waktu terakhir melakukan transaksi dengan waktu sekarang atau akhir periode yang ditetapkan maka semakin besar nilai dari Recency. 2. Frequency – Frequency didefinisikan sebagai jumlah kali transaksi yang dilakukan pelanggan sampai waktu sekarang atau periode yang ditentukan.
11
Semakin besar jumlah kali transaksi pelanggan (rutin melakukan pembelian) semakin tinggi nilai Frequency-nya. 3. Monetary – Monetary memiliki definisi sebagai jumlah biaya yang dikeluarkan pelanggan dalam setiap transaksi sampai waktu sekarang atau dalam periode tertentu. Semakin besar jumlah biaya yang dikeluarkan semakin besar nilai Monetary-nya. Menurut Tsiptsis & Chorianopoulos, 2009 terdapat enam pembagian pelanggan para perusahaan retail berdasarkan nilai RFM yang dimiliki pelanggan, yang didefinisian secara lebih spesifik pada Tabel 2.1. Tabel 2.1 Pembagian customer pada perusahaan retail dengan model RFM
Kelas Pelanggan Superstar
Deskripsi kelas Pelanggan - Customer dengan tingkat loyalitas paling tinggi - Memiliki nilai (value) yang paling tinggi - Memiliki frekuensi yang paling tinggi - Melakukan transaksi terbesar
Golden Customer
- Memiliki nilai (value) terbesar kedua - Memiliki frekuensi tinggi - Melakukan transaksi standar rata-rata
Typical Customer
- Memiliki nilai (value) dan frekuensi standar rata-rata - Melakukan transaksi standar rata-rata
Occational Customer
- Kedua memiliki frekuensi terendah setelah Dormant Customer - Memiliki Recency rendah (memiliki waktu yang lama dengan rentang waktu terakhir kunjungan) - Melakukan
pembelanjaan
dalam
jumlah besar (large basket) Everyday Shopper
- Memiliki peningkatan dalam transaksi
12
- Melakukan
pembelanjaan
dalam
jumlah kecil (small basket) - Memiliki
nilai
dengan
skala
menengah (medium) hingga rendah (low) Dormant Customer
- Memiliki frekuensi dan nilai (value) terendah - Memiliki waktu yang lama ketika masa terakhir kunjungan (memiliki Recency terendah)
2.5 Jaringan Syaraf Tiruan 2.5.1 Pengertian Jaringan Syaraf Tiruan Jaringan syaraf tiruan adalah sistem pemrosesan informasi yang memiliki karakteristik performa tertentu yang serupa dengan jaringan syaraf secara biologi. Jaringan syaraf tiruan telah dikembangkan sebagai generalisasi dari model matematika dari jaringan syaraf biologi, berdasarkan asumsi ini diperoleh : 1. Pemrosesan informasi terjadi dalam berbagai elemen kecil yang disebut neuron. 2. Sinyal dilewatkan antara neuron melalui link koneksi. 3. Setiap link koneksi memiliki bobot seperti pada sebagian besar jaringan syaraf tiruan. 4. Setiap neuron menerapkan satu fungsi aktivasi (kebanyakan non linier) kedalam jaringan input (total bobot sinyal input) untuk menentukan sinyal keluaran (ouput). Karakteristik jaringan syaraf tiruan adalah sebagai berikut : 1. Hubungan pola antar neuron (dikatakan sebagai arsitektur jaringan syaraf tiruan). 2. Metode untuk menentukan bobot (dikatakan sebagai pelatihan, pembelajaran, algoritma). 3. Fungsi aktivasi.
13
Jaringan syaraf tiruan terdiri dari neuron, unit, sel dan titik. Tiap neuron terhubungan dengan neuron yang lain yang berasosiasi dengan sebuah bobot, bobot digunakan dalam jaringan syaraf tiruan untuk dapat memecahkan masalah. Jaringan syaraf tiruan dapat digunakan untuk memecahkan berbagai masalah seperti penyimpanan dan pemanggilan kembali data atau pola, klasisifikasi pola, melakukan pemetaan secara umum dari pola input ke dalam pola output, mengelompokkan
pola
yang
serupa
atau
menemukan
solusi
untuk
mengoptimalisasi pemecahan suatu masalah (Fausset, 1993). 2.5.2 Metode Pelatihan Jaringan Syaraf Tiruan 2.5.2.1 Metode Pelatihan Terbimbing Metode pelatihan terbimbing adalah metode pelatihan yang memasukkan target keluaran dalam data untuk proses pelatihannya. Ada beberapa metode pelatihan terbimbing yaitu Perceptron, Multi Perceptron dan Back Propagation (BP). 2.5.2.2 Metode Pelatihan Tak Terbimbing Metode Pelatihan tak terbimbing adalah metode pelatihan tanpa memelukan target pada keluarannya. Proses pelatihan berdasarkan proses tranformasi dari bentuk variabel diskrit yang dikenal dengan kuantitas vektor. Jaringan yang digunakan untuk proses pelatihan tak terbimbing adalah jaringan umpan balik (feedback network) yang salah satunya adalah algoritma Adaptive Resonance Theory (ART) 1 dan 2.
2.6 Algoritma Adaptive Resonance Theory 2 (ART 2) Adaptive Resonance Theory (ART) adalah metode pembelajaran tak terbimibing (unsupervised learning) yang dapat mengkoordinasi diri sendiri secara stabil terhadap pola input yang acak (Carpenter & Grossberg, 1988) gambar dari arsitektur algoritma ART 2 dapat dilihat pada Gambar 2.2. ART 2 merupakan salah satu bagian dari algoritma ART yang digunakan untuk mengolah data input yang berifat continuous (Fausset, 1993) dan dapat melakukan penekanan terhadap input acak dan memperlakukannya sebagai noise (Carpenter & Grossberg, 1988).
14
2.6.1 Arsitektur Algoritma ART 2 Arsitektur dasar dari algoritma ART 2 membentuk tiga grup neuron, layer input (layer F1), layer cluster (layer F2), dan layer yang mengontrol derajat kesaman dari pola yang ditempatkan pada cluster yang sama (layer reset). Orienting Sub-System
Attentional Sub-System
ρ
Y1
Yj
Yn
F2 Layer
tij
bij R pi Cpi
qi Normalization bf(qi)
ui
vi F1 Layer
Normalization aui
f(xi)
wi
xi Normalization
si
Gambar 2.2 Typical arsitektur dari algoritma ART 2 (Carpenter & Grossberg, 1987)
Untuk mengontrol kesamaan pola yang ditempatkan pada satu cluster terdapat dua penghubung yang digunakan, yaitu untuk menghubungkan layer F1 dengan layer F2 adalah bobot bottom-up (bij). dan untuk menghubungkan layer F2 dengan layer F1 adalah bobot top-down (tji). Layer F1 pada ART2 terdiri dari enam tipe unit yaitu w, x, u, v, p dan q. terdapat n unit dari tiap tipe (dimana n adalah dimensi dari vektor input). Unit tambahan diantara w dan x menerima semua sinyal dari unit w melakukan normalisasi unit w, dan mengirim tiap sinyal ke unit x, proses serupa juga terjadi pada unit tambahan diantara unit p dan q dan unit tambahan diantara unit v dan q. Simbol penghubung yang terdapat antara berbagai unit dalam layer F1 mengindikasikan bahwa tranformasi terjadi pada sinyal yang melalui satu tipe ke tipe berikutnya. Simbol penghubung antara unit tipe p (pada layer F1) dan y (pada layer F2) menunjukkan bahwa bobot dikali dengan sinyal yang ditranmisikan pada penghubung tersebut. Aktivasi dari pemenang pada layer F2 adalah d,
15
dimana 0 < d < 1. Simbol penghubung dengan garis terputus-putus menggambarkan proses normalisasi. Detail hubungan yang melibatkan unit tambahan N yang terdapat diantara unit w dan x, unit u dan v dan unit p dan q digambarkan pada Gambar 2.3 : wn
wi
w1
xn
N
xi
x1
Gambar 2.3. Detail unit tambahan diantara unit tipe w dan x (Fausset, 1993)
Tiap proses yang terjadi berserta komputasinya dideskripsikan sebagai berikut (Fausset, 1993), Sinyal input s = {s1, …., si, ….., sn} secara bertahap dikirim untuk dikomputasikan dalam algoritma ART2, pada mulanya semua aktivasi di set nol. Komputasi dimulai dari unit u kemudian sinyal dari tiap unit u dikirim ke asosiasi unit w dan p. Aktivasi dari unit w dan p kemudian dikomputasi. Unit w menjumlahkan sinyal yang diterima dari unit u dan sinyal input s, dan unit p menjumlahkan sinyal yang diterima dari unit u dan sinyal bobot top-down (tij) yang diterima jika terdapat unit F2 yang aktif. Aktivasi unit x dan q merupakan normalisasi dari unit w dan p kemudian diaplikasi sebuah fungsi aktivasi sebelum sinyal dikirim ke unit v dan unit v akan menjumlahkan sinyal yang diterima dari unit x dan q. Satu putaran untuk unit F1 telah selesai. Layer F1 akan mencapai equilibrium setelah mengalami dua kali proses update. Fungsi pada layer F1 hanya akan melakukan tindakan pada sinyal yang melebihi dari nilai penekanan derau (noise supperession) 𝜃, setelah unit F1 mencapai equilibrium unit p mengirim sinyalnya ke layer F2 dimana pemenang akan berkesempatan mempelajari pola input. Unit p dan unit u juga mengirimkan sinyal ke layer reset. Reset dapat dicek tiap waktu ketika menerima sinyal dari unit p. reset hanya akan dicek ketika terdapat unit pada layer F2 yang aktif setelah proses pengecekan reset dilakukan
16
akan didapatkan keputusan apakah suatu cluster mendapat hak untuk mempelajari pola input, jika tidak maka akan dipilih kandidat cluster unit lainnya. 2.6.2 Parameter ART 2 Pemilihan parameter pada algoritma ART 2 merupakan suatu hal yang penting dan harus dilakukan dengan baik karena merupakan komponen penting dalam menggunakan algoritma ART 2 baik tipe pembelajaran cepat atau tipe pembelajaran lambat. Parameter dalam algoritma ART 2 terdiri dari (Fausset, 1993) : n
: Jumlah komponen input.
a,b
: Nilai tetap yang dapat diinisialisasi sebagai 10 untuk masing-masingnya. Penginisialisasian nilai a,b dengan sama dengan 0 akan mengakibatkan ketidakstabilan namun pemilihan nilai selain 0 tidak berpengaruh signifikan.
c
: Diinisialisasi sebagai 0.1, pemilihan nilai yang lebih kecil memberikan keefektifan terhadap nilai parameter vigilance.
d
: Aktivasi dari unit pemenang dalam layer F2, nilainya harus dipilih hampir mendekati 1 misalkan 0.9 karena akan memberikan keefektifan terhadap nilai parameter vigilance.
𝜃
: Noise suppression, nilai ini didapat menggunakan rumus 𝜃 = 1/ 𝑛 dan fungsi ini berhubungan dengan fungsi aktivasi berikut : 𝑓 𝑥 =
𝛼
𝑥, 𝑥 ≥ 0 0, 𝑥 < 0
: Learning rate, pemilihan nilai learning rate yang kecil dapat mengakibatkan pembelajaran berlangsung lebih lambat baik dalam pembelajaran cepat maupun lambat, namun dengan learning rate yang kecil dapat memastikan bobot mencapai nilai equilibrium terutama pada pembelajaran lambat.
𝜌
: parameter vigilance, nilai parameter ini dapat diset dari 0 sampai 1 namun mengeset nilai parameter ini kurang dari 0.7 adalah kurang efektif karena sama saja artinya dengan mengeset nilainya menjadi 0
17
𝑏𝑗
: Nilai bobot bottom-up dapat ditentukan dengan menggunakan rumus 1
berikut, 𝑏𝑗 ≤ (1−𝑑)
𝑛
; semakin besar nilai bj dapat mengakibatkan
semakin banyaknya jumlah cluster yang terbentuk. 𝑡𝑗
: Inisialisasi nilai bobot top-down menggunakan nilai yang kecil sehingga dapat mencegah reset terjadi pada input pertama yang masuk dalam suatu cluster.
2.6.3 Komputasi Unit ART 2 Perhitungan untuk tiap unit w, x, u, v, p dan q akan dilakukan berulangulang dalam beberapa langkah dalam algoritma ART 2. Rumus untuk tiap unit w, x, u, v, p dan q dijelaskan sebagai berikut (Fausset, 1993): 𝑢𝑖 =
𝑣𝑖 𝑒+||𝑣||
………………………. (2.1) wi = si + aui
………………………
(2.2)
pi = ui
………………………
(2.3)
𝑠𝑖
𝑥𝑖 =
𝑒+ 𝑠
𝑞𝑖 =
𝑒+||𝑝||
𝑝𝑖
vi = f(xi) + bf(qi)
………………………. (2.4) ………………………
(2.5)
………………………
(2.6)
………………………
(2.7)
Dengan fungsi aktivasi : 𝑓 𝑥 =
𝑥 𝑖𝑓 𝑥 ≥ 𝜃 0 𝑖𝑓 𝑥 < 𝜃
2.7 Uji Validitas Cluster Uji validitas cluster digunakan untuk mengevaluasi hasil dari analisis cluster secara kuantitatif sehingga dihasilkan kelompok optimal. Kelompok optimal adalah kelompok yang mempunyai jarak yang padat antar individu dalam kelompok dan terisolasi dari kelompok lain dengan baik (Dubes and Jain, 1988). Indeks yang dijadikan tolak ukur dalam pengujian validitas cluster adalah indeks Silhouette. Indeks Silhouette menunjukkan objek mana yang baik dalam sebuah cluster dan objek mana yang berada ditengah dua cluster atau objek yang salah
18
terkelompok. Untuk tiap i-objek kalkulasikan rata-rata ketidaksamaan dari objek-i dengan semua objek lain pada cluster yang sama a(i), semakin cocok objek-i dalam suatu kelompok atau cluster nilai dari a(i) akan semakin kecil, kemudian untuk tiap cluster ulangi perhitungan rata-rata ketidaksamaan objek-i dengan semua objek lain yang berada pada cluster yang berbeda. Komputasinya ditunjukkan pada persamaan 2.8 berikut : (𝑏 𝑖 − 𝑎(𝑖))
𝑆 𝑖 = max {𝑎
𝑖 ,𝑏(𝑖)}
…………………………
(2.8)
Semakin dekat nilai s(i) terhadap 1 mengindikasikan a(i) bernilai rendah, hal tersebut berarti objek-i telah terkelompok secara baik, jika nilai dari s(i) adalah 0 hal tersebut berarti objek-i berada sama jauh diantara dua cluster dan jika nilai s(i) mendekati -1 hal tersebut berarti objek-i berada pada kondisi terburuk karena lebih dekat dengan cluster yanp bukan merupakan kelompok dimana objek-i berada. Cluster yang memiliki perhitungan rata – rata keseluruhan s(i) yang terbesar merupakan cluster terbaik (GSu) seperti yang diformulasikan pada persamaan 2.9 berikut : 𝐺𝑆𝑢 =
1 𝑛
𝑛 𝑖=1 𝑠(𝑖)
………………………….
(2.9)