PENERAPAN DATA MINING UNTUK PENGELOMPOKAN MINAT KONSUMEN TERHADAP PRODUK LG MOBILE PALEMBANG Rino Riandi Agustin1, M. Akbar, M.IT.2, Siti Sa’uda, M.kom.3 Mahasiswa Universitas BinaDarma1, Dosen Universitas BinaDarma2, Dosen Universitas BinaDarma3 Program Studi Informatika, Fakultas Ilmu Komputer, Universitas Binadarma Jl.Ahmad Yani No.12 Plaju Palembang
Pos-el :
[email protected],
[email protected] [email protected]
Abstract : The variety of brands , types and models of mobile phones that are offered provide plenty of choice for consumers . So do not rule out a consumer will switch other perceived kemerek have advantages compared with the previously used brand . The ability of the technology to store data , process data , extract the data , analyze the data , and summarize data to produce an information that support the decision of the election it is still lacking . With the existence of this problem then comes techniques and new knowledge in processing the data into information . Judging from the number of consumer interest towards mobile phone is probably the application of data mining by the method of clustering and K -Means algorithm can help PT . LG Mobile Palembang in the grouping of consumer interest . Keywords: Data Mining, Clustering,Weka, Algoritma K-Means.
Abstrak : Bervariasinya merek, jenis, serta model handphone yang ditawarkan memberikan banyak pilihan bagi konsumen. Sehingga tidak menutup kemungkinan seorang konsumen akan beralih kemerek lain yang dirasakan memiliki kelebihan disbanding dengan merek yang dipakai sebelumnya. Kemampuan teknologi untuk menyimpan data, mengolah data, mengekstrak data, menganalis data, dan meringkas data untuk menghasilkan sebuah informasi yang menunjang kegiatan pemilihan keputusan dirasa masih kurang. Dengan adanya masalah ini maka munculah teknik dan ilmu baru dalam mengolah data menjadi informasi. Dilihat dari banyaknya minat konsumen terhadap telfon genggam mungkin penerapan data mining dengan metode clustering dan algoritma K-Means dapat membantu PT. LG Mobile Palembang dalam pengelompokan minat konsumen. Kata kunci : Data Mining, Clustering,Weka, Algoritma K-Means.
1.
yang memudahkan kinerja manusia. Akan
PENDAHULUAN
tetapi teknologi yang canggih sering sekali Pesatnya
dunia
tidak diimbangi dengan penyajian informasi
teknologi dan informasi saat ini, berdampak
yang memadai. Data yang cukup besar juga
pada kebutuhan informasi yang akurat serta
terkadang
cepat
informasi yang akurat, karena masih banyak
didalam
perkembangan
kehidupan
sehari-hari.
Dimana teknologi informasi sangat berperan penting dalam kehidupan sekarang dan yang akan datang. Hal ini bisa dilihat dari pemanfaatan teknologi dalam bidang apapun
akan
sulit
diolah
menjadi
kekurangan dari berbagai aspek. Kemampuan sebuah teknologi untuk menyimpan
data,
mengolah
data,
mengekstrak data, menganalis data, dan
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
1
meringkas data guna menghasilkan sebuah
merupakan
informasi
bergerak
yang
menunjang
kegiatan
sebuah
perusahaan
dibidang
penjualan
yang produk
pemilihan keputusan dirasa masih kurang.
handphone, dan produk yang dimiliki LG
Dengan munculnya masalah ini maka timbul
Mobile sendiri memiliki bermacam-macam
lah teknik dan ilmu baru dalam mengolah
tipe handphone. Oleh karena itu, perusahaan
data menjadi informasi. Salah satunya
ini
dengan teknik Data Mining untuk mengatasi
penentuan jumlah penyediaan tipe jenis
suatu masalah penggalian informasi atau
barang karena konsumen memiliki selera
pola yang penting atau menarik data dalam
berbeda dalam tipe pembelian handphone,
jumlah yang besar. Data mining bisa
dan dengan penerapan data mining untuk
memberikan pengetahuan-pengetahuan yang
pengelompokan minat konsumen diharapkan
sebelumnya tersembunyi di dalam gudang
dapat membantu LG Mobile Palembang
data sehingga dapat menjadi informasi yang
dalam
berharga.
sebuah produk sebelum dijual. Data mining
Data
mining
dalam
prosesnya
menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengektraksi dan mengidentifikasi informasi yang
bermanfaat serta suatu
pengetahuan yang terkait dari berbagai database yang besar (Turban, dkk. 2005). Kemajuan teknologi informasi juga
sering
mengalami
kendala
mempertimbangkan
merupakan
solusi
produk-produk konsumen,
untuk
yang
agar
dalam
kemungkinan
memprediksi
diminati
dapat
oleh
meminimalisir
kerugian dan bertumpuknya suatu produk yang berdampak buruk bagi perusahaan. Dengan adanya masalah dan solusi tersebut untuk mengatasi keadaan dimana perusahaan
LG
Mobile
Palembang
membutuhkan
sebuah
informasi
untuk
memprediksi
suatu
produk.
Untuk
Pelembang, karena perusahaan ini memiliki
mengimplementasikan
penulis
tertarik
database yang besar. Sehingga dalam
dengan masalah tersebut, sehingga penulis
pengolahan
akan
dirasakan
oleh
data
Produk
yang
LG
besar
Mobile
tersebut
menuangkan
penelitiannya
dalam
perusahaan memerlukan teknologi untuk
bentuk penulisan skripsi yang berjudul
mengetahui
“Penerapan
informasi
yang
dibutuhkan
Data
Mining
dalam meningkatkan kinerja dan pendapatan
Pengelompokan
dari hasil usaha. LG Mobile Palembang
Terhadap Produk PT. LG”.
Minat
Untuk
Konsumen
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
2
2.
TINJAUAN PUSTAKA
2.1.
Produk Menurut Fandy Tjiptono (2008),
Atribut Produk adalah unsur-unsur produk yang dipandang penting oleh konsumen dan dijadikan dasar pengambilan keputusan. Atribut Produk meliputi merek, kemasan, jaminan(garansi), pelayanan,dan sebagainya. 2.2.
2.4.
Data Mining
digunakan
Algoritma K-Means Dalam
Data mining adalah suatu istilah yang
Gambar 2.1. Clustering
dan
mesin
pembelajaran K-means merupakan metode
menguraikan
analisis kelompok yang mengarah pada
penemuan pengetahuan di dalam database.
permatisian N objek pengamatan dalam K
Data
yang
kelompok (cluster) dimana setiap objek
menggunakan teknik statistik, matematika,
pengamatan dimiliki oleh sebuah kelompok
kecerdasan buatan, dan machine learning
dengan mean (rata-rata) terdekat.1.
untuk mengekstraksi dan mengidentifikasi
Barang, yaitu berisi data produk. Atribut
informasi yang bemanfaat dan pengetahuan
yang ada dapat dilihat dalam tabel tabel 1.
yang terkait dari berbagai database besar
2.4.1
mining
untuk
statistik
adalah
proses
(Kusrini & Luthfi. 2009). 2.3.
Data
Penerapan Clustering K-Means memisahkan data ke k
Clustering
daerah bagian yang terpisah, dimana k
Clustering termasuk metode yang
adalah bilangan integer positif. Algoritma
sudah cukup dikenal dan banyak dipakai
K-Means sangat terkenal karena kemudahan
dalam data mining. Sampai sekarang para
dan kemampuannya untuk mengklasifikasi
ilmuwan dalam bidang data mining masih
data besar dan outlier dengan sangat cepat.
melakukan berbagai usaha untuk melakukan
Berikut adalah langkah-langkah algoritma
perbaikan model clustering karena metode
K-Means :
yang dikembangkan sekarang masih bersifat heuristic. Usaha-usaha untuk menghitung jumlah
cluster
yang
optimal
dan
pengklasteran yang paling baik masih terus
1. Penentuan pusat cluster awal Pusat awal cluster didapatkan dari data sendiri bukan dengan menentukan titik
dilakukan. Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
3
baru, yaitu dengan menrandom pusat awal
generalisasi/formulasi dari sekumpulan data
dari data.
sampling.
2. Perhitungan jarak dengan pusat cluster
3
Untuk mengukur jarak antara data
ANALISIS DATA MINING
3.1 Analisis Data
dengan pusat cluster digunakan Euclidian
Analisis
data
dilakukan
untuk
distance. Algoritma perhitungan jarak data
memperoleh gambaran sistem yang akan
dengan pusat cluster
dibuat dan langkah-langkah dalam model
3. Pengelompokkan data
arsitektur sistem mengikuti proses dari
Jarak
hasil
perhitungan
akan
dilakukan perbandingan dan dipilih jarak
Knowledge Discovery in Database (KDD). 3.1.1 Data Selection
terdekat antara data dengan pusat cluster,
Data dalam penelitian ini bersumber
jarak ini menunjukkan bahwa data tersebut
dari PT. LG Mobile Palembang. Adapun
berada dalam satu kelompok dengan pusat
data tersebut terdiri dari data barang, dan
cluster terdekat.
data store name mulai dari tahun 2015.
4. Penentuan pusat cluster baru
Atribut
Untuk mendapatkan pusat cluster baru bisa dihitung dari rata-rata nilai
Type_hp
Type produk/barang
Model_Hanphone
Nama model Handphone
anggota cluster dan pusat cluster. Pusat cluster baru = x1+x2+x3…..+xn+xp
Keterangan
Tabel 3.1 Tabel Atribut Data Barang
Jumlah+1
Data Store Name, yaitu data yang
Dimana :
berisi nama toko yang menjual produk-
x1,x2,x3,….xn=anggota cluster
produk LG Mobile. Atribut dapat dilihat
xp
dalam table 3.2
2.5.
= pusat lama WEKA
Atribut
Weka adalah aplikasi data mining
Keterangan
Id_Toko
Kode Toko
open source berbasis java. Aplikasi ini
District
Wilayah/Tempat Store
dikembangkan pertama kali oleh Universita
Store_Nm
Nama Toko
Waikato di Selandia Baru. Weka terdiri dari
Nm_Hp
Nama Model Handphone
koleksi algoritma machine learning yang dapat
digunakan
untuk
melakukan
Tabel 3.2 Tabel Atribut Store Name
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
4
Data pegawai, yaitu data yang berisi promoter
atau
pegawai
yang
menjual
produk. Data ini hanya menyimpan kode pegawai. Atribut
Keterangan
CRI_ID
Kode Pegawai
Nm_Pegawai
Nama Pegawai
Tabel 3.4 Data yang mengandung missing value
Tabel 3.3 Tabel Atribut Pegawai 3.1.1
Pre-processing Langkah-langkah
yang
dilakukan
dalam tahapan pre-processing menghasilkan dataset yang bersih (clean) sehingga dapat digunakan dalam tahap selanjutnya yaitu mining dengan tujuan mendapatkan pola nilai yang terjadi dalam seluruh semester yang
telah
merupakan
dilalui. tahap
Data
Cleaning
pembersihan
data
merupakan tahap awal dari KDD. 3.1.2.1 Data Cleaning Pada proses Data Cleaning di dapat beberapa atribut yang akan digunakan untuk proses mining berikutnya. Adapun atribut-
Tabel 3.5 Data yang relevan dan tidak redundant Tabel 3.5 diatas menggambarkan data yang mengandung missing value dan tidak relevan dibersihkan sehingga diperoleh data yang sudah relevan sehingga dapat diproses ke tahap mining berikuntya.
atribut tetap terbagi menjadi 2 kelompok data yaitu data toko dan data barang.
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
5
3.1.2.2 Integrasi Data Integrasi
Data,
3.1.2 Transformasi Data merupakan
Tahap transformasi data yaitu tahap
penggabungan data dari berbagai sumber.
dimana data dirubah menjadi bentuk yang
Adapun dataset dari toko yang digunakan
sesuai untuk data mining. Jika data belum
barasal dari berbagai sumber yang nantinya
terbentuk menjadi data yang dapat diproses
digabungkan menjadi satu tabel.
mining,
maka
harus
dilakukan
tahap
cleaning. Dalam proses ini jika diperlukan Toko -id_toko : Char -distrik : Char -store_nm : Pegawai Char -pegawai -type_hp : Char Integer nm_pegawai : CharGambar 3.6.
dapat ditambahkan atribut bantu diluar NewTable -id_toko : Char -distrik : Char -store_nm : Char -type_hp : Integer Integrasi-pegawai Data : char
atribut yang sudah ada dari data yang di dapat. 4. HASIL DAN PEMBAHASAN 4.1.1 Proses Clustering Algoritma KMeans Pada tahap ini akan dilakukan proses
Tabel pegawai memiliki atribut yang
utama yaitu segmentasi data nilai yang
terdiri dari id pegawai dan nama pegawai.
diakses dari database yaitu sebuah metode
Data ini nantinya diintegrasikan dengan
clustering algoritma K-Means. Berikut ini
tabel toko yang sudah relevan sehingga tabel
merupakan diagram flowchart dari algoritma
toko memiliki kelengkapan data yang lebih
K-Means.
informatif.
1. N data : data set yang akan diolah sebanyak N data dimana N data tersebut terdiri dari atribut-atributnya N(D690, D855, D335, D295) 2. K centroid : Inisialisasi dari pusat cluster data adalah sebanyak K dimana pusat-pusat awal tersebut digunakan sebagai banyaknya kelas yang akan
Tabel 3.7 Dataset Integrasi
tercipta. Centroid didapatkan secara random dari N data set yang ada. 3. Euclidian Distance: merupakan jarak yang didapat dari perhitungan antara
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
6
semua N data dengan K centroid dimana akan memperoleh tingkat kedekatan dengan kelas yang terdekat dengan
4.2 Proses Data Mining Menggunakan WEKA Setelah dijelaskan proses penerapan
populasi data tersebut.
data mining dengan teknik clustering secara
titik x = (x1, x2, x3, ... xn) dan titik y =
teroritis pada penjelasan diatas, maka kali
(y1, y2, y3, ... yn) adalah:
ini akan dijelaskan proses data mining secara aplikatif dimana proses data mining yang akan dilakukan menggunakan software data mining WEKA V.3.7.12.
Dimana, x : Titik data pertama, y : Titik data kedua, n : Jumlah karakteristik (attribut) dalam terminologi data mining, d(x,y) : Euclidian distance yaitu jarak antara data pada titik x dan titik y 4. Pengelompokkan sejumlah
data:
setelah
data
tersebut
populasi
menemukan kedekatan dengan salah satu centroid yang ada.
Gambar 4.1 Tampilan Awal Aplikasi WEKA Langkah pertama yang dilakukan untuk meng-import data kedalam WEKA
5. Update centroid baru: tiap kelas yang telah tercipta tadi melakukan update centroid baru. 6. Batas iterasi: apabila dalam proses clustering belum optimal namun sudah memenuhi batas iterasi maksimum, maka proses dihentikan. Gambar 4.2 Menu Utama WEKA Explorer
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
7
Kemudian lanjutkan dengan mengklik
Hasil dari grafik keseluruhan dapat
menu open file lalu pilih data yang akan
ditampilkan dengan mengklik menu pilihan
dibuka selanjutnya pilih open.
yang bertuliskan visualize all pada kolom selected attribute yang terletak dibawah tabel dan akan menghasilkan tampilan seperti pada gambar 4.5
Gambar 4.3 Menu import data Tampilah hasil dari import data tadi berupa
pengelompokan
berdasarkan
database
5
yang
atribut ada
Gambar 4.5 Grafik Atribut Keseluruhan
yaitu
Tanggal Penjualan, Nama Toko, Tipe Hp, Nama Pegawai, dan ID pegawai.
Proses berikutnya yaitu penggunaan metode Clustering yang dapat digunakan sebagai penentu nilai cluster yang telah diproses.
Gambar 4.4 Import data Penjualan Dari hasil import data penjualan dapat kita
Gambar 4.6 Proses Cluster
lihat hasil dari jumlah data per-atribut. Cara menampilkan tabel data dari atribut-atribut
Setelah algoritma telah di pilih pastikan
yang ada dengan mengklik satu persatu
pada kolom cluster mode ditandai pada
atribut yang akan dipilih.
menu yang bertuliskan use training set, setelah itu lanjutkan dengan mengklik start
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
8
4.3 Interpretation / Evaluation Interpretation atau Evalution merupakan pola informasi yang dapat dihasilkan dari proses data mining yang telah dilakukan, berdasarkan hasil tabel dan grafik
yang
sebelumnya.
dibahas
pada
penjelasan
Dari seluruh data penjualan
produk yang sering terjual pada produk
Gambar 4.7 Use Training Set
dapat dilihat dari tabel pada atribut store Hasil
dari
use
training
set
menampilkan hasil dari clusterer output yang
berisikan
nilai
cluster
centroids
berdasarkan 5 atribut yang digunakan.
Gambar 4.8 Classes to Clusters Store Name Gambar
4.8
menampilkan
pengelompokan clustering yang terdiri dari 2 iterasi, bertujuan untuk menunjukkan proses iterasi dan class pada cluster dengan jumlah record pada store name.
name yaitu Erafon Megastore. Sedangkan type hp yaitu type D335 yang paling di minati oleh konsumen. Berikut adalah grafik Cluster dari setiap atribut.
. Gambar 4.9 Grafik Cluster Gambar
4.9
menampilkan
grafik
cluster yang terdiri dari beberapa atribut yang telah di-cluster pada tools yang terdapat pada WEKA, bertujuan untuk menunjukkan peng-clusteran dalam sebuah data dengan jumlah record yang ada.
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
9
5.
SIMPULAN DAN SARAN
berbeda dan dengan jumlah data yang
5.1
Kesimpulan
lebih
Setelah melalui tahap-tahap proses
pengelompokan
besar
lagi
sehingga minat
prediksi konsumen
analisis data dan penerapan data mining
terhadap produk yang dihasilkan lebih
dengan menggunakan aplikasi Weka maka
akurat.
dapat diambil kesimpulan sebagai berikut: 1.
Penerapan
data
mining
dengan
2.
Pada penelitian yang akan dating, dapat menggunakan teknik data mining dan
teknik clustering dan algorima K-Means
algoritma
yang telah dilakukan menghasilkan sebuah
menggabungkan menjadi dua teknik data
informasi
prediksi
mining sehingga akan menghasilkan
pengelompokan minat konsumen terhadap
hasil yang variatif dan tentunya bernilai
produk LG Mobile Palembang.
informasi yang tinggi.
2.
mengenai
data
lainnya
ataupun
juga
Informasi mengenai data penjualan
3. Penelitian ini disarankan dapat menjadi
yang dihasilkan dari penerapan data mining
bahan referensi yang dipergunakan dan
yang dilakukan.
dikembangkan
3.
selanjutnya.
Semakin kecil batasan nilai data
untuk
penenlitian
transaksi penjualan yang ditentukan maka DAFTAR RUJUKAN
semakin sedikit pula pola/aturan yang dapat dihasilkan dan waktu yang diperlukan lebih
Anamida. 2011. Weka,
sedikit. 4.
http://www.scribd.com/doc/4901452
Store yang paling banyak melakukan
0/WEKA, diakses tgl 12 Juni 2015.
penjualan produk LG dari hasil analisa data mining adalah Erafon Megastore dan produk yang sering diminati konsumen adalah jenis
Fandy
Tjiptono,2008,
Strategi
Bisnis
Pemasaran. Andi. Yogyakarta.
tipe hape D335 yaitu LG Bello. 5.2. Saran Berdasarkan kesimpulan yang telah diuraikan di atas, maka ada beberapa saran
Kusrini & Luthfi. 2009. Algoritma Data Mining. Yogyakarta: Andi Offset.
perlu disampaikan sebagai berikut : 1. Pada
penelitian
selanjutnya
dapat
mencoba menggunakan dataset yang
Kotler, Philip and Gary Armstrong. 2008. Prinsip-prinsip Pemasaran. Edisi
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
10
12. Jilid 1. Jakarta: Erlangga.
Larose. 2005. Data Mining. Yogyakarta: Andi Offset.
Pramudiono, I. 2006. Apa itu Data Mining? Diakses tanggal 24 juli 2015. dari http://datamining.japati.net/cgibin/indodm.cgi.
Santoso, Budi. 2007. “Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis”, Graha Ilmu, Yogyakarta.
Turban. dkk., 2005, Decision Support System
and
Intelligent
System
(Sistem Pendukung Keputusan dan Sistem Cerdas), Andi, Yogyakarta.
Penerapan Data Mining Untuk Pengelompokan Minat Konsumen Terhadap Produk LG Mobile Palembang (Rino) |
11