DATA MINING UNTUK MENGETAHUI TARGET PASAR PADA PENJUALAN BATIK DI KAMPUNG BATIK LAWEYAN (STUDI KASUS BATIK MAHKOTA LAWEYAN)
SKRIPSI
Disusun sebagai salah satu syarat menyelesaikan Jenjang Strata I pada Program Studi Teknik Informatika Fakultas Komunikasi dan Informatika Universitas Muhammadiyah Surakarta
Oleh : DODIK SETYAWAN HANDOKO NIM : L200090128
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA 2013
i
aug'r\tr
"I's'N
46II'00I
:)iN
g^lslns Jnsn^
*-----
frw II Emqlmqured
El06 [gf 91 nqpa
: rr?rep?pued Euuprs
: :
l Emqmqule4
luB8ueg
IreH
ruepp unpturp >In1m Fftuesp rmp euluedrp il?let 1uI
ftrlltglAVT YIOXHYIII XIIYfl SOSYX IOOIS) NYAffAtY"I XIIYA 9NT}dIAM)T Ifi XIIVS NVTYOfNfld YfiVd If,3UVI INHVIf,CNflIAI YTIINO SNINIW YIYO UVSYd
lnpnf ueEuep rsdplg
NVNfnIgSUfld NY'IIYIYH
016
III
xIN
''
'
;i'q;'
€{llslruoJul u€p rse{r u3{o(l
'nii6
'ii'
1e88ue1
euelres rele8 qeloradruau
{n1m
uelere.(srad n1es rlBIBs re8eqes Bruua1rp qelet 1ul Isdlqs
9Lbl'002:)IN
90':>IIN
(@ Yq'
I lfn8ued u"/v\oC
l Sulqturgurs4
@ 6lci ni\G''
!l
"tu88uur ePed
r[nBue6 u&raguedep rp uu{u?qeuedrp qe1e1
821060002'I
:hIIN
OXOCNYH NYATYAISS XIOOA qolo unsnslp uep ue4dersredrq
0uvru*rvr vroDrxrrr,tr xrrys snsyx ronrs) NY tr/t\VT XIIYS CNndI^[Y]t IO XIIYfl NYTY{lfNUd Y(IYd IflCUYI IOHYIf,CNSIAI XOINO ENINII{ YIY(I UYSYd
NYEYSf,ENf,{ NY}IYAYH
DAFTAR KONTRIBUSI
Dengan ini saya menyatakan bahwa skripsi ini tidak terdapat karya yang pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar pustaka. Berikut saya sampaikan daftar kontribusi dalam penyusunan skripsi : 1. Perancangan program aplikasi ini dengan bantuan internet dan buku yang dilampirkan pada daftar pustaka. 2. Aplikasi
yang
saya
gunakan
dalam
melakukan
perancangan
dan
pembangunan data warehouse sistem penjualan batik yaitu a. Weka 3.7.9 b. SQL Server Business Intelligence Development Studio 3. Saya menggunakan laptop dengan spesifikasi Computer Intel(R) Core i5 @ 2,27GHz (2CPUs) RAM 2.00 GB untuk membuat aplikasi ini.
iv
L6II'OOT: )tIN
90': )IN
w l Sulqulrqrus6
:rnqele8uew
o{opuBH uuner$ag
gl0z
's313
lunf
Ip
6suu{ems
Jp-uep u?rEuege>l uep
ue8uep lenq e,(es 1ul rsnqrrluo>l
.udumtntss Isl suls q?.4A?[Erm88uupeq e,(u5
rewp uep
rme:,r.l:u;ied uur{nuac
MOTTO DAN PERSEMBAHAN MOTTO : “Kapan seseorang akan mati ?.. Saat dia terkena tembakan ? tidak!.. Saat dia terkena penyakit mematikan? tidak!,.. Saat dia meminum sup dari jamur beracun? Juga tidak..Seseorang akan mati apabila dia telah dilupakan” -Dr. Hiluluk“Jangan hanya menghitung apa yang telah menghilang! Pikirkan apa saja milikmu yang masih tersisa” -Jinbei-
vi
PERSEMBAHAN : 1. Kepada Allah SWT yang selalu mendengarkan doa dan memudahkan jalan bagi umatnya. 2. Kedua orang tuaku tercinta, untuk kasih sayang yang tidak terbatas, untuk setiap petuah, setiap doa yang dipanjatkan untuk kesuksesanku, serta dukungan moril dan materiilnya yang tak akan pernah terbalaskan. 3. Kedua Adikku Dina dan Lufti yang telah memberikan semangat dalam mengerjakan skripsi. 4. Dian Arini Savitri yang memberi semangat saat saya malas mengerjakan skripsi dan yang telah menjadi partner dalam penyusunan skripsi. 5. Teman-teman satu perjuangan Sutarno, Rendy dan Jisnu yang selalu bersama kemana saja dan memberikan semangat untuk menyelesaikan tugas akhir ini. 6. Teman-teman jurusan teknik informatika kelas E yang memberikan dukungan dan kebersamaan dalam menyelesaikan tugas akhir ini sehingga selesai dengan baik. 7. Keluarga besar Teknik Informatika UMS, atas semua hal yang telah diberikan. 8. Semua pihak yang selalu ada di sekelilingku yang tidak bisa kusebutkan satu persatu.
vii
KATA PENGANTAR
Alhamdulillah, kami panjatkan syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi ini dengan judul “Data mining untuk mengetahui target pasar pada penjualan batik di kampung batik laweyan (studi kasus batik mahkota laweyan)”. Skripsi ini disusun untuk memenuhi kurikulum pada Program Studi Teknik Informatika Universitas Muhammadiyah Surakarta, sebagai kewajiban mahasiswa dalam rangka menyelesaikan program sarjana. Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan, oleh karena itu kritik saran yang membangun dari berbagai pihak sangat penulis harapkan demi perbaikan-perbaikan ke depan. Terwujudnya skripsi ini tidak lepas dari bantuan berbagai pihak. Oleh karena itu dalam kesempatan ini penulis ingin mengucapkan terima kasih yang sebesar-besarnya kepada : 1. Bapak Husni Thamrin, S.T, MT., Ph.D. selaku Dekan Fakultas Komunikasi dan Informatika Universitas Muhammadiayah Surakarta. 2. Bapak Dr. Heru Supriyono, S.T., M.Sc. selaku Ketua Jurusan Teknik Informatika Universitas Muhammadiayah Surakarta. 3. Ibu Endah Sudarmilah, S.T, M.Eng selaku pembimbing akademik selama kuliah.
viii
4. Bapak Husni Thamrin, S.T, MT., Ph.D. selaku pembimbing I yang telah memberikan, bimbingan, dan pengarahan kepada penulis sehingga dapat menyelesaikan tugas akhir ini. 5. Bapak Yusuf Sulistyo N, S.T., M.Eng selaku pembimbing II yang telah memberikan, bimbingan, dan pengarahan kepada penulis sehingga dapat menyelesaikan tugas akhir ini. 6. Segenap dosen dan karyawan prodi Teknik Informatika atas bantuan dan ilmu yang diberikan kepada penulis selama masa perkuliahan hingga dinyatakan mendapat gelar Strata 1. 7. Kepada orang tua yang selalu memberikan do’a, semangat dan motivasi dengan tiada hentinya kepada penulis. 8. Semua pihak yang tidak bisa disebutkan satu-persatu yang telah membantu hingga terselesainya skripsi ini. Akhirnya penulis berharap semoga skripsi ini berguna bagi semua pihak dan bermanfaat bagi penulis khususnya dan pembaca pada umumnya dalam menambah pengetahuan dan wawasan ilmu. Amiin.
Surakarta, Juni 2013
Penulis
ix
DAFTAR ISI
HALAMAN JUDUL........................................................................................
i
HALAMAN PERSETUJUAN .........................................................................
ii
HALAMAN PENGESAHAN ..........................................................................
iii
DAFTAR KONTRIBUSI.................................................................................
iv
MOTTO DAN PERSEMBAHAN ...................................................................
vi
KATA PENGANTAR .....................................................................................
viii
DAFTAR ISI ....................................................................................................
x
DAFTAR TABEL ............................................................................................
xiv
DAFTAR GAMBAR .......................................................................................
xvi
ABSTRAKSI ................................................................................................... xviii BAB I
BAB II
PENDAHULUAN ........................................................................
1
A. Latar Belakang Masalah .........................................................
1
B. Rumusan Masalah ..................................................................
3
C. Batasan Masalah .....................................................................
3
D. Tujuan Penelitian ....................................................................
4
E. Manfaat Penelitian ..................................................................
4
F. Sistematika Penulisan .............................................................
5
TINJAUAN PUSTAKA ..............................................................
7
A. Telaah Penelitian ....................................................................
7
B. Landasan Teori .......................................................................
11
1. Sistem penjualan ...............................................................
11
x
BAB III
2. Data Warehouse .................................................................
11
3. Decision Tree .....................................................................
11
4. Weka ...................................................................................
12
5. Data Mining .......................................................................
12
6. Proses Data Mining ...........................................................
13
METODOLOGI PENELITIAN ................................................
15
A. Waktu dan Tempat .................................................................
15
B. Peralatan Utama dan Pendukung ............................................
15
C. Alur Penelitian ........................................................................
15
D. Langkah Penelitian ..................................................................
18
1. Analisa Kebutuhan ............................................................
18
2. Mengumpulkan Data .........................................................
19
a. Data Pembeli ..............................................................
19
b. Data Produk ................................................................
20
c. Data Penjualan ............................................................
21
3. Menentukan Kebutuhan ....................................................
21
a. Memilih data yang dibutuhkan dari data yang tersedia (data warehouse) ...........................................
21
b. Perancangan Data Mart ..............................................
22
4. Perancangan dan Pembuatan Sistem .................................
22
a. Perancangan data mining ............................................
22
b. Menentukan Metode dan Algoritma ...........................
23
c. Integrasi teknik data mining ke dalam database ........
25
xi
BAB IV
d. Algoritma C45 ............................................................
26
e. Weka J48 ....................................................................
26
HASIL DAN PEMBAHASAN ...................................................
32
A. Hasil Penelitian ........................................................................
32
B. Analisa dan Pembahasan ..........................................................
32
1. Analisa dan Pembahasan Pohon Keputusan (Decision tree) ....................................................................................
32
a. Memilih atribut ............................................................
32
b. Menentukan root node..................................................
33
1) Menentukan entropy pada data atribut provinsi ....
34
2) Menentukan entropy pada data atribut bulan ........
36
3) Menentukan entropy pada data atribut kategori motif .......................................................................
37
c. Menentukan internal node ........................................... 1) Menentukan internal node dan leaf node bulan Januari ...................................................................
40
2) Membuat diagram internal node pada tiap bulan .
45
a)
Internal node bulan Februari ..........................
46
b)
Internal node bulan Maret ..............................
47
c)
Internal node bulan April ...............................
48
d)
Internal node bulan Mei ..................................
51
e)
Internal node bulan Juni .................................
53
f)
Internal node bulan Juli .................................
54
g)
Internal node bulan Agustus ..........................
56
xii
h)
Internal node bulan September ......................
58
i)
Internal node bulan Oktober ..........................
62
j)
Internal node bulan November .......................
63
k)
Internal node bulan Desember ........................
64
2. Analisa dan Pembahsan Implementasi data mining dengan aplikasi Weka 3.7.9 ...............................................
66
a. Pembuatann data Arff ..................................................
66
b. Aplikasi weka 3.7.9 ......................................................
67
c. Pengimplementasian
BAB V
data
mining
dengan
menggunakan weka ......................................................
69
KESIMPULAN DAN SARAN ...................................................
78
A. Kesimpulan ..............................................................................
77
B. Saran ........................................................................................
78
DAFTAR PUSTAKA
xiii
DAFTAR TABEL
Tabel 3.1
Data yang dibutuhkan untuk data mining...............................
22
Tabel 4.1
Tabel Atribut propinsi, bulan dan kategori Motif ..................
29
Tabel 4.2
Tabel entropy provinsi berdasarkan jenis batik .....................
31
Tabel 4.3
Tabel entropy bulan berdasarkan jenis batik ..........................
32
Tabel 4.4
Tabel entropy kategori motif berdasarkan jenis batik ............
33
Tabel 4.5
Hasil dari rata-rata entropy.....................................................
33
Tabel 4.6
Data Provinsi di bulan Januari ...............................................
35
Tabel 4.7
Nilai entropy setiap provinsi pada bulan Januari ...................
36
Tabel 4.8
Data Kategori Motif di bulan Januari.....................................
36
Tabel 4.9
Keterangan Pohon keputusan ................................................
37
Tabel 4.10
Hasil dari pohon keputusan bulan Januari .............................
38
Tabel 4.11
Hasil entropy pada masing masing bulan...............................
39
Tabel 4.12
Hasil dari pohon keputusan bulan Februari ...........................
40
Tabel 4.13
Hasil dari pohon keputusan Bulan Maret ...............................
42
Tabel 4.14
Hasil dari pohon keputusan Bulan April ................................
43
Tabel 4.15
Hasil dari pohon keputusan bulan Mei ..................................
45
Tabel 4.16
Hasil dari pohon keputusan bulan Juni ..................................
46
Tabel 4.17
Hasil dari pohon keputusan bulan Juli ...................................
48
Tabel 4.18
Hasil dari pohon keputusan bulan Juli untuk Jawa Barat ......
49
Tabel 4.19
Hasil dari pohon keputusan bulan Agustus ............................
50
Tabel 4.20
Hasil dari pohon keputusan bulan September ........................
53
xiv
Tabel 4.21
Hasil dari pohon keputusan bulan Oktober ............................
Tabel 4.22.
Hasil dari pohon keputusan bulan Oktober untuk Jawa
55
Tengah ...................................................................................
55
Tabel 4.23
Hasil dari pohon keputusan bulan Desember .........................
57
Tabel 4.23
Hasil dari pohon keputusan bulan November ........................
58
Tabel 4.24
Jenis batik yang diketahui setelah melalui proses data mining ....................................................................................
xv
68
DAFTAR GAMBAR
Gambar 3.1
Diagram Alur Penelitian (Flowchart) ....................................
15
Gambar 3.2
Data pembeli ..........................................................................
19
Gambar 3.3
Data produk ............................................................................
20
Gambar 3.4
Data Penjualan .......................................................................
21
Gambar 3.5
Rumus Matematis Entropy....................................................
24
Gambar 3.6
Pohon keputusan menunjukkan letak node ............................
24
Gambar 3.7
Pengelompokan teknik klasifikasi..........................................
25
Gambar 4.1
Rumus menentukan entropy ..................................................
30
Gambar 4.2
Rumus menentukan nilai Pb ............................................................................
30
Gambar 4.3
Rumus menentukan rata-rata entropy ....................................
31
Gambar 4.4
Root yang digunakan sebagi awal dari decision tree .............
34
Gambar 4.5
Pohon keputusan berdasarkan jenis batik bulan Januari ........
37
Gambar 4.6
Pohon keputusan berdasarkan jenis batik bulan Februari ......
40
Gambar 4.7
Pohon keputusan berdasarkan jenis batik bulan Maret ..........
41
Gambar 4.8
Pohon keputusan berdasarkan jenis batik bulan April ...........
43
Gambar 4.9
Pohon keputusan berdasarkan jenis batik bulan Mei .............
45
Gambar 4.10
Pohon keputusan berdasarkan jenis batik bulan Juni .............
46
Gambar 4.11
Pohon keputusan berdasarkan jenis batik bulan Juli ..............
48
Gambar 4.12
Pohon keputusan berdasarkan jenis batik bulan Agustus ......
50
Gambar 4.13
Pohon keputusan berdasarkan jenis batik bulan September ..
52
Gambar 4.14
Pohon keputusan berdasarkan jenis batik bulan Oktober ......
54
xvi
Gambar 4.15
Pohon keputusan berdasarkan jenis batik bulan November ...
56
Gambar 4.16
Pohon keputusan berdasarkan jenis batik bulan Desember ...
58
Gambar 4.17
Format pada data arff .............................................................
60
Gambar 4.18
Tampilan setelah membuka data Janis batik ..........................
61
Gambar 4.19
Memilih Metode J48 ..............................................................
62
Gambar 4.20
Memilih Test options dan memproses ...................................
62
Gambar 4.21
Data yang telah di proses .......................................................
63
Gambar 4.22
Diagram decision tree berdasarkan jenis batik.......................
64
xvii
ABSTRAKSI
Batik Mahkota Laweyan memiliki jenis dan model batik yang bermacam macam, banyak kombinasi jenis dan model yang telah dibuat baik dari pemesanan maupun untuk penjualan di showroom. Data penjualan yang telah dicatat dari hasil penjualan yang telah terkumpul selama ini hanya dijadikan sebagai pendataan barang atau laporan penjualan saja. Oleh karena itu ketersediaan data penjualan yang melimpah tersebut akan dimanfaatkan dalam bentuk analisa data mining sehingga dapat digunakan sebagai pendukung keputusan untuk membuat solusi bisnis yaitu dengan pengimplementasian data mining yang nantinya sebagai analisa pendukung keputusan dalam menentukan target pasar. Penggunaan
metode
klasifikasi
decision
tree
C.45
yang
telah
diimplementasikan pada aplikasi weka , atau sering disebut juga dengan decision tree J.48 yaitu klasifikasi pohon keputusan. Penerapan konsep pohon keputusan pada data di batik Mahkota Laweyan yang nantinya digunakan untuk menentukan target pasar berdasarkan jenis batik. Dengan pengimplementasian data mining menggunakan decision tree diketahui bahwa pada bulan Januari, Maret, April, Juni, Agustus, dan November jenis batik print adalah jenis batik yang paling digemari setiap provinsi. Dan pada bulan September dan desember setiap provinsi memilih jenis batik lain seperti tulis dan cap.
Kata kunci : Data Mining, Algoritma C.45, Weka J.48
xviii