IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA
NASKAH PUBLIKASI
diajukan oleh Burhan Alfironi Muktamar 10.11.3697
kepada SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER AMIKOM YOGYAKARTA YOGYAKARTA 2013
IMPLEMENTATION OF DATA MINING WITH NAIVE BAYES CLASSIFIER TO SUPPORTING MARKETING STRATEGY IN PUBLIC RELATIONS STMIK AMIKOM YOGYAKARTA IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA Burhan Alfironi Muktamar Erik Hadi Saputra Jurusan Teknik Informatika STMIK AMIKOM YOGYAKARTA ABSTRACT Data mining is a process to finding new patterns in the data by filtering large quantities. Search pattern data mining using pattern recognition technology which is similar to the statistical techniques and mathematical techniques. Patterns found are expected to provide useful information to produce economic benefits, effectiveness and efficiency. One method of data mining is the naive Bayes classifier is a data mining technique which has the ability of classification. Naive Bayes classifier algorithm can be used to predict interest the study based on the evidence given. Naive Bayes classifier algorithm is one method of data mining that can be used to support effective marketing strategies and efficient. The results of this research is the application of data mining algorithms are constructed using a naive Bayes classifier which can provide important information such as the results of predictions of interest in the study of students who could be used to help Team Marketing STMIK AMIKOM Yogyakarta. The data used is the student enrollment the previous year. Prediction of the results obtained, is expected to help to support the marketing strategies that have an impact on the effectiveness and efficiency of marketing and increasing the number of new students who enroll. Keywords : data mining, naive bayes classifier, classification
1.
PENDAHULUAN
1.1
Latar Belakang Masalah Banyak perusahaan dan instansi pemerintah yang menggunakan data mining
untuk menggali informasi. Informasi ini sangat berguna untuk meningkatkan keuntungan ataupun membantu dalam penyusunan strategi pemasaran. Selain perusahaan dan instansi pemerintah, penerapan data mining juga dilakukan dalam dunia pendidikan baik oleh perguruan tinggi negeri maupun swasta. Hal ini karena banyak perguruan tinggi yang berupaya untuk mendapatkan competitive intelligence. STMIK AMIKOM Yogyakarta merupakan salah satu perguruan tinggi swasta yang berkedudukan di Yogyakarta di bawah naungan Yayasan AMIKOM Yogyakarta. STMIK AMIKOM Yogyakarta merupakan sebuah perguruan tinggi hasil pengembangan 1
dari Akademi Manajemen Informatika dan Komputer "AMIKOM Yogyakartaβ . Salah satu penerapan data mining dengan naive bayes classifier dalam perguruan tinggi adalah untuk mengetahui minat dan ketertarikan calon mahasiswa baru terhadap program studi yang tersedia dengan memprediksi probabilitas keanggotaan suatu class. Informasi ini dapat digunakan untuk mendukung strategi pemasaran agar lebih efektif dan efisien. Dengan informasi ini suatu perguruan tinggi dapat mengetahui tingkat ketertarikan calon mahasiswa terhadap suatu program studi yang terdapat di perguruan tinggi tersebut. Sehingga perguruan tinggi dapat mengetahui serta menentukan target atau sasaran pasar dengan lebih rinci. Dengan demikian, di bagian Hubungan Masyarakat (HUMAS) STMIK AMIKOM Yogyakarta diperlukan suatu aplikasi data mining untuk menggali atau mencari informasi dari data pendaftaran tahun-tahun sebelumnya sebagai bahan evaluasi dan analisa untuk mendukung strategi pemasaran tahun berikutnya. Konsep bayesian classification ditujukan untuk memprediksi probabilitas di masa depan berdasarkan pengalaman di masa sebelumnya.
1
Anonim, Sejarah Berdirinya Sekolah Tinggi Manajemen Informatika dan Komputer AMIKOM Yogyakarta, http://www.amikom.ac.id/index.php/profile/history, diakses 12 Juli 2013 pukul 10.45.
1
2.
LANDASAN TEORI
2.1
Pengertian Data Mining Data mining, sering juga disebut knowledge discovery in database (KDD), adalah
kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari data mining ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan. Sehingga istilah pattern recognition sekarang jarang digunakan karena termasuk bagian dari data mining. (Santosa, 2007:10). Dalam prosesnya data mining menggunakan apa yang dihasilkan oleh data warehouse. Data warehouse adalah kumpulan data dari berbagai sumber internal maupun eksternal yang dikumpulkan menjadi satu dalam tempat penyimpanan yang berukuran besar yang bisa digunakan untuk pengambilan keputusan, dan bersifat berorientasi subjek, terintegrasi, time-variant, dan non-volatine. Data warehouse bertugas untuk menarik data dari basis data mentah untuk memberikan hasil data yang nantinya digunakan oleh proses data mining. 2.2
Konsep Klasifikasi Klasifikasi
dapat
didefinisikan
sebagai
pekerjaan
yang
melakukan
pelatihan/pembelajaran terhadap fungsi target f yang memetakan setiap set atribut (fitur) x ke satu dari sejumlah label kelas y yang tersedia. Pekerjaan pelatihan tersebut akan menghasilkan suatu model yang kemudian disimpan sebagai memori. (Prasetyo, 2012 : 45). Algoritma klasifikasi menggunakan data training untuk membuat sebuah model. Model yang sudah dibangung tersebut kemudian digunakan untuk memprediksi label kelas data baru yang belum diketahui. Dalam proses klasifikasi terdapat banyak algoritma yang telah dikembangkan oleh para peneliti seperti K-Nearest Neighbor, Artifical Neural Network, Support Vector Machine, Decision Tree, NaΓ―ve Bayes Classifier dan lain sebagainya. Setiap algoritma dalam klasifikasi data mining tersebut memiliki kelebihan dan kekurangan. Tetapi prinsip dari masing-masing algoritma tersebut sama, yaitu melakukan suatu pelatihan sehingga di akhir pelatihan model dapat memprediksi setiap vektor masukan ke label kelas output 2
dengan tepat . Salah satu pengukur kinerja klasifikasi adalah tingkat akurasi. Sebuah sistem dalam melakukan klasifikasi diharapkan dapat mengklasifikasi semua set data dengan 3
benar, tetapi tidak dipungkiri bahwa kinerja suatu sistem tidak bisa 100% akurat .
2
Eko Prasetyo, Data Mining Konsep dan Aplikasi Menggunakan Matlab, Yogyakarta : Penerbit Andi, 2012, hal 46. 3 Ibid, hal 48.
2
ο·
Untuk menghitung akurasi digunakan formula : Akurasi =
π½π’ππππ πππ‘π π¦πππ πππππππππ π π πππππ πππππ ππ’ππππ πππππππ π π¦πππ ππππππ’πππ =
ο·
Untuk menghitung kesalahan prediksi (error) digunakan formula: Error
=
π½π’ππππ πππ‘π π¦πππ πππππππππ π π πππππ π ππππ ππ’ππππ πππππππ π π¦πππ ππππππ’πππ =
2.3
π11 + π00 π11 + π10 + π01 + π00
π10 + π01 π11 + π10 + π01 + π00
Konsep Naive Bayes Classifier Teori keputusan Bayes adalah pendekatan statistik yang fundamental dalam
pengenalan pola (pattern recognition). Pendekatan ini didasarkan pada kuantifikasi tradeoff antara berbagai keputusan klasifikasi dengan menggunakan probabilitas dan ongkos yang ditimbulkan dalam keputusan-keputusan tersebut .(Santosa, 2007:75). Naive bayes classifier merupakan salah satu metode yang digunakan dalam data mining yang didasarkan pada teori keputusan Bayes. Naive bayes classifier memiliki kemampuan klasifikasi seperti metode decision tree dan neural network. Metode ini dapat 4
digunakan untuk memprediksi probabilitas keanggotaan suatu class . Seperti yang dikatakan Eko Prasetyo (2012:61), formulasi Naive Bayes Classifier adalah sebagai berikut : P YX =
P(Y)
q i=1 P(Xi |Y)
P(X)
Dimana untuk formula diatas : ο·
P(Y|X) adalah probabilitas data dengan vector X pada kelas Y.
ο·
P(Y) adalah probabilitas awal kelas Y.
ο·
q i=1 P(Xi |Y)
adalah probabilitas independen kelas Y dari semua fitur dalam
vector X. ο·
Nilai P(X) selalu tetap sehingga dalam perhitungan prediksi nantinya tinggal menghitung bagian P(Y)
q i=1 P(Xi |Y)
dengan memilih yang terbesar sebagai
kelas yang dipilih sebagai hasil prediksi. Naive Bayes Classifier (NBC) membutuhkan jumlah record data yang sangat besar untuk mendapatkan hasil yang baik. Jika kategori prediktor tidak ada dalam data training, maka naive bayes classifier mengasumsikan bahwa record baru dengan kategori predictor memiliki probabilitas nol.
4
Kusrini, dan Emha, Taufiq Luthfi, Algoritma Data Mining, Yogyakarta : Penerbit Andi, 2009, hal 189.
3
3.
ANALISIS DAN PERANCANGAN SISTEM
3.1
Analisis PIECES
3.1.1
Analisis Kinerja Sistem (Performance Analysis) Dari analisa kinerja di HUMAS STMIK AMIKOM Yogyakarta didapatkan hasil
seperti yang ditampilkan pada tabel 3.1. Tabel 3.1 Analisis Kinerja (Performance Analysis) Parameter
Sistem Lama Jumlah total pendaftar pada tahun ajaran 2013/2014 yang dihasilkan
Throughput
dari proses marketing kurang lebih sebesar 10.000 orang. Kemudian yang melakukan verifikasi pendaftaran sebesar 5.168 orang dan diterima sebesar 2080 orang.
Respontime
3.1.2
Respontime untuk pelayanan marketing dari customer service marketing kurang lebih 10 menit/orang.
Analisis Informasi (Information Analysis) Dari analisa informasi di HUMAS STMIK AMIKOM Yogyakarta didapatkan hasil
seperti yang ditampilkan pada tabel 3.2. Tabel 3.2 Analisis Informasi (Information Analysis) Parameter
Sistem Lama Dari sistem yang lama belum ada informasi yang akurat
Akurat
berhubungan dengan hasil klasifikasi dan prediksi minat studi proses marketing. Untuk mendapatkan perhitungan informasi mengenai hasil
Tepat Waktu
analisa yang berhubungan dengan klasifikasi dan prediksi minat studi
serta
statistik
teknik
marketing
secara
manual
membutuhkan waktu kurang lebih 2 jam. Informasi secara umum yang berhubungan dengan data Relevan
pendaftar dalam proses marketing dinilai relevan karena dikelola dengan baik oleh Innovation Center.
3.1.3
Analisis Ekonomi (Economic Analysis) Dari analisa ekonomi di HUMAS STMIK AMIKOM Yogyakarta didapatkan hasil
seperti yang ditampilkan pada tabel 3.3.
4
Tabel 3.3 Analisis Ekonomi (Economic Analysis) Parameter
Sistem Lama Anggaran
Biaya
biaya
yang
dikeluarkan
untuk
proses
marketing
dialokasikan untuk pembuatan brosur, periklanan dengan berbagai media seperti televisi, koran, dan radio, kunjungan, serta proses marketing lainnya.
3.1.4
Analisis Kendali (Control Analysis) Dari analisa kendali di HUMAS STMIK AMIKOM Yogyakarta didapatkan hasil
seperti yang ditampilkan pada tabel 3.4. Tabel 3.4 Analisis Kendali (Control Analysis) Parameter Kontrol
Sistem Lama Kontrol terhadap data dilakukan oleh Innovation Center dengan melakukan back up data setiap malam. Keamanan dikelola dengan pemberian hak akses dan keamanan
Keamanan
database serta didukung dengan keamanan sistem operasi dan jaringan oleh Innovation Center.
3.1.5
Analisis Efisiensi (Efficiency Analysis) Dari analisa efisiensi di HUMAS STMIK AMIKOM Yogyakarta didapatkan hasil
seperti yang ditampilkan pada tabel 3.5. Tabel 3.5 Analisis Efisiensi (Efficiency Analysis) Parameter
Sistem Lama Dengan proses marketing yang dilakukan dan biaya yang
Efisien
dikeluarkan dihasilkan jumlah pendaftar kurang lebih 10.000 orang, sehingga proses marketing dinilai efisien.
3.1.6
Analisis Pelayanan (Service Analysis) Dari analisa pelayanan di HUMAS STMIK AMIKOM Yogyakarta didapatkan hasil
seperti yang ditampilkan pada tabel 3.6. Tabel 3.6 Analisis Pelayanan (Service Analysis) Parameter
Sistem Lama Pelayanan pada customer service marketing di STMIK AMIKOM
Pelayanan
Yogyakarta dilaksanakan dari jam 08.00 β 16.00 WIB pada hari senin sampai dengan jumat dan jam 08.00 β 14.00 WIB pada hari sabtu.
5
3.2
Analisis Kelayakan Sistem
3.2.1
Kelayakan Teknologi Kelayakan teknologi berhubungan dengan ketersediaan sarana pembuatan dan
implementasi sistem. Teknologi di STMIK AMIKOM Yogyakarta sangat baik, sehingga dapat mendukung proses pembuatan dan implementasi sistem. Di bagian HUMAS STMIK AMIKOM Yogyakarta sudah tersedia komputer dengan spesifikasi diatas standard yang diperlukan dan siap terkoneksi dengan Innovation Center untuk mengakses database yang berisi data-data yang diperlukan untuk diproses. Sehingga dari segi teknologi sistem dapat diusulkan layak untuk diterapkan. 3.2.2
Kelayakan Hukum Kelayakan hukum ditujukan untuk memberikan penilaian apakah sistem yang
dibuat melanggar hukum atau tidak. Di STMIK AMIKOM Yogyakarta, khususnya pada bagian
humas
dan
Innovation
Center
menggunakan
software
resmi
dalam
pengimplementasian sistem ini. Karena software yang berhubungan dengan sistem yang akan dibuat tersebut bersifat legal dan aplikasi yang dibuat tidak mengandung unsur SARA dan ponografi, maka secara hukum perancangan sistem ini dinilai layak untuk diterapkan. 3.2.3
Kelayakan Operasional Kelayakan operasioanal ditujukan untuk mengetahui kesiapan sumber daya
manusia di bagian Humas STMIK AMIKOM Yogyakarta. Sumber daya manusia di bagian Humas hampir semua mempunyai basic pendidikan pada bidang IT. Sehingga tidak ada masalah yang ditemukan dalam segi kelayakan operasional. 3.3
Perancangan Sistem
3.1
Perancangan Konsep Aplikasi ini memberikan informasi mengenai hasil klasifikasi dan prediksi minat
studi dari target marketing dengan menggunakan algoritma naive bayes classifier. Aplikasi ini memanfaatkan data pendaftar mahasiswa tahun-tahun sebelumnya sebagai sumber pengetahuan yang terdiri dari kota, jenis kelamin, asal sekolah dan jurusan. Kemudian dengan rumus perhitungan bayesian, aplikasi ini dapat melakukan perhitungan probability dan memberikan hasil prediksi minat studi dari data target yang diinputkan. Selain informasi mengenai hasil klasifikasi dan prediksi minat studi, aplikasi ini juga akan memberikan informasi tentang presentase keberhasilan dari masing-masing usaha marketing yang sudah dilakukan. Informasi tersebut akan disajikan dengan menggunakan chart agar lebih mudah dipahami. Selain itu, aplikasi ini juga akan memberikan
informasi
mengenai
usaha
marketing
keberhasilan paling tinggi di setiap kota yang diinputkan.
6
yang
memiliki
presentase
3.2
Flowchart Perancangan flowchart ini bertujuan untuk memberi gambaran bagaimana aliran
proses dari aplikasi untuk prediksi minat studi ini berjalan. Mulai dari awal ketika task menu prediksi minat studi diklik hingga tampil hasil prediksi minat studi.
Mulai
Input Data Target Marketing
Hitung Prior Probability ( P(Ci) )
Hitung Probability Attribut Target Marketing Terhadap Masing-Masing Class ( P(X|Ci) )
Hitung perkalian Prior Probability dengan Probability Attribut Target Marketing ( P(Ci) x ( P(X|Ci) )
Mencari nilai maksimal dari P(Ci) x ( P(X|Ci)
Tampil Hasil Prediksi
Selesai Gambar 3.1 Alur Aplikasi Program 3.3
Perancangan Interface Interface merupakan tampilan yang digunakan sebagai mediator interaksi antara
sistem yang dibuat atau sebuah perangkat dengan pengguna (user). Interface sangat berpengaruh terhadap penggunaan aplikasi untuk memberikan kemudahan terhadap user. Dibawah ini adalah perancangan interface aplikasi Smart Marketing.
7
3.3.1
Halaman Menu Utama Halaman menu utama adalah halaman awal dari aplikasi yang dibuat. Halaman
ini yang menampung menu-menu utama yang terdapat dalam aplikasi ini.
Gambar 3.2 Tampilan Halaman Menu Utama 3.3.2
Halaman Prediksi Minat Studi Halaman ini adalah halaman yang terdapat pada menu prediksi minat studi.
Halaman ini digunakan untuk melakukan perhitungan probability yang digunakan untuk memprediksi minat studi yang dimiliki target marketing.
Gambar 3.3 Tampilan Halaman Prediksi Minat Studi 3.3.3
Halaman Statistik Marketing Halaman ini adalah halaman yang terdapat pada menu statistik marketing.
Halaman ini digunakan untuk mengetahui tingkat keberhasilan langkah-langkah marketing yang digunakan.
8
Gambar 3.4 Tampilan Halaman Statistik Marketing 3.3.4
Halaman About Halaman ini adalah halaman yang terdapat pada menu about. Halaman ini
digunakan untuk memberikan informasi singkat mengenai aplikasi Smart Marketing.
Gambar 3.5 Tampilan Halaman About 3.3.5
Halaman Credit Halaman ini adalah halaman yang terdapat pada menu credit. Halaman ini
digunakan untuk memberikan informasi dan contact mengenai pembuat aplikasi Smart Marketing.
9
Gambar 3.6 Tampilan Halaman Credit 3.3.6
Halaman Help Halaman ini adalah halaman yang terdapat pada menu help. Halaman ini
digunakan untuk memberikan informasi mengenai manual program (bagaimana menggunakan) aplikasi Smart Marketing.
Gambar 3.7 Tampilan Halaman Credit
10
4.
HASIL PENELITIAN DAN PEMBAHASAN
4.1
Uji Coba Sistem dan Program
4.1.1
White-box Testing White-box testing dilakukan dengan menguji logika jalur program yang meliputi : 1. Menggunakan semua modul minimal satu kali untuk memberikan jaminan bahwa semua jalur program berfungsi seperti yang diharapkan. 2. Menggunakan semua keputusan logis pada sisi true dan false. 3. Mengeksekusi semua loop pada batasan operasional mereka.
Hasil yang didapatkan menunjukkan tidak adanya kesalahan logika dalam pemrograman. Pengujian syntax program dilakukan dengan pengecekan pada setiap listing program. Pada tool Microsoft Visual Studio 2010 jika terdapat kesalahan syntax maka akan ditunjukan dengan tanda error garis merah seperti yang ditunjukkan pada gambar 4.1. Setelah dilakukan pengecekan terhadap seluruh source code program menunjukkan tidak ada kesalahan syntax.
Gambar 4.1 Contoh Syntax Error 4.1.2
Black-box Testing Black-box testing dilakukan pada seluruh modul program untuk mengetahui
apakah program yang dibuat sudah sesuai dengan kebutuhan fungsionalnya. Tabel 4.1 Uji Coba Kebutuhan Fungsional No 1
2 3 4
Kebutuhan Fungsional
Keterangan
User dapat melakukan penginputan data target marketing yang berupa sekolah asal, kota, jenis kelamin, dan jurusan. Sistem
dapat
melakukan
perhitungan
probability
keanggotaan suatu class. User dapat menganalisa hasil output perhitungan probability. Sistem dapat memberikan hasil prediksi minat studi yang diinginkan oleh target marketing.
11
Terpenuhi
Terpenuhi Terpenuhi Terpenuhi
Sistem dapat memberikan statistik keberhasilan teknik 5
marketing berdasarkan dari informasi yang didapat oleh para
Terpenuhi
pendaftar untuk masuk STMIK AMIKOM Yogyakarta.
Hasil dari uji coba dari 1000 data testing dengan aplikasi Smart Marketing untuk prediksi minat studi ditampilkan pada daftar hasil uji coba prediksi minat studi (terlampir). Dengan menggunakan rumus (2.1), hasil uji coba prediksi minat studi tersebut mendapatkan nilai akurasi sebagai berikut : Akurasi =
927 = 0,927 = 92,7 % 1000
Dari perhitungan akurasi untuk kinerja klasifikasi didapatkan akurasi sebesar 92,7%, kemudian dengan hasil uji coba prediksi minat studi menggunakan rumus (2.2) didapatkan kesalahan prediksi (error) sebagai berikut : πΈππππ =
73 = 0,025 = 7,3 % 1000
Setelah dilakukan perhitungan kesalahan prediksi (error) dari 1000 data testing didapatkan bahwa kesalahan prediksi klasifikasi sebesar 7,3%. Tabel 4.2 Nilai Akurasi dan Kesalahan Klasifikasi (Error) Algoritma
Data Training
Naive Bayes
Data pendaftar
1000 data
Classifier
tahun 2009
pendaftar tahun
sampai dengan
2012 yang
2011
diambil secara
Data Testing
Akurasi
Error
92,7%
7,3%
acak
4.2
Pembahasan Interface Dalam aplikasi Smart Marketing ini terdiri dari beberapa interface yaitu Menu
Utama, Menu Prediksi Minat Studi, Menu Statistik Marketing, Menu About, Menu Credit, dan Menu Help.
4.2.1
Halaman Menu Utama Menu utama adalah halaman yang akan ditampilkan setelah user berhasil login,
pada menu utama ini terdapat beberapa pilihan menu yaitu Prediksi Minat Studi, Statistik Marketing, About, Credit, Help, Log Out, dan Exit.
12
Gambar 4.2 Tampilan Menu Utama 4.2.2
Halaman Prediksi Minat Studi Prediksi Minat Studi adalah halaman yang akan tampil ketika user menekan task
item Prediksi Minat Studi pada menu utama. Pada halaman Prediksi Minat Studi ini akan menampilkan combo box untuk input data target marketing berupa provinsi, kota, sekolah asal, jenis kelamin, dan jurusan. Pada halaman ini juga terdapat 2 tombol yaitu tombol PROSES dan tombol RESET. Selain itu pada halaman ini juga terdapat chart dan text field untuk menampilkan hasil dari prediksi minat studi.
Gambar 4.3Tampilan Prediksi Minat Studi 4.2.3
Halaman Statistik Marketing Statistik Marketing adalah halaman yang akan tampil ketika user menekan task
item Statistik Marketing pada menu utama. Pada halaman Statistik Marketing ini akan menampilkan combo box untuk memilih tampilan statistik, apakah ingin ditampilkan statistik marketing dari semua data yang ada atau berdasarkan kota yang dipilih. Pada halaman ini juga terdapat 2 tombol yaitu tombol PROSES dan tombol RESET. Selain itu pada halaman ini juga terdapat chart dan text field untuk menampilkan hasil dari perhitungan statistik marketing.
13
Gambar 4.4 Tampilan Statistik Marketing
4.2.4
Halaman About Halaman About adalah halaman yang akan tampil ketika user menekan task item
About pada menu utama. Pada halaman About ini akan menampilkan informasi singkat mengenai aplikasi Smart Marketing.
Gambar 4.5 Tampilan About 4.2.5
Halaman Credit Halaman Credit adalah halaman yang akan tampil ketika user menekan task item
Credit pada menu utama. Pada halaman Credit ini akan menampilkan informasi dari pembuat aplikasi ini.
14
Gambar 4.6 Tampilan Credit 4.2.6
Halaman Help Halaman Help adalah halaman yang akan tampil ketika user menekan task item
Help pada menu utama. Pada halaman Help ini akan menampilkan manual program untuk mempermudah user dalam mengoperasikan aplikasi Smart Marketing.
Gambar 4.7 Tampilan Help
15
5.
Kesimpulan Kesimpulan yang dapat diambil adalah sebagai berikut: 1. Smart Marketing adalah aplikasi data mining menggunakan algoritma naive bayes classifier yang dapat memprediksi minat studi terhadap program studi S1 Teknik Informatika, S1 Sistem Informatika, D3 Teknik Informatika, D3 Manajemen Informatika di STMIK AMIKOM Yogyakarta dari target marketing dengan harapan dapat mendukung strategi pemasaran khususnya di bagian HUMAS STMIK AMIKOM Yogyakarta. 2. Hasil dari uji coba 1000 data testing yang diambil secara acak dari data induk mahasiswa tahun 2012 dengan data training yang diambil dari data induk mahasiswa tahun 2009 sampai dengan 2011 menggunakan aplikasi Smart Marketing untuk prediksi minat studi didapatkan akurasi sebesar 92,7% dan error sebesar 7,3%.
5.1
Saran Untuk pengembangan lebih lanjut terhadap aplikasi Smart Marketing, ada
beberapa saran yang dapat diambil: 1.
Smart Marketing menggunakan data training dari data induk mahasiswa tahun 2009 sampai dengan 2011. Untuk menjaga akurasi prediksi minat studi, data training dapat diperbaharui dengan data induk mahasiswa tahun berikutnya.
2.
Selain variabel kota, sekolah, jenis kelamin, dan jurusan, untuk meningkatkan akurasi dapat ditambah variable baru seperti penghasilan orang tua.
3.
Jika kategori prediktor tidak ada dalam data training, maka naive bayes classifier mengasumsikan bahwa record baru dengan kategori predictor memiliki probabilitas nol. Untuk pengembangan berikutnya bisa dicoba dengan algoritma yang lain untuk mencari akurasi yang lebih tinggi seperti algoritma K-Nearest Neighbor, Artifical Neural Network, Support Vector Machine, Decision Tree, dan lain sebagainya.
4.
Variabel jurusan yang berasal dari sekolah kejuruan hanya terdapat STM untuk kejuruan industri dan SMEA untuk kejuruan administrasi. Untuk pengembangan berikutnya, variable jurusan bisa diinputkan lebih spesifik, misalnya : otomotif, elektro, tata boga dan lain sebagainya.
5.
Fitur statistik marketing hanya menggunakan data mahasiswa yang diterima di STMIK
AMIKOM
Yogyakarta.
Untuk
pengembangan
lebih
lanjut
dapat
menggunakan seluruh data mahasiswa yang mendaftar di STMIK AMIKOM Yogyakarta.
16
DAFTAR PUSTAKA
Anonim. 2010. Microsoft Visual C# 2010. Yogyakarta : Andi. Booch, G., James, R., dan Ivar, J. 1998. The Unified Modeling Language User Guide First Edition. Addison Wesley Professional. Hermawan, J. 2004. Analisa Desain dan Pemrograman Berorientasi Obyek denagn UML dan VB.NET. Yogyakarta : Andi. Kristanto, A. 2004. Rekayasa Perangkat Lunak (Konsep Dasar. Yogyakarta : Gava Media. Kusrini, dan Emha, T.L. 2009. Algoritma Data Mining. Yogyakarta : Andi. Prasetyo, E. 2012. Data Mining Konsep dan Aplikasi Menggunakan Matlab. Yogyakarta : Andi. Santoso, B. 2007. Data Mining : Teknik Pemanfaatan Data Untuk Keperluan Bisnis. Yogyakarta : Graha Ilmu. Yasin, V. 2012. Rekayasa Perangkat Lunak Berorientasi Objek Pemodelan, Arsitektur, dan Perancangan (Modeling, Architecture and Design. Jakarta : Mitra Wacana Media. Anonim. Sejarah Berdirinya Sekolah Tinggi Manajemen Informatika dan Komputer AMIKOM Yogyakarta. http://www.amikom.ac.id/index.php/profile/history. Diakses pada 12 Juli 2013 pukul 10.45 WIB. Anonim. Classification Diagram, http://philips.files.wordpress.com. Diakses pada 12 Juli 2013 pukul 15.00 WIB. Ardi.
Sejarah
Bahasa
Pemrograman
C#
(C
Sharp),
http://belajar-
csharp.blogspot.com/2011/07/sejarah-bahasa-pemrograman-c-csharp.html, Diakses pada tanggal 16 Juli 2013 pukul 11.25 WIB. Ashary,
F.
Pengertian
UML
(Unified
Modeling
Language).
http://fadhlyashary.blogspot.com/2012/06/pengertian-uml-unified-modeling.html. Diaskses pada 13 Juli 2013 pukul 15.00 WIB. Microsoft User Group Indonesia. Panduan Praktis Membuat UML dengan Microsoft Visio Studio
2010.
https://skydrive.live.com/view.aspx?cid=4D69ABBBB11E643B&resid=4D69ABBB B11E643B%21115&app=WordPdf. Diakses pada 13 Juli 2013 pukul 14.00. Raharja,
P.
2012.
Modul
UML.
www.pribadiraharja.com/neli/SKRIPSI/.../DAFTAR_SIMBOL.doc. Diakses pada 13 Juli 2013 pukul 15.30 WIB.
17