Seminar Nasional Teknologi Informasi dan Komunikasi 2015 (SENTIKA 2015) Yogyakarta, 28 Maret 2015
ISSN: 2089-9815
APLIKASI SALES REPORT UNTUK KLASIFIKASI AREA PENJUALAN MENGGUNAKAN K-NEAREST NEIGHBOR DAN NAIVE BAYES BERBASIS ANDROID Budi Dwi Satoto1, Achmad Yasid2 Program Studi Manajemen Informatika, Fakultas Teknik,Universitas Trunojoyo Madura Jl. Telang PO BOX 2, Kamal, Bangkalan,69162 Telp. (031)3011146 2 Program Studi Manajemen Informatika, Fakultas Teknik, Universitas Trunojoyo Madura Jl. Telang PO BOX 2, Kamal, Bangkalan, 69162 E-mail:
[email protected] 1
ABSTRAKS Perkembangan pesat ilmu pengetahuan dan teknologi memberikan manfaat pada kalangan masyarakat dalam berbagai bidang. Salah satu penerapan teknologi seluler bidang bisnis adalah laporan penjualan produk Telkomsel. Tujuannya adalah mendapatkan report yang cepat, tepat dan akurat. Selain itu report dari lokasi menentukan klasifikasi area sales yang ideal . Aplikasi ini memaksimalkan handphone sebagai media bantu dalam penyusunan Laporan sales, klasifikasi area dan pengolahan data admin. Admin melakukan pemantauan melalui Global Positioning System (GPS) menggunakan layanan.Location Based Service (LBS) yang menyediakan informasi letak geografis perangkat mobile. Klasifikasi area dibutuhkan untuk membagi salesman dalam area yang sesuai jarak tempuh terdekatnya dalam wilayah yang telah ditentukan. Adapun hasilnya di dapat dari jarak tempuh dan volume sales. Klasifikasi menggunakan K-Nearest neighbor sementara akurasi prediksi dihitung menggunakan Naive Bayes dan didapatkan nilai akurasi 86% untuk mendapatkan cakupan wilayah operasional dan penempatan Salesman. Kata Kunci: location based service, k-nearest neighbor, Naive Bayes classifier 1. PENDAHULUAN 1.1 Latar Belakang Seiring dengan meningkatnya kemampuan perangkat seluler, maka kebutuhan akan kegunaan handphone dalam dunia kerja juga berkembang pesat. Implementasi reporting penjualan produk oleh salesman pada pelaksanaannya terdapat proses manual yang harus di lakukan oleh seorang salesman dan admin, sehingga aplikasi ini diharapkan mampu memanfaatkan reporting tersebut untuk menentukan klasifikasi area. Penelitian ini memanfatkan Location Based Service (LBS) yang menggunakan Lokasi spasial dalam sistem koordinat yang dipahami sebagai lintang-bujur ketinggian. Dimana Latitude adalah pengukuran sudut di pusat bumi utara atau selatan khatulistiwa sedangkan untuk Longitude adalah pengukuran sudut di pusat bumi, timur atau barat dari meridian utama yang berjalan dari kutub ke kutub melalui Greenwich (Kamarudin and Salam, 2011). 1.2 Rumusan Masalah Adapun rumusan masalah pada penelitian ini adalah sebagai berikut : a. Bagaimana cara mendapatkan klasifikasi area penjualan menggunakan posisi salesman pada saat melakukan reporting penjualan memanfaatkan fitur Location Based Station (LBS).
b. Bagaimana cara untuk mendapatkan klasifikasi area penjualan berdasarkan jarak tempuh dan nilai penjualan menggunakan K-Nearest neighbor. c. Bagaimana melakukan pengujian akurasi hasil klasifikasi k-NN menggunakan Naïve bayes untuk menentukan klasifikasi area yang sama. 1.3 Tujuan Adapun tujuan penulisan adalah Mendapatkan klasifikasi area salesman berdasarkan laporan dari area penjualan yang terkoneksi dengan server sistem informasi dengan mempertimbangkan jarak tempuh salesman dan volume penjualan pada masing masing counter, sehingga didapatkan klasifikasi area yang optimum untuk meminimalkan biaya transportasi. 1.4 Kajian Pustaka Adapun Penelitian sebelumnya menggunakan Location Based Station (LBS) adalah Pemantauan jumlah keluarga berbasis android. Aplikasi ini dibangun untuk para orang tua yang sibuk bekerja untuk mengetahui posisi anak atau anggota keluarga ketika sama-sama sedang berada di luar rumah. GPS dan akselerometri memberikan penilaian obyektif dari aktivitas fisik perjalanan sekolah dengan konteks di mana, kapan, berapa lama. Tujuannya Untuk menggambarkan pola aktivitas fisik selama proxy sekolah aktif dan memperkirakan aktivitas fisik yang masih dilakukan remaja selama perjalanan menuju dan pulang sekolah.(Voss, Winters, 2014). 199
Seminar Nasional Teknologi Informasi dan Komunikasi 2015 (SENTIKA 2015) Yogyakarta, 28 Maret 2015
1.5
Landasan Teori. Algoritma k-NN (k-Nearest neighbor) merupakan sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Data pembelajaran diproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi data pembelajaran (Yu, Liu, 2014). Sebuah titik pada ruang ini ditandai kelas c jika kelas c merupakan klasifikasi yang paling banyak ditemui pada k buah tetangga terdekat titik tersebut. Dekat atau jauhnya tetangga biasanya dihitung berdasarkan jarak Euclidean. Adapun persamaan euclidian distance ditunjukkan rumus 1.
D(a, b)
k 1 (ak bk )2 d
(1)
Dimana D(a,b) adalah jarak skalar dari dua buah vektor data a dan b yang berupa matrik berukuran d dimensi.untuk mengestimasi p(x) dari n training sample dapat memusatkan pada sebuah sel disekitar x dan membiarkannya tumbuh hingga meliputi k samples. Samples tersebut adalah KNN dari x. Jika densitasnya tinggi di dekat x, maka sel akan berukuran relatif kecil yang berarti memiliki resolusi yang baik. Jika densitas rendah, sel akan tumbuh lebih besar, tetapi akan berhenti setelah memasuki wilayah yang memiliki densitas tinggi. KNN memiliki beberapa kekurangan yang mempengaruhi keakuratan dari klasifikasi. Ini memiliki persyaratan memori yang besar serta kompleksitas waktu tinggi (Taneja, Gupta, 2014) Location Based Service (LBS) merupakan Layanan Berbasis lokasi yang dapat diakses melalui mobile device dengan mengunakan mobile network, yang dilengkapi kemampuan untuk memanfaatkan lokasi dari mobile device tersebut. LBS memberikan kemungkinan komunikasi dan interaksi dua arah. Oleh karena itu pengguna memberitahu penyedia layanan untuk mendapatkan informasi yang dia butuhkan, dengan referensi posisi pengguna tersebut. Layanan berbasis lokasi dapat digambarkan sebagai suatu layanan yang berada pada pertemuan tiga teknologi yaitu : Geographic Information System, Internet Service, dan Mobile Devices. Secara Garis besar jenis Layanan Berbasis Lokasi (Chen, Xia, 2014) Naive Bayes Classifier (NBC) merupakan sebuah pengklasifikasi probabilitas sederhana yang mengaplikasikan Teorema Bayes dengan asumsi ketidaktergantungan (independent) yang tinggi. Keuntungan penggunan NBC adalah bahwa metoda ini hanya membutuhkan jumlah data pelatihan (training data) yang kecil untuk menentukan estimasi parameter yang diperlukan dalam proses pengklasifikasian. Karena yang diasumsikan sebagai variable independent, maka hanya varians dari suatu
ISSN: 2089-9815
variable dalam sebuah kelas yang dibutuhkan untuk menentukan klasifikasi, bukan keseluruhan dari matriks kovarians ditunjukkan rumus 2 dan 3.
p(C | F1 ,..., Fn )
Posterior
p(C ) p( F1 ,..., Fn | C ) p( F1,...,Fn )
Pr ior * Likelihood Evidence
(2)
(3)
Menggunakan densitas kernel - Metode ini cocok untuk fitur dengan distribusi kontinu tanpa memperhatika apakah distribusi fitur miring atau memiliki beberapa puncak. Naïve bayes Classifier akan menghitung kernel terpisah estimasi densitas untuk setiap fitur berdasarkan data pelatihan kelas tertentu (Manap, Tahir, 2012). 2. PEMBAHASAN 2.1 Metodologi Penelitian. Adapun metodologi yang digunakan dalam penelitian ini dapat digambarkan dalam bentuk FlowChart : Start
Salesman mengirimkan reporting sales dan posisi dari lokasi penjualan dengan android
Server menerima data id salesman, posisi reporting dan volume sales
K-Nearest Neighboor menghitung berdasarkan Jarak tempuh dan Volume penjualan
Check kesesuaian kelas menggunakan naïve bayes
Laporan Penjualan Salesman, penentuan lokasi penjualan, biaya transportasi
Selesai
Gambar 1. FlowChart System FlowChart pada Gambar 1 menggambarkan alur masuk sistem melalui menu android menuju ke server database dan dilakukan pengolahan data menggunakan k-Nearest neighbor. Pada halaman utama terdapat beberapa menu seperti laporan, lihat counter, tambah counter, lihat produk, location, about, help dan exit. Jika memilih salah satu menu seperti report maka akan muncul detail laporan seperti id sales, nama sales, nama counter, banyak produk terjual pada hari itu, jam transaksi, tanggal, dan pengambilan lokasi sales. 200
Seminar Nasional Teknologi Informasi dan Komunikasi 2015 (SENTIKA 2015) Yogyakarta, 28 Maret 2015
Webserver akan menjalankan k-Nearest neighbor yang mengolah jarak tempuh dan volume sales yang telah diterima dari salesman di lapangan , dan melakukan klasifikasi setelah dibandingkan dengan data training, selanjutnya pada menu admin, terdapat pilihan menu daftar sales, maka akan tampil daftar nama salesman yang berada di area pada hari itu. Admin bisa menginputkan nama sales, menghapus daftar nama sales, dan mengeditnya, kemudian admin juga bisa membuat laporan daftar nama sales dalam bentuk pdf dan excel. Pada menu daftar counter, admin dapat menginputkan nama counter, menghapus dan mengeditnya. Pada menu laporan salesman, admin dapat melihat dan mengelola data laporan sales, membuat laporan data penjualan produk dalam bentuk dokumen pdf dan excel serta lokasi sales terupdate. Selanjutnya data lokasi diolah menggunakan K-Nearest neighbor seperti ditunjukkan pada Gambar 2. Start
Tentukan parameter K
Hitung jarak antara data yang akan dievaluasi dengan semua data pelatihan
Urutkan jarak yang terbentuk, dari jarak terkecil
2.2
ISSN: 2089-9815
Perancangan Perangkat Lunak.
Gambar 3. Use case diagram salesman Salesman harus melakukan Login untuk masuk menu aplikasi seperti ditunjukkan Gambar 3, memilih salah menu laporan di antaranya id_sales, jenis_produk, nama_counter, jumlah, tanggal, waktu, lokasi. Jika salesman memilih take lokasi maka akan ditampilkan lokasi latitude dan longitude posisi gps saat tersebut. Selanjutnya data langsung di kirimkan ke server beserta data laporan sales. Adapun Conceptual Diagram ditunjukkan gambar 4. .
Tentukan jarak terdekat sampai urutan K Pasangkan Kelas yang bersesuaian
Cari jumlah kelas dari tetangga yang terdekat dan tetapkan kelas yang akan dievaluasi
Selesai
Gambar 2. Flow Chart K-Nearest neighbor K-Nearest neighbor bekerja berdasarkan pada jarak terpendek dari testing sample ke training sample untuk menentukan K-Nearest neighbor nya. Setelah mengumpulkan K-Nearest neighbor,, kemudian diambil mayoritas anggota dari K-Nearest neighbor (KNN) untuk dijadikan prediksi dari sample uji. Pada fase klasifikasi, fitur-fitur yang sama dihitung untuk testing data atau yang klasifikasinya tidak diketahui. Jarak dari vektor baru yang ini terhadap seluruh vektor training sample dihitung dan sejumlah k buah yang paling dekat. Titik yang baru klasifikasinya diprediksikan termasuk pada klasifikasi terbanyak dari titik-titik tersebut.
Gambar 4. CDM Reporting Sales . 2.3
Data Pengamatan Adapun Training sample yang digunakan untuk menguji sistem ditunjukkan pada Tabel 1.
201
Seminar Nasional Teknologi Informasi dan Komunikasi 2015 (SENTIKA 2015) Yogyakarta, 28 Maret 2015
ISSN: 2089-9815
Tabel 1. Wilayah Surabaya,jarak tempuh dan sales bulanan
Gambar 6.Tampilan pengiriman laporan
2.4
Hasil Pengamatan Hasil dari penelitian ini adalah sebuah aplikasi Sales Report studi kasus pada PT Telesindoshop yang berjalan pada platform android. Tampilan login awal pada aplikasi ini ditunjukkan pada gambar 5.
Sementara di webserver, Halaman web server untuk administrator terdiri dari menu sales untuk mengelola data sales, daftar produk untuk mengelola data produk, daftar counter untuk mengelola data counter serta laporan untuk mengelola data laporan dari sales yang selanjutnya diolah menjadi laporan harian, mingguan. Laporan yang dihasilkan penelitian ini berupa Grafik penjualan harian terhadap nama counter. Dimana masing masing counter telah diklasifikasikan terlebih dahulu berdasarkan lokasi kecamatan terdekatnya. Selanjutnya data sales akan digunakan bersama dengan posisi sales untuk mendapatkan klasifikasi area yang tepat. Adapun laporan sales ditunjukkan pada Gambar 7.
Gambar 5. Tampilan Menu Salesman Tampilan setelah memilih menu pada tampilan android adalah form laporan pengiriman laporan antara lain adalah idsales, nama_produk, nama_counter, jumlah, jam, tanggal, Ambil lokasi. Jumlah disini maksudnya pengiriman data laporan banyak penjualan produk tersebut dalam satuan angka. Hal ini ditunjukkan pada gambar 6.
Gambar 7. Grafik Penjualan Kartu 2.5
Analisa Hasil Dari proses yang dilakukan menggunakan k-Nearest neighbor dengan mengubah nilai K setelah melakukan perhitungan jarak data training dengan data latih didapatkan jumlah area yang berbeda beda seiring bertambahnya k, seperti ditunjukkan pada Tabel 2. 202
Seminar Nasional Teknologi Informasi dan Komunikasi 2015 (SENTIKA 2015) Yogyakarta, 28 Maret 2015
Tabel 2. Jumlah Klasifikasi Area untuk masing masing nilai K
Tampak Dari Tabel 2, didapatkan jumlah klasifikasi area salesman berdasarkan pembagian wilayah dengan jarak tempuh dan value sales yang dihasilkan pada area penjualan. Seiring kenaikan nilai K, maka distribusi dekat dan sedang membesar, sementara distribusi jauh mengecil. Adapun dengan informasi ini, maka nilai K yang tepat diperlukan untuk mendapatkan hasil yang optimum. Hasil yang didapatkan menggambarkan wilayah dengan atribut jarak dan sales. Pengaturan nilai k diperlukan untuk mendapatkan jumlah keanggotaan kelas yang tepat dan paling mendekati keadaan sebenarnya. Untuk mendapatkan nilai yang tepat, pada penelitian ini ditambahkan algoritma naïve bayes. Hasil klasifikasi naïve bayes selanjutnya dibandingkan dengan hasil yang didapatkan pada algoritma k-NN. Selisih Keanggotaan K-NN dalam Naïve bayes digunakan untuk mengetahui seberapa presisi jumlah keanggotaan kelas yang telah terbentuk di k-NN. Jadi selain dengan mengatur nilai K, indikator yang dapat digunakan adalah nilai prosentasi ketepatan pemetaan jumlah keanggotaan yang diinginkan dalam 1 kelas tertentu. Setelah dilakukan pengaturan nilai K yang tepat, tampak distribusi Jarak Tempuh(km) dan sales bulanan(jt), dijembatani oleh perhitungan jarak terkecil euclidian dalam algoritma K-Nearest neighbor dengan menyesuaikan nilai K antara keduanya sehingga distribusi wilayah dekat, sedang dan jauh menjadi lebih proporsional. Hal ini ditunjukkan gambar 8.
ISSN: 2089-9815
Selanjutnya data hasil pelatihan Algoritma k-NN dijadikan Model kelas acuan untuk dibandingkan dengan Model Naïve bayes yang difungsikan sebagai prediction, selanjutnya anggota kelas akan dibandingkan tingkat kesuaiannya antara data latih dan masukan data uji seperti ditunjukkan pada gambar 9
Masukkan data latih (x,y)
Algoritma Pelatihan k-NN
Pembangunan Model kelas hasil k-NN
Masukkan Data uji (x)
Penerapan Model Naïve Bayes
Keluaran Data Uji (x,y)
Gambar 9. Proses Klasifikasi k-NN dan Naive Bayes Pada fase training, algoritma ini melakukan penyimpanan vektor-vektor fitur dan klasifikasi data training sample. Pada fase klasifikasi, fitur yang sama dihitung untuk testing data atau data yang klasifikasinya tidak diketahui. Jarak dari vektor baru terhadap seluruh vektor training sample dihitung dan sejumlah k buah yang paling dekat diambil. Titik yang baru klasifikasinya diprediksikan dengan naïve bayes, termasuk klasifikasi terbanyak dari titik-titik tersebut Nilai k yang terbaik untuk algoritma ini tergantung pada data yang digunakan. Nilai k yang tinggi akan mengurangi efek noise pada klasifikasi, tetapi membuat batasan antara setiap klasifikasi menjadi semakin kabur. Selanjutnya hasil dari KNearest neighbor dilakukan perbandingan menggunakan hasil Naïve bayes dan hasilnya seperti ditunjukkan Tabel 3. Tabel 3. Hasil Perhitungan Naïve bayes untuk Jarak dan sales
Gambar 8. Grafik Jarak Tempuh Salesman berbanding Sales Area Bulanan 203
P(good/bad)
50.00%
50.00%
P (Jarak=↓ | …
… | C=good)
… | C=bad)
Near
33.33%
0.00%
Middle
66.67%
13.33%
Far
33.33%
66.67%
P (Sales=↓ | …
… | C=good)
… | C=bad)
Good
55.56%
0.00%
Average
33.33%
13.33%
Poor
11.11%
66.67%
Seminar Nasional Teknologi Informasi dan Komunikasi 2015 (SENTIKA 2015) Yogyakarta, 28 Maret 2015
Selanjutnya Hasil perhitungan probabilitas nilai sales dan jarak diatas digunakan untuk mendapatkan nilai prediksi kelas, dan selanjutnya untuk mendapatkan nilai ketelitian dari Naïve bayes seperti ditunjukkan tabel 4.
3.
ISSN: 2089-9815
untuk mendapatkan value transportasi rata rata yang tepat untuk tiap kelas. Adapun kelas yang terbentuk diprediksi menggunakan algoritma Naive Bayes classifier dan memiliki nilai akurasi 86%.
Tabel 4. Hasil Perhitungan Nilai akurasi Jarak
Sales
Cost Clas s
Prediction Class
p(X | good)
p(X | bad)
Near
Good
Good
good
9.26%
0.00%
Middle
Good
Good
good
18.52%
0.00%
Middle
Average
Good
good
11.11%
0.89%
Middle
Poor
Bad
bad
3.70%
4.44%
Far
Good
Good
good
9.26%
0.00%
Far
average
Bad
good
5.56%
4.44%
Far
Poor
Bad
bad
1.85%
22.22%
Predicted ↓
Class=go od
Class=b ad
good
4
0
bad
1
2
Accuracy =
86%
Adapun perhitungan untuk mendapatkan nilai akurasi adalah : Akurasi =
Jumlah data yang diprediksi secara benar Jumlah prediksi yang dilakukan
Akurasi =
f11 f 00 f11 f10 f 01 f 00
Akurasi = f (good|good)+f(bad|bad)/f(All) Akurasi = (4+2)/7=86% Sehingga untuk memperbaiki akurasi dapat dilakukan dengan mengatur kelas yang diprediksikan dan mengatur nilai K yang sesuai. Selain itu untuk mendapatkan akurasi yang lebih baik sebaiknya dapat dilakukan dengan mengatur bobot parameter yang diinginkan dalam klasifikasi. 3.
KESIMPULAN
1.
Hasil Aplikasi pada penelitian ini adalah Laporan sales yang berasal dari lokasi area penjualan dan aplikasi web server untuk admin pada PT Telesindoshop. Salesman melakukan proses login, mengirim laporan penjualan dan data lokasi dari area penjualan. Aplikasi web server pada melakukan manajemen data laporan sales harian mingguan dan bulanan. Admin juga mengolah data counter yang telah dikunjungi serta lokasi salesman untuk mengelompokkan area penjualan. Dari report sales dihasilkan klasifikasi wilayah area penjualan dengan kategori dekat sedang dan jauh bergantung pada nilai K yang digunakan, dimana ketika nilai K yang digunakan semakin tinggi maka kategori jauh akan semakin sedikit dan kategori dekat semakin banyak. Selanjutnya data digunakan
2.
PUSTAKA Kamarudin, N. and S. Salam. Enabling mobile Location Based Services for emergency cases. in Research and Innovation in Information Systems (ICRIIS), 2011 International Conference on. 2011. Voss, C., et al., They go straight home – don’t they? Using global positioning systems to assess adolescent school-travel patterns. Journal of Transport & Health, 2014. 1(4): p. 282287. Yu, Z., et al., Scalable Distributed Processing of K Nearest Neighbor Queries over Moving Objects. Knowledge and Data Engineering, IEEE Transactions on, 2014. PP(99): p. 11. Taneja, S., et al. An Enhanced K-Nearest Neighbor Algorithm Using Information Gain and Clustering. in Advanced Computing & Communication Technologies (ACCT), 2014 Fourth International Conference on. 2014. Chen, Z., et al., Development of location-based services for recommending departure stations to park and ride users. Transportation Research Part C: Emerging Technologies, 2014. 48(0): p. 256-268. Manap, H.H., N.M. Tahir, and R. Abdullah. Anomalous gait detection using Naive Bayes classifier. in Industrial Electronics and Applications (ISIEA), 2012 IEEE Symposium on. 2012.
204