Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
Implementasi Metode K-Means Cluster Analysis untuk Memilih Strategi Promosi Penerimaan Mahasiswa Baru Wirta Agustin1, Erlin2 1,2 Jurusan Teknik Informatika, STMIK Amik Riau Email:
[email protected],
[email protected]
Abstrak Promosi merupakan suatu wadah atau sarana komunikasi dalam menyampaikan informasi kepada konsumen, baik mengenai biaya, kualitas maupun jenis produk yang ditawarkan. Kegiatan promosi memerlukan perencanaan yang tepat agar mencapai sasaran promosi yang diinginkan, sehingga dibutuhkan perancangan strategi promosi berdasarkan perilaku konsumen. Konsumen menjadi hal penting terhadap produk atau jasa yang ditawarkan. STMIK Amik Riau merupakan penyelenggara swasta dibidang pendidikan yang juga sangat bergantung kepada konsumen sebagai pengguna jasa pendidikannya. Sumber utamanya adalah lulusan SMU/SMK/MA sederajat. Lulusan ini akan diperebutkan oleh semua perguruan tinggi yang sejenis. Persaingan yang ketat mengharuskan untuk melakukan perencanaan dan perancangan strategi promosi yang lebih baik dan tepat. Untuk itu diperlukan analisis terhadap strategi promosi yang ada saat ini, seperti: media online, spanduk, brosur atau map dan secara lisan (dari mulut ke mulut) dengan peran aktif mahasiswa dan alumni. Metode analisis yang akan digunakan dalam penelitian ini adalah K-Means Cluster Analysis, merupakan keilmuan dalam data mining yang mengelompokkan data (objek) didasarkan hanya pada informasi yang ditemukan dalam data dengan jumlah yang cukup besar, waktu komputasi yang relatif cepat dan efisien berdasarkan strategi promosi yang dilakukan, sehingga dapat dilihat strategi promosi mana yang lebih tepat dan terencana sebagai panduan/acuan bagian promosi untuk memilih strategi promosi yang sangat efektif. Kata Kunci: Promosi, Penerimaan Mahasiswa Baru, K-Means Cluster Analysis Abstract Promotion is a means of communication to convey information to consumers, either on cost, quality and type of products offered. Promotional activities require proper planning in order to achieve the desired promotions, so it takes promotion strategies based on consumer behavior. Consumers are becoming essential to the product or service being offered. STMIK Amik Riau is a private organizer in the field of education is also highly dependent on consumers as users of education services. The main source is a graduate of SMU/SMK/MA. These graduates will be contested by all the universities of the same. Intense competition requires to do the planning and design of better promotion strategy and appropriate. It required an analysis of promotion strategies that exist today, such as: online media, banners, brochures and verbal (word of mouth). The analytical method used is a K-Means Cluster Analysis, is a science of data mining that are based solely on information found in the data (object) with a sizeable amount, the computing time relatively quickly, so it can be seen promotional strategy which is more precise and as a guide/reference to select a highly effective promotional strategy by promotion section. Keywords: Promotions, Admission of new students, K-Means Cluster Analysis
1.
PENDAHULUAN
Promosi merupakan suatu wadah atau sarana komunikasi dalam menyampaikan informasi kepada konsumen, baik mengenai biaya, kualitas maupun jenis produk yang ditawarkan. Kegiatan promosi memerlukan perencanaan yang tepat agar mencapai sasaran promosi yang diinginkan, sehingga dibutuhkan perancangan strategi promosi berdasarkan perilaku konsumen. Konsumen menjadi hal penting terhadap produk atau jasa yang ditawarkan. STMIK Amik Riau merupakan penyelenggara swasta dibidang pendidikan yang juga sangat bergantung kepada konsumen sebagai pengguna jasa pendidikannya. Sumber utamanya adalah lulusan SMU/SMK/MA sederajat. Lulusan ini akan diperebutkan oleh semua perguruan tinggi yang sejenis. Persaingan yang ketat mengharuskan untuk melakukan perencanaan dan perancangan strategi promosi yang lebih baik dan tepat. Untuk itu diperlukan analisis terhadap strategi promosi yang ada saat ini, seperti: media online, spanduk, brosur atau map dan secara lisan (dari mulut ke mulut) dengan peran aktif mahasiswa dan alumni. Metode analisis yang telah pernah digunakan pada penelitian sebelumnya adalah analisis model regresi linier [1] dan analisis deskriptif kuantitatif [2]. Metode-metode ini menggunakan dasar perhitungan statistik. Metode K-Means Cluster Analysis merupakan keilmuan dalam data mining yang mengelompokkan data (objek) yang didasarkan hanya pada informasi yang ditemukan dalam data yang menggambarkan objek
9
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
tersebut dan hubungan diantaranya. K-Means merupakan metode clustering yang paling sederhana dan umum. Hal ini dikarenakan K-Means mempunyai kemampuan mengelompokkan data dalam jumlah yang cukup besar dengan waktu komputasi yang relatif cepat dan efisien. 2.
METODE
2.1. Metode Penelitian Analisis Kelompok (Cluster Analysis) Analisis kelompok (cluster analysis) adalah pekerjaan mengelompokkan data (objek) yang didasarkan hanya pada informasi yang ditemukan dalam data yang menggambarkan objek tersebut dan hubungan diantaranya. Tujuannya adalah agar objek-objek yang bergabung dalam sebuah kelompok merupakan objek-objek yang mirip (atau berhubungan) satu sama lain dan berbeda (atau tidak ada hubungan) dengan objek dalam kelompok lain. Lebih besar kemiripannya (homogenitas) dalam kelompok dan lebih besar perbedaannya di antara kelompok yang lain [3]. K-Means K-Means merupakan salah satu metode pengelompokkan data non hierarki (sekatan) yang berusaha mempartisi data yang ada ke dalam bentuk dua atau lebih kelompok. metode ini mempartisi data ke dalam kelompok sehingga data berkarakteristik sama dimasukkan ke dalam satu kelompok yang sama dan data yang berkarakteristik berbeda dikelompokkan ke dalam kelompok yang lain [3]. Algoritma Dasar K-Means Pengelompokan data dengan menggunakan metode K-Means secara umum dapat dilakukan dengan algoritma dasar sebagai berikut [4]: 1. Tentukan jumlah kelompok (cluster). 2. Alokasikan data ke dalam kelompok (cluster) secara acak (random). 3. Hitung pusat kelompok (centroid/rata-rata) dari data yang ada di masing-masing kelompok (cluster). 4. Alokasikan masing-masing data ke centroid/rata-rata terdekat. 5. Kembali ke langkah (step) 3, apabila masih ada data yang berpindah kelompok (cluster), atau apabila perubahan nilai centroid, ada yang di atas nilai ambang (threshold) yang ditentukan, atau apabila perubahan nilai pada fungsi objektif (objective function) yang digunakan di atas nilai ambang (threshold) yang ditentukan. 2.2. Formula Pada Metoda K-Means Pada langkah 3 algoritma, lokasi centroid (titik pusat) setiap kelompok yang diambil dari rata-rata (mean) semua nilai data pada setiap fiturnya harus dihitung kembali. Jika M menyatakan jumlah data dalam sebuah kelompok, i menyatakan fitur ke-i dalam sebuah kelompok, dan p menyatakan dimensi data, untuk menghitung centroid fitur ke-i digunakan formula [3]: Ci =
1
M
Ʃ Xj
(1)
M j=1 Formula tersebut dilakukan sebanyak p dimensi sehingga i mulai dari 1 sampai p. Ada beberapa cara yang dapat digunakan untuk mengukur jarak data ke pusat kelompok, diantaranya Euclidean, Manhattan/City Blok dan Minkowsky [3], yaitu: Pengukuran jarak pada ruang jarak (distance space) Euclidean menggunakan formula: D(x2,x1) = ||x2 – x1||2 =
p
Ʃ x2j – x1j
2
(2)
j=1
dimana: D : jarak antara data x2 dan x1, |.| : nilai mutlak. Pengukuran jarak pada ruang jarak (distance space) Manhattan menggunakan formula: p
(3)
D(x2,x1) = ||x2 – x1||1 = Ʃ x2j – x1j j=1
10
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
Pengukuran jarak pada ruang jarak (distance space) Minkowsky menggunakan formula: p
D(x2,x1) = ||x2 – x1||λ = λ
λ
Ʃ x2j – x1j
(4)
j=1
dimana: λ : parameter jarak Minkowsky. Pada langkah 4 algoritma, pengalokasian kembali data ke dalam masing-masing kelompok dalam metode K-Means didasarkan pada perbandingan jarak antara data dengan centroid setiap kelompok yang ada. Data dialokasikan ulang secara tegas ke kelompok yang mempunyai centroid dengan jarak terdekat dari data tersebut. Pengalokasian ini dirumuskan sebagai berikut [3]: 1
d = min{D(xi, C1)}
0
lainnya
ai1 =
(5)
dimana: ai1 : nilai keanggotaan titik xi ke pusat kelompok C1, d : jarak terpendek dari data xi ke K kelompok setelah dibandingkan, C1 : centroid (pusat kelompok) ke-1. Fungsi objektif yang digunakan untuk K-Means ditentukan berdasarkan jarak dan nilai keanggotaan data dalam kelompok. fungsi objektif yang digunakan adalah sebagai berikut [3]: N K
J = Ʃ Ʃ aicD(xi,C1)2
(6)
i=1 1=1
dimana: N K ai1 C1 D(xi,C1)
: jumlah data, : jumlah kelompok, : nilai keanggotaan titik data xi ke pusat kelompok C1, : pusat kelompok ke-1, : jarak titik xi ke pusat kelompok C1 yang diikuti.
a mempunyai nilai 0 atau 1. Apabila suatu data merupakan anggota suatu kelompok, nilai a i1 = 1, jika tidak, nilai ai1 = 0. 3.
HASIL DAN PEMBAHASAN
Pengumpulan data dilakukan dengan cara wawancara kepada calon mahasiswa baru STMIK Amik Riau untuk mendapatkan informasi tentang promosi dan mengambil dokumen sampel Formulir Pendaftaran Calon Mahasiswa Baru STMIK Amik Riau untuk mendapatkan informasi asal sekolah. Strategi promosi yang digunakan pada STMIK Amik Riau adalah melalui media online, spanduk, brosur dan dari mulut ke mulut. Dan asal sekolah terdiri dari SMA, SMK, MA dan Pesantren. Kemudian akan dilakukan pengolahan data untuk mengetahui strategi promosi yang sangat efektif, efektif dan kurang efektif di masing-masing sekolah asal calon mahasiswa baru. Data yang akan diolah sebanyak 106 data calon mahasiswa baru tahun 2015/2016 dan 2016/2017 pada STMIK Amik Riau, sampel data awal (10 sampel data) dapat dilihat pada Tabel 1.
11
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
Tabel 1. Sampel data awal calon mahasiswa Calon Mahasiswa Ke-i 1 2 3 4 5 6 7 8 9 10
Nama Calon Mahasiswa Riki Admiko Wiwik Novia Herlianti Muthia Rahmalia R. Adhi Nugroho M.Haikal Haqiqi Hasibolan Serasi Sinamo Bagus Santoso Seprio Naldo Resdi Siska Fariz Rizki Ramadhan
Online 0 1 1 0 0 1 1 1 1 0
Strategi Promosi Asal Spanduk Brosur Mulut ke Mulut Sekolah 0 0 1 SMA 0 0 0 SMK 1 1 1 SMA 0 0 1 SMK 0 0 1 SMA 1 1 1 SMK 1 1 1 SMK 1 1 1 SMK 1 1 1 SMA 0 0 1 SMK
Data awal akan dilakukan proses transformasi data karena jenis data tidak berupa numeric maka data harus ditranformasikan terlebih dahulu dengan cara melakukan frekuensi pada data yang terbanyak muncul dengan mengurutkan frekuensi tertinggi ke terendah dan lakukan inisial data, seperti pada Tabel 2 dan Tabel 3. Tabel 2. Transformasi strategi promosi Strategi Promosi Frekuensi Inisial MM 89 1 Online 29 2 Brosur 8 3 Spanduk 7 4 Tabel 3. Transformasi asal sekolah Asal Sekolah
Frekuensi
Inisial
SMK
51
1
SMA
45
2
MA
8
3
PP
2
4
Setelah transformasi masing-masing atribut selesai langkah selanjutnya adalah memindahkan inisial data tersebut pada data awal, barulah data siap untuk diproses. Sampel data hasil proses tranformasi data terlihat pada Tabel 4. Tabel 4. Sampel hasil transformasi data Calon Mahasiswa Ke-i 1 2 3 4 5 6 7 8 9 10
Online 0 2 2 0 0 2 2 2 2 0
Strategi Promosi Spanduk Brosur Mulut ke Mulut 0 0 1 0 0 0 4 3 1 0 0 1 0 0 1 4 3 1 4 3 1 4 3 1 4 3 1 0 0 1
Asal Sekolah 2 1 2 1 2 1 1 1 2 1
Data hasil transformasi akan dilakukan pengolahan data dengan proses clustering menggunakan algoritma K-Means, sehingga didapatkan hasil pengelompokan strategi promosi yang sangat efektif, efektif dan kurang efektif. Tahapan yang dilakukan berdasarkan algoritma k-means adalah sebagai berikut:
12
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
a. Penentuan jumlah cluster Penentuan jumlah cluster dilakukan untuk mengetahui hasil strategi promosi mana yang sangat efektif, efektif dan kurang efektif. Maka dalam penelitian ini jumlah cluster yang digunakan adalah sebanyak 3 cluster (k=3), sehingga nanti akan diketahui cluster terbaik dalam penelitian ini. b. Menentukan centroid Pusat awal cluster atau centroid ditentukan secara random atau acak, dimana nilai cluster 0 diambil dari calon mahasiswa ke-6, nilai cluster 1 pada calon mahasiswa ke-42 dan cluster 2 pada calon mahasiswa ke-75. Berikut adalah nilai centroid awal pada data strategi promosi dalam penerimaan mahasiswa baru: Cluster 0 : ( 2 ; 4 ; 3 ; 1 ; 1 ) Cluster 1 : ( 0 ; 0 ; 0 ; 1; 1 ) Cluster 2 : ( 2 ; 0 ; 0 ; 0 ; 2) c. Menghitung jarak dari centroid Menghitung jarak antara titik centroid dengan titik tiap objek dengan menggunakan Euclidian Distance. Perhitungan untuk Cluster 0: D(C0,1)= √ D(C0,2)= √ D(C0,3)= √
= 5,477 = 5,099 = 1,000
Perhitungan untuk Cluster 1: D(C1,1)= √ D(C1,2)= √ D(C1,3)= √
= 1,000 = 2,236 = 5,477
Perhitungan untuk Cluster 2: D(C2,1)= √ D(C2,2)= √ D(C2,3)= √
= 2,236 = 1,000 = 5,099
d. Alokasikan masing-masing objek ke centroid terdekat, untuk melakukan mengalokasikan objek ke dalam masing-masing cluster dengan cara mengelompokkan berdasarkan jarak minimum objek ke pusat cluster dengan memberikan kode “1” jika hasil cluster mendekati nol. Perhitungan dilakukan terus sampai data ke-106 terhadap pusat cluster. Hasil perhitungan jarak data dan posisi cluster pada iterasi pertama akan didapatkan. Suatu data akan menjadi anggota dari suatu cluster yang memiliki jarak terkecil dari pusat clusternya (nilai minimum), seperti pada Tabel 5.
13
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
Tabel 5. Hasil perhitungan jarak data iterasi ke-1 Mahasiswa Ke-i 1 2 3 4 5 6 7 8 9 10
Online 0 2 2 0 0 2 2 2 2 0
Strategi Promosi Spanduk Brosur 0 0 0 0 4 3 0 0 0 0 4 3 4 3 4 3 4 3 0 0
Mulut ke Mulut 1 0 1 1 1 1 1 1 1 1
Asal Sekolah 2 1 2 1 2 1 1 1 2 1
C0
C1
C2
Min
Kel
5,477 5,099 1,000 5,385 5,477 0,000 0,000 0,000 1,000 5,385
1,000 2,236 5,477 0,000 1,000 5,385 5,385 5,385 5,477 0,000
2,236 1,000 5,099 2,449 2,236 5,196 5,196 5,196 5,099 2,449
1,000 1,000 1,000 0,000 1,000 0,000 0,000 0,000 1,000 0,000
2 3 1 2 2 1 1 1 1 2
Setelah itu akan ditentukan posisi dari masing-masing cluster setiap datanya sesuai dengan kelompok yang dihasilkan berdasarkan nilai minimum yang diperoleh. Misalkan untuk mahasiswa ke-1: Nilai C0=5,477, nilai C1=1,000 dan nilai C2=2,236, maka nilai yang diambil adalah nilai C1 (nilai minimum) yang artinya mahasiswa ke-1 berada pada kelompok 1(C1). Nilai minimum yang diambil pada masing-masing kelompok setiap data akan diwakili oleh tanda bintang atau asterik (*), yang menyatakan setiap data berada pada kelompok C0, C1 atau C2, seperti pada Tabel 6. Tabel 6. Posisi cluster pada iterasi ke-1 Mahasiswa Ke-i 1 2 3 4 5 6 7 8 9 10
Online 0 2 2 0 0 2 2 2 2 0
Strategi Promosi Spanduk Brosur 0 0 0 0 4 3 0 0 0 0 4 3 4 3 4 3 4 3 0 0
Mulut ke Mulut 1 0 1 1 1 1 1 1 1 1
Asal Sekolah 2 1 2 1 2 1 1 1 2 1
C0
C1
C2
* * * * * * * * * *
Kel 2 3 1 2 2 1 1 1 1 2
e. Kembali ke langkah c, jika masih ada data yang berpindah kelompok (cluster). Hasil akhir yang diperoleh manual (iterasi ke-2) dan pengujian dengan aplikasi RapidMiner (centroid table) adalah: a) Cluster 0 memiliki nilai centroid (0.857, 2, 2.714, 4 dan 1.429), terdiri dari 7 data yang dapat diartikan sebagai kelompok yang menggunakan semua strategi promosi yang ada dan asal sekolah SMK, (kelompok dengan strategi promosi kurang efektif). b) Cluster 1 memiliki nilai centroid (0.987, 0, 0.039, 0 dan 1.688), terdiri dari 77 data yang dapat diartikan sebagai kelompok yang menggunakan strategi promosi dari mulut ke mulut dan asal sekolah SMA (kelompok dengan strategi promosi sangat efektif). c) Cluster 2 memiliki nilai centroid (0.318, 2, 0, 0 dan 1,500), terdiri dari 22 data yang dapat diartikan sebagai kelompok yang menggunakan strategi promosi media online dan asal sekolah SMA (kelompok dengan strategi promosi efektif). 4.
SIMPULAN
Berdasarkan penelitian dan pembahasan yang telah dilakukan, maka dapat diambil kesimpulan bahwa metode Clustering K-Means dapat membantu dalam pemilihan strategi promosi Penerimaan Mahasiswa Baru pada STMIK Amik Riau. Diperoleh 3 kategori keefektifan strategi promosi yang ada saat ini, yaitu kategori sangat efektif, kategori efektif dan kategori kurang efektif. STMIK Amik Riau pada Penerimaan Mahasiswa Baru tahun 2015 dan 2017 kategori strategi promosi lebih dominan pada promosi dari mulut ke mulut dibandingkan dengan online, brosur dan spanduk. Terlihat pada cluster 1 terdapat 77 calon mahasiswa lebih mengetahui informasi kampus dari mulut ke mulut yang asal sekolah dari Sekolah
14
Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN: 978-602-1034-40-8
Menengah Atas (SMA), maka promosi mulut ke mulut termasuk kategori sangat efektif. Pada cluster 2 terdapat 22 calon mahasiswa lebih mengetahui informasi kampus dari media online yang asal sekolah dari Sekolah Menengah Atas (SMA), maka promosi melalui media online termasuk kategori efektif. Dan pada cluster 0 terdapat 7 calon mahasiswa yang mengetahui informasi kampus dari media online, spanduk, brosur dan mulut ke mulut (semua promosi), maka kelompok ini termasuk kategori kurang efektif. Hasil penelitian ini akan digunakan bagian promosi untuk membuat perencanaan dan perancangan strategi promosi yang lebih baik dan tepat (kategori sangat efektif). 5. [1] [2] [3] [4]
REFERENSI Iriyanto, Setia. 2013. Pengaruh Biaya Promosi Terhadap Jumlah Mahasiswa Baru dan Analisis Promosi Mix di Universitas Muhammadiyah Semarang. Jurnal Bisnis dan Manajemen. Vol. 9(2). Wahyuni, Alida. 2012. Kajian Bauran Promosi di Perguruan Tinggi. Jurnal Liquidity. Vol. 1(2): 175-182. Eko, Prasetyo. 2012. Data Mining - Konsep dan Aplikasi Menggunakan Matlab. Andi, Yogyakarta. Agusta, Yudi. 2007. K-Means – Penerapan, Permasalahan dan Metode Terkait. Jurnal Sistem dan Informatika. Vol. 3.
15