Implementasi Fuzzy C-Means untuk Clustering Data dalam Sistem Informasi Promosi (Studi Kasus : UKSW)
Artikel Ilmiah
Diajukan kepada Fakultas Teknologi Informasi untuk memperoleh Gelar Sarjana Komputer
Peneliti : Monica Dias Pangestika (672007068) Drs. Prihanto Ngesti Basuki, M. Kom. Charitas Fibriani, S. Kom., M. Eng.
Program Studi Teknik Informatika Fakultas Teknologi Informasi Universitas Kristen Satya Wacana Salatiga Juli 2013
i
ii
iii
iv
Pernyataan Yang bertandatangan di bawah ini, Nama
: Monica Dias Pangestika
NIM
: 672007068
Program Studi
: Teknik Informatika
Fakultas
: Teknologi Informasi, Universitas Kristen Satya Wacana
Menyatakan dengan sesungguhnya bahwa tugas akhir dengan judul : Implementasi Fuzzy C-Means untuk Clustering Data dalam Sistem Informasi Promosi (Studi Kasus : UKSW) Yang dibimbing oleh : 1. Drs. Prihanto Ngesti Basuki, M.Kom. 2. Charitas Fibriani, S.Kom., M.Eng.
Adalah benar hasil karya saya. Di dalam tugas akhir ini tidak terdapat keseluruhan atau sebagian tulisan atau gagasan orang lain yang saya ambil dengan menyalin atau meniru dalam bentuk rangkaian kalimat atau gambar serta simbol yang saya akui seolah-olah sebagai karya saya tanpa memberikan pengakuan penulisan atau sumber aslinya.
Salatiga, 25 Juli 2013 Yang memberi pernyataan,
Monica Dias Pangestika
v
Implementasi Fuzzy C-Means untuk Clustering Data dalam Sistem Informasi Promosi (Studi Kasus : UKSW) 1
)Monica Dias Pangestika, 2) Prihanto Ngesti Basuki, 3)Charitas Fibriani
Program Studi Teknik Informatika Fakultas Teknologi Informasi Universitas Kristen Satya Wacana Jl. Diponegoro 52-60 Salatiga Email: 4)
[email protected], 5)
[email protected], 6 )
[email protected]
Abstract Promotion is a important factor in a university to attract prospective students interest for continuing their education in that university. Equality of the same promotion in Satya Wacana Christian University (UKSW) to all high scholl and to all study major, make promotion less effective. Data clustering method are used to classification scholl and study major based on the clusters. Fuzzy C–Means algorithm is the one of algorithm which can be used to clustering data, this algorithm be used in this research to clustering data prospective students and study major. The final result is a information that shows scholls and study majors which the promotion is less, need to increase, or enough. Based the result of this research, value of the cluster about scholls and study major which include to low cluster, it is recommended to do promotion in that scholl and that study major. Keywords: Fuzzy C-Means, clustering data, information
Abstrak Promosi merupakan faktor penting dalam suatu universitas untuk menarik minat calon mahasiswa agar melanjutkan pendidikannya ke universitas itu. Pemerataan promosi pada Universitas Kristen Satya Wacana (UKSW) yang sama ke semua sekolah menengah atas dan pada semua program studi, membuat kurang efektifnya promosi. Metode Pengelompokan data yang dilakukan untuk mengklasifikasikan sekolah dan program studi berdasarkan clusternya. Algoritma Fuzzy C-Means merupakan salah satu algoritma yang digunakan dalam teknik pengelompokan data, untuk itulah algoritma Fuzzy C-Means digunakan pada penelitian ini untuk mengelompokkan data calon mahasiswa dan program studi. Hasil akhir berupa informasi yang menunjukan sekolah dan program studi yang promosinya kurang, lebih ditingkatkan, atau cukup. Berdasarkan hasil penelitian, nilai cluster sekolah dan program studi yang masuk ke cluster rendah, direkomendasikan untuk dilakukan promosi di sekolah dan program studi tersebut.
Kata Kunci : Fuzzy C-Means, pengelompokan data,informasi 1 2 3 4 5 6
Mahasiswa Teknologi Informasi Universitas Satya Wacana Pembimbing Pertama Teknologi Informasi Universitas Satya Wacana Pembimbing Kedua Teknologi Informasi Universitas Satya Wacana Alamat email mahasiswa Alamat email Pembimbing Pertama Alamat email Pembimbing Kedua
1
1. Pendahuluan Promosi adalah salah satu faktor penting bagi suatu universitas untuk menarik minat calon mahasiswa agar tertarik untuk melanjutkan pendidikannya ke universitas itu. Banyaknya lulusan sekolah menengah atas yang ingin melanjutkan jenjang pendidikan ke jenjang yang lebih tinggi, maka promosi pada suatu universitas perlu lebih diefektifkan. Selama ini suatu universitas menerima mahasiswa dari berbagai sekolah menengah atas dan berbagai jurusan yang diminati dengan jumlah berbeda setiap tahunnya. Tergantung dari bagaimana bagian promosi suatu universitas melakukan promosi, menunjukkan kualitas yang dimiliki suatu universitas, baik dalam hal akademik, fasilitas, maupun program studi yang dimiliki. Penerimaan mahasiswa dari suatu sekolah menengah atas yang berbeda beda setiap tahunnya, program studi yang diminati yang tidak sama setiap tahunnya, serta pemerataan promosi pada Universitas Kristen Satya Wacana yang sama ke semua sekolah menengah atas dan pada semua program studi, membuat kurang efektifnya promosi, mendorong penulis untuk melakukan pengelompokan data berdasarkan data 3 tahun terakhir pada Universitas Kristen Satya Wacana. Data jumlah calon mahasiswa dari setiap sekolah menengah atas, dan data program studi yang diminati setiap tahunnya akan dikelompokkan menjadi 3 cluster. Pembentukan cluster atau kelompok data merupakan salah satu teknik yang digunakan dalam mengekstrak pola kecenderungan suatu data. Analisis cluster atau clustering merupakan proses membagi data dalam suatu himpunan ke dalam beberapa kelompok yang kesamaan datanya dalam suatu kelompok lebih besar daripada kesamaan data tersebut dengan data dalam kelompok lain [1]. Metode Fuzzy C-Means yang digunakan dipilih karena metode ini adalah suatu teknik pengelompokan data dimana keberadaan tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat keanggotaan. Fuzzy C-Means adalah algoritma pengelompokan yang terawasi, karena pada algoritma Fuzzy C-Means jumlah cluster yang akan dibentuk perlu diketahui terlebih dahulu. Konsep dasar algoritma Fuzzy C-Means adalah menentukan pusat kelompok yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan pada tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang-ulang, maka didapat lokasi pusat cluster optimal. Perulangan ini didasarkan pada minimasi fungsi obyektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut [2]. Diharapkan dengan perancangan sistem informasi tersebut, nantinya sistem ini dapat memberi informasi berdasarkan pengelompokan data penerimaan mahasiswa dari setiap sekolah menengah atas dan program studi yang diminati untuk dapat menentukan strategi promosi berikutnya dalam biro promosi yang lebih berorientasi kepada target.
2
2. Strategi Promosi di UKSW Strategi Promosi merupakan teknik dan cara – cara yang dipakai suatu perusahaan atau organisasi untuk melakukan promosi dengan tujuan untuk mendapatkan efisiensi promosi yang baik, termasuk didalamnya kegiatan pemasaran untuk menginformasikan, membujuk, serta menarik konsumen mengenai produk atau jasa yang ditawarkan perusahaan [3]. Biro Promosi dan Hubungan Luar (BPHL) adalah unit yang bertugas untuk mengelola dan mengembangkan sistem dan program promosi di UKSW. Dalam kegiatannya, BPHL menjalin hubungan kemitraan yang baik dengan sekolah, gereja, pemerintah, industri, dan alumni. Banyak kegiatan yang dilakukan biro promosi dalam kegiatan promosinya, ada kegiatan visitasi ke sekolah – sekolah yang lebih prospek, kegiatan presentasi yang merupakan penyampaian materi mengenai UKSW, kegiatan EXPO, kegiatan Road Show, kegiatan consultation desk. Serta penggunaan baliho yang dipasang seperti pada persimpangan jalan, trafik yang ramai contohnya seperti pada Kota Salatiga, brosur, leaflet, Satya link yaitu website yang berisi informasi serta kegiatan yang ada pada UKSW, dan iklan ke advedtorial. Proses Bisnis pada BPHL dituangkan pada Standart Operational Prosedure (SOP) Pelaksanaan Promosi. Pada SOP tersebut dijelaskan tahap – tahap untuk pelaksanaan promosi sampai kepada laporan pertanggungjawaban. Dengan tujuan memperkenalkan program dan keunggulan yang ada pada masing – masing program studi di Universitas Kristen Satya Wacana Salatiga kepada siswa SMA/SMK/MA/sederajat untuk menarik minat siswa melanjutkan pendidikannya ke UKSW. Ruang lingkup meliputi presentasi ke sekolah meliputi permohonan izin presentasi, materi promosi, anggaran, penjelasan program dan keunggulan, pembuatan laporan.
3. Kajian Pustaka Penelitian terdahulu Irma Irandha P. W, mahasiswa D4 dari Politeknik Elektronika Negeri Surabaya, meneliti tentang Analisa Keluarga Miskin Dengan Menggunakan Metode Fuzzy C-Means Clustering. Penelitian ini meneliti Kota Surabaya tepatnya di Kecamatan Wonocolo yang terdapat Keluarga miskin. Penentuan status Keluarga Miskin menggunakan metode tentang data keluarga miskin yang meliputi jumlah ART (Anggota Rumah Tangga), jenis pekerjaan, indikator Kesehatan, Pendidikan, Perumahan dan Lingkungan, Ekonomi serta Sosial Budaya. Metode ini dilakukan untuk menghasilkan informasi tentang keluarga miskin dengan katagori sangat miskin, miskin, dan mendekati miskin [4]. Bahar mahasiswa program Pasca Sarjana, Magister Teknik Informatika dari Universitas Dian Nuswantoro tentang Penentuan Jurusan Sekolah Menengah Atas dengan Algoritma Fuzzy C-Means. Parameter data yang digunakan dalam eksperimen berupa rata-rata nilai mata pelajaran kelompok peminatan, yaitu: jurusan IPA (mata pelajaran Biologi, Matematika, Fisika dan Kimia), jurusan IPS (mata pelajaran Sosiologi, Geografi, Sejarah dan Ekonomi), jurusan Bahasa (Bahasa Inggris dan Bahasa Indonesia). Penelitian ini menghasilkan 3 cluster yang
3
merupakan peminatan IPS, Bahasa, dan IPA, dan tingkat akurasi yang lebih tinggi (yaitu rata – rata 78,39 %) dibandingkan dengan metode penentuan jurusan secara manual [5]. Pada penelitian ini metode Fuzzy C-Means akan digunakan dalam pengolahan data promosi di UKSW. Data yang diperlukan dalam penelitian ini akan diambil dari data jumlah masing – masing sekolah menengah atas calon mahasiswa dan jumlah program studi yang diminati per tahunnya selama 3 tahun, di mana data ini dimasukkan langsung oleh bagian promosi dan semua proses perhitungan Fuzzy C-Means dilakukan oleh sistem. Sistem ini menyediakan fungsi untuk load data berupa file excel. Hasil dari penelitian ini akan dikelompokkan menjadi 3 cluster, yaitu rendah, sedang, dan tinggi dan keterangan informasi bagi biro promosi. Sehingga nantinya dapat membantu pihak promosi dalam menentukan tindakan promosi selanjutnya yang lebih berorientasi target.
Algoritma Clustering Kategori pengelompokan algoritma clustering adalah sebagai berikut [6]: Hierarchical clustering menentukan sendiri jumlah cluster yang dihasilkan. Hasil dari metode ini adalah suatu struktur data berbentuk pohon yang disebut dendogram dimana data dikelompokkan secara bertingkat dari yang paling bawah dimana tiap instance data merupakan satu cluster sendiri, hingga tingkat paling atas dimana keseluruhan data membentuk satu cluster besar berisi cluster-cluster. Hierarchical clustering dibagi lagi menjadi 2 yaitu : - Agglomerative clustering merupakan suatu teknik hierarki clustering yang menghasilkan suatu rangkaian penurunan jumlah cluster pada setiap tahapan. Clustering yang terdapat pada setiap tahapan diperoleh dari tahapan sebelumnya dengan cara menggabungkan 2 cluster yang mempunyai kemiripan. - Divisive hierarchical clustering mengelompokkan data dari kelompok yang terbesar hingga ke kelompok yang terkecil, yaitu masing-masing instance dari kelompok data tersebut. Sebaliknya, agglomerative hierarchical clustering mulai mengelompokkan data dari kelompok yang terkecil hingga kelompok yang terbesar. Beberapa algoritma yang menggunakan metode ini adalah: RObust Clustering Using LinKs (ROCK), Chameleon, Cobweb, Shared Nearest Neighbor (SNN). Partitional clustering yang mengelompokkan data ke dalam k cluster dimana k adalah banyaknya cluster dari input user. Kategori ini biasanya memerlukan pengetahuan yang cukup mendalam tentang data dan proses bisnis yang memanfaatkannya untuk mendapatkan kisaran nilai input yang sesuai. Beberapa algoritma yang masuk dalam kategori ini antara lain: K-Means, Fuzzy C-Means, Clustering Large Aplications (CLARA), Expectation Maximation (EM), Bond Energy Algorithm (BEA), algoritma Genetika, Jaringan Saraf Tiruan. Clustering Large Data, dibutuhkan untuk melakukan clustering pada data yang volumenya sangat besar sehingga tidak cukup ditampung dalam memori komputer pasca suatu waktu. Biasanya untuk mengatasi masalah besarnya
4
volume data, dicari teknik-teknik untuk meminimalkan berapa kali algoritma harus membaca seluruh data. Beberapa algoritma yang masuk dalam kategori ini antara lain: Balanced Iteratif Reducing and clustering using hierarchies (BIRCH), Density Based Spatial Clustering of Application With Noise (DCSCAN), Clustering Categorical Data Using Summaries (CACTUS). Fuzzy Clustering C-Means (FCM) Pada proses pengklasteran (clustering) secara klasik (misalnya pada algoritma Clustering K-Means), pembentukan partisi dilakukan sedemikian rupa sehingga setiap obyek berada tepat pada satu partisi. Namun, adakalanya tidak dapat menempatkan suatu obyek tepat pada suatu partisi, karena sebenarnya obyek tersebut terletak di antara 2 atau lebih partisi yang lain. Pada logika fuzzy, metode yang dapat digunakan untuk melakukan pengelompokan sejumlah data dikenal dengan nama fuzzy clustering. Fuzzy Clustering lebih alami jika dibandingkan dengan pengklasteran secara klasik. Suatu algoritma clustering dikatakan sebagai fuzzy clustering jika algoritma tersebut menggunakan parameter strategi adaptasi secara soft competitive. Sebagian besar algoritma fuzzy clustering didasarkan atas optimasi fungsi obyektif atau modifikasi dari fungsi obyektif tersebut. Salah satu teknik fuzzy clustering adalah Fuzzy C-Means (FCM). FCM adalah suatu teknik pengklasteran data yang keberadaan tiap-tiap data dalam suatu cluster ditentukan oleh nilai/derajat keanggotaan tertentu. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981. Berbeda dengan teknik pengklasteran secara klasik (dimana suatu obyek hanya akan menjadi anggota suatu klaster tertentu), dalam FCM setiap data bisa menjadi anggota dari beberapa cluster. Batas-batas cluster dalam FCM adalah lunak (soft). Konsep dasar FCM, pertama kali adalah menentukan pusat cluster yang akan menandai lokasi rata-rata untuk tiap- tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan nilai keanggotaan tiap-tiap data secara berulang, maka akan terlihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi obyektif [7]. Algoritma Fuzzy C-Means (FCM) diberikan sebagai berikut [8]: Menentukan data yang akan di cluster X, berupa matriks berukuran n x m (n=jumlah sampel data, m = atribut setiap data). Xij = data sampel ke-i (i=1,2,...,n), atribut ke-j (j=1,2,...,m). Menentukan: - Jumlah cluster = c ( ) - Pangkat = w (> 1) - Maksimum interasi = MaxIter - Error terkecil yang diharapkan = - Fungsi objektif awal = Po = 0 - Interasi awal = t =1 dan Membangkitkan bilangan random μik, i=1,2,3 ..., n; k=1,2,3 ...,c; sebagai elemenelemen matriks partisi awal U.
5
Menghitung jumlah setiap kolom: ......................................................................................(2.1) dengan j = 1,2,...,n Menghitung pusat cluster ke-k: Vkj, dengan k=1,2,...c; dan j=1,2,...m ............................................................................(2.2) Menghitung fungsi objektif pada interasi ke-t : .....................................(2.3) Menghitung perubahan matriks partisi :
..........................................................(2.4) dengan: i=1,2,...n; dan k=1,2,...c. Memeriksa kondisi berhenti : Jika: (|Pt – Pt-1|< ξ) atau (t > MaxIter) maka berhenti Jika tidak: t=t+1, mengulang langkah ke-4.
Perancangan Sistem Gambar berikut ini merupakan diagram alir (flowchart) yang merupakan diagram alir perangkat lunak untuk menentukan informasi promosi dengan menggunakan metode Fuzzy C-Means.
6
Mulai
Input MaxIterasi dan Error
Load Data Excel jumlah sekolah atau program studi selama 3 tahun
Proses dengan Algoritma FCM
tidak
Fgs Objectf skrg – fgs Obj sblumbya < error Iterasi > maks iterasi
Ya Hasil clustering Optimal
Selesai
Gambar 1 Flowchart Metode Fuzzy C-Means pada sistem
7
Mulai
Baca Matriks X ukuran m x n, error terkecil, pangkat pembobot (w),maksimum iterasi
Inisialisasi P(0)=0, Iterasi awal=1
Bangkitkan matriks partisi awal secara random[0....1] dan normalisasi matriks partisi awal
Menghitung Pusat cluster Vkj
Fungsi Objective P(t)
Perbaharui Matriks Partisi
tidak P(t) –P(t-1) < error / Iterasi >= maks iterasi
t= t+1
Ya
Hasil clustering Optimal
Selesai
Gambar 2 Flowchart Algoritma Fuzzy C-Means
Use Case Diagram Dalam diagram use case, hak akses hanya user. Di sini user adalah pegawai biro Promosi UKSW. Seorang user dapat langsung mengakses sistem dan menjalankan proses mulai algoritma. Di sini user menjalankan 2 aktifitas, yaitu dimana user dapat melakukan proses algoritma mencakup perubahan pada max iterasi dan error, juga meload data, kemudian melihat hasil, dimana user dapat melihat fungsi obyektif yang dihasilkan, melihat matriks partisi, melihat pusat cluster, melihat hasil pengelompokan cluster, dan melihat grafik hasil
8
pengolahan metode Fuzzy C-Means, serta melihat Informasi bagi Biro Promosi. Lebih jelasnya dapat dilihat Gambar 3. Melakukan Perubahan MaxIterasi dan Error
<
>
Melakukan Proses Algoritma Load data <>
Melihat Fungsi Objectif User
Melihat Hasil
<>
Melihat Matriks Partisi
<> <> Melihat Pusat Cluster <>
<> Melihat Hasil Pengelompokan Cluster <>
Melihat GrafiK hasil FCM
Melihat Informasi bagi Biro Promosi
Gambar 3 Use Case Diagram User
Class Diagram MainFrame +FuzzyFix fix +DialogInput input +keluar() +inputSettingDanData() +tampilkanHasil()
DialogInput +initComponents() +loadDataActionPerformed() +prosesactionPerformed()
Data +file +table +jumlahIterasi +jumlahtahun +error +nilaiIterasiBerhenti +nilaiErrorIterasiBerhenti
FuzzyFix +model +model1 +modelPartisi +modelPusatCluster +modelFungsiObj +informasiIterasi +JUMLAH_DATA +table +L1 +L2 +L3 +LT +totalCluster1Pow +totalCluster2Pow +totalCluster3Pow +pusatCluster +jumlahFungsiObjective +jumlahFungsiObjectiveSebelumnya +proses() +bacaExcel() +bangkitkanMatriks() +tentukanPusatCluster() +fungsiObjective() +perubahanMatriksPartisi() +tampilkanHasil() +tampilkanGrafik1() +tampilkanGrafik2() +tampilkanGrafik3() +tampilkanPromosi()
Baris data +name +data +derajatKeanggotaanCluster1 +derajatKeanggotaancluster2 +derajatKeanggotaanCluster3 +cluster1 +cluster2 +cluster3 +cluster1pow +cluster2pow +cluster3pow
Gambar 4 Class Diagram Sistem
Class diagram sistem pada Gambar 4 dapat dijelaskan sebagai berikut. Class MainFrame dan DialogInput merupakan User Interface berupa tampilan
9
Menu Utama dan Input setting dan Data. Class MainFrame melakukan panggilan terhadap Class FuzzyFix yang merupakan algoritma dan menggunakan DialogInput karena dipanggil dari MainFrame. Class FuzzyFix memiliki 2 Class yang diperlukan untuk proses yaitu Class Baris Data yang digunakan untuk menyimpan data yang dihasilkan setelah proses algoritma dan Class Data yang berisi variabel dari Class DialogInput. Tujuan
mengelompokkan data
Atribut
Jumlah sekolah menengah atas
Jumlah Cluster
Rendah
Jumlah program studi
Sedang
Tinggi
Gambar 5 Hirarki Keputusan untuk mengelompokkan data sekolah menengah atas dan program studi
Penentuan cluster Rendah adalah promosi kurang, cluster Sedang adalah promosi lebih ditingkatkan, dan cluster Tinggi adalah promosi cukup. Pada sekolah menengah atas / jurusan yang promosinya cukup, kegiatan visitasi dapat digantikan dengan mengirim brosur, leaflet, dan juga sosialisasi ke satya link, sehingga biaya dapat lebih diefektifkankan ke sekolah / program studi yang promosinya kurang, sehingga pendekatan, pengenalan kelebihan program studi dapat terlaksana dengan waktu kunjungan yang cukup untuk tahap menarik minat siswa. Untuk sekolah menengah atas / jurusan yang promosinya lebih ditingkatkan, kegiatan visitasi tetap dilakukan, tetapi dengan waktu kunjungan yang tidak begitu lama tetapi tetap efektif untuk penyampaian materi promosi.
10
4. Hasil dan Pembahasan
Gambar 6 Tampilan Awal
Gambar 6 merupakan tampilan antarmuka awal bagi user. Halaman Utama berisi 3 button menu yaitu button Setting dan Data , button Tampilkan Hasil , dan button Keluar untuk keluar dari aplikasi.
Gambar 7 Tampilan Antarmuka Setting & Data
Pada proses clustering seperti pada Gambar 7, aktifitas yang dapat dilakukan oleh user menentukan maksimal iterasi dan ketelitian kesalahan. Dua faktor tersebut dipenuhi untuk menentukan kriteria berhenti.
11
Gambar 8 Tampilan antarmuka Tampilkan Hasil
Pada Gambar 8 yang merupakan tampilan antarmuka tampilkan hasil, user dapat melihat fungsi objective yang dihasilkan, matriks partisi, pusat cluster, hasil perhitungan Fuzzy C-Means, grafik, dan informasi promosi.
Gambar 9 Hasil Perhitungan Fuzzy dan Clustering
12
Gambar 10 Informasi Biro Promosi
Tabel 1 Hasil Pengclusteran Data Sekolah Menangah Atas Kota Salatiga Label Data
Nama Sekolah
Rendah
Sedang
Tinggi *
Keterangan
1
SMA Kristen 1 Salatiga
2
SMA Kristen 2 Salatiga
3
SMA Kristen Satya Wacana Salatiga
4
SMA Muhammadiyah Salatiga
*
Promosi lebih ditingkatkan
5
SMA PGRI 3 Salatiga
*
Promosi lebih ditingkatkan
6
SMA Theresiana
*
Promosi lebih ditingkatkan
7
SMA Negeri 1 Salatiga
*
Promosi cukup
8
SMA Negeri 2 Salatiga
*
Promosi cukup
9
SMA Negeri 3 Salatiga
*
Promosi cukup
10
SMK PGRI 1 Salatiga
*
11
SMK PGRI 2 Salatiga
*
12
SMK Kristen 1 Salatiga
13
SMK Kristen 2 Salatiga
*
Promosi lebih ditingkatkan
14
SMK Islam Sudirman Tingkir
*
Promosi lebih ditingkatkan
15
SMK Diponegoro
*
Promosi lebih ditingkatkan
16
SMK Negeri 1
*
Promosi lebih ditingkatkan
17
SMK Pelita
*
Promosi lebih ditingkatkan
18
SMK Negeri 2
*
Promosi lebih ditingkatkan
19
SMK T&I Kristen
*
Promosi lebih ditingkatkan
20
SMK Saraswati
*
Promosi lebih ditingkatkan
21
SMK Negeri 3 Salatiga
*
Promosi lebih ditingkatkan
22
SMA Lain - Lain
*
Promosi lebih ditingkatkan
*
Promosi lebih ditingkatkan *
Promosi cukup
Promosi lebih ditingkatkan Promosi lebih ditingkatkan *
13
Promosi cukup
Promosi cukup
Tabel 1 adalah salah satu contoh hasil pengclusteran dengan data sampel sekolah menengah atas Kota Salatiga selama 3 tahun terakhir. Ada 22 data mewakili nama – nama sekolah menengah atas serta jumlah calon mahasiswa tiap tahunnya. Disini ke – 22 data tersebut masuk ke dalam 2 cluster yaitu cluster sedang dan cluster tinggi. Dapat dilihat data yang masuk ke cluster tinggi ada SMA Kristen 1 Salatiga, SMA Kristen Satya Wacana, SMA Negeri 1 Salatiga, SMA Negeri 2 Salatiga, SMA Negeri 3 Salatiga, SMK Kristen 1 Salatiga, yang promosinya cukup. Sisanya masuk ke kelompok sedang dimana promosi lebih ditingkatkan. Tabel 4.2 Hasil Pengclusteran Data Jurusan Label Data
PROGRAM STUDI
Rendah
Sedang
Tinggi
Keterangan
1
AGRIBISNIS
*
Promosi kurang
2
AGROEKOTEKNOLOGI
*
Promosi kurang
3
AKUTANSI
4
ANALIS KIMIA INDUSTRI
*
Promosi kurang
5
BIMBINGAN KONSELING
*
Promosi kurang
6
BIOLOGI
*
Promosi kurang
7
SECRETARY PROGRAM
*
Promosi kurang
8
TOURISM PROGRAM
*
Promosi kurang
9
D2 PENDIDIKAN GURU SD
*
Promosi kurang
10
DESAIN KOMUNIKASI VISUAL
*
Promosi kurang
11
DOKTOR ILMU MANAJEMEN
*
Promosi kurang
12
DOKTOR SOSIOLOGI AGAMA
*
Promosi kurang
13
DOKTOR STUDI PEMBANGUNAN
*
Promosi kurang
14
FISIKA
*
Promosi kurang
15
ILMU HUKUM
*
Promosi kurang
16
KEPERAWATAN
*
Promosi kurang
17
KIMIA
*
Promosi kurang
18
KOMPUTER AKUNTANSI
*
Promosi kurang
19
KOMUNIKASI
*
Promosi kurang
20
MAGISTER BIOLOGI
*
Promosi kurang
21
MAGISTER ILMU HUKUM
*
Promosi kurang
22
*
Promosi kurang
23
MAGISTER MANAJEMEN MAGISTER MANAJEMEN PENDIDIKAN
*
Promosi kurang
24
MAGISTER SAINS PSIKOLOGI
*
Promosi kurang
25
MAGISTER SISTEM INFORMASI
*
Promosi kurang
26
MAGISTER SOSIOLOGI AGAMA
*
Promosi kurang
27
MAGISTER STUDI PEMBANGUNAN
*
Promosi kurang
28
MANAJEMEN
29
MATEMATIKA
*
* *
Promosi lebih ditingkatkan
Promosi lebih ditingkatkan Promosi kurang
14
30
PENDIDIKAN BAHASA INGGRIS
*
Promosi lebih ditingkatkan
31
PENDIDIKAN GURU SD
*
Promosi lebih ditingkatkan
32
PENDIDIKAN MATEMATIKA
*
Promosi lebih ditingkatkan
33
PENDIDIKAN EKONOMI
*
Promosi kurang
34
PENDIDIKAN FISIKA
*
Promosi kurang
35
PENDIDIKAN SEJARAH
*
Promosi kurang
36
PERSONNEL MANAGEMENT
*
Promosi kurang
37
PPKN
*
Promosi kurang
38
PSIKOLOGI
39
PUBLIC RELATION
40
S1 PENDIDIKAN GURU
41
SENI MUSIK
*
Promosi kurang
42
SISTEM INFORMASI
*
Promosi kurang
43
SISTEM KOMPUTER
*
Promosi kurang
44
SOSIOLOGI
*
Promosi kurang
45
STUDI PEMBANGUNAN
*
Promosi kurang
46
TEKNIK ELEKTRO
*
Promosi kurang
47
TEKNIK INFORMATIKA
48
TEOLOGI
*
Promosi lebih ditingkatkan
*
Promosi kurang *
* *
Promosi cukup
Promosi lebih ditingkatkan Promosi kurang
Tabel 2 adalah salah satu contoh hasil pengclusteran dengan data sampel program studi selama 3 tahun terakhir. Ada 48 data mewakili nama – nama program studi serta jumlah peminat tiap tahunnya. Disini dilihat ke – 48 data tersebut ada 7 data pada cluster sedang yaitu Akutansi, Manajemen, Pendidikan Bahasa Inggris, Pendidikan Guru SD, Pendidikan Matematika, Psikologi, dan Teknik Informatika, yang promosinya lebih ditingkatkan . S1 Pendidikan Guru promosinya sudah cukup. Sisanya masuk ke cluster rendah dimana promosi kurang.
5. Simpulan Berdasarkan uji coba terhadap data kota Salatiga dan data program studi, nilai cluster sekolah dan program studi yang promosinya kurang, lebih direkomendasikan untuk dilakukan promosi di sekolah dan pada program studi tersebut. Biro promosi dapat lebih melakukan pendekatan terhadap sekolah menengah atas dan peningkatan pengenalan keunggulan program studi terhadap sekolah dan program studi yang promosinya kurang atau lebih ditingkatkan. Dengan begitu biaya dari sekolah dan program studi yang promosinya cukup dapat diefektifkan kepada promosi yang kurang. Informasi dalam clustering data ini dihitung dengan menggunakan algoritma Fuzzy C Means (FCM). Adapun perhitungan dalam Fuzzy C Means (FCM) menggunakan jumlah calon
15
mahasiswa tiap sekolah dan jumlah peminat masing – masing program studi selama 3 tahun sebagai atribut. Diharapkan di kemudian hari, pengembangan yang dapat dilakukan pada aplikasi clustering data ini adalah dengan menambah atribut sebagai dasar perhitungan Fuzzy C Means (FCM), membuat cluster dan pembobot sebagai inputan yang dinamis. Serta pengembangan aplikasi lebih diperbaiki dari sisi User interface secara umum, sehingga pihak promosi lebih mudah membaca hasil perhitungan.
6. Daftar Pustaka [1] [2] [3] [4]
[5]
[6] [7] [8]
Kusrini, 2006, Algoritma Data Mining, Penerbit ANDI, Yogyakarta. Kusumadewi, Sri dan Hari Purnomo, 2004, Aplikasi Logika Fuzzy Untuk Pendukung Keputusan, Yogyakarta: Graha Ilmu. Suharyadi, 2012, Analisis Strategi Universitas dengan Data Mining, Salatiga : Fakultas Teknologi Informasi Universitas Kristen Satya Wacana. P. W Irandha, Irma, Analisa Keluarga Miskin Dengan Menggunakan Metode Fuzzy C-Means Clustering, Politeknik Elektronika Negeri Surabaya. Bahar, 2011, Penentuan Jurusan Sekolah Menengah Atas dengan Algoritma Fuzzy C-Means, Program Pasca Sarjana, Magister Teknik Informatika, Universitas Dian Nuswantoro, Semarang. Kantardzic, Mehmed (2003), Data Mining Concepts Models, Methods, and Algorithms, New Jersey, IEEE. Kusumadewi, S., Hartati, S., 2006, Fuzzy Multi Atribute Decision Making, Graha Ilmu, Yogyakarta. Kusumadewi, S., Purnomo, H., 2010, Aplikasi Fuzzy Untuk Pendukung Keputusan, Graha Ilmu, Jakarta.
16