APLIKASI SURVEY POLITIK UNIVERSITAS BRAWIJAYA MALANG (ASUPOL) : STUDI KASUS PEMILIHAN BEM PTIIK 2012 (PEMILWA 2012)
Afiqie Fadhihansah1*, Dio Dharmawan1**, Fridha Agustina1**, Irwan Nugrahanto1*, Maharani Putri S N1**, Tri Halomoan S1*
1
Teknik Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya, Malang 65142, Indonesia
E-Mail: * {afiqie.fadhihansah, irwan.nugrahanto, trihalomoans} @yahoo.com, ** {vaiofreak16, fridha92, maharanipsn} @gmail.com. Abstrak Pemilihan BEM 2012 akan dilaksanakan untuk pertama kalinya di PTIIK. Mungkin saat ini terlalu dini untuk mengetahui siapa yang akan menjadi pemenang Pemilihan BEM 2012, namun tidak ada salahnya untuk mengetahui lebih cepat bagaimana pemilihan ini akan berjalan nantinya. Karena ini adalah pertama kalinya PTIIK melaksanakan Pemilihan BEM 2012 maka respon, tolok ukur serta pola dalam Pemilihan BEM 2012 masih belum diketahui. Respon, tolok ukur serta pola dalam Pemilihan BEM 2012 dapat diketahui, salah satunya dengan metode algoritma Naïve Bayes. Data yang diperoleh akan diolah dengan algoritma Naïve Bayes yang nantinya akan menghasilkan pola-‐pola yang akan dijadikan tolak ukur dalam memprediksi pilihan dari seorang mahasiswa berdasarkan atribut yang dimilikinya. Hasil akhir yang diperoleh dari aplikasi ini adalah Calon 1 mendapat 59 suara (25%), Calon 2 mendapat 129 suara (54,66%), Golput sebesar 49 suara (20,34%). Total pemilih sebesar 236 mahasiswa sehingga diperoleh pemenang yaitu Calon 2. Kata kunci: (6) Algoritma naïve bayes, BEM, pola, atribut Abstract The 2012 BEM Election will be held for the first time in PTIIK. It too soon to predict the 2012 BEM Presidential winner, but it is not too early to know the general election will look like. Since this is the first time the BEM Election 2012 PTIIK will be held, and the benchmark BEM’s patterns election is still unknown. Response, as well as patterns in the benchmark BEM Elections 2012 are known, one with a Naive Bayes algorithm method. The data obtained will be processed with a Naive Bayes algorithm will produce patterns to be used as benchmarks in predicting the choice of a student
based on its attributes. The final results obtained from this application is 25% Candidate 1, Candidate 2 for 54.66%, 20.34% Golput amount. Total turnout of 236 students that earned the winner is Candidate 2.
Keywords: (6) naïve bayes algorithm, BEM, patterns, attributes.
merupakan salah satu metode yang dapat 1. PENDAHULUAN Setiap
digunakan
orang
memiliki
untuk
melakukan
pilihan
pengklasifikasian terhadap suatu data,
tersendiri dalam menentukan seorang
dimana naïve bayes classifier merupakan
pemimpin, baik itu dari tingkat terendah
bagian dari Teorema Bayes. Dengan
seperti pemimpin lingkungan tempat
menggunakan
tinggal hingga tingkat tertinggi seperti
classifier, proses klasifikasi memerlukan
pemimpin suatu Negara.
sejumlah petunjuk untuk menentukan
Banyak faktor yang menentukan
naïve
bayes
kelas apa yang cocok bagi sampel yang
mengapa seseorang memutuskan untuk mengambil keputusan untuk memilih
metode
akan dianalisis.
kandidat terbaik yang ia rasa layak untuk
Teorema Bayes memiliki bentuk umum
menjadi seorang pemimpin. Faktor-‐faktor
seperti pada persamaan 1 berikut :
ini bisa dipelajari dan diolah melalui sistem
P(H|X) =
𝑷 𝑿 𝑯 𝑷(𝑯)
pengenalan pola.
𝑷(𝑿)
……. [4]
Yang mana[3] :
2. METODE PENELITIAN Pada aplikasi ini metode penelitian
X = data dengan class yang belum diketahui
yang digunakan adalah Naïve Bayes
H = hipotesis data X merupakan suatu
Classifier yang merupakan bagian dari
class spesifik
Teorema Bayes untuk menentukan ke
P(H|X) = probabilitas hipotesis H
kelas manakah data uji akan masuk.
berdasakan
kondisi
X
(posteriori
probability)
Teorema Bayes. Teorema Bayes adalah
P(H) = probabilitas hipotesis H (prior
suatu teorema mengenai peluang yang
probability)
pertama kali diperkenalkan oleh Reverend
P(X|H) = probabilitas X berdasarkan
Thomas Bayes [1]. Naïve Bayes Classifier
kondisi pada hipotesis H
P(X) = probabilitas dari X … (3)
Rumus di atas menjelaskan bahwa peluang masuknya sampel dengan karakteristik
Di mana:
tertentu dalam kelas H (posterior) adalah
·∙ P menyatakan peluang
munculnya kelas H (sebelum masuknya
·∙ Xi menyatakan atribut ke-‐i.
sampel ke dalam karakteristik tertentu
·∙ xi menyatakan nilai atribut ke-‐i.
dalam kelas H, atau biasa disebut sebagai
·∙ Y menyatakan kelas yang dicari.
prior) dikali dengan peluang kemunculan
·∙ yi menyatakan sub kelas Y yang dicari.
karakteristik-‐karakteristik
·∙ µ menyatakan rata-‐rata dari seluruh
sampel
pada
kelas H (disebut juga dengan likelihood),
atribut.
dibagi
·∙ σ menyatakan varian dari seluruh atribut.
dengan
peluang
kemunculan
karakteristik-‐karakteristik sampel secara global (disebut juga dengan evidence). Oleh karena itu, rumus diatas bisa juga dituliskan dengan sederhana, yakni seperti persamaan 2 berikut :
Naïve Bayes Classifier. Klasifikasi adalah proses untuk menemukan model atau fungsi
yang
menjelaskan
atau
membedakan konsep atau kelas data, dengan
tujuan
untuk
dapat
memperkirakan kelas dari suatu obyek [2]. …. (2)(5)
Oleh karena itu, kelas yang ada tentulah
Keterangan :
lebih dari satu. Penentuan kelas dari suatu
Nilai evidence selalu tetap untuk setiap
dokumen
kelas pada suatu sampel. Nilai dari
membandingkan nilai probabilitas suatu
posterior tersebut yang nantinya akan
sampel berada di kelas yang satu dengan
dibandingkan dengan nilai-‐nilai posterior
nilai probabilitas suatu sampel berada di
kelas lainnya untuk menentukan ke kelas
kelas yang lain.
dilakukan
dengan
cara
apa suatu sampel akan diklasifikasikan. Prior digunakan untuk menghitung peluang awal dari θ untuk pengamatan data. Untuk klasifikasi dengan data kontinyu, maka digunakan rumus seperti persamaan 3 berikut :
Gambar 1. Ilustrasi pengklasifikasian data
Penentuan kelas yang cocok bagi
Proses kerja pada sistem. Pertama-‐tama
suatu sampel dilakukan dengan cara
program akan mencari nilai kemungkinan
membandingkan nilai Posterior untuk
tiap fitur dari tiap kelas. P(x | kelasN)
masing-‐masing kelas dan mengambil kelas
dibaca jika x maka kelasN. ‘x’ merupakan
dengan nilai Posterior yang tinggi.
jumlah data fitur yang termasuk kedalam
Dari data training yang sudah
kelasN, data fitur menyamakan data fitur
terkumpul, kami akan memperhitungkan
pada data baru/input. Selanjutnya x akan
menggunakan naïve bayes. Kemudian
dibagi dengan total keseluruhan jumlah
aplikasi asupol akan memberikan hasil
data yang termasuk kedalam kelasN. selain
klasifikasi yang sesuai dengan kriteria data
itu dihitung juga nilai dari jumlah data tiap
yang dimasukkan.
kelas dibagi dengan total jumlah data
Terdapat 8 atribut yang digunakan,
keseluruhan
kelas.
Dari
perhitungan
yakni :
tersebut akan didapat nilai kemungkinan
1. Jenis Kelamin
dari tiap fitur.
2. Agama
Langkah berikutnya program akan
3. Usia
menghitung data kontinyu dari data
4. SMA Asal
baru/input dengan berpatokan pada data
5. Kota Asal
uji/training. Pada program ini digunakan
6. Propinsi
fitur Usia sebagai perhitungan data
7. Jurusan
kontinyu. Perhitungan data kontinyu ini
8. Angkatan
menggunakan rumus gaussian seperti yang
Sedangkan kelas yang digunakan ada
telah dijelaskan pada pendahuluan, hasil
3 kategori, yakni :
dari perhitungan ini akan didapatkan nilai
1. Calon 1
dari data kontinyu.
2. Calon 2 3. Tidak Memilih (Golput)
Terakhir akan dilakukan perhitungan nilai dengan mengkalikan seluruh data pada tahap awal perhitungan dan juga
Data baru akan diolah dengan menggunakan 7 atribut dan nantinya akan di masukkan ke salah satu kelas dari 3 kelas yang ada sesuai dengan posteriornya.
data kontinyu sesuai dengan kelasnya, sehingga didapat nilai akhir dari tiap kelas. nilai dari tiap kelas ini kemudian akan dibandingkan
dan
diambil
nilai
maksimal/tertinggi. nilai maksimal ini yang
akan dijadikan sebagai patokan untuk
data tersebut masuk kedalam kelas 1 atau
mengklasifikasikan data baru termasuk
3.
kedalam kelas ke berapa.
Begitu pula pada propinsi dan
angkatan dengan data “DKI Jakarta” dan
3. HASIL DAN ANALISA Hasil
dari
baru/input
“2010” pada data uji/training lebih banyak
program akan
ini,
data
masuk kedalam kelas 1 sehingga jika
dimasukkan/
terdapat
data
baru/input
dengan
diklasifikasikan ke dalam kelas yang
propinsi DKI Jakarta dan angkatan 2010
dianggap paling mendekati menurut dan
akan lebih sering diklasifikasiakan kedalam
berdasarkan
kelas 1.
perhitungan
dari
data
uji/training. dari uji coba hasil dengan
Penyebab lain dari masalah diatas
menginputkan data baru yang bernilai
kurang ter-‐covernya / kurang meratanya
sama dengan salah satu data yang ada
data tiap fitur yang ada pada data
pada data uji/training, 3 dari 10 kali
uji/training. Sehingga jika data baru/input
percobaan
dimasukkan dan salah satu fitur yang
dengan
data
random
didapatkan hasil yang berbeda pada
dimasukkan
pengklasifikasian.
bukan
uji/training, fitur tersebut menjadi kurang
dikarenakan kesalahan pada program
berpengaruh pada pengklasifikasian data,
melainkan program mencari kedekatan
sehingga program kurang mendapatkan
paling maksimal dari seluruh hasil pada
hasil maksimal.
Hal
ini
data uji/training yang ada.
tidak
ada
dalam
data
Analisa lain diluar sistem, sistem
Dari analisa 2 fitur yaitu propinsi dan
merupakan program matematis yang
angkatan dengan data “Jawa Timur” dan
menilai data dari pandangan subjektif dari
“2010” pada data uji/training lebih banyak
data
masuk kedalam kelas 2 sehingga jika
pemilihan data uji/training yang ada
terdapat data baru/input dengan propinsi
terkandung aspek lain seperti emosi,
Jawa Timur dan angkatan 2010 akan lebih
perasaan, dan pikiran serta hal-‐hal lain
sering diklasifikasikan kedalam kelas 2
yang lebih bersifat objektif, individu, dan
walaupun data baru/input yang di
personal sehingga sistem tidak dapat
inputkan tersebut sama persis dengan
menyamai aspek-‐aspek tersebut.
salah satu data yang ada pada data
uji/training, yang mana pada data training
yang
ada,
sedangkan
terkait
Daftar pemilih yang sudah masuk :
Gambar 2. Data training pada asupol.tk Berikut hasil dari data training yang telah
dikumpulkan :
Gambar 6.Hasil pengklasifikasian data uji Dari hasil uji coba, maka didapatkan : •
Untuk pemilih asal “Kab. Sumenep” pada
Gambar 3. Statistik data training
semua
angkatan,
lebih
diklasifikasikan ke dalam kelas 2.
Data uji yang masuk akan dimasukkan ke
•
dalam database data uji.
Untuk pemilih asal “DKI Jakarta” dan
pada
semua
angkatan,
dikalsifikasikan ke dalam kelas 1.
4. KESIMPULAN
Gambar 4.Data uji pada database
Aplikasi yang digunakan untuk
asupol.tk Apabila
dilakukan
menghitung suara secara cepat. Dengan
pengklasifikasian
adanya aplikasi ini, 1 orang tidak bisa
terhadap data tertentu, maka akan
memberikan suaranya lebih dari 1 kali.
dihasilkan :
Kita dapat melakukan klasifikasi data
Gambar 5.Input data uji
menggunakan Metode Naïve bayes pada Quick Count. Dengan metode Naïve Bayes, dapat diketahui seorang calon pemilih masuk dalam kategori kelas calon 1, 2, atau 3. Dari calon pemilih
kita
dapat
mengetahui,
kedekatan antara data pemilih dan calon, mempengaruhi siapa yang dipilih. Dari sini kita dapat mengetahui
persentase akurasi. Dari survey yang
tanggal 19 Desember 2012 11.48
telah kami lakukan diketahui hasilnya
pm
adalah Calon 1 sebesar 59 suara (25%),
Calon 2 sebesar 129 suara (54,66%),
bayes-‐theorem/ >
Golput sebesar 48 suara (20,34%), dan total pemilih sebesar 236 orang.
Classifiers”, October 2006, diakses
Sedangkan dalam pemilwa yang telah
tanggal 20 Desember 2012.
diadakan PTIIK pada tanggal 20
Desember 2012, diketahui hasilnya
Teaching/CS340Fall06/reading/NB.
adalah Calon 1 sebesar 94 suara
pdf>
(23,32%), Calon 2 sebesar 285 suara
3) Siti Winiarti, “Pemanfaatan
(70,71%), Golput sebesar 3 suara
Teorema Bayes Dalam Penentuan
(0,7%), tidak sah sebesar 21 suara
Penyakit THT”, Jurnal Informatika,
(5,21%) dan total pemilih sebesar 403
Vol. 2, No.2, Juli 2008.
orang. Sehingga diperoleh hasil akurasi aplikasi asupol sebesar 83,95%.
4) Ammar Shadiq, “Keoptimalan Naïve Bayes Dalam Klasifikasi”, Program
Ilmu Komputer FPMIPA Universitas Pendidikan Indonesia.
5. REFERENSI 1) James Joyce, “Bayes Theorem”, Stanford
Encyclopedia
of
Philosophy, June 2003, diakses
2) Kevin P Murphy, “Naïve Bayes
5) Samuel Natalius, “Metoda Naïve Bayes Classifier dan Penggunaannya pada Klasifikasi Dokumen”, ITB, Bandung, 2010.