Artikel Skripsi Universitas Nusantara PGRI Kediri
KLASIFIKASI DATA FORUM PENGADUAN PESERTA PELATIHAN DI DIKLAT PERTANIAN JAWA TIMUR DENGAN MENGGUNAKAN METODE LVQ (LEARNING VECTOR QUANTIZATION)
SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer (S.Kom) Pada Program Studi Teknik Informatika
OLEH : MOH. DADANG HALIMI YUSUF 12.1.03.02.0226
FAKULTAS TEKNIK UNIVERSITAS NUSANTARA PERSATUAN GURU REPUBLIK INDONESIA UN PGRI KEDIRI 2016
MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
simki.unpkediri.ac.id || 1||
Artikel Skripsi Universitas Nusantara PGRI Kediri
1. Halaman persetujuan lengkap TTD (scan)
MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
simki.unpkediri.ac.id || 2||
Artikel Skripsi Universitas Nusantara PGRI Kediri
2. Halam Pengesahan Lengkap TTD dan Stempel (Scan)
MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
simki.unpkediri.ac.id || 3||
Artikel Skripsi Universitas Nusantara PGRI Kediri
KLASIFIKASI DATA FORUM PENGADUAN PESERTA PELATIHAN DI DIKLAT PERTANIAN JAWA TIMUR DENGAN MENGGUNAKAN METODE LVQ (LEARNING VECTOR QUANTIZATION)
Moh. Dadang Halimi Yusuf 12.1.03.02.0266 Teknik - Informatika
[email protected] Fatkhur Rohman, M.Pd dan Intan Nur Farida, M.KOM. UNIVERSITAS NUSANTARA PGRI KEDIRI
ABSTRAK Proses pengelompokan data forum pengaduan peserta pelatihan di UPT Diklat Pertanian Jawa Timur masih dilakukan secara manual. Sehingga membutuhkan waktu yang lama dan sering terjadi kehilangan data serta kesalahan dalam pengelompokkan data pengaduan. Rumusan masalah dalam penelitian ini (1)Bagaimana mengelompokkan data forum pengaduan peserta pelatihan sesuai dengan isinya berupa kritik atau saran?. (2)Berapa akurasi yang dihasilkan oleh metode LVQ dalam mengklasifikasikan komentar?. Sehingga tujuan dari penelitian ini adalah (1) Mengelompokkan data forum pengaduan peserta menjadi dua kelas. yaitu, kritik atau saran sehingga mempermudah pegawai terkait dalam memprioritakan aspirasi peserta yang harus ditangani terlebih dahulu tentang sarana dan prasarana.(2) Mengetahui akurasi terbaik metode LVQ dalam mengklasifikasikan komentar. Sistem ini menggunakan metode LVQ (Learning Vector Quantization), dimana masing-masing komentar akan dihitung dengan bobot dari hasil data learning serta membandingan komentar tersebut termasuk dalam kelas kritik atau saran. sehingga memberikan output label dari setiap komentar yang masuk. Pengelompokkan ini berdasarkan hasil dari penghitungan bobot dan komentar dengan mencari jarak terdekat dari hasil perhitungan tersebut. Sistem klasifikasi ini membantu pegawai dalam melakukan pengelompokkan data pengaduan peserta sesuai dengan kelasnya yaitu kritik atau saran. Hal ini berguna untuk memudahkan pekerjaan pegawai dalam pengelompokkan sera mengetahui masalah apa yang harus segera ditangani sehingga dapat memberikan hasil pelayanan yang maksimal.
Kata Kunci : Data mining, klasifikasi, Learning Vector Quantization.
MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
simki.unpkediri.ac.id || 4||
Artikel Skripsi Universitas Nusantara PGRI Kediri
I.
LATAR BELAKANG Perkembangan
teknologi
telah
mengakibatkan meningkatnya data dalam
Mengklasifikasikan dokumen abastrak tugas akhir sesuai dengan kategorinya.
jumlah besar. Data berukuran besar yang
Metode
data mining yang akan
sudah disimpan jarang digunakan secara
diterapkan dalam penelitian ini adalah
optimal karena manusia seringkali tidak
klasifikasi. Berbeda dengan clustering yang
memiliki waktu dan kemampuan yang
hanya mengelompokkan, proses klasifikasi,
cukup
(Hermadi,
yaitu proses learning, dan juga adanya kasus
2007). Data bervolume besar seperti data
baru yang akan dimasukkan ke dalam suatu
teks, jauh melampaui kapasitas pengolahan
kelas. Klasifikasi komentar adalah proses
manusia yang sangat terbatas (Toyota,
memberi label komentar sesuai
2012).
kategori
untuk
mengelolanya
Kasus yang diangkat adalah data
yang dimilikinya.
komentar merupakan
dengan
Klasifikasi
masalah
yang
pengaduan atau evaluasi peserta pelatihan di
mendasar namun sangat penting karena
UPT
Timur.
manfaatnya cukup besar mengingat jumlah
Pengaduan atau evaluasi peserta pelatihan di
komentar yang ada setiap hari semakin
UPT Diklat Pertanian Jawa Timur saat ini
bertambah.
masih menggunakan cara manua, Masing
dikelompokkan ke dalam kategori tertentu
masing peserta diminta untuk mengisi kritik
berdasarkan kata-kata dan kalimat-kalimat
maupun
sudah
yang ada di dalam komentar tersebut.
akan di
Kata atau kalimat yang terdapat di dalam
kumopulkan oleh panitia untuk dilakukan
sebuah komentar memiliki makna tertentu
pengelompokan.
data
dan dapat digunakan sebagai dasar untuk
tersebut dilakukan secara manual sehingga
menentukan kategori dari komentar tersebut
sering
sehingga
Diklat
Pertanian
saran
disediakan.
di
Jawa
kertas
yang
Kertas tersebut
Pengelompokan
terjadi
kesalahan.
Untuk
Sebuah
meminimalkan
menanggulangi hal tersebut, diperlukan
sumber
adanya
pengklasifikasian.
mekanisme
pelabelan
data
komentar
daya
waktu
manusia
dapat
dan dalam
pengaduan secara otomatis, sehingga dapat
Berdasarkan permasalahan diatas
meminimalisir kesalahan.
penelitian ini akan membahas mengenai
Untuk memmberikan label pada data
maka
klasifikasi dokumen teks menggunakan
pengaduan peserta tersebut salah satunya
metode
bisa dengan menggunkan data mining
Quantization). Algoritma ini dikenal dengan
sebagaimana
kemampuannya dalam
dilakukuan
penelitian oleh
Hariri
yang
telah
(2014)
dalam
MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
LVQ
(Learning
Vector
klasifikasi yang
mempunyai tinggkat akurasi
tinggi dan
simki.unpkediri.ac.id || 2||
Artikel Skripsi Universitas Nusantara PGRI Kediri
kecepatan dalam hal proses (Hadnanto,
dalam evaluasi pelatihan sebanyak 4
1996).
angkatan pelatihan.
Penelitian ini fokus dalam melihat performa LVQ dalam mengklasifikasikan komentar dan
untuk
stemming
2. Komentar yang diolah hanya yang berbahasa Indonesia saja.
dokumennya
3. Isi komentar yang diolah hanya yang
menggunakan algoritma nazief & andriani
berupa kata-kata, sedangkan simbol dan
karena algoritma ini memiliki akurasi yang
angka tidak diolah.
lebih baik dibandingkan algoritma porter (Agusta, 2009).
4. Proses stemming hanya berlaku pada kata-kata berbahasa Indonesia saja. 5. Data akan dikelompokkan dalam 2
A. IDENTIFIKASI MASALAH
kelas, yaitu Kritik Atau Saran. 6. Untuk data learning dan testing jumlah
Berdasarkan uraian latar belakang
masing-masing kelas sebanding.
yang telah dipaparkan, maka pokok identifikasi masalah adalah sebagai berikut: 1. Proses
evaluasi
pelatihan
yang
dilakukan di UPT Diklat Pertanian Jawa Timur masih dilakukan secara manual
2. Pengelompokan data evaluasi / forum sering kali terjadi kesalahan dalam data
tersebut
apakah
Algoritma
Nazief
&
Adriani. 8. Akurasi ditentukan berdasarkan hasil asli
yang
algoritma LVQ. 9. Parameter yang diubah-ubah dan diamati hasilnya untuk mendapatkan kondisi terbaik
10. Pengecekan parameter reduksi dimensi
3. Sering terjadi kehilangan data karena pengumpulan
menggunakan
dokumen
adalah nilai dimensi.
termasuk kritik atau saran.
faktor
stemming
yang dibandingkan dengan hasil dari
dan belum terkomputerisasi.
pemahaman
7. Untuk
masih
dilakukan secara manual.
dilakukan antara 40% sampai 80% dengan penambahan parameter sebesar 20%. 11. Prototype yang akan dibuat hanya akan mensimulasikan proses pembentukan bobot
B. PEMBATASAN PENELITIAN Permasalahan yang akan dibahas di dalam penelitian ini dibatasi sebagai berikut: 1. Data komentar yang digunakan adalah data kalimat komentar dari peserta pelatihan yang sebelumya dituangkan II.
oleh
algoritma
LVQ
dan
proses
pengklasifikasian komentar. 12. Database menggunakan mySQL sebagai database pasif yang kedudukannya hanya digunakan menyimpan data. 13. Prototype dibangun menggunakan bahasa pemprograman PHP.
METODE
MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
simki.unpkediri.ac.id || 3||
Artikel Skripsi Universitas Nusantara PGRI Kediri
Jaringan saraf
tiruan Learning
vektor input
dengan
vektor
bobot
Vector Quantization (LVQ) telah banyak
menggunakan Euclidean distance. Secara
dimanfaatkan untuk pengenalan pola baik
matematis
berupa citra, suara, dan lain-lain. Jaringan
dirumuskan : (Kohonen,1988)
Ecluidean
Distance
dapat
LVQ sering pula digunakan untuk ekstraksi pola.
Metode
Jaringan
Syaraf
LVQ
dimana :
termasuk dengan Supervised Learning dalam
penentuan
bobot
/
…..(1)
ij
ciri (feature) pada proses awal pengenalan
dj2 = distance
model
pembelajarannya, dimana pada metode
Xt = Node data input
LVQ ditentukan hasil seperti apa selama
Wij = Bobot ke-ij
proses
pembelajaran.
Selama
proses
pembelajaran nilai bobot disusun dalam suatu range tertentu tergantung pada nilai input yang diberikan. Tujuan pembelajaran ini adalah pengelompokan unit-unit yang hampir sama dalam satu area tertentu. Pembelajaran seperti ini sangat cocok untuk pengelompokan (klasifikasi) pola
LVQ
minimum. Dimana node yang terpilih (winner) berjarak minimum akan di update bobot, update bobot node winner yang dirumuskan sebagai berikut :
𝑤ij
adalah
pengurangan node-node
𝑤ij
dari
(neighbour)
(Kusumadewi,2003),
sehingga
pada
akhirnya hanya ada satu node output yang yang
dilakukan perhitungan jumlah jarak selisih
algoritma
kerja
tetangganya
terpilih
antara node output dengan input maka
Jika sesuai target memakai rumus:
(Efendi,2009) Prinsip
Setelah diketahui tiap-tiap jarak
(winner
node).
dilakukan
Pertama
adalah
kali
melakukan
+1
𝑤ij
dan jika tidak 𝑤ij 𝑤ij
+1
𝑤ij
0<𝛼
Setelah diberikan bobot, maka jaringan
x
maka
jaringan
mulai
melakukan
perhitungan jarak vektor yang didapatkan
𝛼
. 𝑥
, 𝑗 ∈ 𝑁𝑒 .....(3)
Dimana :
input. Setelah input diterima jaringan,
. 𝑥
, 𝑗 ∈ 𝑁𝑒 .....(2)
inisialisasi bobot untuk tiap-tiap class. diberi input sejumlah dimensi node/neuron
+𝛼
< 1 .…………...... (4)
= Input pixel
w = bobot Ne = Nilai neighborhood t
= waktu
dengan menjumlah selisih/jarak antara MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
simki.unpkediri.ac.id || 4||
Artikel Skripsi Universitas Nusantara PGRI Kediri
i
= index node input
j
= index node output
α
= alpha learning rate
-
sehingga
perubahan
-
minimum
Perbaiki Wj dengan ketentuan
o Jika T=Cj maka :
bobot
Wj(baru)=Wj(lama)
yang berubah terhadap perubahan error. Perubahan alpha
||X-Wj||
(Sebutsebagai Cj)
α(t) merupakan alpha/learning rate yaitu faktor pengali pada
Tentukan j sedemikian rupa
+α(X-
Wj(lama))
ini sesuai dengan
o Jika T≠Cj maka :
banyaknya input yang masuk. Faktor
Wj(baru)=Wj(lama)
pengali
Wj(lama))
alpha/learning rate
ini
akan
selalu berkurang bila tidak ada perubahan error. Dalam penelitian ini alpha learning rate
akan
berubah
berkurang
c. 4.
+1
0.1 ∗ 𝛼
Kurangi nilai α
Kembali ke langkah ke-3, jika
secara
(Epoch < maxEpoch) atau (α > eps)
geometris sebagai berikut: (Balza,2005) 𝛼
-α(X-
tidak terpenuhi, selesai.
...........(5)
Setelah dilakukan pelatihan, akan
algoritma
diperoleh bobot akhir (W). Bobot-bobot ini
Learning Vector Quantization (LVQ)
nantinya akan digunakan untuk melakukan
sebagai berikut:
klasifikasi terhadap data baru. Gambar 2.1
Secara
1.
garis
besar
Siapkan data learning, x (m,n) dan
dibawah
mengilustrasikan
proses
perhitungan metode LVQ.
target T (1,n).
Start
2.
Inisialisasi bobot (W), maksimum
Tetapkan Data Learning dan Bobot awal (W)
Epoch (Max Epoch), error minimum Inisialisai MaxEpoh , Eps, dan Learning rate (alpha)
yang diharapkan (Eps), learning
(Epoh<max) or (alpha>eps)
rate (α). Max Epoch dan learning
Y
i = 1
rate digunakan untuk menentukan i
batas ambang komputasi
T
Epoh=epoh+1
Y
C=||X-Wj||
T
3.
Melakukan proses sebagai berikut selama
(Epoch<maxEpoch)
Y
atau
Persamaan 2
(α>eps).
T
Persamaan 3
Learning rate - i++
Selesai
a. Epoch = Epoch+1
Gambar 2.4 Flowchart LVQ
b. Kerjakan untuk i=1 sampai n III. MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
Target=C
HASIL DAN KESIMPULAN simki.unpkediri.ac.id || 5||
Artikel Skripsi Universitas Nusantara PGRI Kediri
Dalam
tahapan
awal
membuat
sebuah aplikasi, tentu diperlukan sebuah
digunakan oleh user.
Yaitu halaman
admin, serta halaman peserta.
rancangan awal sebagai patokan dan sebagai
dasar
fondasi
aplikasi tersebut
agar
nantinya
1.
Halaman Form Login
bisa berjalan sesuai
Fungsi : sebagai halaman login untuk
dengan tujuan awal dibangunnya aplikasi
pegawai, Ka.Subag Tata Usaha, dan
tersebut. Maka dari itu, dalam sub bab
Kepala UPT.
Desain Rancangan Aplikasi ini, penulis berusaha
menguraikan
tahapan-tahapan
dalam merancang sistem ini yang nantinya meliputi desain sketsa input serta output, DFD (Data Flow Diagram), dan terakhir adalah daftar tabel-tabel yang digunakan untuk menyimpan data dari sistem yang dibuat.
Gambar 5.13 halaman login 2.
Halaman admin Pada halaman admin terdapat :
Nantinya, desain sketsa input
a). Beranda admin
meliputi rancangan input data komentar, login. Lalu desain sketsa input meliputi
Fungsi : Setelah berhasil login
rancangan
admin,
akan muncul tampilan seperti di
dalam
bawah ini, yang menampilkan
preporsesing terdapat beberapa output
komentar kritik dn saran sesuai
meliputi
tabelnya,
komentar,
ouput data
beranda
komentar,
pembobotan
TF,
di
Stemming
yang
telah
Indexing, dn terhir penghitungan metode
kelompokkan
LVQ.
Tampilan Home/ Dasboard dapat
Setelah
selesai
dengan
tahapan
oleh
di
system.
dilihat pada gambar 5.14 :
perancangan sebuah aplikasi pada sub bab sebelumnya, langkah selanjutnya adalah tahapan implementasi dan evaluasi yang menampilkan tampilan (interface), inputoutput, serta fungsi-fungsi dari aplikasi yang sedang dibangun secara keseluruhan. Terutama yang akan dibahas dalam hal ini adalah tampilan keseluruhan dari dua (2)
Gambar 5.14 beranda admin b). Menu Komentar
halaman pokok selain halaman login yang MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
simki.unpkediri.ac.id || 6||
Artikel Skripsi Universitas Nusantara PGRI Kediri
Fungsi
:
menu
ini
untuk
memasukkan komentar baru
Fungsi
:
berisikan
Halaman
data-data
ini
komentar
hasil dari proses pembobotan TF.
Gambar 5.15 Form Komentar
Gambar 5.18 Tampilan data Pembobotan
Setelah komentar di isikan dan
e). Menu Stemming
seluruh form di isi dan di klik
Fungsi
tambah
berisikan data-data hasil dari
maka
akan
muncul
tampilan dari komentar yang sudah
:
Halaman
ini
proses Stemming.
di tokenisasi dan di Stemming seperti gambar 5.16 :
Gambar 5.19 Menu Stemming f). Menu Indexing Fungsi Gambar 5.16 Hasil tambah
berisikan data-data hasil dari
c). Menu Data Komentar Fungsi
:
Halaman
: Halaman ini
proses ini
Stemming
dan
pembobotan lalu di index.
berisikan data-data komentar yang telah dimasukkan oleh User
Gambar 5.20 Tampilan indexing Gambar 5.17 Data Komentar d). Menu Pembobotan
g). Menu LVQ Fungsi
:
Halaman
untuk
menampilkan
ini
proses
penghitungan LVQ. MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
simki.unpkediri.ac.id || 7||
Artikel Skripsi Universitas Nusantara PGRI Kediri
update komentar setelah dihitung dengan metode LVQ .
Gambar 5.21 Tampilan Hasil LVQ
Gambar 5.22 Tampilan Data
h). Menu Hasil Update
IV.
Update
Fungsi
:
Halaman
untuk
menampilkan
ini
proses
DAFTAR PUSTAKA
Agusta,
Ledi.
2009
.
Perbandingan
Teknologi Informasi & Pendidikan Vol.6 NO.2.
Algoritma Stemming Porter dengan Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia.
Konferensi
Effendy, N., Imanto, R., 2009. Deteksi Pornografi Pada Citra Digital
Nasional
Menggunakan Pengolahan Citra
Sistem dan Informatika. 106-39
Dan
Alfiyanto, Dian ,Ratnawati ,Ridok. 2010,
Jaringan
Saraf
Tiruan,
Pengklasifikasian Kritik Dan Saran
/2010/02/deteksi-pornografi.pdf>.
Dengan
Diakses pada tanggal 3 Oktober
Menggunakan
Metode
2015.
Fuzzy K-Nearest Neighbour (FKnn).
Program
Studi
Ilmu
Komputer,
Program
Teknologi
Informasi
dan Ilmu
Komputer
Fayyat,
Usama.
1996.
Advanced
in
Knowledge and Discovery and Data Mining. MTI Press.
Universitas Brawijaya. Hamid, Andini, Silfia. 2013, Klasifikasi Dokument Teks Naive
Menggunakan Bayes
Pemograman
Algoritma
Nihal
M.
Algorithm-Based Clustering.
Dengan
Bahasa
Conference
Java.
Jurnal
Technology.
MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
dkk.
2013,
Bees
Document International
on
Information
simki.unpkediri.ac.id || 8||
Artikel Skripsi Universitas Nusantara PGRI Kediri
Hariri, Fajar Rahman., 2014. Implementasi Learning
Vector
Stemming Algorithm for Bahasa
Quantization
Indonesia, Fakulty of Computer Science University of Indonesia.
Untuk Klasifikasi Dokumen. Tugas Akhir.Yogyakarta
:
STMIK
AMIKOM Yogyakarta.
Prasetyo, Eko. 2012. Data Mining Konsep dan
Hermadi, I.2007, Clustering Menggunakan Self-Organizing
Maps
Institut Pertanian Bogor. 5: 2. Kadir,
Abdul.
2010.
MATLAB,
Algoritma
Toyota,
T.,
dan
C++. Yogyakarta : Andi.
Search
Kohonen, T.,1988, An introduction to Neural
Network.,1:3-16 Kusumadewi,
Sri.
Intelligence Aplikasinya.
:
Artificial
Teknik
Yogyakarta:
Nobuhara,
H.
2012,
& Graha
Ilmu.
Using
Restricted
and
Region
Dimensionality
Reduction. JACIII. 16: 222. Turban, E, .2005.Decision Support System and
2003.
Penerbit
Based on Efficient Self-Organizing Map
network,
Yogyakarta.
Visualization of the Internet News
Pemrograman Menggunakan C &
neural
menggunakan
ANDI.
(Studi
Kasus: Data PPMB IPB). FMIPA
Aplikais
Intelligent
Bahasa
System,
Indonesia
edisi jilid
1.Yogyakarta.Penerbit ANDI. Yakub. 2012. Pengantar Sistem Informasi. Yogyakarta : Graha Ilmu
Nazief, Bobby dan Mirna Adriani. 1996. Confix-Stripping:
Approach
to
MOH. DADANG HALIMI YUSUF | 12.1.03.02.0226 Teknik - Informatika
simki.unpkediri.ac.id || 9||