CLUSTERING K- MEANS ANALYSIS (Studi Kasus : Koleksi Perpustakaan) 1)
Warnia Nengsih1) Department of Computer Politeknik Caltex Riau Indonesia Email:
[email protected]
Commented [h1]: Jika cumin 1 author tidak perlu diberi nomor. Apakah formatnya sudah mengikuti format SNTIKI? Pls checked
Abstrak Koleksi perpustakaan merupakan salahsatu indikator untuk menentukan kualitas sebuah perpustakaan .Semakin lengkap koleksi dan memenuhi kebutuhan pengunjungnya menjadi magentik tersendiri akan keberadaan perpustakaan tersebut. Tentunya pengelola perpustakaan harus memperhatikan aspek pengadaaan koleksi ini. Untuk mewujudkan pengadaan koleksi sehingga keefektifan dan konsep tepat guna bisa diperoleh maka perlu adanya analysis pengadaan kebutuhan koleksi perpustakaan. Penelitian ini menggunakan teknik k-means clustering untuk menentukan koleksi apa yang diminati oleh pengunjung sehingga membantu dalam penentuan kebijakan pengadaan koleksi. Berdasarkan kriteria pengunjung dan kecenderungan peminjaman koleksi diperoleh cluster koleksi audio visual, koleksi referensi dan koleksi serial. Koleksi-koleksi tersebut merupakan jenis koleksi yang paling diminati oleh pengunjung sehingga penambahan koleksi kategori ini menjadi skala prioritas, sementara koleksi umum dan koleksi digital memiliki minat pengunjung yang rendah. Keywords: K-means,clustering, pengadaaan koleksi, perpustakaan
A. Pendahuluan Pengadaan koleksi yang tepat sasaran pada sebuah
salahsatu teknik data mining yang memberikan
perpustakaan menjadi sebuah keharusan. Sehingga
deskripsi cluster sebuah item. Sehingga hasil
pengadaan koleksi tidak hanya sebagai upaya untuk
simulasi
memberikan
menambah kuantitas saja tetapi juga harus dlihat
kebijakan
pengadaan
dari aspek kualitas dan aspek kemanfaatannya.
perpustakaan.
Aspek tepat gunanya harus disesuaikan dengan
B. Dasar Teori
kebutuhan pengunjung dan harus disesuaikan
1.
dengan kebutuhan budaya serta karakteristik dari
Koleksi
perpustakaan
pengguna. Kesulitan dalam
indikator
kualitas
menentukan jenis
pengetahuan koleksi
pada
tentang sebuah
Koleksi perpustakaan merupakan sebuah
salahsatu
perpustakaan.
koleksi apa yang seharusnya perlu menjadi prioritas
Perpustakaan yang mempunyai koleksi dengan
untuk diperbanyak atau tidak, harus menjadi
kuantitas dan jenis koleksi yang beragam menjadi
pengetahuan
sebuah keharusan, karena seyogyanya konsep
penting
perpustakaan.
bagi
para
pengelola
Pengelola
perpustakaan
harus
pengetahuan
berdasarkan
data
ilmu. Bagaimanapun bentuk dan formatnya jika
pengunjung, sehingga tidak terjadi kesalahan dalam
item-item tersebut dimanfaatkan dan mempunyai
pengadaan.
nilai guna bagi pengunjung perpustakaan , maka
memiliki
perpustakaan sebagai
media untuk memperoleh
definisi tersebut sudah mengarah pada koleksi Dalam rangka mewujudkan hal tersebut perlu
perpustakaan.
adanya analisis lebih dalam dengan menggunakan kmeans clustering. K-Means clustering merupakan
Ade Kohar (2003 : 6) mengatakan, “Koleksi perpustakaan adalah yang mencakup berbagai
Commented [h2]: Sebaiknya hasil yang diperoleh dibuat dengan data yang lebih rinci
format bahan sesuai dengan perkembangan dan
berdasarkan kriteria data pengunjung perpustakaan
kebutuhan alternatif para pemakai perpustakaan
tersebut , sehingga pengadaan koleksi tidak sebatas
terhadap media rekam informasi”.
pengadaan biasa, namun pengadaan dilakukan sesuai
dengan
kebutuhan.
Maka
seyogyanya
Beragam jenis koleksi perpustakaan adalah :
pengadaan tersebut harus menyesuaikan dengan
a.
prilaku pengunjung yang sudah ada.
Koleksi umum Koleksi umum bisa berbentuk cetak dan
b.
tercetak tidak terbatas untuk semua bidang,
Kegiatan ini disebut juga dengan pengembangan
namun bisa dipinjamkan dan tidak harus
koleksi.
diakses dilingkungan perpustakaan.
diperhatikan dalam pengembangan koleksi yaitu
Koleksi Referensi
kegiatan pemilihan dan pengadaan. Tentunya dua
Koleksi yang bisa berbentuk cetak dan tercetak
kegiatan ini tetap mengacu pada konsep sesuai
tidak terbatas untuk semua bidang, dengan
dengan kebutuhan pengunjung.
Ada
dua
hal
penting
yang
harus
jumlah yang terbatas dan sifat yang terbatas sehingga
c.
d.
hanya
bisa
digunakan
oleh
“Sejumlah
kegiatan
yang
berkaitan
dengan
pengunjung di area perpustakaan seperti kamus,
penentuan dan koordinasi kebijakan seleksi, menilai
ensiklopedia, biografi.
kebutuhan pemakai, pemakaian koleksi, evaluasi
Koleksi Fiksi /non fiksi
koleksi, identifikasi kebutuhan koleksi, seleksi
Merupakan koleksi buku yang pada umumnya
bahan pustaka, perencanaan kerjasama sumberdaya
termasuk ke dalam kategori koleksi umum
koleksi, pemeliharaan koleksi, dan penyiangan
Koleksi serial
koleksi perpustakaan itu merupakan definisi dari
Seperti jurnal, buletin, terbitan berkala , komik
konsep pengembangan koleksi Menurut Ade Kohar
serial,majalah, surat kabar atau laporan berkala
(2003 : 6),
dan sebagainya e.
f.
Koleksi audio visual
Menurut buku Perpustakaan Perguruan Tinggi
Seperti film, format CD ,gambar, mp3,
(2004 : 26), “Tujuan pengembangan koleksi
mp4,video , lukisan , piringan hitam dan
perpustakaan perlu dirumuskan dan disesuaikan
sebagainya.
dengan kebutuhan sivitas akademika di perguruan
Koleksi digital
tinggi agar perpustakaan dapat secara terencana
Seperti e-book, e-journal dan sebagainya
mengembangkan koleksinya”. Hal itu berarti bahwa pengadaan koleksi harus disesuaikan dengan
Koleksi
yang lengkap biasanya identik dengan
karakter, budaya dan kebutuhan penggunanya.
pengunjung pada perpustakaan tersebut. Semakin lengkap dan banyak jenis koleksi menjadi daya
Menurut Sutarno NS (2006 : 118), manfaat
magnet bagi pengunjung di samping hal-hal lain
pengembangan koleksi antara lain :
tentunya seperti faktor kenyamanan dan faktor
1.
pelayanan. Namun koleksi merupakan faktor internal yang harus menjadi perhatian manajemen perpustakaan
sehingga
tercapainya
tujuan
perpustakaan. Pemilihan koleksi dan jumlah harus
Membantu menetapkan metode untuk menilai bahan pustaka yang harus dibeli.
2.
Membantu merencanakan bentuk-bentuk kerja sama dengan perpustakaan lain, seperti pinjam
Commented [h3]: Perhatikan format penulisan refferensi di SNTIKI, biasanya cukup Kohar (2003) tanpa halaman. 6 untuk menyatakan halamannya.
antar
perpustakaan,
kerjasama
dalam
Berikut merupakan langkah-langkah pada k-means
pengadaan, dan sebagainya. 3.
Membantu identifikasi bahan pustaka yang start
perlu dipindahkan ke gudang atau dikeluarkan dari koleksi. 4.
Tentukan
Membantu dalam merencanakan anggaran
jumlah cluster
jangka panjang dengan menetapkan prioritasprioritas
dan
garis
besar
sasaran Pusat cluster
pengembangan. 5.
Membantu
memilih
cara
terbaik
untuk Hitung nilai euclidean
pengadaan.
Semua kegiatan untuk menambah atau mengadakan Kelompokkan obyek berdasar
koleksi dengan melakukan pemilihan dan penilaian
jarak minimum
koleksi disebut dengan pengembangan koleksi. Menurut buku Perpustakaan Perguruan Tinggi (2004 : 25), kebijakan pengembangan koleksi
Nilai sudah
didasari atas beberapa asas yaitu :
Belum
diperoleh
1. Relevan dengan kebutuhan pengguna Sudah
2. Berorientasi kepada kebutuhan pengguna end
3. Kelengkapan 4. Kemutakhiran
2.
Gambar 1. Flowchart algoritma K-Means clustering Seperti yang terlihat pada gambar 1 maka algoritma
Algoritma K-Means
K-means merupakan salahsatu algoritma pada teknik clustering di dalam data mining , clustering merupakan
teknik
unsupervised
yang
tidak
memerlukan data training dan data testing. Pada algoritma ini akan ditentukan
k-means clustering sebagai berikut : 1.
Menentukan jumlah cluster.
2.
Menentukan pusat baru cluster
3.
Menghitung
terlebih dahulu
jumlah cluster yang untuk kategori data dan
sembarang objek untuk penentuan titik tengah cluster.
terdekat
dengan
menggunakan nilai euclidean. 4.
pemilihan centroid point tidak harus ditentukan dan dibatasi, hal ini berarti bahwa boleh memilih
jarak
Commented [h4]: Pengertian ini menurut siapa? Untuk menghindari plagiarism lengkapi dengan refferensi
Menampilkan hasil berdasarkan jarak yang terendah yang dihasilkan.
5.
Jika belum ditemukan hasil yang sesuai , iterasi akan dilanjutkan , namun jika sudah ditemukan, hasil akan dilanjutkan.
Adapun formula untuk mencari nilai euclidean
Terdapat enam cluster yang ditentukan diantaranya
adalah :
cluster 1 (koleksi umum) ,Cluster 2 (Koleksi referensi),clsuter 3 (koleksi fiksi), cluster 4 (koleksi serial),cluster 5(koleksi audio visual), cluster 6 (koleksi digital). Sehingga dari hasil simulasi diperoleh analisa jenis koleksi yang menjadi fokus untuk pengadaan serta jenis koleksi apa yang tak
dimana
:
perlu ditambah.
dij = Jarak objek Berikut meruapakan flowchart sistem :
P = Dimensi data Xik
= Koordinat dari obyek i
Xjk
= Koordinat dari obyek j
Mulai
Sementara untuk mencari nilai pusat cluster baru
Data Pengunjung perpustakaan
dapat menggunakan rumus
K-means clustering
C. Implementasi dan Hasil Hasil Pengolahan
Pengadaan kebutuhan koleksi perpustakaan, jenis koleksi apa yang perlu ditambah dan yang tidak perlu ditambah,sehingga pengadaan koleksi sesuai Selesai
dengan kebutuhan pengunjung pada perpustakaan . Analisa menggunakan k-means clustering akan membantu
pengelola
perpustakaan
Gambar 2. Flowchart sistem
dalam
mendefinisikan kebutuhan untuk tercapainya nilai
Tabel
tepat guna dan tepat sasaran.
perpustakaan
yang
menggunakan
k-means
Pada penelitian ini data yang diolah berdasarkan data
pengunjung
perpustakaan.
Simulasi
berdasarkan usia, gender, pekerjaan dan level pendidikan pengunjung. Dari data pengunjung dan empat
variabel tersebut akan ditentukan bahwa
pengunjung dengan kriteria tertentu lebih dominan untuk melakukan peminjaman jenis koleksi tertentu.
1
menunjukkan
data
akan
pengunjung
diolah
dengan
clustering,
simulasi
berdasarkan empat variabel yang berkaitan dengan pengunjung perpustakaan
Tabel 1 data pengunjung perpustakaan
Dari data tersebut tentukan jumlah cluster kemudian
Tabel 3 Jarak setiap data pada pusat cluster
6,0827625 3,8729833 3 3,1622777 4,6904158 4,3588989 5,4772256 2,4494897 5,6568542 6,4807407 4,472136 7,0710678 4,1231056 4,2426407 5,5677644 5,6568542 6,7082039 6,0827625 4,6904158 4,472136 1 2,4494897 3,3166248 3,8729833
5,1962 2,2361 1,7321 2,4495 3,1623 3 4,2426 1,4142 4,4721 4,6904 3,4641 5,4772 2,6458 3,1623 4,1231 4,4721 5,1962 4,3589 3,1623 3,4641 1,7321 1,4142 2,2361 2,2361
4,582576 1,732051 1 2,44949 2,44949 2,645751 3,741657 2,44949 3,464102 3,162278 2,828427 4,242641 1 2,44949 3,316625 3,464102 3,605551 3 2,44949 2,828427 3 1,414214 2,645751 1,732051
4,69041576 2,44948974 2,44948974 3,60555128 2,64575131 3,16227766 3,87298335 3,87298335 3,31662479 1,73205081 3,31662479 3,31662479 1,41421356 3 3,16227766 3,31662479 2,44948974 2 2,64575131 3,31662479 4,69041576 3 3,74165739 2,44948974
5,385165 3,872983 4,123106 5,09902 3,741657 4,358899 4,690416 5,477226 4 1,414214 4,472136 3,162278 3 4,242641 3,872983 4 2,236068 2,236068 3,741657 4,472136 6,403124 4,690416 5,196152 3,872983
5,744563 4,795832 5,385165 6 4,690416 5,196152 5,477226 6,63325 4,242641 2 5,09902 3,464102 4,358899 5,477226 4,358899 5,09902 3 3,316625 4,472136 5,09902 7,681146 6 6,557439 5,196152
tentukan pusat cluster acak.
Tabel 2 Pusat cluster acak
Berikut merupakan hasil cluster sementara , pada tabel 4 terlihat tujuh data pada cluster 1, delapan data pada cluster 2, satu data pada cluster 3, enam data pada cluster 4, dua data pada cluster 5.
Berdasarkan data pusat cluster baru, selanjutnya menentukan jarak terdekat setiap cluster seperti yang ditunjuk pada tabel 2
Tabel 4 Hasil cluster sementara
Iterasi dilanjutkan sampai ditemukan hasil cluster yang sama.
Tabel 5 Hasil cluster akhir
Tabel 5 merupakan hasil cluster akhir setelah
tidak perlu dilakukan penambahan karena minat
melalui beberapa iterasi, diperoleh sembilan kriteria
pengunjung untuk jenis koleksi ini sangat kecil.
masuk ke dalam cluster 5 (koleksi audio visual), tujuh kriteria masuk ke dalam cluster 4 (koleksi
D. Kesimpulan
serial) dan terdapat delapan kriteria masuk ke dalam
Pengunjung dengan kriteria tertentu lebih dominan
cluster 2 (koleksi referensi ). Sehingga dari hasil k–
untuk melakukan peminjaman jenis koleksi tertentu.
means
bahwa
Terdapat sembilan kriteria yang masuk ke dalam c5
pengadaan koleksi lebih fokus pada jenis koleksi
clustering
diperoleh
analisis
(koleksi audio visual), tujuh kriteria yang masuk ke
audio visual, koleksi serial dan koleksi referensi
dalam c4( koleksi serial) dan delapan kriteria yang
serta koleksi umum. Koleksi fiksi dan koleksi digital
masuk ke dalam c2 ( koleksi referensi). Koleksi fiksi
dan koleksi digital
tidak perlu dilakukan
penambahan karena minat pengunjung untuk jenis koleksi ini sangat kecil.
DAFTAR PUSTAKA [1] Darmono. 2001. Manajemen dan Tata Kerja Perpustakaan Sekolah. Jakarta: Grasindo. [2] Garcia-Molina, Hector; Ullman, JD., & Widom, Jennifer. 2002. Database systems the complete book, International edition. New Jersey, Prentice Hall. [3] Bafadal, Ibrahim. 2008. Pengelolaan Perpustakaan Sekolah. Jakarta: Bumi Aksara. [4] Pal, Shankar K & Mitra, Pabitra. 2004. Pattern Recognition algorithms for data mining. CRC Press. [5] Yusuf, Pawit M dan Suhendar, Yaya. 2005. Pedoman Penyelenggaraan Perpustakaan Sekolah. Jakarta: Kencana. [6] Wright, Peggy , Knowledge Discovery In Databases: Tools and Techniques, http://www.acm.org/crossroads/xrds52/kdd.html#11 [7] Tan, Pang-Ning,; Steinbach,Michael; Kumar ,Vipin. Data Mining Cluster Analysis: Basic Concepts and Algorithms. wwwusers.cs.umn.edu/ ~kumar /dmbook/-16k. [8] J. A. Hartigan (1975) “Clustering Algorithms”. Wiley. J. A. Hartigan and M. A. Wong (1979). “A K-Means Clustering Algorithm”. Applied Statistics 28 (1): 100–108. [9] Teknomo, Kardi. Numerical Example of KMeans Clustering, http://people.revoledu.com/kardi/tutorial/kMe an/NumericalExample.htmNu [10] Berkhin, Pavel. Survey on clustering data mining techniques, http://www.ee.ucr.edu/~barth/EE242/clusterin g_survey.pdf [11] William, Graham, Data Mining Cluster, http://datamining.anu.edu.au/student/math334 6_2005/ 050809-maths3346-clusters-2x2.pdf