JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010
ISSN : 2086 – 4981
PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri1
ABSTRACT Various problem that are related to classification object can be solve easier with using classification techniques. For example in the medical field, classification application can be applied to classify diseases level of patient so that easier for a doctor to give right therapy solution And in industries field and trading of batik, classification application needed to assignment of batik tulis quality. To solve such classification problem, several methods have been applied. In soft computing field, there are many classification technique has been improved. So, classification process can be done relatively faster with using precise classification algorithm. In this research two classification methods for classify quality of batik tulis, k-nearest neighbor and nearest cluster classifier are compared. K-nearest neighbor is a method that based on probabilistic approach and nearest cluster classifier is a method that based on similarity. Focus of this research is a accuration ratio or succes ratio that result it. The result of this research showed that classification in quality of batik tulis with k-nearest neighbor method is better than nearest cluster classifier method in rate of accuration ratio or succes ratio. Keywords : Classification, k-nearest neighbor, nearest cluster classifier, probabilistic approach, similarity, accuration ratio.
INTISARI Berbagai kasus yang berkaitan dengan pengelompokkan objek dapat diselesaikan lebih mudah dengan menerapkan teknik-teknik klasifikasi. Sebagai contoh pada bidang medis, aplikasi klasifikasi dapat digunakan untuk klasifikasi tingkat penyakit yang diderita oleh seorang pasien sehingga memudahkan dokter dalam memberikan solusi terapi yang tepat. Dan di dunia industri dan perdagangan batik, aplikasi klasifikasi juga dibutuhkan untuk menentukan kualitas batik. Untuk memecahkan masalah klasifikasi, berbagai macam metode telah diterapkan. Dibidang soft computing, mulai banyak dikembangkan juga teknikteknik klasifikasi. Sehingga proses klasifikasi dapat dilakukan dalam waktu yang relatif lebih cepat dengan menggunakan algoritma klasifikasi yang tepat. Dalam penelitian ini dibandingkan dua metode klasifikasi yaitu k-nearest neighbor dan nearest cluster classifier untuk proses klasifikasi kualitas batik tulis. Metode k-nearest neighbor adalah metode yang berdasarkan pada pendekatan 1
Dosen STMIK Indonesia Padang
42
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010
ISSN : 2086 – 4981
probabilistik sedangkan nearest cluster classifier berdasarkan pada kemiripan. Fokus penelitian ini adalah pada tingkat akurasi atau succes ratio yang dihasilkan oleh masing-masing metode. Dari hasil penelitian menunjukkan bahwa klasifikasi kualitas batik tulis dengan metode k-nearest neighbor menunjukkan tingkat akurasi atau succes ratio yang lebih baik dibandingkan dengan metode nearest cluster classifier. Kata Kunci : Klasifikasi, k-nearest neighbor, nearest cluster classifier, pendekatan probabilitas, similarity, tingkat akurasi.
43
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010
ISSN : 2086 – 4981
PENDAHULUAN Klasifikasi merupakan suatu metode untuk mengelompokkan sebuah objek ke dalam kelompok atau kelas tertentu. Berbagai kasus yang berkaitan dengan pengelompokkan objek dapat diselesaikan lebih mudah dengan menerapkan teknik-teknik klasifikasi. Sebagai contoh pada bidang kesehatan, aplikasi klasifikasi dapat digunakan untuk mengetahui tingkat penyakit yang diderita oleh seorang pasien sehingga memudahkan dokter dalam memberikan solusi terapi yang tepat. Pada bidang ekonomi, aplikasi klasifikasi juga dapat digunakan oleh sebuah bank yang ingin mengetahui apakah customer yang mengajukan kredit termasuk dalam kategori customer yang menguntungkan atau tidak. Sementara itu dalam dunia industri dan perdagangan batik di Indonesia, prinsip-prinsip klasifikasi juga dibutuhkan, seperti dalam menentukan kualitas sebuah batik. Kualitas suatu batik tidak dapat langsung ditentukan begitu saja secara visual. Untuk dapat mengetahui kualitas dari suatu batik yang dihasilkan maka perlu dilakukan serangkaian pengujian terlebih dahulu. Hasil pengujian inilah yang kemudian akan diklasifikasikan atau dikelompokkan sehingga akhirnya ditemukan kualitas dari suatu batik tersebut. Pengujian kualitas suatu batik dilakukan di Balai Besar Kerajinan dan Batik Indonesia yang berada di kota Yogyakarta. Parameter yang digunakan dalam menguji kualitas batik ini berdasarkan pada ketentuan standar penilaian yang sudah ditetapkan oleh Badan Standarisasi Nasional (BSN). Hingga saat ini, penilaian dan penentukan kualitas dari sebuah batik sangat dipengaruhi oleh pengalaman dan kemampuan pegawai yang bekerja di Balai Besar
Kerajinan dan Batik Indonesia. Semakin berpengalaman pegawai tersebut dalam menilai kualitas suatu batik, maka semakin cepat proses penentuan kualitas batik yang diuji tersebut. Sebaliknya apabila pegawai tersebut masih belum berpengalaman, maka proses pengklasifikasian kualitas batik tersebut menjadi lebih lambat. Dengan demikian keterlibatan individu tersebut dapat dikatakan masih sangat dominan dan proses klasifikasi yang dilakukan juga masih bersifat manual. Kenyataannya, jika proses klasifikasi dilakukan secara manual maka hal ini akan menjadi sebuah pekerjaan yang membutuhkan banyak waktu. Dalam memecahkan masalah klasifikasi, para ahli telah mengembangkan berbagai metode klasifikasi. Dibidang soft computing, mulai banyak dikembangkan juga teknik-teknik klasifikasi sehingga proses klasifikasi dapat dilakukan dalam waktu yang relatif lebih cepat dengan menggunakan algoritma klasifikasi yang tepat. Namun di sisi lain, tidak semua metode klasifikasi yang ada dapat diterapkan pada semua kasus. Oleh karena itu untuk menemukan metode yang sesuai dan baik dalam klasifikasi kualitas batik khususnya pada batik tulis, maka pada penelitian ini akan dibahas perbandingan dua metode klasifikasi yaitu k-nearest neighbor (KNN) dan nearest cluster classifier (NCC). Kedua metode ini akan dicoba dalam pengklasifikasian kualitas batik tulis. Metode yang memberikan tingkat akurasi atau succes ratio yang lebih baik, dapat dipilih sebagai prototype dalam membangun sebuah sistem klasifikasi kualitas batik tulis pada Balai Besar Kerajinan dan Batik Indonesia nantinya.
44
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010 PEMBAHASAN Dalam proses klasifikasi kualitas batik tulis ini akan digunakan dua metode klasifikasi yaitu metode k-nearest neighbor (KNN) dan metode nearest cluster classifier (NCC). Metode KNN merupakan metode klasifikasi berdasarkan probabilistik, sedangkan metode NCC merupakan metode klasifikasi berdasarkan kemiripan. Penggunaan dua metode tersebut bertujuan untuk melihat perbandingan tingkat akurasi (ketepatan) kedua model tersebut dalam mengklasifikasikan objek. Metode klasifikasi terbagi atas supervised classification dan unsupervised classification. Metode KNN dan NCC termasuk ke dalam supervised classification. Untuk membangun sistem klasifikasi yang bersifat supervised classification, sebelumnya sistem harus memiliki memori atau pengetahuan menyangkut objek yang akan diklasifikasikan. Representasi memori atau pengetahuan ini dapat dibangun melalui proses learning. Dua tahapan yang harus dilalui dalam proses learning adalah tahapan pelatihan (training) dan tahapan pengenalan (testing). Pada fase pelatihan, sebagian data yang telah diketahui kelas datanya diumpankan untuk membentuk model prediksi. Selanjutnya pada fase pengenalan, fitur-fitur pada objek baru atau yang disebut sebagai data testing diujikan dengan model prediksi yang terbentuk. Pengujian yang dimaksud adalah untuk mencari tingkat akurasi model dalam melakukan klasifikasi. Selanjutnya setelah model prediksi yang diperoleh dianggap telah sesuai maka proses klasifikasi objek baru dapat dilakukan. Metode yang digunakan untuk mengukur kemiripan tersebut adalah dengan metode jarak euclidean distance dan metode classifier yang dipilih adalah
ISSN : 2086 – 4981
metode k-nearest neighbor nearest cluster classifier.
dan
Klasifikasi dengan Metode KNearest Neightbor (KNN) K-Nearest Neighbor (KNN) merupakan algoritma supervised learning dimana output dari suatu data baru diklasifikasikan berdasarkan kelompok mayoritas dari k buah tetangga terdekat. Tujuan dari algoritma ini adalah mengelompokkan data baru berdasarkan atribut dan data training [1]. Algoritma metode KNN sangatlah sederhana, bekerja berdasarkan pada jarak terpendek dari objek query ke training sample untuk menentukan sejumlah kneighbor pointnya. Setelah mengumpulkan k-neighbor point, kemudian diambil mayoritas dari kneighbor point untuk dijadikan prediksi dari objek query. Untuk mendapatkan nilai k yang optimal dapat digunakan optimasi parameter, misalnya dengan menggunakan k-fold cross validation. Pada KNN, classifier tidak menggunakan model apapun untuk dicocokkan dan hanya berdasarkan pada memori. Proses training tidak dilakukan pada metode ini, tapi langsung proses testing. Sebuah objek query diberikan kemudian akan dihitung jaraknya dengan masing-masing training sample dan kemudian diambil sejumlah k neighbor point yang paling dekat dengan objek query. Klasifikasi menggunakan voting terbanyak di antara klasifikasi dari k neighbor point terdekat. K-Fold Cross Validation Cross validation digunakan dalam rangka menemukan parameter terbaik dari satu model. Ini dilakukan dengan cara menguji besarnya error pada data testing. Dalam cross validation, data dibagi
45
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010 ke dalam k sampel dengan ukuran yang sama. Dari k subset data yang digunakan akan dipakai k-1 sampel sebagai data training dan 1 sampel sisanya untuk data testing. Selanjutnya dilakukan proses training dan testing kemudian dihitung rata-rata error (error mean). Setiap running akan ditemukan error untuk data testing, model yang memberikan rata-rata error terkecil dipilih menjadi metode terbaik. Persamaan yang dapat digunakan untuk menghitung ratarata dan standar deviasi error dapat dinyatakan sebagai berikut [2]: a. Mean :
Means (F-CM). Setelah cluster terbentuk dan pusat cluster diketahui, selanjutnya akan ditentukan tingkat probabilitas dari setiap kelas terhadap suatu cluster, dengan persamaan yaitu:
n(JK)
P(JK) n(K)
Dimana: P(JK) = Probabilitas suatu kelas j terhadap cluster k n(JK) = Banyaknya anggota kelas j yang masuk pada cluster k n(K) = Ruang sampel yang menunjukkan banyaknya anggota dari cluster k. Selanjutnya pada proses pengenalan (testing), akan dihitung jarak antara data testing dengan setiap pusat cluster yang diperoleh. Jarak dihitung dengan menggunakan euclidean metric pada persamaan 2.5: Euclidean metric :
1 n m Ui n i 1 (2.1) b. Variansi
v
ISSN : 2086 – 4981
: n
1 (Ui m) 2 n 1 i 1
(2.2) c. Standar deviasi :
v
DEucl ( x, y)
(2.3)
(2.5)
Klasifikasi dengan Metode Nearest Cluster Classifier (NCC) Algoritma NCC merupakan algoritma untuk mengklasifikasikan suatu objek berdasarkan jarak terdekatnya dengan suatu pusat cluster. Metode ini juga disebut dengan minimum euclidean distance classifier [3]. Pada metode NCC proses learning dilakukan untuk menemukan model prediksi yang tepat. Pada awal fase pelatihan (training), semua data training dipartisi ke dalam beberapa cluster yang telah ditentukan dan kemudian dicari pusat cluster dari masingmasing cluster yang terbentuk. Untuk membentuk cluster dan menemukan pusat cluster dari data training, dihitung dengan menggunakan salah satu metode clustering yaitu metode Fuzzy C-
N
x i 1
yi
2
i
Menemukan Pusat Cluster dengan metode Fuzzy C-Means Untuk menemukan pusat cluster dan anggota-anggota cluster dengan menggunakan metode Fuzzy C-Means (FCM), proses diawali dengan menentukan jumlah cluster yang akan dibentuk, batasan error terkecil, fungsi objektif awal, dan maksimum iterasi yang akan dilakukan. Pada iterasi pertama, pusat cluster yang menandai lokasi ratarata untuk setiap cluster dan juga derajat keanggotaan setiap data training pada masing-masing cluster ditentukan secara random / acak. Derajat keanggotaan setiap data pada masing-masing cluster dijadikan sebagai elemen-elemen matrik partisi. Pada awalnya, pusat
46
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010 cluster yang terbentuk masih belum akurat. Pusat cluster dan derajat keanggotaan setiap titik data akan diperbaiki secara berulang-ulang sampai ditemukan pusat cluster yang tepat. Perulangan akan terus dilakukan selama selisih fungsi objektif masih lebih besar dari batas error terkecil yang telah ditetapkan atau banyak iterasi masih kecil dari maksimum iterasinya. Selisih fungsi objektif diperoleh dari pengurangan fungsi objektif terakhir dengan fungsi objektif sebelumnya. Setelah data menuju lokasi cluster yang tepat maka proses pun berhenti. Output yang diperoleh adalah deretan pusat cluster dan derajat keanggotaan untuk setiap data.
n
i 1 k 1
m
j 1
5. Hitung perubahan matriks partisi: 1 m [ (X Vkj ) 2 ] w 1 ij j1 μ ik 1 c m 2 [ (X ij Vkj ) ] w 1 k 1 j1
Dengan i = 1,2,...,n; dan k = 1,2,...,c 6. Cek kondisi: a. Jika ( | Pt – ( Pt-1)| ) atau ( t > MaxIter ) maka proses berhenti; b. Jika tidak t = t +1, maka ulangi langkah ke-4 Pengujian Tingkat Akurasi Pengujian tingkat akurasi yang dimaksud adalah untuk menemukan persentase ketepatan dalam proses pengklasifikasian terhadap data testing yang diuji. Tingkat akurasi dihitung dengan menggunakan rumus:
ac
c
Qij μ ijk k 1
match * 100 % tp
Dimana: ac = tingkat akurasi ( %) match = Jumlah klasifikasi yang benar tp = Jumlah data testing
dengan j = 1,2,...,m. Hitung: ik Qij
Pengujian Sistem Pembentuk Kelas Pengujian sistem pembentuk kelas dilakukan untuk mengetahui seberapa besar keberhasilan sistem ini pada masing-masing metode. Pengujian sistem pembentuk kelas, dengan menggunakan data training dan data testing. Tiap-tiap data training akan diuji dengan setiap data testing. Perlakuan sampel pada sistem pembentuk kelas yang digunakan pada fase training dan
3. Hitung pusat cluster ke-k : Vkj, dengan k= 1,2,...,c; dan j = 1,2,...,m n
Vkj
c
Pt ([ (X ij Vkj ) 2 ] * (μ ik ) w )
Berikut ini algoritma proses clustering dengan metode FCM: 1. Diawal proses cluster tentukan jumlah cluster, maksimum iterasi, error terkecil, fungsi objektif awal, iterasi awal. 2. Bangkitkan bilangan random ik, i = 1,2,...,n; k=1,2,...,c; sebagai elemen-elemen matrik partisi awal U. Hitung jumlah setiap kolom (atribut):
μnew ik
ISSN : 2086 – 4981
(( i 1
ik
) w * X ij )
n
( i 1
4. Hitung fungsi iterasi ke-t, Pt:
ik
)w
obyektif
pada
47
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010 fase testing untuk kelompok uji batik tulis adalah seperti yang terlihat
ISSN : 2086 – 4981
pada
Tabel
1:
Tabel 1. Sampel pada Kelompok Uji Batik Tulis Indeks Indeks Banyak Kelompok Banyak training testing sampel Uji Sampel keke1 100 1 100 2 60 2 60 Kelompok 3 80 3 80 Batik Tulis 4 50 5 35
Dari ketiga sampel training ini, masing-masing akan diujikan pada kelima sampel testing. Sehingga ada 15 kali perlakuan yang akan diperkenalkan pada sistem pembentuk kelas untuk
kelompok uji batik tulis. Adapun output proses training dan testing yang terbentuk dengan menggunakan metode K-NN dapat dilihat hasilnya pada Tabel 2:
Tabel 2. Hasil Pengujian Kualitas Batik Tulis dengan metode KNN Percobaa n ke1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Indeks training ke1 1 1 1 1 2 2 2 2 2 3 3 3 3 3
Indeks Testing ke1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
K terbaik 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Dari tabel diatas terlihat dengan menggunakan metode KNN, tingkat akurasi yang diperoleh 100%. Artinya, semua data testing yang diujikan dapat diklasifikasikan dengan benar. Sedangkan dengan metode NCC tingkat akurasi yang diperoleh rata-rata hanya sebesar
Jml Sample testing 100 60 80 50 35 100 60 80 50 35 100 60 80 50 35
Cocok
Beda
Akurasi (%)
100 60 80 50 35 100 60 80 50 35 100 60 80 50 35
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
100 100 100 100 100 100 100 100 100 100 100 100 100 100 100
89% seperti yang terlihat dalam Tabel 3. Dengan metode NCC, ternyata tidak semua data dapat diklasifikasikan secara tepat, walaupun data testing yang digunakan sama persis dengan data trainingnya.
48
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010
ISSN : 2086 – 4981
Tabel 3. Hasil Pengujian Kualitas Batik Tulis dengan metode NCC Percobaan Indeks Indeks Banyak Jml Cocok Beda ke training Testing cluster Sample testing 1 1 1 3 100 92 8 2 1 2 3 60 54 6 Percobaan Indeks Indeks Banyak Jml Cocok Beda ke training Testing cluster Sample testing 3 1 3 3 80 64 16 4 1 4 3 50 46 4 5 1 5 3 35 30 5 6 2 1 3 100 90 10 7 2 2 3 60 53 7 8 2 3 3 80 59 21 9 2 4 3 50 44 6 10 2 5 3 35 30 5 11 3 1 3 100 98 2 12 3 2 3 60 56 4 13 3 3 3 80 73 7 14 3 4 3 50 48 2 15 3 5 3 35 32 3
Akurasi (%) 92 90 Akurasi (%) 80 92 85.7143 90 88.3333 73.75 88 85.7143 98 93.3333 91.25 96 91.4286
Pada ketiga kelompok uji dengan 45 kali perlakuan, sistem pembentuk kelas dengan metode KNN berhasil membentuk kelas lebih baik dibandingkan dengan metode
NCC. Rata-rata keberhasilan sistem dalam mengklasifikasi dengan metode KNN adalah 99.38%, sedangkan dengan metode NCC rata-ratanya sebesar 86.58%.
Pengujian Sistem Klasifikasi
terhadap objek query / data baru. Pada pengujian sistem klasifikasi jenis batik tulis ini digunakan 50 sampel data uji, dengan rincian seperti yang terlihat pada Tabel 4.
Pengujian sistem klasifikasi ini dilakukan untuk mengetahui tingkat keberhasilan sistem dalam melakukan identifikasi dan klasifikasi
Tabel 4. Data sampel jenis batik tulis yang akan diuji coba Sampel ke1 2 3 4 5 6 7 8 9 10
Jumlah cecek 8 17 15 10 20 13 15 8 20 10
Tebal canting 0.1 0.1 0.2 0.25 0.25 0.4 0.7 0.9 0.9 1
49
Kelas Data Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010 11 12 13 14 15 16 17 Sampel ke18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
13 15 10 13 1 20 17 Jumlah cecek 5 1 4 12 14 17 6 7 1 4 5 7 6 9 18 5 2 7 16 12 16 2 3 4 1 2 3 4 2 3 1 2 3
1 1.2 1.3 1.3 1.3 1.35 1.4 Tebal canting 1.4 1.4 1.4 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.55 1.55 1.57 1.6 1.6 1.6 1.6 1.62 1.65 1.7 1.7 1.7 1.7 1.7 1.8 1.8 1.8 1.8 1.85 1.85 2 2 2
Dari 50 sampel data uji yang diujikan pada sistem klasifikasi kualitas batik tulis dengan metode KNN, semua sampel dapat diklasifikasikan dengan baik dan benar pada masing-masing pengujian. Sedangkan dengan metode NCC, dari 50 sampel data uji
ISSN : 2086 – 4981
Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Kasar Batik Tulis Halus Batik Tulis Halus Hasil Klasifikasi Sistem Batik Tulis Sedang Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Sedang Batik Tulis Sedang Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Sedang Batik Tulis Sedang Batik Tulis Sedang Batik Tulis Halus Batik Tulis Halus Batik Tulis Sedang Batik Tulis Kasar Batik Tulis Sedang Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar yang diujikan ternyata tidak semua data dapat diklasifikasikan dengan benar. Pada pengujian ini diperoleh sampel ke-1, 8, 13 dan 31 diklasifikasikan pada kelompok yang berbeda, hal ini seperti yang terlihat pada Tabel 5. Dari pengujian ini tingkat akurasi yang diperoleh
50
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010 dengan menggunakan metode NCC .
adalah
ISSN : 2086 – 4981
sebesar
Tabel 5. Hasil Klasifikasi yang salah dengan metode KNN Sampel ke1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43
Jumlah cecek 8 17 15 10 20 13 15 8 20 10 13 15 10 13 1 20 17 5 1 4 12 14 17 6 7 1 4 5 7 6 9 18 5 2 7 16 12 16 2 3 4 1 2
Tebal canting 0.1 0.1 0.2 0.25 0.25 0.4 0.7 0.9 0.9 1 1 1.2 1.3 1.3 1.3 1.35 1.4 1.4 1.4 1.4 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.55 1.55 1.57 1.6 1.6 1.6 1.6 1.62 1.65 1.7 1.7 1.7 1.7 1.7 1.8 1.8
51
Kelas Data Batik Tulis Sedang Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Sedang Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Sedang Batik Tulis Halus Batik Tulis Kasar Batik Tulis Halus Batik Tulis Halus Batik Tulis Sedang Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Sedang Batik Tulis Sedang Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Sedang Batik Tulis Sedang Batik Tulis Sedang Batik Tulis Sedang Batik Tulis Halus Batik Tulis Sedang Batik Tulis Kasar Batik Tulis Sedang Batik Tulis Halus Batik Tulis Halus Batik Tulis Halus Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar
92%
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010 44 Sampel ke45 46 47 48 49 50
3 Jumlah cecek 4 2 3 1 2 3
1.8 Tebal canting 1.8 1.85 1.85 2 2 2
Pada ketiga kelompok uji dengan 9 kali percobaan diatas, sistem klasifikasi dengan metode KNN berhasil mengklasifikasikan sampel lebih baik dibandingkan dengan metode NCC. Rata-rata keberhasilan sistem dalam mengklasifikasi dengan metode KNN adalah 99.11%, sedangkan dengan metode NCC rata-rata keberhasilan sistem dalam mengklasifikasikan adalah sebesar 86.44%.
ISSN : 2086 – 4981
Batik Tulis Kasar Kelas Data Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Batik Tulis Kasar Semakin banyak jumlah data training yang diperkenalkan pada sistem, maka kemampuan sistem mengenali data testing semakin baik. Hal ini dibuktikan pada pengujian dengan kelompok uji kain mori, dimana jumlah data training yang diujikan mulai dari 350, 440 hingga 770 data. Rata-rata tingkat akurasi hampir sama yaitu 99.98% dengan menggunakan metode KNN dan 99.97% dengan menggunakan metode NCC. Untuk sistem klasifikasi pada ketiga kelompok uji dengan menggunakan metode KNN, sistem berhasil mengklasifikasikan 50 sampel dengan benar dibandingkan dengan menggunakan metode NCC. Rata-rata keberhasilan sistem klasifikasi dengan menggunakan metode KNN adalah 99.11% sedangkan dengan metode NCC keberhasilannya hanya mencapai 86.44%. Dalam penelitian ini mungkin masih ditemukan beberapa kekurangan, dan masih dapat dikembangkan lagi dengan metode lainnya. Salah satunya penggunaan metode distance metric yang lain untuk mengukur kemiripan atau kedekatan antara vektor fitur dapat dicoba pada penelitian berikutnya. Selain itu juga pada metode NCC, untuk menemukan pusat cluster dapat dipergunakan metode clustering lainnya.
KESIMPULAN Berdasarkan pengujian yang dilakukan, implementasi metode KNN pada sistem pembentuk kelas dan sistem klasifikasi memberikan hasil yang lebih baik dibandingkan dengan menggunakan metode NCC. Pada sistem pembentuk kelas menggunakan metode KNN, semua data testing dapat dikembalikan dengan benar, baik untuk data testing yang sama persis dengan data trainingnya maupun data testing yang berbeda dengan data testingnya. Tingkat akurasi yang diperoleh dari 45 kali pengujian ratarata mencapai 99.38% . Sedangkan pada sistem pembentuk kelas menggunakan metode NCC, baik untuk data testing yang sama persis dengan data training maupun data testing yang berbeda dengan data training tingkat akurasi yang diperoleh hanya mencapai 87% untuk 45 kali pengujian yang telah dilakukan.
52
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN VOL. 2 NO. 1 SEPTEMBER 2010 DAFTAR PUSTAKA [1] Teknomo, K. K-Nearest Neighbors Tutorial, Tersedia di situs: http://people.revoledu.com/kar di/ tutorial/KNN .2006. [25 Juni 2008]
[2].
[3].
53
ISSN : 2086 – 4981
Kusumadewi, S. Aplikasi Logika Fuzzy untuk Pendukung Keputusan, Graha Ilmu, Yogyakarta. 2002. Schowengert, R.A., Multispectral Classification, Arizona. 2003.