PENGENALAN AKSARA SUNDA MENGGUNAKAN EKSTRAKSI CIRI ZONING DAN KLASIFIKASI SUPPORT VECTOR MACHINE
ISNAN MULIA
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
PENGENALAN AKSARA SUNDA MENGGUNAKAN EKSTRAKSI CIRI ZONING DAN KLASIFIKASI SUPPORT VECTOR MACHINE
ISNAN MULIA
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
ABSTRACT ISNA N MULIA. Sundanese Script Recognition Using Zoning Feature Ext raction and Support Vector Machine Classification. Superv ised by MUSHTHOFA. This research aims to determine the most effective feature extraction method used in Sundanese script recognition. The data used in this research are generated in the form of image files, each of which contains a Sundanese character. Feature extraction method used is the variations of zoning method: Image Centroid and Zone (ICZ), Zone Centroid and Zone (ZCZ), and combination of ICZ and ZCZ. The nu mber of zones used are 4, 6, 8, and 12 zones. Support Vector Machine is used as classifier, with linear, quadratic, polyno mial, and RBF kernel. A mong the feature extract ion methods used, the hybrid feature extraction method ICZ and ZCZ obtain s maximu m accuracy for all the number of zones used. On the other side, the feature extract ion method using 12 zones obtains the maximu m accuracy fo r all the feature ext raction methods used. From th is result, it can be concluded that the most effective feature extract ion method used in Sundanese script recognition is the hybrid method ICZ & ZCZ with 12 zones. Keywords: pattern recognition, Sundanese script, support vector machine, zoning, image centroid and zone (ICZ), zone centroid and zone (ZCZ)
Penguji: 1. 2.
Aziz Kustiyo, S.Si, M.Ko m Dr. Yen i Herdiyeni, S.Si, M.Ko m
Judul Skripsi : Pengenalan Aksara Sunda Menggunakan Ekstraksi Ciri Zoning dan Klasifikasi Support Vector Machine Nama : Isnan Mulia NRP : G64080006
Menyetujui, Pembimb ing
Mushthofa, S.Ko m, M.Sc NIP. 19820325 200912 1 003
Mengetahui, Ketua Departemen Ilmu Ko mputer
Dr. Ir. Agus Buono, M.Si, M.Ko m NIP. 19660702 199302 1 001
Tanggal Lu lus :
KATA PENGANTAR Puji dan syukur penulis panjatkan ke hadirat A llah subhanahu wata’ala, yang telah memberikan nikmat yang begitu banyak, sehingga penulis dapat menyelesaikan penelitian dan tulisan ini. Shalawat dan salam penulis sampaikan kepada Nabi Muhammad shallallahu ‘alaihi wasallam, keluarganya, sahabatnya, serta umatnya hingga akhir zaman. Tulisan ini merupakan hasil penelit ian yang penulis lakukan sejak Desember 2011 hingga Mei 2012. Tulisan ini mengambil topik pengenalan pola, dan bertujuan membangun model pengenalan pola karakter aksara Sunda. Tak lupa penulis mengucapkan terima kasih kepada seluruh pihak yang telah berperan dalam penelitian ini, yaitu: 1
Ayahanda Muanas, Ibunda Tri Marlina, serta Adik Mulianto Raharjo atas kasih sayang, doa, semangat, dan dorongan kepada penulis agar dapat segera menyelesaikan penelit ian in i.
2
Bapak Mushthofa, S.Ko m, M.Sc, selaku dosen pembimb ing, yang telah memberikan banyak ide, masukan, dan dukungan kepada penulis.
3
Bapak A ziz Kustiyo, S.Si, M .Ko m dan Ibu Dr. Yeni Herd iyeni, S.Si, M.Ko m, yang telah bersedia menjad i penguji.
4
Rekan -rekan seperjuangan Ilko merz 45 atas segala dukungan, bantuan, dan kebersamaannya. Semoga kesuksesan senantiasa menyertai kita semua.
5
Muhammad Abrar Istiadi, Alif Kurn iawan, Abdul Qif li Sangadji, Arief Hidayatulloh, Annis a Anastasia, Ariel Febrila Niswar, Sri Rahayu, dan sahabat lainnya.
6
Rekan satu bimbingan, Dony Satria, semoga diberikan kelancaran dalam penelit iannya.
7
Pihak-pihak lain yang tidak dapat penulis sebutkan satu persatu.
Penulis berharap penelitian dan tulisan in i dapat memberikan manfaat untuk kemajuan masyarakat Indonesia pada umu mnya dan masyarakat Sunda pada khususnya.
Bogor, Agustus 2012
Isnan Mulia
RIWAYAT HIDUP Penulis dilahirkan di Bogor, Jawa Barat, pada tanggal 7 Januari 1991. Penulis merupakan anak pertama dari pasangan Muanas dan Tri Marlina. Penulis mengenyam pendidikan di SDN Sasana Wiyata I Kabupaten Bogor pada tahun 1996-2002, d ilan jutkan dengan SMP Negeri 1 Kota Bogor pada tahun 2002-2005, dan SMA Negeri 1 Kota Bogor pada tahun 2005-2008. Pada tahun 2008, penulis diterima di Departemen Ilmu Ko mputer Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB. Selama akt if men jadi mahasiswa, penulis menjadi salah satu pengurus Himpunan Mahasiswa Ilmu Ko mputer (Himalko m) pada tahun 2010 sampai tahun 2012. Penulis juga men jadi asisten praktiku m untuk beberapa mata ku liah, yaitu Algorit me dan Pemrograman (2010), Organisasi Ko mputer (2011 dan 2012), Stru ktur Data (2011 dan 2012), dan Metode Kuantitatif (2011). Selain itu, penulis melaksanakan Praktik Kerja Lapangan di Direktorat Jenderal Hortikultura Kementerian Pertanian pada tahun 2011.
DAFTAR ISI Hal aman DAFTAR TABEL .............................................................................................................................................. vi DAFTAR GAM BAR ......................................................................................................................................... vi DAFTAR LAMPIRAN ..................................................................................................................................... vi PENDAHULUAN Latar Belakang ................................................................................................................................................. 1 Tujuan ................................................................................................................................................................ 1 Ruang Lingkup ................................................................................................................................................. 1 TINJA UAN PUSTAKA Digital Image (Citra Digital) ......................................................................................................................... 1 Ekstraksi Ciri .................................................................................................................................................... 2 Metode Ekstraksi Ciri Zoning ........................................................................................................................ 2 K-fold Cross-validation .................................................................................................................................. 3 Support Vector Machine ................................................................................................................................. 3 METODE PENELITIA N Pengumpulan Data ........................................................................................................................................... 4 Praproses Data .................................................................................................................................................. 4 Ekstraksi Ciri .................................................................................................................................................... 4 K-fold Cross-validation .................................................................................................................................. 6 Pelatihan Support Vector Machine ............................................................................................................... 6 Pengujian Support Vector Machine .............................................................................................................. 6 Analisis .............................................................................................................................................................. 6 Lingkungan Penelit ian .................................................................................................................................... 6 HASIL DA N PEM BAHASA N Pengumpulan Data ........................................................................................................................................... 6 Praproses Data .................................................................................................................................................. 7 Ekstraksi Ciri .................................................................................................................................................... 7 Klasifikasi Support Vector Machine ............................................................................................................ 8 Analisis .............................................................................................................................................................. 8 SIMPULAN DAN SA RAN Simpu lan ............................................................................................................................................................ 9 Saran ............................................................................................................................................................... 10 DAFTAR PUSTA KA ....................................................................................................................................... 10 LAMPIRA N ....................................................................................................................................................... 11
v
DAFTAR TABEL Halaman 1 Pengelo mpokan beberapa variasi metode ekstraksi ciri zoning ............................................................... 2 2 Daftar ukuran data hasil ekstraksi ciri .......................................................................................................... 7 3 Hasil aku rasi rata-rata berdasarkan metode ekstraksi ciri dan ju mlah zona yang digunakan ............. 8
DAFTAR GAMBAR Halaman Keadaan linearly separable .......................................................................................................................... 3 Tahapan penelitian ......................................................................................................................................... 4 Variasi untuk karakter "ka" .......................................................................................................................... 4 Contoh citra untuk algorit me ICZ dan ZCZ .............................................................................................. 5 Perhitungan jarak pixel non-background dengan image centroid untuk zona 1 ................................. 5 Perhitungan jarak pixel non-background dengan zone centroid untuk zona 1 .................................... 5 Contoh citra hasil pembangkitan data ........................................................................................................ 7 (a) Citra sebelu m dilakukan praproses, (b) citra setelah dilakukan binerisasi dan pemotongan, serta (c) citra setelah dilakukan binerisasi, pemotongan, dan pengubahan ukuran ............................ 7 9 Hasil akurasi rata-rata berdasarkan (a) metode ekstraksi ciri, dan (b) ju mlah zona yang digunakan ........................................................................................................................................................ 8 10 Hasil akurasi berdasarkan jenis kernel. ...................................................................................................... 9 1 2 3 4 5 6 7 8
DAFTAR LAMPIRAN Halaman 1 Contoh karakter aksara Sunda yang digunakan ........................................................................................ 12 2 Contoh citra asli, citra hasil praproses, dan data hasil ekstraksi ciri menggunakan algorit me ICZ dan ZCZ untuk citra angka ................................................................................................................... 13 3 Hasil aku rasi keseluruhan untuk data hasil ekstraksi ciri gabungan ICZ dan ZCZ dengan ju mlah zona 12 berdasarkan jenis kernel yang digunakan ...................................................................... 16 4 Tabel akurasi untuk hasil klasifikasi terbaik dari setiap fungsi kernel yang digunakan .................... 17
vi
1
PENDAHULUAN Latar Belakang Pengenalan pola (pattern recognition) merupakan salah satu perkembangan dari kecerdasan buatan (artificial intelligence). Dengan pengenalan pola, ko mputer dapat mengenali pola-pola karakter yang dikenali oleh manusia untuk kemudian d iproses oleh ko mputer. Pengenalan pola dapat digunakan untuk mengenali tulisan tercetak maupun tulisan tangan, baik tulisan dengan aksara Latin maupun aksara non-Latin, seperti yang dilakukan oleh Rajashekararadhya dan Ranjan (2008). Salah satu contoh tulisan dengan aksara nonLatin ialah tulisan menggunakan aksara Sunda. Aksara Sunda merupakan salah satu aksara daerah Indonesia. Aksara ini sudah digunakan oleh masyarakat Sunda sejak lima abad yang lalu. Sejak dikeluarkannya Surat Keterangan Gubernur Jawa Barat No mor 434/Sk.614Dis.Pk/99 tentang pembakuan aksara Sunda, aksara Sunda seolah-olah dihidupkan kembali dalam keh idupan masyarakat Sunda di Jawa Barat (Baidillah et al. 2008). Bah kan, sejak April 2008, aksara Sunda sudah resmi masuk ke dalam Un icode, dan masuk ke dalam daftar karakter Un icode versi 5.1 (Unicode 2008). Salah satu cara untuk memasyarakatkan aksara Sunda ialah dengan mengajarkannya kepada siswa melalui buku pelajaran bahasa Sunda. Selain itu, aksara Sunda dapat juga digunakan dalam penulisan papan nama jalan, seperti yang terdapat pada papan nama jalan di beberapa kota di Jawa Barat. Tulisan dengan aksara Sunda, baik yang terdapat pada papan nama jalan maupun buku bacaan, menimbu lkan masalah tersendiri bagi beberapa orang dalam memahaminya, terlebih bagi orang yang sama sekali belu m pernah mengenal aksara Sunda. Hal ini disebabkan oleh bentuk karakter pada aksara Sunda yang sangat berbeda dengan karakter pada aksara Latin. Selain itu, terdapat karakter tambahan untuk menyatakan suku kata tertentu. Karenanya, untuk mempermudah pengenalan aksara Sunda, diperlukan sebuah sistem ko mputer yang dapat membaca dan mengenali tu lisan dengan aksara Sunda. Penelit ian mengenai pengenalan aksara Sunda belum banyak dilaku kan. Salah satu penelitian mengenai hal ini yaitu penelitian yang dilakukan oleh Mubarok (2010). Dalam penelitian tersebut, dilakukan pengenalan guratan tulisan tangan aksara Sunda secara online (karakter masukan diproses secara lang-
sung) menggunakan sebuah aplikasi desktop dengan mouse sebagai media pemasukan data. Kemudian data masukan diolah dan dikenali menggunakan Kohonen Neural Network . Penelit ian tersebut mendapatkan akurasi rata-rata untuk guratan normal sebesar 75.36%, sedangkan guratan ber-noise menghasilkan akurasi rata-rata sebesar 75.36%. Penelit ian ini akan membuat model pengenalan aksara Sunda menggunakan ekstraksi ciri Zoning dan klasifikasi Support Vector Machine. Data yang digunakan adalah citra aksara Sunda tercetak. Variasi metode ekstraksi ciri yang digunakan adalah metode yang diajukan oleh Rajashekararadhya dan Ranjan (2008), yaitu Image Centroid and Zone (ICZ), Zone Centroid and Zone (ZCZ), dan gabungan ICZ dan ZCZ. Dalam penelitiannya, Rajashekararadhya dan Ranjan memperoleh ting kat pengenalan ratarata karakter angka Kannada, Telugu, Tamil, dan Malayalam yang ditulis tangan di atas 90% dengan metode ekstraksi ciri gabungan ICZ dan ZCZ untuk hasil klasifikasi menggunakan Jaringan Saraf Tiruan dan KNN. Tujuan Tujuan dari penelitian ini ialah menentukan metode ekstraksi ciri yang paling efektif di antara metode ekstraksi ciri yang digunakan untuk pengenalan aksara Sunda. Ruang Lingkup Ruang lingkup dari penelitian ini yaitu: 1 Karakter aksara Sunda yang digunakan adalah karakter swara (vokal), ngalagena (konsonan), dan angka (0–9), tanpa karakter imbuhan (penambah dan pengubah suara), berdasarkan naskah yang terdapat pada Unicode. 2 Model yang akan dikembangkan mengenali pola aksara hasil cetakan (OCR), bukan tulisan tangan. 3 Metode yang digunakan untuk menerapkan multi-class SVM ialah metode one-versusall.
TINJAUAN PUSTAKA Digital Image (Citra Digital) Menurut Gonzales dan Woods (2002), sebuah citra dapat didefinis ikan sebagai fungsi dua dimensi f(x, y), dengan x dan y adalah koordinat spasial atau bidang, dan nilai amp litudo f untuk masing-masing pasangan x dan y disebut intensitas atau derajat keabuan dari citra pada titik tersebut. Jika nilai x, y, serta
2
nilai amp litudo f berupa nilai d iskret, citra disebut citra digital. Cit ra digital tersusun atas sejumlah elemen yang masing-masing memiliki nilai dan lokasi tertentu yang disebut dengan picture elements (pixels). Ekstraksi Ciri Devijver dan Kittler (1982, diacu dalam Trier et al. 1995) mendefinisikan ekstraksi ciri sebagai masalah “mengekstraksi informasi yang sangat relevan dari data mentah untuk proses klasifikasi, dalam art i meminimalkan variabilitas pola dalam kelas sambil memperbesar variabilitas pola antarkelas.”
Beberapa di antaranya tercantum dalam Tabel 1. Dalam penelit ian in i, variasi metode ekstraksi ciri zoning yang digunakan adalah variasi yang disebutkan oleh Rajashekararadhya dan Ranjan (2008), yaitu metode ekstraksi ciri jarak metrik ICZ (image centroid and zone), metode ekstraksi ciri jarak metrik ZCZ (zone centroid and zone), dan metode ekstraksi ciri gabungan (ICZ dan ZCZ). Tahapan pengerjaan dari masing-masing algorit me akan dijelaskan sebagai berikut.
Metode Ekstraksi Ciri Zoning Zoning merupakan salah satu metode ekstraksi ciri pada citra karakter. Secara u mu m, dengan metode ekstraksi ciri zoning, citra akan dibagi menjadi beberapa zona yang berukuran sama. Set iap zona kemudian d iambil cirinya. Ada beberapa variasi algorit me untuk metode ekstraksi ciri ciri zoning, yang dapat dikelo mpokkan berdasarkan berdasarkan ciri yang diambil, titik acuan yang digunakan, dan posisi zona. Beberapa Tabel 1 Pengelo mpokan beberapa variasi metode ekstraksi ciri zoning Referensi Ciri yang diambil Rata-rata jarak Rajashekararadhya dan antara pixel dan Ranjan (2008), Gatos et titik acuan al. (2011) Rata-rata sudut Rajashekararadhya dan antara pixel dan Ranjan (2009a), Rajashetitik acuan kararadhya dan Ran jan (2009b) Titik acuan Image centroid Rajashekararadhya dan Ranjan (2008), Rajashekararadhya dan Ran jan (2009a), Rajashekararadhya dan Ranjan (2009b) Zone centroid Rajashekararadhya dan Ranjan (2008), Rajashekararadhya dan Ran jan (2009b) Titik lain Gatos et al. (2011) Posisi zona Tetap Rajashekararadhya dan Ranjan (2008), Rajashekararadhya dan Ran jan (2009a), Rajashekararadhya dan Ranjan (2009b) Berubah-ubah Gatos et al. (2011) (adaptif)
Kelo mpok
Metode ekstraksi ciri jarak metrik Image Centroid and Zone 1 Hitung centroid (pusat) dari citra masukan. 2 Bagi citra masukan men jadi n zona yang sama. 3 Hitung jarak antara centroid citra dan setiap pixel yang ada dalam zona. 4 Ulangi langkah 3 untuk semua pixel yang ada dalam zona. 5 Hitung jarak rata-rata antara tit ik-titik tersebut. 6 Ulangi langkah 3–5 untuk semua zona secara berurutan. 7 Akhirnya, akan didapatkan n ciri untuk klasifikasi dan pengenalan. Metode ekstraksi ciri jarak met rik Zone Centroid and Zone 1 Bagi citra masukan men jadi n zona yang sama. 2 Hitung centroid tiap zona. 3 Hitung jarak antara centroid zona dan setiap pixel yang ada dalam zona. 4 Ulangi langkah 3 untuk semua pixel yang ada dalam zona. 5 Hitung jarak rata-rata antara tit ik-titik tersebut. 6 Ulangi langkah 3–5 untuk semua zona secara berurutan. 7 Akhirnya, akan didapatkan n ciri untuk klasifikasi dan pengenalan. Metode ekstraksi ciri gabungan (ICZ dan ZCZ) 1 Hitung centroid dari citra masukan. 2 Bagi citra masukan men jadi n zona yang sama. 3 Hitung jarak antara centroid citra dan setiap pixel yang ada dalam zona. 4 Ulangi langkah 3 untuk semua pixel yang ada dalam zona. 5 Hitung jarak rata-rata antara tit ik-titik tersebut. 6 Hitung centroid tiap zona. 7 Hitung jarak antara centroid zona dan setiap pixel yang ada dalam zona.
3
8 Ulangi langkah 7 untuk semua pixel yang ada dalam zona. 9 Hitung jarak rata-rata antara tit ik-titik tersebut. 10 Ulangi langkah 3–9 untuk semua zona secara berurutan. 11 Akhirnya, akan didapatkan 2n ciri untuk klasifikasi dan pengenalan.
Margin
K-fold Cross-validation Cross-validation merupakan metode statistika untuk mengevaluasi dan membandingkan algorit me pembelajaran dengan membagi data men jadi dua bagian: satu bagian digunakan untuk mempelajari atau melatih model dan bagian lainnya digunakan untuk memvalidasi model tersebut. Salah satu bentuk crossvalidation ialah k-fold cross-validation. Pada k-fold cross-validation, awalnya data dibagi menjadi k bagian yang berukuran sama (atau hampir sama). Secara berurutan, pelat ihan dan validasi dilakukan sebanyak k ulangan sehingga dalam setiap perulangan satu bagian data yang berbeda digunakan untuk validasi sementara k – 1 bagian lainnya digunakan untuk pembelajaran atau pelatihan (Refaeilzadeh et al. 2009). Support Vector Machine Support Vector Machine (SVM) merupakan prosedur pembelajaran konstruktif yang universal yang berbasis teori pembelajaran statistik. Istilah “universal” berarti bahwa SVM dapat digunakan untuk mempelajari beragam representasi, seperti jaringan s araf (dengan fungsi aktivasi sigmoid biasa), radial basis function, dan spline. SVM mengo mbinasikan empat konsep berbeda, yaitu implementasi baru dari prinsip induktif Structural Risk Minimization (SRM), pemetaan data masukan ke ruang dimensi tinggi, fungsi linear dengan kendala pada kompleksitas, dan dualitas teori optimisasi (Cherkassky & Mulier 2007). SVM akan mencari hyperplane (bidang pemisah) terbaik yang memisahkan data dari suatu permasalahan. Menurut Osuna et al. (1997), suatu data dikatakan linearly separable (dapat dipisahkan secara linear) jika untuk permasalahan tersebut dapat dicari pasangan (w, b) sedemikian sehingga: i
b
i
b
i
-
i
kelas
(1)
kelas
(2)
Kelas –1
Kelas +1
Gambar 1 Keadaan linearly separable. Karenanya, ruang hipotesis adalah set fungsi yang diberikan oleh b
si n
b
Gambar 1 menunjukkan kondisi suatu data yang linearly separable. Pada gambar tersebut, terdapat sebuah hyperplane yang memisahkan data di kelas +1 (lingkaran) dengan data di kelas –1 (kotak). Terdapat pula margin, yaitu jarak antara hyperplane dengan elemen terluar dari kedua kelas. Bidang pemisah terbaik adalah bidang pemisah yang menghasilkan n ilai margin terbesar. SVM d irancang tidak hanya untuk dapat menyelesaikan permasalahan linear, tetapi juga permasalahan non-linear. Agar permasalahan non-linear dapat diselesaikan, permasalahan tersebut dapat dipetakan ke dalam ruang ciri berdimensi lebih tinggi, kemudian diterapkan klasifikasi linear dalam ruang tersebut. Tepatnya, variabel input x dipetakan ke dalam vektor variabel ciri ϕ(x) dengan fungsi transformasi x ϕ . Fungsi yang memetakan suatu permasalahan non-linear ke dalam ruang ciri yang lebih tinggi disebut dengan fungsi kernel, K(x, y). Terdapat tiga kernel yang biasa digunakan dalam SVM, yaitu sebagai berikut (Osuna et al. 1997).
Polinomial dengan derajat d:
Gaussian Radial Basis Function (RBF): e - an
Multi Layer Perceptron (untuk beberapa nilai ): tanh - .
Metode M ulti-class SVM One-versus-all Pada awalnya, SVM d idesain untuk melakukan klasifikasi biner, dengan kata lain hanya dapat menangani data yang memiliki dua kelas. Cara untuk mengembangkan SVM agar
4
dapat digunakan untuk klasifikasi banyak kelas merupakan isu riset yang masih berjalan. Salah satu metode yang digunakan untuk klasifikasi multi-class SVM ialah metode one-versus-all atau metode one-against-all. Menurut Hsu dan Lin (2002), metode oneversus-all kemungkinan merupakan metode implementasi untuk klasifikasi multi-class SVM paling awal. Metode ini membangun k model SVM, dengan k adalah jumlah kelas yang ada. Model SVM ke-i dilatih menggunakan semua contoh di kelas ke-i dengan label positif (kelas 1), dan semua contoh di kelas lain dengan label negatif (kelas –1). Setelah dilaku kan pelatihan SVM, d idapatkan k fungsi keputusan dari k model tersebut. Misalkan ada data baru x yang diujikan pada model SVM one-versus-all ini, x akan masuk ke dalam kelas tertentu yang memiliki nilai fungsi keputusan terbesar.
citra PNG. File citra PNG ini akan digunakan sebagai data pelatihan dan pengujian. Karakter aksara Sunda yang digunakan berupa karakter tunggal yang ada pada naskah Unico e se erti karakter “ka” ᮊ “ga” ᮌ), an “nga” ᮍ). Data untuk setiap karakter akan diberikan variasi yang berbeda. Sebagai contoh, variasi untuk karakter “ka” itunjukkan a a Gambar 3. Pemberian variasi untuk setiap data bertujuan untuk membuat data yang digunakan men jadi lebih beragam. Contoh citra karakter aksara Sunda yang digunakan ditunjukkan pada Lamp iran 1.
Gambar 3 Variasi untuk karakter "ka". Praproses Data
METODE PENELITIAN Secara garis besar, tahapan dalam penelitian ini d igambarkan pada Gambar 2.
Pada tahapan praproses data, data citra yang sudah dibangkitkan pada tahap sebelumnya akan dipraproses agar dapat diolah pada tahap berikutnya. Metode praproses data yang akan digunakan ialah binerisasi (konversi citra warna men jadi cit ra biner) dan pemotongan (cropping) bagian karakter dari citra. Ekstraksi Ciri Metode ekstraksi ciri yang digunakan ialah metode zoning. Metode ini memiliki beberapa variasi algorit me, tiga di antaranya seperti yang dijelaskan oleh Rajashekararadhya dan Ranjan (2008). Penelitian ini menggunakan ketiga variasi algorit me metode zoning, yaitu Image Centroid and Zone (ICZ), Zone Centroid and Zone (ZCZ), dan gabungan dari ICZ dan ZCZ.
Gambar 2 Tahapan penelitian. Pengumpulan Data Data yang akan digunakan dalam pelatihan dan pengujian SVM diku mpulkan pada tahapan ini. Data didapatkan dari hasil pembangkitan yang dilaku kan oleh penulis dengan menulis aksara Sunda pada program pengolah vektor grafis. Setelah sedikit dio lah (diatur pos isinya, warna background, dan lain-lain), karakter aksara Sunda kemudian di-export menjad i file
Sebagai ilustrasi, berikut ini akan diberikan contoh ekstraksi ciri menggunakan algorit me Image Centroid and Zone dan Zone Centroid and Zone. Sebagai citra ilustrasi digunakan sebuah citra berukuran 5x9 pixel, seperti pada Gambar 4. Dengan menggunakan algorit me Image Centroid and Zone, pertama dihitung centroid (pusat) dari citra. Centroid dari citra d inyatakan dengan nilai koordinat titik (xc , yc). Cara menghitung centroid yaitu: i
i
an
i
i
(4)
dengan f(x, y) adalah nilai pixel dari citra pada posisi tertentu. Perhitungan menghasilkan nilai xc = 3 dan yc = 5 sehingga didapatkan nilai centroid citra yaitu (3, 5).
5
Setelah didapatkan jarak centroid-pixel untuk masing-masing pixel non-background pada zona 1, jarak rata-ratanya dihitung sebagai berikut. jarak
jarak
jarak
Perhitungan menghasilkan jarak rata-rata centroid-pixel untuk zona 1 ialah 3.196.
Gambar 4 Contoh citra untuk algorit me ICZ dan ZCZ. Berikutnya, citra d ibagi men jadi n zona yang sama, misalkan menjad i 3 zona, yaitu zona atas, zona tengah, dan zona bawah, dengan masingmasing zona berukuran 5x3 pixel. Kemudian, dihitung jarak antara centroid dan setiap pixel yang ada dalam zona, dalam hal ini pixel yang digunakan adalah pixel non-background. Jarak dihitung menggunakan rumus jarak Euclid, dengan rumus berikut: jarak
Dengan cara yang sama, jarak centroid-pixel dihitung untuk setiap pixel pada zona 2 (tengah) dan 3 (bawah), kemudian dihitung rata-ratanya. Dari hasil perhitungan, didapatkan bahwa jarak rata-rata centroid-pixel untuk zona 2 dan 3 berturut-turut ialah 0.94 dan 3.196. Sementara itu, jika menggunakan algorit me Zone Centroid and Zone, pertama citra akan langsung dibagi menjadi n zona yang sama, misalkan menjadi 3 zona seperti pada algoritme Image Centroid and Zone, menjadi zona atas, zona tengah, dan zona bawah. Kemudian, zone centroid dari masing-masing zona dihitung menggunakan Persamaan 4. Dari hasil perhitungan, didapatkan hasil berikut:
Gambar 5 Perh itungan jarak pixel nonbackground dengan image centroid untuk zona 1. Untuk zona 1 (zona atas), perhitungan jarak, yang divisualisasikan oleh Gambar 5, d ilakukan dengan perhitungan berikut: jarak
–
–
.
jarak
–
–
.
jarak
–
–
jarak
–
–
.
jarak
–
–
.
Zona 1 (atas): xc = 3, yc = 2.2 Zona 2 (tengah): xc = 3, yc = 5 Zona 3 (bawah): xc = 3, yc = 7.8
Gambar 6 Perh itungan jarak pixel nonbackground dengan zone centroid untuk zona 1. Kemudian, untuk masing-masing zona, jarak antara centroid masing-masing zona dan setiap pixel non-background yang ada di dalam zona dicari menggunakan rumus jarak Euclid (Persamaan 5). Untuk zona 1 (atas), perhitungan jarak, yang divisualisasikan oleh Gambar 6, dilakukan dengan perhitungan berikut: jarak
–
– .
.
jarak
–
– .
.
6
jarak
–
– .
.
Pengujian Support Vector Machine
jarak
–
– .
.
jarak
–
– .
.
Setelah didapatkan model dari pelat ihan SVM, model akan diuji menggunakan data uji hasil ekstraksi ciri yang sebelumnya sudah dibagi menggunakan k-fold cross-validation.
Setelah didapatkan jarak centroid-pixel untuk masing-masing pixel non-background pada zona 1, jarak rata-ratanya dihitung, sebagai berikut. jarak
jarak
jarak
Dari hasil perhitungan, didapatkan bahwa jarak rata-rata centroid zona dengan seluruh pixel untuk zona 1 ialah 1.508. Dengan cara yang sama, jarak centroid-pixel dihitung untuk setiap pixel pada zona 2 (tengah) dan 3 (bawah), kemudian rata-ratanya dihitung. Dari hasil perhitungan, jarak rata-rata centroidpixel untuk zona 2 dan 3 berturut-turut ialah 0.94 dan 1.508. Dengan demikian, tiga nilai d idapatkan untuk masing-masing algorit me ekstraksi ciri, yang merupakan ciri dari citra yang didapatkan dari masing-masing zona. Untuk algorit me Image Centroid and Zone, hasilnya adalah 3.196, 0.94, dan 3.196. Sementara itu, untuk algorit me Zone Centroid and Zone hasilnya adalah 1.508, 0.94, dan 1.508. Ket iga nilai dari masing-masing algorit me ini kemudian akan digunakan dalam pelatihan dan/atau pengujian SVM. K-fold Cross-validation Data yang sudah dikenakan proses ekstraksi ciri kemudian dibagi menjad i data latih dan data uji dengan menggunakan k-fold cross-validation. K-fold cross-validation membagi seluruh data menjadi k subbagian data yang sama, kemudian secara berurutan menggunakan k subbagian data tersebut sebagai data uji, dan k – 1 data yang lain digunakan sebagai data latih. Nilai k yang digunakan ialah 5. Pelatihan Support Vector Machine Pelatihan SVM dilakukan menggunakan data latih hasil ekstraksi ciri yang sebelumnya sudah dibagi menggunakan k-fold crossvalidation. Dalam pelatihan SVM ini, akan dicobakan pelatihan menggunakan empat fungsi kernel, yaitu kernel linear (polino mial berderajat 1), quadratic (polinomial berderajat 2), polinomial berderajat 3, dan Radial Basis Function (RBF).
Analisis Dari hasil pelatihan dan pengujian SVM dengan kernel dan algoritme pelatihan yang berbeda, akan didapatkan hasil untuk kinerja algorit me SVM dalam klasifikasi citra karakter aksara Sunda. Setelah itu, dicari akurasi untuk masing-masing hasil klasifikasi. Ru mus yang digunakan untuk menghitung akurasi hasil klasifikasi, yaitu: kurasi
umlah
benar
umlah ata uji
Sementara itu, hal-hal yang akan dianalisis meliputi metode ekstraksi ciri dan ju mlah zona, serta jenis kernel SVM yang digunakan. Lingkungan Penelitian Lingkungan yang digunakan untuk penelitian ini memiliki spesifikasi sebagai berikut. Perangkat keras:
Processor Intel Core i3-2310M, Memory 2 GB, dan Harddisk 500 GB.
Perangkat lunak:
Sistem Operasi M icrosoft Windows Professional Service Pack 1 32-bit, MATLAB R2008b, dan Inkscape 0.48.
7
HASIL DAN PEMBAHASAN Pengumpulan Data Data yang digunakan dalam penelitian ini didapat dari hasil pembangkitan yang dilakukan menggunakan program pengolah vektor grafis Inkscape dan font SundaneseLatin. Di dalam font SundaneseLatin, terdapat 40 karakter aksara Sunda, yang terdiri atas 7 karakter swara (vokal), 23 karakter ngalagena (konsonan), dan 10 karakter angka (0– 9). Untuk 40 karakter tersebut, dibangkitkan 10 citra karakter berjen is PNG beru kuran 90x86 pixel, masing-masing dengan variasi posisi karakter, warna karakter, dan warna latar yang berbeda-beda, seperti ditunjukkan pada Gambar 7. Setelah tahapan ini selesai, didapatkan 400 data citra.
7
Hal ini dilaku kan karena sebenarnya algoritme gabungan ICZ dan ZCZ merupakan urutan pengerjaan ekstraksi ciri menggunakan algoritme ICZ yang dilanjutkan dengan ekstraksi ciri menggunakan algorit me ZCZ. Gambar 7 Contoh citra hasil pembangkitan data. Praproses Data Pada tahapan praproses data, data citra yang sudah dibangkitkan sebelumnya diubah men jadi citra biner (b inerisasi), dipotong (crop), dan diubah ukurannya (resize). Data hasil pembangkitan berupa citra warna RGB. Karena citra yang akan diproses harus berupa citra biner dengan bagian karakter bernilai 1 dan bagian background bernilai 0, citra RGB harus diubah menjad i citra b iner. Tahapan yang dilaku kan ialah mengubah citra RGB men jadi citra grayscale, mengubah citra grayscale menjadi citra b iner, serta menegasikan citra, jika diketahui bagian karakter bernilai 0.
Setelah dilakukan ekstraksi ciri menggunakan algorit me ICZ dan ZCZ serta empat macam zona, didapatkan 12 dataset dengan ukuran yang berbeda-beda, seperti ditunjukkan pada Tabel 2. Adapun contoh citra asli, citra hasil praproses, dan data hasil ekstraksi ciri menggunakan algorit me ICZ dan ZCZ untuk citra angka d itunjukkan pada Lamp iran 2. memii
Pemotongan citra dilaku kan karena hanya bagian karakter saja yang akan diproses, sementara bagian latar akan dibuang. Cara memotongnya sebagai berikut. Pertama, ditentukan batas kiri, kanan, atas dan bawah dari citra karakter yang akan diambil. Setelah itu, elemen citra yang berada di dalam batas diamb il sebagai citra baru. Setelah dilaku kan pemotongan, ternyata didapatkan citra hasil yang ukurannya tidak seragam. Agar u kurannya seragam, citra hasil harus diubah ukurannya. Setelah dilakukan pengamatan, ditentukan bahwa ukuran citra untuk kemudian diproses lebih lanjut ialah 60x56 pixel. Perbandingan antara citra asli sebelum dilaku kan praproses data, setelah dilakukan binerisasi dan pemotongan, serta setelah dilakukan binerisasi, pemotongan, dan pengubahan ukuran ditunjukkan o leh Gambar 8. Ekstraksi Ciri Metode ekstraksi ciri yang digunakan adalah variasi dari metode ekstraksi ciri zoning, yaitu Image Centroid and Zone (ICZ), Zone Centroid and Zone (ZCZ), dan gabungan dari ICZ dan ZCZ. Ju mlah zona yang digunakan yaitu 4, 6, 8, dan 12 zona. Data hasil ekstraksi ciri menggunakan algorit me ICZ dan ZCZ d idapat dari hasil implementasi algorit me ICZ dan ZCZ yang disebutkan oleh Rajashekararadhya dan Ranjan (2008). Sementara itu, data hasil ekstraksi ciri gabungan ICZ dan ZCZ didapat dari penggabungan data hasil ekstraksi ciri ICZ dan ZCZ.
Gambar 8 (a) Cit ra sebelum dilaku kan praproses, (b) citra setelah dilakukan binerisasi dan pemotongan, serta (c) citra setelah dilakukan b inerisasi, pemotongan, dan pengubahan ukuran. Tabel 2 Daftar u kuran data hasil ekstraksi ciri Metode Ekstraksi Ciri
Jumlah Zona 4
6
8
12
ICZ
400 x 4
400 x 6
400 x 8
400 x 12
ZCZ
400 x 4
400 x 6
400 x 8
400 x 12
ICZ + ZCZ
400 x 8
400 x 12
400 x 16
400 x 24
8
Data yang digunakan untuk pelatihan SVM sebanyak 320 buah, dan data uji yang digunakan sebanyak 80 buah. Pembagian data dilakukan menggunakan 5-fold cross-validation. Setelah data dibagi menggunakan k-fold cross-validation, dilakukan klasifikasi SVM. Model SVM dibangun menggunakan empat fungsi kernel, yaitu kernel linear (polino mial berderajat 1), quadratic (polinomial berderajat 2), polino mial berderajat 3, dan RBF. Dengan menggunakan keempat fungsi kernel ini, dibentuklah unit percobaan sebanyak 1728 buah. Setelah dilaku kan pelatihan dan pengujian hanya didapatkan 1667 hasil klasifikasi saja. Hal ini disebabkan oleh beberapa hal yang terjadi selama proses pelatihan dan pengujian unit percobaan. Setelah didapatkan hasil klasifikasi, dihitung akurasi dari hasil klasifikasi tersebut. Perhitungan akurasi dilaku kan menggunakan Persamaan 6. Analisis Setelah hasil akurasi untuk semua kombinasi kernel dan parameternya didapatkan, akurasi ku mulatif dih itung berdasarkan metode ekstraksi ciri dan ju mlah zona, serta jen is kernel. Metode ekstraksi ciri dan jumlah zona Untuk hasil akurasi berdasarkan metode ekstraksi ciri dan jumlah zona yang digunakan, nilai akurasi yang dianalisis merupakan rata-rata nilai akurasi dari hasil klasifikasi untuk masingmasing dataset. Hasil akurasi rata-rata berdasarkan metode ekstraksi ciri dan ju mlah zona yang digunakan ditunjukkan pada Tabel 3, sementara itu Gambar 9 memvisualisasikan Tabel 3 dari sudut pandang (a) metode ekstraksi ciri, dan (b) ju mlah zona yang digunakan. Jika ditin jau berdasarkan metode ekstraksi ciri yang digunakan (Gambar 9.a.), dapat dilihat
Jumlah zona
Metode Ekstraksi Ciri ICZ
ZCZ
ICZ + ZCZ
4
75.03%
67.88%
89.74%
6
83.91%
84.99%
91.17%
8
82.75%
88.26%
91.51%
12
88.35%
90.79%
93.99%
100%
ICZ
ZCZ
ICZ + ZCZ
90%
Akurasi
Setelah didapatkan data hasil ekstraksi ciri, proses dilanjutkan dengan klasifikasi(Support Vector Machine (SVM). Proses klasifikasi SVM diawali dengan memodifikasi fungsi SVM, agar dapat digunakan untuk menangani data yang memiliki banyak kelas . Teknik perluasan fungsionalitas yang digunakan ialah SVM oneversus-all. Dengan teknik in i, dapat dibangun SVM sebanyak ju mlah kelas yang ada, yaitu 40 buah, dengan masing-masing SVM mewakili setiap kelas yang ada. Misalkan SVM 1 mewakili kelas “nol” SVM ini akan mengenali citra karakter “nol” an “bukan nol”.
Tabel 3 Hasil akurasi rata-rata berdasarkan metode ekstraksi ciri dan ju mlah zona yang digunakan
80% 70% 60%
50% 4
6 8 Jumlah zona
12
(a) 100%
4
6
8
12
90% Akurasi
Kl asifikasi Support Vector Machine
80% 70% 60% 50% ICZ
ZCZ ICZ + ZCZ Metode ekstraksi ciri
(b) Gambar 9 Hasil akurasi rata-rata berdasarkan (a) metode ekstraksi ciri, dan (b) ju mlah zona yang digunakan. bahwa metode ekstraksi ciri ZCZ menghasilkan akurasi yang lebih baik daripada metode ekstraksi ciri ICZ untuk ju mlah zona 6, 8, dan 12 buah. Sebaliknya, metode ekstraksi ciri ICZ menghasilkan akurasi yang lebih baik daripada metode ekstraksi ciri ZCZ untuk ju mlah zona 4 buah. Hal ini dapat disebabkan oleh metode ICZ yang merupakan metode ekstraksi ciri global, yang mengambil ciri dari citra secara keseluruhan. Sementara itu, metode ZCZ merupakan metode ekstraksi ciri lokal, yang mengamb il cir i
9
dari cit ra secara lokal berdasarkan informasi pola lokal sehingga ciri yang diambil lebih mendetail dan dapat meningkatkan akurasi hasil klasifikasi. Sementara itu, metode ekstraksi ciri gabungan ICZ dan ZCZ mendapatkan hasil akurasi terbaik untuk keempat zona. Bahkan untuk jumlah zona 6, 8, dan 12 buah, nilainya melebih i 90%. Hal ini wajar, karena data untuk metode ekstraksi ciri gabungan ICZ dan ZCZ merupakan gabungan antara data untuk metode ekstraksi ciri ICZ dan ZCZ, dan seharusnya data gabungan ini dapat menghasilkan nilai akurasi yang lebih tinggi daripada data hasil ekstraksi ciri menggunakan metode ICZ atau ZCZ saja. Jika dit injau berdasarkan ju mlah zona yang digunakan (Gambar 9.b.), dapat dilihat bahwa hasil akurasi meningkat seiring dengan penambahan jumlah zona yang digunakan ketika proses ekstraksi ciri. Hal yang sedikit berbeda terdapat pada hasil ekstraksi ciri menggunakan ICZ, yaitu penggunaan 6 buah zona menghasilkan akurasi yang lebih baik daripada penggunaan 8 buah zona. Secara u mu m, hal in i dapat disebabkan oleh jumlah ciri yang diamb il dari citra, karena ju mlah zona mempengaruhi ju mlah ciri yang diamb il. Semakin banyak ju mlah zona, semakin banyak ciri yang diamb il dari citra, baik ciri global maupun ciri lokal. Hal ini dapat membuat akurasi hasil klasifikasi meningkat. Dari hasil in i, dapat dikatakan bahwa peningkatan jumlah zona yang digunakan dapat men ingkatkan akurasi, walaupun pada metode ICZ akurasi untuk ju mlah zona 6 buah lebih tinggi daripada akurasi untuk jumlah zona 8 buah. Jenis kernel
Akurasi
Gambar 10 menunjukkan hasil akurasi terbaik berdasarkan jenis kernel yang digunakan pada pelatihan SVM, yaitu kernel linear, quadratic 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Linear
Quadratic Polinomial, or er
RBF
Jenis kernel
Gambar 10 Hasil aku rasi berdasarkan jenis kernel.
quadratic, polinomial berderajat 3, dan RBF, untuk data hasil metode ekstraksi ciri gabungan ICZ dan ZCZ dengan jumlah zona 12 buah. Pemilihan data hasil metode ekstraksi ciri serta ju mlah zona yang digunakan sebagai pembanding didasarkan pada hasil dari bagian sebelumnya, yang menunjukkan bahwa metode ekstraksi ciri dan ju mlah zona yang menghasilkan akurasi terbaik ialah metode ekstraksi ciri gabungan ICZ dan ZCZ dan jumlah zona 12 buah. Hasil akurasi untuk seluruh klasifikasi untuk data hasil ekstraksi ciri gabungan ICZ dan ZCZ dengan jumlah zona 12 buah dapat dilihat pada Lampiran 3, sementara tabel akurasi untuk hasil klasifikasi terbaik dari setiap fungsi kernel yang digunakan dapat dilihat pada Lamp iran 4. Dari Gambar 10 diketahui bahwa klasifikasi SVM untuk data hasil ekstraksi ciri gabungan ICZ dan ZCZ dan ju mlah zona 12 buah menggunakan keempat jenis fungsi kernel menghasilkan akurasi terbaik yang sama. Dari hasil in i dapat dikatakan bahwa keempat fungsi kernel SVM memiliki kinerja yang sama dalam melakukan pelatihan SVM untuk data yang digunakan dalam penelit ian in i.
SIMPULAN DAN SARAN Simpulan Pengenalan pola merupakan salah satu perkembangan dari artificial intelligence, yang memungkinkan ko mputer dapat mengenali pola karakter yang dikenali oleh manusia. Pengenalan pola biasa digunakan dalam proses OCR (optical character recognition) dan HCR (handwritten charater recognition). Dalam penelit ian ini, dibangun model pengenalan aksara Sunda tercetak menggunakan metode ekstraksi ciri zoning dan klasifikasi Support Vector Machine. Tujuan dari penelitian ini yaitu untuk menentukan metode ekstraksi ciri yang paling efektif di antara metode ekstraksi ciri yang digunakan untuk pengenalan aksara Sunda. Dari hasil yang didapat, diketahui bahwa metode ekstraksi ciri gabungan ICZ dan ZCZ menghasilkan akurasi paling tinggi, untuk keempat ju mlah zona yang digunakan dalam proses ekstraksi ciri. Sementara itu, untuk ju mlah zona yang digunakan, akurasi paling tinggi didapat oleh ju mlah zona 12 buah, untuk ketiga metode ekstraksi ciri yang digunakan. Dari apa yang telah dilaku kan, dapat disimpulkan bahwa metode ekstraksi ciri yang paling efektif di antara metode ekstraksi ciri
10
yang digunakan untuk pengenalan aksara Sunda ialah metode gabungan ICZ dan ZCZ, dengan ju mlah zona 12 buah. Saran Beberapa saran untuk penelitian selanjutnya yaitu: 1 Perancangan data latih dan data uji lebih lanjut untuk menguji kinerja algorit me zoning, misalnya dengan mengubah ukuran atau kemiringan karakter. 2 Penggunaan metode klasifikasi lain untuk pengenalan aksara Sunda, misalnya KNN atau Backpropagation Neural Network . 3 Pengembangan sistem pengenalan aksara Sunda lebih lan jut, sehingga sistem dapat mengenali karakter penambah dan pengubah suara. 4 Pengembangan aplikasi mobile untuk menerap kan model SVM yang sudah didapatkan dari penelitian ini.
DAFTAR PUSTAKA Baidillah I, Darsa UA, Abdurahman O, Permadi T, Gunardi G et al. 2008. Direktori Aksara Sunda untuk Unicode. Bandung: Pemerintah Provinsi Jawa Barat. Cherkassky V, Mulier F. 2007. Learning from Data: Concepts, Theory, and Methods. Ed ke-2. New Jersey: John Wiley & Sons. Devijver PA, Kittler J. 1982. Pattern Recognition: A Statistical Approach. London: Prentice -Hall. Gatos B, Kesid is AL, Papandreou A. 2011. Adaptive zoning features for character and word recognition. Di dalam: 11th International Conference on Document Analysis and Recognition; Beijing, 18-21 Sep 2011. Washington DC: IEEE Co mputer Society. h lm 1160-1164. Gon zalez R, Woods R. 2002. Digital Image Processing. Ed ke-2. New Jersey: Prentice Hall. Hsu CW, Lin CJ. 2002. A co mparison of methods for mult iclass support vector
mach ines. IEEE Transactions on Neural Networks 13 (2): 415-425. Mubarok. 2010. Pengenalan tulisan tangan aksara Sunda menggunakan kohonen neural network [skripsi]. Bandung: Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam, Un iversitas Pendidikan Indonesia. Osuna EE, Freund R, Girosi F. 1997. Support Vector Machines: Training and Applications. AI Memo 1602, Massachusetts Institute of Technology. Rajashekararadhya SV, Ranjan P V. 2008. Efficient zone based feature extration algorith m for handwritten numeral recognition of four popular South Indian scripts. Journal of Theoretical and Applied Information Technology 4 (12): 11711181. Rajashekararadhya SV, Ranjan PV. 2009a. Handwritten numeral recognition of Kannada script. Di dalam: Bajaj P, Abraham A, ed itor. Workshop Proceedings of the International Workshop on Machine Intelligence Research; Nagpur, 24 Jan 2009. Washington: Machine Intelligence Research Labs. hlm 80-86. Rajashekararadhya SV, Ranjan PV. 2009b. A novel zone based feature extraction algorith m for handwritten numeral recognition of four indian scripts. Digital Technology Journal 2: 41-51. Refaeilzadeh P, Tang L, Liu H. 2009. Cross validation. Di dalam: Liu L, Öszu MT, editor. Encyclopedia of Database Systems. New York: Sp ringer. Trier OD, Jain AK, Taxt T. 1996. Feature extraction methods for character recognition – a survey. Pattern Recognition 4 (29): 641-662. [Un icode]. 2008. The Unicode Standard, Version 5.1 Archived Code Charts. http://www.unicode.org/Public/ 5.1.0/charts /CodeCharts.pdf [27 Des 2011].
LAMPIRAN
12
Lamp iran 1 Contoh karakter aksara Sunda yang digunakan Karakter angka
0
1
2
3
4
5
6
7
8
9
Karakter swara (vokal)
A
É
E
EU
I
O
U
Karakter ngalagena (konsonan)
BA
CA
DA
FA
GA
HA
JA
KA
LA
MA
NA
NGA
NYA
PA
QA
RA
SA
TA
VA
WA
XA
YA
ZA
13
Lamp iran 2 Contoh citra asli, citra hasil praproses, dan data hasil ekstraksi ciri menggunakan algorit me ICZ dan ZCZ untuk citra angka Karakter
Citra Asli
Citra Hasil Praproses
Karakter
0
5
1
6
2
7
3
8
4
9
Citra Asli
Data hasil ekstraksi ciri Metode ICZ dengan 4 zona Karakter 0 1 2 3 4 5 6 7 8 9
Data Hasil Ekstraksi Ciri 25.191 25.926 24.779 23.458 28.818 22.953 23.028 24.130 16.787 24.910 22.846 18.360 19.857 16.847 20.414 25.521 24.972 25.949 22.020 28.127 18.941 18.422 22.111 21.513 18.871 26.388 22.406 22.436 27.378 20.976
25.474 22.747 24.223 19.296 16.119 25.686 17.958 18.005 17.707 20.256
Metode ICZ dengan 6 zona Karakter 0 1 2 3 4 5 6 7 8 9
25.336 25.149 27.846 27.638 22.731 25.624 18.874 16.397 25.265 23.162
Data Hasil Ekstraksi Ciri 24.843 26.229 25.020 22.661 30.243 23.196 20.049 0.000 18.626 21.616 23.607 19.063 13.706 21.977 23.542 24.434 25.077 26.718 26.029 25.661 20.042 18.324 25.887 25.336 15.785 27.584 24.087 23.375 27.837 21.760
24.138 19.142 14.856 14.955 16.298 23.153 13.655 17.505 18.248 16.360
25.886 25.031 28.910 24.088 20.908 26.370 23.233 17.303 14.960 25.202
Citra Hasil Praproses
14
Lanjutan Metode ICZ dengan 8 zona Karakter 0 1 2 3 4 5 6 7 8 9
25.301 27.633 28.723 29.605 22.539 28.912 27.556 23.421 23.577 26.870
25.784 28.818 26.923 29.279 20.677 28.489 32.002 27.452 30.880 28.330
Data Hasil Ekstraksi Ciri 25.032 26.143 24.866 13.951 0.000 16.706 11.713 11.562 9.069 13.767 21.614 11.882 10.752 12.930 16.204 18.524 18.096 22.583 16.810 21.589 13.892 13.338 14.910 13.553 8.141 16.603 15.301 13.632 20.959 14.199
25.944 19.757 17.957 15.603 16.101 21.863 14.160 13.048 13.866 15.754
24.720 25.789 21.887 21.811 26.614 27.400 21.715 26.668 26.346 24.420
25.178 25.951 26.797 22.749 19.142 27.347 21.036 22.449 21.940 23.957
Metode ICZ dengan 12 zona Karakter 0 1 2 3 4 5 6 7 8 9
25.7 30.3 31.3 32.2 23.9 29.6 25.6 21.9 26.1 28.8
24.8 24.9 25.8 26.3 19.2 24.8 29.5 23.2 21.6 25.8
26.3 30.2 0.0 0.0 22.9 29.4 32.4 31.6 31.5 29.3
25.0 14.6 11.5 14.0 17.4 18.5 17.1 15.4 8.0 14.0
Data Hasil Ekstraksi Ciri 0.0 26.1 24.9 0.0 12.8 0.0 16.8 10.3 11.8 0.0 12.0 6.3 13.4 23.6 13.2 8.7 7.0 20.8 20.5 11.9 16.8 18.1 22.6 0.0 15.6 23.8 15.1 8.0 9.6 19.1 17.5 7.4 8.8 17.7 18.1 11.6 12.8 22.9 15.3 9.2
25.9 22.9 27.7 22.4 20.9 21.9 22.2 15.2 15.0 22.9
Metode ZCZ dengan 4 zona Karakter 0 1 2 3 4 5 6 7 8 9
Data Hasil Ekstraksi Ciri 9.967 10.163 10.000 10.037 6.489 9.827 10.837 6.638 10.150 10.108 10.366 9.770 10.689 10.084 10.590 8.843 8.962 10.288 8.022 12.799 10.319 8.464 11.504 10.936 9.255 9.302 9.705 9.256 7.759 10.265
10.112 10.782 10.875 10.727 7.820 10.229 10.488 9.051 7.223 10.965
Metode ZCZ dengan 6 zona Karakter 0 1 2 3 4 5 6 7 8 9
7.792 9.607 8.387 9.173 8.035 8.680 5.530 5.007 4.909 8.981
Data Hasil Ekstraksi Ciri 5.783 7.902 7.768 7.757 4.352 8.540 8.247 0.000 7.979 7.633 4.931 8.191 9.977 10.054 10.561 8.968 8.727 8.487 8.577 9.809 8.724 9.019 8.184 8.605 8.563 8.236 8.104 8.110 8.272 8.587
5.792 9.012 11.454 9.469 8.135 5.779 9.339 8.942 9.652 9.096
7.871 8.810 6.956 10.326 4.507 8.536 10.033 6.416 2.460 10.627
25.2 27.3 22.8 23.0 29.2 29.3 23.4 30.7 27.6 25.8
24.1 22.5 20.8 19.4 25.0 23.2 17.6 22.2 22.8 20.9
25.8 27.6 29.2 25.5 0.0 29.2 23.9 21.8 0.0 26.9
15
Lanjutan Metode ZCZ dengan 8 zona Karakter 0 1 2 3 4 5 6 7 8 9
6.652 8.321 8.629 8.279 6.861 6.800 4.817 4.470 6.870 7.194
6.780 6.489 3.508 1.499 5.804 6.953 3.597 9.949 6.793 5.031
Data Hasil Ekstraksi Ciri 4.759 4.566 4.767 4.813 0.000 4.856 5.008 5.360 6.083 4.586 6.008 5.791 7.509 8.289 8.799 4.593 4.686 4.633 4.920 6.178 6.110 5.380 8.369 7.397 4.319 4.180 6.675 4.750 5.739 6.245
4.643 7.682 10.308 8.276 7.772 4.744 8.276 6.001 4.263 8.662
6.674 7.952 7.353 7.274 5.107 8.349 8.023 9.195 8.373 7.986
6.797 7.190 7.786 6.458 0.000 8.258 6.484 5.056 3.928 6.545
Metode ZCZ dengan 12 zona Karakter 0 1 2 3 4 5 6 7 8 9
4.53 6.10 5.61 5.82 4.72 6.22 2.49 2.35 4.08 5.12
5.78 6.25 5.24 4.57 6.31 8.78 6.33 6.43 4.61 6.44
4.62 4.35 0.00 0.00 4.12 6.21 1.70 4.76 5.68 3.32
4.76 4.06 2.77 3.64 4.19 4.56 4.17 3.78 1.12 4.07
Data Hasil Ekstraksi Ciri 0.00 4.57 4.77 0.00 3.47 0.00 4.82 3.50 5.09 0.00 4.51 5.59 5.33 4.93 4.51 5.05 5.44 6.69 5.14 5.91 7.19 4.60 4.63 0.00 5.68 4.93 4.92 4.76 5.87 4.37 4.22 4.67 6.08 3.83 5.60 8.18 4.56 4.74 4.71 4.77
4.64 5.88 5.18 5.44 4.51 4.74 5.87 4.17 2.46 5.34
4.48 5.78 5.40 5.26 3.55 5.99 5.87 5.24 6.70 5.78
5.79 5.78 5.78 6.33 4.27 5.78 6.33 6.47 5.85 6.35
4.63 5.09 5.59 4.60 0.00 5.94 4.63 3.41 0.00 4.56
16
Lamp iran 3 Hasil akurasi keseluruhan untuk data hasil ekstraksi ciri gabungan ICZ dan ZCZ dengan ju mlah zona 12 berdasarkan jenis kernel yang digunakan Kernel Linear 1 99.25%
2 99.25%
3 99.75%
Percobaan ke4 5 99.75% 99.75%
6 99.75%
7 99.75%
8 99.75%
3 99.75%
Percobaan ke4 5 99.75% 99.75%
6 99.75%
7 99.75%
8 99.75%
Kernel Quadratic 1 99.75%
2 99.75%
Kernel Polino mial Derajat 3 4 5 6
1 99.75% 99.25% 94.50% 64.00%
2 99.75% 99.25% 94.50% 64.00%
3 99.75% 99.25% 94.50% 64.00%
Percobaan ke4 5 99.75% 99.75% 99.25% 99.25% 94.50% 94.50% 64.00% 64.00%
6 99.75% 99.25% 94.50% 64.00%
7 99.75% 99.25% 94.50% 64.00%
3 99.00% 99.25% 99.75% 99.25% 97.25% 87.75% 86.00% 91.25% 91.75% 91.75%
Percobaan ke4 5 99.00% 99.00% 99.25% 99.25% 99.75% 99.75% 99.25% 99.25% 99.25% 99.25% 92.75% 95.25% 83.75% 85.75% 90.75% 82.75% 91.75% 91.25% 91.75% 91.75%
6 99.00% 99.25% 99.75% 99.75% 99.25% 95.75% 89.00% 83.75% 90.75% 91.75%
7 99.00% 99.25% 99.75% 99.75% 99.25% 97.75% 90.00% 84.50% 82.00% 91.25%
8 99.75% 99.25% 94.50% 64.00%
Kernel RBF Sig ma 0.5 1 2 4 8 16 32 64 128 256
1 99.00% 99.25% 99.50% 99.75% 95.50% 90.50% 92.25% 91.75% 91.75% 91.75%
2 99.00% 99.25% 99.50% 99.50% 96.50% 86.75% 90.75% 91.75% 91.75% 91.75%
8 99.00% 99.25% 99.75% 99.75% 99.25% 99.25% 94.75% 88.50% 83.75% 90.75%
17
Lamp iran 4 Tabel akurasi untuk hasil klasifikasi terbaik dari setiap fungsi kernel yang digunakan Kernel Linear No
Kelas Asli
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54
1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27
Fold 1 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1 12 1 13 1 13 1 14 1 14 1 15 1 15 1 16 1 16 1 17 1 17 1 18 1 18 1 19 1 19 1 20 1 20 1 21 1 21 1 22 1 22 1 23 1 23 1 24 1 24 1 25 1 25 1 26 1 26 1 27 1 27 1
Fold 2 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 19 0 10 1 10 1 11 1 11 1 12 1 12 1 13 1 13 1 14 1 14 1 15 1 15 1 16 1 16 1 17 1 17 1 18 1 18 1 19 1 19 1 20 1 20 1 21 1 21 1 22 1 22 1 23 1 23 1 24 1 24 1 25 1 25 1 26 1 26 1 27 1 27 1
Fold 3 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1 12 1 13 1 13 1 14 1 14 1 15 1 15 1 16 1 16 1 17 1 17 1 18 1 18 1 19 1 19 1 20 1 20 1 21 1 21 1 22 1 22 1 23 1 23 1 24 1 24 1 25 1 25 1 26 1 26 1 27 1 27 1
Fold 4 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1 12 1 13 1 13 1 14 1 14 1 15 1 15 1 16 1 16 1 17 1 17 1 18 1 18 1 19 1 19 1 20 1 20 1 21 1 21 1 22 1 22 1 23 1 23 1 24 1 24 1 25 1 25 1 26 1 26 1 27 1 27 1
Fold 5 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1 12 1 13 1 13 1 14 1 14 1 15 1 15 1 16 1 16 1 17 1 17 1 18 1 18 1 19 1 19 1 20 1 20 1 21 1 21 1 22 1 22 1 23 1 23 1 24 1 24 1 25 1 25 1 26 1 26 1 27 1 27 1
18
Lanjutan 55 28 56 28 57 29 58 29 59 30 60 30 61 31 62 31 63 32 64 32 65 33 66 33 67 34 68 34 69 35 70 35 71 36 72 36 73 37 74 37 75 38 76 38 77 39 78 39 79 40 80 40 Jumlah benar Akurasi Akurasi rata2
28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
80 100.00%
79 98.75%
80 100.00% 99.75%
80 100.00%
80 100.00%
Fold 1 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1
Fold 2 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 19 0 10 1 10 1 11 1 11 1 12 1
Fold 3 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1
Fold 4 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1
Fold 5 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1
Kernel Quadratic No
Kelas Asli
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12
19
Lanjutan 24 12 25 13 26 13 27 14 28 14 29 15 30 15 31 16 32 16 33 17 34 17 35 18 36 18 37 19 38 19 39 20 40 20 41 21 42 21 43 22 44 22 45 23 46 23 47 24 48 24 49 25 50 25 51 26 52 26 53 27 54 27 55 28 56 28 57 29 58 29 59 30 60 30 61 31 62 31 63 32 64 32 65 33 66 33 67 34 68 34 69 35 70 35 71 36 72 36 73 37 74 37 75 38 76 38 77 39 78 39 79 40 80 40 Jumlah benar
12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 80
12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 79
12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 80
12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 80
12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 80
20
Lanjutan Akurasi Akurasi rata2
100.00%
98.75%
100.00% 99.75%
100.00%
100.00%
Kernel Polino mial No
Kelas Asli
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25
Fold 1 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1 12 1 13 1 13 1 14 1 14 1 15 1 15 1 16 1 16 1 17 1 17 1 18 1 18 1 19 1 19 1 20 1 20 1 21 1 21 1 22 1 22 1 23 1 23 1 24 1 24 1 25 1 25 1
Fold 2 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 19 0 10 1 10 1 11 1 11 1 12 1 12 1 13 1 13 1 14 1 14 1 15 1 15 1 16 1 16 1 17 1 17 1 18 1 18 1 19 1 19 1 20 1 20 1 21 1 21 1 22 1 22 1 23 1 23 1 24 1 24 1 25 1 25 1
Fold 3 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1 12 1 13 1 13 1 14 1 14 1 15 1 15 1 16 1 16 1 17 1 17 1 18 1 18 1 19 1 19 1 20 1 20 1 21 1 21 1 22 1 22 1 23 1 23 1 24 1 24 1 25 1 25 1
Fold 4 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1 12 1 13 1 13 1 14 1 14 1 15 1 15 1 16 1 16 1 17 1 17 1 18 1 18 1 19 1 19 1 20 1 20 1 21 1 21 1 22 1 22 1 23 1 23 1 24 1 24 1 25 1 25 1
Fold 5 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1 10 1 11 1 11 1 12 1 12 1 13 1 13 1 14 1 14 1 15 1 15 1 16 1 16 1 17 1 17 1 18 1 18 1 19 1 19 1 20 1 20 1 21 1 21 1 22 1 22 1 23 1 23 1 24 1 24 1 25 1 25 1
21
Lanjutan 51 26 52 26 53 27 54 27 55 28 56 28 57 29 58 29 59 30 60 30 61 31 62 31 63 32 64 32 65 33 66 33 67 34 68 34 69 35 70 35 71 36 72 36 73 37 74 37 75 38 76 38 77 39 78 39 79 40 80 40 Jumlah benar Akurasi Akurasi rata2
26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39 39 40 40
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
80 100.00%
79 98.75%
80 100.00% 99.75%
80 100.00%
80 100.00%
Fold 1 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1
Fold 2 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 19 0 10 1
Fold 3 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1
Fold 4 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1
Fold 5 Hasil Sama? 1 1 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 1 6 1 6 1 7 1 7 1 8 1 8 1 9 1 9 1 10 1
Kernel RBF No
Kelas Asli
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10
22
Lanjutan 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77
10 11 11 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39
10 11 11 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
10 11 11 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
10 11 11 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
10 11 11 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
10 11 11 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 31 31 32 32 33 33 34 34 35 35 36 36 37 37 38 38 39
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
23
Lanjutan 78 39 79 40 80 40 Jumlah benar Akurasi Akurasi rata2
39 40 40
1 1 1 80 100.00%
39 40 40
1 1 1 79 98.75%
39 40 40
1 1 1 80 100.00% 99.75%
39 40 40
1 1 1 80 100.00%
39 40 40
1 1 1 80 100.00%
Keterangan: Dari keempat tabel akurasi tersebut, kesalahan klasifikasi terjadi pada data yang sama, yaitu pada data uji ke 18 pada fold kedua. Seharusnya data tersebut masuk ke dalam kelas 9, akan tetapi hasil klasifikasi membuat data tersebut masuk ke dalam kelas 19.