ANALISIS GRAFOLOGI BERDASARKAN HURUF a DAN t MENGGUNAKAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK
JILLY PRATIWI
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
ABSTRACT JILLY PRATIWI. Graphology Analysis Based on Letter a and t Using Backpropagation Neural Network (BPNN). Under the supervision of AZIZ KUSTIYO. Graphology or handwriting analysis is a method of identifying, analysing, evaluating, and understanding personality through the strokes and patterns revealed by handwriting. People who can analyze handwriting called graphologist. Graphologist can have a subjective assesment. Different graphologist can analyze the same handwriting but give different results. In addition, the accuracy of handwriting analysis depend on the graphologists ability. A system that can recognize handwrititng patterns is required to overcome these problems. Identification system which is implemented in this research uses Backpropagation Neural Network (BPNN). This research used 135 images of letter a and 150 images of letter t. This research is divided into three parts which are determining optimal combination of BPNN parameter, identifying personality based on letter a, and identifying personality based on letter t then classifies them into one of three character classes available. The results of this research is that the system has 98.15% accuracy for letter a and 73.33% for letter t. The result shows that Backpropagation Neural Network can be used to classify the personality.
Keyword : Backpropagation Neural Network, Graphology, Personality Analysis.
ANALISIS GRAFOLOGI BERDASARKAN HURUF a DAN t MENGGUNAKAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK
JILLY PRATIWI
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
Judul : Analisis Grafologi Berdasarkan Huruf a dan t Menggunakan Jaringan Syaraf Tiruan Propagasi Balik Standar Nama : Jilly Pratiwi NRP : G64070119
Menyetujui:
Pembimbing,
Aziz Kustiyo, S.Si, M.Kom NIP.19700719 199802 1 001
Mengetahui: Ketua Departemen Ilmu Komputer
Dr.Ir. Sri Nurdiati, M.Sc NIP.19601126 198601 2 001
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kepada Allah SWT yang telah mencurahkan rahmat dan karunia-NYA sehingga penulis dapat menyelesaikan tugas akhir dengan judul Analisis Grafologi Berdasarkan Huruf a dan t Menggunakan Jaringan Syaraf Tiruan Propagasi Balik. Salawat dan salam semoga tetap tercurahkan kepada junjungan nabi besar Muhammad SAW. Penulis mengucapkan terima kasih kepada semua pihak yang telah membantu dalam penyelesaian tugas akhir ini, yaitu: 1 Kedua Orang Tua tercinta (S.Pudji Hartono dan Lili Aprianti), adik-adik tersayang (Bella Pertiwi dan Gilang Syahwalri), serta keluarga besar penulis yang selalu memberikan dukungan moril dan materil, perhatian, kasih sayang dan doa kepada penulis. 2 Bapak Aziz Kustiyo, S.Si, M.Kom selaku dosen pembimbing. 3 Dosen penguji Bapak Sony Hartono Wijaya, S.Kom, M.Kom dan Bapak Dr.Ir Agus Buono, M.Si, M.Kom. 4 Fitri Kusuma Dewi, S.Hut dan Mugi Rahayu, S.Psi sebagai grafologis dan psikolog yang telah memberikan arahan dan masukan sehingga selesainya skripsi ini. 5 Teman-teman kelompok grafologist, Amanda, Fazariah, dan Fauzan. 6 Seluruh staf pengajar dan pegawai Departemen Ilmu Komputer. 7 Keluarga besar ilkomerz 44. 8 Semua pihak yang telah membantu pelaksanaan tugas akhir ini baik secara langsung maupun tidak langsung. Penulis menyadari dalam tugas akhir ini masih banyak kekurangan. Oleh karena itu, penulis mengharapkan kritik dan saran yang membangun. Penulis berharap semoga tulisan ini dapat bermanfaat bagi seluruh pihak.
Bogor, Agustus 2011
Jilly Pratiwi
RIWAYAT HIDUP Penulis dilahirkan di Bogor pada tanggal 10 Agustus 1988 sebagai anak pertama dari tiga bersaudara dari ayah yang bernama S. Pudji Hartono dan ibu yang bernama Lili Aprianti. Pada tahun 2007 penulis lulus dari Sekolah Menengah Analis Kimia Bogor (SMAKBO). Sewaktu menjadi siswa di SMAKBO, penulis pernah mengikuti Praktik Kerja Lapangan di Balai Besar Industri Agro (BBIA) Bogor selama dua bulan pada tahun 2007. Penulis diterima di Institut Pertanian Bogor pada Program Studi Ilmu Komputer Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor pada tahun 2007.
DAFTAR ISI Halaman DAFTAR TABEL .................................................................................................................... viii DAFTAR GAMBAR ................................................................................................................ viii DAFTAR LAMPIRAN ............................................................................................................. viii PENDAHULUAN ....................................................................................................................... 1 Latar Belakang ....................................................................................................................... 1 Tujuan Penelitian ................................................................................................................... 1 Ruang Lingkup Penelitian....................................................................................................... 1 Manfaat Penelitian.................................................................................................................. 1 TINJAUAN PUSTAKA .............................................................................................................. 1 Grafologi................................................................................................................................ 1 Grafologi Huruf a dan Huruf t .............................................................................................. 2 Citra Digital ........................................................................................................................... 3 Jaringan Syaraf Tiruan Propagasi Balik................................................................................... 4 METODE PENELITIAN ............................................................................................................. 5 Data Penelitian ....................................................................................................................... 5 Praproses Data ....................................................................................................................... 5 Pelatihan Jaringan Syaraf Tiruan............................................................................................. 6 Pengujian Jaringan Syaraf Tiruan ........................................................................................... 6 Lingkungan Pengembangan Sistem......................................................................................... 7 HASIL DAN PEMBAHASAN .................................................................................................... 7 Menentukan Parameter JST yang Optimal............................................................................... 7 Pengaruh Jumlah Hidden Neuron terhadap Generalisasi .......................................................... 7 Pengaruh Jumlah Epoch Terhadap Generalisasi....................................................................... 7 Pengaruh Galat Terhadap Generalisasi .................................................................................... 8 Pengaruh Learning Rate Terhadap Generalisasi ...................................................................... 9 Pengenalan Karakter Berdasarkan Huruf a .............................................................................. 9 Pengenalan Karakter Berdasarkan Huruf t ............................................................................. 11 KESIMPULAN DAN SARAN .................................................................................................. 13 Kesimpulan .......................................................................................................................... 13 Saran.................................................................................................................................... 13 DAFTAR PUSTAKA ................................................................................................................ 13 LAMPIRAN .............................................................................................................................. 15
vii
DAFTAR TABEL Halaman 1 Bentuk dan deskripsi karakter huruf a...................................................................................... 2 2 Bentuk dan deskripsi karakter huruf t ...................................................................................... 3 3 Karakteristik JST yang digunakan ........................................................................................... 6 4 Definisi kelas target huruf a .................................................................................................... 6 5 Definisi kelas target huruf t ..................................................................................................... 6 6 Jumlah hidden neuron dengan generalisasi rata-ratanya ........................................................... 7 7 Generalisasi rata-rata menggunakan 10 dan 20 hidden neuron .................................................. 8 8 Pengaruh galat terhadap generalisasi rata-rata .......................................................................... 9 9 Pengaruh learning rate terhadap generalisasi ........................................................................... 9 10 Parameter optimal JST propagasi balik .................................................................................... 9 11 Bentuk huruf a yang dianalisis .............................................................................................. 10 12 Hasil pengujian huruf a percobaan pertama ........................................................................... 10 13 Kesalahan klasifikasi data uji huruf a percobaan pertama ....................................................... 10 14 Hasil pengujian huruf a percobaan kedua............................................................................... 10 15 Hasil Pengujian huruf a percobaan ketiga .............................................................................. 11 16 Bentuk huruf t yang dianalisis ............................................................................................... 11 17 Hasil pengujian data uji huruf t percobaan pertama ................................................................ 11 18 Kesalahan klasifikasi data uji huruf t percobaan pertama........................................................ 12 19 Hasil pengujian data uji huruf t percobaan kedua ................................................................... 12
DAFTAR GAMBAR Halaman 1 2 3 4 5 6 7 8 9
Representasi citra digital. ......................................................................................................... 4 Model JST propagasi balik. ...................................................................................................... 4 Tahapan pengenalan karakter. .................................................................................................. 6 Pengaruh hidden neuron terhadap generalisasi. ......................................................................... 7 Generalisasi rata-rata terhadap jumlah epoch menggunakan 10 dan 20 hidden neuron. .............. 8 Pengaruh galat terhadap generalisasi rata-rata. .......................................................................... 8 Grafik pengaruh learning rate dengan galat 10-3 terhadap generalisasi. ..................................... 9 Ilustrasi pengambilan data latih dan data uji baru secara acak.................................................. 10 Ilustrasi pengambilan data latih dan data uji baru huruf t. ........................................................ 12
DAFTAR LAMPIRAN Halaman 1 Algoritme Jaringan Syaraf Tiruan Propagasi Balik Standar .................................................... 16 2 Data Penelitian...................................................................................................................... 18 3 Arsitektur Jaringan Syaraf Tiruan Propagasi Balik ................................................................. 23 4 Pengaruh jumlah hidden neuron terhadap generalisasi ........................................................... 24 5 Pengaruh jumlah epoch dengan 10 hidden neuron terhadap generalisasi ................................. 25 6 Pengaruh jumlah epoch dengan 20 hidden neuron terhadap generalisasi ................................. 26 7 Pengaruh galat terhadap generalisasi ..................................................................................... 27 8 Pengaruh learning rate terhadap generalisasi ......................................................................... 28 9 Kesalahan klasifikasi data uji huruf a pada percobaan kedua .................................................. 29 10 Kesalahan klasifikasi data uji huruf a pada percobaan ketiga.................................................. 30 11 Kesalahan klasifikasi data uji huruf t percobaan pertama........................................................ 31 12 Kesalahan klasifikasi data uji huruf t percobaan kedua ........................................................... 32
viii
PENDAHULUAN Latar Belakang Grafologi adalah ilmu yang mempelajari, mengidentifikasi, menganalisis, dan mengetahui karakter seseorang melalui tulisan tangannya. Orang yang dapat menganalisis tulisan tangan disebut grafologist. Menurut (Mutalib, et al. 2008) analisis tulisan tangan telah banyak digunakan dalam berbagai bidang di antaranya seleksi calon pegawai, kriminalogi, tumbuh kembang anak, seleksi pasangan hidup (life partner), seleksi rekan kerja, dan konseling. Selain itu, diterapkan juga dalam bidang kesehatan dan pendidikan. Grafologist dapat memiliki penilaian yang subjektif. Grafologist yang berbeda dapat menganalisis tulisan tangan yang sama tetapi memberikan hasil yang berbeda (Galbraith 1964 & Guest 1994, diacu dalam Sheikholeslami et al). Selain itu, keakuratan hasil analisis tulisan tangan bergantung pada kemampuan grafologist itu sendiri dalam menganalisis tulisan tangan (Champa & Kumar 2010). Oleh karena itu, untuk mengatasi permasalahan subjektifitas tersebut dan membantu grafologist dalam menganalisis tulisan tangan diperlukan suatu pemanfaatan teknologi komputer yang dapat menerapkan ilmu grafologi. Pada penelitian (Mutalib et al. 2007) dilakukan analisis grafologi berdasarkan parameter huruf t menggunakan jaringan syaraf tiruan propagasi balik. Percobaan dalam penelitian ini dibagi menjadi dua yaitu pengenalan huruf t dan pengenalan karakter seseorang berdasarkan huruf t. Input dalam penelitian ini merupakan citra tulisan tangan dan output yang dihasilkan berupa pengenalan huruf t dan karakter seseorang berdasarkan penulisan huruf t orang tersebut. Penelitian ini menunjukkan bahwa jaringan syaraf tiruan propagasi balik dapat digunakan untuk mengklasifikasikan huruf t dan karakter seseorang berdasarkan huruf t dengan hasil yang cukup baik yaitu sebesar 90.27% dan 60%. Berdasarkan pada penelitian (Mutalib 2007), pengenalan pola menggunakan jaringan syaraf tiruan propagasi balik menunjukkan hasil yang cukup baik. Oleh karena itu, pada penelitian ini akan dilakukan analisis grafologi menggunakan jaringan syaraf tiruan propagasi balik. Huruf a merupakan salah satu huruf yang dapat menggambarkan cara berkomunikasi
seseorang dan huruf t dapat menggambarkan motivasi dan ambisi seseorang. Kedua huruf ini dapat mendeskripsikan karakter seseorang dalam hal berkomunikasi dan motivasi. Cara berkomunikasi seseorang dan motivasinya merupakan hal yang cukup penting dalam berbagai bidang terutama dalam penerimaan calon pegawai. Oleh karena itu, dalam penelitian ini akan dianalisis karakter seseorang berdasarkan huruf a dan t kecil. Tujuan Penelitian Tujuan penelitian ini adalah mengimplementasikan jaringan syaraf tiruan propagasi balik dalam mengenali karakter seseorang melalui tulisan tangannya. Ruang Lingkup Penelitian Ruang lingkup dalam penelitian ini yaitu: 1 Analisis grafologi yang dilakukan hanya berdasarkan pada huruf a dan t kecil. Pada penelitian ini tidak dilakukan pengenalan terhadap huruf a dan t, sehingga citra huruf a dan t yang digunakan harus dipotong (cropping) secara manual. 2 Input yang digunakan yaitu citra tulisan tangan huruf a dan t kecil berukuran 40x40 piksel dan berformat JPG. 3 Output hasil analisis masing-masing dikelompokkan ke dalam tiga kelas karakter sesuai bentuk huruf a dan t kecil. 4 Dalam penelitian ini huruf a dan t yang digunakan masing-masing hanya tiga kelas. Huruf a terdiri atas a balok, a terbuka di atas, dan a tertutup. Huruf t terdiri atas t lurus, t naik, t turun. Manfaat Penelitian Manfaat penelitian ini adalah mendapatkan informasi mengenai karakter seseorang sehingga diharapkan dapat membantu pekerjaan grafologist dalam menganalisis tulisan tangan. TINJAUAN PUSTAKA Grafologi Kata grafologi merupakan gabungan kata yang berasal dari Yunani yaitu grapheirt yang artinya menulis dan ology yang berarti cabang dari ilmu pengetahuan. Jadi grafologi adalah ilmu tulisan tangan berdasarkan pada perkembangan ilmu pengetahuan yang secara tetap diuji dalam penggunaan praktik. Ilmu ini merupakan ilmu yang berkesinambungan,
1
terus berkembang, terkodesifikasi.
dan
bukan
sistem
Sangat memungkinkan untuk memahami dan mengetahui karakter menggunakan pendekatan berbeda terhadap bentuk asli yang spesifik, seperti bidang medis dan psikologi yang dapat memperoleh hasil yang sama walaupun berawal dari posisi yang berbeda satu sama lain. Seperti halnya bidang medis, grafologi juga menggabungkan dan mensintesiskan informasi yang membutuhkan pelatihan dan penilaian dalam aplikasinya. Secara dinamis, grafologi memiliki cakupan yang luas. Ilmu ini juga diterapkan sebagai alat diagnostik tambahan oleh psikolog dan psikiater (Amend & Ruiz 1980). Menurut (Robert 2002) pada abad ke 17 Alerius Prosper dan Camilla Baldo berpendapat bahwa ada hubungan antara tulisan tangan dengan kepribadian. Pada abad ke 19, Abbot Jean Hippolyte Michon dan Abbot Flandrin mengumpulkan contoh-contoh tulisan tangan dan mencocokkan gaya tulisan tangan dengan berbagai macam kepribadian yang akhirnya ilmu ini disebut grafologi. Sekarang ini ilmu grafologi digunakan secara luas dalam berbagai bidang contohnya dalam bisnis, kepolisian, pada bidang penerimaan calon pegawai, bahkan dalam mencari partner. Grafologi sangat efektif untuk mengamati respon alam bawah sadar karena bentuk tulisan tangan merupakan alat ukur yang tidak dapat berbohong. Sama halnya dengan komputer, tulisan tangan merupakan hasil print out dari format berfikir seseorang.
2 Kelompok pembelajaran dan evaluasi terdiri atas huruf Y, y, U, u, W, w, V, v. 3 Kelompok penghargaan dan ekspresi terdiri atas huruf M, m, N, n, H, h. 4 Kelompok pemahaman terdiri atas huruf L, l, E, e, I, i, J, j. 5 Kelompok kreativitas terapan terdiri atas F, f, R,r, S, s. 6 Kelompok status terdiri atas huruf T, t, K, k, B, b. 7 Kelompok memercayai dan otoritas dalam diri terdiri atas huruf C, c, X, x. 8 Kelompok kepuasan diri yaitu huruf Z, z. Huruf a merupakan salah satu huruf kelompok komunikasi. Huruf a merupakan huruf pertama dalam hampir semua alfabet fonetik. Dalam tulisan tangan, huruf a melambangkan ekspresi ego seseorang dalam kehidupan sehari-hari dan derajat sensitivitas atau kenyamanan terhadap citra diri. Huruf a adalah kepala kelompok komunikasi karena berasal dari ego yang dibentuk oleh citra diri. Berdasarkan huruf a ini dapat dilihat cara bertindak, bereaksi, dan berinteraksi seseorang. Menurut (Baggett 1993) bentuk huruf a terbagi dalam beberapa bentuk dan setiap bentuk menggambarkan karakter yang berbeda-beda. Bentuk dan deskripsi karakter tersebut dapat dilihat pada Tabel 1. Tabel 1 Bentuk dan deskripsi karakter huruf a Gambar
Nama
Deskripsi
a balok
Huruf a kecil seperti ini mengindikasikan individu yang cenderung tertarik pada kegiatan yang berhubungan dengan seni, musik, budaya, dan sastra. Huruf a terbuka di atas menunjukkan individu yang fasih berbicara dalam mengemukakan ide atau pendapat, cenderung dermawan, jujur dan tulus.
(Desire of culture)
Grafologi Huruf a dan Huruf t Menurut (Rodgers 1993) grafologi disebut juga analisis tulisan tangan merupakan ilmu yang mengorelasikan pola-pola tulisan tangan dengan kepribadian seseorang. Analisis grafologi tidak hanya dilihat dari parameterparameter seperti baseline, slant, margin, dan parameter lainnya tetapi analisis grafologi juga dilakukan terhadap huruf-huruf alfabet spesifik yang dikelompokkan menjadi kelompok alfabet. Setiap huruf adalah pernyataan tersendiri dari sikap yang membentuk citra diri. Kelompok alfabet tersebut dibagi menjadi delapan kelompok. Kedelapan kelompok tersebut adalah:
a terbuka di atas (Talkative)
1 Kelompok komunikasi yang terdiri atas huruf A, a, O, o, D, d, G, g, Q, q, P, p.
2
a tertutup rapat tanpa loop (Frankness)
a dengan loop dikiri dan dikanan (Lying)
a dengan stringer hook (Need a challenge)
a dengan loop di sisi kiri dalam (Self deceit)
Huruf a kecil yang tertutup rapat mengindikasikan individu yang cenderung tertutup. Individu ini akan jujur dan terus terang jika ditanya mengenai pendapatnya, berbeda dengan huruf a terbuka di atas yang jujur dalam mengemukakan pendapat secara sukarela tanpa diminta. Individu yang cenderung suka berbohong secara patologis. Orang yang sulit dipercaya. Individu ini cenderung sangat suka tantangan, dan cenderung akan bosan jika merasa terkontrol dalam suatu hubungan. Individu yang cenderung menipu dirinya sendiri tentang sesuatu yang terjadi pada dirinya. Orang yang suka lari dalam menghadapi masalah.
Menurut (Rodgers 1993) huruf t dapat menggambarkan sikap seseorang terhadap suatu profesi, terhadap citra diri yang ditampilkan, dan merupakan huruf penghargaan pada nilai diri dan harga diri. Huruf t juga menggambarkan antusiasme, keteguhan hati, dan motivasi. Menurut (Amend & Ruiz 1980) huruf t dapat merefleksikan kekuatan kemauan dan dorongan pribadi yang diekspresikan dalam hidupnya. Berdasarkan huruf t juga dapat dilihat ambisi seseorang. Bar dari huruf t
dapat merefleksikan sikap perilaku seseorang pada suatu waktu terhadap pemikiran karir dan juga harapan. Terdapat sekitar 50 jenis gaya penulisan huruf t kecil, tetapi yang akan digunakan dalam penelitian ini hanya 3 jenis. Bentuk dan deskripsi karakter huruf t tersebut dapat dilihat pada Tabel 2. Tabel 2 Bentuk dan deskripsi karakter huruf t t-bars
Deskripsi
Ambisi
Horizontal
t-bar yang horizontal menunjukkan individu yang tenang dan dapat mengendalikan diri dalam berfikir dan bertindak.
Balanced, Terkontrol
UpTurned
t-bar yang naik menunjukkan individu yang optimis, dinamis, dan termotivasi. Selain itu, menggambarkan pribadi yang bersemangat, percaya diri, dan antusias.
Dinamis, Optimis, Termotivasi
DownTurned
t-bar yang menurun menunjukkan individu yang suka bergantung pada orang lain, mudah putus asa dan pasrah.
Pesimis, Kurang termotivasi.
Citra Digital Menurut (Gonzales & Wood 2002) image atau citra dapat didefinisikan sebagai fungsi dua dimensi f(x,y), dimana x dan y adalah koordinat spasial. Nilai f pada setiap titik (x,y) menunjukkan tingkat intensitas keabuan (gray level) citra pada titik tersebut. Ketika x ,y dan nilai f semuanya adalah finite dan kuantitas diskret maka citra itu disebut citra digital. Citra digital dapat berupa citra dalam skala keabuan (grayscale) atau berwarna. Citra digital direpresentasikan dalam bentuk matriks berukuran m x n dimana m menunjukkan baris dan n menunjukkan
3
kolom, contoh matriks citra digital dapat dilihat pada Gambar 1. f(x,y) =
đ(đ, đ) ⯠⎠⹠đ(đ, đ) âŻ
đ(đ, đ) ⎠đ(đ, đ)
Gambar 1 Representasi citra digital Setiap elemen matriks menunjukkan nilai piksel. Suatu citra digital berformat grayscale 8 bit memiliki 256 intensitas warna pada setiap pikselnya. Nilai piksel tersebut berkisar antara 0 sampai 255, 0 menunjukkan intensitas paling gelap dan 255 menunjukkan intensitas yang paling terang. Citra tulisan tangan yang direpresentasikan sebagai matriks m x n, dikonversi menjadi vektor kolom yang disebut vektor citra. Transpose dari vektor citra tersebut adalah f(x,y)T = [f(1,1) f(2,1)âŚf(1,n) f(2,n)âŚf(m,n)] Jaringan Syaraf Tiruan Propagasi Balik Menurut (Fauset 1994) jaringan syaraf tiruan adalah suatu sistem pemrosesan informasi yang memiliki karakteristik tertentu seperti jaringan syaraf biologis. Jaringan syaraf tiruan telah dikembangkan sebagai generalisasi model matematika dari syaraf biologis manusia. Jaringan syaraf tiruan propagasi balik merupakan algoritme pembelajaran yang terawasi (supervised learning) dan biasanya digunakan oleh jaringan multilayer untuk mengubah bobot yang terhubung dengan semua neuron pada hidden layer. Jaringan syaraf tiruan propagasi balik dikembangkan oleh Rumelhart, Hinton, dan Williams pada tahun 1986an. Propagasi balik merupakan metode pembelajaran yang efektif untuk jaringan multilayer. Prinsip dasar algoritme propagasi balik terdiri atas tiga fase, yaitu: 1 Fase feed forward Fase ini merupakan fase untuk penghitungan nilai aktivasi. Setiap neuron pada hidden layer dan output layer menghitung masing-masing nilai aktivasinya sesuai dengan fungsi aktivasi yang digunakan. 2 Fase kalkulasi dan backpropagation error (propagasi balik galat) Setiap output neuron menghitung informasi galat antara nilai output yang dihasilkan dan nilai target. Informasi galat ini dikirimkan ke layer di bawahnya. 3 Fase penyesuaian bobot
Setiap output neuron dan hidden neuron mengubah bias dan bobot-bobotnya sesuai dengan nilai galat. Secara umum propagasi balik membutuhkan waktu pembelajaran yang lama, tetapi setelah pembelajaran selesai maka aplikasinya akan memberikan output yang cepat. Jaringan syaraf tiruan propagasi balik memiliki karakteristik di antaranya: 1 Jaringan multilayer Arsitektur yang digunakan adalah jaringan multilayer, yaitu satu input layer, satu output layer, dan satu atau lebih hidden layer. Setiap neuron pada suatu layer dalam jaringan propagasi balik mendapat sinyal input dari semua neuron pada layer sebelumnya beserta satu sinyal bias. 2 Fungsi aktivasi Fungsi aktivasi untuk backpropagation harus memiliki beberapa karakteristik penting, yaitu harus kontinu, differentiable (berbeda), dan tidak turun. Fungsi aktivasi yang umum digunakan pada jaringan syaraf tiruan (JST) propagasi balik adalah: a. Fungsi Sigmoid biner outputnya memiliki rentang (0,1) 1 đŚ=đ đĽ = 1 + đ âđđĽ dengan fâ = ďł f(x) [1 - f(x)] b. Fungsi Sigmoid bipolar memiliki rentang (-1,1) đŚ=đ đĽ = dengan fâ(x) =
đ 2
outputnya
1 â đ âđĽ 1 + đ âđĽ
[1 + f(x)][1 â f(x)]
Model jaringan syaraf tiruan (JST) propagasi balik dengan satu hidden layer dapat dilihat pada Gambar 2.
Gambar 2 Model JST propagasi balik Sumber: (Fauset 1994)
4
Input layer pada Gambar 2 ditunjukkan dengan unit-unit Xi sedangkan hidden layer dan output layer masing-masing ditunjukkan dengan unit-unit Zj dan Yi. Neuron-neuron pada layer yang sama tidak saling berhubungan, tetapi pada layer berbeda saling berhubungan. Input layer berfungsi untuk meneruskan sinyal dan tidak melakukan komputasi, sedangkan hidden layer dan output layer melakukan proses komputasi. Selama fase feedforward, setiap unit input Xi menerima sinyal input dan meneruskan sinyal ke setiap unit hidden layer Zi,âŚ,Zp. Setiap unit hidden lalu menghitung aktivasinya dan mengirimkan sinyal ke setiap unit output. Setiap unit output Yi menghitung aktivasinya untuk membentuk respon ke jaringan untuk memberi pola input. Sebelum proses pelatihan dilakukan, inisialisasi bobot awal merupakan hal yang penting karena nilai bobot awal sangat mempengaruhi kinerja jaringan. Inisialisasi bobot awal dapat dilakukan menggunakan metode Nguyen-Widrow. Metode NguyenWidrow dilakukan dengan menentukan faktor pengali terlebih dahulu yang didefinisikan sebagai berikut: đ˝ = 0.7(đ)1/đ , dengan: n = jumlah unit input p = jumlah unit tersembunyi (hidden)
METODE PENELITIAN Pada penelitian ini dilakukan tiga kali percobaan. Percobaan pertama adalah mencari parameter-parameter JST propagasi balik yang optimal. Percobaan kedua adalah pengenalan karakter berdasarkan huruf a dan percobaan ketiga dilakukan pengenalan karakter berdasarkan huruf t. Data Penelitian Data awal didapat dari 57 responden yang masing-masing menuliskan suatu kalimat yang telah ditentukan pada kertas berukuran 10,5 x 7 cm. Kalimat yang dituliskan oleh responden dapat dilihat pada Lampiran 2. Setelah itu, data tulisan tangan diubah menjadi citra digital menggunakan scanner dan disimpan sebagai satu file citra, sehingga diperoleh data citra tulisan tangan sebanyak 57 data. Data tersebut dibagi menjadi 27 data untuk huruf a dan 30 data untuk huruf t. Data citra tulisan tangan selengkapnya dapat dilihat pada Lampiran 2. Huruf a terdiri atas tiga kelas yaitu kelas 1 terdiri atas 7 data, kelas 2 dan kelas 3 terdiri atas 10 data. Dari masing-masing data setiap kelas akan diambil huruf a sebanyak lima citra. Lima citra huruf a dari setiap kelas akan dibagi menjadi 3 citra untuk data latih dan 2 citra untuk data uji, sehingga diperoleh total data latih sebanyak 81 citra dan data uji sebanyak 54 citra.
dengan:
Huruf t terdiri atas tiga kelas, masingmasing kelas terdiri atas 10 data. Dari masingmasing data setiap kelas akan diambil huruf t sebanyak lima citra. Lima citra huruf t dari setiap kelas akan dibagi menjadi 3 citra untuk data latih dan 2 citra untuk data uji, sehingga diperoleh total data latih sebanyak 90 citra dan data uji sebanyak 60 citra.
Vik(old) = nilai acak antara -0.5 sampai 0.5
Praproses Data
i = 1,2,âŚ,m
Setiap citra khususnya pada huruf a dan t kecil dilakukan proses cropping (pemotongan) berukuran 40 x 40 piksel. Ukuran citra yang terlalu besar akan memperlambat kinerja sistem. Oleh karena itu, diperlukan proses resizing untuk mereduksi ukuran citra input. Citra input akan diubah menjadi citra grayscale dan diseragamkan ukurannya menjadi 24 x 12 piksel.
Kemudian diinisialisasi bobot-bobot dari input layer ke hidden layer, didefinisikan sebagai berikut: đ˝đđđ (đđđ )
đđđ(đđđ¤)= âĽđđ (đđđ )⼠,
k = 1,2,âŚ,p Bobot bias (Vok) diinisialisasi antara nilai â đ˝ sampai đ˝. Selama proses pelatihan, output yang dihasilkan dibandingkan dengan target. Jika output belum mencapai target maka pelatihan akan terus dilakukan dengan memperbaiki bobot dengan cara mempropagasi balik nilai koreksi galat output ke layer sebelumnya. Jika nilai output sama dengan target maka pelatihan akan berhenti. Algoritme BPNN secara lengkap dapat dilihat pada Lampiran 1.
Citra karakter tulisan tangan akan direpresentasikan menjadi vektor kolom berdimensi 1 x 81 untuk huruf a dan 1 x 90 untuk huruf t. Dengan demikian, seluruh data latih akan direpresentasikan berupa matriks
5
berukuran 288 x 81 untuk huruf a dan 288 x 90 untuk huruf t, dan seluruh data uji akan direpresentasikan berupa matriks berukuran 288 x 54 untuk huruf a dan 288 x 60 untuk huruf t. Tahapan proses pengenalan karakter tulisan tangan dapat dilihat pada Gambar 3.
Citra tulisan tangan
Jumlah output neuron disesuaikan dengan banyaknya kelas target (dalam penelitian ini terdapat tiga kelas target). Setiap target akan merepresentasikan satu karakter hasil analisis tulisan tangan. Elemen target ke-i bernilai 1 merepresentasikan kelas target ke-i. Misalnya untuk target dengan nilai elemen pertamanya satu dan yang lainnya nol maka target tersebut merepresentasikan kelas pertama. Definisi kelas target dapat dilihat pada Tabel 4 dan Tabel 5. Tabel 4 Definisi kelas target huruf a
Praproses data
Citra latih
Bentuk huruf a
Citra uji
Kelas Karakter
Target
1
100
2
010
3
001
Pelatihan JST Tabel 5 Definisi kelas target huruf t Pengujian JST
Bentuk huruf t
Hasil Gambar 3 Tahapan pengenalan karakter
Kelas Karakter
Target
1
100
2
010
3
001
Pelatihan Jaringan Syaraf Tiruan Setelah data latih dan data uji telah siap, tahapan selanjutnya adalah proses pelatihan data latih menggunakan jaringan syaraf tiruan (JST) propagasi balik. Pada penelitian ini akan digunakan model JST propagasi balik dengan struktur yang ditunjukkan pada Tabel 3. Arsitektur JST propagasi balik yang digunakan dapat dilihat pada Lampiran 3. Tabel 3 Karakteristik JST yang digunakan Karakteristik Arsitektur Input neuron Hidden neuron Output neuron Inisialisasi bobot Fungsi aktivasi Toleransi galat Epoch Laju pembelajaran
Spesifikasi 1 hidden layer 288 10 3 Nguyen-Widrow Sigmoid bipolar, linear 0.001 3000 0.01
Pengujian Jaringan Syaraf Tiruan Setelah proses pelatihan, dilakukan proses pengujian pada data uji menggunakan parameter â parameter JST yang didapat dari proses pelatihan. Hasil dari proses pengujian berupa tingkat akurasi dan prediksi hasil analisis karakter seseorang berdasarkan penulisan huruf a atau t kecil. Pengujian JST untuk pengenalan pola dapat dilakukan dengan generalisasi, yaitu jumlah pola yang berhasil dikenali dengan benar oleh JST dibagi dengan jumlah seluruh pola yang diuji. Persamaan generalisasi sebagai berikut: Generalisasi=
đđđđ đđđđđđđđ đđđđđ đĽ 100% đ đđđ˘đđ˘đ đđđđ đŚđđđ đđđ˘đđ
6
Lingkungan Pengembangan Sistem Sistem dikembangkan menggunakan kompiler Matlab R2008b dan sistem operasi Windows 7. Spesifikasi hardware komputer yang digunakan adalah Processor Intel (R) Atom (TM) CPU N280 @1,66 Ghz, Memory 1 GB, dan Harddisk 80 GB. HASIL DAN PEMBAHASAN Percobaan pertama yang dilakukan pada penelitian ini adalah mencari parameter JST propagasi balik yang optimal untuk digunakan pada proses pengenalan karakter berdasarkan huruf a dan t kecil.
0.01 dan masing-masing diulang sebanyak tiga kali. Generalisasi rata-rata maksimum hasil percobaan pengaruh hidden neuron adalah 81.48%. Generalisasi tersebut dicapai pada saat jumlah hidden neuron sebanyak 20. Generalisasi rata-rata untuk setiap jumlah hidden neuron dapat dilihat pada Tabel 6. Data selengkapnya pada percobaan ini dapat dilihat pada Lampiran 4. Tabel 6 Jumlah hidden neuron dengan generalisasi rata-ratanya Hidden neuron
Generalisasi rata-rata (%)
Menentukan Parameter JST yang Optimal
10
77.78
Pada penelitian ini dilakukan percobaan untuk mengetahui dampak pengubahan parameter-parameter JST terhadap generalisasi atau tingkat akurasi. Percobaan ini bertujuan untuk menemukan kombinasi yang optimal antara hidden neuron, epoch, toleransi galat, dan learning rate.
20
81.48
30
79.01
40
77.78
50
77.16
60
69.75
Pengaruh Jumlah Hidden Neuron terhadap Generalisasi
70
73.46
80
61.73
90
64.19
100
67.28
Generalisasi rata-rata
Pada percobaan ini jumlah hidden neuron diubah-ubah untuk mendapatkan jumlah hidden neuron yang optimal sehingga menghasilkan generalisasi yang baik. Grafik hubungan antara jumlah hidden neuron dengan generalisasi rata-rata dapat dilihat pada Gambar 4. 100 80 60 40 20 0 10 20 30 40 50 60 70 80 90 100
Hidden Neuron
Gambar 4 Pengaruh hidden neuron terhadap generalisasi Jumlah hidden neuron yang digunakan pada percobaan ini, sebesar 10, 20, 30, 40, 50, 60, 70, 80, 90, dan 100 neuron. Pada percobaan pengaruh hidden neuron digunakan galat sebesar 10-4, epoch 1000, learning rate
Pada Tabel 6, generalisasi rata-rata semakin meningkat mulai dari jumlah hidden neuron 10 sampai 20 hidden neuron. Pada saat hidden neuron berjumlah 30, generalisasi mulai menurun dan tidak stabil. Jumlah hidden neuron yang besar membuat jaringan lebih fleksibel dan dapat menghasilkan generalisasi yang lebih baik tetapi jika jumlah hidden neuron terlalu besar generalisasi cenderung akan menurun dan tidak stabil, selain itu waktu yang dibutuhkan untuk pelatihan jaringan lebih lama. Oleh karena itu, untuk percobaan pengaruh epoch terhadap generalisasi digunakan jumlah hidden neuron sebesar 10 dan 20, karena pada saat hidden neuron 10 dan 20 generalisasi mengalami peningkatan dan waktu yang dibutuhkan untuk pelatihan jaringan lebih cepat. Pengaruh Jumlah Generalisasi
Epoch
Terhadap
Pada percobaan ini jumlah epoch diubah untuk mendapatkan besarnya epoch yang optimal sehingga menghasilkan generalisasi yang baik. Jumlah epoch yang digunakan pada percobaan ini sebesar 1000, 1500, 2000, 2500,
7
90
Pada percobaan dengan 20 hidden neuron, walaupun generalisasi lebih besar dibandingkan generalisasi pada 10 hidden neuron, tetapi epoch yang diperlukan untuk mencapai generalisasi maksimum tersebut lebih besar dibandingkan dengan 10 hidden neuron. Epoch yang lebih besar akan mengakibatkan waktu pelatihan menjadi lebih lama. Oleh karena itu, karena selisih generalisasi maksimum antara 10 dan 20 hidden neuron tidak berbeda jauh yaitu 0.61 % maka untuk percobaan pengaruh galat akan digunakan 10 hidden neuron dengan epoch maksimum 3000 epoch.
85
Pengaruh Galat Terhadap Generalisasi
80
Percobaan ini bertujuan untuk menentukan toleransi galat yang optimal sehingga menghasilkan generalisasi yang baik. Besarnya toleransi galat yang digunakan pada percobaan ini sebesar 10-1, 10-2, 10-3, 10-4, dan 10-5. Pada percobaan ini digunakan jumlah hidden neuron sebanyak 10, epoch maksimum sebesar 3000 epoch, learning rate sebesar 0.01 dan masing-masing percobaan diulang sebanyak tiga kali. Grafik hubungan antara pengaruh galat terhadap generalisasi rata-rata dilihat pada Gambar 6.
75 70
Epoch 10 neuron
20 neuron
Gambar 5 Generalisasi rata-rata terhadap jumlah epoch menggunakan 10 dan 20 hidden neuron Generalisasi rata-rata maksimum hasil percobaan pengaruh epoch dengan 10 hidden neuron adalah 87.04% dicapai pada saat jumlah epoch sebesar 3000, sedangkan generalisasi rata-rata maksimum dengan 20 hidden neuron dicapai pada epoch 3500 yaitu sebesar 87.65%. Generalisasi rata-rata menggunakan 10 dan 20 hidden neuron dapat dilihat pada Tabel 7. Data selengkapnya pada percobaan ini dapat dilihat pada Lampiran 5 dan Lampiran 6. Tabel 7 Generalisasi rata-rata menggunakan 10 dan 20 hidden neuron Epoch
Generalisasi Rata-rata (%)
1000
10 hidden neuron 77.78
20 hidden neuron 81.48
1500
84.57
85.80
2000
84.57
86.42
2500
86.42
84.57
3000
87.04
85.19
3500 4000
82.10 81.48
87.65 85.81
Generalisasi rata-rata
Generalisasi rata-rata
dan 3000, 3500, dan 4000 epoch. Pada percobaan ini digunakan jumlah hidden neuron sebanyak 10 dan 20 neuron. Jumlah hidden neuron ini dipakai karena pada percobaan sebelumnya memberikan hasil generalisasi yang cukup baik. Selain itu, pada percobaan ini digunakan galat sebesar 10-4, learning rate sebesar 0.01 dan masing-masing percobaan diulang sebanyak tiga kali. Grafik hubungan antara jumlah epoch dengan generalisasi rata-rata menggunakan 10 dan 20 hidden neuron dapat dilihat pada Gambar 5.
100 90 80 70 60 50 40 30 20 10 0
Galat
Gambar 6 Pengaruh galat terhadap generalisasi rata-rata Generalisasi rata-rata maksimum hasil percobaan pengaruh galat adalah 90.74% dicapai pada saat galat sebesar 10-3. Generalisasi rata-rata untuk setiap besarnya galat dapat dilihat pada Tabel 8. Data selengkapnya pada percobaan ini dapat dilihat pada Lampiran 7.
8
Tabel 8 Pengaruh galat terhadap generalisasi rata-rata Galat
Generalisasi Rata-rata (%)
0,00001
85.80
0,0001
87.04
0,001
90.74
0,01
86.42
0,1
75.31
Percobaan ini menunjukkan bahwa jika toleransi galat diturunkan maka tingkat akurasi jaringan semakin tinggi tetapi jika toleransi galat terlalu kecil dapat mengakibatkan gejala overfitting. Hal ini terlihat pada toleransi galat sebesar 10-4 dan 10-5 tidak terjadi peningkatan akurasi bahkan akurasi mulai turun. Gejala sistem yang overfit timbul disebabkan sistem mulai terlalu spesifik mempelajari pola pada data pelatihan, sehingga sulit untuk mempelajari pola-pola baru pada data pengujian. Hasil percobaan ini menunjukkan bahwa pada toleransi galat 10-3 dihasilkan generalisasi yang cukup baik. Oleh karena itu, untuk percobaan selanjutnya digunakan toleransi galat sebesar 10-3. Pengaruh Learning Generalisasi
Rate
Terhadap
Generalisasi ratarata
Percobaan pengaruh learning rate bertujuan untuk menentukan nilai learning rate yang optimal sehingga menghasilkan generalisasi yang baik. Grafik hubungan antara pengaruh learning rate terhadap generalisasi rata-rata dengan toleransi galat sebesar 10-3 dapat dilihat pada Gambar 7.
baik. Selain itu, pada percobaan ini digunakan 3000 epoch, 10 hidden neuron, dan masingmasing percobaan diulang sebanyak tiga kali. Generalisasi rata-rata maksimum hasil percobaan pengaruh learning rate dengan toleransi galat 10-3 adalah 90.74% dicapai pada saat learning rate sebesar 0.01. Data selengkapnya pada percobaan ini dapat dilihat pada Lampiran 8. Pada toleransi galat sebesar 10-3, terlihat bahwa nilai learning rate yang semakin besar dapat menurunkan generalisasi. Perbandingan pengaruh learning rate terhadap generalisasi rata-rata dengan toleransi galat sebesar 10-3 dapat dilihat pada Tabel 9. Tabel 9 Pengaruh learning rate terhadap generalisasi Learning Rate 0.01
Generalisasi Rata-rata (%) 90.74
0.05
83.33
0.1
82.10
Pada Tabel 9 generalisasi maksimum sebesar 90.74% dicapai pada saat learning rate 0,01. Oleh karena itu, nilai learning rate yang akan digunakan pada penelitian ini sebesar 0,01. Jika learning rate nilainya terlalu besar maka jaringan tidak stabil tetapi jika learning rate nilainya terlalu kecil maka jaringan akan membutuhkan waktu yang lama untuk konvergen. Berdasarkan hasil percobaan sebelumnya, diperoleh parameterparameter JST propagasi balik yang optimal yang dapat menghasilkan generalisasi yang cukup baik. Parameter-parameter tersebut dapat dilihat pada Tabel 10. Tabel 10 Parameter optimal JST propagasi balik
95 90 85 80 75 0.01
0.05
0.1
Learning rate Gambar 7 Grafik pengaruh learning rate dengan galat 10-3 terhadap generalisasi Besarnya learning rate yang digunakan pada percobaan ini sebesar 0.1, 0.05, dan 0.01. Pada percobaan ini digunakan toleransi galat sebesar 10-3. Toleransi galat ini digunakan karena pada percobaan sebelumnya memberikan hasil generalisasi yang cukup
Parameter Hidden Neuron Toleransi Galat Epoch maksimum Learning Rate
Jumlah 10 neuron 0,001 3000 0,01
Pengenalan Karakter Berdasarkan Huruf a Pengenalan karakter berdasarkan huruf a terdiri atas tiga percobaan. Pada pengenalan karakter ini digunakan parameter-parameter JST propagasi balik optimal yang didapat dari percobaan sebelumnya untuk menguji sistem. Kelas huruf a yang digunakan dalam penelitian ini sebanyak tiga kelas yaitu a balok (desire of culture), a terbuka diatas (talkative), dan a tertutup (frankness), bentuk-
9
bentuk huruf a yang dianalisis dapat dilihat pada Tabel 11. Pengujian dilakukan dengan 54 data uji, hasil pengujian dapat dilihat pada Tabel 12. Tabel 11 Bentuk huruf a yang dianalisis
Bentuk huruf a
Kelas
Nama
a balok (desire of culture) a terbuka di atas (talkative)
1 2 3
a tertutup (frankness)
Tabel 12 Hasil pengujian huruf a percobaan pertama
percobaan pertama dijadikan sebagai data latih dan sebaliknya. Data latih percobaan pertama untuk kelas 1 berjumlah 21, data latih kelas 2 dan 3 berjumlah 30. Setiap data latih diambil secara acak dari tiap-tiap kelas sebesar 7 data dari kelas 1, 10 data dari kelas 2 dan 3. Kemudian, data latih yang diambil secara acak digabungkan dengan data uji percobaan pertama pada masing-masing kelas dan data ini akan menjadi data latih yang baru, sedangkan data latih percobaan pertama akan menjadi data uji. Ilustrasi pengambilan data ini dapat dilihat pada Gambar 8. Data latih lama Data uji lama 7 data Kelas 1 :14 data
Kelas 1 : 21 data Kelas 2: 30 data Kelas 3: 30 data
10 data 10 data
Kelas 2 : 20 data Kelas 3: 20 data
Hasil Prediksi Aktual
1
2
3
Desire of Culture
1
14
0
0
Talkative
2
0
19
1
Frankness
3
0
0
20
Berdasarkan hasil pengujian terhadap 54 data uji, diperoleh tingkat akurasi sebesar 98.15%. Kesalahan klasifikasi pada data uji sebanyak 1 data dari total data uji sebanyak 54. Data uji yang salah diklasifikasikan beserta hasil klasifikasinya dapat dilihat pada Tabel 13. Tabel 13 Kesalahan klasifikasi data uji huruf a percobaan pertama Hasil Klasifikasi
Kelas aktual: Kelas 2
Image data uji
Contoh Image hasil prediksi
Kelas Prediksi: Kelas 3
Salah satu data uji pada kelas 2 diklasifikasikan ke dalam kelas 3. Hal ini disebabkan oleh bentuk citra uji tersebut mirip dengan citra uji kelas 3 dan pada bagian atas citra uji huruf a tersebut terlihat sedikit tertutup seperti citra pada kelas 3. Pada percobaan kedua huruf a, data latih dan uji yang digunakan sama dengan percobaan pertama tetapi data uji pada
Data uji baru
Data latih baru
Kelas 1 :14 data
Kelas 1 : 21 data
Kelas 2 : 20 data
Kelas 2: 30 data
Kelas 3: 20 data
Kelas 3: 30 data
Gambar 8 Ilustrasi pengambilan data latih dan data uji baru huruf a Setelah mendapatkan data latih dan data uji yang baru, dilakukan pengenalan karakter berdasarkan huruf a menggunakan parameterparameter JST propagasi balik yang optimal dari percobaan sebelumnya. Pengujian dilakukan terhadap 54 data uji dan hasil pengujian dapat dilihat pada Tabel 14. Tabel 14 Hasil pengujian huruf a percobaan kedua Aktual Desire of Culture Talkative Frankness
Hasil Prediksi 1 2 3 1
14
0
0
2 3
4 0
13 2
3 18
Berdasarkan hasil pada Tabel 14 dapat dilihat bahwa generalisasi yang diperoleh sebesar 83,33%. Generalisasi ini lebih kecil dibandingkan dengan percobaan pertama. Hal ini menunjukkan bahwa pemilihan data latih dan data uji yang baru kurang baik dibandingkan percobaan pertama. Data uji yang salah terklasifikasi dapat dilihat pada Lampiran 9.
10
Pada percobaan ketiga huruf a, jumlah data kelas 2 dan 3 dikurangi masing-masing sebanyak 9 citra sehingga total data latih kelas 2 dan 3 masing-masing menjadi 21 citra sama seperti jumlah data pada kelas 1. Begitu juga dengan data uji kelas 2 dan 3 dikurangi masing-masing sebanyak 6 citra sehingga total data uji kelas 2 dan 3 masing-masing menjadi 14 citra. Jadi, pada percobaan ketiga ini jumlah seluruh data latih sebesar 63 citra dan jumlah data uji sebanyak 42 citra. Hal ini bertujuan untuk melihat hasil generalisasi yang diperoleh jika jumlah data masingmasing kelas sama. Pengujian dilakukan terhadap 42 data uji dan hasil pengujian dapat dilihat pada Tabel 15. Tabel 15 Hasil Pengujian huruf a percobaan ketiga Aktual Desire of Culture Talkative Frankness
Hasil Prediksi 1 2 3 1
14
0
0
2 3
0 0
12 3
2 11
Hasil klasifikasi data uji pada percobaan ketiga huruf a diperoleh generalisasi sebesar 88,09 %. Data uji yang salah terklasifikasi dapat dilihat pada Lampiran 10. Hasil ini lebih besar dibandingkan pada percobaan kedua karena data latih dan data uji yang digunakan adalah data latih dan data uji pada percobaan pertama hanya jumlah data kelas 2 dan 3 dikurangi. Pemilihan data percobaan pertama lebih baik dibandingkan data pada percobaan kedua sehingga generalisasi pada percobaan ketiga masih lebih besar dibandingkan percobaan kedua. Jika percobaan ketiga dibandingkan dengan percobaan pertama, maka generalisasi dari percobaan ketiga lebih kecil karena jumlah data yang digunakan lebih sedikit sehingga pola yang dikenali jaringan kurang bervariatif. Oleh karena itu, penambahan data pada pelatihan dapat membuat jaringan lebih bervariatif dalam mengenali pola, sehingga generalisasi yang diperoleh pun lebih besar. Data citra sebaiknya ditambah untuk melihat kinerja sistem. Berdasarkan percobaan pertama, kedua, dan ketiga huruf a, hasil klasifikasi untuk kelas 1 (a balok) selalu dikenali dengan benar seluruhnya karena bentuk dari huruf a kelas 1 (a balok) ini memang sangat berbeda dengan bentuk huruf a kelas 2 (a terbuka di atas) dan kelas 3 (a tertutup). Kesalahan dalam
klasifikasi umumnya terjadi pada kelas 2 yang diklasifikasikan ke dalam kelas 3 dan sebaliknya, hal ini disebabkan oleh bentuk huruf a kelas 2 dan 3 mirip dan perbedaanya pun hanya ditentukan pada bagian atas huruf a yaitu terbuka atau tertutup sehingga kemungkinan salah klasifikasi cukup besar. Generalisasi yang paling besar diperoleh pada percobaan pertama yaitu sebesar 98,15%. Oleh karena itu, data latih dan data uji dari percobaan pertama yang akan digunakan dalam penelitian ini. Pengenalan Karakter Berdasarkan Huruf t Pengenalan karakter berdasarkan huruf t terdiri atas dua percobaan. Perobaan pertama yaitu data latih yang digunakan sebanyak 90 citra dan data uji sebanyak 60 citra. Parameter-parameter JST propagasi balik yang digunakan berasal dari percobaan sebelumnya. Kelas huruf t yang digunakan dalam penelitian ini sebanyak tiga kelas yaitu t bar balanced, t bar up turned, dan t bar down turned, bentuk-bentuk huruf t yang dianalisis dapat dilihat pada Tabel 16. Pengujian dilakukan dengan 60 data uji dan hasil pengujian dapat dilihat pada Tabel 17. Tabel 16 Bentuk huruf t yang dianalisis Bentuk huruf t
Kelas
t
Nama
1
t bar balanced
2
t bar up turned
3
t bar down turned
Tabel 17 Hasil pengujian data uji huruf t percobaan pertama Hasil Prediksi Aktual
1
2
3
t bar balanced
1
14
4
2
t bar up turned
2
3
15
2
t bar down turned
3
2
3
15
Berdasarkan Tabel 17, diperoleh generalisasi untuk pengenalan karakter huruf t sebesar 73.33%. Kesalahan klasifikasi pada data uji sebanyak 16 data dari total data uji sebanyak 60. Beberapa data uji yang salah
11
diklasifikasikan beserta hasil klasifikasinya dapat dilihat pada Tabel 18. Tabel 18 Kesalahan klasifikasi data uji huruf t percobaan pertama Hasil Klasifikasi
Kelas aktual: Kelas 1 Kelas aktual: Kelas 1 Kelas aktual: Kelas 3
Image data uji
Contoh Image hasil prediksi
Kelas Prediksi: Kelas 2 Kelas Prediksi: Kelas 3 Kelas Prediksi: Kelas 2
Data uji yang salah terklasifikasi selengkapnya dapat dilihat pada Lampiran 11. Berdasarkan Tabel 18 dapat dilihat bahwa data uji pada kelas 1 diklasifikasikan ke dalam kelas 2 dan kelas 3, lalu data uji pada kelas 3 diklasifikasikan ke dalam kelas 2. Hal ini disebabkan oleh bentuk citra uji tersebut mirip dengan citra uji pada kelas prediksinya. Misalnya pada citra uji pertama dapat dilihat bar dari huruf t tersebut sedikit naik seperti pada citra uji kelas prediksinya. Pada percobaan kedua huruf t, data latih dan uji yang digunakan sama dengan percobaan pertama tetapi data uji pada percobaan pertama dijadikan sebagai data latih dan sebaliknya. Data latih percobaan pertama untuk kelas 1,2, dan 3 berjumlah 30 data. Setiap data latih diambil secara acak dari tiap-tiap kelas sebanyak 10 data. Kemudian, data latih yang diambil secara acak digabungkan dengan data uji percobaan pertama pada masing-masing kelas dan data ini akan menjadi data latih yang baru, sedangkan data latih percobaan pertama yang telah diambil 10 data dari masing-masing kelas akan menjadi data uji baru. Ilustrasi pengambilan data ini dapat dilihat pada Gambar 9.
Data Latih Kelas 1 : 30 data Kelas 2: 30 data Kelas 3: 30 data
Data Uji 10data 10 data 10 data
Data Uji baru
Kelas 1 :20 data Kelas 2 : 20 data Kelas 3: 20 data
Data Latih baru
Kelas 1 :20 data
Kelas 1 : 30 data
Kelas 2 : 20 data
Kelas 2: 30 data
Kelas 3: 20 data
Kelas 3: 30 data
Gambar 9 Ilustrasi pengambilan data latih dan data uji baru huruf t Setelah mendapatkan data latih dan data uji yang baru, dilakukan pengenalan karakter berdasarkan huruf t menggunakan parameterparameter JST propagasi balik yang optimal dari percobaan sebelumnya. Pengujian dilakukan terhadap 60 citra uji dan hasil pengujian dapat dilihat pada Tabel 19. Tabel 19 Hasil pengujian data uji huruf t percobaan kedua Hasil Prediksi Aktual
1
2
3
t bar balanced
1
14
3
3
t bar up turned
2
2
16
2
t bar down turned
3
5
6
9
Berdasarkan Tabel 19, diperoleh generalisasi untuk pengenalan karakter huruf t sebesar 65%. Generalisasi yang dihasilkan pada percobaan kedua lebih kecil dibandingkan dengan percobaan pertama. Hal ini menunjukkan bahwa pemilihan data latih dan data uji yang baru kurang baik dibandingkan percobaan pertama. Oleh karena itu, untuk pengenalan karakter berdasarkan huruf t digunakan data latih dan data uji percobaan pertama. Data uji yang salah terklasifikasi dapat dilihat pada Lampiran 12. Pada hasil penelitian Mutalib (2007), proses pengenalan dibagi menjadi dua yaitu pengenalan terhadap huruf t lalu pengenalan karakter seseorang berdasarkan huruf t. Hasil
12
akurasi pada pengenalan huruf t cukup tinggi yaitu sebesar 90,27%, tetapi akurasi dari pengenalan karakter berdasarkan huruf t kurang baik yaitu sebesar 60%. Hal ini dapat disebabkan oleh analisis karakter melalui huruf t hanya dilihat berdasarkan kemiringan garis bar pada huruf t, sehingga perbedaannya tidak terlalu signifikan. Selain itu, akurasi pengenalan huruf t yang tidak 100% yang dapat memengaruhi akurasi dalam pengenalan karakter berdasarkan huruf t. Jadi, kesalahan sistem dalam mengklasifikasikannya cukup besar. Jaringan syaraf tiruan propagasi balik yang digunakan dalam penelitian Mutalib yaitu JST propagasi balik dengan momentum. Berbeda dengan penelitian Mutalib (2007), pada penelitian ini tidak dilakukan pengenalan terhadap huruf t tetapi hanya pengenalan karakter seseorang berdasarkan huruf t. Generalisasi yang diperoleh lebih besar dibandingkan hasil penelitian Mutalib (2007) yaitu sebesar 73,33%. Hal ini karena pada penelitian ini tidak dilakukan pengenalan huruf t tetapi langsung pada pengenalan karakter seseorang berdasarkan huruf t, sehingga dapat mengurangi kesalahan dalam klasifikasi. Selain itu, huruf t dalam penelitian ini dipotong (cropping) secara manual. Generalisasi yang didapat dari analisis huruf t jauh lebih kecil dibandingkan dengan generalisasi yang dihasilkan pada pengenalan karakter berdasarkan huruf a. Hal ini dapat disebabkan oleh analisis karakter melalui huruf t hanya dilihat berdasarkan kemiringan garis bar pada huruf t, sehingga perbedaan antar kelas huruf t tidak terlalu signifikan. Selain itu, tidak ada proses rotasi dalam tahap praproses yang menyebabkan posisi huruf t tidak seragam sehingga memengaruhi kemiringan bar huruf t yang dapat menyebabkan kesalahan klasifikasi. Kesalahan klasifikasi baik untuk huruf t dan a dapat disebabkan oleh bentuk dan ukuran huruf-huruf yang mirip antar kelas sehingga memungkinkan sistem salah dalam mengklasifikasikannya ke dalam kelas karakter yang benar. Selain itu, kemiringan huruf pada data latih setiap kelas pun tidak seragam sehingga memengaruhi hasil klasifikasi. KESIMPULAN DAN SARAN Kesimpulan Jaringan syaraf tiruan propagasi balik standar dapat melakukan pembelajaran
dengan baik dan melakukan pengenalan terhadap suatu pola dengan tingkat generalisasi yang cukup tinggi. Implementasi analisis grafologi menggunakan jaringan syaraf tiruan propagasi balik dapat menjadi alat bantu grafologist untuk analisis tulisan tangan. Parameter-parameter JST propagasi balik yang optimal hasil percobaan ini yaitu 10 hidden neuron, learning rate sebesar 0.01, toleransi galat sebesar 10-3, dan epoch maksimum sebesar 3000 epoch. Sistem ini mampu melakukan pengenalan dengan tingkat generalisasi yang cukup tinggi sebesar 98.15 % untuk huruf a dan 73.33% untuk huruf t. Saran Penelitian ini masih dapat dikembangkan untuk membuat sistem yang lebih baik lagi. Saran-saran bagi penelitian lebih lanjut di antaranya: 1 Parameter untuk analisis grafologi sebaiknya ditambah, tidak hanya huruf a dan t kecil saja. 2 Proses pengenalan huruf a dan t diautomatisasi sehingga tidak dipotong (cropping) secara manual. 3 Dalam tahap praproses ditambahkan proses rotasi.
sebaiknya
DAFTAR PUSTAKA Amend KK, Ruiz MS. 1980. Handwriting Analysis, The Complete Basic Book. USA: Book Mart Press. Baggett BA. 1993. The Secret To Making Love Happen. USA: Empresse Publishing. Champa HN, Kumar AKR. 2010. Artificial Neural Network for Human Behavior Prediction through Handwriting Analysis. International Journal of Computer Applications (0975-8887). Vol.2, No.2, Mei 2010. India: SJB Institute of Technology. Fauset L. 1994. Fundamentals of Neural Networks. New Jersey: Prentice-Hall. Gonzales RC, Woods RE. 2002. Digital Image Processing. Massachussets: Addison Wasley. Mutalib S, Rahman SA, Yusoff M, Mohamed A. 2007. Personality Analysis Based on Letter t Using Back Propagation Neural Network. Proceedings of the International
13
Conference on Electrical Engineering and Informatics. Malaysia: University Teknologi MARA. Mutalib S, Ramli R, Rahman SA, Yusoff M, Mohamed A. 2008. Towards Emotional Control Recognition through Handwriting Using Fuzzy Inference. IEEE. pp. 978-14244-2328-6/08. Roberts P. 2002. The Romantic Secret Hidden in Our Handwriting. Pan-Amerika: Career Press,Inc. Rodgers V. 1993. Your Handwriting Can Change Your Life. Berkeley, California: Celestial Arts. Sheikholeslami G, Srihari SN, Govindaraju V. Computer Aided Graphology. USA: University of New York.
14
LAMPIRAN
15
Lampiran 1 Algoritme Jaringan Syaraf Tiruan Propagasi Balik Standar Langkah 0: Inisialisasi bobot (bobot awal dengan nilai random yang paling kecil). Langkah 1: Menentukan maksimum epoch, target error, dan learning rate. Selama syarat berhenti bernilai salah, kerjakan langkah 2-9. Langkah 2: Setiap pasangan pelatihan, kerjakan langkah 3-8. Langkah 3: Setiap unit input (Xi,i = 1,âŚ,n) menerima sinyal masukan xi dan meneruskannya ke seluruh unit pada lapisan di atasnya (Hidden unit). Langkah 4: Setiap hidden unit (Zj,j = 1,âŚp) menghitung total sinyal masukkan terbobot,
lalu menghitung sinyal keluarannya menggunakan fungsi aktivasi,
kemudian mengirimkan sinyal tersebut ke seluruh unit di atasnya (output units). Langkah 5: Setiap unit output (Yk,k = 1,âŚ,m) menghitung total sinyal masukkan terbobot,
lalu menghitung sinyal keluaran dengan fungsi aktivasi,
Backpropagation error Langkah 6: Setiap unit output (Yk,k = 1,âŚ,m) menerima sebuah pola target yang sesuai dengan pola masukkan pelatihannya, kemudian unit tersebut menghitung informasi kesalahannya,
lalu menghitung koreksi bobotnya (digunakan untuk update bobot (Wjk) selanjutnya).
dan menghitung koreksi biasnnya (digunakan untuk update bias (W0k) selanjutnya).
dan mengirimkan
ke layer di bawahnya.
Langkah 7: Setiap unit hidden (Zj,j = 1,âŚ,p) menghitung delta input (dari unit pada layer di atasnya).
lalu mengalikannya dengan turunan fungsi aktivasi untuk menghitung informasi error,
kemudian menghitung koreksi bobot (digunakan untuk update bobot Vij selanjutnya).
dan menghitung koreksi bias (digunakan untuk update bias V0j selanjutnya).
16
Lampiran 1 Lanjutan Update bobot dan bias Langkah 8: Setiap unit output (Yk,k = 1,âŚ,m) mengubah bias dan bobot (j = 0,âŚ,p): Setiap unit hidden (Zj,j = 1,âŚ,p) mengubah bias dan bobot (i = 0,âŚn):
Langkah 9: Kondisi berhenti. (Sumber: Fauset 1994)
17
Lampiran 2 Data Penelitian
18
Lampiran 2 Lanjutan Kelas Karakter Kelas 1
Data Latih
Data Uji
Orang ke 1
Orang ke 2
Orang ke 3
Orang ke 4
Orang ke 5
Orang ke 6
Orang ke 7
Kelas 2
Orang ke 1
Orang ke 2
Orang ke 3
Orang ke 4
Orang ke 5
Orang ke 6
Orang ke 7
Orang ke 8
Orang ke 9
Orang ke 10
Kelas 3 Orang ke 1
19
Lampiran 2 Lanjutan Orang ke 2
Orang ke 3
Orang ke 4
Orang ke 5
Orang ke 6
Orang ke 7
Orang ke 8
Orang ke 9
Orang ke 10
20
Lampiran 2 Lanjutan Kelas Karakter Kelas 1
Data Latih
Data Uji
Orang ke 1
Orang ke 2
Orang ke 3
Orang ke 4
Orang ke 5
Orang ke 6
Orang ke 7
Orang ke 8
Orang ke 9
Orang ke 10
Kelas 2
Orang ke 1
Orang ke 2
Orang ke 3
Orang ke 4
Orang ke 5
Orang ke 6
Orang ke 7
Orang ke 8
21
Lampiran 2 Lanjutan Orang ke 9
Orang ke 10
Kelas 3
Orang ke 1 Orang ke 2
Orang ke 3
Orang ke 4
Orang ke 5
Orang ke 6
Orang ke 7
Orang ke 8
Orang ke 9
Orang ke 10
22
Lampiran 3 Arsitektur Jaringan Syaraf Tiruan Propagasi Balik
X1
Z1
Y1 X2
Z2
. . .
. . .
Y2
Y3 X288
Z288
1 Input Layer
1 Hidden Layer
Output Layer
23
Lampiran 4 Pengaruh jumlah hidden neuron terhadap generalisasi Hidden Neuron
Ulangan ke
Dikenal
Tidak Dikenal
Generalisasi (%)
Waktu (menit)
10
1 2 3
47 41 38
7 13 16
87,037 75,926 70,370
0.43 0.44 0.40
20
1
10
77,778 81,482
0.42 0.45
30
2
41
13
75,926
0.46
3
47
7
87,037
0.46
11
81,482 79,629
0.46 0.51
15 8
72,222 85,185
0.49 0.53
16
79,012 70,370
0.51 0.55
1 2 3
40
50
60
70
1
Rata-rata 43 39 46 Rata-rata 38
2
45
9
83,333
0.54
3
43
11
79,629
0.58
12
77,777 77,778
0.56 1.00
1
Rata-rata 42
2
45
9
83,333
1.00
3
38
16
70,370
0.59
20
77,160 62,963
0.86 1.01
1
Rata-rata 34
2
42
12
77,778
1.06
3
37
17
68,519
1.02
9
69,753 83,333
1.03 1.09
20
62,963
1.09
14 21
74,074 73,457 61,111
1.07 1.08 1.15
1 2 3
80
Rata-rata 44
1
Rata-rata 45 34 40 Rata-rata 33
2
33
21
61,111
1.13
3
34
20
62,963
1.13
61,728 61,111 62,963 68,519 64,198 68,519 59,259
1.14 1.17 1.19 1.2 1.19 1.27 1.22
74,074 67,284
1.23 1.24
90
1 2 3
100
1 2 3
Rata-rata 33 34 37 Rata-rata 37 32 40 Rata-rata
21 20 17 17 22 14
24
Lampiran 5 Pengaruh jumlah epoch dengan 10 hidden neuron terhadap generalisasi Epoch
Ulangan ke
Dikenal
Generalisasi (%)
47
Tidak Dikenal 7
87,037
Waktu (menit) 0.43
1000
1 2
41
13
75,926
0.44
3
38
16
70,370
0.4
77,778
0.42
Rata-rata 1500
1
48
6
88,889
1.08
2
45
9
83,333
1.08
3
44
10
81,482
1.02
Rata-rata 2000
84,568
1.06
1
44
10
81,482
1.18
2
46
8
85,185
1.21
3
47
7
87,037
1.24
84,568
1.21
Rata-rata 2500
1
45
9
83,333
1.43
2
49
5
90,741
1.42
3
46
8
85,185
1.42
Rata-rata 3000
86,420
1.42
1
50
4
81,481
2.16
2
48
6
88,889
2.03
3
49
5
90,741
1.58
87,037
1.92
Rata-rata 3500
1
40
14
74,074
2.22
2
45
9
83,333
2.34
3
48
6
88,889
2.35
Rata-rata 4000
82,099
2.30
1
43
11
79,629
2.55
2
46
8
85,185
2.52
3
43
11
79,629
2.54
81,481
2.54
Rata-rata
25
Lampiran 6 Pengaruh jumlah epoch dengan 20 hidden neuron terhadap generalisasi Epoch
Ulangan ke
Dikenal
Tidak Dikenal
Generalisasi (%)
Waktu (menit)
1000
1
44
10
81,482
0.45
2
41
13
75,926
0.46
3
47
7
87,037
0.46
81,482
0.46
Rata-rata 1500
1
46
8
85,185
1.11
2
46
8
85,185
1.12
3
47
7
87,037
1.15
85,802
1.13
Rata-rata 2000
1
46
8
85,185
1.33
2
47
7
87,037
1.36
3
47
7
87,037
1.31
86,420
1.33
Rata-rata 2500
1
47
7
87,037
1.56
2
47
7
87,037
1.51
3
43
11
79,629
1.58
84,568
1.55
Rata-rata 3000
1
46
8
85,185
2.17
2
48
6
88,889
2.21
44
10
81,482
2.2
85,185
2.19
3
Rata-rata 3500
1
42
12
77,778
2.43
2
51
3
94,444
2.44
3
49
5
90,741
2.42
87,654
2.43
Rata-rata 4000
1
45
9
83,333
3.09
2
48
6
88,889
3.09
3
46
8
85,185
3.04
85,802
3.07
Rata-rata
26
Lampiran 7 Pengaruh galat terhadap generalisasi Galat
Ulangan ke
Dikenal
Tidak Dikenal
Generalisasi (%)
Waktu (menit)
Epoch
0.1
1
42
12
77,778
0.21
493
2
44
10
81,482
0.17
376
3
36
18
66,667
0.39
891
75,309
0.26
Rata-rata 0.01
1
49
5
90,741
2.05
3000
2
48
6
88,889
2.08
3000
3
43
11
79,629
2.07
3000
86,420
2.1
Rata-rata 0.001
1
48
6
88,889
2.21
3000
2
48
6
88,889
2.08
3000
3
51
3
94,444
2.11
3000
90,741
2.13
Rata-rata 0.0001
1
50
4
81,481
2.16
3000
2
48
6
88,889
2.03
3000
3
49
5
90,741
1.58
3000
87,037
1.92
Rata-rata 0.00001
1
46
8
85,185
2.21
3000
2
47
7
87,037
2.21
3000
3
46
8
85,185
2.22
3000
85,802
2.21
Rata-rata
27
Lampiran 8 Pengaruh learning rate terhadap generalisasi Learning rate
Ulangan ke
0.1
1
Dikenal
Tidak Dikenal
Generalisasi (%)
Waktu (menit)
Epoch
41
13
75,926
1.16
1731
2
43
3
49
11
79,629
1.14
1648
5
90,741
1.3
2010
82,099
1.2
Rata-rata 0.05
1
45
9
83,333
2.15
2913
2
45
9
83,333
2.03
2643
3
45
9
83,333
1.46
3000
83,333
1.88
Rata-rata 0.01
1
48
6
88,889
2.21
3000
2
48
6
88,889
2.08
3000
3
51
3
94,444
2.11
3000
90,741
2.13
Rata-rata
28
Lampiran 9 Kesalahan klasifikasi data uji huruf a pada percobaan kedua
Kelas aktual Kelas 2
Kelas prediksi Kelas 3
Kelas 2
Kelas 3
Kelas 2
Kelas 1
Kelas 2
Kelas 1
Kelas 2
Kelas 1
Kelas 2
Kelas 1
Kelas 2
Kelas 3
Kelas 3
Kelas 2
Kelas 3
Kelas 2
Citra uji
Citra kelas prediksi
29
Lampiran 10 Kesalahan klasifikasi data uji huruf a pada percobaan ketiga Kelas aktual Kelas 2
Kelas prediksi Kelas 3
Kelas 2
Kelas 3
Kelas 3
Kelas 2
Kelas 3
Kelas 2
Kelas 3
Kelas 2
Citra uji
Citra kelas prediksi
30
Lampiran 11 Kesalahan klasifikasi data uji huruf t percobaan pertama Kelas aktual Kelas 1
Kelas prediksi Kelas 2
Kelas 1
Kelas 2
Kelas 1
Kelas 2
Kelas 1
Kelas 2
Kelas 1
Kelas 3
Kelas 1
Kelas 3
Kelas 2
Kelas 1
Kelas 2
Kelas 3
Kelas 2
Kelas 3
Kelas 2
Kelas 1
Kelas 2
Kelas 1
Kelas 3
Kelas 1
Kelas 3
Kelas 2
Kelas 3
Kelas 2
Kelas 3
Kelas 2
Kelas 3
Kelas 1
Citra uji
Citra kelas prediksi
31
Lampiran 12 Kesalahan klasifikasi data uji huruf t percobaan kedua Kelas aktual Kelas 1
Kelas prediksi Kelas 2
Kelas 1
Kelas 3
Kelas 1
Kelas 2
Kelas 1
Kelas 3
Kelas 1
Kelas 2
Kelas 1
Kelas 3
Kelas 2
Kelas 3
Kelas 2
Kelas 1
Kelas 2
Kelas 3
Kelas 2
Kelas 1
Kelas 3
Kelas 2
Kelas 3
Kelas 1
Kelas 3
Kelas 2
Kelas 3
Kelas 2
Kelas 3
Kelas 2
Kelas 3
Kelas 2
Kelas 3
Kelas 2
Kelas 3
Kelas 1
Kelas 3
Kelas 1
Kelas 3
Kelas 1
Kelas 3
Kelas 1
Citra uji
Citra kelas prediksi
32