Signature Recognition Using Neural Network Probabilistic Heri Nurdiyanto2 , and Hermanto2 a)
1 Departement Informatic Enggenering,STMIK Dharma Wacana Corresponding author:
[email protected] [email protected]
ABSTRACT. The development of computer technology today has been able to identify an object based on digital data supplied. One form of digital data that can be used is image / digital image. The system uses digital image signatures to identify a person's identity. The signature of each person is different and has unique characteristics. The difference is the unique characteristic so that signatures can be analyzed for the identification process. The process of identification of signatures in this study using grayscale method for preprocessing, Shannon Entropy for feature extraction and Probabilistic Neural Network for identification. This study uses five types of image signatures. Each type of imagery consists of five signatures. Extracted divided into training data and test data. Training data is processed into a training model and tested on the test data using Probabilistic Neural Network. The test results in the form of identification of the owner's signature. Furthermore, the test results compared with actual data and evaluated to determine the accuracy of the system performance. System performance was only 40%. KEYWORDS: Probabilistic Neural Network, Entropy, Identification of Signatures 1.
INTRODUCTION Identification is an important process to identify and distinguish one thing with other things, it can be animals, plants, and humans. This identification is done by recognizing the characteristic possessed something about it. Development of basic methods of identification by using the natural characteristics of the human being as its base became known as biometrics. Biometric characteristics include physiological and behavioral characteristics. Physiological characteristics are relatively stable physical characteristics such as fingerprints, hand silhouette, characteristic facial, iris pattern, or the retina of the eye. Behavioral characteristics, such as signature, speech patterns, or typing rhythm, in addition to having a relatively stable physiological basis, is also influenced by psychological conditions volatile. Currently, the signature is widely used as an identification system to identify a person. In general, to identify signatures still done conventionally is to match the signature on a transaction with a valid signature. Conventional identification techniques to identify a person's identity by using a password or card is not reliable enough, because the security system and the password can be penetrated when the card is used by unauthorized users. Biometric identification has keuggulan compared with conventional methods because it is not easy to be stolen or used by unauthorized users. The signature can be seen as an image of the visual representation of an object. In the computer field, the image is a visual representation of an object after suffering various transformations of data from various forms of numerical sequence. The introduction of the signature can be done through the stages of the conversion of the image into a numeric vector, image processing for quality improvement, prior to further processing stages numerically, including the use of Artificial Neural Network (ANN) for classification. Classification or identification features that are closely related to be reviewed. 1.1 Research Question how to apply the methods of entropy and Probabilistic Neural Network in the image of the signature that can accurately recognize a person's identity. 1.2 Research Objectives The goal of this research is to apply the method of entropy and Probabilistic Neural Network to be able to recognize a person's identity only by utilizing his signature. 1.3 Landasan Teori 1.3.1 Probabilistic Neural Network Probabilistic neural network (PNN) proposed by Donald Specht in 1990 as an alternative to back-propagation neural network. PNN has several advantages, namely the training process requires only one iteration and the solution is obtained using a Bayesian approach. The main
advantage using PNN is training that is easy and fast. The weight is not the result of training, but the value will be input. Weights there was ever changing, only the new vectors were inserted into the matrix of weights when training process (Herdiyeni and Wahyuni 2012; Wu et al .. 2007). PNN structure, shown in Figure 1, has four constituent layer is the input layer, layer pattern, the summation layer, and the layer of decision. 1 Sum 1 t f1 f2
Kelas 1
1 Sum 2
f3
Kelas Keputusan
t fk
Kelas 2
x 1 Sum n t Kelas n Lapisan Masukan
Lapisan Pola
Lapisan Penjumlahan
Lapisan Keputusan
Figure 1 Structure of PNN PNN constituent layer is described as follows: 1. The input layer (input layer) The input layer is composed of input x k characteristic value that will be classified in one of the classes of the n class. 2. Layers pattern (pattern layer) In the pattern layer carried dot (dot product) between the input x and the weight vector xA, namely ZA = x ∙ Xai, ZA then divided by bias (σ) specified and subsequently included in the function Parzen, namely g (x) = exp ( -x). Thus, the equation used in the pattern layer is the following equation:
3.
Xai states with training vectors to class-A sequence-i. Lapisan penjumlahan (summation layer) Pada lapisan penjumlahan, setiap pola pada masing-masing kelas dijumlahkan sehingga menghasilkan probability density function untuk setiap kelas. Persamaan digunakan pada lapisan ini.
dengan
4.
1.3.2
Lapisan keputusan (output layer) Pada lapisan keputusan, masukan x akan diklasifikasikan ke kelas A jika nilai pA(x) paling besar dibandingkan kelas lainnya.
Verifikasi Tanda Tangan Verifikasi adalah proses membandingkan sebuah sample biometrik terhadap sebuah refrensi dari seorang pengguna untuk memastikan identitas seseorang yang berhubungan dengan akses ke sistem, pada sistem keamanan dengan biometrik Verifikasi tanda tangan adalah verifikasi berdasarkan pada tanda tangan seseorang, dimana tanda tangan yang diberikan dicocokkan
dengan sample tanda tangan yang telah disimpan pada data sebelumnya. Dalam proses verifikasi tanda tangan menurut Griess (2000) [5]dapat dibagi menjadi dua bagian, yaitu : a. Off-line signature verification (Verifikasi tanda tangan secara off-line) b. On-line signature verification (Verifikasi tanda tangan secara on-line) Verifikasi tanda tangan secara off-line merupakan sebuah signature verification yang mengambil sebuah image tanda tangan sebagai input yang nantinya akan digunakan dalam proses selanjutnya. Berbeda dengan verifikasi tanda tangan secara On- line dimana input berupa tanda tangan yang di-capture langsung dari digitizer yang dapat menghasilkan nilainilai dinamik, seperti nilai koordinat dan waktu tanda tangan. Pada gambar tanda tangan secara Off-line biasanya memiliki tingkat noise yang cukup tinggi dibandingkan dengan gambar image yang di-capture langsung oleh digitizer yang dipakai pada verifikasi tanda tangan secara On-line, tetapi hal tersebut tergantung juga pada alat scanning dan latar belakang kertas yang digunakan. Verifikasi tanda tangan secara Off-line memiliki kelebihan dari segi biaya, karena biaya yang diperlukan lebih murah daripada pengenalan tanda tangan secara on- line, selain itu pengenalan tanda tangan secara off-line lebih diperlukan dalam bidang perbankan, oraganisasi atau lembaga dan sebagian besar bank, organisasi, atau lembaga di Indonesia. 1.3.3
Citra Digital Citra secara umum dapat didefinisikan sebagai fungsi intensitas cahaya dari suatu objek dalam dua dimensi f(x,y), dimana x dan y menyatakan koordinat spasial dan nilai f pada sembarang titik (x,y) sebanding dengan skala keabuan (brightness) dari citra pada titik tersebut, dengan demikian f(x,y) juga merupakan fungsi kontinu yang menyatakan tingkat intensitas citra pada titik itu (Suhendra, 2008). Dalam bidang pengolahan citra (image processing), citra yang diolah adalah citra digital, yaitu citra kontinu yang telah diubah ke dalam bentuk diskrit, baik koordinat ruang maupun intensitas cahayanya.
Gambar 2. Ilustrasi Citra dalam Sistem Koordinat Piksel Citra digital f(x,y) dapat dibayangkan sebagai sebuah matriks yang indeks baris dan kolomnya mengidentifikasikan sebuah titik pada citra dan nilai dari elemen matriks yang bersangkutan merupakan tingkat warna pada titik tersebut. Elemen tersebut disebut elemen citra, elemen gambar (picture elements), piksel, atau pels, dimana dua kata yang terakhir merupakan singkatan dari “picture elements”. Picture elements atau piksel dapat didefinisikan sebagai elemen terkecil dari sebuah citra digital yang menentukan resolusi citra tersebut. Semakin tinggi resolusi yang dihasilkan, semakin kecil ukuran pikselnya. Hal ini berarti bahwa citra yang diperoleh akan semakin halus. Citra yang biasa dilihat adalah citra analog yang merupakan fungsi intensitas cahaya dalam bidang 2D. Bilangan-bilangan pembentuk intensitas pada citra analog berupa bilangan riil. Sedangkan citra digital merupakan hasil konversi bilangan tersebut ke bentuk diskrit. Jadi citra digital adalah representasi citra dalam bentuk diskrit, baik pada koordinat ruang maupun nilai intensitas cahayanya. Citra digital dinyatakan dengan matriks berukuran N x M (baris/ tinggi = N, kolom/ lebar = M). Representasi citra digital sebagai matrik dua dimensi dengan ukuran N x M dapat diilustrasikan pada gambar berikut:
Gambar 3. Matriks citra digital N x M 1.3.4 Ekstraksi Fitur Ekstraksi fitur adalah proses pemetaan fitur asli menjadi fitur berukuran kecil yang hanya berisi informasi utama dari data. Pemrosesan data input yang terlalu besar diduga akan berlebihan karena banyak data tetapi tidak banyak informasi. Oleh karena itu data input diubah menjadi satu set fitur yang disebut sebagai vektor fitur. Transformasi data masukan menjadi satu set fitur disebut ekstraksi fitur (Sharma et al, 2011). Tujuan ekstraksi fitur adalah mengurangi kompleksitas komputasi dan ruang dimensi. Ekstraksi fitur paling penting dalam sistem pengenalan citra karena fitur yang disediakan berpengaruh terhadap akurasi klasifikasi (Patil et al. 2012). Salah satu teknik yang dapat digunakan untuk mengekstraksi fitur dari suatu citra adalah Shannon Entropy. a. Shannon Entropy Istilah entropi pertama sekali digunakan dalam teori informasi yang dikembangkan sekitar tahun 1940 oleh Claude Shannon di laboratorium Bell. Istilah ini dipakai dalam bidang thermodinamika untuk menandai adannya sejumlah gangguan pada sistem fisika. Entropi merupakan teknik yang mengukur ketidakpastian data dalam distribusi diskrit (Duda et al. 2000). Shannon (1948) melambangkan entropy H dari sebuah variabel acak diskrit X yang didefinisikan dalam persamaan berikut.
Kuantitas H memainkan peranan utama dalam teori informasi sebagai ukuran informasi, pilihan, dan ketidakpastian. adalah fungsi peluang , dengan merupakan anggota bilangan acak X. Entropi tergantung pada intensitas gray level. 2
PEMBAHASAN 2.1 Analisis system Sistem Identifikasi Tanda Tangan merupakan sistem yang membantu proses identifikasi seseorang menggunakan tanda tangan digital. Sistem ini terdiri dari dua bagian. Bagian pertama merupakan proses untuk mendapatkan model pelatihan. Model pelatihan diperoleh dengan memproses seluruh data latih tanda tangan. Proses yang dilakukan adalah preprocessing, dengan merubah citra RGB menjadi citra grayscale, kemudian mengekstrak ciri khusus dari seluruh citra menggunakan teknik Shannon Entropy. Ciri khusus dari seluruh citra inilah yang disebut sebagai model pelatihan. Bagian kedua adalah proses identifikasi tanda tangan. Preprocessing dan ekstraksi ciri yang sama seperti bagian pertama juga dilakukan pada data uji. Setelah diperoleh ekstraksi ciri data uji, sistem akan menghitung jarak antara data uji dengan masiing-masing kelas dalam model pelatihan menggunakan PNN. Data uji yang memiliki jarak terdekat dengan kelas tertentu akan diidentifikasi sebagai kelas tersebut. Setiap kelas mewakili identitas orang yang berbeda. 2.2 Citra tanda Tangan Sampel yang digunakan dalam penelitian ini adalah 5 jenis tanda tangan, masing-masing tanda tangan terdiri dari 5 citra. Data citra dari setiap jenis tanda tangan dibagi menjadi dua bagian yaitu data latih dan data uji. Citra 1 dari setiap jenis tanda tangan akan digunakan sebagai citra uji sedangkan 4 citra lainnya digunakan sebagai citra latih. Citra RGB tanda tangan memiliki format jpg dengan ukuran piksel yang sama yaitu 591 x 709. Citra ini memiliki total piksel sebanyak 419.019 piksel. Disebabkan karena keterbatasan tempat, penulis hanya menampilkan piksel-piksel tertentu yang dipilih secara acak. 2.3 Preposesing Data tanda tangan responden dipindai menggunakan alat pemindai untuk mendapatkan gambar tanda tangan. Data hasil alat pemindai tersebut selanjutnya disebut citra tanda tangan. Proses identifikasi tanda tangan menggunakan objek tanda tangan pada masing-masing citra. Setiap piksel dalam citra tanda tangan memiliki 3 buah nilai yaitu nilai R, nilai G, dan nilai B. Sebelum proses ekstraksi ciri dilakukan, citra harus diubah menjadi citra grayscale. Citra grayscale yang dimaksud
adalah citra dengan nilai piksel antara 0-255 atau 1-256. Untuk merubah RGB menjadi grayscale menggunakan persamaan berikut ini: Berikut ini adalah nilai grayscale yang diperoleh dari rata-rata penjumlahan piksel R (red), G (green), B (blue).
2.4 Ekstraksi ciri Citra hasil preprocessing diekstraksi untuk memperoleh ciri-ciri yang khas atau unik dari setiap jenis tanda tangan. Metode yang digunakan untuk mendapatkan cirri-ciri unik tanda tangan adalah metode entropi. Pada tahap ini, data yang digunakan sebanyak 25 citra tanda tangan. Metode entropi digunakan untuk mengukur informasi ketidakpastian ciri dalam data latih. Pengukuran informasi dilakukan berdasarkan nilai histogram. Histogram merubah nilai-nilai intensitas citra sehingga penyebarannya seragam (uniform). Distribusi nilai piksel dihitung menggunakan histogram. Histogram grayscale harus dinormalisasi untuk mendapatkan penyebaran histogram yang merata sehingga setiap derajat keabuan memiliki jumlah piksel yang sama. Normalisasi diperoleh dengan cara mengubah derajat keabuan suatu piksel dengan derajat keabuan yang baru dengan suatu fungsi transformasi. Perhitungan entropi hanya menghasilkan satu nilai untuk satu citra sehingga diperoleh 5 nilai entropi,sepertitabel 1 dibawah ini:
2.5 Identifikasi Citra Proses identifikasi citra dilakukan dengan mengklasifikasi data dan mengelompokkan data tersebut kedalam kelas-kelasnya. PNN merupakan salah satu teknik klasifikasi yang melakukan pembelajaran terhadap data untuk membentuk suatu pola tertentu. Proses pembelajaran dilakukan pada data latih dan menghasilkan model klasifikasi. Selanjutnya data uji akan diujikan pada model klasifikasi. Data uji adalah data yang tidak digunakan dalam proses pembelajaran. Klasifikasi dilakukan untuk mengelompokan data pada masing-masing kelas. Kelas yang digunakan terdiri dari kelas A (kelas 1), kelas B (kelas 2), kelas C (kelas 3), kelas D (kelas 4), dan kelas E (kelas 5). Data hasil ekstraksi setiap kelas dibagi berdasarkan skenario pembagian data. Setiap subdata terdiri dari 1 citra. Nilai entropi untuk data latih dapat dilihat pada table 2 berikut:
Data latih detraining menggunakan PNN untuk mendapatkan model pelatihan. PNN akan mengukur jarak data uji dengan masing-masing kelas dalam model pelatihan. Data uji yang
memiliki jarak terdekat dengan kelas tertentu akan diidentifikasi sebagai bagian dari kelas tersebut. Hasil klasifikasi data uji dapat dilihat pada Tabel 3
3
KESIMPULAN 3.1 Kesimpulan Penelitian ini menerapkan metode entropi dan klasifikasi PNN untuk mengidentifikasi jenis tanda tangan. Proses identifikasi jenis tanda tangan dimulai dengan melakukan tahap preprocessing terhadap citra. Citra hasil preprocessing diekstraksi menggunakan metode Shannon Entropy. Untuk menguji sistem, data dibagi menjadi dua yaitu data latih dan data uji. Data uji diklasifikasi menggunakan probabilistic neural network. Hasil percobaan menunjukkan bahwa metode entropi dan klasifikasi PNN kurang dapat membedakan jenis tanda tangan. Hal ini disimpulkan berdasarkan kinerja sistem identifikasi tanda tangan yang hanya mencapai 40%. Berdasarkan analisis data yang telah dilakukan, kinerja sistem yang rendah disebabkan oleh adanya kesalahan proses identifikasi. Kesalahan identifikasi citra terjadi karena kurangnya data yang digunakan serta proses pengambilan citra yang kurang baik
3.2 Saran Penelitian ini masih jauh dari sempurna. Salah satu kelemahan sistem ini adalah kinerja sistem yang hanya mencapai 40%. Penulis mengharapkan kinerja sistem dapat diperbaiki oleh peneliti lain. Perbaikan kinerja sistem dilakukan dengan meningkatkan nilai akurasinya. Nilai akurasi sistem dapat ditingkatkan dengan cara: a) Menambahkan proses segmentasi sebelum proses ekstraksi fitur. b) Menambah jumlah data citra. c) Memperbaiki citra sebelum preprocessing.
REFERENCES . [I] Arymurthy, Aniati Murni, dan Setiawan. 1992. Pengantar Pengolahan Citra. Jakarta: PT Elex Media Komputindo. [II] Dewi, Sri Kusuma. 2003. Artificial Intelegence Teknik dan Aplikasinya. Yogyakarta: Graha ilmu. [III] Duda Richard O, Peter E Hart dan Davis E Stork. 2000. Pattern Classification: second edition. ISBN10: 0471056693 | ISBN-13: 978-0471056690. [IV] Gonzales Rafael C dan Richard O Wood. 2008. Digital Image Processing 3rd Ed. Amerika: Pretice Hall. ISBN: 0-130-94650-8. [V] Griess, Friederike Dorothea. 2000. On-line Signature Verification. USA: Michigan State University. [VI] Patil PS, Kolhe SR, Patil RV. 2012. Performance evaluation in iris recognition and CBIR system based on phase congruency. IJCA [Internet]. [diunduh 2015 Maret 1]; 47(14):13-18. Tersedia pada: http://research.ijcaonline.org/volume47/number14/ pxc3880258.pdf. [VII] Sharma, DK, Rai CS, Gaur L. 2011. Linear versus non linear algorithms for feature extraction and image compression. Proceedings of the Academy of Information and Management Sciences [internet]. 2011 Oct 12-15; Las Vegas, Amerika Serikat. Las Vegas (US). hlm 21-26. [VIII] Suhendra, Adang. 2008. Pengantar Pengolahan Citra. Surabaya: Institut Teknologi Sepuluh November. [IX] Wu SG, Bao FS, Xu EY, Wang YX, Chang YF, Xiang QL. 2007. A leaf recognition algorithm for plant classification using Probabilistic Neural Network. IEEE 7th International Symposium on Signal Processing and Information Technology [Internet]. [diunduh 2012 Nov 10]. Tersedia
pada:http://arxiv.org/pdf/0707.4289.pdf.