19
BAB III METODOLOGI PENELITIAN 3.1. Kerangka Pemikiran Kerangka pemikiran untuk penelitian ini seperti pada Gambar 9. Penelitian dibagi dalam empat tahapan yaitu persiapan penelitian, proses pengolahan data, desain pemodelan dan desain aplikasi termasuk simulasi dan pengujian.
Gambar 9 Kerangka pemikiran. 3.1.1
Persiapan Penelitian
Persiapan penelitian merupakan tahap awal dari rangkaian penelitian yang dilakukan. Dalam tahap ini dilakukan beberapa proses yang dimulai dengan
20
memahami permasalahan yang diteliti, kemudian menetapkan tujuan yang dicapai, melakukan studi literatur sebagai bahan untuk melengkapi pengetahuan dasar peneliti dan menentukan ruang lingkup penelitian. 3.1.2
Pengumpulan dan Pengolahan Data Pada tahap ini, dilakukan pengumpulan data berupa sampel formulir dan
rekaman. Nomor yang terdapat pada setiap formulir dan rekaman adalah bagian yang menjadi perhatian dalam tahap pengolahan data, sebab nomor dokumen ini yang menjadi objek untuk diteliti (Gambar 10). Nomor ini memiliki format “ F X X X X X X”, dimana X dalam format Angka 0 – 9.
Gambar 10 Menangkap citra nomor formulir Kegiatan berikutnya pada tahap pengolahan adalah melakukan ekstraksi ciri dari semua nomor formulir yang dijadikan data input pada proses pelatihan dan testing JST. Adapun langkah-langkah yang dilakukan untuk mendapatkan data ini adalah pertama menangkap citra pada lokasi nomor formulir yang terdapat pada dokumen hasil pindai. Untuk mendapat hasil pemotongan yang optimal dilakukan proses deteksi tepi terhadap setiap karakter yang terdapat dalam nomor formulir sebagai mana yang diperlihatkan pada Gambar 11.
21
Menangkap citra nomor
Gambar 11 Menangkap citra nomor formulir Hasil penangkapan citra dalam bentuk greyscale selanjutnya disegmentasi. Proses segmentasi dilakukan pada masing-masing karakter dengan ukuran 10 x 8 pixels seperti yang ditunjukkan oleh Gambar 10. Setiap citra hasil segmentasi selanjutnya diubah kedalam format citra hitam putih. Citra setiap karakter direpresentasikan dalam bentuk biner, yang berwarna hitam diberi nilai 1 dan warna putih diberi nilai 0 sebagaimana yang ditunjukkan pada Gambar 12. Nilai biner dari setiap karakter dibentuk menjadi sebuah vektor sebagai input pada proses JST.
Gambar 12 Representasi citra biner (hitam putih) 3.1.3
Desain Model JST
a. Arsitektur JST Dalam penelitian ini algoritma JST yang digunakan untuk mendapatkan model dan pencocokan pola adalah algoritma propagasi balik. Arsitektur JST yang digunakan adalah Multi Layer Perceptron (MLP) dengan satu lapisan tersembunyi. Pemilihan arsitektur MLP mengacu pada penelitian yang dilakukan oleh park et al 2008. Arsitektur yang digunakan seperti yang ditunjukkan pada Gambar 13.
22
LM
LT
LK
Gambar 13 Model arsitektur MLP pengenalan dokumen. Keterangan Gambar : LK
: Lapisan Keluaran (y1, y2, y3, y4, y5, y6, ..., yn , n = 11)
LT
: Lapisan Tersembunyi (h1, h2, h3, h4, h5, h6, ..., hn , n = variasi jumlah neurons 7, 9, 11, 15, 20, 25, 30, 40, 60)
LM
: Lapisan Masukan ( x1, x2, x3, x4, x5, x6, ..., xn , n = 80 )
xi
: variabel input node i pada lapisan input, i = 0, 1, 2, …, xn
hj
: output node j pada lapisan hidden, j = 0, 1, 2, …,hn
yk
: output node k pada lapisan output, k = 1, 2, .....yn
wij
: bobot yang menghubungkan noda i pada lapisan input dengan node j pada lapisan tersembunyi
vjk
: bobot yang menghubungkan node j pada lapisan tersembunyi dengan node k pada lapisan output
b1
: bias pada lapisan masukan dengan nilai 1
b2
: bias pada layer tersembunyi dengan nilai 1
23
Pada lapisan masukan menggunakan 80 neuron sesuai pixel citra dari setiap karakter nomor dokumen yaitu 10 x 8. Tidak ada kepastian tentang berapa banyak jumlah neuron pada lapisan tersembunyi agar jaringan dapat dilatih dengan sempurna (Siang 2009), pada penelitian sebelumnya (Aprijani 2011) penetapan jumlah neuron pada lapisan tersembunyai divariasikan pada 5, 8, 10 dan 20. Pada Penelitian ini jumlah neuron pada lapisan tersembunyi divariasikan untuk mendapatkan model terbaik yaitu 7, 9, 11, 15, 20, 25, 30, 40, 50, dan 60 neuron. Penetapan jumlah neuron pada lapisan tersembunyi ini dilakukan dengan proses trial and error. Pada lapisan keluaran jumlah neuron ditetapkan dengan penyesuain pendefinian target, dalam hal ini terdapat 11 target yang akan didefinisikan yaitu huruf F dan angka 0 sampai dengan 9. Metode Pemberhentian iterasi digunakan dengan menerapkan error terkecil (MSEmin) dan epoch maximum (Epochmax) sebagaimana yang dilakukan oleh Aprijani 2011. b. Pendefinisian Target Dalam mendesain pengembangan model JST, diharapkan dapat mengenali 11 jenis pola karakter sesuai dengan nomor formulir. Model JST yang dibangun menggunakan fungsi aktifasi sigmoid biner, fungsi aktifasi ini digunakan untuk jaringan syaraf yang dilatih dengan menggunakan metode backpropagation (Kusumadewi 2004). Fungsi sigmoid biner memiliki nilai pada range 0 sampai 1. Fungsi sigmoid biner dirumuskan dengan : = =
.................................................(8)
Karena model JST yang dikembangkan menggunakan fungsi aktifasi sigmoid biner maka diperlukan pendefinisian target yang mengacu pada nomor dokumen yang terdiri dari kombinasi huruf F dan angka 0 sampai dengan 9. Dengan demikian terdapat 11 jenis pola yang akan dihasilkan dari desain Model JST yang dikembangkan. Ke 11 pola tersebut masing masing memiliki target berupa karakter yaitu “F”, ”0”, “1”, “2”, “3”, “4”, “5”, “6”, “7”, “8”, “9”. Pendefinisian target JST yang digunakan seperti pada Tabel 2.
24
Tabel 2 Definisi target No.
Target
H
1 1 0 0 0 0 0 0 0 0 0 0 0 2 0 1 0 0 0 0 0 0 0 0 0 1 3 0 0 1 0 0 0 0 0 0 0 0 2 4 0 0 0 1 0 0 0 0 0 0 0 3 5 0 0 0 0 1 0 0 0 0 0 0 4 6 0 0 0 0 0 1 0 0 0 0 0 5 7 0 0 0 0 0 0 1 0 0 0 0 6 8 0 0 0 0 0 0 0 1 0 0 0 7 9 0 0 0 0 0 0 0 0 1 0 0 8 10 0 0 0 0 0 0 0 0 0 1 0 9 11 0 0 0 0 0 0 0 0 0 0 1 F Keterangan: H : huruf/angka sebagai representasi target c. Metode Pelatihan dan Pengujian Proses pelatihan dan testing dilakukan dalam upaya untuk mendapatkan model JST yang terbaik. Prosedur pelatihan dilakukan dengan melakukan variasi jumlah neuron pada lapisan tersembunyi. Kinerja dari jaringan syaraf diukur dengan melihat error hasil pelatihan, validasi dan testing terhadap sekumpulan data. Data dibagi menjadi dua bagian yang saling asing, yaitu data yang dipakai sebagai pelatihan/validasi dan data yang dipakai untuk testing (Kusumadewi 2004). Pada penelitian yang dilakukan oleh Aprijani 2011, 75%
dari data
penelitian digunakan untuk proses training dan 25% digunakan untuk pengujian (testing). Mengingat keterbatasan jumlah data, percobaan yang akan dilakukan pada penelitian ini akan mengalokasi data untuk pelatihan sebanyak 70% dan data untuk testing sebanyak 30%. Dari 70% data pelatihan yang digunakan memiliki jumlah komposisi karakter yaitu huruf “F” (140 buah), angka “0” (417 buah), angka “1” (106 buah), angka “2” (127 buah), angka “3” (88 buah), angka “4” (36 buah), angka “5” (36 buah), angka “6” (12 buah), angka “7” (12 buah), angka “8” (17 buah), dan angka “9” (13 buah). Untuk mendapatkan hasil pelatihan dengan cepat dan akurat digunakan sebuah algoritma pelatihan traingdx. Algoritma ini merupakan penggabungan dari algoritma gradient conjugate with adaptive learning (traingda) dan gradient conjugate with momentum (traingdm). Algoritma traingdx merupakan fungsi
25
default yang digunakan pada matlab dan memiliki performa kecepatan pelatihan yang tinggi (Siang 2009). Struktur JST yang digunakan selengkapnya disajikan dalam Tabel 3. Tabel 3 Struktur JST Karakteristik
Spesifikasi
Arsitektur
Multi Layer Perceptron
Input Neurons
80
Hidden Neurons (Training Test)
7, 9, 11, 15, 20, 25, 30, 40, 50, 60
Output Neurons
11
Fungsi aktivasi
Sigmoid Biner
Algoritma pelatihan
Traingdx.(Matlab)
Maksimum Epoch
3000
d. Pengambilan Keputusan Pengambilan keputusan dilakukan dengan metode nilai maksimum untuk data yang dikenali. Jika neuron output ke-n merupakan neuron yang memiliki nilai maksimum maka neuron ke-n akan bernilai 1 (satu) dan neuron yang lain bernilai 0 (nol). Sebagai contoh, jika neuron output ketiga bernilai maksimum maka nilai output ketiga akan bernilai 1 dan neuron yang lain bernilai 0, dengan demikian sesuai Tabel 3 jaringan akan mengenalinya sebagai karakter/angka “2”. 3.1.4
Perancangan Aplikasi
Desain aplikasi pengendalian dokumen dilakukan pada tahap ini. Model JST terbaik yang sudah didapatkan pada proses pelatihan dan testing selanjutknya digunakan dalam pengembangan sistem pengendalian dokumen. Dalam membangun aplikasi pengendalian dokumen tersebut diatas dilakukan langkah persiapan terutama yang berkaitan dengan perancangan basis data. Berikut langkah-langkan yang dilakukan: a) Melakukan pengumpulan kebutuhan informasi yang diperlukan meliputi: •
Pemahaman terhadap proses bisnis pengendalian dokumen.
•
Penetapan jumlah unit kerja dan user yang terlibat dalam sistem.
•
Penentuan hak akses oleh setiap pengguna sistem.
26
•
Pemahaman terkait aturan-aturan yang berlaku dalam pengendalian dokumen.
b) Melakukan perancangan konseptual terkait
basis data, perancangan
konseptual diperlukan untuk menggambarkan hubungan antar data, hubungan tersebut dinyatakan dalam digram E-R. c) Melakukan perancangan logis terkait basis data, yaitu melakukan proses transformasi model data konseptual kedalam bentuk model logis. d) Melakukan perancangan fisik terkait basis data, perancangan fisik diperlukan untuk mendapatkan efesiensi dalam pemrosesan data. e) Melakukan testing terhadap sistem pengendalian dokumen, testing ini dilakukan untuk menemukan kesalahan dengan skenario tes yang direncanakan dengan data sesungguhnya. 3.2. Bahan dan Alat Bahan yang digunakan dalam penelitian ini adalah sampel dokumen berupa formulir dan rekaman hasil kegiatan. Sampel fomulir
dan rekaman yang
digunakan adalah versi terakhir. Alat-alat dan perangkat lunak (tool) yang digunakan diantaranya, sebuah perangkat pindai (scanner). Perangkat ini diperlukan sebagai pemindah dari dokumen hardcopy ke bentuk softcopy dalam bentuk citra. Personal Computer atau Notebook dengan minimum spesifikasi Processor type Intel Pentium-4 1.8 GHz, RAM 512 Mb, Hardisk 60 Gb, Matlab versi 2008b, Microsof Visual Basic 6.0 , dan Microsoft
Office 2007 untuk
penulisan program aplikasi dan pengetikan dokumentasi penelitian.