BAB 2 KONSEP DASAR PENGENAL OBJEK 2.1
KONSEP DASAR Pada penelitian ini, penulis menggunakan beberapa teori yang dijadikan
acuan untuk menyelesaikan penelitian. Berikut ini teori yang akan digunakan penulis dalam penyelesaian penelitian. 2.1.1 Artificial Neural Network Artificial Neural Network ( ANN ) adalah jaringan dari sekelompok unit pemproses kecil yang dimodelkan berdasarkan jaringan syaraf manusia. ANN merupakan sistem adaptif yang dapat mengubah strukturnya untuk memecahkan masalah berdasarkan informasi eksternal maupun internal yang mengalir melalui jaringan tersebut. Secara sederhana, ANN adalah sebuah alat pemodelan data statistic non-linear. ANN juga dapat digunakan untuk memodelkan hubungan yang kompleks antara input dan output untuk menemukan pola-pola pada data. Setiap element pemproses memiliki koneksi keluaran tunggal yang bercabang ke sejumlah koneksi kolateral yang diinginkan. Keluaran dari elemen pemproses tersebut dapat merupakan sembarang jenis persamaan matematis yang diinginkan. Seluruh proses yang berlangsung pada setiap elemen pemproses harus benar-benar dilakukan secara lokal, yaitu keluaran hanya bergantung pada nilai masukan pada saat itu yang diperoleh melalui koneksi dan nilai yang tersimpan dalam memori lokal. ANN menjadi salah satu pilihan ketika rumusan persoalan-persoalan yang dihadapi tidak bisa diselesaikan secara analitik, dan dengan mengasumsikan suatu
black box yang kita tidak tahu isinya maka ANN menemukan pola hubungan antara input dan output melalui tahap pelatihan. ANN ditentukan oleh 3 faktor, antara lain: a. Pola hubungan antar neuron ( disebut dengan arsitektur jaringan ) b. Metode untuk menentukan bobot penghubung ( disebut metode training / learning / algoritma ) c. Fungsi aktivasi ( fungsi transfer ) Arsitektur jaringan dan algoritma pelatihan sangat menentukan model-model ANN. Arsitektur tersebut gunanya untuk menjelaskan arah perjalanan sinyal atau data di dalam jaringan. Sedangkan algoritma belajar menjelaskan bagaimana bobot koneksi harus diubah agar pasangan masukan-keluaran yang diinginkan dapat tercapai. Dalam setiap perubahan harga bobot koneksi dapat dilakukan dengan berbagai cara, tergantung pada jenis algoritma pelatihan yang digunakan. Dengan mengatur besarnya nilai bobot ini diharapkan bahwa kinerja jaringan dalam mempelajari berbagai macam pola yang dinyatakan oleh setiap pasangan masukankeluaran akan meningkat. Sebagai contoh, perhatikan neuron Y pada gambar berikut:
Gambar 2.1 Sebuah sel syaraf tiruan Y menerima input dari neuron X1, X2, dan X3 dengan bobot hubungan masing-masing adalah W1, W2, dan W3. Ketiga impuls neuron yang ada dijumlahkan, net = X1W1 + X2W2 + X3W3 . Besarnya impuls yang diterima oleh Y mengikuti fungsi aktivasi y = f(net). Apabila nilai fungsi aktivasi cukup kuat, maka sinyal akan diteruskan. Nilai 7
fungsi aktivasi ( keluaran model jaringan ) juga dapat dipakai sebagai dasar untuk mengubah bobot. Arsitektur ANN yang digunakan dalam tugas akhir ini adalah sebagai berikut : -
Jaringan layar jamak
Jaringan ini merupakan perluasan dari layar tunggal. Dalam jaringan ini, selain unit input dan output, ada unit-unit lain yang sering disebut layar tersembunyi. Layar tersembunyi ini bisa saja lebih dari satu, sebagai contoh perhatikan gambar 2.3 di bawah ini : Y1
1
...
Z1
...
Yk
Zj
Ym
Zp
ij
1
X1
...
Xi
np
...
Xn
Gambar 2.2 Jaringan layar jamak Pada gambar 2.2 diperlihatkan jaringan dengan n buah unit masukan ( X1, X2,…,Xn ), sebuah layar tersembunyi yang terdiri dari m buah unit ( Z1, Z2,…,Zm ), dah 1 buah unit keluaran. Jaringan layar jamak dapat menyelesaikan masalah yang lebih kompleks dibandingkan dengan layar tunggal, meskipun kadangkala proses pelatihan lebih kompleks dan lama.
8
2.1.2 BackPropagation Dalam ANN terdapat konsep belajar atau pelatihan. Sehingga jaringanjaringan yang dibentuk akan belajar melakukan generalisasi karakteristik tingkah laku objek. Algoritma pelatihan artinya membentuk pemetaan ( fungsi ) yang menggambarkan hubungan antara vektor masukan dan vektor keluaran. Algoritma pelatihan yang dipakai dalam tugas akhir ini adalah algoritma Backpropagation. Backpropagation adalah salah satu metode dari ANN yang dapat diaplikasikan dengan baik dalam bidang pengenalan bentuk ( pattern recognition ). Backpropagation melatih jaringan untuk mendapatkan keseimbangan antara kemampuan jaringan mengenali pola yang digunakan selama training serta kemampuan jaringan untuk memberikan respon yang benar terhadap pola masukan yang serupa namun tidak sama dengan pola yang dipakai selama pelatihan. Dalam pelatihan dengan backpropagation sama halnya seperti pelatihan pada jaringan syaraf yang lain. Pada jaringan feedforward ( umpan maju ), pelatihan dilakukan dalam rangka perhitungan bobot sehingga pada akhir pelatihan akan diperoleh bobot-bobot yang baik. Selama proses pelatihan, bobot-bobot diatur secara iterative untuk meminimumkan error ( kesalahan ) yang terjadi. Kesalahan dihitung berdasarkan Mean Square Error ( MSE ). Rata-rata kuadrat kesalahan juga dijadikan dasar perhitungan unjuk kerja fungsi aktivasi. Dimana perhitungan MSE yang biasa digunakan adalah : 1. kesalahan kuadrat dibagi dengan jumlah komponen keluaran 2. kesalahan kuadrat total dibagi dengan jumlah data pelatihan dimana rumus yang biasa digunakan adalah sebagai berikut : MSE = ( ∑ ( T – Ym )² ) / m Dimana ,
9
T = Error yang terjadi saat iterasi tersebut Ym = nilai output yang keluar pada iterasi tersebut M = jumlah data yang ditraining Penggunaan MSE dapat dilihat dari Lampiran hal 16 ( L16). Ada 3 face pelatihan backpropagation antara lain : 1. Fase pertama, yaitu Feed Forward Dalam Feed Forward, setiap sinyal masukan dipropagasi ( dihitung maju ) ke layar tersembunyi hingga layar keluaran dengan menggunakan fungsi aktivasi yang ditentukan. 2. Fase kedua, yaitu Backward Kesalahan ( selisih antara keluaran jaringan dengan target yang diinginkan ) yang terjadi di Backward mulai dari garis yang berhubungan lansung dengan unit-unit di layar keluaran. 3. Fase ketiga, yaitu perubahan bobot Pada fase ini dilakukan modifikasi bobot untuk menurunkan kesalahan yang terjadi. Ketiga fase tersebut diulang-ulang terus hingga kondisi penghentian dipenuhi. Algoritma pelatihan untuk jaringan dengan satu layar tersembunyi ( dengan fungsi aktivasi sigmoid biner ) adalah sebagai berikut : a. Langkah 0 : inisialisasi semua bobot dengan bilangan acak kecil b. Langkah 1 : jika kondisi penghentian belum terpenuhi, lakukan langkah 2-8 c. Langkah 2 : untuk setiap pasang data pelatihan lakukan langkah 3-8 Fase pertama : Propagasi maju
10
d. Langkah 3 : tiap unit input ( Xi, i= 1,…,n ) menerima sinyal x, dan meneruskannya ke unit tersembunyi diatasnya ( hidden layer ) e. Langkah 4 : hitung semua keluaran di unit tersembunyi Zj ( j = 1,2,….,p )
(2.1)
(2.2)
f. Langkah 5 : hitung semua keluaran jaringan di unit Yk ( k = 1,2,…m )
(2.3)
(2.4) Fase Kedua : Backward g. Langkah 6 : hitung faktor o
unit keluaran berdasarkan kesalahan
disetiap unit keluaran Yk ( k = 1,2,….,m ) (2.5) δk Merupakan unit kesalahan yang akan dipakai dalam perubahan bobot layar di bawahnya ( langkah 7 ) Hitung suku perubahan bobot Wkj ( yang akan dipakai nanti untuk ( mengubah bobot Wkj ) dengan laju percepatan α ; k = 1,2,….m ; j = 0,1,…,p 11
(2.6)
h. Langkah 7 : hitung faktor δ unit tersembunyi berdasarkan kesalahan di setiap unit tersembunyi Zj ( j = 1,2,…,p )
(2.7) Faktor δ unit tersembunyi :
(2.8) Hitung suku perubahan bobot Vji ( yang akan dipakai nanti untuk ( mengubah bobot Vji )
; j = 1,2,…,p ; I = 0,1,….,n
(2.9)
Fase ketiga : perubahan bobot i. Langkah 8 : Hitung semua perubahan bobot Perubahan bobot garis yang menuju ke unit keluaran : (2.10) ( k = 1,2,…,m ; j = 0,1,….,p ) Perubahan bobot garis yang menuju ke unit tersembunyi : (2.11) ( j = 1,2,….,p ; I = 0,1,….n ) j. Langkah 9 : tes kondisi berhenti Setelah pelatihan selesai dilakukan, jaringan dapat dipakai untuk pengenalan pola, dalam hal ini, hanya propagasi maju ( langkah 4 dan 5 ) saja yang dipakai untuk menentukan keluaran jaringan.
12
Dalam beberapa kasus pelatihan yang dilakukan memerlukan iterasi yang banyak sehingga membuat proses pelatihan menjadi lama. Untuk mempercepat iterasi dapat dilakukan dengan parameter α atau laju pemahaman. Nilai α terletak antara 0 dan 1 ( 0 ≤ α ≤ 1 ). Jika harga α semakin besar, maka iterasi yang dipakai semakin sedikit. Akan tetapi jika harga α terlalu besar, maka akan merusak pola yang sudah benar sehingga pemahaman menjadi lambat. Proses pelatihan yang baik dipengaruhi pada pemilihan bobot awal, karena bobot awal sangat mempengaruhi apakah jaringan mencapai titik minimum lokal atau global, dan seberapa cepat konvergensinya. Oleh karena itu dalam standar backpropagation bobot dan bias diisi dengan bilangan acak kecil dan biasanya bobot awal diinisialisasi secara random dengan nilai antara -0,5 sampai 0,5 ( atau -1 sampai 1 atau interval yang lainnya ). Dalam back propagation, standar perubahan bobot didasarkan atas gradien yang terjadi untuk pola yang dimasukkan saat itu. Modifikasi dilakukan dengan mengubah bobot yang didasarkan atas arah gradien pola terakhir dan pola sebelumnya ( momentum ) yang dimasukkan. Jadi perhitungannya tidak hanya pola masukan terakhir saja. Momentum ditambahkan untuk menghindari perubahan bobot yang mencolok akibat adanya data yang sangat berbeda dengan data yang lainnya. Jika beberapa data terakhir yang diberikan ke jaringan memiliki pola serupa ( berarti arah gradient sudah benar ), maka perubahan bobot dilakukan secara cepat. Namun jika data terakhir yang dimasukkan memiliki pola yang berbeda dengan pola sebelumnya, maka perubahan bobot dilakukan secara lambat. Dengan penambahan momentum, bobot baru pada waktu ke ( t + 1 ) didasarkan atas bobot pada waktu t dan ( t - 1 ). Disini harus ditambahkan dua variable yang mencatat besarnya momentum untuk dua iterasi terakhir.
13
Jika µ adalah konstanta ( 0 ≤ µ ≤ 1 ) yang menyatakan parameter momentum maka bobot baru dihitung berdasarkan persamaan berikut ini : (2.12) = bobot awal pola kedua ( hasil dari iterasi pola pertama ) = bobot awal pada iterasi pola pertama Dan (2.13) Dengan, = bobot awal pola kedua ( hasil iterasi pola pertama ). = bobot awal pada iterasi pertama
Dalam algoritma backpropagation ini akan digunakan Salah satu fungsi aktivasi yang sering dipakai yaitu fungsi sigmoid biner yang memiliki range (0,1). Fungsi sigmoid biner didefinisikan sebagai berikut.
(2.14) Fungsi sigmoid biner memiliki nilai pada range 0 sampai 1, oleh karena itu, fungsi ini sering digunakan untuk jaringan syaraf yang nilai outputnya antara 0 sampai dengan 1. Fungsi sigmoid biner ini terlampirkan dalam lampiran hal 18 ( L18 ).
14
2.2
IMAGE PROCESSING
2.2.1 Grayscaling Model warna RGB adalah model warna yang adifit yang dapat dikombinasikan untuk membuat warna yang lainnya. Sistem warna RGB terdiri dari tiga bagian utama, yaitu merah ( Red ), hijau ( Green ), dan Biru ( Blue ). Pada umumnya setiap warna RGB terdiri dari delapan bit yang memiliki nilai sebanyak 256 nilai. Variasi nilai yang terbentuk antara 0 hingga 255. Jumlah bit yang digunakan untuk merepresentasikan setiap pixel dalam sistem warna RGB disebut dengan pixel depth. Jadi jika tiap warna dalam RGB memiliki 8 bit maka dapat dikatakan pixel depth untuk sistem warna ini adalah 24 bit. Jika nilai-nilai RGB dikombinasikan, maka total jenis warna yang dapat dibentuk adalah
=
16.777.216 warna. Grayscaling adalah proses perubahan nilai pixel dari warna ( RGB ) menjadi gray level. Pada dasarnya proses ini dilakukan dengan meratakan nilai pixel dari 3 nilai RGB menjadi 1 nilai. Untuk memperoleh hasil yang lebih baik, nilai pixel tidak langsung dibagi menjadi 3 melainkan terdapat persentasi dari masing-masing nilai. Salah satu cara untuk melakukan konversi gambar ke grayscale adalah dengan menggunakan sistem warna YUV, yaitu dengan mengkonversi RGB ke YUV lalu mengambil komponen Y ( iluminasi ). Hal ini dilakukan menggunakan persamaan sebagai berikut, Gray = Y = ( 0.2989 x R ) + ( 0.5870 x G ) + ( 0.1140 x B ) (2.15) 2.2.2 Binarization Proses binarization adalah proses pemisahan pixel yang ada pada image menjadi hanya 2 jenis pixel yaitu titik putih ( dengan pixel 255 ) dan titik hitam ( dengan pixel 0 ). Hal ini dilakukan dengan memberikan batasan antara pixel-pixel
15
yang ada dari image hasil gray scale. Hal ini dilakukan dengan mengambil nilai tengah dari pixel minimum ( 0 ) dan pixel maksimum ( 255) yaitu pixel dengan nilai 128 sebagai nilai titik tengah pembatas, hal ini berarti bahwa : a. Bila pixel tersebut lebih kecil dari 128 ( pixel ≤ 128 ) maka nilai pixel tersebut akan menjadi 0 ( pixel = 0 ), warna abu-abu dominan akan dijadikan warna hitam ( pixel = 0 ) b. Bila pixel tersebut lebih besar dari 128 ( pixel > 128 ) maka nilai pixel tersebut akan menjadi 255 ( pixel = 255 ), warna abu-abu yang agak terang akan dijadikan warna putih ( pixel = 255 ) Hal ini dilakukan agar dalam gambar hanya akan ada 2 nilai utama di mana pixel hitam untuk selanjutkan akan disamakan dengan nilai 0 ( pixel = 0 ) dan pixel putih akan disamakan dengan nilai 1 ( pixel = 1 ) dalam image yang ada. Hal ini akan mempermudah dalam pencarian bentuk dalam image yang ada dan penggunaan fungsi sigmoid biner, dimana range data yang digunakan adalah 0 sampai dengan 1.
2.2.3 Region of Interest Image dari hasil object segmentation akan dibagi menjadi 9 area region of interest, di mana 9 area tersebut akan dihitung perbandingan titik hitam dengan titik putih yang hasilnya akan digunakan sebagai input untuk proses training dengan metode backpropagation. Dari berbagai proses image processing akan didapat suatu kumpulan nilai yang disimpan dalam data value yang akan digunakan sebagai data untuk proses backpropagation. Lalu dari hasil training akan didapatkan value yang disimpan dalam temporary output data, yang akan dibandingkan dengan output data dari training gambar lain untuk menentukan tipe mobil gambar tersebut.
16