BAB 2 LANDASAN TEORI
Dalam bab ini diuraikan beberapa landasan teori yang terkait, mencakup konsep
hyperspectral, neuro–fuzzy dan soft computing, teori himpunan fuzzy meliputi himpunan fuzzy, sistem inferensi fuzzy (fuzzy inference system, FIS), serta fuzzy clustering, yaitu fuzzy c-means (FCM), jaringan syaraf tiruan, metode regresi penduga kuadrat terkecil (least square estimator, LSE) , metode optimisasi penurunan tercuram (steepest descent, SD), Adaptive Neuro – Fuzzy Inference System (ANFIS) dan Hyperspectral. 2.1.
Neuro-Fuzzy dan Soft Computing
2.1.1. Pengertian Neuro-Fuzzy dan Soft Computing Menurut Jang (1997, p76), neuro-fuzzy dan soft computing (SC) adalah integrasi dua pendekatan komplementer: jaringan syaraf (neural network, NN) yang mengenali pola dan beradaptasi untuk menanggulangi lingkungan yang berubah-ubah; sistem inferensi fuzzy (fuzzy inference systems, FIS) yang menggabungkan pengetahuan manusia serta melakukan inferensi dan pembuatan keputusan. Sinergi ini memungkinkan SC menggabungkan pengetahuan manusia secara efektif, menghadapi ketidaktepatan dan ketidakpastian, dan belajar beradaptasi dengan lingkungan yang tidak diketahui atau berubah – ubah untuk performa yang lebih baik.
5
6 2.1.2. Karakteristik Neuro-Fuzzy dan Soft Computing a) Kepakaran Manusia SC menggunakan kepakaran manusia dalam bentuk aturan if-then fuzzy, sama baiknya
seperti
dalam
representasi
pengetahuan
konvensional,
untuk
memecahkan masalah-masalah praktis. b) Model-model komputasi biologically inspired Diinspirasi oleh NN biologis, NN tiruan digunakan secara ekstensif dalam SC untuk menghadapi persepsi, pengenalan pola, dan regresi nonlinier serta masalah-masalah klasifikasi. c) Teknik-teknik optimasi baru SC mengaplikasikan metode-metode optimasi inovatif yang timbul dari berbagai sumber. d) Komputasi numeris Tidak seperti kecerdasan buatan (Artificial Intelligence / AI) yang simbolik, SC terutama bergantung pada komputasi numeris. e) Domain-domain aplikasi baru Karena komputasi numerisnya, SC telah menemukan sejumlah domain aplikasi baru disamping domain-domain dengan pendekatan AI. Domaindomain aplikasi ini membutuhkan komputasi yang intensif. f)
Pembelajaran bebas model NN dan FIS adaptif mempunyai kemampuan untuk membangun
model
menggunakan hanya data contoh system target. Pengetahuan detil dalam sistem target menolong men-set struktur model inisial, tetapi bukan keharusan.
7 g) Komputasi intensif Tanpa asumsi banyak pengetahuan background masalah yang sedang diselesaikan, neuro-fuzzy dan SC sangat bergantung pada komputasi menerkah angka kecepatan tinggi untuk menemukan aturan-aturan atau keberaturan dalam himpunan data. h) Toleransi kesalahan Penghapusan sebuah neuron dalam suatu NN atau sebuah aturan dalam FIS, tidak menghancurkan system. Sistem tetap bekerja karena arsitektur parallel dan redundannya meskipun kualitas performa berangsur memburuk. i) Karakteristik goal driven Neuro-fuzzy dan SC adalah goal-driven; jalan yang memimpin state kini ke solusi tidak terlalu penting selama bergerak menuju tujuan dalam long run. Pengetahuan domain spesifik menolong
mengurangi waktu komputasi dan
pencarian tetapi bukan suatu kebutuhan. j) Aplikasi-aplikasi dunia riil Semua masalah dunia riil mengandung ketidakpastian built-in yang tidak dapat dielakkan, sehingga terlalu cepat menggunakan pendekatan konvensional yang memerlukan deskripsi detil masalah yang sedang dipecahkan. SC adalah pendekatan terintegrasi yang seringkali dapat menggunakan teknik-teknik spesifik dalam subtugas-subtugas untuk membangun solusi umum yang memuaskan untuk masalah dunia riil.
8 2.2.
Logika Fuzzy Dalam teori logika fuzzy menjelaskan sejarah, definisi dan terminologi dasar,
teori operasi himpunan fuzzy, parameter dan formulasi fungsi keanggotaan (membership function) serta konfigurasi dan desain sistem logika fuzzy. Teori logika fuzzy dikemukakan pertama kali oleh Lotfi A. Zadech tahun 1965, yaitu suatu pendekatan komputasional dalam pengambilan keputusan sesuai dengan cara berfikir manusia yang mengijinkan adanya ketidakpastian dan memperlihatkan suatu logika yang bergradasi. Seperti yang dilakukan oleh manusia dalam mengambil keputusan, pengertian – pengertian yang ada di dalam pemikiran manusia diukur dengan kualitas daripada kuantitas. Dalam logika klasik hanya mengenal dua nilai kebenaran yaitu benar atau salah yang disimbolkan oleh nilai 1 dan 0, serta perubahan keanggotaan pada himpunan klasik berubah secara drastis. Tetapi pada logika fuzzy sesuatu dapat bernilai diantara 0 dan 1, serta nilai anggota himpunan diperbolehkan mempunyai gradasi diantara menjadi anggota penuh atau hanya sebagian. Sehingga perubahan keanggotaan pada logika fuzzy berlangsung secara perlahan atau memberikan nilai kebenaran yang bergradasi. Misalkan pada pengertian “tinggi“ yang sering digunakan dalam hidup keseharian. Pada himpunan klasik hanya mengenal seseorang tinggi jika orang tersebut memiliki tinggi 180 cm, sedangkan dibawah 180 cm disebut “pendek“. Namun pada himpunan fuzzy, orang yang memiliki tinggi badan 2m mempunyai nilai kebenaran penuh atau 1. Sedangkan bila tingginya 175 cm maka seseorang dianggap misalnya 90 % tinggi. Gambar 2.1 dan 2.2 menunjukkan perbedaan antara himpunan klasik dan himpunan fuzzy.
9 µ 1
0
180 Tinggi badan (cm)
Gambar 2.1. Fungsi keanggotaan tinggi badan orang berdasarkan teori logika klasik µ 1
0
175 180 Tinggi badan (cm)
Gambar 2.2. Fungsi keanggotaan tinggi badan orang berdasarkan teori logika fuzzy
2.2.1. Himpunan Fuzzy Himpunan fuzzy (kabur) adalah generalisasi konsep himpunan biasa (ordiner). Untuk semesta wacana x, himpunan fuzzy ditentukan oleh fungsi keanggotaan yang memetakan anggota x ke rentang keanggotaan dalam interval [0,1]. Sedangkan untuk himpunan biasa fungsi keanggotaan bernilai diskrit 0 dan 1. Menurut Kusumadewi (2006, p19) Fungsi keanggotaan (Membership Function / MF) adalah suatu kurva yang menunjukkan pemetaan titik-titik input data ke dalam nilai keanggotaannya. Berikut didefinisikan beberapa kelas Membership Function (MF) terparameter satu dimensi, yaitu MF dengan sebuah input tunggal.
10 MF segitiga dispesifikasikan oleh tiga parameter {a,b,c} seperti berikut:
Gambar 2.3. MF segitiga Parameter {a,b,c} {dengan a
Gambar 2.4. MF trapesium Parameter {a,b,c,d} (dengan a
11 µ gauss (x; c,σ) = e
(2.1)
dimana c merepresentasikan pusat MF dan σ mendefinisikan lebar MF. MF bel umum (atau MF bel) dispesifikasikan oleh tiga parameter {a,b,c}: Bell = (x;a,b,c) =
(2.2)
|
|
Dengan b selalu positif (+) MF sigmoid didefinisikan oleh
Gambar 2.5. MF sigmoid
(2.3)
sig(x;a,c) = dengan a = pengontrol slope pada titik perpotongan x = c. MF left right (L-R) dispesifikasikan oleh tiga parameter {α, β, c}: FL (
), x
c
LR(x; α, β, c)
(2.4) FR (
), x
c
12 dengan FL (x) dan FR (x) adalah fungsi yang secara monoton berkurang pada [0,∞] dengan FL (0) = FR (0) = 1 dan lim FL (x) = maks (0, √1 FL (x) = e
FL x
= lim
FR x
= 0, yaitu :
x
(2.5)
| |
(2.6)
2.2.2. Konfigurasi Sistem Logika Fuzzy Sebuah proses pengambilan keputusan akan mengambil masukan-masukan yang selanjutnya akan dipetakan ke keluaran yang sesuai berdasarkan aturan-aturan tertentu dan dilakukan dengan mengikuti alur pola logika fuzzy. Secara umum, proses sistem logika fuzzy dapat dijelaskan dengan gambar berikut ini:
Masukkan
Fuzzifikator
Inferensiator
Fungsi Keanggotaan Input
Bank Aturan (Memory Asosiatif Fuzzy
Defuzzifikator
Keluaran
Fungsi Keanggotaan Output
Gambar 2.6. Blok diagram konfigurasi sistem logika fuzzy Secara singkat, bagian utama dari konfigurasi system logika fuzzy sesuai dengan yang ditunjukkan Gambar 2.6. adalah : ¾ Fungsi keanggotaan input dan output adalah suatu fungsi yang memetakan tiap anggotanya dalam derajat keanggotaan. ¾ Fuzzifikator adalah bagian yang mengubah input-input crisp yang dimasukkan ke dalam himpunan fuzzy, serta menghasilkan derajat keanggotaan input pada daerah yang sesuai.
13 ¾ Inferensiator adalah bagian yang memproses inferensi (membangkitkan aturanaturan sesuai daerah input). Di dalamnya terdapat kumpulan aturan yang selanjutnya menghasilkan daerah output dengan derajat aktivasi. ¾ Defuzzifikator adalah proses defuzzifikasi yang menghubungkan daerah output ke output crisp. ¾ Bank Aturan (Memori Asosiatif Fuzzy) adalah bagian berisi kumpulan aturanaturan yang memetakan input terhadap output. 2.2.3. Sistem Inferensi Fuzzy (Fuzzy Inference System) Menurut Kusumadewi (2006, p34), sistem inferensi fuzzy adalah suatu kerangka komputasi berdasarkan pada konsep teori set fuzzy, fuzzy if-then rules dan pemikiran fuzzy. Sistem ini telah berhasil diaplikasikan dalam berbagai bidang yang sangat luas, seperti pengendalian otomatis, klasifikasi data, analisis keputusan, system pakar, prediksi rentetan waktu, robotic dan pengenalan pola. Oleh karena banyak diaplikasikan dalam berbagai bidang multidisiplin, maka sistem inferensi fuzzy sering disebut juga system fuzzy rule based, system pakar fuzzy, model fuzzy, memory asosiatif fuzzy, pengendalian logika fuzzy dan sistem fuzzy lainnya. Struktur dasar dari system inferensi fuzzy terdiri dari tiga komponen yaitu suatu kumpulan aturan-aturan berupa pilihan aturan-aturan fuzzy, pusat data (database) berupa fungsi-fungsi kenggotaan yang digunakan di dalam aturan-aturan fuzzy, dan mekanisme pemikiran, yang melakukan prosedur penyimpulan (umumnya pemikiran fuzzy) atas aturan-aturan dan memberikan fakta untuk mendapatkan suatu keluaran yang layak atau kesimpulan. Untuk masukkan berupa set crisp atau fuzzy dan keluarannya menghasilkan hampir selalu set fuzzy. Kadang-kadang diperlukan keluaran berupa suatu set crisp,
14 khususnya dalam suatu situasi dimana sistem inferensi fuzzy digunakan sebagai pengendali. Oleh karena itu, diperlukan suatu metode defuzzifikasi untuk menggali nilai crisp yang mewakili suatu set fuzzy terbaik. Rule 1 fuzzy X is A1 crisp or fuzzy X
Y is B1 fuzzy
Rule 2
Y is B2
X is A2
Aggregator
Defuzzifier
Y
Rule n
X is A3
Y is B3
Fuzzy
Gambar 2.7. Diagram blok sistem inferensi fuzzy. Adapun diagram blok dari sistem inferensi fuzzy ditunjukkan dalam Gambar 2.7. Pada sistem inferensi fuzzy tersebut sebagai input adalah X yang berupa nilai crisp, beberapa aturan-aturan atau rule (rule-1, rule-2,… , rule-n) yang menghubungkan input dengan pengumpul (aggregator) dan menghasilkan suatu set fuzzy, kemudian oleh pendefuzzifikasi (deffuzifier) nilai dalam set fuzzy akan diubah lagi ke nilai crisp pada output Y. 2.2.4
Fuzzy C-Means (FCM) Menurut Kusumadewi (2006, p282) FCM adalah suatu teknik pengclusteran data
yang mana keberadaan tiap-tiap data dalam suatu cluster ditentukan oleh nilai keanggotaan. Konsep dasar FCM, pertama kali adalah menentukan pusat cluster yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan
15 nilai keanggotaan tiap-tiap data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Menurut Kusamadewi (Zimmerman, 1991, p283), algoritma FCM diberikan sebagai berikut: 1. Tentukan: a. Matriks X berukuran n x m, dengan n = jumlah data yang akan dicluster; dan m = jumlah variabel (kriteria). b. Jumlah cluster yang akan dibentuk = C ( 2). c. Pangkat (pembobot) = w ( 1). d. Maksimum iterasi. e. Kriteria penghentian = ε (nilai positif yang sangat kecil) f. Iterasi awal, t = 1, dan ∆ = 1. 2. Bentuk matriks partisi awal, U0, sebagai berikut: µ11 (x1)
µ12 (x2)
…
µ1n (xn)
µ21 (x1)
µ22 (x2)
…
µ2n (xn)
U=
.
.
.
.
.
.
.
.
µC1 (x1)
µC2 (x2)
…
µCn (xn)
(matriks partisi awal biasanya dipilih secara acak). 3. Hitung pusat cluster (V), untuk setiap cluster : Vij =
∑
µ ∑
.X µ
(2.7)
4. Perbaiki derajat keanggotaan setiap data pada setiap cluster (perbaiki matriks partisi), sebagai berikut :
16 µ = ∑C
/
(2.8)
Dengan: dik = d(xk - vi) = ∑
x
v
/
(2.9)
5. Tentukan criteria berhenti, yaitu perubahan matriks partisi pada iterasi sekarang dengan iterasi sebelumnya, sebagai berikut: ∆ = || U Apabila ∆
U
|| ε maka iterasi dihentikan, namun apabila ∆
(2.10) ε, maka naikkan
iterasi (t=t+1) dan kembali ke langkah-3. 2.3.
Jaringan Syaraf Tiruan Menurut Kusumadewi (2006, p59), jaringan syaraf tiruan adalah merupakan
salah satu representasi buatan dari otak manusia yang selalu mencoba untuk mensimulasikan proses pembelajaran pada otak manusia tersebut. Jaringan syaraf tiruan dikembangkan sebagai model matematis dari syaraf biologis dengan berdasarkan asumsi bahwa: 1. Pemrosesan terjadi pada elemen-elemen sederhana yang disebut neuron. 2. Sinyal dilewatkan antar neuron melalui penghubung. 3. Setiap penghubung memiliki bobot yang akan mengalikan sinyal yang lewat. 4. Setiap neuron memiliki fungsi aktivasi yang akan menentukan nilai sinyal output. Jaringan syaraf dapat digolongkan menjadi berbagai jenis berdasarkan pada arsitekturnya, yaitu pola hubungan antara neuron-neuron, dan algoritma trainingnya, yaitu cara penentuan nilai bobot pada penghubung.
17 2.3.1
Multi-Layer Perceptron Multi-Layer Perceptron adalah jaringan syaraf tiruan feedforward yang terdiri
dari sejumlah neuron yang dihubungkan oleh bobot-bobot penghubung. Neuron-neuron tersebut disusun dalam lapisan-lapisan yang terdiri dari satu lapisan input (input layer), satu atau lebih lapisan tersembunyi (hidden layer), dan satu lapisan output (output layer). Menurut Riedmiller (1994, p50), lapisan input menerima sinyal dari luar, kemudian melewatkannya ke lapisan tersembunyi pertama, yang akan diteruskan sehingga akhirnya mencapai lapisan output. Setiap neuron i di dalam jaringan adalah sebuah unit pemrosesan sederhana yang menghitung nilai aktivasinya yaitu si terhadap input eksitasi yang juga disebut net input net i.
neti = ∑
s w
θ
(2.11)
dimana pred(i) melambangkan himpunan predesesor dari unit i,wij melambangkan bobot koneksi dari unit j ke unit i, dan θ adalah nilai bias dari unit i. Untuk membuat representasi menjadi lebih mudah, seringkali bias digantikan dengan suatu bobot yang terhubung dengan unit bernilai 1. Dengan demikian bias dapat diperlakukan secara sama dengan bobot koneksi. Aktivasi dari unit i, yaitu si , dihitung dengan memasukkan net input ke dalam sebuah fungsi aktivasi non-linear. Biasanya digunakan fungsi logistik sigmoid:
si = f
net
(2.12)
Salah satu keuntungan dari fungsi ini adalah memiliki turunan yang mudah dihitung:
f′
net
s
1
s
(2.13)
18 Menurut Fausett (1994, p78), nilai dari fungsi sigmoid di atas memiliki nilai output antara 0 dan 1. Jika diinginkan nilai output antara –1 dan 1, dapat digunakan fungsi bipolar sigmoid berikut :
s
g
net
1
(2.14)
Derivatif dari fungsi tersebut adalah:
g′
net
1
s
1
s
(2.15)
Back Propagation adalah istilah dalam penggunaan metoda Multi Layer Perceptron untuk melakukan proses update pada nilai vektor weight dan bias. Adapun bentuk metoda weight ini memiliki beberapa macam, antara lain adalah sebagai berikut : •
Gradient Descent Back Propagation (GD) Metode steepest descent, juga dikenal sebagai gradient descent method, salah
satu dari teknik lama untuk meminimalkan fungsi yang didefinisikan pada ruang input multidimensi. Metode ini membentuk dasar bagi banyak metode langsung yang digunakan dalam mengoptimalkan masalah yang terbatas maupun yang tidak terbatas. Walaupun metode ini konvergensinya lambat, tetapi metode ini paling sering digunakan dalam teknik optimasi nonlinier karena kesederhanaanya. Metoda ini merupakan proses update untuk nilai weight dan bias dengan arah propagasi fungsinya selalu menurunkan nilai weight sebelumnya. Bentuk vektor weight tersebut berlaku seperti metoda berikut : Wk+1 = wk – α . gk
(2.16)
Dimana α merupakan Learning rate serta g merupakan gradient yang berhubungan dengan nilai error yang diakibatkan oleh weight tersebut.
19 •
Gradient Descent Back Propagation dengan Momentum (GDM) Penggunaan Momentum pada Metoda ini memberikan nilai tambah dimana hasil
update diharapkan tidak berhenti pada kondisi yang dinamakan Local Minimum, sehingga proses penelusuran hingga mencapai nilai minimum yang paling puncak dalam pengertian nilai error yang paling kecil dapat tercapai. •
Variable Learning Rate Back Propagation dengan Momentum (GDX) Penggunaan metoda ini bertujuan untuk mempercepat waktu penyelesaian
sehingga proses mendapatkan nilai error yang paling kecil dapat tercapai dengan cepat serta penelusuran yang lebih singkat. Sebaliknya jika nilai yang digunakan dalam praktisnya maka hasil yang didapatkan biasanya akan memperlambat proses penelusuran nilai error yang paling kecil. Dalam penggunaan metoda ini para peniliti biasanya menggunakan cara memperbesar nilai dari Variabel Learning Rate saat hasil yang dicapai jauh dari target, dan sebaliknya saat hasil yang dicapai dekat dengan nilai target. •
Conjugate Gradient Back Propagation (CGP) Conjugate Gradient Back Propagation memiliki perbedaan dibandingkan dengan
metoda GD yaitu pada saat melakukan proses update, dimana untuk metoda GD proses tersebut dilakukan setiap penggunaan rumus sedangkan pada proses CGX, update dilakukan setiap iterasi dilakukan. •
Quasi-Newton Back Propagation (BPGS) Metoda Newton ini merupakan improvisasi dari metoda CGX, dimana
pencapaian nilai konfigurasi dapat dilakukan lebih cepat.
20 2.3.2
Supervised Learning Tujuan pada pembelajaran supervised learning adalah untuk menentukan nilai
bobot-bobot koneksi di dalam jaringan sehingga jaringan dapat melakukan pemetaan (mapping) dari input ke output sesuai dengan yang diinginkan. Pemetaan ini ditentukan melalui satu set pola contoh atau data pelatihan (training data set). Setiap pasangan pola p terdiri dari vektor input xp dan vektor target tp. Setelah selesai pelatihan, jika diberikan masukan xp seharusnya jaringan menghasilkan nilai output tp. Besarnya perbedaan antara nilai vektor target dengan output aktual diukur dengan nilai error yang disebut juga dengan cost function:
E=
∑
P∑
t
s
(2.17)
di mana n adalah banyaknya unit pada output layer. Tujuan dari training ini pada dasarnya sama dengan mencari suatu nilai minimum global dari E. 2.4.
Adaptive Neuro Fuzzy Inference System (ANFIS) Menurut Kusumadewi (2006, p359), Adaptive Neuro-Fuzzy Inference System
(ANFIS) adalah arsitektur yang secara fungsional sama dengan fuzzy rule base model Sugeno, dan juga sama dengan jaringan syaraf dengan fungsi radial dengan sedikit batasan tertentu. Adaptive Neuro-Fuzzy Inference System (ANFIS) merupakan jaringan adaptif yang berbasis pada sistem kesimpulan fuzzy (fuzzy inference system). Dengan penggunaan suatu prosedur hybrid learning, ANFIS dapat membangun suatu mapping input-output yang keduanya berdasarkan pada pengetahuan manusia (pada bentuk aturan fuzzy if-then) dengan fungsi keanggotaan yang tepat.
21 Sistem kesimpulan fuzzy yang memanfaatkan aturan fuzzy if-then dapat memodelkan aspek pengetahuan manusia yang kwalitatif dan memberi reasoning processes tanpa memanfaatkan analisa kwantitatif yang tepat. Ada beberapa aspek dasar dalam pendekatan ini yang membutuhkan pemahaman lebih baik, secara rinci: 1. Tidak ada metoda baku untuk men-transform pengetahuan atau pengalaman manusia ke dalam aturan dasar (rule base) dan database tentang fuzzy inference system. 2. Ada suatu kebutuhan bagi metoda efektif untuk mengatur (tuning) fungsi keanggotaan (Membership Function / MF) untuk memperkecil ukuran kesalahan keluaran atau memaksimalkan indeks pencapaian. ANFIS dapat bertindak sebagai suatu dasar untuk membangun satu kumpulan aturan fuzzy if-then dengan fungsi keanggotaan yang tepat, yang berfungsi untuk menghasilkan pasangan input-output yang tepat. Sistem inferensi fuzzy yang digunakan adalah sistem inferensi fuzzy model Tagaki-Sugeno-Kang (TSK) orde satu dengan pertimbangan kesederhanaan dan kemudahan komputasi. Rule 1 : if x is A1 and y is B1 then z1 = ax + by + c premis konsekuen Rule 2 : if x is A2 and y is B2 then z2 = px + qy + r premis konsekuen Input adalah x dan y. Konsekuen adalah z. Langkah dari fuzzy reasoning dilakukan oleh sistem kesimpulan fuzzy adalah:
22
Gambar 2.8. Model fuzzy Sugeno orde satu dengan dua buah input (a) feedforward 3 X1
6
8
7
9
X8
4 X2
X9
5 (a) recurrent 3 X1
6
8
7
9
X8
4 X2
X9
5 Gambar 2.9. Jaringan adaptif : Arsitektur dan algoritma pembelajaran
23 Sesuai dengan namanya, jaringan adaptif merupakan suatu struktur jaringan yang terdiri dari sejumlah simpul yang terhubung melalui penghubung secara langsung (directional links). Tiap simpul menggambarkan sebuah unit proses, dan penghubung antara simpul menentukan hubungan kausal antara simpul yang saling berhubungan. Semua atau sebagian simpul bersifat adaptif (bersimbol kotak) dapat dilihat pada gambar 2.8, yang artinya keluaran dari simpul tersebut bergantung pada parameter peubah yang mempengaruhi simpul itu. Layer 1
Layer 2
Layer 3
Π
N
Layer 4
Layer 5
A1 x A2
x y Σ
B1 y
Π
N
B2
x y Gambar 2.10. Arsitektur ANFIS
Simpul-simpul (neuron-neuron) pada arsitektur ANFIS (Gambar 2.10.): - Nilai-nilai (Membership function). - Aturan- aturan (T-norm yang berbeda, umumnya yang digunakan operasi produk). - Normalisasi (Penjumlahan dan pembagian aritmatika). - Fungsi-fungsi (Regresi linier dan perkalian ). - Output (Penjumlahan aljabar). Simpul-simpul tersebut dibentuk dalam arsitektur ANFIS yang terdiri dari lima lapis. Fungsi dari setiap lapis tersebut sebagai berikut
24 Lapis 1 Setiap simpul i pada lapis 1 adalah simpul adaptif dengan nilai fungsi simpul sebagai berikut: O1,i = μAi (X) untuk i=1,2
(2.18)
O1,i = μAi (X) untuk j=1,2
(2.19)
dengan x dan y adalah masukan simpul ke i. Ai(x) dan Bj(y) adalah label linguistik yang terkait dengan simpul tersebut. O1,i dan O1,j adalah derajat keanggotaan himpunan fuzzy A1, A2, atau B1 B2. Fungsi keanggotaan untuk A atau B dapat diparameterkan, misalnya fungsi segitiga:
Gambar 2.11. Fungsi Segitiga Dengan {a,b,c} adalah himpunan parameter. Parameter dalam lapis ini disebut premise parameters yang adaptif. Lapis 2 Setiap simpul pada lapis ini adalah simpul tetap berlabel ∏ dengan keluarannya adalah produk dari semua sinyal yang datang. O2,i = μAi (X) x μBi (X), I = 1,2;
(2.20)
Setiap keluaran simpul dari lapis ini menyatakan kuat penyulutan (fire strength) dari tiap aturan fuzzy. Fungsi ini dapat diperluas apabila bagian premis memiliki lebih dari dua
25 himpunan fuzzy. Banyaknya simpul pada lapisan ini menunjukkan banyaknya aturan yang dibentuk. Fungsi perkalian yang digunakan adalah interpretasi operator and. Lapis 3 Setiap simpul pada lapis ini adalah simpul tetap berlabel N. Simpul ini menghitung rasio dari kuat penyulutan atau fungsi derajat pengaktifan aturan ke i pada lapisan sebelumnya terhadap jumlah semua kuat penyulut dari semua aturan pada lapisan sebelumnya. (2.21) Keluaran lapis ini disebut kuat penyulut ternormalisasi. Lapis 4 Setiap simpul pada lapis ini adalah simpul adaptif dengan fungsi simpul: (2.22) dengan: wi adalah kuat penyulut ternormalisasi dari lapis 3. Parameter {pix + qiy + ri} Adalah himpunan parameter dari simpul ini. Parameter pada lapis ini disebut consequent parameters. Lapis 5 Simpul tunggal pada lapis ini adalah simpul tetap dengan label Σ yang menghitung keluaran keseluruhan sebagai penjumlahan semua sinyal yang datang dari lapisan 4. (2.23) Jaringan adaptif dengan lima lapisan diatas ekivalen dengan sistem inferensi fuzzy Takagi–Sugeno–Kang (TSK) atau yang lebih dikenal dengan Sugeno.
26 2.5.
Algortima Pembelajaran Hybrid Pada saat premise parameters ditemukan, output yang terjadi akan merupakan
kombinasi linear dari consequent parameters, yaitu : y
=
W W
W
y1 +
W W
W
y2
(2.24)
=
w1(c11x1 + c12x2 + c10) + w2 (c21x1 + c22x2 + c20);
(2.25)
=
(w1x1)c11 + (w1x2)c12 + w1c10 +(w2x1)c21 + (w2x2)c22 + w2c20; (2.26)
Linear terhadap parameter cij (i = 1,2 dan j = 0,1,2). Algortima hybrid akan mengatur parameter-parameter cij secara maju (forward) dan akan mengatur parameter-parameter {ai, bi, ci} secara mundur (backward). Pada langkah maju (forward), input jaringan akan merambat maju sampai pada lapisan
keempat,
dimana
parameter-parameter
cij
akan
diidentifikasi
dengan
menggunakan metode least-square. Sedangkan pada langkah mundur (backward), error sinyal akan merambat mundur dan parameter-parameter { ai, bi, ci } akan diperbaiki dengan menggunakan metode gradient descent. Menurut Jang (1997, p87), menggunakan algoritma backpropagation atau gradient descent untuk mengidentifikasi paramter-parameter pada suatu jaringan adaptif biasanya membutuhkan waktu yang relatif lama untuk konvergen. Mengemukakan algoritma hybrid yang akan menggabungkan antara steepest descent (SD) dan least square estimator (LSE) untuk mengidentifikasi parameter-parameter linear. 2.5.1. Least Square Estimator (LSE) Rekursif Salah satu metode LSE adalah LSE rekursif. Pada LSE rekursif, dapat menambahkan suatu pasangan data [aT | y], sehingga memiliki sebanyak (m+1) pasangan
27 data. Dari sini dapat dihitung kembali LSE θk+1 dengan bantuan θk. Bentuk semacam ini dikenal dengan LSE rekursif. Karena jumlah paramater ada sebanyak n, maka matriks m x n dapat diselelsaikan dengan menggunakan metode invers, sebagai berikut: Pn = (AnT An)-1
(2.27)
Θn = Pn AnT yn
(2.28)
Selanjutnya, iterasi dimulai dari data ke-(n+1), dengan nilai Pk+1 dan θk+1 dapat dihitung sebagai berikut: Pk+1 = Pk -
T
P T
P
P
θk+1 = θk + Pk+1 ak+1 (yk+1 - aT θk ) 2.6.
(2.29) (2.30)
K-fold Cross Validation •
K-fold cross validation dilakukan untuk membagi data menjadi training set dan test set.
•
Menurut Fu (1994, p95), K-fold cross validation mengulang k-kali untuk membagi sebuah himpunan contoh secara acak menjadi k subset yang saling bebas, setiap ulangan disisakan satu subset untuk pengujian dan subset lainnya untuk pelatihan.
2.7.
Hyperspectral Menurut Smith (2006, p4), data citra hyperspectral dihasilkan oleh alat yang
disebut imaging spectrometer yang melibatkan konvergensi dua teknologi yaitu spektroskopi dan pencitraan jauh. Pada umumnya, sensor mengumpulkan data secara pasif dan aktif. Sensor pasif mengumpulkan dan merekam energi elektromagnetik yang dipantulkan atau dipancarkan
28 oleh permukaan suatu fitur tertentu, khususnya terusan dari sebuah lensa optik. Sensor aktif menghasilkan energi pemiliknya dan kemudian mengumpulkan sinyal yang dipantulkan dari permukaan bumi. Pada citra hyperspectral sumber data memasukkan 10 atau lebih data band. Lebar band
data memiliki
multispectral
range
1 sampai 15 nanometer , sedangkan pada
lebar band berkisar antara 50 sampai 120 nanometer. Menurut
Borengasser (2008), data multispectral bisa memiliki celah / renggang antara spectral band yang dikumpulkan, sedangkan data hyperspectral memiliki kumpulan band yang kontinyu. Menurut Borengasser (2008, p60), Reflectance adalah persentase cahaya yang dipantulkan oleh suatu material. Nilai reflectance bervariasi untuk setiap benda dengan bahan yang berbeda. Menurut Smith (2006, p7), Hubungan linear dari perubahan panjang gelombang dengan leaf area index (LAI) atau indeks luas permukaan daun dan kandungan klorofil gandum mengindikasikan bahwa resolusi tinggi data spektral dapat digunakan untuk memperkirakan kondisi pertumbuhan hasil panen dan mengidentifikasi tekanan hasil panen. Grafik hubungan antara panjang gelombang spektrum gandum dengan LAI dapat dilihat pada Gambar 2.12. dan hubungan antara panjang gelombang spektrum gandum dengan kandungan klorofil dapat dilihat pada Gambar 2.13.
29