TINJAUAN PUSTAKA Penginderaan Jauh Penginderaan jauh adalah ilmu dan seni untuk memperoleh informasi tentang objek, daerah atau gejala dengan jalan menganalisis data yang diperoleh dengan menggunakan alat tanpa kontak langsung terhadap objek, daerah atau gejala yang dikaji (Lillesand & Kiefer 1990). Menurut Hornby (1974 dalam Sutanto 1986) mengemukakan bahwa citra merupakan gambaran yang terekam oleh kamera atau oleh sensor penginderaan jauh.
Data penginderaan jauh
memiliki keunggulan dalam hal waktu pengamatan dibandingkan dengan cara konvensional. Data penginderaan jauh khususnya data satelit mempunyai peran yang sangat penting karena memberikan informasi menggenai penggunaan lahan yang sesuai dengan keadaan sebenarnya.
Data yang didapatkan dari satelit
biasanya sudah merupakan data bersifat digital. Pengolahan data penginderaan jauh atau pengolahan citra digital meliputi beberapa tahapan, yaitu memasukkan data (input data), pengolahan awal untuk memperbaiki kualitas citra secara radiomerik dan geometrik, pengolahan citra menjadi suatu output yang memberikan informasi kepada pengguna. Data yang mungkin dianalisis untuk memperoleh informasi tentang objek, area, kejadian yang diteliti dikumpulkan menggunakan berbagai sistem sensor yang dioperasikan dari suatu wahana (platform). Pada penginderaan jauh sumber daya alam, data pada umumnya dikumpulkan dalam bentuk sebaran energi elektromagnetik yang dipantulkan atau dipancarkan oleh obyek di permukaan bumi (Lillesand & Kiefer 1990) Selanjutnya menurut Lillesand & Kiefer (1990) terdapat dua proses dasar dalam penginderaan jauh sumber daya alam yaitu : pengumpulan data dan analisis data. Unsur-unsur proses pengumpulan data adalah sumber energi, perambatan energi melalui atmosfer, interaksi energi dengan kenampakan permukaan bumi dan data yang diperoleh dalam bentuk gambar. Proses analisis data menyangkut penilaian data dengan menggunakan berbagai peralatan pengamatan dan interpretasi untuk menganalisis data dalam bentuk gambar atau komputer untuk menganalisis data dalam bentuk numerik, selanjutnya data referensi tentang
6
sumber daya alam dipelajari untuk membantu dalam analisis data.
Dengan
bantuan data referensi, analisis ekstraksi informasi tentang luas, macam, lokasi dan kondisi berbagai sumber alam yang diindera oleh sensor.
Informasi ini
kemudian disajikan, umumnya dalam bentuk peta, tabel-tabel dan laporan. Akhirnya informasi digunakan oleh pemakai dalam proses pengambilan keputusan. Pada dasamya objek di permukaan bumi ini dapat dibedakan menjadi tiga kelompok besar, yaitu tanah, air dan vegetasi. Ketiga objek tersebut secara alami mempunyai bentuk dan sifat berbeda, sehingga apabila dipotret dengan mengunakan panjang gelombang tertentu akan menghasilkan karakteristik reflektan yang berbeda-beda. Karakteristik reflektan dari objek permukaan bumi (tanah, air dan vegetasi) dapat digunakan sebagai dasar dalam pemilihan citra penginderaan jauh yang digunakan dan dasar dalam interpretasi objek. Kurva karakteristik reflektan dari objek tanah, air dan vegetasi secara umum dapat diketahui dari Gambar 1. Dalam penerapan teknik penginderaan jauh, detail dan ketelitian yang diinginkan, luas wilayah terliput, ditentukan oleh jenis dan skala citra yang digunakan, karena setiap jenis citra tertentu dengan skala tertentu menggambarkan dan bahkan menonjolkan objek-objek tertentu sesuai dengan panjang gelombang yang digunakan untuk merekam data lapangan. Suatu hal yang perlu dipakai sebagai dasar pemikiran dalam setiap penerapan teknik penginderaan jauh bahwa pada prinsipnya kamera/sensor penginderaan jauh hanya merekam objek-objek di permukaan bumi, sehingga objek-objek di bawah permukaan bumi atau yang tertutup oleh tumbuh-tumbuhan, dinterpretasi berdasarkan objek-objek yang tampak pada permukaan bumi (Estes et al 1983; Sutanto 1987; Lillesand & Kiefer 1990).
7
Gambar 1. Kurva Karakteristik Reflektan dari Obyek Tanah, Air dan Vegetasi Citra Landsat (Sumber: Gao Yan 2003) Karakteristik Landsat ETM+ Karakteristik penginderaan jauh satelit dapat dibedakan menurut misinya seperti satelit cuaca dan satelit sumber daya alam. Data satelit cuaca memiliki cakupan luas dan resolusi temporal tinggi, sedangkan data satelit sumber daya alam memiliki resolusi spasial tinggi dan masing-masing band memiliki kesesuaian untuk analisis obyek tertentu, sehingga memudahkan penafsir untuk melakukan analisis spasial terhadap fenomena yang terjadi pada permukaan bumi (Asriningrum 2002). Di Indonesia data citra satelit sumber daya alam seperti Landsat, SPOT, IKONOS, JERS dan ERS sudah digunakan.
Landsat dari seri satelit bumi
merupakan sistem penginderaan jauh yang menyelidiki sumber daya bumi sebagai obyek operasi utamanya. Sistem Landsat mengidentifikasikan sejumlah bandband yang khusus direkam pemindai (Scanner). Landsat 4 dan 5 memuat sensor multi spectral scanner (MSS) dan sensor thematic mapper (TM). Saat ini citra satelit Landsat sudah mencapai seri Landsat 7 ETM+. Landsat ETM+ merupakan seri Landsat ke-7 atau terakhir dari Landsat yang memiliki beberapa peningkatan kemampuan dibandingkan dengan seri sebelumnya yaitu Landsat 5. Landsat 7 diluncurkan pada tanggal 15 April 1999 dengan wahana peluncur roket Delta II. Landsat 7 membawa satu sensor yaitu
8
Enhanced Thematic Mapper Plus (ETM+). Sensor tersebut merupakan duplikasi dari sensor TM pada Landsat TM 4, 5 yang mendapat tambahan satu saluran pankromatik dengan resolusi spasial 15 m, sedangkan pada infra merah thermal resolusinya spasialnya meningkat dari 120 meter pada Landsat TM menjadi 60 meter (Landsat 2000). Karakteristik Landsat ETM+ dan fungsi masing-masing saluran disajikan pada Tabel 1. Keunggulan citra Landsat ETM+ dibanding Landsat TM adalah ditambahnya band pankromatik (band 8) dengan resolusi 15 meter dan pada band 6 terdapat perekaman dengan sistem low gain dan high gain untuk analisis laut dan darat. Adapun keterbatasan citra ini adalah adanya liputan awan (akibat sistem perekaman optik), dan resolusi spasial 15 meter masih termasuk kasar untuk tujuan pemetaan skala besar (Asriningrum 2002). Tabel 1. Karakteristik Landsat ETM+ dan Kegunaan Masing-masing Band Sistem resolusi No
Band
1
Biru
Spektral (µm) 0.450-0.515
2
Hijau
0.525-0.605
30 x 30
16
3
Merah
0.630-0.690
30 x 30
16
4
Infra merah dekat
0.750-0.900
30 x 30
16
5
Inframerah gelombang pendek (menengah I) Inframerah thermal
1.550-1.750
30 x 30
16
10.40-12.50
60 x 60
16
Inframerah gelombang pendek (menengah II) Pankromatik
2.090-2.350
30 x 30
16
0.520-0.900
15 x 15
16
6 7
8
Sumber : Landsat (2000)
Spasial (m) 30 x 30
Tempor al (hari) 16
Kegunaan utama Penetrasi tubuh air, analisis penggunaan lahan, pembedaan vegetasi dan tanah Pengamatan puncak pantulan vegetasi, untuk membedakan jenis vegetasi dan untuk membedakan antara tanaman sehat dan tidak sehat. Untuk membedakan jenis vegetasi, untuk membedakan jenis tanaman, memudahkan perbedaan antara lahan terbuka dengan lahan bervegetasi. Saluran yang peka terhadap biomassa vegetasi, juga untuk identifiaksi jenis tanaman, memudahkan perbedaan tanah dan tanaman serta lahan dan air Saluran penting untuk pembedaan jenis tanaman, kandungan air tanaman, kelembaban tanah. Untuk membedakan formasi batuan dan untuk pemetaan hidrotermal Berfungsi untuk memisahkan formasi batuan dan dapat digunakn untuk pemetaan hidrotermal Klasifikasi vegetasi, analisis ganguan vegetasi, pembedaan kelembaban tanah dan keperluan lain yang berhubungan dengan gejala termal
9
Klasifikasi Digital Klasifikasi merupakan suatu proses dimana semua piksel dari citra yang memiliki ciri spektral yang sama dikelompokkan. Secara umum terdapat dua metode klasifikasi : klasifikasi terbimbing (supervised classification) dan klasifikasi tak terbimbing (unsupervised classification). Klasifikasi terbimbing (supervised classification) merupakan metode klasifikasi yang menggunakan training area yang telah dikenal dengan baik oleh analis.
Training area yang refresentatif untuk masing-masing kelas harus
ditentukan oleh pengguna. Hal yang penting diperhatikan dalam pengambilan training area adalah pencarian area yang homogen. Namun demikian kisaran variabilitas juga perlu diperhatikan untuk menghindari ketidakmampuan algoritma dalam mengklasifikasi.
Informasi yang diperlukan sebagai referensi dalam
penetapan training area dapat diperoleh dari survei lapangan, foto udara, peta dan data lainnya. Hanggono (1998) mengemukan bahwa asumsi terpenting dalam metode ini adalah bahwa setiap kelas spektral dapat dideskripsikan oleh suatu distribusi probabilitas dalam suatu ruang multispektral. Distribusi multivariabel ini dengan beberapa variabel sebagai dimensi ruang sehingga mampu mendeskripsikan peluang ditemukannya sebuah piksel pada sebuah kelas dilokasi manapun dalam ruang multispektral. Pendekatan klasifikasi tidak terbimbing (unsupervised classification) pada umumnya tidak mensyaratkan data yang berlebihan atau kelas tidak dikenal secara apriori. Oleh karena itu metode ini pada umumnya diterapkan pada citra yang kurang didukung oleh data kondisi penutupan lahan. Algoritma kemudian akan mengelompokkan piksel-piksel yang memiliki kesamaan ciri spektral kedalam gerombol yang unik melalui kriteria statistika yang ditentukan melalui training area dan selanjutnya mengkombinasikan dan atau mengubah label gerombol kedalam kelas yang sesungguhnya (Manalu 2002). Berdasarkan asumsi statistik yang digunakan Schowengerdt (2007) membedakan
algoritma klasifikasi citra dalam dua kelompok yaitu non
parametrik dan parametrik.
Algoritma klasifikasi citra non parametrik
berasumsikan bahwa distribusi kelas tersebar secara bebas, yang termasuk kedalam metode ini antara lain neural network, ISODATA, nearest neighbors.
10
Sementara parametrik menggunakan asumsi bahwa kelas terdistribusi secara normal dan memerlukan perkiraan distribusi parameter seperti mean vektor dan kovarian matrik untuk klasifikasi, yang termasuk kedalam parametrik antara lain maximum likelihood (MLC), nearest mean. Ditinjau dari aspek statistik sampel yang ditentukan harus mencukupi. Swain dan Davis (1998) menganjurkan 10 sampai 100 piksel perkelas untuk mendapatkan statistik kelas yang sesuai. Algoritma akan menghitung variabelvariabel statistika dasar yang diperlukan yaitu rataan, standar deviasi, matrik kovarian, matrik korelasi untuk setiap area yang dijadikan training area. Selanjutnya, algoritma yang digunakan akan mengevaluasi dan memetakannya kedalam kelas yang memiliki peluang/kemiripan yang paling dekat. Fungsi utama klasifikasi adalah untuk melakukan pemisahan dari suatu populasi yang kompleks kedalam kelompok-kelompok yang disebut kelas, yang di anggap sebagai unit-unit homogen untuk tujuan tertentu (Malingreu 1978). Wiradisastra (1982) juga menjelaskan bahwa klasifikasi penutup lahan merupakan pembagian wilayah kedalam satuan-satuan yang lebih kecil dan homogen agar deskripsinya lebih sederhana. Metode Klasifikasi Back Propagation Neural Network (BPNN) Gagasan neural network berasal dari fungsi struktur dasar otak manusia. Neural network merupakan simulasi perangkat lunak yang mengambarkan sistem kerja jaringan saraf (neuron) dalam arti biologi. Dalam ilmu pengetahuan modern dan rancang bangun neural network telah memperkuat pentingnya aplikasi numerik yang berkisar pada pola pengenalan, klasifikasi dan lain-lain. Menurut Basuki (2003) metode ini berisi proses stimulasi-stimulasi yang berlangsung dalam otak yang diterjemahkan dalam simbol, nilai dan bobot.
Metode ini
mempunyai keunggulan dalam hal proses pembelajaran, terdapat bermacammacam jenis neural network tergantung pada penggunaan.
BPNN atau back
propagating perceptron paling dikenal dan digunakan secara luas pada sistem neural network.
Istilah BPNN mengacu pada metode training yang
menghubungkan pembobot network yang disesuaikan. BPNN mempunyai tipe dari multi layer feed forward network.
11
Klasifikasi neural network adalah metode klasifikasi non parametrik. Neural network perlu dilakukan training untuk membuat analisis diskriminan. Tujuan dari training adalah untuk menyesuaikan kekuatan asosiasi (atau koefisien dari pembobot) antar neuron. Kriteria dari training untuk membuat error antar keluaran (output) perhitungan vektor dependent dan vektor independent dari pola traning yang diketahui.
Proses dari training adalah untuk meneruskan error
terbelakang (transmit backward error) ke network. Penyesuaian pembobot antar unit antar output layer, hidden layer dan input layer oleh karena itu bentuk neural network ini dikenal dengan back propagation neural network (Zhou et al 1997) Penggunaan neural network untuk klasifikasi citra multispektral terbagi atas dua tahap, yaitu tahap pelatihan dan tahap klasifikasi. Adapun data untuk pelatihan sama dengan yang digunakan oleh algoritma klasifikasi terawasi parametrik. Pertama-tama jaringan tersebut dilatih dengan algoritma rambat-balik sampai dicapai target kesalahan minimal yang dipersyaratkan. Target kesalahan minimal tersebut merupakan perbedaan antara nilai target yang diinginkan dan nilai output yang dihasilkan. Jika proses pelatihan telah selesai, maka jaringan digunakan sebagai struktur umpan maju (feed forward structure) untuk menghasilkan klasifikasi tutupan lahan seluruh citra (Paola and Schowengerdt 1997). Elemen dasar neural network adalah node pemroses (Gambar 2). Mulamula setiap nilai input (X) dikalikan dengan nilai bobot sinapsis (W), yang berfungsi menentukan kuat lemahnya aliran sinyal input, kemudian seluruh hasil perkalian tersebut dijumlahkan untuk menghasilkan nilai jaringan (net). Nilai jaringan ini dilewatkan melalui suatu fungsi aktivasi yang dibatasi oleh suatu nilai ambang. Jika nilai jaringan melampaui tingkat ambang tersebut maka jaringan menjadi aktif. Sebaliknya, jika tidak maka jaringan tetap pasif. Oleh karena input tersebut melewati suatu model untuk menghasilkan output, sistem ini disebut sistem umpan maju.
12
Gambar 2. Struktur Internal Node Pemeroses Neural Network (Siang 2005) dimana : x1, x2, ..xn w1,w2, ..wn b Σ f (net)
: data masukan : pembobot berfungsi untuk menyimpan informasi : bias : elemen pemroses yang berfungsi mengatur daerah nilai ambang : fungsi aktivasi untuk pemroses informasi
Oleh karena kemampuan perhitungan atau pengolahan sistem syaraf ditentukan oleh hubungan antar neuron dalam bentuk jaringan, maka node-node pemroses tunggal tersebut diorganisasi ke dalam beberapa layer, yang setiap layer saling terhubung dengan layer berikutnya dalam bentuk jaringan. Tetapi, di dalam satu layer sendiri tidak terjadi hubungan antar node. Hubungan antar node memiliki bobot yang bersesuaian. Jika suatu nilai dilewatkan dalam hubungan tersebut akan dikalikan dengan bobot tersebut. Pemodelan ini disebut multi layer perceptron atau disebut juga multi layer feed forward. Model multi layer perceptron umumnya terdiri dari tiga jenis layer dengan topologi jaringan seperti pada Gambar 3, yaitu: layer input, layer tersembunyi, dan layer output.
Gambar 3. Model Generik Multi Layer Perceptron (Paola and Schowengerdt 1997)
13
Fungsi aktivasi menyatakan perlakuan suatu node terhadap input secara tidak linier. Setiap fungsi diferensial dapat digunakan sebagai fungsi aktivasi f, namun yang paling banyak digunakan adalah fungsi sigmoid. Fungsi sigmoid merupakan fungsi yang bersifat kontinyu, monoton, output-nya terbatas, dan dapat dideferensialkan. Fungsi ini dibedakan atas fungsi logsigmoid dan transigmoid (Gambar 4). a. Fungsi Logsigmoid (binary sigmoid) yang didefinisikan sebagai :
f (net )
1 1 e net
................................................................................. (1)
b. Fungsi Tansigmoid (bipolar sigmoid) yang didefinisikan sebagai :
f (net )
2 1 ............................................................................ (2) 1 e net
dimana : f (net) e net
= fungsi aktivasi untuk pemroses informasi = bilangan natural = Nilai Jaringan (network)
Gambar 4. Fungsi Sigmoid (Ozkan and Erbek 2003) Neural network yang digunakan dalam penelitian ini adalah BPNN yang dikembangkan oleh Rumelhard et al. tahun 1986 dan merupakan metode neural network yang paling banyak digunakan (Rumelhard et al 1990 dalam Kushardono 2001). Model BPNN dan model sebuah neuron j dalam neural network disajikan pada Gambar 5 dan 6.
14
Gambar 5 : Model Back Propagation Neural Network (BPNN)
Gambar 6. Neural Network dengan Fungsi Aktivasi BPNN merupakan metode klasifikasi terbimbing (supervised classification) yang terdiri atas banyak neuron layer seperti input layer, hidden layer (kemungkinan lebih satu layer) dan output layer (Gambar 5). Proses neuron dalam setiap layer dikenal dengan unit proses atau secara sederhana dikenal sebagai unit dan neuron. Unit dari input layer, hidden layer dan output layer dapat juga disebut input unit, hidden unit dan output unit. Tiap layer terdiri dari beberapa neuron yang modelnya seperti terlihat pada Gambar 6. Proses dari setiap neuron p dalam tiap-tiap layer menghasilkan sinyal output Op yang dihitung dari persamaan 3, dimana output ditentukan berdasarkan fungsi F dari jumlah penganda nilai sinyal oleh faktor pengali dan ditambahkan ke faktor penambah. Persamaan ditunjukkan dibawah ini (Koeshardono 2001):
1 OP F (Wip x Oi ) L p ................................................................(3) i 1
15
dimana : Op = Output sinyal pada setiap neuron p pada setiap layer Lp
= faktor penambah untuk setiap neuron p (p = 1, 2, 3,…, p)
Wip = faktor pengali untuk neuron p terhadap neuron i ( i= 1, 2, 3,…, l) yang merupakan lapisan neuron pada layer sebelumnya Oi
= nilai sinyal dari neuron i yang masuk.
Besarnya faktor pengali (Wip) dan faktor penambah (Lp) pada BPNN ini ditentukan berdasarkan metode pengajaran back propagation dengan nilai awal ditentukan secara acak dan perubahan nilai setiap waktu t+1 proses pengajaran sejumlah ∆Wip (t+1) dan ∆Lp (t+1) seperti persamaan yang ditunjukkan berikut ini :
Wip (t 1) ( x Ecp x Ocp ) ( x Wip (t )) L p (t 1) ( x Ecp ) L p (t ))
...................................... (4)
dimana : η dan α = tingkat pembelajaran (learning rate) dan momentum yang merupakan nilai konstan yang besarnya berkisar 0.0 sampai 1.0 Ecp = besar kesalahan (error) pengajaran pada neuron p sebelumnya, dihitung dengan persamaan 5 dan persamaan 6 untuk training sample c (c = 1, 2, 3,…, cn) Ocp = besar sinyal output dari neuron p tersebut untuk training sample c. t = waktu Besar error pengajaran pada neuron p sebesar Ecp pada persamaan 4 untuk output layer (lapis terakhir) dihitung dengan persamaan sebagai berikut : Ecp = (Tcp-Ocp) xOcp x1-Ocp)
....................................................... (5)
dimana : Tcp = sinyal pengajaran (learning signal) yaitu suatu output jika benar untuk training data c pada neuron p, Ocp = output sinyal neuron p pada output layer Ecp untuk hidden layer (lapisan tengah) dihitung dengan persamaan berikut : K
Ecp Ocp x (1 Ocp ) x ( Eck xW pk ) k 1
..................................................... (6)
16
dimana : Ocp Eck Wpk
= output sinyal neuron p pada hidden layer (lapisan tengah) = besar kesalahan (error) untuk training data c pada neuron k (k = 1, 2, 3,..., k) dari layer samping atau lapisan belakangnya atau layer terakhir jika neural network terdiri tiga layer = faktor pengali untuk hubungan antara neuron p pada hidden layer dengan neuron k pada layer belakangnya atau lapisan sebelumnya.
Fungsi F pada persamaan 3 pada BPNN yang umum digunakan adalah fungsi sigmoid, yaitu sebagai berikut :
F (u )
1 1 eu
......................................................................... (7)
dimana : f (u) = fungsi aktivasi untuk pemroses informasi = bilangan natural e u = Nilai Jaringan (network) Secara teknis, terdapat dua hal mendasar di dalam klasifikasi neural netwok ialah daerah pelatihan dan pengaturan parameter jaringan. Daerah pelatihan yang baik yaitu daerah pelatihan yang secara statistik mempunyai nilai indeks keterpisahan antara 1,9-2 (Richard 1993) dan atau mempunyai tampilan diagram pencar yang tidak saling tumpang tindih, sedangkan nilai indek sepabilitas 0-1 mengindikasikan separabilitas tidak baik dan nilai 1-1,9 adalah indek separabilitas cukup baik. Sementara Parameter jaringan ialah parameter yang perlu diatur untuk memperoleh kinerja klasifikasi yang baik di dalam arti efisien dan efektif. Parameter jaringan ini meliputi : (a) fungsi aktivasi, (b) training threshold contribution, (c) training rate, (d) training momentum, (e) training RMS exit criteria dan (f) jumlah iterasi pelatihan (PCI Help 2001).
Fungsi aktivasi. Fungsi aktivasi di dalam jaringan syaraf tiruan digunakan untuk menentukan keluaran sebuah neuron. Dua fungsi aktivasi yang sering dipergunakan adalah logistic dan hyperbolic. Fungsi aktivasi logistic atau sering disebut fungsi sigmoid biner memiliki kisaran nilai dari 0 sampai dengan 1, sedang fungsi hyperbolic mempunyai kisaran nilai antara -1 sampai dengan +1. Di dalam penelitian ini digunakan fungsi aktivasi logistic.
17
Training threshold contribution Training threshold contribution merupakan nilai ambang yang perlu ditentukan untuk meratakan perubahan bobot di dalam node.
Hal ini
digunakan untuk mempercepat konvergensi karena perataan bobot akan dapat meminimumkan kesalahan antara lapisan keluaran dan respon yang diharapkan. Perataan bobot-bobot di dalam node dapat memberikan hasil klasifikasi yang lebih baik. Nilai parameter ini berkisar antara 0 sampai dengan 1. Masukan nilai 0 pada parameter ini tidak akan meratakan bobotbobot di dalam node.
Laju pelatihan (training rate) Laju pelatihan akan mempengaruhi kecepatan proses iterasi. Nilai laju pelatihan yang besar akan mempercepat perubahan bobot menuju bobot stabil, tetapi menghadapi resiko terjadinya osilasi dan ketidakstabilan selama proses iterasi. Sebaliknya, nilai laju pelatihan yang kecil akan menyebabkan perubahan bobot yang relatif lambat yang juga akan memperlambat proses konvergensi. Tidak ada kepastian tentang nilai laju pelatihan yang tepat pada proses pelatihan.
Training momentum Pada metode back propagation baku, komputasi didasarkan pada perubahan bobot pada gradient yang terjadi untuk pola yang dimasukkan saat itu. Modifikasi dapat dilakukan dengan cara memperhitungkan arah gradient pola terakhir dengan arah gradient pola sebelumnya yang disebut momentum. Penambahan momentum dimaksudkan untuk menghindari perubahan bobot yang drastis akibat adanya data yang sangat berbeda atau ekstrem. Jika data terakhir yang diberikan ke jaringan memiliki pola yang serupa, maka perubahan bobot dapat dilakukan secara cepat, demikian juga sebaliknya.
Training RMS exit criteria Training RMS exit criteria merupakan salah satu cara untuk menghentikan proses pelatihan atau iterasi, selain menggunakan pembatasan jumlah iterasi (number of iteration). Iterasi akan berhenti tepat pada nilai toleransi RMS yang ditetapkan di dalam jaringan.
18
Jumlah iterasi pelatihan Jumlah
iterasi
yang
makin
besar
dapat
menghasilkan
klasifikasi
penutup/penggunaan lahan dengan ketelitian keseluruhan yang makin baik, meskipun demikian penambahan jumlah iterasi pada batas tertentu juga akan mengalami penurunan tingkat ketelitian keseluruhan dan jumlah iterasi yang semakin besar juga akan menambah lama waktu pelatihan. Selama dekade terakhir para peneliti telah melakukan atau menggunakan neural network untuk klasifikasi penutupan lahan menggunakan data satelit penginderaan jauh. Beberapa peneliti yang menggunakan neural network dalam penelitian mereka (Sadly 1998): 1. Chang (1994) menggunakan dynamic learning neural network untuk aplikasi penginderaan jauh dan mendapatkan hasil yang baik dengan menyimpulkan bahwa neural network merupakan pengklasifikasi yang sesuai dan mudah untuk volume citra yang luas. 2. Studi yang sama juga dilakukan Bischof (1992) dan menunjukkan bahwa neural network hampir sama seperti MLC 3. Yoshida (1994) mengajukan klasifikasi neural network untuk analisis data penginderaan jauh dan juga untuk memperbaiki hubungan tetangga antar piksel dan mengurangi kemungkinan error untuk pola klasifikasi dan mendapatkan hasil yang lebih realistik dan tanpa ingar dibandingkan metode statistik konvensional. Andayani (2008) menggunakan metode BPNN untul klasifikasi penutupan lahan menggunakan data ALOS, dengan mengembangkan beberapa model parameter input data dan membandingkan hasilnya.
Hasil penelitiannya
menunjukkan bahwa metode BPNN akan meningkat akurasi dengan menambah input-input data lainnya seperti NDVI, SAVI dan RVI. Sedangkan Shafri et al. (2007) menggunakan beberapa model algoritma klasifikasi untuk pengenalan pola dalam pemetaan tutupan hutan menggunakan data hyperspektral, menunjukkan hasil bahwa MLC dan Artificial Neural Network tidak terdapat perbedaan signifikan yaitu MLC 86% dan ANN 85%. Fauzi (2001) menggunakan jaringan syaraf tiruan dan klasifikasi MLC untuk mendeteksi kondisi hutan hujan tropis didaerah konsesi Lebanan Kabupaten
19
Berau.
Metode yang digunakan adalah klasifikasi neural network multilayer
perceptron dengan fungsi aktivasi sigmoid. Hasil penelitiannya menunjukkan terdapat pemisahan yang signifikan antar kelas didalam satu skema klasifikasi. Akurasi klasifikasi dengan algoritma neural network terbukti lebih baik dibandingkan dengan MLC.
Metode Klasifikasi Maximum Likelihood (MLC) Metode klasifikasi kemungkinan maksimum merupakan metode klasifikasi yang paling banyak digunakan dalam metode klasifikasi secara terbimbing untuk data penginderaan
jauh.
Sebelum melakukan klasifikasi, perlu menentukan
training area yang digunakan untuk melihat ciri-ciri statistik masing-masing calon kelas. Metode ini dikembangkan mengikuti statistik yang dapat diterima (Richard 1993). Richard (1993) juga menambahkan bahwa teknik klasifikasi kemungkinan maksimum didasarkan pada perkiraan densitas probabilitas untuk setiap tutupan lahan. Perhitungan probabilitas disini memungkinkan untuk menemukan sebuah piksel dari kelas i pada posisi X yang didefinisikan oleh teori Bayes :
P(i|X) = P(X|i)P(i)/P(X)
...................................................................... (8)
Dimana : P(i|X) = Probabilitas bersyarat dari kelas i, dihitung mengingat bahwa vektor X ditetapkan secara apriori (tanpa syarat), probabilitas ini juga disebut likelihood. P(X|i) = Probabilitas bersyarat (conditional) dari vektor X, dihitung mengingat bahwa kelas ditetapkan secara apriori P(i) = Probabilitas kelas i muncul didalam sebuah citra P(X) = Probabilitas dari vektor X
Pendekatan klasifikasi citra dengan metode MLC adalah dengan memperhatikan probabilitas anggota kelas paling maksimum dari sejumlah piksel pada citra input.
Aturan keputusan dari MLC menetapkan tiap-tiap piksel
memiliki pola ukuran atau ciri-ciri X ketidakpastian kelas c yang unit-unitnya paling mungkin atau mendekati pada kenaikan yang diberikan pada ciri-ciri vektor X (Swain dan Davis, 1978 dalam Foody et al. 1992 dalam Jensen 1996). Sistem
20
klasifikasi ini berasumsi bahwa data statistik training untuk tiap-tiap kelas dalam tiap-tiap band tersebar secara normal yaitu Gausian (Blaisdell 1993 dalam Jensen 1996). Lillesand dan Kiefer (1990) menyatakan bahwa klasifikasi MLC mengevaluasi secara kuantitatif variance dan co-variance pola tanggapan spektral kategori ketika mengklasifikasi piksel yang tidak dikenal. Untuk melakukan ini, dibuat asumsi bahwa distribusinya normal.
Untuk alasan matematik Surlan
(2002) menyebutkan bahwa suatu distribusi normal multivariate dapat digunakan sebagai fungsi densitas probabilitas. Dalam kasus distribusi normal, Lk dapat diexpresikan sebagai berikut :
Lk X
dimana : n X Lk(X) µk ∑k /∑k/
1 n 2
(2 ) / k / 1 / 2 = = = = = =
1 1 exp ( X k )k ( X k ) t ..................... (9) 2
banyaknya band vektor penciri dari n band kemungkinan dari X masuk kedalam kelas k vektor rataan dari kelas k matrik varian kovarian dari kelas k determinan dari ∑k
Dalam kasus dimana matrik varian-kovarian simetris, Lk sama seperti euclidian, sedangkan jika determinan sama satu dengan lainnya, Lk menjadi mahalanobis. Persamaan Mahalanobis sebagai berikut : t 1 d 1 Gk (X) - (X - k ) k 1 (X - k ) - ( ) log (2TT) - ( ) log ( 2 2 2
k ) log (Pk )
.(10)
Untuk meningkatkan ketelitian klasifikasi dengan metode klasifikasi MLC Mueler (1983) dalam Surlan (2002) menekankan cara pengambilan training area haruslah memenuhi 4 syarat: 1. Ukuran dari training area : harus memenuhi syarat utama yakni agar kovarian matrik tidak singular, haruslah piksel-piksel suatu training area saling independen linear. Jadi pada n kelas obyek minimal n+1 piksel pada tiap-tiap kelasnya.
Untuk mencapai hasil yang lebih baik disarankan 10 kali dari
jumlah piksel minimum diatas. 2. Kehomogenan training area : untuk hal ini diharapkan hanya piksel-piksel dari kelas itu saja yang berada pada training area dan distribusinya harus
21
sedapat mungkin berdistribusi normal. Dalam banyak hal adalah seringkali sangat susah membuat training area untuk memisahkan piksel-piksel dari dua kelas yang berbeda, seperti terjadi pada obyek jalan atau sungai. Seringkali tercampur piksel-piksel dari dua kelas misal jalan dengan sungai. Dalam hal ini adalah membantu jika sebelumnya dilakukan klasifikasi unsupervised. 3. Kelas representatif : suatu persyaratan penting untuk dapat menerapkan metode MLC adalah masing-masing kelas berdistribusi normal.
pada
kenyataannya persyaratan ini seringkali tidak terpenuhi, karena tidak terpenuhinya simetrisasi dari kelas-kelas obyek pada ruang spektral. Pada penentuan kelas dapat dilakukan dengan menandai training area, sedemikian sehingga seluruh piksel dapat terkelompokan. 4. Keterpisahan kelas : untuk menajamkan keterpisahan kelas biasanya dilakukan transformasi.
Evaluasi Akurasi Hasil Klasifikasi Pengujian ketelitian klasifikasi bertujuan untuk melihat kesalahan-kesalahan klasifikasi sehingga dapat diketahui persentase ketepatannya (akurasi). Pengujian akurasi menggunakan ground truth area yang didapat dari lapangan. Akurasi hasil klasifikasi diuji dengan cara membuat matrik kontingensi yang sering disebut dengan matrik kesalahan (error matrix) atau matrik konfusi (confusion matrix). Metode ini adalah metode yang paling umum dilakukan untuk mengetahui tingkat keakuratan hasil klasifikasi. Matrik kesalahan adalah matrik bujur sangkar yang berfungsi untuk membandingkan antara data lapangan dengan korespondensinya dengan hasil klasifikasi (Lillesand dan Kiefer, 1994). Persentase ketepatan klasifikasi tersebut dapat dilihat dari nilai user’s accuracy, producer’s accuracy, overall accuracy dan kappa accuracy. Menurut Congalton dan Green (1999) producer’s dan user’s accuracy adalah dua penduga dari ketelitian keseluruhan (overall accuracy). Producer’s accuracy adalah peluang rata-rata (dalam persen) bahwa suatu piksel akan diklasifikasikan dengan benar dalam kelas hasil klasifikasi, ukuran ini juga mencerminkan rata-rata dari kesalahan omisi (omission error) yaitu kesalahan klasifikasi berupa kekurangan jumlah piksel suatu kelas akibat masuknya piksel-piksel kelas tersebut ke kelas
22
yang lain. Sedangkan user’s accuracy adalah peluang rata-rata (dalam persen) bahwa suatu piksel dari citra yang terklasifikasi secara aktual mewakili kelaskelas tersebut di lapangan, ukuran ini mencerminkan rata-rata dari kesalahan komisi (commission error) yaitu kesalahan klasifikasi berupa kelebihan jumlah piksel pada suatu kelas yang diakibatkan masuknya piksel dari kelas yang lain. Sementara overall accuracy adalah suatu persentase dari piksel-piksel yang terkelaskan dengan tepat yang dibagi dengan jumlah total piksel yang diuji. Nilai akurasi yang paling banyak digunakan adalah akurasi kappa (KHAT), karena nilai ini memperhitungkan semua elemen (kolom) dari matrik. Congalton dan Green (1999) menyatakan bahwa kappa accuracy merupakan perhitungan dari setiap matrik kesalahan dan mencerminkan seberapa baik klasifikasi citra dengan data referensi yang digunakan. Nilai-nilai producer’s accuracy, user’s accuracy, dan overall accuracy dan nilai Kappa dapat dihitung dengan persamaan berikut : r
Producer’s Accuracy
X i 1
X k
ii
x100% ;
....................................................... (11)
r
User’s Accuracy
X i 1
ii
X k
x100%
.................................................................. (12)
r
Over All Accuracy
X i 1
N
ii
x100%
............................................................... (13)
Dimana : N r Xii X+k Xk+
= = = = =
jumlah semua piksel yang digunakan dalam pengamatan jumlah baris atau lajur pada matrik kesalahan (= jumlah kelas) Jumlah pengamatan di baris i dan kolom i jumlah semua kolom pada lajur ke- k jumlah semua kolom pada baris ke- k Nilai akurasi yang paling banyak digunakan adalah akurasi kappa (KHAT),
karena nilai ini memperhitungkan semua elemen (kolom) matriks. Secara matematis akurasi kappa dinyatakan sebagai berikut :
23
r
r
N X i X i X i
Kappa Accuracy =
i 1
i 1
................................................. (14)
r
N X i X i 2
i 1
Dimana : N = jumlah semua piksel yang digunakan untuk pengamatan r = jumlah baris/ lajur pada matriks kesalahan (sama dengan jumlah kelas) Xi+ = jumlah semua kolom pada lajur ke-i X+i = jumlah semua kolom pada baris ke-i Badan Survey Geologi Amerika Serikat (USGS) telah mensyaratkan tingkat akurasi/ ketelitian sebagai kriteria utama bagi sistem klasifikasi penutupan dan penggunaan lahan yaitu tingkat akurasi klasifikasi terhadap data penginderaan jauh harus tidak kurang dari 85 %, dan ketelitian klasifikasi harus lebih kurang sama untuk beberapa katagori/ kelas (Lillesand & Kiefer 1990). Akurasi dievaluasi dengan membuat matriks contingency, yang lebih dikenal dengan matriks kesalahan (confusion matrix) seperti pada Tabel 2. Tabel 2. Matrik Kesalahan (Confusion Matrix) Data Training area A B … D Total Kolom User’s
Diklasifikasi Ke- Kelas A B … D Xii
Total Baris
Producer’s
Xk+
Xkk/Xk+
Xkk X+k Xii/X+k
N
Klasifikasi Penutup/Penggunaan Lahan Lahan mempunyai arti yang sangat penting dalam kehidupan manusia karena semua aktivitas kehidupan manusia, baik secara langsung maupun tidak langsung berkaitan dengan lahan. Definisi lahan adalah suatu lingkungan fisik yang meliputi tanah, iklim, relief, hidrologi dan vegetasi dimana faktor-faktor tersebut saling mempengaruhi potensi penggunaannya.
Termasuk didalamnya
adalah akibat kegiatan manusia baik pada masa lampau maupun masa sekarang, seperti reklamasi daerah pantai, alih fungsi areal persawahan, penebangan hutan
24
dan juga akibat-akibat lain yang menyebabkan kemunduran produktivitas lahan. Menurut Lillesand dan Kiefer (1990) penggunaan lahan berhubungan dengan kegiatan manusia pada sebidang lahan, sedangkan penutup lahan lebih merupakan perwujudan fisik obyek-obyek yang menutupi lahan tanpa mempersoalkan kegiatan manusia terhadap obyek-obyek tersebut. Klasifikasi penutup lahan/penggunaan lahan adalah upaya pengelompokkan berbagai jenis penutup/penggunaan lahan kedalam suatu kesamaan sesuai dengan sistem tertentu.
Klasifikasi penutup/penggunaan lahan digunakan sebagai
pedoman atau acuan dalam proses interpretasi atau penafsiran citra penginderaan jauh untuk tujuan pemetaan penutup lahan/penggunaan lahan. Banyak sistem klasifikasi
penutup/penggunaan
lahan
yang
telah
dikembangkan,
yang
dilatarbelakangi oleh kepentingan tertentu atau pada waktu tertentu. Salah satu sistem klasifikasi penutupan/penggunaan lahan yang sering digunakan dalam mengklasifikasikan
penutupan/penggunaan
lahan
menggunakan
data
penginderaan jauh adalah sistem klasifikasi FAO. Klasifikasi ini banyak dipakai sebagai standar klasifikasi penutup/penggunaan lahan dengan menggunakan citra Penginderaan Jauh, sedangkan di Indonesia sistem klasifikasi ini digunakan pada TREES Project kerjasama IPB dan Uni Eropa. Sistem klasifikasi FAO 1994 disajikan pada Tabel 3. Pemilihan kelas penutup/penggunaan lahan dalam penelitian ini adalah didasarkan pada kebutuhan dengan fokus pada lahan sawah dan tebu.
25
Tabel 3 Klasifikasi Penutup Lahan Menurut FAO Tahun 1994 Level 1
Level 2
1. Evergreen and Semi evergreen Forest
2. Deciduous Forest
1. Forest 3. Inundated Forest
4. Gallery Forest
5. Plantation
2. Mosaic
6. Forest Regrowth 7. Mangrove 9. Other 10% - 40% forest cover 1. Shifting cultivation
Level 3 0. Unknow 1.Evergreen - lowland forest 2.Evergreen-mountain forest 3. Semi-evergreen forest 4. Heath forest / kerangas 5. Coniferous 9. Other 0. Unknown 1. (Dry) – Mixed deciduous 4. Dry Dipterocarp 9. Other 0. Unknow 1. Periodically inundated 3.Swampforest(permanently inundated 4. Swamp forest with palms 5. Peat swamp forest 9. Other 0 0. Unknown 1. Teak 2. Pine 3. Eucalyptus 9. Other 0. 0. 0. 0. Undefined 1. 1/3 cropping 2. > 1/3 cropping
2. Cropland and Forest 3. Other vegetation and Forest 9. Other 3. Non Forest Vegetation< 10% canopy cover or < 10% forest cover Up to 10% of 1. Wood & shrubland 0. Unknown Forest cover 4. Bamboo 5. Swamp savanna 6. Humid (evergreen) type 7. Dry (savanna) type 9. Other 2. Grassland 0. Unknown 1. Dry grassland 2. Swamp grassland 9. Other 3. Regrowth of vegetation 9. Other < 10% canopy cover Or < 10% forest cover 1. Arable 0. unknown 1. Irigated 2. Rainfed 4. Agriculture Up to 10% of Forest cover
5. Non vegetated
6. Water 7. Sea 8. Not visible
2. Plantations
3. Ranching 9. Other 1. Urban 2. Roads 3. Infra structure 4. Bare soil 9. Other 1. River 2. Lake 1. Clouds 2. Shadow
9. No data
Sumber : FAO (1994 dalam Rosalina 2002)
0. Unknown 1. Rubber 2. Oil palm 3. Coffee, Cacao 9. Other
Level 4 A. Closed > 70% forest cover > 70% canopy cover B. Open > 70% forest cover 70-10% canopy cover C. Fragmented 40-70% forest cover >10% canopy cover D. Undefined