BAB I PENDAHULUAN
1.1 Latar Belakang Klasifikasi data citra satelit penginderaan jauh (remote sensing), dalam hubungannya dengan kemajuan teknologi remote sensor, menjadi suatu persoalan yang menantang. Apalagi jika citra satelit tersebut dengan resolusi rendah, maka yang menjadi persoalan adalah dalam hal analisis. Perubahan tingkat resolusi dapat berpengaruh dalam pengklasifikasian suatu obyek atau citra yang diamati. Resolusi
merupakan
kemampuan
suatu
sistem
optik-elektronik
untuk
membedakan informasi yang secara spasial berdekatan atau secara spektral mempunyai kemiripan (Swain dan Davis, 1978). Resolusi spasial (Richards dan Jia, 2006) digambarkan dengan ukuran piksel, yang merupakan ukuran terkecil obyek yang masih dapat dideteksi oleh suatu sistem pencitraan. Semakin halus/tinggi tingkat resolusi maka semakin jelas atau semakin kecil ukuran obyek yang dapat terdeteksi dalam sebuah citra satelit penginderaan jauh, dan semakin mudah membedakannya secara visual. Di samping itu, struktur-struktur yang ada di dalam citra juga dapat dianalisis secara rinci. Ukuran ini menunjukkan bahwa obyek yang lebih kecil dari resolusi spasial tidak akan dapat dikenali atau direpresentasikan sebagai obyek itu sendiri secara individual. Obyek tersebut akan tercatat sebagai satu sel penyusun citra.
Sedangkan resolusi spektral adalah kemampuan suatu sistem optikelektronik untuk membedakan obyek berdasarkan pantulan atau pancaran spektralnya. Semakin banyak dan sempit band yang digunakan maka semakin tinggi kemungkinannya dalam mengenali obyek berdasarkan respon spektralnya, dan jika semakin banyak jumlah bandnya, maka semakin tinggi resolusi spektralnya. Menurut Sutanto (1999), bahwa resolusi spasial menggambarkan rincian data tentang obyek yang dapat dideteksi dari suatu sistem penginderaan jauh, dan resolusi spektral menunjukkan rincian spektrum elektromagnetik yang digunakan di dalam suatu sistem penginderaan jauh. Gambar 1.1 menyajikan dua dataset, berturut-turut dengan resolusi spasial rendah dan resolusi spasial tinggi. Gambar 1.1(a), Wilayah Yogyakarta, dengan struktur kota yang tidak teridentifikasi karena tingkat resolusi rendah (30 meter). Gambar 1.1(b) adalah bagian kecil dari Gambar 1.1(a), dengan resolusi 50 kali lebih besar (0,6 meter). Dengan peningkatan atau penghalusan resolusi, maka struktur-struktur kota, seperti jalan, bangunan gedung besar, rumah hunian, lahan hijau, jembatan, mobil, dan lain-lain, sudah dapat diakses dan dibedakan secara visual. Selanjutnya, dengan resolusi spektral yang tinggi akan mengakibatkan analisis terhadap struktur akan lebih rinci. Sebagai contoh, data hiperspektral citra Hyperion di atas wilayah Yogyakarta dan sekitarnya, terdiri dari 242 band spektral, dan di antaranya seperti dalam Gambar 1.2. Dengan banyaknya band spektral ini, akan lebih memungkinkan uraian struktur setiap dataset secara rinci.
2
(a)
(b)
Gambar 1.1 Citra satelit: (a) Hyperion di atas area Yogyakarta dan sekitarnya – resolusi spasial 30 m; (b) Data Quickbird bagian Yogyakarta – resolusi spasial 0,6 m
(a)
(b)
Gambar 1.2 Citra satelit Hyperion di atas area Yogyakarta: (a) Band 15 (Band 3, rev), (b) Band 114 (Band 58, rev)
3
Resolusi spasial terkait dengan klasifikasi fitur, yaitu semakin besar resolusi spasial sebuah citra remote sensing, maka semakin baik melakukan klasifikasi terhadap obyek yang ada di dalamnya, sedangkan resolusi spektral diperlukan untuk pereduksian dimensi. Semakin tinggi resolusi spektral dari suatu citra remote sensing, maka semakin banyak dimensinya. Akibatnya, penggunaan metode pereduksian fitur dari dimensi tersebut semakin diperlukan, yang manfaatnya, terutama untuk analisis lebih lanjut, seperti klasifikasi. Data citra remote sensing dikarakterisasi dengan data yang dapat dipandang sebagai koleksi spektra (domain spektral) di mana setiap piksel merupakan vektor dan komponennya adalah nilai-nilai reflektansi (pantulan) pada panjang gelombang tertentu, dan sekaligus dapat dianggap sebagai koleksi citra (domain citra/spasial) yang diperoleh pada panjang gelombang yang berbeda. Upaya
pertama
untuk
menganalisis
data
remote
sensing
dengan
menggunakan metodologi, seperti teknik pengembangan lahan, berdasarkan pemodelan sinyal, dikemukakan Landgrebe (2003). Setiap vektor piksel digunakan sebagai sinyal, dan sinyal itu didasarkan pada algoritma pemrosesan, yang lebih banyak berdasarkan pemodelan statistika. Pendekatan tradisonal dalam mengklasifikasi data remote sensing bisa diringkas seperti
dalam Landgrebe
(2005), dari dataset asli, tahapan membuat seleksi/reduksi fitur sesuai kelas yang dipelajari, kemudian melakukan klasifikasi menggunakan fitur terekstraksi ini. Jika data sampel (data latih) yang diperoleh sedikit, maka umumnya dilakukan prosedur iteratif, dengan menambahkan sampel yang semi-label, yaitu sampel
4
yang tidak berlabel setelah tahap klasifikasi tertentu kemudian diberi label, pada data latih yang sesuai kriteria tertentu. Dimensi dalam citra remote sensing dikenal dengan band (saluran); untuk sensor hiperspektral dalam suatu wilayah, dapat mengumpulkan lebih dari ratusan band spektral sekaligus, dengan resolusi spasial yang lebih besar, misalnya 1,5 meter, sedangkan untuk data multispektral terdapat puluhan band, serta sensor pankromatik hanya ada satu band. Permasalahan dimensionalitas secara tradisional (Landgrebe, 2003), dapat diselesaikan dengan menggunakan algoritma ekstraksi fitur (FE). Di samping itu, ada juga teknik tak terkontrol (unsupervised) standar seperti principal component analysis atau analisis komponen utama (AKU) dan independent component analysis (ICA), dan teknik terkontrol (supervised) di antaranya discriminant analysis feature extraction (DAFE), decision boundary feature extraction (DBFE), dan non-parametric weighted feature extraction (NWFE). Kesulitan-kesulitan dalam menganalisis data citra remote sensing di antaranya adalah, persoalan data yang berukuran besar, ketepatan permukaan bumi yang terbatas, perlunya informasi spasial/kontekstual, dan kesulitan mengekstraksi informasi spasial (Fauvel, 2007). Kesulitan lain adalah sifat-sifat data itu sendiri, misalnya, resolusi spektral dan resolusi spasial yang telah mengalami peningkatan luar biasa sejak tahun 1970-an, dan juga daerah cakupan sensor, serta peningkatan masing-masing nilai spektral (dari 8-bit hingga 16-bit). Hal ini berakibat kesesuaian algoritma, untuk jenis data tertentu belum dapat dipastikan sama terhadap jenis data yang lain. Misalnya, suatu model statistika
5
tertentu dapat dilakukan dengan baik untuk suatu sensor tertentu, tetapi belum bisa dipastikan sesuai bagi sensor lainnya. Dalam penelitian ini dipelajari reduksi dan klasifikasi fitur. Untuk reduksi dimensi dilakukan dengan metode analisis komponen utama kernel (AKUK), namun, karena pada umumnya masalah dalam domain dunia nyata (real world problem) jarang yang bersifat linear-separable, dan kebanyakan bersifat nonlinear, sedangkan kinerja AKU belum optimal untuk data non-linear, apalagi data citra satelit yang digunakan dalam penelitian ini diasumsikan berdimensi tinggi (hiperspektral) dan non-linear. AKUK adalah AKU yang diaplikasikan pada data input yang telah ditransformasi ke ruang fitur. Kajian AKUK ini difokuskan pada terbentuknya matriks kernel, sebagai representasi matriks kovariansi. Penelitian ini juga dilanjutkan dengan melakukan klasifikasi terhadap citra remote sensing, menggunakan metode pengklasifikasi dengan fungsi regresi kernel.
1.2 Tinjauan Pustaka Studi pendahuluan yang telah dilakukan, adalah mencari berberapa literatur sebagai bahan referensi. Dalam kaitan dengan klasifikasi citra penginderaan jauh, kajian yang telah dilakukan adalah peranan AKU untuk mengekstraksi fitur (obyek) dapat memberikan pemahaman klasifikasi yang memadai (Djakaria, dkk, 2010b), dan klasifikasi terhadap obyek yang berukuran kecil (Djakaria, 2012), serta perbandingan antara hasil ekstraksi fitur melalui AKU (dan AKUK) (Djakaria, dkk, 2011). Sehingga, untuk melihat tingkat pemahaman yang dimaksud di atas, perlu kajian lebih lanjut, terutama menyangkut tingkat akurasi.
6
AKU, adalah suatu metode yang banyak digunakan untuk mereduksi sejumlah dimensi, misalkan p, dari sekumpulan data (variabel) observasi, menjadi k variabel baru, dengan k p. Setiap k variabel baru hasil reduksi merupakan kombinasi linear dari p variabel asal, dengan variansi yang dimiliki oleh p variabel asal, sebagian besar dapat diterangkan oleh k variabel baru. AKU telah dipelajari sejak awal abad 20, Pearson tahun 1901 dan Hotelling tahun 1935 telah mempelajarinya melalui metode komputasi praktis (Tipping dan Bishop, 1999). Perkembangan AKU begitu pesat, terutama penerapannya dalam berbagai bidang, misalnya bidang kesehatan, biologi, lingkungan, pemrosesan citra, dan lain-lain, sehingga menjadi suatu metode yang sangat baik untuk mereduksi sejumlah variabel yang berdimensi lebih tinggi dan nonlinear, dengan menggunakan fungsi kernel. Metode ini dikenal dengan AKUK. AKUK banyak dibahas para ilmuwan, seperti Schölkopf, dkk (1998), yang membandingkan manfaat AKUK dalam ruang fitur untuk pattern recognition dengan menggunakan sebuah pengklasifikasi linear, dan menemukan dua manfaat AKUK. Pertama, komponen utama (KU) nonlinear memberikan evaluasi recognition terbaik dibandingkan dengan jumlahan KU linear yang bersesuaian; dan kedua, pembentukan komponen nonlinear dapat lebih dikembangkan dengan menggunakan komponen yang lebih banyak daripada dalam kasus linear yang bersesuaian. Bahasan ini masih seirama dengan Yang, dkk (2004), yang menganggap AKUK sebagai perluasan AKU. Menurut Yang, dkk, AKU merupakan salah satu teknik klasik untuk menguraikan fitur linear, sedangkan AKUK adalah salah satu metode yang menguraikan fitur nonlinear.
7
Bahasan Schölkopf, dkk ini telah menjadi rujukan banyak penulis, lihat saja, misalnya Weinberger, dkk (2004), mengaitkan AKUK dengan matriks kernel untuk mereduksi dimensi nonlinear, dan menurut Wu, dkk (2004), AKUK dapat digunakan untuk memperoleh representasi dimensi rendah dari input dimensi tinggi, sedangkan Mika, dkk (1999), berpandangan bahwa AKUK baik sekali digunakan untuk mengekstrak struktur data nonlinear, dan masih banyak lagi. Proses ini bertujuan untuk mempertimbangkan kendala nonlinear, dan untuk memperjelas hubungan antara perluasan ruang fitur dengan pola (pattern) yang sangat berarti (meaningful) dalam input space. Pada awalnya, AKUK memetakan data ke dalam ruang fitur melalui suatu fungsi yang umumnya nonlinear, dan selanjutnya membentuk AKU linear pada data hasil pemetaan. Seperti halnya dengan AKU, AKUK juga bertujuan untuk mereduksi sejumlah dimensi variabel agar menjadi lebih sederhana, dengan tidak mengurangi informasi yang ada di dalam variabel sebelumnya. Prosedur ini lebih dikenal dengan retain variances. Zhou (2003) menyajikan suatu analisis probabilistik dari komponen utama kernel (KUK) dengan menyatukan teori AKU probabilistik dan AKUK. Prosedur ini ditunjukkan, selama komponen kernel mengembangkan pemodelan fungsi power (kuasa) nonlinear yang memberikan struktur probabilistik. Di samping itu, AKUK (Zwald dan Blanchard, 2005) bertujuan untuk menemukan kembali suatu subruang dimensi tertentu, dari ruang Hilbert, sehingga suatu proyeksi pada subruang tersebut mempunyai harga mutlak rata-rata kuadrat maksimum.
8
AKU, dan varian nonlinearnya, AKUK, adalah algoritma yang digunakan secara luas dalam analisis data. Semuanya diekstrak dari ruang vektor di mana data itu berada, suatu basis yang disesuaikan dengan data yang bervariansi maksimum. Penerapannya sangat bervariasi, berkisar dari reduksi dimensional, hingga denoising. Penerapan AKU dalam suatu ruang fungsi yang dibandingkan dengan suatu ruang vektor pertama-tama diusulkan oleh Besse pada tahun 1979, dalam sebuah disertasi program Ph.D di Universitas Toulouse, Prancis (Zwald, dkk, 2004). AKUK merupakan suatu contoh metode yang telah memotivasi pemahaman tentang AKU sehingga dapat mengabaikan batasan (persyaratan) AKU linear dengan baik (Schölkopf, dkk, 1998). Dibandingkan dengan metode lain untuk AKU nonlinear, seperti multi-layer perceptron (MLP) autoassosiatif dengan sebuah bottleneck layer hidden atau kurva utama (Schölkopf, dkk, 1998; dan Schölkopf & Smola, 2002), AKUK mempunyai keunggulan manfaat dengan tidak melibatkan optimisasi nonlinear. Di sini hanya memerlukan penyelesaian masalah nilai eigen seperti pada kasus AKU standar. Selain itu, jika dibandingkan dengan kebanyakan jenis neural network AKU (Oja dalam Schölkopf , dkk, 1998; Schölkopf & Smola, 2002), maka AKUK berfungsi untuk memberikan suatu informasi (pemahaman) yang lebih baik dari jenis fitur nonlinear yang diekstrak, yaitu komponen-komponen utama dalam ruang fitur yang ditetapkan sebelum pemilihan fungsi kernel. Dalam hal ini, spesifikasi jenis nonlinearitas masih sangat luas, yang seluruhnya memilih ruang fitur (dimensi tinggi), tetapi bukan ruang bagian yang relevan yang dilaksanakan secara otomatis.
9
Yao, dkk (2015) mengaplikasikan AKUK aditif tergeneralisasi guna melakukan monitoring sekumpulan proses. Dalam aplikasi pada data remote sensing, AKU (Danoedoro, 1996) merupakan teknik rotasi yang sangat spesifik, yang diterapkan pada sistem koordinat multiband (saluran atau dimensi yang banyak, bahkan lebih dari 3 dimensi) sehingga menghasilkan sumbu-sumbu baru atau citra baru dengan jumlah band yang lebih sedikit, dengan demikian AKU mampu mereduksi dimensi data. Sedangkan menurut Fauvel (2007), AKU memerankan sebuah aturan penting dalam pemrosesan citra remote sensing. Meskipun demikian batasan teoritik untuk analisis data hiperspektral yang telah ditunjukkan dalam situasi praktis pada hasil-hasil yang diperoleh menggunakan AKU, masih kompetitif untuk tujuan klasifikasi. Keunggulan dari AKU adalah tidak terlalu kompleks di dalam hal analisis dan tidak adanya parameter yang diperhatikan. Namun, AKU hanya berperan di dalam statistik orde kedua, yang dapat membatasi efektivitas metode ini. Untuk mengatasi kelemahan ini, disajikan versi AKU nonlinear, yakni AKUK, yang dapat bekerja pada statistik order lebih tinggi. Tan, dkk (2006), merencanakan untuk menggunakan algoritma AKUK pada data ilmu kebumian real seperti sea surface temperature (SST) atau normalized difference vegetation index (NDVI). Informasi yang dihasilkan dari AKUK dapat berkorelasi dengan sinyal seperti Southern Oscilation Index (SOI) untuk menentukan keterhubungan dengan fenomena El Nino. AKUK dapat digunakan untuk menemukan korelasi data nonlinear yang kemungkinan tidak dapat ditemukan menggunakan AKU standar. Informasi atau data yang dihasilkan
10
menggunakan AKUK meliputi fitur data nonlinear. Fitur-fitur ini berkorelasi dengan sinyal spasial-temporal yang dapat menemukan hubungan nonlinear. AKUK memberikan peningkatan analisis dataset yang memiliki struktur nonlinear. Bajwa, dkk (2009) dan Bajwa dan Hyder (2005) mengklasifikasi citra awan dengan lapisan tunggal menggunakan AKU serta membandingkannya dengan AKUK.
Langkah-langkah
yang
dilakukan
meliputi,
pengumpulan
data,
penormalisasian citra awan, mendefinisikan kelas-kelas awan, mengklasifikasi jenis awan, mengevaluasi tingkat akurasi, dan membandingkannya dengan teknologi yang lain. Manfaat aplikasi pengklasifikasian struktur wilayah perkotaan (Netzband, dkk, 2005) adalah algoritma klasifikasi dapat digunakan untuk membuat peta tematik, tentang evolusi pertumbuhan wilayah perkotaan. Pada tingkat resolusi rendah, klasifikasi hanya memungkinkan untuk mengekstrak jaringan kota dalam mengevaluasi hubungan antara setiap zona kota (pinggiran kota, tengah, dan lainlain). Hal ini merupakan manfaat terhadap pemetaan dan pengklasifikasian. Manfaat terhadap manajemen risiko, yaitu, dengan mengidentifikasi daerah perumahan (pemukiman), daerah komersial, dan daerah industri, akan memungkinkan untuk menganalisis sensitivitas dari sebuah kota yang berisiko alam. Analisis geofisika memungkinkan untuk mendapatkan pengetahuan yang lebih akurat tentang bahaya geologi yang mungkin terjadi. Remote sensing dapat bermanfaat, antara lain dengan menganalisis tata ruang kota, seperti wilayah padat, daerah terbuka, dan lain-lain, maka dapat membuat pemetaan masalah
11
sosial, dan distribusi layanan kritis (misalnya rumah sakit, sekolah) dapat dipelajari. Di atas telah dikemukakan, bahwa modifikasi yang tidak hanya menggunakan algoritma klasifikasi piksel, akan tetapi juga algoritma piksel tetangganya, adalah modifikasi dengan memasukkan informasi kontekstual. Algoritma klasifikasi ini tidak banyak memanfaatkan informasi spasial yang terdapat pada data remote sensing, dengan alasan pada umumnya data resolusi spasial yang rendah. Namun, data dengan resolusi spasial tinggi memuat informasi kontekstual yang banyak, karena dengan sebuah piksel yang diberikan maka dapat diekstrak ukuran, bentuk dan distribusi tingkat kekaburan (gray-scale) dari strukturnya. Hal ini merupakan cara mendiskriminasi beberapa struktur yang dibuat dari materi yang sama. Sebagai contoh, menurut Fauvel (2007), jika informasi spektral saja yang digunakan, maka atap dari rumah pribadi dan gedung besar akan terdeteksi sebagai jenis struktur yang sama, tetapi dengan menggunakan informasi spasial, akan memungkinkan klasifikasi dua obyek itu ke dalam dua kelas terpisah. Jelasnya adalah, diperlukan sebuah pengklasifikasi spektral/spasial secara simultan untuk mengklasifikasi data satelit penginderaan jauh daerah perkotaan dengan lebih baik. Jackson dan Landgrebe (2002) juga telah merencanakan suatu pengklasifikasi statistik iteratif berdasarkan pemodelan Markov random fields (MRF) konvensional. Namun, pemodelan MRF mengalami kesulitan karena resolusi spasial yang tinggi, di mana piksel-piksel yang berdekatan sangat berkorelasi sehingga definisi sistem standar kedekatannya tidak memuat sampel yang cukup efektif. Kelemahannya, sistem kedekatan yang besar
12
memerlukan komputasi yang sulit, sehingga dapat mengurangi manfaat pemodelan MRF konvensional. Demikian pula dengan algoritma-algoritma yang berdasarkan MRF secara tradisional, memerlukan tahapan-tahapan optimasi iteratif, yang membutuhkan waktu yang cukup lama, dan berakibat penggunaan informasi spasial tidak menghasilkan peningkatan akurasi klasifikasi. Tinjauan di atas merupakan kajian dari segi pereduksian fitur melalui AKU dan AKUK, sedangkan kajian tentang pengklasifikasian dan pendeteksian fitur diuraikan berikut. Benediktsson, dkk (2003) menggunaan filter morfologi sebagai cara alternatif untuk melakukan klasifikasi bersama. Filter morfologi memungkinkan untuk menganalisis tetangga suatu piksel menurut struktur dari mana ia berasal dibandingkan dengan mendefinisikan keteraturan tetangga yang ditetapkan untuk setiap piksel. Pendekatan ini telah memberikan hasil yang baik untuk berbagai data perkotaan (lihat pula Benediktsson, dkk, 2005). Apabila data terdiri dari ruang vektor berdimensi tinggi maka akan muncul persoalan praktis dan persoalan teoritis, dan yang paling utama adalah kesulitan dalam estimasi statistika dan banyaknya informasi komponen vektor (Fauvel, 2007). Dalam persoalan dimensionalitas dari vektor fitur, perlu adanya kehatihatian karena akan lebih membuat rumitnya persyaratan serta menambah informasi kontekstual pada informasi spektral data asli. Meskipun demikian, pendekatan tradisional sebagaimana metode statistika dan metode neural bisa gagal dengan data berdimensi tinggi, sehingga tidak sesuai dengan penggunaan informasi spasial yang ada.
13
Berbagai proses pencitraan, seperti keterhubungan pola, teknik pengenalan, dan metodologi yang digunakan adalah untuk menganalisis informasi yang terdapat dalam citra (Bajwa, dkk, 2009). Teknologi yang digunakan dapat dibedakan dalam dua bagian, yaitu yang digunakan untuk pendekatan statistika dan pendekatan non statistika. Metodologi statistika, seperti Fisher discriminant analysis (FDA) (Joo, 2003), radial basis function neural network (RBFNN) (Hongtao, dkk, 1997), dan support vector machines (SVM) (Cao, dkk, 2004) dapat digabungkan untuk melakukan analisis terhadap citra remote sensing. Sedangkan untuk teknik non-statistika, pendekatan yang sering digunakan untuk pemrosesan citra adalah neural network (Ou, dkk, 1999; Barsi dan Heipke, 2003). Metodologi-metodologi yang digunakan mempunyai beberapa keterbatasan, antara lain, memerlukan waktu latih yang lebih lama, lebih mengeksploitasi waktu pemrosesan, dan keterbatasan akurasi sekitar 70% (Haykin, 1999). Penurunan tingkat akurasi ini sering akan menurunkan klasifikasi citra remote sensing, sehingga akan mengurangi ketelitian dalam identifikasi. Klasifikasi data citra hiperspektral terhadap fase pertumbuhan tanaman padi dilakukan Darmawan, dkk (2011), dengan teknik spectral angle mapper (SAM). Dengan teknik ini, perbedaan fase pertumbuhan tanaman padi dapat dengan mudah dilakukan sehingga untuk masa yang akan datang dapat diaplikasikan untuk estimasi produksi pada kurun waktu tertentu. Penelitian-penelitian yang telah dilakukan antara lain Fauvel (2007), tentang metode spektral dan spasial untuk mengklasifikasi data penginderaan jauh di atas wilayah perkotaan. Untuk mengklasifikasi fitur atau obyek-obyek pada wilayah
14
perkotaan, Fauvel menggunakan metode morphological profile (MP) dan derivative morphological profile (DMP). MP terdiri dari profil bukaan (opening profile, OP) dan profil tutupan (closing profile, CP), sedangkan DMP adalah derivatif MP. Kesimpulan dari penelitiannya, bahwa terdapat dua strategi umum, pertama, digunakan dua langkah pendekatan, dimana pada langkah pertama, menggunakan fakta bahwa AKU meminimalkan kesalahan rekonstruksi dalam mengekstraksi citra representatif dari data dan melakukan analisis spasial pada fitur terekstraksi, merupakan pendekatan yang baik untuk mencapai tujuan klasifikasi. Sedangkan pada langkah kedua, adalah meliputi klasifikasi data menggunakan fitur spektral dan fitur spasial terekstraksi. Penggunaan support vector machines (SVM) memberikan solusi masalah yang berkaitan dengan dimensi data hiperspektral dan data latih ukuran sedikit. Untuk MP, sebuah vektor dibuat menggunakan fitur spasial yang terekstraksi, dan untuk spektro-spasial SVM, didefinisikan sebuah kernel yang menggunakan kedua informasi, spektral dan spasial. Selain itu, pembobotan parameter yang mengontrol pengaruh setiap jenis informasi yang ada dalam kernel yang dipilih. Hasil eksperimen menunjukkan akurasi yang sangat baik dan perilaku yang saling melengkapi dua pendekatan klasifikasi. Pendekatan morfologis mengekstrak fitur geometris lebih informatif daripada yang didasarkan pada filterisasi daerahnya sendiri. Dengan demikian pendekatan morfologis lebih sesuai untuk daerah perkotaan, sedangkan pendekatan berdasarkan filter komplementer diri lebih cocok untuk peri-urban.
15
Strategi kedua, adalah berdasarkan penggabungan data. Pada awalnya diselidiki penggabungan hasil dari beberapa pengklasifikasi. Hasil yang baik dalam hal akurasi klasifikasi yang diperoleh dibandingkan dengan hasil yang diperoleh dari masing-masing pengklasifikasi. Fitur spektral dan fitur spasial dari daerah yang sama dianggap sebagai dua data terpisah, kemudian dilakukan penggabungan sebelum klasifikasi, yang bertujuan untuk memasukkan lebih banyak informasi spektral. Di Indonesia, penelitian yang menggunakan metode AKU, terhadap data remote sensing, antara lain Wicaksono (2008) menyelidiki tingkat kesehatan terumbu karang di Kepulauan Karimunjawa, dengan menggunakan transformasi AKU, membandingkan kemampuan citra Landsat 7 ETM+ dan citra ASTER. Hasil penelitiannya menyimpulkan bahwa, dengan beberapa kombinasi KU, ternyata citra Landsat 7 ETM+ masih lebih unggul dibandingkan dengan citra ASTER. Serupa dengan Wicaksono, Palapa (2002) mengidentifikasi dan memetakan terumbu karang di Kepulauan Seribu, DKI Jakarta, dengan menggunakan metode AKU pada citra hiperspektral CASI 15 band, dengan tingkat akurasi citra KU1 sebesar 57%, KU2 35,5%, dan KU3 45%. Farda (2008), mengkaji klasifikasi obyek berdasarkan segmentasi untuk menganalisis citra dengan resolusi spasial tinggi, tidak menggunakan metode AKU atau AKUK, melainkan metode klasifikasi berorientasi obyek menggunakan segmentasi, seperti, K-Means image clustering, K-Means region clusterer, fuzzy C-Means image clustering, simple region growing, statistical region merging, dan mean shift, dan membandingkannya dengan citra tanpa segmentasi menggunakan
16
metode klasifikasi minimum distance to mean. Dari penelitiannya, diperoleh klasifikasi citra hasil segmentasi mampu meningkatkan akurasi dengan baik. Berdasarkan informasi yang diuraikan di atas, maka dalam penelitian ini dilakukan pendeteksian matriks kovariansi melalui transformasi AKU dan matriks kernel melalui transformasi AKUK, untuk kernel yang dipilih. Selanjutnya pekerjaan difokuskan pada pengklasifikasian obyek-obyek yang ada, dengan menggunakan metode klasifikasi fungsi RKUK. Perbedaan dengan penelitian terdahulu, adalah penggunaan fungsi RKUK untuk kernel RBF, sebagai fungsi pengklasifikasi dengan metode klasifikasi biner. Di samping itu, kajian piksel-piksel dari obyek remote sensing. Kalau pada penelitian
tentang
remote
sensing
dengan
transformasi
AKU,
lebih
menitikberatkan pada pereduksian terhadap dimensi, maka untuk metode fungsi regresi kernel dengan AKUK ini, lebih memperhatikan matriks kernel yang terbentuk. Hasil pereduksian dimensi untuk AKUK tidak terlalu dipertimbangkan, melainkan lebih memperhatikan matriks kernel yang terbentuk. Selanjutnya, hasil ekstraksi fitur sebagai hasil transformasi piksel dengan AKUK akan dibagi dalam piksel (data) latih dan data uji.
1.3 Perumusan Masalah Berdasarkan uraian sebelumnya, dapat dikemukakan beberapa permasalahan dengan rumusan sebagai berikut: i. Bagaimanakah peranan algoritma AKUK dalam metode fungsi RKUK untuk klasifikasi data citra remote sensing?
17
ii. Bagaimanakah gambaran kajian sifat-sifat parameter dari model RKUK? iii. Bagaimanakah aturan model klasifikasi biner untuk data multikelas? iv. Seberapa besarkah tingkat akurasi klasifikasi obyek data citra remote sensing dengan menggunakan metode fungsi RKUK melalui fungsi sgn(f(x)) dan modifikasi, sgn(f(x) + ), sebagai aturan klasifikasi, dengan kernel RBF?
1.4 Tujuan Penelitian Penelitian ini bertujuan memberikan informasi tentang penerapan teknik AKUK, terutama untuk data citra remote sensing pada penutup lahan. Selanjutnya, diperoleh metode klasifikasi yang unggul terhadap obyek data citra remote sensing pada penutup lahan. Tujuan penelitian meliputi, antara lain: i. Memberikan kajian tentang algoritma AKUK dalam metode fungsi RKUK untuk klasifikasi data citra remote sensing. ii. Memberikan kajian sifat-sifat parameter dari model RKUK. iii. Menemukan aturan klasifikasi biner untuk data multikelas. iv. Menjelaskan tingkat akurasi pengklasifikasi fitur dengan metode fungsi RKUK pada data citra remote sensing, baik dengan fungsi sgn(f(x)) maupun fungsi modifikasi sgn(f(x) + ), secara kuantitatif menggunakan matriks confusion.
18
1.5 Pembatasan Penelitian Permasalahan yang berhubungan dengan pereduksian (transformasi) dan klasifikasi fitur pada data citra remote sensing merupakan pertanyaan terbuka dan kompleks. Oleh karenya dalam penelitian ini diberikan batasan permasalahan agar penelitian yang dilakukan lebih fokus. Batasan-batasan permasalahan dalam penelitian ini antara lain: i. Memformulasi model fungsi RKUK. ii. Membentuk aturan klasifikasi biner untuk data multikelas. iii. Analisis tingkat akurasi klasifikasi dengan metode fungsi RKUK. Dalam penelitian ini digunakan fungsi kernel yang dipilih seperti didefinisikan pada Bab II, yaitu kernel RBF.
1.6 Manfaat Penelitian Terdapat dua kajian utama dalam penelitian ini, meliputi kajian teoritik dan kajian aplikasi (terapan). Dari dua kajian ini diharapkan akan dapat memberikan beberapa manfaat, antara lain: i. Sebagai salah satu prosedur yang dapat memudahkan penelitian lebih lanjut tentang analisis statistika multivariat, khususnya teknik AKUK yang merupakan salah satu teknik pereduksian dimensi dalam teori multivariat, sehingga terbentuk data transformasi dengan AKUK yang akan digunakan untuk klasifikasi fungsi regresi kernel.
19
ii. Di samping itu, penelitian ini juga bermanfaat bagi pemrosesan citra remote sensing, terutama dalam mengklasifikasi obyek-obyek atau fitur sehingga memberikan ketepatan dalam penafsiran suatu obyek dari obyek yang lain.
1.7 Metodologi Penelitian Metode yang digunakan dalam penelitian ini adalah studi literatur, kajian teoritik, dan kajian aplikasi, serta membuat contoh dengan software. Di samping itu pula dilakukan studi lapang, untuk penyelidikan awal data aplikasi, yang termasuk dalam preprocessing. Studi literatur yang tentu saja didahului dengan pengumpulan literatur pokok, berupa texbook dan jurnal, meliputi kunjungan ke perpustakaan baik fisik maupun elektronik, termasuk penelusuran bahan penelitian dan jurnal melalui internet. Hal ini tidak hanya pada awal penelitian, namun akan secara sporadis dilakukan pada saat diperlukan. Penelitian akan dimulai dengan melakukan peninjauan (review) AKUK, dan metode pengklasifikasi fungsi regresi kernel untuk kernel yang dipilih, termasuk mendeskripsikan kelebihan dan kekurangan dari metode ini. Beberapa aplikasi pada data real, terutama data yang akan digunakan dalam penelitian ini, berupa citra digital remote sensing hiperion, juga akan dilakukan untuk konfirmasi hasil teoritis yang diuraikan sebelumnya misalnya bahwa KU, dan juga KUK tidak saling berkorelasi satu sama lain. Demikian pula akan ditinjau tingkat akurasi metode pengklasifikasi fungsi regresi kernel, terhadap obyek-obyek dalam data citra remote sensing yang digunakan. Dalam hal aplikasi ini akan digunakan software antara lain Matlab.
20
Tahapan penelitian yang direncanakan untuk mencapai tujuan penelitian diuraikan dalam dua kajian berikut, yaitu kajian teoritik dan kajian aplikatif. Kajian teoritik antara lain: i. Mempelajari dan mengkaji konsep dasar AKU, terutama dalam penetapan KU yang memiliki kandungan informasi yang besar dibandingkan dengan KU lainnya. ii. Seperti halnya kajian AKU, dalam penelitian ini juga dilakukan kajian model AKUK. iii. Mempelajari model analisis yang berhubungan dengan teknik pengklasifikasi, seperti fungsi RKUK, untuk fungsi kernel RBF, bersama kajian tentang sifatsifat estimator RKUK. Sedangkan kajian aplikatif meliputi, antara lain: i. Mempelajari dan mengkaji prosedur penetapan model AKUK melalui data citra remote sensing hiperion. ii. Mengembangkan suatu prosedur pengklasifikasian obyek-obyek atau fitur-fitur yang ada pada data citra remote sensing dengan pengklasifikasi fungsi RKUK, sgn(f(x)) serta modifikasinya sgn(f(x) + ). Adapun road map penelitian ini disajikan dalam Gambar 1.3.
21
AKU (metode mereduksi dimensi data Input: X yang memiliki struktur data linear dan berdimensi rendah)
AKUK (metode mereduksi dimensi data secara nonlinear, ilustrasi Gambar 2.1) Kernel RBF (Definisi 2.13)
KUK ke-k: (model), Persamaan (2.31, 3.14, dan 3.15)
KU ke-: (model), Persamaan (2.1) Y = a1X1 + a2X2 +… + apXp p = j=1 a j Xj = a X, = 1, …, p,
k(x) =
Regresi
Regresi
Variabel hasil reduksi (Y = X) digunakan sebagai prediktor untuk model RKU: Persamaan (3.4) Y = X + (Teorema 3.2 dan Teorema 3.3) dengan estimator parameter (3.11)
Variabel hasil reduksi (W = XV) (3.29), digunakan sebagai prediktor untuk model RKUK: Persamaan (3.31) Y = W + (Teorema 3.4 dan Teorema 3.5) dengan estimator parameter (3.40) Klasifikasi
(Poggio dan Smale, 2003): Fungsi RKUK digunakan untuk membentuk fungsi klasifikasi dari sekelompok data berlabel secara parsial, dengan menggunakan vektor bobot (Pers. (4.8), b = ). Bentuk model (3.21) dan (3.22), dapat dibentuk kembali menjadi model (3.48), Y = f(x)
, dan setelah x menjadi xtr dan xts, maka
bentuk model menjadi Pers. (4.13). Dari Pers. (4.7) s.d (4.13), dilanjutkan ke fungsi klasifikasi:
sgn(f(x)+) =
sgn(f(x) =
(4.15)
R , kinerja klasifikasi lebih optimal.
Gambar 1.3: Roadmap Penelitian (X input adalah digital number citra hiperion) 22
1.8 Kerangka Penulisan Tulisan ini terdiri dari enam bab, diawali dengan Bab I, yang menguraikan latar belakang, tinjauan pustaka, perumusan masalah, tujuan penelitian, pembatasan penelitian, manfaat penelitian, metodologi penelitian, dan kerangka penulisan. Selanjutnya, Bab II, akan meninjau konsep-konsep dasar teori tentang AKU, dan AKUK. Kemudian, diuraikan beberapa metode yang digunakan untuk menganalisis data citra digital satelit penginderaan jauh, yang dikaitkan dengan AKU, antara lain AKUK dan informasi pendukung lainnya. Bab III, membahas RKUK, yang meliputi pemodelan RKU, RKUK itu sendiri, dan pemodelan RKUK untuk data remote sensing hiperion. Pada bab ini juga dibahas beberapa teorema sebagai usulan dalam disertasi ini. Sedangkan Bab IV meninjau klasifikasi menggunakan RKUK, yang antara lain konsep klasifikasi, dan klasifikasi dengan metode RKUK. Bab V membahas aplikasi RKUK pada data citra remote sensing, yang terdiri dari analisis data citra satelit dengan komponen utama kernel (KUK), dan analisis klasifikasi untuk kernel yang dipilih seperti didefinisikan pada Bab II. Terakhir, dalam Bab VI akan diberikan beberapa kesimpulan pembahasan tulisan ini, saran-saran, dan masalah terbuka, agar dapat memberikan peluang bagi penelitian-penelitian lain berdasarkan perkembangan teknologi dan informasi serta teknologi lainnya.
23