JURNAL ILMIAH ELITE ELEKTRO, VOL. 2, NO. 1, MARET 2011: 45-49
45
Pemilihan Ciri Data Citra Penginderaan Jauh dengan Menggunakan Metode Transformasi Komponen Utama Mulyono1*, dan Aniati Murni Arimurty2 1. Jurusan Matematika, FMIPA, Universitas Negeri Jakarta, Jakarta Timur 13220, Indonesia 2. Fakultas Ilmu Komputer, Universitas Indonesia, Depok 16424, Indonesia *E-mail:
[email protected]
Abstrak Pemilihan ciri merupakan subyek penting dalam pengenalan pola. Tulisan ini merupakan hasil kajian metode pemilihan fitur atau ciri transformasi komponen utama pada data penginderaan jauh. Pada aplikasi penginderaan jauh dengan sensor optik seperti Landsat TM, yang sensornya terdiri dari 7 panjang gelombang, akan diperoleh 7 citra fitur (multi band). Adanya kendala awan pada citra optik, telah menyebabkan adanya upaya penggunaan citra radar. Pada interpretasi citra radar, diperlukan analisis ciri tekstur yang merupakan hasil transformasi dari model tekstur terhadap data aslinya. Untuk tujuan penyimpanan dan pemrosesan data, diusahakan hanya menggunakan sejumlah data yang terbatas, tetapi menghasilkan klasifikasi yang optimal. Pemilihan fitur merupakan suatu metode yang bertujuan untuk mendapatkan subset fitur yang optimal. Pada tulisan ini memperkenalkan metode pemilihan fitur transformasi komponen utama yang diujicobakan terhadap dua data uji, yaitu citra optik (data citra daerah Jawa Tengah) dan citra radar (data citra daerah Sumatera Selatan) yang semuanya merupakan data skala kecil yaitu tiap-tiap data kurang dari 20 ciri. Akurasi klasifikasi rata-rata yang didapat dengan metode transformasi komponen utama untuk kedua data uji secara berturut-turut adalah sebagai berikut: pada data citra daerah Jawa Tengah sebesar 91,86% dan pada data citra daerah Sumatera Selatan sebesar 86,58%.
Abstract The Selection Data Image Sensing by Using Far Main Components of Transformation. Feature selection is important thing at the pattern recognition. This paper discussed about a method for feature selection using principal component transform method in the application of remote sensing. In terms of application of remote sensing using optical sensor image such as Landsat TM images which has seven wave length, this sensor may obtain seven image feature (multi band). The problem of cloudy at optical images has been overcome by radar images. For radar images interpretation, analysis texture image is needed which is transformation result of texture model from the original data. For both storing and processing of data, it is suggested to use limited data but result the optimum classification. Feature selection is a method to obtain an optimum subset feature. This study introduces a method for feature selection using principal component transform method that was tested on two testing data such as optical image (center of Java image) and radar image (South Sumatera image). The average of classification accuracy which is obtained using this method for both testing data respectively as follow: for image feature in center of Java is 91,86% and for South Sumatera is 86,58% . Keywords: component transform remote sensing, pattern rcognition, radar images
untuk tujuan interpretasi citra, dan sudah banyak algoritma pemilihan subset fitur yang dikembangkan untuk mendapatkan sejumlah fitur yang optimal tersebut. Algoritma-algoritma yang sudah umum digunakan adalah sequential forward selection, sequential backward selection, generalized sequential forward selection, generalized sequential backward
1. Pendahuluan Dimensi fitur jumlahnya bisa tidak terbatas dan pemrosesan data dalam dimensi besar mempunyai implikasi pada kebutuhan tempat penyimpanan dan waktu proses yang besar. Oleh karena itu pemilihan fitur diperlukan untuk mendapatkan fitur yang optimal
45
46
JURNAL ILMIAH ELITE ELEKTRO, VOL. 2, NO. 1, MARET 2011: 45-49
selection, plus l-take away r, generalized plus l-take away r, sequential forward floating selection, sequential backward floating selection, max-min, branch and bound, genetic algorithm [1], band selection, transformasi komponen utama (principal component transform) [2,3], pendekatan korelasi secara visual [4] dan pendekatan joint pair [5]. Pada aplikasi penginderaan jauh, seleksi fitur sering dilakukan dengan pendekatan band selection dan principal component transform (PCT), terutama untuk data citra optik [3,6]. Pada kesempatan ini digunakan pendekatan pemilihan fitur transformasi komponen utama pada data citra optik dan citra radar untuk mendapatkan subset fitur yang optimal tersebut. Dengan terbatasnya fasilitas ekstraksi dan seleksi fitur pada perangkat lunak pengolahan citra yang ada dan perlunya kajian metode seleksi fitur, maka perlu dilakukan kajian terhadap metode-metode pemilihan fitur yang potensial, dan pada penelitian ini dilakukan kajian metode pemilihan fitur, yaitu metode transformasi komponen utama [7]. Adapun tujuan penelitian ini adalah untuk melakukan kajian terhadap metode pemilihan fitur transformasi komponen utama pada data citra optik maupun data citra radar. Data yang digunakan adalah 1 citra optik Landsat TM (data citra daerah Jawa Tengah) dan 1 citra radar yaitu data citra daerah Sumatera Selatan (Airborne Radar LBand). Evaluasi terhadap metode pemilihan fitur Band Selection, dilakukan berdasarkan parameter akurasi klasifikasi global (seluruh kelas obyek) [1,8-14] dan akurasi klasifikasi per kelas obyek, yang biasanya informasi ini diperlukan dalam analisis obyek tertentu.
2. Metode Penelitian Pelaksanaan penelitian ini dilakukan dengan tahapantahapan sebagai berikut: (1) Menyiapkan data yang digunakan untuk penelitian, yaitu data-data dari citra optik yang digunakan ada 7 fitur, yaitu: band 1 (0,45– 0,52 μm); band 2 (0,52–0,60 μm); band 3 (0,63–0,69
μm); band 4 (0,76–0,90 μm); band 5 (1,55–1,75 μm); band 6 (2,08–2,35 μm) dan band 7(10,40–12,50 μm); Data-data dari citra radar yang digunakan merupakan hasil ekstraksi ciri tekstur dari ciri tonal citra asal, yang sudah diperoleh dari penelitian sebelumnya, yaitu: statistik lokal (mean, minimum, maksimum); matriks co-occurrence (enegi, entropi, kontras, homogenitas, probabilitas maksimum, invers, korelasi dan cluster shade) dan semivariogram (semivariogram 1 sampai dengan semivariogram 8) [15]. (2) Mengimplementasi pemilihan fitur dengan pendekatan Transformasi Komponen Utama pada pemilihan d fitur terbaik; (3) Melakukan evaluasi terhadap hasil-hasil uji coba yang dilakukan, dan parameter yang digunakan dalam evaluasi adalah: tingkat ketelitian akurasi per kelas maupun seluruh kelas serta waktu eksekusi.
3. Hasil dan Pembahasan Data yang digunakan pada penelitian ini terdiri dari 1 citra optik dan 1 citra radar, yaitu: (1) Citra daerah Jawa Tengah (Citra Optik Landsat TM) (Gambar 1). Citra daerah Jawa Tengah adalah citra optik, yang terdiri dari 7 fitur (7 band), yang masing-masing mempunyai resolusi spasial 512x512, mempunyai 256 pola tingkat keabuan dan diklasifikasikan menjadi 3 kelas obyek, yaitu: pemukiman atau kota, hutan atau area pertanian basah dan air; (2) Dari hasil pemilihan fitur dengan metode transformasi komponen utama pada data citra daerah Jawa Tengah [3], diperoleh Tabel 1, 2, dan 3. Tabel 1. Nomor dan Nama Citra Ciri (Fitur) Daerah Jawa Tengah
Nomor fitur Nama fitur (ciri) (ciri) 1 Band 1 2 Band 2 3 Band 3 4 Band 4 5 Band 5 6 Band 6 7 Band 7
Panjang gelombang yang digunakan 0,45μm – 0,52μm 0,52μm – 0,60μm 0,63μm – 0,69μm 0,76μm – 0,90μm 1,55μm – 1,75μm 2,08μm – 2,35μm 10,40μm – 12,50μm
Tabel 2. Nilai Variansi Citra Asli dan Nilai Variansi Citra PCT dari Citra Ciri Daerah Jawa Tengah
Urutan ke-d 1 2 3 4 5 6 7
Citra asli Nomor ciri 5 4 7 3 1 2 6
Variansi 551,9502 240,5890 124,6447 96,9583 93,8974 35,2013 9,4917
Citra PCT Nomor ciri 5 1 4 6 3 7 2
Variansi 939,7126 159,4179 39,1230 5,8917 4,5880 3,1445 0,8603
JURNAL ILMIAH ELITE ELEKTRO, VOL. 2, NO. 1, MARET 2011: 45-49
47
Tabel 3. Subset d Fitur Terbaik, Waktu Eksekusi, Akurasi Klasifikasi Global dan Per Kelas Obyek dari Citra Daerah Jawa Tengah PCT
Waktu eksekusi Subset d fitur (ciri) untuk memperoleh d terbaik d fitur (ciri) terbaik (det) 1 5 9,83 2 5 1 12,69 3 5 14 14,00 4 5 146 15,77 5 5 1463 18,23 6 5 14637 20,82
Akurasi klasifikasi dari subset d fitur (ciri) terbaik 0,8730 0,9094 0,9385 0,9328 0,9291 0,9288
Akurasi klasifikasi per kelas subset d fitur (ciri) terbaik Kelas air Kelas hutan atau Kelas pemukiman area pertanian atau kota 0,9841 0,9650 0,5728 0,9738 0,9270 0,8340 0,9692 0,9402 0,9209 0,9671 0,9311 0,9235 0,9642 0,9244 0,9276 0,9608 0,9207 0,9377
Tabel 5. Nilai Variansi Citra Asli dan Nilai Variansi Citra PCT dari Citra Ciri Daerah Sumatera Selatan
Urutan ke-d
Gambar 1. Citra-citra Fitur (Ciri) Daerah Jawa Tengah
Tabel 4. Nomor dan Nama Citra Ciri (Fitur) Daerah Sumatera Selatan
Nomor fitur (ciri) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Nama fitur (ciri) Energi Entropi Kontras Cluster Shade Korelasi Homogen Probabilitas Maksimum Invers Semivariogram 1 Semivariogram 2 Semivariogram 3 Semivariogram 4 Rata-rata Maksimum Minimum
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Citra asli Nomor Variansi Ciri 6 3574,5019 2 3503,4099 8 3445,7142 14 2538,2561 7 2261,6392 1 1524,7573 10 1470,6919 9 1353,3952 11 1288,1459 12 1032,5698 13 675,6551 5 627,1199 4 576,2804 3 347,4280 15 254,7358
Citra PCT Nomor Variansi Ciri 6 10737,4888 2 8783,1015 9 2622,7831 12 664,9575 5 556,5259 14 391,1024 13 155,0294 11 147,4509 10 131,6947 4 112,8431 8 66,2298 15 50,1286 3 38,9339 1 14,5291 7 1,5017
(2) Citra daerah Sumatera Selatan (Airborne Radar LBand) (Gambar 2). Citra daerah Sumatera Selatan adalah citra radar, yang terdiri dari 15 fitur, yang diturunkan dari citra radar 1 Band dengan menggunakan 3 model dari metode transformasi, yaitu model Matriks Co-occurrence, semivariogram dan statistik lokal [1617]. Masing-masing fitur mempunyai resolusi spasial sebesar 350x350, mempunyai 256 pola tingkat keabuan dan diklasifikasikan menjadi 3 kelas obyek, yaitu: daerah terbuka, hutan, dan air. Dari hasil pemilihan fitur dengan metode transformasi komponen utama pada data citra daerah Sumatera Selatan, diperoleh Tabel 4, Tabel 5, dan Tabel 6.
JURNAL ILMIAH ELITE ELEKTRO, VOL. 2, NO. 1, MARET 2011: 45-49
48
Tabel 6.
Subset d Fitur (Ciri) Terbaik, Waktu Eksekusi, Akurasi Klasifikasi Global dan Per Kelas Obyek dari Citra Daerah Sumatera Selatan PCT
d
Subset d fitur (ciri) terbaik
1 2 3 4 5 6 7 8 9 10 11 12 13 14
6 62 629 6 2 9 12 6 2 9 12 5 6 2 9 12 5 14 6 2 9 12 5 14 13 6 2 9 12 5 14 13 11 6 2 9 12 5 14 13 11 10 6 2 9 12 5 14 13 11 10 4 6 2 9 12 5 14 13 11 10 4 8 6 2 9 12 5 14 13 11 10 4 8 15 6 2 9 12 5 14 13 11 10 4 8 15 3 6 2 9 12 5 14 13 11 10 4 8 15 3 1
Waktu eksekusi untuk memperoleh d fitur (ciri) terbaik (det.) 17,14 19,67 20,32 21,26 22,41 23,73 25,21 26,91 28,84 30,76 33,01 35,42 38,23 40,92
Akurasi klasifikasi dari subset d fitur (ciri) terbaik 0,6669 0,7683 0,8450 0,8785 0,8800 0,8894 0,8921 0,8900 0,8980 0,8996 0,8998 0,9033 0,9050 0,9050
Akurasi klasifikasi per kelas subset d fitur (ciri) terbaik Kelas air Kelas Kelas daerah hutan terbuka 0,0000 0,8139 0,7998 0,8322 0,7538 0,7559 0,9170 0,8484 0,8140 0,9085 0,8475 0,8936 0,8870 0,8476 0,9054 0,8812 0,8583 0,9197 0,8748 0,8547 0,9312 0,8745 0,8427 0,9370 0,8824 0,8474 0,9480 0,8931 0,8419 0,9520 0,8998 0,8374 0,9538 0,9033 0,8433 0,9552 0,9053 0,8453 0,9548 0,9075 0,8429 0,9572
Gambar 2. Citra-citra Fitur (Ciri) Daerah Sumatera Selatan
4. Simpulan Berdasarkan hasil eksperimen dan analisis yang dilakukan pada penelitian ini, maka dapat ditarik beberapa simpulan sebagai berikut: 1) Subset ciri terbaik yang diperoleh dari data citra daerah Jawa Tengah adalah subset 3 ciri terbaik, dengan akurasi klasifikasi 93,85%; 2) Subset ciri terbaik yang diperoleh
dari data citra daerah Sumatera Selatan adalah subset 13 ciri terbaik, dengan akurasi klasifikasi 90,50%; 3) Akurasi klasifikasi global dari subset 2, 3, 4, 5 maupun 6 ciri terbaik pada data citra daerah Jawa Tengah, lebih tinggi dibandingkan pada data citra daerah Sumatera Selatan; 4) Akurasi klasifikasi per kelas obyek dari data citra daerah Jawa Tengah, pada umumnya lebih dari 90%; 5) Waktu eksekusi yang diperlukan untuk
JURNAL ILMIAH ELITE ELEKTRO, VOL. 2, NO. 1, MARET 2011: 45-49
mendapatkan subset 2, 3, 4, 5, maupun 6 ciri terbaik dari data citra daerah Jawa Tengah lebih cepat dibandingkan dengan waktu eksekusi yang diperlukan pada data citra daerah Sumatera Selatan.
Daftar Acuan [1] A. Jain, D. Zongker, IEEE Trans. Pattern Anal. Machine Intell. 19/2 (1997) 153. [2] A. Jennings, Matrix Computations for Engineers and Scientists, John Wiley & Sons, Inc., New York, 1977, p.330. [3] T.M. Lillesand, R.W. Kiefer, Remote Sensing and Image Interpretation, John Wiley & Sons, Inc., New York, 1994, p.763. [4] A. Murni, Feature Selection Method in Radar Image Classification: A Case Study, Data Management and Modelling Using Remote Sensing and GIS for Tropical Forest Land Inventory, Rodeo International Publishers, Jakarta, 1999, p.231. [5] M. Pietikainen, T. Ojala, Z. Xu, Pattern Recognit. 33 (2000) 43. [6] C.I. Chang, Q. Du, T.L. Sun, M.L.G. Althouse, IEEE Trans. Geosci. Remote Sensing 37/6 (1999) 2631. [7] A. Murni, S. Setiawan, Pengantar Pengolahan Citra, ed.1, Elex Media Computindo, Jakarta, 1992, p.171.
49
[8] P. Pudil, J. Novovicova, J. Kittler, Pattern Recognit. Lett. 15 (1994) 1119. [9] F.J. Ferri, P. Pudil, M. Hatef, J. Kittler, In: E.S. Gelsema, L.N. Kanal (Ed.), Pattern Recognition in Practice IV, Elsevier Science B.V., Amsterdam, 1994, p.403. [10] R.C. Gonzales, R.E. Woods, Digital Image Processing, Addison-Wesley Publishing Company, Inc., Reading, Massachusetts, 1993, p.156. [11] M. Kudo, J. Sklansky, Pattern Recognit. 33 (2000) 25. [12] R. Huber, L.V. Dutra, Proceedings World Multiconference Systemics, Cybernetics and Informatics., vol. V, Image, Acoustic, Speech and Signal Processing: Part I, Orlando, Florida, USA, 2000, p.370. [13] Mulyono, Tesis Program Pascasarjana, Universitas Indonesia, Indonesia, 2000. [14] A. Murni, Disertasi Program Pascasarjana Universitas Indonesia, 1997. [15] D. Chahyati, Skripsi Sarjana, Fakultas Ilmu Komputer, Universitas Indonesia, Indonesia 2000. [16] J.R. Carr, F.P. Miranda, IEEE Trans. Geosci. Remote Sensing 36/6 (1988) 1945. [17] I.T. Jolliffe, Principal Component Analysis, Springer-Verlag, New York Inc., 1986, p.271.