Pemilihan Fitur Citra Hiperspektral Hymap Dan Model Prediksi Panen Padi Menggunakan Algoritma Genetika Dan Regresi Komponen Utama (Feature selection of Hyperspectral remote sensing and prediction model with genetic algorithm and principal component regression) 1
2
3
Sidik Mulyono , Erna Piantari , Mohamad Ivan Fanany , Tjan Basaruddin
3
1
Badan Pengkajian dan Penerapan Teknologi Mahasiswa S1 Departemen Ilmu Komputer Institut Pertanian Bogor 3 Fakultas Ilmu Komputer, Universitas Indonesia
2
Abstrak Citra hiperspektral Hymap yang terdiri dari jumlah band yang sangat banyak, memerlukan metode analisa yang canggih untuk menganalisanya. Salah satu pendekatannya adalah mengurangi computational cost, dengan mengeliminasi band yang tidak memberikan nilai tambah terhadap analisa maupun model prediksi yang akan dilakukan, yaitu dengan menggunakan algoritma genetika yang dipadukan dengan regresi komponen utama. Nilai fitness yang digunakan untuk menentukan jumlah band yang paling optimal adalah nilai error terkecil berdasarkan kaidah norm dari model prediksi yang dibangun. Model prediksi yang terbangun ini dapat diaplikasikan ke dalam citra hiperspektral Hymapuntuk mengetahui sebaran produksifitas padi di suatu wilayah. Kata kunci: Citra hiperspektral, algoritma genetika, regresi komponen utama, produktifitas padi Abstract Hymap Hyperspectral image consists of large number of bands which require sophisticated method to analyze. One approach to reduce computational cost and accelerate knowledge discovery, is to eliminate bands that do not add value to the analysis and prediction models that will be applied, by using genetic algorithms combined with principal component regression (GA-PCR). Fitness value that is used to determine the optimal number of band is defined as the smallest error based on norm principle which analysed from PCR. Prediction model developed in this study is then applied to the hyperspectral image to know the spatial distribution of paddy yield. Index terms: Hymap hyperspectral image, genetic algorithms, principal component regression, paddy yield
1. Latar Belakang Teknologi penginderaan jauh (inderaja) hiperspektral yang merupakan pengembangan teknologi inderaja terkini memiliki beberapa keunggulan yang sangat nyata dibanding teknologi inderaja multispektral sebelumnya. Dengan memiliki jumlah band yang berjumlah hingga ratusan kanal, membuat teknologi ini sangat memungkinkan untuk dikaji secara lebih rinci dalam memantau vegetasi pada umumnya, maupun yang lebih khusus seperti untuk memantau pertumbuhan dan perkembangan kondisi tanaman padi. Teknologi inderaja memiliki potensi untuk memberikan informasi tentang tanaman pertanian secara kuantitatif dan cepat, tanpa merusak tanaman itu sendiri di daerah cakupan yang sangat luas. Selain itu juga karena inderaja dapat memberikan informasi tentang status sebenarnya dari tanaman pertanian, maka integrasi antara data inderaja dan model simulasi pertumbuhan tanaman merupakan tren penting untuk estimasi hasil dan prediksi, (Huang Jing-feng et al., 2002). Akan tetapi, di balik dari keunggulan inderaja hiperspektral yang memiliki hingga ratusan band ini, terdapat beberapa kelemahan. Biaya yang cukup mahal untuk melakukan pengambilan data di lapangan, sehingga data yang terkumpul dan akan digunakan untuk analisis sangat terbatas sekali. Selain itu juga kemungkinan terdapat hubungan multikolinear antar band yang saling berdekatan, yang dapat menimbulkan kutukan dimensi (curse of dimension), sehingga hasil analisis akan mengalami overfitting (Gustavo Camps-Valls et al, 2005). Untuk menghindari hal tersebut maka diperlukan pengembangan metode baru untuk menganalisisnya.
1
Dalam makalah ini akan dibahas metode algoritma genetika yang dipadukan dengan regresi komponen utama (GA-PCR). Algoritma genetika akan membentuk konfigurasi band hiperspektral Hymap dari mulai pembentukan konfigurasi penuh seluruh band (berjumlah 116 band), dan melalui proses cross-over dan mutasi, akan dibentuk generasi baru yang jumlah bandnya semakin berkurang, tetapi keakurasiannya meningkat hingga mencapai titik konvergen. Setiap konfigurasi band yang terbentuk, akan dilakukan regresi menggunakan PCR terhadap 3 parameter agronomi, yaitu terhadap indeks luas daun (LAI), nilai kehijauan (yang direpresentasikan dalam bentuk nilai SPAD), serta produktifitas padi (yield). Penentuan kecocokan (fitness) dalam proses genetika ini dilakukan berdasarkan nilai terkecil dari error berdasarkan kaidah norm yang dianalisis menggunakan PCR, lalu dikalibrasi dan diuji menggunakan 8 kali putaran sampling (8-fold train-test sampling). Proses genetika akan berhenti dengan sendirinya bila nilai fitness sudah mencapai nilai jenuh (convergence), dan konfigurasi band yang terbentuk menunjukan band optimal yang akan digunakan untuk membangun model prediksi tanaman padi.
2. Bahan dan Metoda (Teknik Analisis) 2.1 Area studi dan sampling Studi dilakukan di 2 lokasi sentra produksi padi yaitu Kabupaten Subang (Koordinat : 107” 31’ - 107” 54’ Bujur timur dan 6” 1’ - 6” 49’ Lintang selatan) dan Kabupaten Indramayu (Koordinat : 107"51'- 108"36' Bujur Timur dan 6"15' - 6"40' Lintang Selatan), propinsi Jawa Barat. Kedua kabupaten ini memiliki kontribusi lebih dari 2% dari seluruh produksi padi nasional dengan kemampuan panen rerata sekitar 5.5 sampai dengan 6.0 ton/ha.
Gambar 1. Lokasi studi pengamatan spectral (Field campaign dan Airborne campaign)
2.2 Pengambilan data Pengamatan data hiperspektral dilakukan selama kegiatan airborne campaign tanggal 26 - 28 Juni 2008, menggunakan sensor Hymap yang dipasang di bawah lambung pesawat CESSNA 404 yang terbang dengan ketinggian 2.000 meter di atas permukaan laut, dan melintas di atas wilayah Subang dan Indramayu sebanyak 15 lintasan. Objek pengukuran di kedua area studi, yaitu Kabupaten Subang dan Indramayu, yang masing-masing tersebar di 10 segmen pengukuran, dan setiap segmen terdiri dari 10 petakan . Pengamatan parameter agronomi (LAI dan SPAD) dilakukan di setiap petakan tersebut, dan masing-masing petakan sudah
2
diukur posisinya menggunakan D-GPS. Data GPS ini akan digunakan untuk menentukan posisi petakan yang ada di dalam citra hiperspektral Hymap, dan menjadi acuan untuk mengekstrak data hiperspektral setiap petakan. Sedangkan untuk pengamatan ubinan (yield) dilakukan setelah pengukuran lapangan, yaitu menunggu waktu panen seluruh petakan yang menjadi objek pengamatan. Data LAI, SPAD, dan yield disusun sedemikian rupa berdasarkan petakan, sehingga mudah untuk dipasangkan dengan nilai reflektan di setiap petakan pada citra HyMap, dan memiliki nilai statistik seperti yang ditunjukkan pada tabel 1. Tabel 1. Nilai statistik dari hasil pengamatan LAI, SPAD, dan yield Parameter yang diamati LAI (-) SPAD (-) Yield (ton/h)
Jumlah data 109 110 73
Nilai Minimum 0.146 28.3 2.27
Nilai rerata 2.450 37.87 6.452
Nilai Maksimum 5.432 44.3 9.87
Deviasi standar 1.359 3.52 1.835
Jangkauan 5.286 16.0 7.60
2.3 Pemrosesan data Pertama-tama dilakukan ekstraksi nilai spektral dari 126 band citra hiperspektral Hymap (yang sudah dilakukan koreksi radiometrik, koreksi atmosferik, serta koreksi geometrik) untuk setiap petakan, dengan menggunakan acuan data GPS setiap petakan. Dari hasil ekstrasi tersebut diperoleh data spektral hanya untuk 76 petakan saja. Jumlah ini sebetulnya sangat sedikit dibanding dengan rencana pengamatan di lapangan saat field campaign berlangsung, sehingga diperlukan suatu teknik analisis yang handal untuk dapat membangun model prediksi yang akurat. Data spektral yang sudah diekstrak tersebut kemudian diperiksa profil spektralnya yang mengalami derau akibat ketidakmampuan sensor mendeteksi cahaya pada panjang gelombang tertentu, karena telah diserap oleh uap air di udara (water absorption). Dari hasil pengamatan diketahui bahwa band yang mengalami derau ada sebanyak 10 band, dan band-band tersebut dieliminasi dari data set aslinya sehingga jumlah band yang tetap digunakan sebanyak 116 band. Selanjutnya data spektral seluruh petakan yang sudah tereliminasi tersebut digabungkan ke dalam bentuk matriks, dimana jumlah kolom menunjukkan jumlah band hiperspektral dan jumlah baris menunjukkan jumlah petakan atau sampel spektral. Agar memudahkan dalam melakukan korelasi terhadap parameter agronomi dan Yield, maka setiap baris matriks tersebut diberi kode nama petakan. Dan untuk menghindari pengaruh ill condition dalam analisis, maka seluruh nilai spektral tersebut dinormalisasi dengan satuan 10.000.
(a)
(b)
Gambar 2. Profil spektral hiperspektral Hymap (a) sebelum dan (b) sesudah eliminasi band
2.4
Kombinasi GA-PCR untuk menentukan jumlah band hiperspektral yang optimal Algoritma genetika sangat dikenal kemampuannya secara efisien dapat mencari solusi terbaik dalam suatu ruang yang luas, dan relatif tidak terlalu sensitif terhadap pengaruh derau ( Haleh Vafaie et al),
3
sehingga cocok diaplikasikan untuk pemilihan fitur dasar yang lebih handal dalam rangka meningkatkan kualitas analisis dan kualitas model prediksi. Algoritma Genetika adalah algoritma yang dikembangkan dari proses pencarian solusi menggunakan pencarian acak, ini terlihat pada proses pembangkitan populasi awal yang menyatakan sekumpulan solusi yang dipilih secara acak. Selanjutnya pencarian dilakukan berdasarkan proses-proses teori genetika yang memperhatikan pemikiran bagaimana memperoleh individu yang lebih baik, sehingga dalam proses evolusi dapat diharapkan diperoleh individu yang terbaik (Achmad Basuki, 2003). Dalam penelitian ini algoritma genetika diaplikasikan ke dalam data hiperspektral untuk mencari jumlah band yang optimal yang dapat digunakan untuk membangun model prediksi. Yang dimaksud dengan jumlah band optimal adalah jumlah band yang relatif lebih sedikit dari data set aslinya, tetapi dapat meningkatkan keakuratan model yang akan dibangun serta dapat mengurangi beban komputasi (computational cost). Populasi awal yang dibentuk adalah sebanyak 20 individu dengan 116 gen biner, yaitu sesuai dengan jumlah band hiperspektral yang telah dieliminasi. Untuk generasi pertama, seluruh individu dibuat memiliki nilai biner 1, sebagai acuan solusi untuk seluruh band yang tersedia. Kemudian untuk generasi berikutnya akan dikombinasikan dengan pembangkitan acak, seleksi, perkawinan silang (cross-over) dan mutasi gen. Seleksi dilakukan berdasarkan nilai fitness setiap individu, dimana setiap individu memiliki nilai fitness sesuai dengan gen yang terbentuk secara acak, yang merupakan penentu dari solusi yang paling optimal. Nilai fitness ini diperoleh dari proses korelasi antara gen (yang merupakan representasi dari jumlah band) yang terbentuk secara acak dalam proses seleksi dan dikorelasikan dengan suatu variable terikat. Untuk mendapatkan korelasi tersebut sebagai acuan fitness, adalah dengan mengaplikasikan regresi komponen utama (principal component regression) ke dalam algoritma genetika. Analisa komponen utama merupakan salah satu solusi untuk menghindari masalah multi kolinearitas. Pada dasarnya analisa ini adalah bertujuan untuk menyederhanakan variabel yang diamati dengan cara menyusutkan (mereduksi) dimensinya. Hal ini dilakukan dengan cara menghilangkan korelasi diantara variabel bebas melalui transformasi variabel-variabel bebas asal ke variabel baru yang tidak berkorelasi sama sekali atau yang biasa disebut dengan komponen utama ( principal component). Setelah beberapa komponen utama yang bebas multikolinearitas diperoleh, maka komponenkomponen tersebut menjadi variabel bebas baru yang akan diregresikan atau dianalisa pengaruhnya terhadap variabel tak bebas dengan menggunakan analisis regresi. Salah satu cara untuk mendapatkan komponen utama adalah dengan metode Singular Value Decomposition (SVD), yaitu dengan memfaktorkan matrik yang terbentuk dari gen pada proses algoritma genetika, ke dalam 2 matrik orthogonal dan 1 matrik diagonal. Setelah komponen utama terbentuk, kemudian diregresikan menggunakan metode kuadrat terkecil (least square method). Dan model prediksi yang terbentuk dari hasil regresi komponen utama ( Bent Jørgensen et al, 2007) ditunjukan pada persamaan (1). (1)
Dari hasil analisa regresi ini kemudian dihitung besar simpangan (error) terhadap nilai aslinya, dengan menggunakan kaidah norm-p (T. Basaruddin, 2007) , ditunjukan oleh persamaan (2).
(2)
4
Dimana merupakan anggota dari [1,2,∞], adalah jumlah sampel, dan masing-masing adalah nilai variabel terikat hasil pengukuran dan hasil prediksi. Norm-2 lebih dikenal sebagai euclidean norm atau setara dengan nilai root mean square error (RMSE), sedangkan norm-1 merupakan akumulasi jumlah error keseluruhan, dan norm-∞ merupakan nilai error maksimum yang ada diantara seluruh sampel yang ada. Bila jumlah generasi yang dibangkitkan melalui algoritma genetika ini dinotasikan sebagai , maka nilai fitness dari setiap tahapan seleksi dihitung menggunakan persamaan (3). (3) 2
Sedangkan koefisien determinasi (R ) yang menunjukan nilai kedekatan suatu model prediksi terhadap variable terikat dihitung setelah proses fitness sudah mencapai kondisi konvergen pada suatu titik, yang dihitung menggunakan persamaan statistik berikut ini. (4) Dimana,
Karena jumlah sampel yang sangat terbatas, maka untuk meningkatkan akurasi dalam proses kalibrasi regresi (model prediksi), sampel yang tersedia dibagi ke dalam 8 bagian secara acak, yaitu 1 bagian merupakan data pengujian (test set), sedangkan sisanya merupakan data pelatihan (train set). Proses kalibrasi dilakukan secara iterasi sebanyak 8 kali pelatihan dan pengujian. Dari hasil pengujian diperoleh 8 alternatif hasil dan model yang terbaik dipilih berdasarkan nilai norm yang paling minimum, hal ini mirip seperti metode penentuan nilai fitness pada persamaan (3).
Popu lasi baru
Populasi awal
Elitism e Seleksi individu
PC
Evaluasi fitness
No
Reproduksi: Cross-Over dan mutasi
Yes Band optimal dan model terbaik
Gambar 3. Siklus GA-PCR untuk pemilihan band optimal dan pembangunan model prediksi
5
3. Hasil dan Pembahasan Kode program untuk algoritma genetika ini diadopsi dari IDL genetic algorithms Allard De Wit yang bebas diunduh dan digunakan tanpa harus menggunakan lisensi hak cipta. Dengan sedikit modifikasi kode program IDL yang dipadukan dengan kode program PCR, program ini dijalankan dengan membangkitkan 100 generasi, menggunakan data hiperspektral HyMap dan parameter agronomi serta yield sebagai data input. Gambar 4, 5, dan 6 masing-masing menunjukkan perubahan nilai fitness, jumlah band optimal, serta nilai 2 koefisien determinasi R selama proses generasi berlangsung yang dikorelasikan terhadap variabel terikat LAI, SPAD, dan Yield. Secara umum dapat diketahui bahwa fitness yang menggunakan norm-∞ lebih cepat mencapai kondisi konvergen, karena penggunaan computational cost untuk norm-∞ adalah yang paling sederhana dibanding dengan norm lainnya. Tetapi dilihat dari sisi capaian jumlah band dan koefisien determinasi yang dihasilkan norm-∞ tidak seoptimal norm lainnya, sehingga dalam hal ini norm∞ tidak digunakan untuk penentuan band optimal, dan cenderung menggunakan norm-1 atau norm-2. Untuk prediksi LAI dan SPAD, fitness yang paling tepat digunakan adalah error dengan kaidah norm-2 2 yang capaian jumlah band paling sedikit (52 band dan 62 band) dan capaian R paling tinggi (0.9998 dan 0.9972). Sedangkan untuk model prediksi Yield, fitness yang paling tepat digunakan adalah norm-1 2 dengan capaian jumlah band adalah 39 dan R mencapai 0.9996. Dengan memilih jumlah band paling sedikit, diharapkan dapat mengurangi beban komputasi pada saat model ini diaplikasikan ke dalam citra yang sesungguhnya dan tanpa mengurangi tingkat keakurasiannya. Pada tabel 3a – 3c ditunjukkan konfigurasi band optimal dalam bentuk biner, dimana nilai 1 menunjukkan band yang aktif, dan nilai 0 menunjukkan band yang tidak diperlukan. Dari bentuk biner kemudian konfigurasi band optimal ini ditampilkan dalam bentuk pita hijau di atas profil hiperspektral,yang masingmasing digunakan untuk memprediksi LAI, SPAD, dan Yield, seperti yang ditunjukan pada gambar 7. Dari gambar tersebut diketahui bahwa konfigurasi band optimal untuk LAI dan SPAD memiliki konfigurasi yang unik, yaitu terdapat daerah blank spot (band kosong) yang hampir sama minimal di 2 lokasi, masing-masing adalah 1280 ~ 1488 nm, dan 1736 ~ 1784 nm. Sedangkan untuk Yield terlihat terdapat blank spot yang lebih luas lagi di sekitar 1543 ~ 2045 nm. Hal ini menunjukan bahwa untuk keperluan prediksi, daerah-daerah blank spot tersebut tidak diperlukan sama sekali sehingga dapat dieliminasi dan dapat meningkatkan kecepatan komputasi serta meningkatkan akurasi. Dari gambar ini juga dapat diketahui bahwa pemilihan fitur hiperspektral menggunakan GA-PCR secara relatif dapat juga menghilangkan pengaruh derau (water absorption) di sekitar 1280 ~ 1488 nm dan 1736 ~ 1784 nm, tetapi tidak mampu mengeliminasi derau yang terjadi di atas 2000 nm, karena kemampuan algoritma genetika yang tidak sensitive terhadap derau kecil. Selain menghasilkan konfigurasi band optimal, metode GA-PCR ini juga sekaligus dapat menghasilkan model prediksi dengan akurasi tinggi (error terendah). Tabel 4, 5, dan 6 menunjukkan nilai koefisien untuk parameter dan yang diperlukan dalam model prediksi menggunakan PCR, yaitu dengan cara memasukkan seluruh parameter tersebut ke dalam persamaan (1) yang dibangun ke dalam program IDL (Interactive Data Language), kemudian diintegrasikan dengan data hiperspektral Hymap berdasarkan konfigurasi band optimal pada tabel 3.
6
(LAI)
(SPAD)
(Yield)
Gambar 4. Nilai fitness terhadap perubahan generasi
(LAI)
(LAI)
(SPAD)
Gambar 5. Jumlah band optimal terhadap perubahan generasi
(Yield)
(SPAD) (Yield) Gambar 6. Koefisien determinasi terhadap perubahan generasi
Tabel 2. Kumulasi hasil pemilihan fitur (band) menggunakan GA-PCR Parameter agronomi LAI SPAD Yield
Norm-1 2 n band R 64 0.9999 62 0.9910 39 0.9996
Norm-2 2 n band R 62 0.9998 52 0.9972 54 0.9999
Norm-∞ 2 n band R 87 0.9997 82 0.9896 72 0.9998
Tabel 3a. Konfigurasi biner band optimal (459 ~ 1094 nm) LAI SPAD Yield
011010001100101101011011000111011001110100100 010000001010100101100010110100111110001101101 110101000001101000010100011010101101011000101
LAI SPAD Yield
111110000110001101010110000110001101101000101 110111000101000000011000001000010010100011110 000101100000001011010100000000000000000000000
LAI SPAD Yield
10101011100001111101101111 01101111001010100111001100 00110000010010110100001111
Tabel 3b. Konfigurasi biner band optimal (1109 ~ 2006 nm)
Tabel 3c. Konfigurasi biner band optimal (2026~ 2460 nm)
7
Tabel 4. Koefisien regresi PCR untuk memprediksi LAI Parameter
Koefisien 2.428555 0.056786 0.054742 0.059445 0.068623 0.064601 0.094055 0.203223 0.251788 0.289071 0.293180 0.295308 0.296028 0.264942 0.256644 0.256263 0.285634 0.260263 0.235519 0.221218 0.213531 0.080416 0.080627 0.089579 0.094927 0.115356 0.113776 0.110800 0.103576 0.027987 0.030984 0.054549 0.056408 0.057823 0.051655 0.047752 0.030402 0.028020 0.022009 0.017810 0.012857 -16.892390 -126.484863 114.771357 -124.694599 203.909398 -177.103891 149.206672 -143.411203 75.028737 -82.564502 63.768082 -29.914844 -88.077096 190.245826 107.056803 10.096588 -26.732899 33.234603 25.666785 86.762491 23.484548 55.210051 -10.284295 33.985064 -68.417900 201.255789 84.921864 -112.711190 -42.371022 -30.633941 -51.349776 -72.879617 16.906614 -150.872588 102.850438 -57.686070 98.653533 -1.815510 67.687109 -45.035643
0.058989 0.053156 0.052319 0.293351 0.292984 0.292886 0.269040 0.287912 0.289665 0.214696 0.204714 0.196664 0.117495 0.119908 0.118358 0.034999 0.042177 0.049438 0.043951 0.040378 0.036728 0.008799 122.919414 -318.774749 244.826381 -193.757924 255.519356 -49.024648 -231.683689 79.140493 9.476402 -168.822942 -41.422961 40.619380 -138.971852 -27.317412 0.053165 124.328039 133.554523 -140.447335 -55.852687 51.330448 73.026416 9.202556
Tabel 5. Koefisien regresi PCR untuk memprediksi SPAD Parameter
Koefisien 37.749996 0.057146 0.295002 0.261020 0.220884 0.115918 0.049111 0.033248 388.418228 522.548986 -928.612533 -682.564494 671.844826 -83.127371 -692.192917 -310.268263
0.068904 0.062817 0.059323 0.052578 0.094434 0.141725 0.295906 0.292415 0.293466 0.294572 0.295277 0.290965 0.268419 0.282926 0.287181 0.288218 0.289158 0.285270 0.215247 0.213293 0.214558 0.080275 0.084179 0.112169 0.110548 0.097990 0.097269 0.027786 0.027942 0.037574 0.051992 0.054269 0.056087 0.059079 0.055144 0.047536 0.030149 0.021773 0.017727 -495.939145 -1016.715647 183.452978 1013.702405 -712.678291 -1304.549693 969.119853 -622.764520 1113.728824 -608.559438 243.789893 290.376472 974.521030 -1366.957283 285.471966 -280.166293 -381.628049 -928.385622 -617.609881 2667.819969 -45.714218 110.373108 -852.870351 -983.021433 964.197080 -399.706674 -305.846498 -495.813787 1325.498711 1769.742110 -985.784091 730.977199 -2334.821629 1067.920814 1060.261927 146.439134 -681.072187
0.288234 0.278318 0.234933 0.120527 0.041866 0.036534 671.011847 487.286865 1336.329101 -1207.056213 1228.341638 -2310.988441 1492.997230
Tabel 6. Koefisien regresi PCR untuk memprediksi Yield Parameter
Koefisien 7.318333 0.063726 0.061328 0.059564 0.071924 0.067070 0.065782 0.060419 0.198180 0.262338 0.279387 0.278320 0.277606 0.279869 0.280813 0.276979 0.254628 0.248250 0.252849 0.277403 0.278643 0.231379 0.213105 0.210209 0.204173 0.188494 0.085639 0.086684 0.095746 0.047704 0.051244 0.064653 0.060363 0.052516 0.048524 0.040644 0.025539 0.020453 0.015548 0.010038 56.718968 -351.078399 105.251543 334.050371 171.061567 -66.947325 -149.490609 -55.658692 155.693924 -127.261121 -322.583939 132.444210 91.093673 318.274303 -155.706285 157.810564 -385.978238 245.152213 67.528484 -143.022733 81.613578 -309.889002 72.210903 176.555850 -45.406633 59.240308 118.639477 66.959452 -152.441783 -324.251766 -89.436813 253.021068 -311.318350 -112.099952 465.860311 153.118206 71.019370 25.094487 -130.463604
8
Blank spot
(a)
Blank spot
LAI
Blank spot
Blank spot
(b) SPAD
Blank spot
(c)
Significant Blank spot
Yield
Gambar 7. Konfigurasi band optimal
9
4. Kesimpulan Pada penelitian ini telah dilakukan pemilihan fitur (band) hiperspektral Hymap dengan metode kombinasi GA-PCR. Nilai fitness yang digunakan adalah mengacu pada nilai error terkecil dari 3 kaidah norm. Karena nilai fitness diorientasikan untuk mencari nilai error yang terkecil, maka model prediksi yang dihasilkan GA-PCR ini memiliki tingkat keakurasian yang cukup tinggi. Ini terbukti dari koefisien determinasi yang dihasilkan hampir mendekati nilai 1. Selain itu, GA-PCR juga menghasilkan konfigurasi band optimal yang jauh lebih sedikit dari jumlah band aslinya, sehingga akan dapat meningkatkan kecepatan komputasi pada saat melakukan prediksi terhadap citra hiperspektral Hymap. Secara relatif, GA-PCR juga dapat menghilangkan band-band yang berpengaruh derau yang diakibatkan oleh resapan spectrum cahaya oleh uap air di udara, sehingga diharapkan dapat membantu tahapan pra proses pengolahan citra hiperspektral. Model prediksi yang dibangun dalam penelitian ini dikalibrasi dengan data hiperspektral tanaman padi, sehingga hanya efektif digunakan untuk objek tanaman padi saja. Agar model prediksi ini dapat digunakan secara optimal, maka harus diintegrasikan dengan metode klasifikasi citra yang khusus untuk objek tanaman padi. Teknologi hiperspektral telah membuka wawasan dan paradigma berpikir baru bagi para peneliti di bidang inderaja, serta memberikan peluang yang sangat luas untuk mengaplikasikan teknologi ini untuk berbagai keperluan yang lebih mendukung kebutuhan hidup dan kesejahterraan manusia.
5. Referensi. Achmad Basuki, “ALGORITMA GENETIKA, Suatu Alternatif Penyelesaian Permasalahan Searching, Optimasi dan Machine Learning”, Politeknik Elektronika Negeri Surabaya, PENS –ITS, Surabaya 2003 Allard de Wit, “IDL Genetic Algorithms”, available at http://ajwwag.home.xs4all.nl/, 21 March 2011 Bent Jørgensen and Yuri Goegebeur, “Multivariate Data Analysis and Chemometrics: Modul 6: Principal Components Regression”, http://statmaster.sdu.dk/courses/ST02, 2007 Gustavo Camps-Valls, and Lorenzo Bruzzone, “Kernel Based Method for Hyperspectral Image Classification”, IEEE Transactions on Geoscience and Remote Sensing, Vol. 43, no. 6, June 2005 Haleh Vafaie and Kenneth De Jong, “Genetic Algorithms as a Tool for Feature Selection in Machine Learning”, Center for Artificial Intelligence, George Mason University Huang Jingfeng, Tang Shuchuan, Ousama Abou-Ismail, Wang Renchao, “Rice yield estimation using remote sensing and simulation model”, JOURNAL OF ZHEJIANG UNIVERSITY SCIENCE, 2002, 3 (4): 461-466 T. Basaruddin, “Komputasi Numerik”, Fakultas Ilmu Komputer UI, 2007
10