Field_Spect 10 Field_Spect 50 2. Cross validation 5 fold dengan pemisahan data Indramayu dan Subang, menggunakan data berikut: Field_Spect 10 Field_Spect 50 3. Supplied test set : training: Field_Spect 10, testing: Hymap training: Field_Spect 50, testing: Hymap 4. Percentage split dengan data training 70% dan data testing 30% menggunakan data Hymap. Prosedur kedua hanya dilakukan untuk memprediksi yield sedangkan prosedur pertama, ketiga dan keempat dilakukan untuk memprediksi LAI, SPAD, dan yield.
Tabel 2 Jumlah data prosedur uji Data
Field_Spect 10
Field_Spect 50
Hymap
Crop Variable
Jumlah data
LAI
104
SPAD
105
yield
64
LAI
104
SPAD
105
yield
64
LAI
62
SPAD
63
yield
34
Praproses Tahap praproses dilakukan pada Data 0.0, Data Hymap, dan Data Crop Variable. Setelah melalui tahapan praproses, data tersebut dibagi sesuai dengan prosedur uji. Jumlah data yang diperoleh untuk setiap prosedur uji dapat dilihat pada Tabel 2. Lebih lanjut hasil dari praproses dapat dilihat pada Hasil dan Pembahasan.
Field_Spect 10 Indramayu
40
Field_Spect 10 Subang
24 yield
Field_Spect 50 Indramayu
40
Field_Spect 50 Subang
24
Evaluasi dan Analisis Hasil Hasil pengujian dievaluasi dengan membandingkan nilai R2. Nilai R2 merupakan hasil kuadrat dari nilai coefficient correlation (CC). Setelah semua hasil pengujian diperoleh, hasil pengujian tersebut dianalisis. Lingkungan Pengembangan Perangkat lunak yang digunakan untuk penelitian yaitu: 1. Windows Vista Home Premium sebagai sistem operasi, 2. Interactive Data Language (IDL) untuk praproses data, 3. Weka 3.6 sebagai pengujian data, 4. Notepad++ dan Microsoft Excel sebagai editor program. Perangkat keras yang digunakan untuk penelitian yaitu : 1. Processor Intel Dual-Core 1.60 GHz, 2. RAM 2 GB, 3. Hard disk kapasitas 70GB.
Pengujian Data Data diuji dengan mengikuti prosedur yang telah dibuat dengan menggunakan perangkat lunak Weka dengan algoritme PLSR. Pengujian dilakukan berulang dengan mengubah parameter jumlah latent.
HASIL DAN PEMBAHASAN Praproses Data Tahap-tahap praproses dilakukan pada Data 0.0 dan data Hymap dengan menggunakan IDL. Praproses untuk Data 0.0 dilakukan menjadi tiga level data dan pada setiap level menghasilkan data baru yaitu Data 0.1, Data 0.2, dan Data 1.0. Alur tahapan praproses dapat dilihat pada Gambar 6 dan penjelasan untuk tahapan praproses tiap data dapat dilihat pada Tabel 3. Contoh file reflectance Data 0.0 dapat dilihat pada Lampiran 1. Setiap file pada Data 0.0 terdiri atas 6 sampai 16 kolom. Baris pertama merupakan header yang menunjukkan banyaknya 7
pengulangan nilai reflectance. Kolom pertama adalah panjang gelombang sedangkan kolom kedua sampai terakhir dari baris kedua sampai terakhir merupakan nilai-nilai spektral.
Tabel 3 Level data dan tahapan praproses Level Data
Tahapan Praproses
Data 0.1
Nilai spektral yang diambil pada tiap titik percobaan dilakukan perhitungan rata-rata dari setiap panjang gelombang.
Data 0.2
Rata-rata tiap petakan dihitung dari Data 0.1 dan data yang mengandung noise dihapus.
Data 1.0
Resampling data spektral menjadi 114 band yang disesuaikan dengan templateband pada data Hymap.
Tahap praproses selanjutnya yaitu menghitung rata-rata tiap panjang gelombang untuk setiap titik percobaan pada setiap quadrate. Implementasi pada data yang digunakan yaitu beberapa file yang memiliki kode q yang sama dilakukan perhitungan ratarata pada setiap panjang gelombang kemudian disimpan ke dalam file baru pada folder Data 0.2. Contoh untuk file dengan kode IN01q1p1_10, IN01q1p2_10, sampai dengan kode IN01q1p10_10 dilakukan perhitungan rata-rata tiap panjang gelombang yang kemudian disimpan ke dalam file IN01q01. Jika hasil rata-rata pada range 600 sampai dengan 1300 nanometer dan range 1500 sampai dengan 1700 nanometer terdapat nilai yang lebih dari 0.48, data tersebut dianggap memiliki noise dan tidak akan digunakan untuk pengujian dan analisis.
Gambar 6 Tahap praproses data. Dari setiap file Data 0.0 dilakukan perhitungan rata-rata untuk setiap panjang gelombang dan kemudian disimpan ke dalam file baru pada folder Data 0.1 dengan nama file yang sama. Contoh nama file Data 0.0 yaitu IN01q1p1_10, IN01q1p2_10, IN01q1p3_10, SB01q1p1_10, SB01q1p2_10 dan seterusnya. Simbol IN artinya data tersebut diambil dari daerah Indramayu sedangkan SB artinya dari wilayah Subang, q menunjukkan quadrate, dan p menunjukkan titik percobaan.
Tahap praproses terakhir untuk data Field_Spect 10 dan Field_Spect 50 yaitu penggabungan seluruh data yang ada pada Data 0.2 menjadi satu file. Nilai-nilai reflectance setiap file pada Data 0.2 akan menjadi kolom dari file pada Data 1.0, tetapi nilai reflectance yang akan disimpan ke dalam Data 1.0 hanya untuk panjang gelombang yang terdapat pada data Hymap. Nilai-nilai reflectance yang terdapat pada Data 0.2 dilakukan penyesuaian terhadap data Hymap, sehingga untuk Data 1.0 setiap nilai reflectance dikalikan dengan 10000 dan panjang gelombang dalam satuan 1/1000 nanometer. Data Hymap terdiri atas 126 band dengan range panjang gelombang 459 sampai dengan 2490 nanometer dan lebar band berbeda.Tahap praproses yang dilakukan pada data tersebut yaitu pemilihan data untuk panjang gelombang 8
terpilih sehingga menjadi 114 band. Pemilihan 126 band menjadi 116 band karena terdapat sepuluh band yang merupakan band terjadinya water absorption (proses penyerapan panjang gelombang oleh air sebelum jatuh ke permukaan bumi). Sepuluh band tersebut dihapus sedangkan dua band lainnya dihapus (band 115 dan 116) karena merupakan band yang mengandung noise. Pada data Hymap juga dilakukan penggabungan untuk seluruh file menjadi sebuah file seperti praproses Data 0.2 menjadi Data 1.0. Data Hymap untuk daerah Indramayu dilakukan pembulatan nilai panjang gelombang agar sesuai dengan data Field_Spect 10 dan Field_Spect 50. Hasil penggabungan Data 1.0, data Hymap, dan data Crop Variable disesuaikan dengan format Weka dan prosedur pengujian. Hasil Pengujian Data Menggunakan Weka Prosedur pengujian yang dilakukan yaitu cross validation 5 fold, supplied data test, dan percentage split 70% data training dan 30% data testing dengan melakukan perubahan pada jumlah latent yang digunakan pada setiap prosedur pengujian tersebut. 1. Cross validation 5 fold dengan menggabungkan data Indramayu dan Subang Pengujian cross validation 5 fold dengan menggabungkan data Indramayu dan Subang untuk pengujian LAI menggunakan 1 sampai dengan 82 latent, SPAD menggunakan 1 sampai dengan 83 latent, dan yield menggunakan 1 sampai dengan 52 latent. Nilai R2 maksimum yang diperoleh untuk prediksi LAI, SPAD, dan yield masing-masing dapat dilihat pada Tabel 4, Tabel 5, dan Tabel 6, sedangkan untuk perbandingan nilai R2 LAI, SPAD, dan yield data Field_Spect 10 dan Field_Spect 50 masingmasing dapat dilihat pada Gambar 7 dan Gambar 8. Grafik error untuk hasil prediksi LAI, SPAD, dan yield dengan cross validation 5 fold dapat dilihat pada Lampiran 2. 2. Cross validation 5 fold dengan pemisahan data yield Indramayu dan Subang
fold pemisahan data Indramayu dan Subang dapat dilihat pada Lampiran 3. Tabel 4 Hasil prediksi LAI dengan cross validation 5 fold data Indramayu Subang LAI
Crop Variable
Field_Spect 10
Field_Spect 50
R2
0.8840
0.9038
RMSE
0.4638
0.4232
10
9
Data
Latent R2 maksimum
Tabel 5 Hasil prediksi SPAD dengan cross validation 5 fold data Indramayu Subang SPAD
Crop Variable Data R2 RMSE
Field_Spect 10
Field_Spect 50
0.2700
0.2252
3.1202
3.1294
10
3
2
Latent R maksimum
Tabel 6 Hasil prediksi yield dengan cross validation 5 fold data Indramayu Subang Crop Variable
yield Field_Spect 10
Field_Spect 50
R2
0.2400
0.3363
RMSE
2.6166
1.7586
15
13
Data
Latent R2 maksimum
Pada pengujian cross validation 5 fold untuk prediksi yield, data Indramayu menggunakan 1 sampai dengan 32 latent sedangkan data Subang 1 sampai dengan 20 latent. Nilai R2 maksimum masing-masing daerah dapat dilihat pada Tabel 7 dan Tabel 8. Perbandingan nilai R2 yield antara penggabungan dan pemisahan data Indramayu dan Subang dapat dilihat pada Gambar 9 dan Gambar 10. Grafik error untuk hasil prediksi yield dengan cross validation 5 9
Tabel 7 Hasil prediksi yield dengan cross validation 5 fold data Indramayu
Field_Spect 10
Field_Spect 50
R2
0.2878
0.3023
RMSE
1.5177
2.0849
Data
R2
INDRAMAYU
Daerah
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1
5
9
Latent R2 maksimum
3
10
IN
Tabel 8 Hasil prediksi yield dengan cross validation 5 fold data Subang
Field_Spect 50
R2
0.0769
0.1471
RMSE
0.7745
0.7932
4
4
Latent R2 maksimum
R2
Field_Spect 10
Data
21
SB
IN-SB
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1
5
9
IN Field_Spect 10
R2
17
yield data Gambar 9 Perbandingan R2 Field_Spect 10 cross validation 5 fold.
SUBANG
Daerah
13
17
21
Jumlah latent SB IN-SB
Gambar 10 Perbandingan R2 yield data Field_Spect 50 cross validation 5 fold.
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
3. Supplied test set
1
5
9
13 17 21 25 29 33 37 41 45 49 53
LAI
Jumlah latent SPAD
YIELD
Gambar 7 Perbandingan R2 LAI, SPAD, dan yield Field_Spect 10. Field_Spect 50
R2
13
Jumlah latent
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
Supplied test set menggunakan data training Field_Spect 10 dan Field_Spect 50 dengan data testing yaitu data Hymap. Hasil R2 maksimum untuk prediksi LAI, SPAD, dan yield dapat dilihat pada Lampiran 4, sedangkan grafik perbandingan R2 untuk Field_Spect 10 dan Field_Spect 50 dalam memprediksi data Hymap dapat dilihat pada Gambar 11 dan Gambar 12. Grafik error untuk hasil prediksi dengan supplied test set data Hymap dapat dilihat pada Lampiran 5. 4. Percentage split dengan 70% data training dan 30% data testing
1
5
9
LAI
13
17
21
Jumlah latent SPAD
25
29
33
YIELD
Gambar 8 Perbandingan R2 LAI, SPAD, dan yield Field_Spect 50.
Data Hymap dibagi menjadi 3 data set untuk masing-masing data LAI, SPAD, dan yield. Data dibagi dengan sistem acak dan masingmasing pengujian menggunakan jumlah latent yang berbeda.Hasil R2 maksimum untuk prediksi LAI, SPAD, dan yield dapat dilihat pada Lampiran 6, sedangkan grafik perbandingan R2 dapat dilihat pada Lampiran 7.
10
masing bernilai 0.0769 dan 0.1471. Diagram perbandingan R2 pemisahan data Indramayu dan Subang dapat dilihat pada Lampiran 8.
1,0000 0,9000 0,8000 0,7000
R2
0,6000 0,5000 0,4000 0,3000 0,2000 0,1000 0,0000 1 3 5 7 9 1113151719212325272931333537394143454749
LAI
Jumlah latent SPAD
YIELD
R2
Gambar 11 Perbandingan R2 data training Field_Spect 10 data testing Hymap LAI, SPAD dan yield.
Pada Gambar 9 dan Gambar 10, nilai R2 untuk prediksi yield daerah Subang lebih rendah dari data Indramayu dan data gabungan Indramayu-Subang. Penggabungan data Indramayu-Subang lebih baik jika dibandingkan dengan data Indramayu maupun data Subang. Secara keseluruhan, nilai R2 untuk memprediksi LAI jauh lebih tinggi jika dibandingkan dengan SPAD dan yield seperti yang terlihat pada Gambar 7, Gambar 8, Gambar 11 dan Gambar 12. Diagram perbandingan R2 LAI, SPAD, dan yield dapat dilihat pada Lampiran 9. Pengujian data Hymap dengan percentage split menunjukkan bahwa hasil untuk prediksi yield bisa mencapai nilai R2 0.4921. Hal ini menunjukkan bahwa yield dapat diprediksi dengan menggunakan data spektral walaupun belum mencapai akurasi sebaik prediksi LAI.
1,0000 0,9000 0,8000 0,7000 0,6000 0,5000 0,4000 0,3000 0,2000 0,1000 0,0000 1 3 5 7 9 1113151719212325272931333537394143454749
Jumlah latent LAI
SPAD
Gambar 12 Perbandingan R2 data training Field_Spect 50 data testing Hymap LAI, SPAD dan yield. Evaluasi dan Analisis Hasil Hasil yang diperoleh dengan melakukan ketiga prosedur pengujian data menunjukkan bahwa jumlah latent yang dibutuhkan untuk mendapatkan akurasi maksimum berbeda untuk setiap data. Nilai R2 maksimum cross validation 5 fold yang diperoleh untuk prediksi LAI dengan data Field_Spect 10 yaitu 0.8840, sedangkan data Field_Spect 50 yaitu 0.9038. Prediksi SPAD dengan data Field_Spect 10 yaitu 0.2700, sedangkan data Field_Spect 50 yaitu 0.2252. Prediksi yield dengan data Field_Spect 10 yaitu 0.2400, sedangkan data Field_Spect 50 yaitu 0.3363. Pengujian cross validation 5 fold dengan memisahkan data yield Indramayu dan Subang tidak memberikan pengaruh yang terlalu besar terhadap nilai R2 pada masing-masing percobaan. Pada daerah Indramayu, R2 data Field_Spect 10 yaitu 0.2878 dan R2 data Field_Spect 50 yaitu 0.3023. R2 mengalami penurunan pada data Subang yaitu untuk data Field_Spect 10 dan Field_Spect 50 masing-
Seluruh hasil percobaan menunjukkan bahwa LAI dapat diprediksi menggunakan data spektral dan mendapatkan akurasi yang tinggi, sedangkan SPAD dan yield masih kurang baik. Hasil prediksi SPAD yang memiliki akurasi kurang baik dapat dikarenakan adanya kesalahan sistem pengukuran pada alat. Pada saat pengukuran, kandungan klorofil daun yang berwarna hijau dengan daun yang berwarna merah memiliki nilai SPAD yang hampir sama. Nilai yield aktual yang digunakan pada data penelitian merupakan hasil pengukuran ubinan yang merupakan pengukuran sample, yaitu perhitungan yield 4 x 4 meter yang mewakili yield untuk 1 hektar (100 x 100 meter). Hal tersebut dapat menjadi salah satu penyebab hasil akurasi yang kurang baik dalam memprediksi yield. KESIMPULAN DAN SARAN Kesimpulan Hasil penelitian menunjukkan: 1. Semakin banyak jumlah latent yang digunakan, maka nilai R2 akan mendekati ke suatu nilai (konvergen). 2. Untuk menghasilkan nilai R2 maksimum diperlukan pemilihan jumlah latent yang tepat. 3. Jumlah data cukup berpengaruh terhadap nilai R2. 4. Penggabungan data Indramayu dan Subang memberikan nilai R2 relatif lebih baik karena data menjadi lebih bervariasi untuk testing data baru.
11