JARINGAN SYARAF TIRUAN DAN ALGORITMA GENETIKA DALAM PEMODELAN KALIBRASI (Studi Kasus: Tanaman Obat Temulawak)
BARTHO SIHOMBING
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2011
2
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis berjudul Jaringan Syaraf Tiruan dan Algoritma Genetika dalam Pemodelan Kalibrasi (Studi Kasus: Tanaman Obat Temulawak) adalah karya saya sendiri dengan arahan dan bimbingan dari komisi pembimbing serta belum pernah diajukan dalam bentuk apapun kepada perguruan tinggi dimana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan oleh pihak lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, Juni 2011
Bartho Sihombing NRP G151080041
ABSTRACT
BARTHO SIHOMBING. Artificial Neural Network and Genetic Algorithm on Calibration Spectroscopy (Case Study: Curcuma Medicinal Plant). Supervised by ERFIANI and UTAMI DYAH SYAFITRI. The problems in prediction of calibration model are multicolinearity and the number of variables is larger than the number of observations. Principal Component Analysis-Artificial Neural Network-Genetic Algorithm (PCA-ANNGA) models were applied for the relationship between sample of concentration which is limited and transmittance data which is in large dimensions. A large number of variables were compressed into principal components (PC’s). From these PC’s, the ANN was employed for prediction of concentration. The principal components computed by PCA were applied as inputs to a backpropagation neural network with one hidden layer. The models was evaluated using GA for the best network structure on hidden layer. Root Mean Square Error (RMSE) for 80% training set and 20% testing set are 0.0314 and 0.5225, respectively. Distribution of data according to the percentage of training data and testing data were also very influential to obtain the best network structure with the smallest RMSE achievement. The best model for these methods is two layers Neural Network with eight neuron in the hidden layer. Keywords : Principal Component Analysis, Artificial Neural Network, Genetic Algorithm, RMSE
RINGKASAN
BARTHO SIHOMBING. Jaringan Syaraf Tiruan dan Algoritma Genetika dalam Pemodelan Kalibrasi (Studi Kasus: Tanaman Obat Temulawak). Dibimbing oleh ERFIANI dan UTAMI DYAH SYAFITRI. Pada pendugaan kalibrasi permasalahan yang sering muncul adalah kasus multikolinieritas dan jumlah pengamatan contoh jauh lebih kecil dari jumlah peubah bebas. Salah satu cara untuk mengatasinya adalah dengan mereduksi dimensi peubah bebas. Analisis Komponen Utama (AKU) adalah salah satu metode yang dapat digunakan untuk mereduksi dimensi peubah yang besar. AKU adalah teknik yang digunakan untuk menyederhanakan suatu data dengan cara mentransformasi secara linier sehingga terbentuk system koordinat baru dengan keragaman maksimum. AKU dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan. Pada AKU data akan direduksi ke dalam beberapa komponen utama. Pereduksian dilakukan dengan cara memproyeksikan data asli ke dalam ruang komponen utama yang berdimensi rendah. Salah satu metode pemodelan kalibrasi adalah Jaringan Syaraf Tiruan (JST). JST dapat digunakan untuk menduga kandungan senyawa aktif tanaman obat temulawak berdasarkan data persen transmitan. JST tidak diprogram untuk menghasilkan keluaran tertentu. Semua keluaran atau kesimpulan yang ditarik oleh jaringan didasarkan pada pengalamannnya selama mengikuti proses pembelajaran. Pada proses pembelajaran, ke dalam JST dimasukkan pola-pola (input dan ouput) lalu jaringan akan diajari untuk memberikan jawaban yang bisa diterima. Dalam penelitian ini, komponen utama yang diperoleh melalui AKU digunakan sebagai input pada jaringan untuk menduga nilai target. Data hasil pemrosesan AKU dibagi dalam dua bagian, data training dan data testing. Pembagian data menjadi data training dan data testing memberikan pengaruh terhadap kebaikan model. Metode backpropagation pada JST merupakan salah satu metode pelatihan yang baik untuk mengatasi masalah pengenalan pola-pola kompleks (Siang 2009). Penggunaan Algoritma Genetika (AG) dalam optimasi JST dilakukan untuk mendapatkan struktur neuron pada lapis tersembunyi yang mendekati optimal. Tingkat pengenalan JST dalam pendugaan yang tinggi akan didapat apabila seluruh neuron pada lapis tersembunyi memberikan nilai kontribusi objektif, yaitu nilai R2. Penghilangan neuron yang kurang bermanfaat dapat dilakukan dengan membuang bobot dari neuron yang terhubung yang memberikan kontribusi R2 kecil. Pada percobaan JST dengan optimasi AG, kelompok data dengan jumlah data training 80% dan komponen utama ysng digunakan sebagai input pada jaringan menjelaskan 99,8555% data asal diperoleh model terbaik dengan RMSE minimum dan R2 paling besar. AG sangat baik digunakan untuk memperoleh struktur jaringan yang terbaik jika dibandingakan dengan tanpa menggunakan AG, hal ini dapat dievaluasi dari nilai RMSE dan R2 yang diperoleh.
©Hak cipta milik Institut Pertanian Bogor, tahun 2011 Hak cipta dilindungi Undang-undang Dilarang mengutip sebagian atau seluruh hasil karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik dan tinjauan suatu masalah; dan pengutipan tidak merugikan kepentingan yang wajar bagi Institut Pertanian Bogor. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apapun tanpa izin Institut Pertanian Bogor.
JARINGAN SYARAF TIRUAN DAN ALGORITMA GENETIKA DALAM PEMODELAN KALIBRASI (Studi Kasus: Tanaman Obat Temulawak)
BARTHO SIHOMBING
Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2011
Penguji Luar Komisi pada Ujian Tesis : Yenni Angraini, S.Si, M.Si.
Judul Tesis Nama NRP
: Jaringan Syaraf Tiruan dan Algoritma Genetika dalam Pemodelan Kalibrasi (Studi Kasus: Tanaman Obat Temulawak) : Bartho Sihombing : G151080041
Disetujui Komisi Pembimbing
Dr. Ir. Erfiani. M.Si. Ketua
Utami Dyah Syafitri, M.Si. Anggota
Diketahui
Ketua Program Studi Statistika
Dekan Sekolah Pascasarjana
Dr. Ir. Aji Hamim Wigena, M.Sc
Prof. Dr. Ir. Khairil Anwar Notodiputro, M.S.
Tanggal Ujian:
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kepada Tuhan atas segala rahmat-Nya sehingga tesis berjudul Jaringan Syaraf Tiruan dan Algoritma Genetika dalam Pemodelan Kalibrasi (Studi Kasus: Tanaman Obat Temulawak) berhasil diselesaikan. Terima kasih penulis ucapkan kepada Ibu Dr. Ir. Erfiani, M.Si dan Ibu Utami Dyah Syafitri, M.Si selaku komisi pembimbing yang telah memberikan bimbingan dan motivasi dengan penuh kesabaran. Tak lupa penulis sampaikan penghargaan dan terimakasih kepada Ibu Yenni Angraini, M.Si selaku penguji luar komisi dan Dr. Ir. Aji Hamim Wigena selaku perwakilan Program Studi Statistika pada ujian tesis. Penulis juga mengucapkan terimakasih kepada seluruh staf pengajar dan pegawai Program Studi Statistika atas bimbingan dan kerjasama selama penulis mengikuti pendidikan. Akhirnya, ucapan terima kasih yang tak terhingga penulis berikan kepada seluruh keluarga atas segala doa dan dukungannya selama penulis menyelesaikan studi. Semoga karya ilmiah ini dapat bermanfaat bagi kemajuan ilmu pengetahuan.
Bogor, Juni 2011
Bartho Sihombing
RIWAYAT HIDUP Penulis dilahirkan di Lumban Sihite pada tanggal 31 Maret 1977 dari ayah T.Sihombing dan Ibu E.Sitorus. Penulis merupakan anak kelima dari tujuh bersaudara. Tahun 1995 penulis lulus dari SMA Negeri Parongil dan pada tahun yang sama penulis melanjutkan pendidikan sarjana pada jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara, lulus tahun 2000. Pada tahun 2005, penulis menjadi Pegawai Negeri Sipil di Kopertis Wilayah I NAD-SUMUT sebagai tenaga pengajar di Fakultas Teknik Universitas Sisingamangaraja XII, Medan. Pada tahun 2008 penulis masuk program magister pada Program Studi Statistika Sekolah Pascasarjana Institut Pertanian Bogor melalui jalur Beasiswa BPPS dan menyelesaikannya pada tahun 2011.
DAFTAR ISI Halaman DAFTAR TABEL..................................................................................... .......
vi
DAFTAR GAMBAR.......................................................................................
vii
PENDAHULUAN Latar Belakang .......................................................................................... Tujuan Penelitian .......................................................................................
1 3
TINJAUAN PUSTAKA Senyawa Aktif pada Temulawak ............................................................... Spektroskopi FTIR (Fourier Transform Infrared)..................................... High Performance Liquid Chromatography (HPLC) ................................ Analisis Komponen Utama (AKU) ............................................................ Algoritma Genetika (AG) .......................................................................... Jaringan Syaraf Tiruan (JST) ..................................................................... Neuron........................................................................................................ Komponen JST........................................................................................... Arsitektur Jaringan..................................................................................... Metode Backpropagatioan......................................................................... Fungsi Aktivasi pada Backpropagation......................................................
5 5 7 7 8 10 11 11 12 13 14
DATA DAN METODE Data ........................................................................................................... Metode .......................................................................................................
17 17
HASIL DAN PEMBAHASAN ........................................................................ Deskripsi Spektrum Kurkumin................................................................... Reduksi Peubah Penjelas............................................................................ Nilai Dugaan Terhadap Nilai HPLC...........................................................
21 22 23
SIMPULAN DAN SARAN Simpulan .................................................................................................... Saran ...........................................................................................................
29 29
DAFTAR PUSTAKA ......................................................................................
31
LAMPIRAN .....................................................................................................
33
DAFTAR TABEL
Halaman
1. Daerah identifikasi spektra IR kurkumin ................................................. ..
6
2. Populasi awal dengan kromosom 6 bit.......................................................
9
3. Contoh proses crossover ............................................................................
10
4. Ragam kumulatif komponen utama ...........................................................
22
5. Perbandingan rata-rata RMSE dengn AKU-JST-AG ...............................
24
6. Perbandingan rata-rata RMSE dengan AKU-JST tanpa AG .....................
25
7. Nilai RMSEtesting dan R2 berdasarkan jumlah KU ......................................
27
DAFTAR GAMBAR
Halaman
3. Arsitektur backpropagation banyak lapisan ............................................ ..
13
4. Arsitektur backpropagation banyak lapisan dengan bobot ........................
14
3. Diagram Alur Penelitian ............................................................................
20
4. Spektra kurkumin serbuk temulawak .........................................................
21
5. Histogram frekuensi rata-rata nilai RMSE pada data training...................
23
6. Histogram frekuensi rata-rata nilai RMSE pada data testing .....................
24
7. Perbandingan nilai rata-rata R2 dengan AKU-JST-AG dan AKU-JST ....
25
8. Perbandingan nilai RMSEtesting metode AKU-JST-AG dan AKU-JST......
26
9. Sebaran jumlah neuron lapis tersembunyi .................................................
26
PENDAHULUAN
Latar Belakang Pada beberapa percobaan kimia, penelitian kandungan senyawa aktif suatu tanaman obat memerlukan tahapan yang panjang dan rumit. Selain itu tidak sedikit biaya yang diperlukan untuk pengadaan bahan selama persiapan contoh sampai pada pengukuran menggunakan
HPLC (High Performance Liquid
Chromatography).
dikembangkan
Pemodelan
kalibrasi
untuk
mengatasi
permasalahan waktu dan biaya. Kandungan senyawa aktif suatu tanaman obat dapat diketahui dengan metode HPLC (High Performance Liquid Chromatography) dan FTIR (Fourier Transform Infrared). Penggunaan HPLC membutuhkan proses yang lama dan biaya yang mahal untuk memperoleh konsentrasi suatu unsur atau senyawa dari tanaman obat sedangkan FTIR yang relatif lebih sederhana dan murah namun keluaran yang dihasilkannya hanya berupa spektrum yang menunjukkan besarnya nilai serapan saat contoh disinari inframerah (persen transmitan) dengan alat spektrometer FTIR (Sunaryo 2005). Dengan metode HPLC, suatu senyawa dapat diketahui secara kualitatif dan kuantitatif yaitu dengan mengetahui pola kromatogram dan memperbandingkan luas area terhadap suatu standar senyawa yang diketahui, sedangkan spektroskopi FTIR memberikan informasi yang mencerminkan gugus fungsi yang terdapat pada suatu senyawa aktif dan kuantitatif melalui nilai absorbannya. Data keluaran FTIR merupakan data kontinu terhadap bilangan gelombang. Oleh karena itu diperlukan suatu metode alternatif yang lebih murah, mudah dan cepat untuk memperoleh dugaan kandungan senyawa aktif dalam tanaman obat. Salah satu metode alternatif yang dapat menyatakan hubungan antara konsentrasi senyawa aktif hasil pengukuran HPLC dengan persen transmitan yang diukur dengan menggunakan FTIR adalah model kalibrasi.Model kalibrasi merupakan suatu bagian dari kemometrik yang fokus untuk mencari hubungan antara suatu himpunan pengukuran yang diperoleh melalui proses yang relatif mudah atau murah dan himpunan pengukuran lain yang memerlukan waktu lama
2
dan biaya mahal dalam memperolehnya (Naes et al. 2002). Tujuan pemodelan kalibrasi adalah menemukan model yang dapat digunakan untuk memprediksi konsentrasi senyawa secara akurat berdasarkan informasi persen transmitan senyawa yang dianalisis (Erfiani, 2005). Dalam penyusunan model kalibrasi masalah yang sering timbul adalah adanya multikolinieritas antara peubah bebas. Selain itu muncul juga masalah bahwa banyaknya peubah bebas jauh lebih besar dari banyaknya pengamatan. Terdapat beberapa metode pendekatan untuk menyusun model kalibrasi peubah ganda antara lain metode Partial Least Square (PLS) dan Jaringan Syaraf Tiruan (JST).
Beberapa peneliti di Institut Pertanian Bogor (IPB) telah
mengembangkan model kalibrasi untuk kasus yang berbeda. Arnita (2005) melakukan koreksi pencaran pada senyawa aktif gingerol serbuk rimpang jahe, model kalibrasi yang dibentuk dari data yang dikoreksi pencarannya mampu memberikan nilai RMSEP yang lebih kecil dibanding model kalibrasi yang dibentuk dari data yang tidak dikoreksi pencarannya. Atok (2005) menggunakan Jaringan Syaraf Tiruan (JST) dengan metode pra-pemrosesan Analisis Komponen Utama (AKU) untuk mencari pemodelan kalibrasi untuk data HPLC dan FTIR dari zat aktif serbuk jahe, kajian dilakukan hanya didasarkan pada bangkitan data yang konvergen sehingga hasil yang diperoleh dapat diterapkan jika algoritma pembelajaran pada JST menjamin kekonvergenan tersebut. Erfiani (2005) mengembangkan model kalibrasi dengan pendekatan Bayes dengan menggunakan pendekatan regresi terpenggal untuk mereduksi dimensi data, sedangkan Sunaryo (2005) menggunakan Regresi Komponen Utama dengan metode Wavelet digunakan untuk pra-pemrosesan, hasil yang diperoleh memperbaiki nilai RMSEP yang diperoleh oleh Arnita (2005). Mukid (2009) menerapkan regresi proses Gaussian dengan kajian terhadap penggunaan berbagai fungsi peragam, Santi (2010) menggunakan metoda GA-PLS untuk pendugaan model kalibrasi. Peneliti lain yang telah mempublikasikan metode kalibrasi adalah Habibi et.al. yang dalam penelitiannya membandingkan aplikasi AKU-Algoritma Genetika (AG)JST dengan AKU-AG-Multiple Linear Regression dengan kesimpulan bahwa pemodelan
dengan
menggunakan
AKU-AG-JST
relatif
lebih
baik.
3
Dengan memperhatikan berbagai penelitian pemodelan kalibrasi yang telah dilakukan, penulis akan menggunakan aplikasi AKU-JST-AG untuk menduga model kalibrasi pada pengukuran konsentrasi kurkumin pada tanaman temulawak berdasarkan data persen transmitannya. Prapemrosesan akan dilakukan dengan AKU, kemudian dimodelkan dengan JST. Arsitektur dari JST akan dievaluasi oleh AG dengan harapan diperoleh arsitektur yang baik dengan RMSE minimum.
Tujuan Penelitian
Penelitian ini bertujuan untuk membangun model kalibrasi dengan menggunakan JST yang dioptimasi menggunakan Algoritma Genetika pada pengukuran konsentrasi kurkumin temulawak berdasarkan persen transmitannya.
4
TINJAUAN PUSTAKA Senyawa Aktif pada Temulawak Menurut Sinambela (1985), komposisi rimpang temulawak dapat dibagi menjadi dua fraksi utama yaitu zat warna kurkuminoid dan minyak atsiri. Warna kekuningan temulawak disebabkan adanya kurkuminoid. Kandungan utama kurkuminoid
terdiri
dari
senyawa
kurkumin,
desmetoksikurkumin
dan
bisdesmetoksikurkumin. Rimpang temulawak segar, selain terdiri dari senyawa kurkuminoid dan minyak atsiri juga mengandung lemak, protein, selulosa, pati, dan mineral. Kadar masing-masing zat tersebut tergantung pada umur rimpang yang dipanen serta juga dipengaruhi oleh letak dan ketinggian tempat temulawak berada. Menurut Darwis et al. (1991), temulawak mempunyai berbagai macam khasiat, yaitu sebagai: antibakteri dan dapat merangsang dinding kantong empedu untuk mengeluarkan cairan empedu supaya pencernaan lebih sempurna. Selain itu temulawak digunakan juga sebagai pengobatan gangguan pada hati atau penyakit kuning, memperlancar aliran air empedu, obat demam, obat diare, gangguan perut karena dingin dan radang dalam perut atau kulit. Khasiat temulawak tersebut telah dibuktikan melalui teknik ilmu pengetahuan modern baik oleh ilmuwan dalam maupun luar negeri.
Spektroskopi FTIR (Fourier Transform Infrared) FTIR merupakan salah satu teknik spektroskopi inframerah. Instrumentasi spektrum inframerah dibagi kedalam tiga jenis radiasi yaitu inframerah dekat (bilangan gelombang 12800-4000 cm-1), inframerah pertengahan (bilangan gelombang 4000 - 200 cm-1), dan inframerah jauh (bilangan gelombang 200-10 cm-1) (Nur & Adijuawana 1989). FTIR termasuk dalam kategori radiasi inframerah pertengahan. Spektrum
inframerah
senyawa
tumbuhan
dapat
diukur
dengan
spektrofotometri inframerah yang merekam secara otomatis dalam bentuk larutan (dalam kloroform, karbontetraklorida, 1-5%), bentuk gerusan dalam minyak nujol, atau bentuk padat yang dicampur dengan kalium bromida. Daerah pada spektrum
6
inframerah di atas 1200 cm-1 menunjukkan pita spektrum atau puncak yang disebabkan oleh getaran ikatan kimia atau gugus fungsi dalam molekul yang ditelaah (Harbone, JB 1996). Hampir setiap senyawa yang memiliki ikatan kovalen akan menyerap berbagai frekuensi radiasi elektromagnetik dalam daerah spektrum inframerah. Setiap tipe ikatan yang berbeda mempunyai sifat frekuensi vibrasi yang berbeda. Karena tipe ikatan yang sama dalam dua senyawa yang berbeda terletak dalam lingkungan yang sedikit berbeda, maka tidak akan ada dua molekul yang berbeda strukturnya akan mempunyai bentuk serapan inframerah atau spektrum inframerah yang tepat sama. Jika I0 adalah intensitas IR yang masuk kedalam contoh dan I adalah intensitas IR yang diteruskan (transmitted) oleh contoh, maka : Absorban (A) = Log (I0 / I) dan transmitan (T) = 100 (I/I0). Sehingga hubungan absorban dengan transmitan adalah : A = - log ( T/100). Kegunaan penting dari spektrum inframerah adalah untuk mendeteksi tentang gugus fungsi dari suatu molekul. Dari struktur kurkuminoid yang khas, maka spektrum inframerah yang dihasilkan dengan FTIR juga khas. Menurut Socrates (1994), daerah identifikasi spektra inframerah (IR) untuk kurkuminoid adalah seperti yang terlihat pada Tabel 1 berikut: Tabel 1 Daerah identifikasi spektra IR kurkumin Bilangan
No
Jenis Vibrasi
1
Ikatan hidrogen OH
3600-3300
m-s
2
C-H alkana
3000-2850
s
3
C=O keton
1820-1660
vs
1660-1450
s
4
Gelombang cm-1
Aromatic–C=C- rentangan
Intensitas
5
R – O-Ar
1300-1000
m
6
Sidik jari
900-700
s
Keterangan: (s) kuat; (m) medium; (vs) sangat kuat Karena kekuatan serapan proporsional terhadap konsentrasi, maka FTIR dapat digunakan untuk analisis kuantitatif yang menghubungkan konsentrasi dengan absorban atau persen transmitan. Untuk menduga konsentrasi suatu
7
senyawa tertentu dalam contoh, diperlukan pengukuran nilai-nilai absorban dari contoh pada berbagai bilangan gelombang.
High Performance Liquid Chromatography (HPLC) Kromatografi adalah suatu metode pemisahan komponen-komponen suatu campuran, komponen-komponen tersebut akan terdistribusi diantara dua fase. Salah satu fase dibuat diam dan dinamakan fase diam atau fase stasioner, fase lainnya disebut fase gerak atau fase mobil yang bergerak diantara celah-celah atau pada permukaan fase stasioner. Pergerakan fase mobil ini mengakibatkan pergerakan diferensial dari komponen-komponen contoh (Nur dan Adijuwana 1989). Fase diam pada kromatografi dapat berupa cair atau padatan sedangkan fase gerak dapat berupa cair atau gas. Berdasarkan jenis fasenya kromatografi dapat digolongkan menjadi empat jenis yaitu: cair-padatan, gas-padatan, cair-cair, dan gas-cair.
Analisis Komponen Utama (AKU) Analisis Komponen Utama (AKU) adalah teknik yang digunakan untuk menyederhanakan suatu data, dengan cara mentransformasi data secara linier sehingga terbentuk sistem koordinat baru dengan keragaman maksimum. AKU dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan. AKU juga sering digunakan untuk menghindari masalah multikolinearitas antar peubah bebas dalam model regresi berganda.
Dalam
AKU
peubah-peubah
yang masih
saling berkorelasi
ditransformasi menjadi satu set peubah baru yang tidak berkorelasi lagi, peubahpeubah baru itu disebut sebagai Komponen Utama (KU) (Johnson & Wichren 1982). Pada AKU data akan direduksi kedalam beberapa komponen utama. Pereduksian dilakukan dengan cara memproyeksikan data asli ke dalam ruang komponen utama yang berdimensi rendah. Misalkan
adalah suatu vektor acak berdimensi p
dengan matriks kovarian S. Jika λ1, λ2, …, λp adalah akar ciri dari S dengan λ1 ≥ λ2
8
≥ …≥ λp ≥ 0, dan ai adalah vektor ciri dari S yang berhubungan dengan λi, i=1,2,…,p. Maka Komponen Utama ke-i dinyatakan sebagai :
dimana
Dipilih sedemikian hingga varians dari
maksimum.
dengan
dan Berdasarkan proporsi dari total keragaman populasi, akan diambil k komponen utama pertama untuk mengganti p variabel asal.
Algoritma Genetika (AG) AG merupakan metode adaptif yang biasa digunakan untuk memecahkan suatu pencarian nilai dalam sebuah masalah optimasi (Suyanto 2005). Algoritma ini didasarkan pada proses genetik yang ada dalam makhluk hidup; yaitu perkembangan generasi dalam sebuah populasi yang alami, secara lambat laun mengikuti proses seleksi alam atau “siapa yang kuat, dia yang bertahan (survive)”. Dengan meniru teori evolusi ini, AG dapat digunakan untuk mencari permasalahan-permasalahan dalam dunia nyata. Algoritma ini bekerja dengan sebuah populasi yang terdiri dari individu-individu, masing-masing individu mempresentasikan sebuah solusi yang mungkin bagi persoalan yang ada. Dalam kaitan ini individu dilambangkan dengan sebuah nilai fitness yang akan digunakan untuk mencari solusi terbaik dari persoalan yang ada. AG pertama kali dikembangkan oleh John Holland pada tahun 1970-an di New York. Sebagaimana halnya proses evolusi di alam, suatu algoritma genetika terdiri dari tiga operasi yaitu: operasi Evolusi yang melibatkan proses selection (seleksi) didalamnya, operasi crossover (persilangan), dan operasi mutation (mutasi). Struktur umum dari suatu algoritma genetika dapat didefenisikan dengan langkah-langkah sebagai berikut :
9
Mendefinisikan individu, dimana individu menyatakan salah satu solusi yang mungkin dari permasalahan yang diangkat. Individu bisa dikatakan sama dengan kromosom, yang merupakan kumpulan gen. Gen ini bias bersifat biner. Mendefinisikan nilai fitness, yang merupakan ukuran baik-tidaknya sebuah individu atau baik-tidaknya solusi yang didapatkan. Nilai fitness ini yang dijadikan acuan dalam mencapai nilai optimal dalam algoritma genetika. Algoritma genetika bertujuan mencari individu dengan nilai fitness yang paling tinggi. Membangkitkan populasi awal secara random Membentuk generasi baru dengan menggunakan operasi selection (seleksi), cross-over (perkawinan silang) dan mutation (mutasi) gen hingga kriteria berhenti terpenuhi. Bila kriteria berhenti belum terpenuhi maka akan dibentuk lagi generasi baru dengan mengulangi operasi seleksi, perkawinan silang dan mutasi. Kriteria berhenti pada proses AG yang sering digunakan antara lain :
Berhenti pada generasi tertentu
Berhenti setelah dalam beberapa generasi berturut-turut didapatkan nilai fitness tertinggi tidak berubah.
Berhenti bila dalam n generasi berikutnya tidak diperoleh nilai fitness yang lebih tinggi.
Dalam populasi terdapat individu-individu yang dinamakan kromosom. Kromosom ini secara lambat laun mengalami iterasi ’Perkembangbiakan’ dalam sebuah generasi. Tabel 2 merupakan contoh suatu populasi awal sebanyak 4 individu dengan masing-masing kromosom individu terdiri dari 6 bit.
Tabel 2 Populasi awal dengan kromosom 6 bit No
Populasi Awal
1
011001
2
100100
3
101010
4
010101
10
Agar menghasilkan generasi dengan kualitas yang lebih baik, maka perlu dilakukan crossover (kawin silang). Pertama-tama father dan mother dipilih secara acak. Selanjutnya tentukan posisi untuk crossover dalam kromosom. Semua bit yang berada di sebelah kiri posisi crossover dari kromosom father dan semua bit sebelah kanan posisi crossover dari kromosom mother ditransfer sedemikian rupa sehingga dihasilkan keturunan baru. Sepasang parent akan menghasilkan 2 keturunan baru. Tabel 3 Contoh proses crossover Sebelum
Sesudah
crossover
crossover
X1
011|001
011|100
X2
100|100
100|001
Jaringan Syaraf Tiruan (JST) JST adalah sistem komputasi dimana arsitektur dan operasi diilhami dari pengetahuan tentang sel syaraf biologis dalam otak. Istilah JST digunakan karena jaringan syaraf ini diimplementasikan dengan menggunakan program komputer yang mampu menyelesaikan sejumlah proses perhitungan selama proses pembelajaran, cara kerja jaringan syaraf tiruan meniru cara kerja otak manusia (Siang 2009). Salah satu contoh pengambilan ide dari jaringan syaraf biologis adalah adanya elemen-elemen pemrosesan pada JST yang saling terhubung dan beroperasi secara paralel. Ini meniru jaringan syaraf biologis yang tersusun dari sel-sel syaraf (neuron). JST tidak diprogram untuk menghasilkan keluaran tertentu. Semua keluaran atau kesimpulan yang ditarik oleh jaringan didasarkan pada pengalamannya
selama
mengikuti
proses
pembelajaran.
Pada
proses
pembelajaran, kedalam JST dimasukkan pola-pola (input dan output) lalu jaringan akan diajari untuk memberikan jawaban yang bisa diterima. Di dalam JST, input akan diproses oleh neuron-neuron JST dengan bobot tertentu. Secara umum cara kerjanya adalah dengan memproses sinyal yang diterima kemudian didistribusikan melewati jaringan dan disimpan sebagai bobot disetiap neuron. Selama proses
11
pelatihan, dilakukan proses penyesuaian bobot dan batas nilai-nilai diperoleh output yang diinginkan. JST dibentuk sebagai generalisasi model matematika dari jaringan syaraf biologi dengan asumsi bahwa : Pemrosesan informasi terjadi pada banyak elemen sederhana (neuron) Sinyal
dikirimkan
diantara
neuron-neuron
melalui
penghubung-
penghubung Penghubung antar neuron memiliki bobot yang akan memperkuat atau memperlemah sinyal Untuk menentukan output, setiap neuron menggunakan fungsi aktivasi yang dikenakan pada jumlahan input yang diterima. Besarnya output ini selanjutnya dibandingkan dengan suatu batas ambang.
Neuron Neuron adalah unit pemroses informasi yang menjadi dasar dalam pengoperasian jaringan syaraf tiruan (Siang 2009). Neuron terdiri dari 3 elemen pembentuk : 1. Himpunan unit-unit yang dihubungkan dengan jalur koneksi. Jalur-jalur tersebut memiliki bobot/kekuatan yang berbeda-beda. Jumlah, struktur dan pola hubungan antar unit-unit tersebut akan menentukan arsitektur jaringan (dan juga model jaringan yang terbentuk). 2. Suatu unit penjumlah yang akan menjumlahkan input-input sinyal yang sudah dikalikan dengan bobotnya 3. Fungsi aktivasi yang akan menentukan apakah sinyal dari input neuron akan diteruskan ke neuron lain ataukah tidak. Komponen JST Input, merupakan data masukan, data awal sebelum diproses. Setiap input diproses ke satu atribut tunggal. Output, merupakan data keluaran, berisis solusi untuk permasalahan dari input. Bobot, menunjukkan nilai matematik dari input data atau banyaknya koneksi yang memindahkan data dari satu lapisan ke lapisan lainnya.
12
Fungsi Penjumlahan, menghitung jumlah dari semua elemen input yang dimasukkan pada setiap pemrosesan elemennya, merupakan perkalian setiap nilai input dan bobotnya. Fungsi Transfer/Fungsi Aktivasi. Fungsi Penjumlahan menghitung tingkat aktivasi
dari
neuron.
Berdasarakan
tingkatan
ini,
neuron
bisa
menghasilkan suatu output dan bisa juga tidak. Hubungan antara tingkat aktivasi internal dan output dapat berupa linear atau non linear. Hubungan tersebut dinamakan Fungsi Transfer. Berdasarkan algoritma pembelajarannya, JST dikelompokkan menjadi 2 macam pelatihan yang dikenal yaitu :
Terawasi (supervised) , dalam hal ini terdapat sejumlah pasangan data (masukan – target keluaran) yang dipakai untuk melatih jaringan hingga diperoleh bobot yang diinginkan. Pasangan data tersebut merupakan pemberi informasi dan melatih hingga diperoleh bentuk yang terbaik. Pada kategori ini penentuan bobot masing-masing neuron berdasarkan keluaran yang diawasi agar nilainya sedekat mungkin dengan target yang ditentukan.
Tak terawasi (unsupervised). Pada kategori ini, penentuan bobot masing-masing neuron berdasarkan karakteritik masukan.
Arsitektur Jaringan JST dirancang dengan mengunakan suatu aturan yang bersifat menyeluruh dimana seluruh model jaringan memiliki konsep dasar yang sama. Arsitektur jaringan akan menentukan target yang akan dicapai karena tidak semua permasalahan dapat diselesaikan dengan arsitektur yang sama. Jaringan dengan lapisan tunggal, hanya memiliki satu lapisan dengan bobot terhubung, jaringan ini hanya menerima input kemudian secara langsung akan mengolahnya menjadi output tanpa harus melalui lapisan tersembunyi. Jaringan dengan banyak lapisan, memiliki satu atau lebih lapisan terembunyi yang terletak
diantara
lapisan
input
dan
lapisan
output
13
Metode Backpropagation Merupakan salah satu metode pelatihan dalam JST. Metode ini sangat baik dalam menangani masalah pengenalan pola-pola kompleks (Siang 2009). Algoritma perhitungan JST backpropagation terdiri atas dua langkah yaitu perambatan maju dan perambatan mundur. Kedua langkah ini dilakukan pada jaringan untuk setiap pola yang diberikan selama jaringan mengalami pelatihan. Cara kerja dari backpropagation adalah dengan menginisialisai jaringan dengan bobot yang diset dengan bilangan acak. Kemudian data pelatihan dimasukan kedalam jaringan. Data pelatihan tediri atas pasangan input dan output target. Keluaran dari jaringan berupa sebuah nilai output aktual. Selanjutnya nilai output aktual jaringan dibandingkan dengan nilai target untuk mengetahui apakah output jaringan sudah sesuai dengan output target. Error yang timbul akibat perbedaan antara nilai output dengan target tersebut kemudian dihitung dan digunakan untuk mengubah bobot-bobot yang relevan dengan jalan mempropagasikan kembali error. Setiap perubahan bobot diharapkan dapat mengurangi besar error. Siklus seperti ini dilakukan pada semua set pelatihan samapi unjuk kerja jaringan mencapai tingkat yang diinginkan atau sampai kondisi berhenti terpenuhi. Setelah proses pelatihan selesai, barulah diterapkan algoritma aplikasi. Dari respon jaringan dapat dinilai kemampuan memorisasi dan generalisasi jaringan dalam menebak output berdasarkan pada apa yang telah dipelajarinya selama ini.
Nilai Input
Lapisan input
Lapisan Hiden
Lapisan Output
Nilai output
Gambar 1 Arsitektur backpropagation banyak lapisan
15
Y1
Yk
Ym
W 1j
m1
11
W k1
W
10
W W m0
W
W
W k0
W mp mj
W kj
W kp W 1p
1
Z1
V j0
V 10
V j1
X1
Vj
V ji V1
i
pi
1
1
V p0
Zp
V
Vp
V 11
Zj
Xi
n
Vp
n
V 1n
Xn
Gambar 2 Arsitektur backpropagation banyak lapisan dengan bobot
Fungsi Aktivasi pada Backpropagation Dalam JST, fungsi aktivasi merupakan bagian penting dalam tahapan perhitungan keluaran suatu algoritma. Fungsi aktivasi harus memenuhi syarat : kontinu, terdiferensial dengan mudah dan merupakan fungsi yang tidak turun. Beberapa fungsi aktivasi yang sering dipakai adalah fungsi Sigmoid Biner dengan turunan dan
fungsi
Sigmoid
dengan nilai interval (0,1) Bipolar
dengan
turunan
dengan nilai interval (-1,1). Fungsi Identitas dipakai apabila kita menginginkan keluaran jaringan berupa sembarang bilangan riil, fungsinya adalah
.
Menurut Siang (2009), algoritma pelatihan untuk jaringan dengan satu layar tersembunyi (dengan fungsi aktivasi sigmoid biner) adalah sebagai berikut: Langkah 0 : inisialisasi semua bobot dengan bilangan acak kecil Langkah 1 : Jika kondisi penghentian belum terpenuhi,lakukan langkah 29 Langkah 2 : untuk setiap pasang data pelatihan, lakukan langkah 3-8
15
Fase 1 : Propagasi maju Langkah 3 : tiap unit masukan menerima sinyal dan meneruskannya ke unit tersembunyi diatasnya Langkah 4 : hitung semua keluaran di unit tersembunyi z j (j = 1,2,…p)
Langkah 5 :hitung semua keluaran di unit yk (k = 1, 2, …, m)
Fase II : Propagasi mundur Langkah 6 : hitung faktor
unit keluaran berdasarkan kesalahan disetiap unit keluaran
yk (k=1, 2, ..,m)
.
merupakan unit kesalahan yang akan dipakai dalam perubahan bobot layar dibawahnya (langkah 7). Hitung suku perubahan bobot bobot
(yang akan dipakai nanti untuk merubah
) dengan laju percepatan .
Langkah 7 : Hitung faktor
unit tersembunyi berdasarkan kesalahan di
setiap unit tersembunyi zj (j= 1, 2,…, p) Faktor
unit tersembunyi :
.
Hitung suku perubahan bobot vji (yang akan dipakai nanti untuk merubah ; j = 1, 2,…, p ; i = 0, 1, …,n
bobot vji)
Fase III : Perubahan bobot Langkah 8 : Hitung semua perubahan bobot Perubahan
bobot
Perubahan
bobot
garis
garis
yang
yang
menuju
menuju
ke
ke
unit
unit
keluaran
:
tersembunyi
:
16
DATA DAN METODE Data Data yang digunakan dalam penelitian ini adalah data sekunder yang merupakan bagian dari data penelitian Hibah Pascasarjana tahun 2003-2005 hasil kerjasama antara Departemen Statistika IPB dengan Pusat Studi Biofarmaka LPPM IPB. Penelitian tersebut didanai oleh Dirjen Pendidikan Tinggi, Departemen Pendidikan Nasional. Data yang digunakan adalah persen transmitan kurkumin dari serbuk temulawak hasil pengukuran spektrometer FTIR dan data konsentrasi senyawa aktif kurkumin yang diukur dengan menggunakan HPLC. Temulawak yang dijadikan contoh diambil dari beberapa daerah sentra tanaman obat, yaitu Bogor, Sukabumi, Kulon Progo, Karanganyar, Cianjur dan Balitro. Data-data tersebut diperoleh dari Pusat Studi Biofarmaka Institut pertanian Bogor.
Metode Penggunaan algoritma genetika dalam optimasi jaringan syaraf tiruan dilakukan untuk mendapatkan struktur neuron pada lapis tersembunyi yang mendekati optimal. Tingkat pengenalan JST dalam pendugaan yang tinggi akan didapat apabila seluruh neuron pada lapis tersembunyi memberikan nilai kontribusi objektif yang tinggi, dalam hal ini penulis akan menekankan nilai R2. Apabila neuron yang memberikan kontribusi R2 yang kecil dapat dihilangkan, sedangkan yang memberikan kontribusi R2 besar dapat dipertahankan, maka jaringan syaraf tiruan ini dapat diharapkan memberikan nilai R2 yang lebih tinggi. Penghilangan neuron yang kurang bermanfaat ini dapat dilakukan dengan dua cara, yaitu dengan membuang sejumlah bobot dari setiap neuron yang memberi kontribusi R2 kecil atau dengan membuang sejumlah neuron yang berarti membuang seluruh bobot dari neuron yang terhubung yang kurang bermanfaat (Apriyanti 2005). Pada penelitian ini digunakan pendekatan kedua yaitu membuang bobot dari neuron yang terhubung yang memberikan kontribusi R2 kecil. Pada proses AG pengkodean yang akan dipakai adalah string biner, dengan tiap bit dalam
string kromosom merepresentasikan sebuah neuron. Bit yang
18
bernilai 1 merepresentasikan neuron yang dipertahankan dan bit yang bernilai 0 merepresentasikan neuron yang dibuang. Penggunaan parameter seperti dijelaskan diatas diharapakan mencukupi bagi AG untuk melakukan pencarian solusi optimal bagi jumlah neuron lapis tersembunyi. Pada penelitian ini langkah pertama yang akan dikerjakan adalah melakukan prapemrosesan dengan PCA untuk mereduksi dimensi dari peubah bebas yang dalam hal ini adalah persen transmitan yang dihasilkan oleh FTIR. Pada prapemrosesan AKU pengambilan Komponen Utama dilakukan untuk berbagai keragaman kumulatif komponen tersebut menerangkan keragaman data asli. Data dari hasil prapemrosesan dibagi 2 bagian : bagian pertama terdiri dari beberapa pengamatan untuk pemodelan dalam tahap pelatihan (training) dan bagian kedua untuk testing. Pembagian data pengamatan ke dalam kelompok data training dan data testing dicobakan dalam berbagai komposisi yaitu 60%, 70% dan 80% pada data training. Selanjutnya, JST dengan algoritma backpropagation memproses hubungan
digunakan untuk
antara peubah-peubah baru hasil PCA dengan respon.
Dilakukan pendugaan terhadap nilai target (HPLC). Pendugaan untuk memperoleh nilai dugaan mendekati nilai target dilakukan dengan cara menyesuaikan bobot pada masing-masing neuron. Spesifikasi JST yang digunakan : Arsitektur yang digunakan adalah Feed Forward Neural Network (FFNN) banyak lapisan, dalam hal ini neuron-neuron disusun dalam lapisan-lapisan dan sinyal-sinyal mengalir dari input ke lapisan pertama, kemudian ke layer kedua, dan seterusnya. Masukan merupakan hasil prapemrosesan AKU. Pada JST dua lapis, pengkodean string biner sepanjang 16 bit diambil dari jumlah neuron maksimum lapisan tersembunyi. Hal ini berdasarkan penelitian Kusumoputro (2004). Lapisan keluaran menggunakan satu neuron sesuai dengan target, yaitu setiap observasi terhubung dengan satu nilai target (HPLC).
19
Algoritma pembelajaran yang digunakan adalah Backpropagation dengan fungsi transfer/aktivasi untuk lapis tersembunyi adalah sigmoid biner (logsig) dan fungsi transfer linear untuk lapis keluaran. Teknik inisialisasi yang digunakan adalah inisialisasi Nguyen-Widrow. Algoritma ini memberikan bobot awal pada neuron dengan nilai antara -0,5 sampai 0,5, sedangkan bobot-bobot dari masukan ke lapis tersembunyi dirancang sedemikian rupa sehingga mempercepat proses pembelajaran (Fauset 1994). Inisialisasi Nguyen-Widrow didefinisikan sebagai persamaan berikut:
Hitung harga faktor pengali
0.7 p
1
n
dengan p banyaknya
jumlah neuron lapisan tersembunyi dan n banyaknya neuron pada lapisan input.
Untuk setiap unit tersembunyi (j=1, 2, ... ,p), dihitung vij (lama) yaitu bilangan acak diantara -0.5 dan 0.5 (atau di antara - dan + ). Pembaharuan bobot vij (lama) menjadi vij baru yaitu: vij (baru )
vij (lama) vij (lama)
Tetapkan Bias, voj = Bobot pada bias bernilai antara - dan .
Respon yang diambil dalam penelitian ini adalah nilai R2 yang dicapai oleh JST setelah dilakukan optimasi oleh algoritma genetika berdasarkan presentase data training, persentase keragaman AKU yang digunakan dan nilai pembelajaran. Sedang fungsi fitness yang dipakai adalah memaksimumkan nilai R2. Dalam penggunaan data training dan data testing dievaluasi dengan mencari Root Mean Square Error (RMSE) yang didefenisikan dengan :
RMSE
1 N cal
Ncal
yˆ cal,n
ycal,n
2
n 1
dimana: ycal,n
= nilai pengamatan berdasarkan n sampel kalibrasi.
yˆ cal,n
= nilai dugaan pengamatan dengan menghilangkan sebanyak n sampel dari sekumpulan N sampel kalibrasi.
np
=
banyak
sampel
yang
digunakan
dalam
model
validasi.
20
Diagram alur penelitian adalah sebagai berikut : Data
Pemilihan/Pengelompokan Data
Reduksi Data dengan PCA
Proses JST
Testing dengan JST Tanpa AG
Hasil Testing JST Standar
Analisis R2 dan RMSE JST
Proses optimasi JST dengan GA
Testing dengan JST Optimasi
Hasil Testing JST Optimasi
Analisis R2 dan RMSE JST
Gambar 3 Diagram Alur Penelitian
HASIL DAN PEMBAHASAN Deskripsi Spektrum Kurkumin Spektrum kurkumin diambil dari 20 sampel serbuk temulawak yang berasal dari berbagai daerah sentra tanaman obat dapat dilihat pada Gambar 4. Berdasarkan Gambar 4 spektrum kurkumin dari berbagai daerah tersebut sebagian besar memiliki pola yang hampir sama kecuali untuk beberapa spektrum yang menunjukkan pola yang agak berbeda. Terlihat bahwa spektrum kurkumin dari sampel serbuk temulawak yang diambil dari daerah Cianjur (sampel C2) dan Bogor (sampel B2) agak berbeda. Data persen transmitan diperoleh dari pengukuran dengan menggunakan FTIR pada 1866 bilangan gelombang yang berkisar antara 4000 – 400 cm-1. Pada indeks bilangan gelombang disekitar 1500 cm-1 ketika spektrum kurkumin serbuk temulawak dari sebagain besar sampel memiliki pola grafik yang cekung ke atas, tetapi temulawak yang diambil dari daerah Cianjur menujukkan pola grafik yang cekung kebawah. Tampak juga bahwa spektrum kurkumin serbuk temulawak yang diambil dari daerah Bogor (sampel B2) menunjukkan pola yang cenderung konstan di setiap bilangan gelombang.
Gambar 4 Spektra kurkumin serbuk temulawak
22
Reduksi Peubah Penjelas Data persen transmitan diukur pada 1866 bilangan gelombang yang dalam pemodelan kalibrasi ini berperan sebagai peubah penjelas. Ada beberapa alasan utama mengapa reduksi jumlah peubah penjelas ini dilakukan. Pertama, besar kemungkinan antara peubah penjelas satu dengan lainnya tidak saling bebas. Kedua, bekerja dengan sedikit peubah penjelas akan menyederhanakan proses komputasi. Analisis Komponen Utama (AKU) digunakan untuk mereduksi banyaknya peubah penjelas dengan persentase keragaman kumulatif yang mampu dijelaskan digunakan sebagai kriteria untuk menentukan banyaknya komponen utama. Tabel 4 menjelaskan bahwa pada bilangan gelombang 4000–400 cm-1 dengan menggunakan 1 komponen utama, keragaman yang dapat dijelaskan sebesar 89,7592% dan apabila menggunakan 2 komponen utama keragaman yang dapat dijelaskan sebesar 95,1612% sedangkan apabila menggunakan 3 komponen utama keragaman yang dapat dijelaskan sebesar 99,2061% dari keragaman pada data asal. Tabel 4 Ragam kumulatif komponen utama Komponen Utama 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Ragam yang dijelaskan (%) 89,75924 5,401949 4,044904 0,544743 0,104654 0,062432 0,030868 0,030398 0,009928 0,003334 0,002995 0,001876 0,001062 0,000704 0,000374 0,000181 0,000169 0,000118
Ragam Kumulatif (%) 89,7592 95,1612 99,2061 99,7508 99,8555 99,9179 99,9488 99,9792 99,9891 99,9924 99,9954 99,9973 99,9984 99,9991 99,9995 99,9996 99,9998 99,9999
23
Nilai Dugaan Terhadap Nilai HPLC Pemodelan menggunakan JST dengan optimasi AG dilakukan dalam berbagai kelompok data. Pada percobaan JST dengan optimasi AG, kelompok data dengan jumlah data training sebanyak 80% dan komponen utama yang digunakan sebagai input pada jaringan menjelaskan 99,8555% data asal, diperoleh model terbaik dengan nilai rata-rata RMSEtraining 0,0314 dan nilai RMSEtesting 0,5225, dengan nilai rata-rata R2 yang diperoleh 49,93%. Gambar 5 dan Gambar 6 merupakan histogram frekuensi rata-rata RMSE yang diperoleh pada kelompok 80% data training dan data testing.
Gambar 5 Histogram frekuensi rata-rata nilai RMSE pada data training
24
Gambar 6 Histogram frekuensi rata-rata nilai RMSE pada data testing
Percobaan dilakukan dengan mengamati pembagian kelompok data menurut data training dan data testing lainnya. Pada kelompok data training 70%, diperoleh nilai RMSEtraining 0,0297 dan RMSEP 0,5556, nilai R2 yang diperoleh adalah 0,3964 (39,644%). Demikian juga dengan menggunakan kelompok data pada data training
60% diperoleh rata-rata nilai RMSEtraining
sebesar 0,0326 dan RMSEP 0,5844, dengan nilai R2 yang diperoleh sebesar 0,2789 (27,89%). Pembagian kelompok data menjadi data training relatif berpengaruh terhadap pencapaian R2, sesuai dengan penelitian Apriyanti (2005) yang menyimpulkan bahwa pembagian data menjadi data training dan testing cukup berpengaruh terhadap peningkatan nilai R2. Peneliti sebelumnya yang dilakukan oleh Mukid (2009) menghasilkan nilai RMSEP terbaik untuk berbagai jenis fungsi peragam dengan menggunakan seluruh gugus data adalah 0,5913. Tabel 5 merupakan tabel perbandingan nilai rata-rata RMSE yang diperoleh sesuai dengan pengelompokan data. Tabel 5 Perbandingan rata-rata RMSE dengan AKU-JST-AG Kelompok Data 1 (60% data training) 2 (70% data training) 3 (80% data training)
RMSEtraining RMSEtesting 0,0326 0,5844 0,0297 0,5556 0,0304 0,5225
R2 0,2789 0,3964 0,4993
25
Algoritma genetika sangat baik dilakukan untuk memperoleh struktur jaringan yang baik dengan nilai RMSEtesting minimum Jika dibandingkan dengan jaringan tanpa menggunakan AG, hasil yang diperoleh JST optimasi AG relatif lebih baik. Pada kelompok data training 80%, dilakukan percobaan AKU-JST tanpa menggunakan AG, diperoleh rata-rata nilai RMSEtraining 0,0282 dan RMSEtesting 0,6117 dengan rata-rata R2 sebesar 0,4064. Hasil ini tidak lebih baik dibanding dengan program AKU-JST dengan menggunakan AG. Tabel 6 merupakan tabel perbandingan nilai rata-rata RMSE yang diperoleh sesuai pengelompokan data tanpa menggunakan AG.
Tabel 6 Perbandingan rata-rata RMSE dengan GA-JST tanpa AG Kelompok Data 1 (60% data training) 2 (70% data training) 3 (80% data training)
RMSEtraining RMSEtesting 0,0304 0,7698 0,0282 0,6198 0,0282 0,6117
R2 0,1867 0,2860 0,4065
Gambar 7 dan gambar 8 merupakan plot perbandingan nilai R2 dan RMSEP sesuai pengelompokan data untuk jaringan menggunakan optimasi AG dan tanpa menggunakan AG.
Gambar 7 Perbandingan nilai rata-rata R2 dengan AKU-JST-AG dan AKU-JST
26
Gambar 8 Perbandingan nilai RMSEtesting metode AKU-JST-AG dan AKU-JST Sebaran jumlah neuron lapis tersembunyi metode AKU-JST-AG yang menghasilkan rata-rata RMSEtesting minimum untuk melihat kecenderungan jumlah neuron yang memberikan hasil dugaan paling mendekati nilai target diperlihatkan pada Gambar 8. Secara umum metode AKU-JST-AG lapis banyak rata-rata menghasilkan delapan neuron pada lapis tersembunyi dalam arsitektur JST yang menghasilkan rata-rata RMSEtesting paling minimum.
Gambar 9 Sebaran jumlah neuron lapis tersembunyi Pemilihan n-komponen utama pertama yang dijadikan input pada jaringan memberikan hasil yang berbeda. Tabel berikut menyajikan sebelas model yang
27
disusun dengan mencobakan setiap komponen utama pada sebagai input pada model. Tabel 7 Nilai RMSEtesting dan R2 berdasarkan jumlah KU Model ke-i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
n-peubah 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
RMSEtesting 0,7392 0,5440 0,5162 0,5225 0,6246 0,6003 0,5944 0,5538 0,5515 0,5495 0,5260 0,6046 0,5459 0,5754 0,6209 0,5715 0,7560
R2 0,3342 0,4672 0,4651 0,4994 0,4226 0,3687 0,4873 0,3979 0,4223 0,4519 0,4276 0,4367 0,4941 0,4149 0,3878 0,4216 0,3684
Tabel 7 memperlihatkan bahwa model ketiga dan keempat adalah model yang baik. Model keempat memberikan nilai R2 yang lebih tinggi dengan RMSEtesting 0,5225 yang memberikan sumber keragaman terbesar dengan kumulatif keragaman sebesar 99,8555%.
28
29
SIMPULAN DAN SARAN Simpulan
Algoritma Genetika dapat digunakan untuk mengoptimalkan kerja JST, dalam hal ini dilakukan pada struktur neuron pada lapis tersembunyi untuk memperoleh model terbaik yang diukur dengan nilai RMSE yang diperoleh. Pembagian kelompok data menjadi data training dan data testing memberikan hasil yang relatif berbeda.
Saran Penelitian ini menggunakan metode AKU-JST-AG dengan harapan untuk mendapatkan pemodelan kalibrasi terbaik. Banyak metode lain yang perlu untuk dikembangkan lagi sehingga diperoleh pemodelan kalibrasi terbaik. Pemilihan prapemrosesan lain untuk mereduksi dimensi data yang besar sangat diperlukan untuk mendapatkan pendugaan yang terbaik. AG perlu dipertimbangkan dalam pemilihan komponen utama yang paling berpengaruh sebelum dilakukan pendugaan oleh JST.
30
DAFTAR PUSTAKA
Apriyanti N. 2005. Optimasi Jaringan Syaraf Tiruan Dengan Algoritma Genetika Untuk Peramalan Curah Hujan [Skripsi]. Bogor : Program Sarjana Institut Pertanian Bogor. Arnita. 2005. Koreksi Pencaran dalam Model Kalibrasi Peubah Ganda pada Data Senyawa Aktif Gingerol Serbuk Rimpang Jahe (Zingiber Officinale Roscue) [Tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Atok. 2005. Jaringan Syaraf Tiruan Untuk Pemodelan Kalibrasi Dengan Prapemrosesan Analisis Komponen Utama dan Transformasi Fourier Diskret [Tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Erfiani. 2005. Pengembangan Model Kalibrasi dengan Pendekatan Bayes (Kasus Tanaman Obat) [Disertasi]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Fauset L 1994. Fundamentals of Neural Networks. Prentice Hall, New Jersy. Habibi-Yangjeh A, Pourbasheer E, Danandeh-Jenagharad M. 2009. Application of Principal Component-Genetic Algorithm-Atificial Neural Network for Prediction Acidity Constant of Various Nitrogen-Containing Compounds in Water. Monatsh Chem. Harbone JB. 1996. Metode Fitokimia ”Penuntun Cara Modern Menganalisis Tumbuhan”. Terbitan Kedua. Penerbit ITB. Bandung. Kusumoputro B. 2004. Pengembangan Sistem Pengenalan Wajah Secara 3 Dimensi Menggunakan Hemisphere Structure of Neural Networks dan Optimasi Struktur Menggunakan Algoritma Genetika. Makalah Seminar Nasional dan Ilmu Komputer dan Teknologi Informasi V. Fakultas Ilmu Komputer UI. Depok Naes T, Issackson T, Fearn T, Davies T. 2002. User Friendly Guide to Multivariate Calibration and Classification. United Kingdom: NIR Publication Chichester. Nur MA, Adijuwana H. 1989. Teknik Spektroskopi dalam Analisis Biologi. Bogor: Institut Pertanian Bogor. Santi VM. 2010. Model Kalibrasi Spektroskopi Dengan Preprocessing Genetich Algorithm (GA) (Studi Kasus : Tanaman Obat Temulawak) [Tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Siang JJ. 2009. Jaringan Syaraf Tiruan dan Pemrogramannya menggunakan Matlab.PenerbitAndi.Yogyakarta.
32
Sinambela JM. 1985. Fitoterapi, Fitostandar dan Temulawak. Prosiding Simposium Nasional temulawak. Bandung, 17 September 1985. Lembaga Penelitian Universitas Padjajaran. Socrates G. 1994. Infrared Characteristic Group Frequencies Tables and Charts. New York: John Wiley and Sons. Sunaryo S. 2005. Model Kalibrasi dengan Transformasi Wavelet Sebagai Metode Pra-Pemrosesan [Disertasi]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Suyanto. 2005. Algoritma Genetika dalam Matlab. Penerbit Andi. Yogyakarta.
LAMPIRAN
% PROGRAM ANALISIS KOMPONEN UTAMA-JARINGAN SYARAF TIRUAN-ALGORITMA GENETIKA
clear all global net global data global tg_awal global satu global dua prosentase=.80; % prosentase data yang dipakai utk training (prosentase*100%)
% baca data [xx,head]=xlsread('FTIR+HPLC-TEMULAWAK-serbuk.xlsx','FTIR'); tr_awal=xx(:,2:end); [Rtr,Qtr]=size(tr_awal); [yy,head]=xlsread('FTIR+HPLC-TEMULAWAK-serbuk.xlsx','HPLC'); tgn_awal=yy(:,1)'; [Rtg,Qtg]=size(tg_awal); hh=char(head(2:end,3)); satu=1:prosentase*Qtr; dua=prosentase*Qtr+1:Qtr;
% pengacakan data p = randperm(Qtr); trn_awal=tr_awal(:,p); tg_awal=tgn_awal(p); h=hh(p,:); data_norm=detrend(trn_awal');
% proses PCA [pcs,dataBaru,ragam,t2] = princomp(zscore(data_norm)); persen=ragam*100/sum(ragam);
% Keragaman yang diambil dari PCA ragamAmbil=99.99; jmlRagam=0; i=0; while jmlRagam < ragamAmbil i=i+1; jmlRagam=jmlRagam+persen(i); end hitung=1:i; data=(dataBaru(:,hitung))';
34
% Inisialisasi ANN Ranges=minmax(data); Arch=[16 1]; ActFunc={'logsig','purelin'}; net=newff(Ranges, Arch, ActFunc, 'trainrp'); net.trainParam.show = 500; net.trainParam.lr = 0.5; net.trainParam.epochs = 500; net.trainParam.goal = 1e-3 ; net.trainParam.min_grad=1e-009;
%simpan nilai LW tempLW = net.LW{2,1};
% Inisialisasi GA [initPop,tempLW] = gainit(tempLW,8,[0 65535],'fits',[],[1 0]);
% Proses GA [x endPop bpop trace] = ga([0 65535],'fits',[],initPop,[1 0 1],'maxGenTerm',10,... 'roulette',[0.08],['simpleXover'],[0.6],'binaryMutation',[0.0333]); fprintf('konfigurasi neuron terbaik: ') hasil = DecToBin(x,16)
%Mencoba menerapkan hasil yang terbaik net.LW{2,1} = tempLW * (diag(hasil));
% Penentuan input ANN test.P = data(:,dua); test.T = tg_awal(dua); pcTrain = data(:,satu); yTrain = tg_awal(satu);
% Proses ANN [net,tr]=train(net,pcTrain,yTrain,[],[],[],test); yTgt = sim(net,data);
%Evaluasi output jaringan (data testing dengan target) [m2,b2,r2] = postreg_edit(yTgt(dua),test.T); R_sq2=(r2)^2; %R-square petunjuk buat korelasi antara y prediksi dan y aktual RMS_Error2=sqrt(mean((test.T - yTgt(dua)).^2)); %Error y prediksi dan y aktual valid = (r2)+(1/(RMS_Error2+0.001)); RMS_E1=sqrt(mean((yTrain - yTgt(satu)).^2)) R1=corr2(yTgt(satu),yTrain) fprintf('Korelasi (R): ') R=corr2(yTgt(dua),test.T)
fprintf('RMSE: ') RMSE=RMS_Error2 fprintf('Nilai Prediksi (Training): ') Pred=yTgt(satu) fprintf('Nilai Prediksi (Pred): ') Pred=yTgt(dua) figure plot(1:length(yTrain),yTrain,'-or',1:length(yTrain),yTgt(satu),':sb') title(['Hasil Training (RMSE: ',num2str(RMS_E1),', R: ',num2str(R1),')']) legend('aktual','model') set(gca,'xtick',1:length(yTrain),'xticklabel',{h(satu,1:3)}) figure plot(1:length(test.T),test.T,'-or',1:length(test.T),yTgt(dua),':sb') title(['Hasil Estimasi (RMSE: ',num2str(RMSE),', R: ',num2str(R),')']) legend('aktual','estimasi') set(gca,'xtick',1:length(yTrain),'xticklabel',{h(dua,1:3)})
% Program ini diambil dari karya tulis Apriyanti (2005) atas seijin penulis dan diperbaharui seperlunya sesuai dengan tujuan penelitian
65