PENGEMBANGAN MODEL KALIBRASI DENGAN PENDEKATAN BAYES (Kasus Tanaman Obat)
ERFIANI
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2005
PERNYATAAN MENGENAI DISERTASI DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa disertasi Pengembangan Model Kalibrasi dengan Pendekatan Bayes (Kasus Tanaman Obat) adalah karya sendiri dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yag diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir disertasi ini. Bogor, Oktober 2005
Erfiani G326010011
ABSTRAK Erfiani.
PENGEMBANGAN
MODEL
KALIBRASI
DENGAN
PENDEKATAN BAYES (KASUS TANAMAN OBAT). Dibawah bimbingan Khairil Anwar Notodiputro sebagai ketua, Ahmad Ansori Mattjik, dan Latifah K. Darusman sebagai anggota. Tanaman obat banyak digunakan di Indonesia, baik dalam bentuk segar atau bentuk olahan sebagai obat tradisional seperti jamu. Produk obat tradisional agar diterima oleh masyarakat dan indusrti harus memiliki jaminan kualitas. Oleh karena itu salah satu hal penting yang harus dilakukan adalah melakukan standarisasi senyawa aktif. Secara kualitatif dan kuantitatif suatu senyawa aktif dapat diketahui antara lain melalui metode HPLC (High Performance Liquid Chromatography). Pengukuran menggunakan HPLC menghasilkan keluaran konsentrasi senyawa aktif, proses ini memerlukan biaya dan waktu yang cukup besar. Metode kualitatif lain yang juga sering digunakan adalah spektroskopi FTIR (Fourier Transform Infrared). Pengukuran menggunakan FTIR akan menghasilkan pola kromatogram yang tertentu tergantung responnya, proses ini memerlukan biaya dan waktu yang tidak terlalu besar.
Penentuan kandungan senyawa aktif tanaman obat perlu
dilakukan secara cepat dan akurat. Salah satu pemecahan yang dapat dilakukan adalah mengembangkan model kalibrasi yang menggambarkan hubungan antara konsentrasi senyawa aktif yang dihasilkan oleh HPLC dengan keluaran FTIR. Model ini akan mempercepat waktu proses dan menekan biaya. Pada tahapan analisis penyusunan model kalibrasi seringkali ditemukan permasalahan dimensi data yang besar. Sehingga pada tahap awal diperlukan tahapan pereduksian data. Pendekatan regresi terpenggal merupakan pendekatan yang baik digunakan untuk mereduksi jumlah titik transmitan yang dihasilkan FTIR. Pendekatan ini memiliki sifat (1) Pereduksian data dilakukan dengan tidak menghilangkan pola sebaran data (2) Menanggulangi permasalahan dimensi data yang besar, dan (3) Pengukuran kebaikan hasil menggunakan acuan yang pasti.
Model kalibrasi adalah fungsi yang menghubungkan antara persen transmitan (X) dan konsentrasi senyawa aktif (y). Model kalibrasi lebih baik bila menggunakan spektrum dengan banyak puncak, sehingga disebut model kalibrasi ganda. Model ini merupakan fungsi matematik untuk menduga y yang tidak diketahui menggunakan informasi dari X (Martens & Naes 1989). Pada model kalibrasi ganda ditemukan permasalahan kekolinearan ganda antara peubah bebas (X) serta jumlah pengamatan (n) yang jauh lebih kecil dibandingkan jumlah peubah bebas (p). Pendekatan Bayes dengan penambahan informasi tentang prior dapat mengatasi permasalahan ini. Model kalibrasi menggunakan pendekatan Bayes berhirarki memiliki sifat statistik yang robust.
Model kalibrasi Gingerol dan Kurkumin dengan
pendekatan ini memberikan hasil besaran RMSEP yang lebih kecil dibandingkan dengan pendekatan lain. Model Bayes Gingerol dengan memasukkan peubah umur simpan dan menggunakan pendekatan regresi terpenggal menghasilkan RMSEP sebesar 0.0622. Model ini memberikan hasil besaran RMSEP jauh lebih kecil dibandingkan Principal Component Regression (PCR) dengan menggunakan koreksi pencaran pada tahap pre-processing.
Model Bayes Kurkumin
menggunakan pendekatan regresi terpenggal menghasilkan RMSEP sebesar 0.107. Key word : HPLC, FTIR, Model Kalibasi, Regresi terpenggal, Pendekatan Bayes.
ABSTRACT Erfiani.
IMPROVEMENT CALIBRATION MODELS WITH BAYESIAN
APPROACH (CASES MEDICINAL PLANTS). Advisory committee Khairil Anwar Notodiputro, Ahmad Ansori Mattjik, and Latifah K. Darusman as a co-promotor. Medicinal plants have been used commonly in Indonesia, either as raw material or as traditional medicine product e.g “jamu”’ standardized extracts and phytopharmaca. To ensure the quality of medicinal plants product to be accepted by community and industry, the standardization of active or market compound is one of important things to be searched and determined. The active material can be termine qualitatively and quantitatively by HPLC (High Performance Liquid Chromatography). This process produce concentrate of active material and need more time and costly. The other qualitative methods is using by FTIR (Fourier Transform Infra Red). This process produce chromatogram which depend on respons , fastly and cheaper. The contents of active material in medicine herbs need to be determine accurately and faster. To overcome these problem, accurate and cheaper methods are needed. One of the method is calibration model development which shows the relationship between concentration of active material resulted by HPLC and that by FTIR. This model will decrease processing time and cost. Building calibrations models usually face due to large dimension problem. In the first step needed data reduction. Segmented regression approach is one of method which can be handle this problem. Segmented regression approach is good for reduction percent transmitan resulted by FTIR. This approach has attributes (1) Consist of spread data (2) Solving problem large dimension data (3) Having exact criteria. Calibrations
models
are
function
between
absorbance
(X)
and
concentration of active material. These models are better use multi peak spectrum than ones, its calls multivariate calibrations models. Multivariate calibration models are mathematical function to predict unknown y by X information (Martens & Naes 1989). These models usually face due to collinearity among
independent variables (X) and the number of observations (n) is much less than the number of independent variables (p). Bayesian approaches which add prior information can be utilized to overcome these problems. Calibration Models using hierarchical Bayes approach statistics.
have robust
These Models for Gingerol and Kurkumin have smaller RMSEP than
others models. Bayes model for Gingerol by using storage time and Segmented Regression for 20 sample produce RMSEP 0.0622.
This slightly improves
RMSEP produced by PCR using scatter correction as its pre-processing methods. Bayes model for Kurkumin by using Segmented Regression for 40 sample produce RMSEP 0.107 Key word : HPLC, FTIR, Calibration Model, Segmented regressin,Bayesian approach.
Hak cipta milik Erfiani, tahun 2005 Hak cipta dilindungi Dilarang mengutip dan memperbanyak tanpa izin tertulis dari Institut Pertanian Bogor, sebagian atau seluruhnya dalam Bentuk apa pun, baik cetak, fotokopi, mikrofilm, dan sebagainya
PENGEMBANGAN MODEL KALIBRASI DENGAN PENDEKATAN BAYES (Kasus Tanaman Obat)
OLEH : ERFIANI
Disertasi sebagai salah satu syarat untuk memperoleh gelar Doktor pada Departemen Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2005
Judul Disertasi
: Pengembangan Model Kalibrasi dengan Pendekatan Bayes (Kasus Tanaman Obat)
Nama Mahasiswa
: Erfiani
Nomor Pokok
: G326010011
Disetujui Komisi Pembimbing
Dr. Ir. Khairil Anwar Notodiputro, MS Ketua
Prof. Dr. Ir. Ahmad Ansori Mattjik Anggota
Prof. Dr. Ir. Latifah K. Darusman Anggota Diketahui
Ketua Program Studi Statistika
Dekan Sekolah Pascasarjana
Dr. Ir. Budi Susetyo, MS
Prof. Dr. Ir. Syafrida Manuwoto, M.Sc
Tanggal Ujian : 24 Oktober 2005
Tanggal Lulus :
PRAKATA
Alhamdulillah, puji syukur yang sangat dalam penulis sampaikan kepada Illahi Rabbi, atas segala nikmat, rahmat, karunia, pertolongan, dan ridhoNYA yang tidak terhingga yang telah dilimpahkan kepada penulis sehingga penelitian dan penulisan disertasi ini dapat diselesaikan. Disertasi ini yang berjudul ”PENGEMBANGAN MODEL KALIBRASI DENGAN PENDEKATAN BAYES (KASUS TANAMAN OBAT)” disusun berdasarkan penelitian yang dilakukan di Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam FMIPA-IPB. Penelitian yang dilakukan penulis merupakan bagian dari payung penelitian Hibah Pasca 2003-2005, yang merupakan kerjasama antara Departemen Statistika dan Biofarmaka, Institut Pertanian Bogor. Payung penelitian tersebut saat ini memasuki tahun ke-tiga, peneliti mengikuti kegiatan penelitian tersebut sejak awal, dan diperkirakan selesai pada semester akhir tahun 2005. Dengan segala keterbatasan yang ada pada penulis, penulis menyadari masih banyak kekurangan dalam penyusunan disertasi ini.
Penulis sangat
mengharapkan masukan-masukan guna penyempurnaan dan perbaikan tulisan ini.
Bogor, Oktober 2005
Penulis
RIWAYAT HIDUP
Penulis dilahirkan di Tulungagung, Jawa Timur pada tanggal 6 Juni 1966 . Pendidikan Sarjana ditempuh di Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor, pada tahun 1989. Pada tahun 1996 penulis memperoleh gelar Magister Sains dari program studi yang sama. Pada tahun 2001 penulis mendapat kesempatan untuk mengikuti program doktor pada Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Beasiswa pendidikan pascasarjana diperoleh dari Direktorat Jendral Pendidikan Tinggi Departemen Pendidikan Nasional.
DAFTAR ISI Halaman DAFTAR TABEL
xv
DAFTAR GAMBAR
xvii
BAB I
PENDAHULUAN UMUM
A B C
Latar Belakang …………………………………………………... 1 Tujuan Penelitian ………………………………………………... 4 Sistematika Disertasi …………………………………………..... 4
BAB II
TINJAUAN PUSTAKA
A B C
Teknik Spektroskopi …………………………………………...... Fourier Transform Infrared (FTIR) …………………………...... High Performance Liquid Chromatography (HPLC) …………… Kandungan Senyawa aktif pada Jahe ............................................ Kandungan Senyawa aktif pada Temulawak ................................. Pentingnya Penentuan Konsentrasi Senyawa Aktif Tanaman Obat ……………………………………………………………… Model Dasar Kalibrasi ………………………………………...… Pendekatan Bayes …………………………………………..…… Keunggulan Pendekatan Bayes ……………………………..…… Monte Carlo Markov Chain (MCMC) ...........................................
D E F G H I J BAB III
PEMAMPATAN DATA KELUARAN Fourier Transform Infrared (FTIR) MENGGUNAKAN PENDEKATAN REGRESI TERPENGGAL (Segmented Regression)
A B C D E F
Pendahuluan ……………………………………………………. Sumber Data ……………………………………………………. Regresi Terpenggal (Segmented Regression) ............................... Pendekatan Regresi Terpenggal untuk Pereduksian Data Keluaran FTIR ............................................................................. Studi Kasus Penerapan Pendekatan Regresi Terpenggal ............. Simpulan ......................................................................................
BAB IV
KAJIAN SIMULASI: PENDEKATAN BAYES PADA DATA
8 8 9 11 12
12 14 16 17 17
19 20 21 22 24 26
n<
D E
F
Pendahuluan ……………………………………………………. Tujuan ………………………………………………………….. Tinjauan Pustaka ……………………………………………….. Metode Simulasi ........................................................................... WinBUGS .................................................................................... Kriteria Kebaikan Model .............................................................. Bahan dan Metode ……………………………………………… Tahapan Simulasi Data ………………………………………… Tahapan Penyusunan Model Kalibrasi ……………………….… Hasil dan Pembahasan ………………………………………….. Pendekatan Bayes dengan Model I .............................................. Pendekatan Bayes dengan Model II ............................................. Pendekatan Bayes dengan Model III ............................................ Pendekatan Bayes dengan Model IV ........................................... Pendekatan Bayes dengan Model V, VI dan VII ......................... Simpulan ......................................................................................
BAB V
SIFAT-SIFAT STATISTIK DARI DUGAAN MODEL KALIBRASI DENGAN PENDEKATAN BAYES
A B C D E F
Pendahuluan ................................................................................. Model Linier Umum Pendekatan Bayes ...................................... Model Kalibrasi dengan Model Normal Pendekatan Bayes ........ Model Linier Umum Pendekatan Bayes Berhirarki ..................... Kuadrat Tengah Galat Penduga Bayes ......................................... Simpulan ......................................................................................
BAB VI
MODEL KALIBRASI GINGEROL DAN KURKUMIN DENGAN MENGGUNAKAN PENDEKATAN BAYES (Studi Kasus Tanaman Temulawak dan Jahe di Daerah Karanganyar, Kulonprogo, Majalengka dan Bogor)
A B C
Pendahuluan ................................................................................. Tujuan ………………………………………………………….. Tinjauan Pustaka ……………………………………………….. Validasi Model …………………………………………………. Analisis Kesejajaran dengan Pendekatan Uji Ragam .................. Bahan dan Metode ……………………………………………… Hasil dan Pembahasan ………………………………………….. Eksplorasi Data Gingerol ………………………………………. Model Kalibrasi Gingerol ……………………………………… Eksplorasi Data Kurkumin ……………………………………... Model Kalibrasi Kurkumin …………………………………….. Simpulan ......................................................................................
D E
F
27 27 28 28 28 28 29 30 32 33 34 36 38 39 40 44
46 46 48 51 53 55
56 56 57 57 58 59 65 65 68 76 77 82
BAB VII PEMBAHASAN UMUM ………………………………………
84
BAB VIII SIMPULAN UMUM …………………………………………...
89
LAMPIRAN …………………………………………....
.............. 91
DAFTAR PUSTAKA .................................................................. 110
DAFTAR TABEL
Halaman 1 Daerah identifikasi spektra IR Gingerol ............................................
9
2 Daerah identifikasi spektra IR Kurkumin .........................................
9
3 Jumlah titik hasil reduksi ...................................................................
25
4 Kombinasi n dan p yang dicobakan ………………………………..
29
5 Struktur data simulasi ........................................................................
31
6 Transformasi data Y dan X ………………………………………...
32
7 Nilai korelasi antar peubah bebas, n=50, p=100, E(r)=0.1 ...............
34
8 Nilai JKG dan RMSE pada berbagai besaran n dan p dengan penentuan nilai awal sembarang .......................................................
40
9 Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan Model V dengan besaran nilai awal mendekati nilai parameter …...
41
10 Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan Model V dengan berbagai sebaran prior ……………………………
42
11 Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan Model VI dengan berbagai sebaran prior …………………………..
42
12 Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan Model VII dengan berbagai sebaran prior ………………………….
42
13 Nilai JKG dan RMSE pada Berbagai Besaran n dan p menggunakan Model VI dan VII …………………………………………………..
43
14 Jumlah pengamatan rimpang Jahe dan rimpang Temulawak ………
61
15 Matriks data persentase transmitan keluaran FTIR ...........................
62
16 Struktur data konsentrasi Gingerol .....................................................
62
17 Rataan dan ragam selisih persentase transmitan Gingerol antar ulangan dalam setiap petani ……………… ………………………..
66
18 F-hit kesejajaran spektrum Gingerol antar petani dalam daerah yang sama ..........................................................................................
66
19 F-hit kesejajaran spektrum Gingerol antar daerah ............................
67
20 Konsentrasi Gingerol 20 pengamatan ...............................................
68
21 Jumlah titik persentase transmitan Gingerol hasil reduksi menggunakan pendekatan Regresi Terpenggal …………………….
70
22 R2, JKG dan RMSEP model D8, D8k, D8w dan D8kw ………………
72
23 R2, JKG dan RMSE penyusunan model Kalibrasi Gingerol ……….
73
24 Nilai dugaan konsentrasi Gingerol (y-duga) pada validasi model ...
73
25 Rataan dan ragam selisih persentase transmitan Kurkumin antar contoh dalam setiap petani ................................................................
76
26 F-hitung kesejajaran spektrum Kurkumin antar petani dalam daerah yang sama …………………………………………………………..
77
27 F-hitung kesejajaran spektrum Kurkumin antar daerah ....................
77
28 Konsentrasi Kurkumin 16 pengamatan contoh berbagai daerah ......
78
29 Konsentrasi Kurkumin 24 pengamatan hasil percobaan ...................
78
30 Jumlah titik persentase transmitan Kurkumin hasil reduksi menggunakan pendekatan Regresi Terpenggal …………………….
79
31 R2, JKG dan RMSE penyusunan model Kalibrasi Kurkumin ...........
80
32 Nilai dugaan konsentrasi Kurkumin (y-duga) pada validasi model
81
DAFTAR GAMBAR
Halaman 1 Alur metode penyusunan model .………………………………….
3
2 Alur kegiatan penelitian …………………………………………...
6
3 Skema keterkaitan hubungan antara topik dalam disertasi ..............
7
4 Struktur gingerol pada Jahe .............................................................
11
5 Struktur kurkuminoid pada Temulawak ..........................................
12
6 Ilustrasi Regresi Terpenggal dengan dua buah sekatan ...................
21
7 Pemilihan titik pada pendekatan Regresi Terpenggal .....................
23
8 Spektrum serbuk Gingerol Kulonprogo ..........................................
25
9 Spektrum serbuk Gingerol Karanganyar .........................................
25
10 Spektrum serbuk Gingerol sebelum reduksi data ............................
26
11 Spektrum serbuk Gingerol sesudah reduksi data .............................
26
12 Plot antara Y dugaan dan Y pengamatan, n=50, p=150, r=0.7, Nilai awal 100, prior βi ∼ N(0, 0.001) .............................................
35
13 Plot antara Y dugaan dan Y pengamatan, n=10, p=100, r=0.1, Nilai awal 100, prior βi =1/σ ...........................................................
37
14 Model VI, n=10, p=12 .....................................................................
43
15 Model VI, n=20, p=100 ...................................................................
43
16 Skema penyusunan model kalibrasi ................................................
64
17 Spektrum serbuk Gingerol untuk 20 contoh ....................................
65
18 Spektrum serbuk Gingerol Contoh 2 Kulonprogo ..........................
66
19 Spektrum serbuk Gingerol daerah Jawa Tengah, Majalengka dan Bogor ...............................................................................................
67
20 Spektrum serbuk Gingerol D8 .........................................................
70
21 Spektrum serbuk Gingerol D9 .........................................................
70
22 Spektrum serbuk Gingerol D10 .......................................................
70
23 Spektrum serbuk Gingerol dengan konsentrasi 0.63 .......................
71
24 Spektrum serbuk Gingerol 20 contoh setelah dikoreksi pencaran
71
25 Pola JKG pada seluruh model kalibrasi Gingerol ...........................
75
26 Pola RMSEP pada seluruh model kalibrasi Gingerol ......................
75
27 Plot y-duga dan y-(HPLC) Gingerol model D3 ...…………………
75
28 Spektrum serbuk Kurkumin contoh ke-1 daerah Kulonprogo .........
76
29 Spektrum serbuk Kurkumin 40 pengamatan ...................................
78
30 Spektrum serbuk Kurkumin D8 .......................................................
79
31 Spektrum serbuk Kurkumin D9 .......................................................
79
32 Spektrum serbuk Kurkumin D10 .....................................................
80
33 Pola JKG pada seluruh model kalibrasi Kurkumin .........................
81
34 Pola RMSEP pada seluruh model kalibrasi Kurkumin ...................
82
35 Plot y-duga dan y-(HPLC) Kurkumin model D2 ..……………….
82
DAFTAR LAMPIRAN Halaman 1 Doodle Model I ................................................................................
89
2 Doodle Model II ………………………………………………..…
89
3 Doodle Model III .............................................................................
90
4 Doodle Model IV .............................................................................
90
5 Doodle Model V ………………………………………..…………
91
6 Doodle Model VI .............................................................................
91
7 Doodle Model VII ...........................................................................
92
8 Contoh Program WinBUGS 1.4 Model I .......................................
93
9 Contoh Program WinBUGS 1.4 Model II ......................................
94
10 Contoh Program WinBUGS 1.4 Model III .....................................
95
11 Contoh Program WinBUGS 1.4 Model IV ....................................
96
12 Contoh Program WinBUGS 1.4 Model V ......................................
97
13 Contoh Program WinBUGS 1.4 Model VI ....................................
98
14 Contoh Program WinBUGS 1.4 Model VII ………………
...........
99
15 Nilai JKG dan RMSE Model I ........................................................
100
16 Nilai JKG dan RMSE Model II .......................................................
102
17 Nilai JKG dan RMSE Model III ......................................................
104
18 Nilai JKG dan RMSE Model IV ......................................................
106
BAB I. PENDAHULUAN A. Latar Belakang Banyak fenomena yang ada di alam bila diamati dengan seksama ternyata memiliki pola dan perilaku tertentu. Fenomena alam tersebut biasanya dipengaruhi oleh satu atau beberapa kondisi alam atau faktor-faktor lainnya. Sebagai contoh dalam masalah iklim atau cuaca, curah hujan di suatu daerah akan dipengaruhi antara lain oleh temperatur permukaan air laut di sekitarnya, arah mata angin dan tekanan udara. Dalam bidang kesehatan, tinggi badan seorang anak selain disebabkan faktor gizi juga dipengaruhi oleh tinggi badan orang tua, tingkat pendidikan orang tua, penghasilan orang tua dan beberapa faktor lain. Dalam bidang kimia, kandungan senyawa aktif yang dikandung suatu bahan ternyata memiliki pola hubungan dengan panjang gelombang yang dihasilkan bila senyawa aktif tersebut diamati menggunakan alat ukur tertentu. Sehingga bila pola hubungan tersebut diketahui, dapat dilakukan penentuan kandungan senyawa aktif suatu bahan kimia yang belum teridentifikasi. Berdasarkan beberapa contoh kasus tersebut, dapat dibuat suatu gambaran apabila pola hubungan antara peubah dapat diketahui, maka model yang diperoleh dapat digunakan untuk melakukan pendugaan atau perkiraan pada pengamatan lain yang memiliki perilaku sama. Dalam sebuah model peubah amatan dapat dibedakan menjadi dua, pertama adalah peubah respons yaitu peubah yang dipengaruhi oleh peubah lain, kedua adalah peubah penjelas yaitu peubah yang mempengaruhi peubah lain. Misalkan y adalah peubah respons dan X adalah peubah penjelas, y dapat dipengaruhi oleh satu atau beberapa X dengan banyaknya y yang diamati dapat satu atau beberapa buah. Model hubungan tersebut dapat dirumuskan sebagai berikut: yi = f(xi,x2, ...,xp) + εi,
i=l,2,...,n
(1.1)
Fungsi f(x) dapat bersifat linier atau non linier. Persamaan (1.1) dapat dituliskan dalam notasi matriks berikut Y = Xâ + ε (1.2) Y adalah matriks peubah respons berukuran nxm, dengan n adalah banyaknya pengamatan dan m adalah banyaknya peubah respons yang diamati. X adalah
matriks peubah penjelas berukuran nxp, p adalah banyaknya peubah penjelas yang diamati. â adalah matriks koefisien berukuran pxm, sedangkan ε adalah matriks sisaan berukuran nxm. Bila matriks X’X nonsingular, dengan menggunakan metode kuadrat terkecil, matrik â dapat diperoleh. Sebaliknya bila X’X singular dengan metode kuadrat terkecil tidak akan diperoleh matrik â yang bersifat unik. Dua penyebab X’X singular yaitu: (1) Adanya kekolinearan ganda yang sempurna antara peubah bebas X (2) Jumlah pengamatan n, lebih kecil dibandingkan jumlah peubah bebas p (n
Permasalahan lain
dalam pembentukan model kalibrasi adalah jumlah pengamatan (n) yang jauh lebih kecil dibandingkan jumlah peubah bebas p (n<
Kondisi tersebut
mengakibatkan matriks X bersifat singular. Gambar 1. menunjukkan alur metode yang dapat digunakan untuk penyusunan model. Pada pendugaan model kalibrasi apabila terdapat masalah kolinearitas,
beberapa metode yang dapat digunakan yaitu metode regresi
bertatar, regresi ridge, regresi komponen utama, metode NIPALS (dengan prinsip regresi komponen utama), metode Neural Network Partial Least Square (NNPLS) dan metode Partial Least Square (PLS) (Wold (1984); Martens dan Naes (1989); Qin dan Avoy (1992); Young (1994)). Untuk p>>n beberapa tulisan ilmiah dan metode yang pernah digunakan antara lain regresi stepwise dan regresi linier berganda dengan wavelength, regresi komponen utama, Shrinkage of wavelett coeffisien.
Brown (2001) menggunakan Bayesian wavelet regression untuk
aplikasi pada permasalahan kalibrasi spektroskopy. Masalah kolinearitas secara umum dapat diatasi dengan penambahan informasi terhadap model yang akan dibangun atau pentransformasian dari peubah yang bersifat kolinear tersebut menjadi peubah baru yang relatif lebih bebas satu sama lain. Dalam teori statistika dikenal pendekatan Bayes (Berger 1985) yang
merupakan suatu altematif untuk mengatasi masalah kolinearitas.
Hal ini
dimungkinkan karena dalam pendekatan ini informasi baru ditambahkan kedalam model dengan cara mengganggap bahwa parameter model berasal dari sebaran tertentu sehingga tidak bersifat deterministik. Sebaran ini dikenal sebagai sebaran prior yang mencerminkan keyakinan kita tentang besarnya parameter tersebut. Berdasarkan kondisi tersebut pendekatan Bayes merupakan salah satu alternatif pendekatan yang dapat digunakan dalam penyusunan model kalibrasi. Pendekatan Bayes dapat mengatasi masalah kolinearitas antar peubah bebas serta besarnya pengamatan yang jauh lebih kecil dari jumlah peubah bebas. Pada pendekatan Bayes hasil yang diperoleh dipengaruhi oleh penentuan sebaran parameter model, sehingga perlu dilakukan kajian tentang sebaran parameter model yang tepat digunakan dalam penyusunan model kalibrasi. Selain itu perlu juga dilakukan kajian tentang sifat statistik dugaan model kalibrasi yang diperoleh melalui pendekatan Bayes. DATA n p e n g a m a ta n p peubah bebas
p = 1 ?
ya
R e g re s i Peubah Tunggal
tid a k M odel Peubah G anda
n<= p ?
P e re d u k s ia n Peubah B ebas ?
ya
ya
P e re d u k s ia n Peubah Bebas
tid a k ya P e n d e k a ta n B a ye s ?
K o lin e a rita s ? tid a k
tid a k
ya M e to d e Penam bahan In fo rm a s i
R e g re s i B a y e s
Gambar 1 Alur metode penyusunan model.
R e g re s i Peubah G anda
B. Tujuan penelitian Dalam penelitian ini akan dilakukan kajian pengembangan model kalibrasi untuk tanaman obat dengan menggunakan Pendekatan Bayes. Tanaman obat yang akan dikaji adalah jahe dan temulawak. tanaman
Jahe
adalah
Gingerol
Senyawa aktif yang diamati pada
(5-αHidroksil-(1-hidroksi-3metoksifenil)-3-
dekana), sedangkan pada tanaman Temulawak diamati senyawa aktif Kurkumin (1,7-bis(4-hidroksi-3 metoksipenil)1,6-heptadiena-3,5dione). Kedua tanaman obat tersebut diamati dari beberapa daerah sentra tanaman obat di Jateng (Karanganyar), D.I Yogyakarta (Kulonprogo) dan Jabar (Bogor, majalengka, Sukabumi). Beberapa tujuan pada penelitian ini, dapat dirumuskan sebagai berikut: 1. Mengkaji pendekatan Bayes secara teori. 2. Melakukan evaluasi pendekatan Bayes menggunakan data empirik maupun data simulasi. 3. Menyusun model yang dapat digunakan untuk penentuan kandungan senyawa aktif gingerol pada tanaman jahe dari beberapa daerah sentra penghasil tanaman obat di propinsi Jawa Tengah, D.I Yogyakarta, dan Jawa Barat. 4. Menyusun model yang dapat digunakan untuk penentuan kandungan senyawa aktif kurkumin pada tanaman temulawak dari beberapa daerah sentra penghasil tanaman obat di propinsi Jawa Tengah, D.I Yogyakarta, dan Jawa Barat. C. Sistematika Disertasi Berbagai metode pendekatan telah digunakan untuk menyusun model kalibrasi. Secara umum ternyata banyak penelitian yang menunjukan hasil bahwa terdapat kecenderungan pendekatan Bayes merupakan salah satu pendekatan yang cukup menjanjikan bila diterapkan pada penyusunan model kalibrasi.
Pada
penelitian ini akan dilakukan beberapa kajian penyusunan model kalibrasi menggunakan pendekatan Bayes yang meliputi kajian pustaka, kajian secara simulasi, kajian teoritis serta penerapan penyusunan model kalibrasi untuk Gingerol dan Kurkumin.
Setiap kajian tentang penyusunan model kalibrasi dituliskan dalam satu bab tertentu. BAB II berisi kajian pustaka aspek kimia dan statistika yang digunakan pada keseluruhan bab.
Pada penyusunan model kalibrasi struktur data yang
digunakan memiliki dimensi yang sangat besar.
Kondisi ini seringkali
menimbulkan permasalahan pada tahap analisis data, khususnya berkaitan dengan ketersediaan perangkat keras yang memadai untuk pengolahan data dengan dimensi besar. Dalam BAB III dilakukan kajian pereduksian data keluaran FTIR menggunakan pendekatan Regresi Terpenggal (Segmented Regression).
Data
contoh yang digunakan adalah data hasil pengukuran Gingerol untuk tanaman jahe yang berasal dari daerah Kulonprogo dan Karanganyar. Pada penyusunan model kalibrasi dengan pendekatan Bayes, dugaan model yang diperoleh sangat dipengaruhi oleh penetapan sebaran awal parameter model. Oleh karena itu perlu dilakukan kajian tentang sebaran awal parameter yang tepat digunakan untuk penyusunan model kalibrasi. BAB IV berisi tentang kajian penerapan pendekatan Bayes pada data n<
Pada kajian ini
digunakan pendekatan matematis untuk melihat sifat-sifat statistik dari penduga Bayes seperti bias, ragam dan kuadrat tengah galat.
Hasil yang diperoleh
diharapkan dapat menunjukkan kelebihan penggunaan pendekatan Bayes. Pendekatan yang digunakan adalah pendekatan matematis, dilakukan hanya untuk pendekatan Bayes terbaik yang diperoleh pada BAB IV. BAB VI membahas tentang penyusunan model kalibrasi untuk senyawa aktif Gingerol dan Kurkumin dengan menggunakan data pengamatan FTIR dan HPLC dari sumber data hasil percobaan dikebun percobaan Biofarma-Darmaga dan hasil pengamatan ke petani didaerah Karanganyar, Kulonprogo, Majalengka, Sukabumi dan Bogor.
Pendekatan Bayes yang digunakan adalah pendekatan
Bayes terbaik yang diperoleh pada BAB IV. Bagian akhir dan merupakan bab penutup dari disertasi ini adalah BAB VII PEMBAHASAN UMUM dan BAB VIII SIMPULAN UMUM. Alur kegiatan penyusunan model kalibrasi yang dilakukan pada penelitian ini tersaji pada Gambar 2.
Keterkaitan antara bab dalam disertasi ini dan
hubungan antar masing-masing topik penelitian disajikan pada Gambar 3. S tu d i L itera tu r
P e n g e m b an g a n M odel
P e n a rik an c o n to h P e ra n c a n g a n P erc o b a a n
S im u la si P e n g u k u ran R e sp o n s
belum
A n alisis K im ia
P e n g u m p u lan D ata F T IR P e n g u m p u lan D ata H P L C
n dan p S tru k tu r X
S e b a ra n (p rio r d an y )
M odel m em u a sk a n ?
P e n y u su n a n M o d e l
ya
ya
m em u a sk a n ?
M o d e l K a lib ra si
Gambar 2 Alur kegiatan penelitian.
belum
BAB II. TINJAUAN PUSTAKA A. Teknik Spektroskopi Berbagai teknik spektroskopi banyak digunakan dalam analisis kimia biologis, antara lain: spektroskopi UV-VIS, spektroskopi absorpsi atom, spektroskopi infra merah, spektroskopi fluorensi, spektroskopi NMR, dan spektroskopi massa (Nur & Adijuwana 1989). Dalam melakukan teknik analisis dengan spektroskopi, preparasi contoh merupakan hal yang penting dan adakalanya sulit serta memerlukan waktu yang lama. Preparasi contoh harus dilakukan sesuai dengan tujuan analisis, apakah analisis unsur, analisis protein atau analisis asam amino. Untuk analisis unsur, biasanya sampel didestruksi dalam suatu larutan buffer pada PH tertentu, dan untuk analisis asam amino contoh dihidrolisis misalnya hidrolisis asam kemudian hidrolisatnya
setelah
ditambah
pereaksi
tertentu
kemudian
ditentukan
konsentrasinya. B. Fourier Transform Infrared (FTIR) FTIR merupakan salah satu teknik spektroskopi infra merah.
Pada
spektroskopi infra merah, spektrum infra merah terletak pada daerah dengan panjang gelombang dari 0.78 sampai dengan 1000 µm atau bilangan gelombang dari 12800 sampai 1 cm-1. Dilihat dari segi aplikasi dan instrumentasi spektrum infra merah dibagi kedalam tiga jenis radiasi yaitu infra merah dekat (bilangan gelombang 12800-4000 cm-1), infra merah pertengahan (bilangan gelombang 4000-200 cm-1), dan infra merah jauh (bilangan gelombang 200-10 cm-1) (Nur & Adijuwana 1989), FTIR termasuk dalam kategori radiasi infra merah pertengahan (bilangan gelombang 4000-200 cm-1). Plot antara transmitans dengan bilangan gelombang atau frekuensi akan menghasilkan spektrum infra merah. Karena setiap tipe ikatan yang berbeda mempunyai sifat frekuensi vibrasi yang berbeda, dan karena tipe ikatan yang sama dalam dua senyawa berbeda terletak dalam lingkungan yang berbeda, maka tidak ada dua molekul yang berbeda strukturnya akan mempunyai bentuk serapan inframerah atau spektrum infra merah yang tepat sama. Dengan membandingkan spektra infra merah dari dua senyawa yang diperkirakan identik maka seseorang
dapat menyatakan apakah kedua senyawa tersebut identik atau tidak. Pelacakan tersebut lazim dikenal dengan bentuk sidik jari (Finger Print) dari dua spektrum inframerah. Jika puncak spectrum inframerah kedua senyawa tepat sama
maka
dalam banyak hal dua senyawa tersebut adalah identik (Sostrohamidjoyo 1990). Salah satu kegunaan penting dari spektrum infra merah adalah memberikan keterangan tentang gugus fungsi pada suatu molekul. Gugus fungsi yang dihasilkan dapat dibedakan antara daerah identifikasi dan daerah sidik jari. Serapan setiap tipe akan mencerminkan gugus fungsi dan hanya diperoleh dalam bagian-bagian kecil tertentu dari daerah vibrasi inframerah. Kisaran serapan yang kecil dapat digunakan untuk menentukan setiap tipe ikatan. Tabel 1. dan Tabel 2. menyajikan daerah identifikasi untuk gingerol dan kurkumin (Socrates 1994). Tabel 1 Daerah identifikasi spektra IR Gingerol Jenis vibrasi
Bilangan gelombang cm-1
intensitas
Ikatan hidrogen O-H
3550-3230
m-s
C-H rentangan asimetri ; CH3-Ar
2935-2925
m-s
Aromatik -C=C-
1625-1590
vs
α-β-keton takjenuh
1700-1660
vs
R-O-Ar
1310-1210
m
1050-1010
m
C-H ikatan bidang luar
990-980
m
Vinil R- CH=CH2-
910-230
s
C-H ikatan bidang luar
770-735
s
o-subsitusi benzen
710-690
s
Keterangan: (s) kuat; (m) medium; (vs) sangat kuat
Tabel 2. Daerah identifikasi spektra IR Kurkumin No
Jenis vibrasi
Bilangan Gelombang cm-1
intensitas
1
Ikatan hidrogen OH
3600-3300
m-s
2
C-H Alkana
3000-2850
s
3
Aromatik -C=Crentangan
1660-1450
s
4
R-O-Ar
1300-1000
m
5
C=O keton
1820-1660
vs
6
Sidik jari
900-700
s
Keterangan: (s) kuat; (m) medium; (vs) sangat kuat C. High Performance Liquid Chromatography (HPLC) Kromatografi adalah suatu metode pemisahan komponen-komponen dari suatu campuran, komponen-komponen tersebut akan terdistribusi diantara dua fase. Salah satu fase dibuat diam dan dinamakan fase diam atau fase stasioner, fase lainnya disebut fase gerak atau fase mobil yang bergerak diantara celah-celah atau pada permukaan fase stasioner. Pergerakan fase mobil ini mengakibatkan pergerakan diferensial dari komponen-komponen contoh (Nur & Adijuwana 1989). Metode pemisahan ini memerlukan waktu sangat singkat dan lebih efektif dibandingkan dengan pemisahan lain. Fase diam pada kromatografi dapat berupa cair atau padatan sedangkan fase gerak dapat berupa cair atau gas. Berdasarkan jenis fasenya kromatografi dapat digolongkan menjadi empat jenis yaitu: cairpadatan, gas-padatan, cair-cair dan gas-cair. Kromatografi cair adalah semua metode kromatografi yang menggunakan cairan sebagai fase mobil. Kromatografi cair
meliputi metode kromatografi
sederhana dan kromatografi modern. HPLC adalah salah satu metode kromatografi yang termasuk kromatografi cair modern.
HPLC adalah
kromatografi yang menggunakan cairan sebagai fasa gerak dan sebagai fasa diam dapat berupa suatu padatan atau senyawa tertentu yang terikat secara kimia dengan padatan pendukungnya. HPLC biasanya digunakan untuk memisahkan senyawa yang tidak dapat dipisahkan dengan kromatografi gas, karena sifatnya yang tidak mudah menguap,
sehingga tidak mampu melewati kolom dan sampel tidak tahan pada suhu tinggi sehingga akan mengalami dekomposisi pada kondisi pemisahan. HPLC dapat mengatasi permasalahan tersebut, karena HPLC mampu memisahkan senyawa yang tidak mudah menguap dan stabil pada suhu tinggi. Selain itu berbagai macam
fase diam dan fase gerak dapat digunakan pada HPLC yang
memungkinkan metode ini memisahkan berbagai jenis senyawa. HPLC pada dasarnya adalah suatu kromatografi kolom yang menggunakan kolom yang terbuat dari bahan kemasan, maka untuk mendapatkan laju alir yang memadai, digunakan tekanan sampai 5000 lb/inci atau sekitar 2000 kg/cm. Teknik pemisahan HPLC dilakukan
dengan menginjeksikan sedikit sampel yang
berbentuk cairan ke dalam aliran cairan (fase mobil/fase gerak) yang berjalan melalui kolom yang berisi partikel dari suatu fase stasioner. Pemisahan campuran kedalam komponennya tergantung pada tingkat retensi masing-masing komponen di dalam kolom.
Kecenderungan suatu komponen ditahan di dalam kolom
ditentukan oleh partisinya diantara cairan fase mobil dan fase stasioner. HPLC digunakan terutama untuk golongan senyawa tak atsiri, misalnya terpenoid tinggi, segala jenis fenol, alkaloid, lipid dan gula. HPLC berhasil paling baik untuk senyawa yang dapat dideteksi pada daerah spektrum UV atau spektrum sinar tampak. HPLC berbeda dengan kromatografi lainnya terutama dalam pengunaan partikel padatan sebagai pengisi kolom yang mempunyai ukuran partikel seragam (uniform) dengan diameter kecil, dengan demikian diharapkan akan diperoleh efisiensi kolom yang tinggi,tetapi sebagai akibatnya diperlukan dan dibutuhkan pompa bertekanan tinggi yang berfungsi mengalirkan pelarut fasa gerak secara terus menerus. Dengan alasan tersebut kromatografi cair kinerja tinggi sering disebut kromatografi cair tekanan tinggi. Dalam kromatografi cair kinerja tinggi selain
proses
pemisahan
terkait
pula
proses
pendeteksian,pemantauan dan perhitungan hasil.
penginderaan
atau
Proses penginderaan dapat
dilakukan oleh beberapa macam alat penginderaan atau detektor dan pemilihannya sangat bergantung pada senyawa . HPLC dapat digunakan untuk analisis kulitatif dan kuantitatif atau bahkan dapat dimanfaatkan sebagai sarana untuk pemurnian melalui pemisahan secara preparatif (Lindsay 1992).
D. Kandungan Senyawa aktif pada Jahe O (CH2)nCH3 H3CO OH
N-Gingerol Keterangan : N= 6, 8, 10 n= 4, 6, 8 Gambar 4 Struktur gingerol pada Jahe. Komponen yang terkandung dalam jahe atara lain air 80.9%; protein 2.3%; lemak 0.9%; mineral 1-2%; serat 2.4% dan karbohidrat 12.3%. Kandungan kimia ini berbeda-beda tergantung dari faktor genetik dan lingkungan tumbuh yang meliputi iklim, ketinggian, cuaca, jenis tanah, pemupukan dan pengolahan pasca panen. Menurut Young et al (2002) rizoma jahe mengandung dua bagian utama yaitu minyak volatil yang memberikan aroma dan gingerol sebagai pembawa rasa pedas. Stuktur gingerol dapat dilihat pada Gambar 4 ( Chan et al 1986) E. Kandungan Senyawa Aktif pada Temulawak Menurut Sinambela (1985), komposisi rimpang temulawak dapat dibagi menjadi dua fraksi utama yaitu zat warna kurkuminoid dan minyak atsiri. Warna kekuningan
temulawak disebabkan adanya kurkuminoid. Kandungan utama
kurkuminoid terdiri dari senyawa kurkumin, desmetoksikurkumin dan bisdesmetoksikurkumin.
Rimpang temulawak segar, selain terdiri dari senyawa
kurkuminoid dan minyak atsiri juga mengandung lemak, protein, selulosa, pati, dan mineral. Kadar masing-masing zat tersebut tergantung pada umur rimpang yang dipanen juga dipengaruhi letak dan ketinggian tempat temulawak berada. Struktur kurkuminoid dapat dilihat pada Gambar 5 R1
R2
HO
OH
O
Keterangan: R1 -OCH3 -OCH3
OH
R2 -OCH3 = kurkumin -H = desmetoksikurkumin
-H
-H
= bis-desmetoksikurkumin
Gambar 5 Struktur kurkuminoid pada Temulawak. F. Pentingnya Penentuan Konsentrasi Senyawa Aktif Tanaman Obat Indonesia merupakan salah satu negara yang memiliki potensi hayati cukup besar dalam tanaman obat. Di Indonesia, tanaman obat telah lama digunakan oleh masyarakat dan industri dalam pembuatan jamu. Pada akhir-akhir ini, perusahaan farmasi pun telah memanfaatkan tanaman obat tradisional pada produkproduknya.
Penggunaannya yang semakin meluas, mengakibatkan kualitas
senyawa baku tanaman obat menjadi fokus perhatian, terutama untuk kalangan jamu dan industri farmasi, untuk menjamin agar produknya dapat bersaing dan diterima oleh masyarakat. Ditambah lagi dengan adanya persyaratan ISO9000 dan ISO14000, kualitas bahan baku tanaman obat harus menjadi ukuran baku dalam jaminan kualitas suatu produk industri jamu dan farmasi
(Dhanutirto
2001). Proses penentuan konsentrasi senyawa aktif atau senyawa penciri yang dikandung oleh suatu tanaman obat perlu dilakukan secara cepat dan akurat. Untuk itu sangat diperlukan metode yang handal tetapi relatif mudah untuk dioperasikan. Secara kualitatif dan kuantitatif suatu senyawa aktif dapat diketahui antara lain melalui metode HPLC (High Performance Liquid Chromatography) dengan mengetahui pola kromatogram dan memperbandingkan luas area terhadap suatu standar senyawa yang diketahui. Metode kualitatif lain yang juga sering digunakan adalah spektroskopi FTIR (Fourier Transform Infrared) yang pada dasarnya memberikan informasi mengenai keragaan gugus fungsi, yang dapat menjadi penanda stabilitas suatu proses untuk melihat pola tapak (finger print) yang dapat berulang (reproducable). Setiap jenis senyawa aktif atau senyawa identitas (marker compound) secara kimiawi akan memberikan pola tapak FTIR yang juga pola kromatogram yang tertentu tergantung responnya. Kedua peubah ini dapat dimanfaatkan untuk melihat konsistensi respons suatu proses kalibrasi atau standarisasi mutu bahan baku maupun stabilitas proses.
Khasiat tanaman obat tidak terlepas dari kandungan kimiawinya, sedangkan kandungan kimia dari masing-masing tanaman obat bisa berbeda disetiap wilayah atau negara karena tergantung pada iklim, ketinggian, jenis tanah, perlakuan terhadap tanaman dan cara pengolahannya seperti infus, dekok, tingtur dan sebagainya (Dhanutirto 2001). Di dalam proses industri kita mengenal adanya senyawa aktif dan senyawa penciri. Senyawa penciri dapat aktif atau tidak aktif, tetapi harus bersifat stabil selama proses. Oleh karena obat tradisional, baik dalam bentuk simplisia tunggal maupun ramuan, sebagian besar penggunaan dan kegunaannya masih berdasarkan pengalaman maka data yang meliputi kegunaan, dosis dan efek samping sebagian besar belum memiliki landasan ilmiah yang kuat. Demikian pula tentang kandungan senyawa aktif dan penciri dalam tanaman obat belum mendapat perhatian yang baik, padahal pengetahuan tentang kandungan senyawa aktif dan penciri suatu tanaman obat dapat memberi arahan tentang kegunaan dan cara penggunaan tanaman obat tersebut (Hadiwigeno 1993).Penentuan konsentrasi secara kimia dilakukan melalui penentuan kandungan senyawa aktif atau senyawa penciri. Proses penentuan konsentrasi ini dilakukan melalui proses yang panjang meliputi penghancuran bahan, pelarutan, dan pengukuran dengan HPLC dan FTIR. Proses ini memerlukan waktu dan biaya yang relatif mahal. Alternatif cara penentuan lain yang dapat dilakukan adalah dengan mengembangkan model kalibrasi yang menyatakan hubungan antara kandungan senyawa aktif atau penciri hasil pengukuran HPLC dengan data hasil pengukuran FTIR (absorban). Ketersediaan model ini akan menghemat waktu dan biaya. Proses penentuan kandungan senyawa aktif atau penciri dapat dilakukan melalui sampel secara sederhana dan cepat. Selain itu penentuan ini dapat dilakukan berdasarkan serbuk kasar sehingga tidak perlu proses yang panjang. Hal ini akan menunjang industri dan perdagangan serbuk kasar tanaman obat. G. Model Dasar Kalibrasi Model kalibrasi menggambarkan hubungan antara berbagai respons dari instrumen analitik dengan satu atau lebih karakteristik dari suatu bahan aktif. Model ini mengandung parameter yang nilainya harus diduga dari referensi agar dapat digunakan untuk menduga karakteristik dari bahan aktif baru yang belum
diketahui. Dalam proses pendugaannya, biasanya parameter ini dianggap konstan dan jika seandainya berbagai respon instrumen tadi tidak bersifat kolinear maka dapat dihasilkan penduga yang optimum. Secara umum kalibrasi menggunakan suatu fungsi matematik dengan data empirik dan pengetahuan untuk menduga informasi pada y yang tidak diketahui berdasarkan informasi pada X yang tersedia (Martens & Naes 1989). Dalam bidang kimia, model kalibrasi pada spektroskopi merupakan suatu fungsi hubungan antara absorban (X) pada panjang gelombang yang dihasilkan oleh spektrometer dengan konsentrasi (y) larutan unsur atau senyawa yang akan dianalisis (Nur & Adijuwana 1989). Dengan kalibrasi, konsentrasi larutan contoh dapat diketahui berdasarkan absorbannya. Pendugaan model kalibrasi dapat menggunakan model peubah tunggal atau peubah ganda tergantung pada spektrometer yang digunakan. Spektrometer UVVIS menghasilkan spektrum yang berbentuk satu puncak absorban, sehingga model kalibrasinya adalah model peubah tunggal. Spektrometer NIR atau FTIR menghasilkan spektrum dengan banyak puncak absorban, sehingga akan terbentuk suatu model kalibrasi peubah ganda. Model kalibrasi suatu senyawa lebih tepat menggunakan spektrum dengan banyak puncak daripada satu puncak absorban (Nur & Adijuwana 1989). Pada pendugaan model kalibrasi ganda sering timbul masalah kolinearitas di antara peubah absorban (Naes 1985), sehingga metode baku seperti Metode Kuadrat Terkecil tidak dapat digunakan. Permasalahan lain yang dijumpai adalah jumlah pengamatan yang relatif kecil dibandingkan jumlah peubah bebas yang ada.
Hal ini umumnya dikarenakan permasalahan biaya,
waktu atau keterbatasan kemampuan untuk melakukan pengamatan dengan ukuran besar. Beberapa penelitian dalam pendugaan model kalibrasi yaitu, Khristiningrum (1997) yang menunjukkan bahwa metode regresi komponen utama menduga model kalibrasi lebih baik daripada regresi bertatar. Herwindiati (1997) telah membandingkan metode regresi komponen utama, regresi ridge dan regresi dengan metode PLS berdasarkan nilai PRESS, koefisien determinasi (R2), penduga ragam acak (S2) dan nilai bias koefisien regresi. Hasilnya menunjukkan bahwa metode PLS dapat mengatasi masalah kolinearitas dengan memberikan
penduga model kalibrasi yang lebih baik. Dengan data yang sama hasil metode PLS juga lebih baik dari metode NIPALS (Wigena & Aunuddin, 1997). du Plessis dan van der Merwe (1995) telah mengkaji metode Bayes dan membandingkannya dengan metode klasik Brown (1982) secara simulasi dan menerapkannya untuk pendugaan kandungan protein dalam gandum. Hasil kajian menunjukkan bahwa metode Bayes lebih baik dari metode Brown. Sebagai analisis pendahuluan dengan data yang sama Wigena dan Aunuddin (1998) menggunakan metode PLS. Hasil analisis menunjukkan bahwa metode Bayes yang dikemukakan oleh du Plessis dan van der Merwe (1995) relatif lebih baik daripada metode PLS. West (2003) menggunakan pendekatan Bayes untuk menganalisa data spectral dengan p=300 dan n=39. Hasil yang diperoleh menunjukkan tingkat ketepatan pendugaan yang sangat baik dengan R2 yang dihasilkan sebesar 99.995%. Rahayu (2003), Melakukan pendugaan parameter regresi menggunakan pendekatan Bayes dengan dua model. Model pertama mengasumsikan parameter regresi β saling bebas, sedangkan model kedua mengasumsikan parameter regresi β berkorelasi. Data yang digunakan adalah data Naes (1985) untuk menduga kadar lemak pada ikan Trout. Hasil pendugaan yang diperoleh menunjukkan bahwa model kedua menghasilkan Jumlah Kuadrat Galat yang lebih kecil daripada model pertama. Notodiputro (2003), membandingkan antara Regresi Kuadrat Terkecil (RKTP), regresi atas Koefisien Fourier (RKF), Jaringan Syaraf Tiruan (JST) dan pendekatan Bayes. Keempat metode tersebut dicobakan pada data simulasi dan data dari Naes (1985).
Kriteria kebaikan model yang diperoleh dilihat dari
koefisien Jumlah Kuadrat Galat (JKG) dan R2. Hasil yang diperoleh menunjukkan pendekatan Bayes dan JST lebih unggul dari RKTP, sedangkan performans RKF sangat tergantung pada jenis data yang dihadapi. H. Pendekatan Bayes Pendekatan Bayes merupakan suatu altematif untuk mengatasi masalah kekolinearan karena dalam pendekatan ini informasi baru ditambahkan ke dalam
model dengan cara mengganggap bahwa parameter model berasal dari sebaran tertentu sehingga tidak bersifat deterministik. Sebaran ini dikenal sebagai sebaran prior yang mencerminkan keyakinan kita tentang besamya parameter tersebut. Jika parameter model yang ingin diduga adalah β dengan y sebagai peubah acaknya, maka parameter β dipilih yang memaksimumkan fungsi kepekatan bersyarat π(β| y). Fungsi kepekatan bersyarat ini disebut fungsi posterior. Secara umum, jika h(β) adalah sebaran prior dari β dan statistik w= u(yl, y2,...,yp) maka sebaran posteriornya adalah: π(β| w)=
f ( β , w) g ( w)
=
h( β ) f ( w | β ) g ( w)
Dalam hal ini f(w|β) adalah fungsi kemungkinan dari w, f(β,w)adalah fungsi kepekatan bersama dari β dan w. Nilai β dipilih sedemikian sehingga diperoleh π(β|w).
Pemilihan h(β) yang tepat akan dapat memperbaiki fungsi f(w|β)
sehingga ruang bagi nilai optimum β menjadi terbatas. Sebaran prior dapat diperoleh melalui dua pendekatan informative prior atau non informative prior. Pada informative prior, parameter ditetapkan memiliki sebaran tertentu dengan kisaran nilai yang dapat diterima. Sedangkan pada non informative prior, tidak ada informasi tambahan tentang parameter. Pada non informative prior apabila prior bernilai konstan maka penduga parameter dengan metode Bayes akan sama dengan penduga dengan metode kemungkinan maksimum. Metode lain untuk menentukan sebaran prior yang cukup sederhana dan melibatkan data yang ada adalah dengan metode prior sekawan (Conjugate prior). Prior sekawan ditentukan dengan memeriksa fungsi kemungkinan L(β/y) = f(y/β), dan memilih sebagai keluarga sekawan adalah kelompok sebaran yang sama dengan fungsi kemungkinannya. Sebagai contoh bila f(y/β) menyebar normal maka L(β/y) juga akan mengikuti sebaran normal. I. Keunggulan Pendekatan Bayes Roy (1998), menyebutkan beberapa keunggulan pendekatan Bayes sebagai berikut:
•
Dapat digunakan untuk parameter dengan berbagai sebaran peluang
•
Dapat digunakan untuk model parameter numerik yang perilakunya berubahubah
•
Mengatasi salah satu kelemahan pendugaan parameter secara konvensional, yaitu penurunan tingkat efisiensi dengan meningkatnya jumlah parameter yang akan diduga.
•
Pada metoda konvensional parameter ditetapkan pada kisaran nilai yang dapat diterima, sedangkan pada pendekatan Bayes penentuan prior dapat diperoleh berdasarkan informasi dari data itu sendiri.
•
Dapat dikembangkan suatu model hirarki.
J. Monte carlo Markov Chain (MCMC) Salah satu metode optimasi yang banyak digunakan dalam metode Bayes adalah metode simulasi Monte Carlo Markov Chain (MCMC). Metode simulasi MCMC sudah ada kurang lebih 50 tahun, dalam empat dekade terakhir metode ini banyak digunakan pada bidang fisika. Sejak tahun 1980 perkembangan metode ini sangat cepat pada pengembangan konsep peluang dan bidang Statistika. Metode simulasi MCMC adalah suatu metode numerik untuk memperoleh fungsi kepekatan bersama.
Pendugaan parameter menggunakan MCMC merupakan
pendekatan numerik dari fungsi sebaran peluang yang dibangkitkan dari model parameter. Rataan, ragam dan momen lainnya dari parameter dapat diperoleh dari pendekatan numerik fungsi sebaran peluang (Roy 1998).
Cheng (1999),
menyatakan bahwa pada metode MCMC penghitungan untuk memperoleh P(β/y) diperoleh dengan menyekat kurva menjadi beberapa bagian, karena sulit menghitung
∫ β (P( y | β ) pP(β ))dβ .
Beberapa algoritma yang dapat digunakan pada markov chain yaitu Metropolis algorithm, Metropolis-Hasthings algorithm, Langevin algorithm, Gibbs Sampling algorithm dan Metropolis-Hasthings-Green algorithm. Gelman dan Rubin (1992) memberikan statistik yang digunakan untuk mengukur tingkat konvergensi dari Markov Chain.
Rˆ =
(n − 1)W + B nW
(2.2) W adalah within sequence variance dan B adalah between sequence variance. Konvergensi diperoleh bila
Rˆ
<1.2.
Pendekatan Bayes dengan menggunakan MCMC merupakan suatu pendekatan yang cukup menjanjikan. Namun demikian diperlukan kehati-hatian dalam pemilihan sebaran prior. West (2001) menggunakan pendekatan Bayes dan MCMC untuk penyusunan model kalibrasi pada p>>n, hasil yang diperoleh sangat baik dengan R2 sebesar 99.995%.
BAB III PEMAMPATAN DATA KELUARAN Fourier Tansform Infrared (FTIR) MENGGUNAKAN PENDEKATAN REGRESI TERPENGGAL (Segmented Regression) A. Pendahuluan Spektrum keluaran FTIR merupakan data dalam dua dimensi yang merupakan data berpasangan antara persen transmitan (Y) dan bilangan gelombang (X). Data spektrum yang dihasilkan oleh FTIR tersebut adalah data kuantitatif yang umumnya berdimensi besar.
Sehingga bila ingin dilakukan
analisis data akan dijumpai permasalahan dalam penggunaan paket program pengolah data dan kemampuan hardware yang dimiliki.
Oleh karena itu
diperlukan suatu metode pendekatan untuk mereduksi data tanpa menghilangkan pola spektrum awal. Bila pendekatan ini diperoleh akan mempermudah untuk melakukan analisis statistika selanjutnya, seperti dalam hal pengelompokan senyawa dan penentuan senyawa yang dianggap memberikan hasil respons terbaik. Erfiani et al. (2004a) mencoba pereduksian data keluaran FTIR menggunakan Pendekatan Metode Titik Balik untuk data pengukuran senyawa
aktif gingerol dan kurkumin.
Hasil yang diperoleh menunjukkan metode
pendekatan ini cukup baik dilakukan untuk mereduksi dimensi data. Penggunaan metode pendekatan titik balik dapat mereduksi dimensi vektor titik persentase transmitan dari 1869 menjadi 27. Teknik pereduksian data keluaran Near Infrared (NIR), yang diterapkan pada Regresi Komponen Utama, dicobakan pada Erfiani et al. (2004b). Hasil yang diperoleh menunjukkan terdapat banyak metode eksploratif yang relatif sederhana namun memberikan ketepatan pendugaan model yang tinggi. Beberapa metode pendekatan yang digunakan yaitu penyekatan peubah menjadi kelompokkelompok peubah dengan jumlah peubah pada setiap kelompok sama. Jarak lompatan antara kelompok dicobakan pada beberapa jarak lompatan yaitu 2, 5, 10, 20, 30, 50, 75, dan 80. Dari setiap kelompok peubah diambil satu peubah baru yang merupakan fungsi dari peubah-peubah di dalam kelompok tersebut. Fungsi yang digunakan adalah nilai rataan, maksimum, dan peubah pada ujung sekatan. Hasil yang diperoleh menunjukkan bahwa penggunaan fungsi peubah pada ujung masing-masing sekatan dengan berbagai jarak lompatan lebih mudah dan sederhana dilakukan dari dua fungsi lainnya. Penggunaan jarak lompatan kurang dari 10 dapat menggunakan salah satu dari ketiga macam fungsi pereduksian banyak peubah, tetapi penggunaan jarak lompatan lebih dari 10 lebih baik jika menggunakan fungsi nilai rataan pada masing-masing sekatan atau peubah pada ujung masing-masing sekatan.
Jarak lompatan tergantung banyaknya peubah
bebas. Semakin banyak peubah bebas, maka jarak lompatan masing-masing kelompok sekatan dapat semakin besar.
Besaran nilai R2 dan R2(adj) yang
dihasilkan oleh regresi dengan menggunakan data hasil reduksi dengan pendekatan lompatan dan Regresi Komponen Utama relatif sama. Oleh karena itu metode pendekatan ini cukup baik penggunaannya dalam mereduksi data keluaran Infrared. Metode pendekatan pereduksian yang dicobakan pada Erfiani et al. (2004a) dan
Erfiani et al. (2004b) meski memberi hasil yang cukup baik namun
menggunakan pendekatan eksploratif, sehingga hasil yang diperoleh sangat bersifat subyektif.
Oleh karena itu masih diperlukan kajian pendekatan-
pendekatan lain yang dapat digunakan untuk pereduksian data keluaran Infrared.
Pada tulisan ini akan dilakukan kajian penerapan pendekatan Regresi Terpenggal (Segmented Regression) untuk pereduksian data keluaran FTIR. B. Sumber Data Data yang digunakan untuk penerapan pendekatan Regresi Terpenggal untuk pereduksian data keluaran FTIR merupakan data pengukuran senyawa aktif gingerol menggunakan FTIR.
Senyawa aktif gingerol tersebut berasal dari
tanaman jahe hasil pengamatan dua daerah sentra produksi tanaman obat yaitu Kulonprogo, Jawa Tengah dan Karanganyar, D.I. Yogyakarta.
Pengamatan
dilakukan pada periode waktu 27 Juli 2003 sampai dengan 1 Agustus 2003.
C. Regresi Terpenggal (Segmented Regression) Jika (Xi, Yi), i=1, 2, ..., n adalah pasangan data yang saling bebas dengan Y adalah peubah terikat dan X adalah peubah bebas. Pada Model Regresi Terpenggal wilayah X dibagi menjadi dua atau lebih interval atau sekatan dengan masing-masing sekatan memiliki bentuk fungsi tersendiri Titik akhir dari setiap sekatan disebut changepoints atau breakpoints (Küchenhoff & Wellisch 1997). Ilustrasi sederhana dari model Regresi Terpenggal dengan dua buah sekatan tersaji pada Gambar 6, τ adalah breakpoints.
β2 á
β1=0
τ
Gambar 6 Ilustrasi Regresi Terpenggal dengan dua buah sekatan. Jika fungsi regresinya kontinu, model linear dengan dua sekatan atau satu breakpoints, memiliki persamaan regresi sebagai berikut: E( Y | X=x ) = G( á + â1(x-ô)- + â2(x-ô)+ ) yϑ − b(ϑ ) f ( y | ϑ , ξ ) = exp + c( y, ξ ) ξ
(3.1) (3.2)
Keterangan: t+ = maks (0,t) t- = min (0,t) G adalah fungsi penghubung Natural, ϑ = á + â1(x-ô)- + â2(x-ô)+ ô adalah parameter breakpoints ξ adalah nuisance parameter b '(ϑ ) = E( Y | X=x ) Vektor parameter yang akan diduga adalah θ = (á, â1, â2, ô). Perilaku θˆ, dapat diperoleh dengan menggunakan beberapa regularity assumptions berikut: (Fahrmeir & Kaufmann 1985)
(1) Jika (Xi, Yi), i=1, 2, ..., n adalah contoh yang saling bebas dari model persamaan (3.1) dan (3.2) dengan fungsi penghubung natural, maka penciri model persamaan (3.1) akan dipenuhi bila â1 ≠ â2. (2) Momen pertama dan momen kedua dari X ada atau E(X) dan E(X2) ada. (3) (i) E(G(Y, á + â1(x-ô)- + â2(x-ô)+), ada. G adalah fungsi log-kemungkinan. (ii) E(S(Y, X, θ)2) ada. S adalah score function. Berdasarkan (1) dan (3) diperoleh perilaku θˆsebagai berikut: (a) θˆbersifat konsisten. Plim θˆ= θ untuk n → ∞. (b) θˆadalah asymptotic solution dari score equation. − 12 n P n ∑ S (Yi , X i , θˆ) → 0 , untuk n → ∞. i =1 D. Pendekatan Regresi Terpenggal untuk Pereduksian Data Keluaran FTIR Setiap pola spektrum terdiri dari titik yang menunjukkan hubungan antara bilangan gelombang (cm-1) dengan persentase transmittan yang dihasilkan oleh FTIR. Banyaknya titik yang dihasilkan mengakibatkan dimensi yang dihasilkan oleh setiap spektrum sangat besar.
Setiap pola spektrum yang dapat disekat
menjadi beberapa sekatan garis, dengan setiap sekatan memilliki pola spektrum tertentu. Berdasarkan pola yang diperoleh pada setiap sekatan, dapat dilakukan pereduksian jumlah titik dalam partisi tersebut. Sebagai contoh pada suatu partisi yang terdiri dari 20 titik dan membentuk suatu pola garis lurus, maka sesungguhnya cukup hanya diambil sedikitnya dua titik saja dari partisi tersebut. Sehingga jumlah data yang semula 20 titik dapat direduksi menjadi dua titik. Pendekatan ini memiliki konsep yang relatif sama dengan Regresi Terpenggal, hanya tujuan dari pendekatan ini bukan untuk menduga besaran vektor parameter θ = (á, â1, â2, ô), melainkan mereduksi jumlah titik pada setiap sekatan. Pada setiap sekatan hanya diambil dua titik yaitu titik awal dan titik akhir pengamatan. Pendekatan ini secara teori memungkinkan untuk dilakukan karena pada regresi terpenggal sifat dari statistik yang dihasilkannya konsisten, sehingga secara umum akan selalu dapat dibentuk suatu persamaan garis lurus pada setiap sekatan.
Algoritma pereduksian data menggunakan pendekatan Regresi Terpenggal, yaitu: 1. Tetapkan R02 , yaitu besaran koefisien determinasi standar untuk persamaan garis lurus pada semua sekatan. 2.
Tetapkan i = 1, j = 2, dan k =1 i = titik ujung awal sekatan, j = titik ujung akhir sekatan, k = sekatan
3. Ambil dua pasang titik pertama (Xi, Yi) dan (Xj, Yj) sebagai titik awal. 4. Buat regresi linier Yˆ = á + âX . dan hitung nilai R2. 5. Bila R2 • R02 , j = j + 1, gabungkan pasangan data (Xj, Yj) dan kembali kerjakan 4. 6. Bila R2 < R02 , a. Catat nilai pasangan data pertama (Xi, Yi) dan data terakhir (Xj, Yj) sebagai titik ujung awal dan titik ujung akhir sekatan ke-k. b. Hitung i=j+1, j=j+2, dan k=k+1. Jika j < n kembali ke 4, selainnya stop. t4
t9
t2 t1
t8
t3 t5
t7 t6
Gambar 7 Pemilihan titik pada pendekatan Regresi Terpenggal. Ilustrasi pendekatan Regresi Terpenggal untuk pereduksian data tersaji pada Gambar 7. Pada Gambar 7 terdapat sembilan titik yang membentuk tiga daerah sekatan. Daerah sekatan pertama terdiri dari tiga titik t1, t2 dan t3, daerah sekatan kedua terdiri dari titik t4, t5 dan t6, sedangkan daerah sekatan ketiga terdiri dari titik t7, t8 dan t9. Pada setiap sekatan diambil dua titik yang merupakan titik ujung setiap sekatan, sehingga jumlah titik hasil pereduksian sebanyak enam yaitu t1, t3, t4, t6, t7 dan t9. Bila jumlah sekatan yang dihasilkan adalah k, maka jumlah titik yang digunakan sebanyak 2k.
Keuntungan menggunakan pendekatan Regresi Terpenggal untuk mereduksi data keluaran FTIR, yaitu: 1. Pereduksian data dilakukan dengan tidak menghilangkan pola sebaran data. Hal ini diperlukan karena untuk setiap senyawa aktif akan memiliki daerah identifikasi tertentu. Pada daerah identifikasi tersebut, yaitu daerah bilangan gelombang tertentu akan ditemukan lonjakan-lonjakan nilai persentase transmitan.
Hasil pereduksian data menggunakan pendekatan Regresi
Terpenggal ini, akan berupa pasangan titik data bilangan gelombang dan persentase transmitan dengan pola spektrum yang sama dengan pola spektrum data awal. 2. Menanggulangi permasalahan dimensi data yang besar.
Pada beberapa
perangkat lunak dimensi data yang besar kadang menimbulkan permasalahan tersendiri dalam pengolahan data, misalkan dalam hal waktu proses. Oleh karena itu diawal proses diperlukan tahapan pereduksian data. Pereduksian data menggunakan pendekatan Regresi Terpenggal, merupakan salah satu alternatip metode yang cukup mudah dan efisien penggunaannya. Hal ini terlihat dari algoritma yang sederhana sehingga tidak ditemukan masalah dalam hal komputasi, dalam pengadaan perangkat lunak maupun perangkat keras. 3. Pengukuran kebaikan hasil menggunakan acuan yang pasti. Pada pendekatan ini digunakan besaran koefisien determinasi ( R02 ) untuk menentukan banyaknya daerah sekatan bilangan gelombang. Semakin besar acuan nilai R02 yang digunakan, akan semakin banyak jumlah sekatan dan jumlah titik hasil reduksi yang dihasilkan. E. Studi Kasus Penerapan Pendekatan Regresi Terpengga Gambar 8 dan Gambar 9, merupakan plot data antara bilangan gelombang dan persentase transmitan keluaran FTIR untuk pengukuran senyawa aktif Gingerol yang dihasilkan dari tanaman jahe daerah Kulonprogo dan Karanganyar. Berdasarkan plot tersebut terlihat bahwa setiap senyawa aktif memiliki pola spektrum yang tertentu. Pada senyawa aktif tertentu terdapat lonjakan-lonjakan nilai persentase transmitan pada daerah bilangan gelombang tertentu yang disebut
daerah identifikasi. Pada Spektrum IR Gingerol, pada daerah bilangan gelombang 3550-3230 cm-1 akan terdapat ikatan hidrogen O-H, pada daerah bilangan gelombang
2935-2925 cm-1 terdapat C-H rentangan asimetri; CH3-Ar, dst
(Socratesg 1994). Gambar 8 dan Gambar 9. memperjelas kondisi tersebut, bahwa untuk senyawa aktif tertentu meskipun berasal dari sumber berbeda (pada kasus ini berasal dari daerah dan teknik budidaya yang berbeda), akan memiliki pola spektrum yang sama. Oleh karena itu untuk tahap pereduksian data selanjutnya, hanya akan diambil salah satu spektrum saja. FTIR Jahe-Kulonprogo
100 80 60 40 20 0 4400 3900 3400 2900 2400 1900 1400
% Transm itan
% Transm itan
100 80 60 40 20 0 4400 3900 3400 2900 2400 1900 1400
FTIR Jahe-Karanganyar
900
400
Bila nga n Ge lom ba ng (cm -1 )
900
400
Bila nga n Ge lom ba ng (cm -1)
Gambar 8 Spektrum serbuk Gingerol Kulonprogo
Gambar 9 Spektrum serbuk Gingerol Karanganyar
Kriteria penentuan jumlah titik pada setiap sekatan yaitu berdasarkan besaran koefisien determinasi (R2) yang diperoleh dengan menggunakan regresi linier sederhana. Jumlah titik yang berada dalam satu sekatan akan ditentukan oleh besaran R2 yang ditetapkan ( R02 ).
Semakin tinggi nilai penetapan R02 , akan
semakin sedikit jumlah titik yang dihasilkan untuk setiap partisi. Pada penelitian ini pereduksian data dicobakan pada beberapa besaran R02 yaitu 0.95, 0.98, 0.99 dan 0.999. Hasil pereduksian jumlah pasangan data persentase transmitan dan bilangan gelombang dengan empat kriteria R02 yang digunakan tertera pada Tabel 3.
R
2 0
0.95 0.98 0.99 0.999
Tabel 3 Jumlah titik hasil reduksi Jumlah Titik Hasil Persentase Data Tereduksi 14 99 % 26 99 % 46 98 % 86 90 %
Penerapan pendekatan Regresi Terpenggal untuk data diatas, ternyata memberikan hasil yang cukup baik. Pada pendekatan ini hanya akan diambil dua titik dari sekumpulan titik yang membentuk persamaan regresi linier. Pada R02 sebesar 0.999, jumlah titik awal sebanyak 1868 ternyata dapat direduksi menjadi 86 titik tanpa merubah pola titik yang dihasilkan seperti tampak pada Gambar 10
1
1
0.8
0.8
Persen T ran sm itan
Persen Transmitan
dan Gambar 11.
0.6 0.4 0.2
0 4400
3400
2400
1400
400
Bilangan Gelombang (cm -1)
Gambar 10 Spektrum serbuk Gingerol sebelum reduksi data Gambar 11 Spektrum serbuk Gingerol sesudah reduksi data
0.6 0.4 0.2
0 4400
3400
2400
1400
Bilan g an Ge lo m b an g (cm -1 )
400
F. Simpulan Beberapa kelebihan pendekatan Regresi Terpenggal untuk pereduksian data adalah tetap mempertahankan pola data awal, mudah dalam pengerjaannya dan tidak menghadapi kendala dalam penyediaan perangkat lunak maupun perangkat keras. Penerapan pendekatan Regresi Terpenggal untuk pereduksian data keluaran FTIR memberikan hasil yang cukup baik. Berdasarkan data yang digunakan metode ini dapat mereduksi hingga 99% data. Banyaknya titik hasil pereduksian data sangat dipengaruhi jumlah R02 yang digunakan, semakin tinggi R02 akan semakin banyak jumlah titik yang dihasilkan
BAB IV KAJIAN SIMULASI: PENDEKATAN BAYES PADA DATA n<
penelitian
yang
telah
dilakukan
sebelumnya
dengan
membandingkan metode yang disebutkan di atas ternyata pendekatan Bayes mempunyai hasil yang lebih baik dibanding dengan metode lain dalam pendugaan parameter (du Plessis (1995); Wigena dan Aunuddin (1998); West (2003); Rahayu (2003); Notodiputro (2003)). Hal ini dikarenakan dalam pendekatan Bayes ditambahkan informasi tambahan terhadap model yang dibangun, informasi tambahan ini disebut dengan informasi prior. Penelitian yang dilakukan oleh Rahayu (2003) menunjukkan pemilihan penggunaan sebaran prior sangat berpengaruh terhadap hasil dugaan. Oleh karena itu diperlukan ketepatan pemilihan prior agar model mempunyai tingkat keakuratan yang tinggi. B. Tujuan Penelitian ini dilakukan dengan tujuan untuk mengkaji penerapan pendekatan Bayes non hirarki dan Bayes berhirarki untuk pembentukan model kalibrasi pada kondisi data yang berkorelasi.
C. Tinjauan Pustaka Metode Simulasi Simulasi adalah suatu model matematika yang dapat menerangkan perilaku suatu sistem dari waktu ke waktu. Metode simulasi dapat memberikan efisiensi dan kemudahan dalam menganalisis suatu model matematika. Simulasi berbasis komputer saat ini lebih banyak diterapkan dalam penelitian-penelitian dibandingkan dengan simulasi secara manual (Watson & Blackstone 1989). WinBUGS WinBUGS merupakan suatu perangkat lunak yang berbasis Windows yang digunakan untuk analisis statistika dengan metode bayes. Software ini menggunakan Markov Chain Monte Carlo (MCMC) untuk menemukan sebaran posteriornya (Spiegelhater et al 2002). Pada penggunaan program WinBUGS perlu dituliskan nilai awal untuk parameter, terutama parameter ragam. Hal ini dikarenakan software WinBUGS dapat memberikan nilai default negatif untuk nilai awal parameter ragamnya (Anonim, 2004). Kriteria Kebaikan Model Menurut Mattjik
dan Sumertajaya
(2002) kriteria
untuk melihat
keterandalan model antara lain adalah Jumlah Kuadrat Galat (JKG) dan Koefisien Determinasi (R2). Model yang baik mempunyai JKG yang kecil dan R2 yang besar. Rumus untuk mencari R2 adalah sebagai berikut: R2 =
JKR JKG =1− JKT JKT
di mana : JKR = Jumlah Kuadrat Regresi JKT = Jumlah Kuadrat Total
Ukuran kebaikan model lainnya yang dapat digunakan antara lain adalah akar kuadrat tengah galat (RMSE = Root Mean Square Error). Model dikatakan baik jika memiliki nilai RMSE yang kecil (Naes et al. 2002). Rumusan RMSE dapat dituliskan dalam persamaan berikut: RMSE =
MSE =
E ( yˆ− y )
2
MSE adalah Mean Square Error (Kuadrat Tengah Galat / KTG). D. Bahan dan Metode Data yang digunakan dalam penelitian ini merupakan data simulasi atau data bangkitan. Data hasil bangkitan berupa data peubah Y dan peubah X, dimana peubah Y merupakan fungsi dari peubah X. Fungsi peubah Y adalah sebagai berikut: Y = f(X1, X2, X3, …, X p) Dalam penelitian ini, pembangkitan nilai data Y mengikuti interval data senyawa gingerol pada jahe dengan kisaran nilai antara 0.4 sampai dengan 3.1. Sedangkan peubah X yang dibangkitkan, nilainya mengikuti kisaran nilai %transmitan. Nilai peubah X berkisar antara 0 sampai dengan 100 dan peubahpeubah X dalam matriks data X tersebut dikondisikan saling berkorelasi. Korelasi yang dicobakan adalah 0.1, 0.3, 0.5, 0.7, 0.8, 0.9, 0.95, 0.98. Sedangkan kombinasi jumlah pengamatan (n) dan jumlah peubah (p) dalam matriks data X tersaji pada Tabel 4. Tabel 4 Kombinasi n dan p yang dicobakan n 10
20
35
50
p 12 50 100 150 25 50 100 150 40 80 100 150 60 100 150
Alur kerja yang dilakukan dalam penelitian ini adalah sebagai berikut: Tahapan Simulasi Data * = ( x1 , x 2 ,..., x p ) ~ N(µ, Σ), dengan korelasi antar peubah 1. Pembangkitan X nxp
tinggi dengan langkah-langkah sebagai berikut: 1.1. Membangkitkan matriks korelasi R r11 r 21 R= ... r p1
r12 r22 ... rp 2
r1 p ... r2 p ... ... ... r pp ...
Matriks R dicobakan pada beberapa kondisi yaitu: rij ∼ Uniform (0.75, 0.85) rij ∼ Uniform (0.85, 0.95) rij ∼ Uniform (0.95, 1) rij ∼ Uniform (0.96, 1), i = 1, 2, ....p dan j = 1, 2, ....p Untuk setiap gugus r, dibangkitkan data berdasarkan p maks (p=150 buah). Jumlah data yang dibangkitkan untuk setiap gugus: 0.5(p-1)p = 11.175 buah 1.2. Membangkitkan matriks Xnxp = (x1, x2, ..., xp) ∼ N(µ, Iσ2), untuk berbagai nilai n dan p seperti tertera pada tabel 4 (contoh yang digunakan µ=0 dan σ2=9). Struktur data hasil tahap 1.1 dan 1.2 tersaji pada tabel 5. 1.3. Menyusun Matriks peragam Σ dengan menggunakan hasil yang diperoleh pada 1.1. dan 1.2. σ ij2 = rij σ iσ j , 1.4. Dengan menggunakan SVD dekomposisi Σ menjadi L’ L Σ = ADF,
Apxn, A'A = I D = Diagonal (d1, d2, ..., dn), d1≥d2≥ ... ≥dn≥0 Fnxn,F'F=FF'=I
= AD1D1F, D = D12 = L'L
Catatan : Untuk matriks yang simetrik A = F.
1.5. Hitung :X*=XS*L,
1 1 1 S*=Diag , ,..., σ σ σ p 1 2
2. Membangkitkan y = Xβ + ε, dengan langkah pengerjaan sebagai berikut
2.1. Tetapkan β 2.2. Hitung E(y) = Xβ 2.3. Bangkitkan ε (contoh yang digunakan ε ∼ N(0, σ=2)) 2.4. Hitung nilai pengamatan y = E(y) + ε 3. Transformasi Y dan X sehingga interval data yang digunakan sesuai dengan sesungguhnya. Bentuk transformasi data tersaji pada Tabel 6. Tabel 5 Struktrur data simulasi r
n
0.8 10
20
35
50
0.9 10
20
35
50
p
#unsur segitiga R
12 50 100 150 25 50 100 150 40 80 100 150 60 100 150 12 50 100 150 25 50 100 150 40 80 100 150 60 100 150
66 1225 4950 11175 300 1225 4950 11175 780 3160 4950 11175 1770 4950 11175 66 1225 4950 11175 300 1225 4950 11175 780 3160 4950 11175 1770 4950 11175
r 0.95
n
p
#unsur segitiga R
10
12 50 100 150 25 50 100 150 40 80 100 150 60 100 150 12 50 100 150 25 50 100 150 40 80 100 150 60 100 150
66 1225 4950 11175 300 1225 4950 11175 780 3160 4950 11175 1770 4950 11175 66 1225 4950 11175 300 1225 4950 11175 780 3160 4950 11175 1770 4950 11175
20
35
50
0.98
10
20
35
50
Tabel 6 Transformasi data Y dan X eubah
P
S Kisa Artinya enyawa ran Nilai aktif Y G 0.4 0.4 gr – 3.1 gr ingerol % - 3.1% gingerol dalam 100 gr jahe K 0.6 urkumin % - 3.0% X
0.6 gr – 3.0 gr kurkumin dalam 100 gr temulawak
(0% 100%) transmitan
Rumusan Transformasi Y
Y
*
*
X
*
= 0 .4 +
= 0 .6 +
= 0+
Y −Y min Y −Y maks min Y −Y min −Y Y maks min X −X X
maks
( 3.1 − 0
(3 − 0 6
min
−X
min
Tahapan Penyusunan Model Kalibrasi Model kalibrasi dibangun dengan pendekatan Bayes non hirarki dan Bayes hirarki. Pendekatan Bayes non hirarki yang dicobakan yaitu: y ∼ N(Xβ , σ2), y adalah vektor berukuran nx1, X adalah matriks berukuran nxp dan β adalah vektor berukuran px1, beberapa sebaran prior β yang dicobakan dirumuskan dalam model dibawah ini: a. Model I
: Prior β ~ N (0, 0.001)
b. Model II
: Prior β = 1/ó
c. Model III
: Prior β ~ Gamma (2,5)
d. Model IV
: Prior β ~ Eksponensial (1)
Pada model I, III dan IV βi, i = 1, 2, ..., p bersifat saling bebas dan identik. Pada keseluruhan model dicobakan beberapa kemungkinan nilai awal bagi ragam (σ2) yaitu : 1, 10, 50, 100. Pendekatan Bayes hirarki dilakukan berdasarkan pertimbangan pendapat Roy (1998) yang menyatakan bahwa penyusunan model pada proses biologi umumnya baik bila menggunakan pendekatan Bayes berhirarki. Hal ini didukung dengan hasil penelitian Rahayu (2003) bahwa untuk model kalibrasi pada spektroskopi dengan menggunakan pendekatan Bayes, model berhirarki lebih baik digunakan dibandingkan model non hirarki. Beberapa model Pendekatan Bayes berhirarki yang digunakan dalam penelitian ini adalah:
( 100 − 0
Y ∼ N(Xβ , σ2) Beberapa sebaran prior β yang dicobakan dirumuskan dalam model dibawah ini: a. Model V : β berhirarki dan σ konstan b. Model VI : β berhirarki dan σ acak c. Model VII : β berhirarki, σ berhirarki. Pada perilaku β berhirarki, dicobakan berbagai kemungkinan kombinasi sebaran prior dan hiperprior, yaitu sebaran Normal, Eksponensial dan Gamma. Sehingga akan dapat diketahui model pendekatan yang relatif tidak dipengaruhi oleh penetapan sebaran awal β atau bersifat robust. Pemilihan bentuk sebaran prior dan hiperprior ditentukan secara subyektif, dengan anggapan keseluruhan sebaran yang dipilih telah mewakili bentuk sebaran keluarga eksponensial. Pada keseluruhan model juga dicobakan berbagai kondisi penetapan nilai awal σ2. Ketepatan model yang dihasilkan dilihat dari beberapa kriteria yaitu besaran nilai Jumlah Kuadrat Galat (JKG) dan Root Mean Square Error (RMSE). Perangkat lunak yang digunakan adalah Winbugs14. E. Hasil dan Pembahasan Setiap matriks data X bangkitan mempunyai nilai korelasi antar peubah yang tertentu. Tabel 7 merupakan contoh yang menunjukkan korelasi antar peubah bebas dimana korelasi yang dicobakan adalah 0.1 dengan kombinasi jumlah pengamatan (n) 50 dan jumlah pebah bebas (p) 150. Pada tabel 7 hanya ditampilkan sebagian saja korelasi antar peubah, hasil dari pembangkitan matriks data X. Pendekatan bayes dengan model I, II, III, IV menggunakan nilai awal parameter ragam yang nilainya ditetapkan secara subjektif. Nilai awal ragam yang digunakan adalah 1, 10, 50, 100. Sedangkan nilai awal parameter beta yang digunakan merupakan nilai default yang diberikan oleh software WinBUGS 1.4 versi beta. Jumlah iterasi dengan simulasi MCMC yang dilakukan oleh software WinBUGS 1.4 versi beta adalah 1000 kali. Alasan pemilihan jumlah iterasi sebanyak 1000 kali adalah untuk kemudahan, karena proses iterasi untuk matriks data dengan ukuran n dan p yang besar memerlukan waktu yang lama dalam
proses iterasinya. Doodle dan contoh program yang digunakan untuk setiap model disajikan pada Lampiran 1 sampai dengan Lampiran 14.
Tabel 7 Nilai korelasi antar peubah bebas.n=50, p=100, E(r)=0.1 x1 0.310 0.040 0.052
x2 x3 x4 x5 x6 ….. x150
x2
0.243 0.042
x3
x4
x5
-
-
0.033 0.067
-
0.248
0.044
0.042 ….. 0.108
0.113 …..
0.060 …..
0.006
0.031
0.020
-
0.016 ….. 0.157
0.181 ….. 0.197
Pendekatan Bayes dengan Model I Model I merupakan model pendekatan bayes dengan menggunakan prior βi~N(0, 0.001). Tabel Lampiran 1 merupakan hasil dari pengolahan data dengan model I. Pada matriks data 10x12 dapat dilihat bahwa peningkatan nilai awal menyebabkan nilai JKG dan nilai RMSE menurun. Sebagai contoh data pada korelasi 0.1 untuk n=10 dan p=12, pada nilai awal 1 nilai JKG sebesar 6.114 dan nilai RMSE
x6
sebesar 0.782. Saat nilai awal sebesar 100
nilai JKG mnurun
menjadi 0.061 dan nilai RMSE menurun menjadi sebesar 0.078. Jika dilihat lebih jauh perubahan nilai JKG dan RMSE pada nilai awal 1 ke nilai awal 10 lebih besar dibandingkan perubahan nilai JKG dan RMSE dari nilai awal 50 ke 100. Bila dilihat dari nilai korelasi yang dicobakan pada matriks data 10x12 perubahan nilai JKG dan RMSE untuk setiap kenaikan korelasi sangatlah kecil. Pada nilai awal 100 untuk semua nilai korelasi, nilai RMSE masih cenderung sama. Ketika jumlah peubah bebas dinaikkan menjadi 50 dengan n=10 nilai JKG dan RMSE menurun seiring meningkatnya nilai awal. Perubahan nilai JKG dan RMSE pada nilai awal 1 ke 10 masih lebih besar dibanding dengan perubahan nilai JKG dan RMSE pada nilai awal 50 ke nilai awal 100. Perilaku seperti di atas berlaku untuk semua matriks data. Kecenderungan kenaikan nilai JKG dan RMSE terjadi pada matriks data dengan nilai korelasi yang tinggi.
….. 0.092
Secara umum pada n=10 dengan p=100 dan p=150 masih memiliki sifat yang sama dengan p=12 dan p=50. Peningkatan nilai awal menyebabkan nilai JKG dan RMSE menurun. Persentase perubahan nilai JKG dan RMSE dari nilai awal 1 ke nilai awal 10 lebih besar daripada perubahan nilai JKG dan RMSE pada nilai awal 50 ke nilai awal 100. Nilai ketepatan model pada p=100 dan p=150 cenderung menurun pada saat nilai korelasi datanya tinggi. Penambahan jumlah peubah bebas pada n=10 dengan berbagai kombinasi besaran korelasi yang dicobakan, belum menunjukkan suatu pola tertentu. Hal ini dapat dilihat pada matriks data dengan korelasi yang sama, nilai JKG dan RMSE mengalami peningkatan saat jumlah peubah bebasnya bertambah menjadi 50, tetapi nilai JKG dan RMSE kembali menurun saat jumlah peubah bebasnya 100 dan kemudian meningkat kembali saat jumlah peubah bebasnya 150. Perilaku JKG dan RMSE untuk ukuran matriks data yang lebih besar masih sama dengan matriks data sebelumnya. Nilai JKG dan RMSE menurun seiring peningkatan nilai awal. Perubahan nilai JKG dan RMSE pada nilai awal 1 ke 10 lebih besar dari pada perubahan nilai JKG dan RMSE pada nilai awal 50 ke 100. Untuk keseluruhan n dan p yang dicobakan, besaran JKG dan RMSE dengan model I sangat dipengaruhi oleh nilai awal. Semakin besar nilai awalnya nilai JKG dan RMSE semakin kecil. Peningkatan nilai korelasi merubah nilai JKG dan RMSE. Semakin tinggi nilai korelasi antar peubah bebasnya nilai JKG dan RMSE cenderung mengalami kenaikan. Pada n kecil dan n besar kenaikan jumlah peubah bebas merubah nilai JKG dan RMSE, tetapi secara umum belum bisa dikatakan bahwa perubahan ketepatan modelnya membentuk suatu pola ketelitian yang menurun.
y du gaan
3
2
1
0
1
2
y p e n g a matan
3
Gambar 12 Plot antara Y dugaan dan Y pengamatan,n=50, p=150, r=0.7, Nilai awal 100 prior βi ~ N (0, 0.001). Secara umum nilai ketepatan model I untuk semua ukuran matriks sangat tinggi saat nilai awalnya 100. Gambar 12 merupakan contoh plot antara y dugaan dengan y pengamatan pada matriks data n=50, p=150, r=0.7 pada nilai awal 100. Dari Gambar 12 tersebut dapat dilihat tebaran data berada disekitar garis lurus. Hal ini mengindikasikan bahwa nilai dugaan mendekati nilai pengamatan yang sesungguhnya. Pendekatan Bayes dengan Model II Informasi tambahan yang digunakan dalam model ini adalah prior konstan, prior βi = 1/ó. Pada Tabel Lampiran 2 ditampilkan hasil pengolahan data dengan model II untuk matriks data X dengan beberapa kombinasi peubah bebas dan kombinasi jumlah pengamatan. Pada matriks data 10x12 dapat dilihat bahwa nilai JKG dan nilai RMSE menurun seiring dengan meningkatnya nilai awal. Sebagai contoh data pada korelasi 0.1 untuk n=10, p=12, pada nilai awal 1 nilai JKG sebesar 5.127 dan RMSE sebesar 0.716. Saat nilai awal sebesar 100 nilai JKG adalah 0.051 dan nilai RMSE sebesar 0.05. Masih dalam besaran korelasi dan ukuran matriks data yang sama jika dilihat lebih jauh perubahan nilai JKG dan RMSE pada nilai awal 1 ke nilai awal 10 lebih besar dibandingkan dengan perubahan JKG dan RMSE dari nilai awal 50 ke nilai awal 100. Perubahan nilai JKG dan RMSE untuk setiap kenaikan korelasi pada matriks data 10x12 dapat dikatakan mempunyai kecenderungan menurun. Semakin tinggi nilai korelasi, nilai ketepatan model semakin menurun. Penurunan yang besar terjadi pada data yang mempunyai korelasi tinggi. Sebagai contoh pada nilai korelasi 0.8 ke nilai korelasi 0.9 dengan nilai awal 100, RMSE nilainya menaik dari 0.291 menjadi 0.615. Demikian pula halnya dengan nilai ketelitian pada korelasi 0.95 dan 0.98. Pada n yang sama, jika jumlah peubah bebas dinaikkan, nilai JKG dan RMSE menurun seiring
meningkatnya nilai awal. Perubahan nilai JKG dan
RMSE pada nilai awal 1 ke 10 lebih besar daripada perubahan nilai JKG pada nilai awal 50 ke 100 pada korelasi data sebesar 0.1. Kecenderungan perilaku serupa juga terjadi pada tujuh korelasi lainnya. Pada matriks data n=10 pada korelasi yang sama dan kombinasi p berbeda, nilai JKG dan RMSE mengalami perubahan tetapi tidak menunjukkan suatu pola ketepatan model yang menurun. Perilaku JKG dan RMSE untuk kombinasi n dan p lainnya secara keseluruhan sama. Pada model II besaran JKG dan RMSE, sangat dipengaruhi oleh nilai awal. Semakin besar nilai awalnya nilai ketepatan model semakin besar. Peningkatan nilai korelasi pada matriks data yang mempunyai jumlah peubah bebas dan jumlah pengamatan yang sama ketepatan modelnya cenderung mengalami penurunan. Peningkatan jumlah peubah bebas merubah nilai JKG dan RMSE, tetapi secara umum belum dapat dikatakan bahwa perubahannya membentuk suatu pola menurun.
y dugaan
3 2 1
0
1
2 y pengamatan
3
Gambar 13 Plot antara Y dugaan dan Y pengamatan, n=10, p=100, r=0.1, nilai awal 100 prior βi = 1/ó. Nilai ketepatan model pada model II secara umum masih tinggi pada berbagai kombinasi jumlah peubah bebas dan pengamatan pada tingkat korelasi yang rendah. Nilai ketepatan model untuk nilai korelasi yang tinggi cenderung lebih rendah. Gambar 13 adalah contoh plot antara y dugaan dan y pengamatan pada matriks data n=10 dan p=100 dengan korelasi 0.1 pada nilai awal 100. Dari Gambar 13 tersebut nampak bahwa tebaran data berada disekitar garis lurus. Hal ini mengindikasikan bahwa nilai y dugaan mendekati nilai y pengamatan yang sesungguhnya
Pendekatan Bayes dengan Model III Pada model III informasi tambahan yang digunakan berasal dari sebaran Gamma (2,5). Tabel Lampiran 3 menampilkan hasil analisis data dengan model III untuk semua kombinasi n dan p. Pada matriks data 10x12 untuk setiap korelasi, dapat dilihat bahwa nilai JKG dan nilai RMSE menurun seiring dengan meningkatnya nilai awal. Nilai ketepatan model III
pada matriks data 10x12 sangat rendah
dibandingkan dengan model I dan II. Sebagai contoh data pada korelasi 0.1 untuk n=10 dan p=12 nilai RMSE sebesar 1.255 pada nilai awal 100. Perubahan nilai JKG dan RMSE untuk setiap kenaikan korelasi dilihat dari delapan nilai korelasi yang dicobakan pada matriks data 10x12 dapat dikatakan mempunyai kecenderungan menurun. Jika jumlah peubah bebasnya dinaikkan menjadi 50 dengan n=10 nilai JKG dan RMSE menurun seiring meningkatnya nilai awal. Matriks data n=10 untuk p=100 dan p=150 secara umum masih memiliki sifat yang sama seperti matriks data dengan p=12 dan p=50 dalam hal pengaruh nilai awal. Pada semua kombinasi peubah bebas yang dicobakan dengan jumlah pengamatan yang sama yaitu n=10, nilai ketepatan model cenderung mengalami penurunan pada setiap kenaikan korelasi. Penambahan jumlah peubah bebas menyebabkan nilai JKG dan RMSE mengalami kenaikan. Secara keseluruhan dapat dikatakan bahwa pendekatan bayes dengan model III mempunyai nilai ketepatan model yang rendah. Nilai ketepatan model meningkat seiring dengan bertambahnya nilai awal. Dalam suatu matriks data dengan jumlah n dan p tertentu nilai ketepatannya menurun seiring dengan peningkatan korelasi. Semakin besar jumlah peubah bebasnya nilai ketepatan model cenderung semakin kecil.
Pendekatan Bayes dengan Model IV Pendekatan bayes dengan model IV menggunakan prior βi ~ Eksponensial (1), Tabel Lampiran 4 menampilkan hasil pengolahan data dengan model IV. Seperti halnya dengan tiga model sebelumnya, untuk matriks data 10x12 pada setiap korelasi, dapat dilihat bahwa nilai JKG dan nilai RMSE menurun seiring dengan meningkatnya nilai awal. Nilai ketepatan dari model dengan model IV pada matriks data 10x12 masih sangat rendah dan kisaran nilainya hampir mirip dengan model III. Sebagai contoh data pada r = 0.3, n=10, p=12 dan saat nilai awal sebesar 100 nilai RMSE yang diperoleh sebesar 1.056. Perubahan nilai JKG dan RMSE untuk setiap kenaikan korelasi dilihat dari delapan nilai korelasi yang dicobakan pada matriks data 10x12 dapat dikatakan mempunyai kecenderungan menurun. Jika jumlah peubah bebasnya dinaikkan menjadi 50 dan seterusnya, dengan n=10 nilai JKG dan RMSE menurun seiring meningkatnya nilai awal. Matriks data n=10, p=100 dan n=10, p=150 masih memiliki sifat yang sama seperti matriks data dengan p=12 dan p=50 dalam hal pengaruh nilai awal. Pada semua kombinasi peubah yang dicobakan pada jumlah pengamatan yang sama yaitu n=10, nilai ketepatan model cenderung mengalami penurunan pada setiap kenaikan korelasi. Penambahan jumlah peubah bebas cenderung menyebabkan nilai ketepatan model menjadi semakin rendah. Pada jumlah pengamatan yang lebih besar perilaku JKG dan RMSE masih sama dengan matriks data sebelumnya. Nilai JKG dan RMSE menurun seiring peningkatan nilai awal. Nilai ketepatan model model IV masih sangat kecil. Pendekatan bayes dengan model IV secara umum mempunyai nilai ketepatan model yang rendah. Nilai ketepatan model meningkat seiring dengan bertambahnya nilai awal. Pada matriks data dengan jumlah n dan p tertentu nilai ketepatan modelnya menurun seiring dengan peningkatan korelasi. Semakin besar jumlah peubah bebas nilai ketepatan model cenderung semakin rendah.
Pendekatan Bayes dengan Model V, VI dan VII Pada hasil menggunakan Model I, II, III dan IV terlihat bahwa pada pendekatan Bayes non hirarki memiliki kelemahan bila diterapkan pada struktur data dengan korelasi antar peubah bebas relatif tinggi.
Hal ini terlihat pada
keseluruhan model yang digunakan dengan menggunakan berbagai prior dan nilai awal, pendekatan Bayes non hirarki memberikan hasil besaran JKG dan RMSE yang cenderung besar dengan meningkatnya besaran korelasi. Berdasarkan hasil tersebut pada tahap selanjutnya dicobakan pendekatan Bayes hirarki menggunakan data dengan berbagai besaran korelasi antar peubah bebas. Hasil yang diperoleh diharapkan dapat memberi gambaran tentang kemungkinan penggunaan pendekatan Bayes hirarki untuk mengatasi kelemahan pada pendekatan Bayes non Hirarki. Tabel 8 Nilai JKG dan RMSE pada berbagai besaran n dan p nilai awal sembarang Struktur Model V Model VI data n p JKG RMSE JKG RMSE 12 5538647.45 744.22 0.00 0.01 50 5859395.82 765.47 0.00 0.02 10 100 7157435.55 846.02 3.74 0.61 150 4345047.31 659.17 18.68 1.37 25 17929105.26 946.81 15.25 0.87 50 26478014.96 1150.61 0.31 0.12 20 100 24848030.50 1114.63 0.15 0.09 150 25427307.47 1127.55 19.85 1.00 40 36105461.01 1015.67 34.37 0.99 80 22564860.38 802.94 0.02 0.02 35 100 38102217.35 1043.38 25.41 0.85 150 35029235.04 1000.42 0.03 0.03 60 41126209.49 906.93 38.90 0.88 50 100 40472884.12 899.70 0.43 0.09 150 58381274.61 1080.57 57.09 1.07
dengan penentuan Model VII JKG 6.44 9.79 3.74 18.68 15.25 35.01 16.67 19.85 34.37 24.41 25.41 42.26 38.90 47.12 57.09
RMSE 0.80 0.99 0.61 1.37 0.87 1.32 0.91 1.00 0.99 0.84 0.85 1.10 0.88 0.97 1.07
Pada data dengan korelasi kecil antara peubah bebas, hasil pengolahan data pada Tabel 8 menunjukkan dengan penentuan nilai awal yang sembarang Model V memberikan hasil RMSE yang relatif tinggi dibandingkan Model VI dan Model VII. Model VI dan Model VII relatif tidak dipengaruhi oleh penentuan nilai awal, hal ini terlihat pada penentuan nilai awal sembarang Model VI dan Model VII
memberikan hasil RMSE yang relatif rendah (lebih kecil dari satu). Model V memberikan hasil RMSE yang relatif sama dengan kondisi penetapan nilai awal sembarang pada penetapan nilai awal mendekati besaran nilai parameter (Tabel 9). Tabel 9 Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan Model V dengan besaran nilai awal mendekati nilai parameter n p JKG RMSE n p JKG RMSE
10
20
12
6435792.0
802.23
50
11037559.2
100
35
40
25187680.9
1587.06
1050.60
80
37283331.3
1930.89
7513819.9
866.82
100
27728635.0
1665.19
150
18022260.8
1342.47
150
49467471.8
2224.13
25
20526666.6
1013.08
60
40352295.6
1420.43
50
9769753.2
698.92
100
47084955.0
1534.36
100
17057709.1
923.52
150
43761990.1
1479.22
150
29644004.8
1217.46
50
Model VI dan Model VII relatif memberikan hasil RMSE yang relatif rendah (lebih kecil dari satu) pada berbagai kondisi n dan p.
Namun bila
diperbandingkan berdasarkan besaran RMSE yang diperoleh Model VI relatif lebih baik dibandingkan Model VII. Hal ini dapat dilihat dari besaran RMSE pada Model VI yang relatif lebih kecil dibandingkan dengan Model VII. Model V relatif dipengaruhi oleh penetapan sebaran prior β, perbedaan penetapan sebaran memberikan hasil JKG dan RMSE yang berbeda (Tabel 10). Pada Model V bila ditetapkan prior beta berdistribusi normal dan hiperprior beta berdistribusi gama diperoleh hasil JKG dan RMSE yang relatif tinggi, hasil yang sama diperoleh jika dicobakan hiperprior beta berdistribusi eksponensial. Model V bila dicobakan prior beta berdistribusi gama atau eksponensial, dan hiperprior beta berdistribusi normal, hasil yang diperoleh relatif sama. Meski demikian prior beta berdistribusi eksponensial memberikan hasil besaran JKG dan RMSE yang relatif tinggi dibandingkan prior beta berdistribusi gama.
Tabel 10 Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan Model V dengan berbagai sebaran prior β-hirarki, σ-tetap, Prior beta stage-1 normal, Prior beta stage-2 berubah
Struktu r data n
10
gama
β-hirarki, σ-tetap, Prior beta stage-1 berubah, Prior beta stage-2 normal
eksponensial
gama
eksponensial
p
JKG
RMSE
JKG
RMSE
JKG
RMSE
JKG
RMSE
12
7778153
882
7210018
849
5575380
747
7218686
850
50
8983879
948
7725858
879
4923215
702
7530181
868
100
3548539
596
6284027
793
11284712
1062
13557470
1164
150
11585814
1076
20697114
1439
16889312
1300
17431092
1320
Tabel 11 menunjukkan Model VI memberikan hasil besaran JKG dan RMSE yang sangat baik untuk berbagai bentuk sebaran prior dan hiperprior yang dicobakan. Nilai JKG dan RMSE yang diperoleh relatif sangat kecil. Model VII memberikan hasil besaran JKG dan RMSE yang relatif sama untuk nilai besaran n dan p yang sama tanpa dipengaruhi oleh penentuan sebaran prior dan hiperprior. Sebagai contoh untuk n=10 dan p=12, nilai JKG dan RMSE yang diperoleh akan sama pada empat pendekatan yang digunakan (Tabel 12). Tabel 11 Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan Model VI dengan berbagai sebaran prior Struktur data
β-hirarki, σ-hirarki, Prior beta stage-1 normal, Prior beta stage-2 berubah gama eksponensial
n
p
JKG
RMSE
JKG
RMSE
JKG
RMSE
JKG
RMSE
10
12 50 100 150
0.520 0.010 0.220 0.070
0.228 0.032 0.148 0.084
0.058 0.004 0.003 0.008
0.076 0.020 0.017 0.028
0.010 0.050 0.010 0.010
0.032 0.071 0.032 0.032
0.006 0.430 0.035 0.004
0.024 0.207 0.059 0.019
Tabel 12
β-hirarki, σhirarki, Prior beta stage-1 berubah, Prior beta stage-2 normal gama eksponensial
Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan Model VII dengan berbagai sebaran prior
Struktur data
β-hirarki, σ-hirarki, Prior beta stage-1 normal, Prior beta stage-2 berubah gama eksponensial
β-hirarki, σhirarki, Prior beta stage-1 berubah, Prior beta stage-2 normal gama eksponensial
n
p
JKG
RMSE
JKG
RMSE
JKG
RMSE
JKG
RMSE
10
12 50 100 150
6.440 9.790 3.740 18.680
0.802 0.989 0.612 1.367
6.436 9.794 3.741 18.676
0.802 0.990 0.612 1.367
6.440 9.790 3.740 18.680
0.802 0.989 0.612 1.367
6.436 9.794 3.741 18.676
0.802 0.990 0.612 1.367
4
3
3 Y-Dugaan
Y-Dugaan
4
2
2 1
1
0
0 0
1
2
3
4
Y-Pengamatan
Gammbar 14 Model VI, n=10, p=12. Gambar 15 Model VI, n=20, p=100
0
1
2
3
Y-Pengamatan
4
Tabel 13 Nilai JKG dan RMSE pada Berbagai Besaran n dan p menggunakan Model VI dan VII Struktur data Model VI Model VII r
n 10
20 0.8 35
50
p
JKG
RMSE
JKG
RMSE
12 50 100 150 25 50 100 150 40 80 100 150 60 100 150
1.796 4.544 4.009 4.059 1.798 2.715 3.862 4.040 9.027 5.172 6.892 6.437 12.872 4.383 10.865
0.424 0.674 0.633 0.637 0.424 0.521 0.621 0.636 0.950 0.719 0.830 0.802 1.135 0.662 1.042
1.795 4.544 4.009 4.059 0.386 2.716 3.865
0.424 0.674 0.633 0.637 0.196 0.521 0.622
46359.34
68.088
9.027 5.173 6.894 6.44 12.871 4.076 10.864
0.950 0.719 0.830 0.802 1.135 0.638 1.042
Berdasarkan hasil sebelumnya, hanya model VI dan model VII
yang
dicobakan untuk data simulasi n<
modelnya mempunyai kecenderungan menurun seiring dengan bertambahnya nilai korelasi. Pada Model I dan II, untuk semua n yang dicobakan, kenaikan jumlah peubah memberikan pengaruh perubahan terhadap nilai ketelitian tetapi perubahannya belum menunjukkan suatu pola. Untuk Model III dan IV kenaikan jumlah peubah untuk jumlah pengamatan yang sama cenderung menyebabkan nilai ketelitian semakin menurun. Khusus untuk korelasi antar peubah bebas tinggi, secara keseluruhan pendekatan Bayes hirarki memberikan hasil lebih baik dibandingkan pendekatan Bayes non hirarki. Model V sangat dipengaruhi oleh penetapan nilai awal σ2 dan bentuk sebaran prior β. Besaran JKG yang diperoleh pada Model V relatif lebih tinggi dibandingkan dua model lainnya.
Model VI tidak dipengaruhi oleh
penetapan nilai awal. Pada Model VI penentuan sebaran prior β yang berbeda memberikan hasil JKG yang relatif sama dan RMSE yang sedikit berbeda, namun relatif lebih rendah dibandingkan dua model pendekatan lainnya. Model VII tidak dipengaruhi oleh penetapan nilai awal σ2 dan penentuan sebaran prior â, namun hasil JKG yang diperoleh relatif lebih tinggi dibandingkan dengan Model VI, dan RMSE yang diperoleh relatif lebih besar dibandingkan dengan Model VI. Sehingga bila diperbandingkan antara model V, VI dan VII maka Model VI bersifat robust dan menghasilkan nilai JKG dan RMSE yang lebih baik dibandingkan Model V dan dan Model VII. Berdasarkan beberapa kondisi diatas pendekatan Bayes hirarki lebih tepat digunakan dalam penyusunan model kalibrasi, dibandingkan jika menggunakan pendekatan Bayes non hirarki. Model VI merupakan model terbaik yang dapat digunakan untuk penyusunan model kalibrasi
BAB V SIFAT-SIFAT STATISTIK DARI DUGAAN MODEL KALIBRASI DENGAN PENDEKATAN BAYES A. Pendahuluan Model kalibrasi menggambarkan hubungan antara berbagai respons dari instrumen analitik dengan satu atau lebih karakteristik dari suatu bahan aktif. Model ini mengandung parameter yang nilainya harus diduga dari referensi agar dapat digunakan untuk menduga karakteristik dari bahan aktif baru yang belum diketahui. Pada penelitian ini model kalibrasi dirumuskan dalam persamaan y = Xβ, y adalah vektor berukuran nx1 dengan unsur-unsurnya merupakan nilai konsentrasi senyawa
aktif
hasil
pengukuran
dengan
High
Performance
Liquid
Chromatography (HPLC). Matriks X berukuran nxp merupakan matriks data hasil pengukuran menggunakan Fourier Transform Infrared (FTIR). Perilaku umum X yaitu, antar kolom mariks X terdapat multikolinear dan besaran n jauh lebih kecil dari p (n<
(5.1)
θ1 ∼ N(A2θ2, C2)
(5.2)
θ2 adalah vektor parameter yang berukuran px1, A1 dan A2 adalah matriks nonsingular berukuran nxp yang berpangkat p, serta C1 dan C2 adalah matriks berukuran nxn yang diketahui besarannya, maka : (a) Sebaran marjinal y akan mengikuti sebaran N(A1A2θ2, C1+ A1C2 A1′ )
(5.3)
(b) θ1|y ∼ N(Bb, B);
(5.4)
B −1 = A1'C1−1 A1 + C 2−1 b = A1'C1−1 y + C 2−1 A2 θ 2 Pembuktian kedua hal diatas diuraikan sebagai berikut: (a) Sebaran marjinal y akan mengikuti sebaran Normal (A1A2θ2, C1+ A1C2 A1′ ) Bukti: Penggabungan
(5.1) dan (5.2) dapat dituliskan dalam bentuk persamaan
berikut: y = A1θ1+u, u ∼ N(0, C1)
(5.5)
θ1 = A2θ2+v, v ∼ N(0, C2)
(5.6)
Berdasarkan (5.5) dan (5.6) y dapat dirumuskan sebagai berikut: y = A1A2θ2 + A1v + u, u dan v saling bebas E(y) = E(A1A2θ2 + A1v + u) = E(A1A2θ2) + E(A1v) + E(u) = A1A2θ2
(5.7)
Var (y) = Var (A1A2θ2 + A1v + u) = Var(A1A2θ2) + Var(A1v + u) = Var(A1v + u) = Var (A1v ) + Var(u) = A1C2 A1′ + C1
(5.8)
Berdasarkan (5.7) dan (5.8) terbukti bahwa Sebaran marjinal y mengikuti sebaran Normal (A1A2θ2, C1+ A1C2 A1′ ) (b) θ1|y ∼ N(Bb, B);
(5.9)
B −1 = A1'C1−1 A1 + C 2−1 b = A1'C1−1 y + C 2−1 A2 θ 2 Bukti : P(θ1|y) =
P( y | θ 1 ) P(θ 1 ) P( y )
, karena P(y) bukan fungsi dari θ1 maka dapat
dituliskan P(θ1|y) ∼ P(y|θ1) P(θ1)
(5.10)
Jika y ∼ N(A1θ1, C1), dan θ1 ∼ N(A2θ2, C2) maka persamaan (5.10) dapat dituliskan sebagai berikut: P(θ1|y) ∼ e-½Q Q = ( y − A1θ 1 ) 'C1−1 ( y − A1θ 1 ) + (θ 1 − A2 θ 2 ) 'C 2−1 (θ 1 − A2 θ 2 ) Bila B −1 = A1'C1−1 A1 + C 2−1 , dan b = A1'C1−1 y + C 2−1 A2 θ 2 maka '
'
'
'
Q = θ 1 B −1θ 1 − 2b θ 1 + ( y C1−1 y + θ 2 A2'C 2−1 A2 θ 2 ) '
'
= (θ 1 − Bb) 'B −1 (θ 1 − Bb) + ( y 'C1−1 y + θ 2 A2'C 2−1 A2 θ 2 − b Bb) = (θ 1 − Bb) 'B −1 (θ 1 − Bb) + Kons tan ta
(5.11)
Persamaan (5.11) membuktikan bahwa θ1|y ∼ N(Bb, B) C. Model Kalibrasi dengan Model Normal Pendekatan Bayes Pada pendekatan Bayes seringkali diasumsikan sebaran prior β mengikuti sebaran normal. Jika diasumsikan pengamatan (yi) saling bebas dan berasal dari populasi normal dengan rataan Xβ dan ragam σ2I, yi∼ N(Xβ, σ2I),
i = 1, 2, ... , n
Fungsi kepekatan peluang dari yi adalah f ( y i / β , σ ) = (2πσ ) 2
2
−
1 2
1 exp − ( yi − X β ) 2 2 2σ
(5.12)
Fungsi kemungkinan dari n data diperoleh sebagai berikut : f ( y / β , σ ) = (2πσ ) 2
2
−
n 2
1 exp − ( y − X β ) '( y − X β ) , 2 2σ
Jika y i − X β = y i − X β + Xβˆ− Xβˆ, maka : f ( y / β ,σ 2 ) = (2πσ 2 )
−
n 2
1 exp− 2 (( y − X βˆ) '( y − X βˆ) + (β − βˆ) 'X 'X (β − βˆ) + kons tan ta) 2σ (5.13)
Bila digunakan metode prior sekawan, L(β/y) = f(y/β) akan diperoleh L( β , σ 2 / y ) = (2πσ 2 )
−
n 2
1 exp − (( y − X βˆ) '( y − X βˆ) + ( β − βˆ) 'X 'X ( β − βˆ) 2 2σ
∝ (σ 2 )
−
( n −k −2) −1 2
k
− 1 1 exp − (( y − X βˆ) '( y − X βˆ) x(σ 2 ) 2 exp − ( β − βˆ) 'X 'X ( β − βˆ 2 2 2 σ 2 σ (5.14)
L(β,σ2/y) mengikuti sebaran normal gamma, dimana sebaran dari β|σ2 adalah Normal(β,(X’X) -1σ2) dan sebaran marginal dari σ2 adalah kebalikan gamma dengan derajat bebas (n-k-2). Jika prior sekawan gabungan β dan σ2 adalah π(β,σ2) maka π(β,σ2) = π(β|σ2). π(σ2), dimana π(β|σ2) = N(β0, σ2M0-1) dan π(σ2) = iG(S0, v0), sehingga sebaran posterior dapat diperoleh sebagai berikut π (β,σ2/y) = L(β,σ2/y). π(β|σ2). π(σ2)
∝ (σ 2 )
−
n 2
S exp − 2 2σ
1 ˆ' ' ˆ exp − 2σ 2 ( β − β ) X X ( β − β )
k v x (σ 2 ) − 2 exp − 1 2 ( β − β ) 'M 0 ( β − β ) (σ 2 ) − 2 −1 exp − S 0 2 2σ 0 0 2σ 0
∝ (σ 2 )
−
( v0 + n ) −1 2
k − S 1 exp− 1 2 (σ 2 ) 2 exp− (β − β 1 ) 'M 1 (β − β 1 ) (5.15) 2 2σ 2σ
M1 = X’ X + M0
[
]
β1 = M 1−1 M 0 β 0 + X 'Xβˆ S = ( y − X βˆ) '( y − X βˆ) S1 = S0 + S + Sâ
[
(
S β = ( β 0 − βˆ) 'M 0−1 + X 'X
)
] (β
−1 −1
0
− βˆ)
Nilai tengah dari sebaran posterior (β) diperoleh melalui penurunan log dari fungsi posterior sebagai berikut: ∂Logπ ( β , σ 2 / y ) ∂β ∂Logπ ( β , σ 2 / y ) ∂β
=
[
]
∂ ( β − βˆ) 'X 'X ( β − βˆ) + ( β − β 0 ) 'M 0 ( β − β 0 ) (5.16) ∂β
= 0, 2 X 'X β − 2 X 'X βˆ+ 2M 0 β − 2 M 0 β 0 = 0 ( X 'X + M 0 ) β = X 'X βˆ+ M 0 β 0
β = ( X 'X + M 0 ) −1 ( X 'X βˆ+ M 0 β 0 )
(5.17)
Sedangkan besaran ragam dari β|y,σ2 diperoleh sebagai berikut:
[
] )]
V ( β / y, σ 2 ) = V ( X 'X + M 0 ) −1 ( X 'X βˆ+ M 0 β 0 )
[
= ( X 'X + M 0 ) −1V ( X 'X βˆ+ M 0 β 0
[
= ( X 'X + M 0 ) −1 X 'XV ( βˆ) + M 0V ( β 0 )
[
]
= ( X 'X + M 0 ) −1 ( X 'X )( X 'X ) −1 σ 2 + M 0 M 0−1σ 2 = ( X 'X + M 0 ) −1σ 2
] (5.18)
Persamaan (5.17) dan (5.18) setara dengan (5.4) untuk B = ( X 'X + M 0 ) −1 dan b = X 'X βˆ+ M 0 β 0 Berdasarkan hasil diatas dapat diringkaskan bahwa sebaran data, sebaran prior dan sebaran posterior adalah sebagai berikut: Sebaran data
: y|X,β ∼ Normal (Xβ, σ2I)
Sebaran prior
: β|σ2 ∼ Normal (β0, σ2M0-1) σ2 ∼ IG2 (S0, v0)
Sebaran posterior : β|y,σ2 ∼ Normal (β1, σ2M1-1 σ2 ∼ IG2 (S1, v1), v1= v0+n
Nilai harapan dari nilai tengah posterior dapat diuraikan sebagai berikut:
[
E ( β 1 ) = E ( X 'X + M 0 ) −1 ( X 'X βˆ+ M 0 β 0 )
[
]
E ( β 1 ) = ( X 'X + M 0 ) −1 X 'XE ( βˆ) + M 0 E ( β 0 )
]
(5.19)
Pada penduga parameter menggunakan Metode Kuadrat terkecil E ( βˆ) = β, dan β adalah konstanta dengan E(β0)= β, sehingga E(β 1 ) = ( X 'X + M 0 ) −1 ( X 'X + M 0 )β =β Oleh karena itu β1 merupakan penduga tak berbias bagi β. Sedangkan pada pendekatan Bayes besarnya bias pada pendugaan parameter β, sangat dipengaruhi oleh simpangan antara besaran β0 terhadap β. C. Model Linier Umum Pendekatan Bayes Berhirarki Smith (1973) menguraikan model linier umum pendekatan Bayes sebagai berikut: Jika y ∼ N(A1θ1, C1),
(5.20)
θ1 ∼ N(A2θ2, C2),
(5.21)
θ2 ∼ N(A3θ3, C3),
(5.22)
maka : (a) Sebaran marjinal θ1 akan mengikuti sebaran Normal (A2A3θ3, C2+ A2C3A2′ ) Bukti: Penggabungan (5.20) dan (5.21) dapat dituliskan dalam bentuk persamaan berikut: θ1 = A2θ2+u, u ∼ N(0, C2)
(5.23)
θ2 = A3θ3+v, v ∼ N(0, C3) (5.24) Berdasarkan (5.23) dan (5.24) y dapat dirumuskan sebagai berikut: θ1 = A2A3θ3 + A2v + u, u dan v saling bebas E(θ1) = E(A2A3θ3 + A2v + u) = E(A2A3θ3) + E(A2v) + E(u) = A2A3θ3
(5.25)
Var (θ1) = Var (A2A3θ3 + A2v + u) = Var(A2A3θ3) + Var(A2v + u) = Var(A2v + u) = Var (A2v ) + Var(u) = A2C3 A2′ + C2
(5.26)
Berdasarkan (5.25) dan (5.26) terbukti bahwa Sebaran marjinal θ1 mengikuti sebaran Normal (A2A3θ3, C2+ A2C3 A2′ ) *
(b) θ1|Ai, Ci, θ3, y ∼ N( θ 1 , D1);
(5.27)
[
]
D1−1 = A1'C1−1 A1 + C 2 + A2 C 3 A2'
[
−1
(5.28)
]
−1
d = A1'C1−1 y + C 2 + A2 C 3 A2' A2 A3 θ 3
(5.29)
*
θ 1 = D1d
(5.30)
Dˆ1 adalah sampling dispersion matriks.
Jika θˆ1 adalah penduga kuadrat terkecil dari θ1 maka diperoleh persamaan * Dˆ1−1θ 1 = A1'C1−1 y
(5.31)
Dˆ1−1 = A1'C1−1 A1
(5.32)
Sehingga persamaan (5.28) dan (5.29) dapat dituliskan sebagai berikut:
[
]
−1 D1−1 = Dˆ1−1 + C2 + A2C3 A2'
[
(5.33)
]
D1−1θ 1 = Dˆ1−1θˆ1 + C 2 + A2 C 3 A2' *
−1
A2 A3 θ 3
(5.34)
Jika C3−1 = 0 , persamaan (5.33) dan (5.34) dapat dituliskan sebagai berikut: D1−1 = A1'C1−1 A1 + C2−1 − C2−1 A2 ( A2'1C2−1 A2 ) −1 A2'C2−1
(5.35)
* D1−1θ 1 = Dˆ1−1θˆ1
(5.36) *
Berdasarkan (5.36) dapat diperoleh θ 1 dengan langkah-langkah penguraian sebagai berikut: Jika persamaan (5.35) dirumuskan dalam persamaan D1−1 = D - EFE’ D = A1'C1−1 A1 + C 2−1 ; E = C 2−1 A2 ; F = −( A2'1C 2−1 A2 ) −1 Menggunakan konsep matriks kebalikan (D + EFE’ )-1 = D-1 - D-1E(E’ D-1E + F-1)-1E’ D-1, diperoleh
[
{
D1 = ( A1'C1−1 A1 + C2−1 ) −1 I + C2−1 A2 A2'1C2−1 A2 − A2'1C2−1 x ( A2'1C 2−1 A1 + C 2−1 ) C 2−1 A2
}
−1
A2'1C 2−1 ( A1'C1−1 A1 + C 2−1 ) −1
]
(5.37)
Menggunakan operasi matriks (D+B)-1=D-1- D-1(D-1+B-1)-1 D-1 persamaan dalam kurung kurawal dapat dituliskan sebagai berikut:
{
A2' ( A1'C1−1 A1 ) −1 + C2
}
−1
A2
(5.38)
dan
{
C2−1 ( A1'C1−1 A1 + C2−1 ) −1 = ( A1'C1−1 A1 ) −1 + C2
} (AC −1
' −1 −1 1 1 1
A)
(5.39)
Berdasarkan persamaan ( 5.36), (5.37), (5.38) dan (5.39) dapat diperoleh persamaan bagi θ 1* sebagai berikut:
[
[
−1 −1 * θ 1 = ( A1'C1−1 A1 + C 2−1 ) −1 A1'C1−1 A1θˆ1 + C 2−1 A2 A2'{( A1'C1−1 A1 ) −1 + C 2 } A2 ]
{
−1 xA2' ( A1'C1−1 A1 ) −1 + C 2 } θˆ1
]
θ 1 = ( A1'C1−1 A1 + C 2−1 ) −1 ( A1'C1−1 A1θˆ1 + C 2−1 A2 D2 D2−1θˆ2 ) *
* θ 1 = ( A1'C1−1 A1 + C 2−1 ) −1 ( A1'C1−1 A1θˆ1 + C 2−1 A2 θˆ2 )
(5.40)
Kondisi C3−1 = 0 merupakan model Bayes non hirarki, sehingga persamaan (5.40) identik dengan persamaan (5.9). D. Kuadrat Tengah Galat Penduga Bayes Pada sub bab ini ingin dilakukan pembandingan efektifitas pendugaan antara dugaan Bayes dan dugaan kuadrat terkecil. Secara umum penduga Bayes adalah berbias, untuk pembandingan efektifitas hasil dugaan pendekatan Bayes dan pendekatan Kuadrat Terkecil digunakan kuadrat tengah galat. Persamaan (5.33) dan (5.34) dengan menghilangkan subscripts pada setiap peubah dapat dituliskan sebagai berikut: * ( Dˆ−1 + B −1 )θ = Dˆ−1θˆ+ B −1θˆ0
(5.41)
θ0 adalah prior rataan, sedangkan B adalah dispersion matrix. Bila didefinisikan: Z = ( Dˆ−1 + B −1 ) −1 Dˆ−1 dan W = I-Z, maka persamaan (5.41) dapat dituliskan dalam persamaan * θ = Zθˆ+ W θˆ0
(5.42)
Kuadrat tengah galat (KTG) dari θ* dapat dirumuskan KTG(θ*) = Ey|θ{( θ*- θ)’ ( θ*- θ)} = Ey|θ{( θˆ- θ)’ Z’ Z( θˆ- θ)} + ( θ- θ0)’ W’ W ( θ- θ0) = trace{ DˆZ’ Z} + ( θ- θ0)’ W’ W ( θ- θ0)
(5.43)
Berdasarkan persamaan (5.43) terlihat bahwa besaran KTG(θ*) sangat dipengaruhi oleh selisih antara nilai θ dan θ0. Semakin kecil selisih antara θ dan θ0, maka semakin kecil besaran KTG(θ*) yang diperoleh. Pada persamaan (5.41) θˆ adalah penduga kuadrat terkecil dengan besaran KTG ( θˆ) = trace ( Dˆ). Penduga bayes akan lebih baik dari penduga kuadrat terkecil bila KTG(θ*) < KTG ( θˆ) atau KTG(θ*) < trace ( Dˆ). Kondisi tersebut akan dipenuhi jika dan hanya jika trace ( Dˆ) ≥ trace{ DˆZ’ Z} + ( θ- θ0)’ W’ W ( θ- θ0)
(5.44)
Sebelum mengkaji kondisi yang diperlukan untuk memenuhi persamaan (5.44), terlebih dahulu ingin dilakukan pembuktian bahwa trace ( Dˆ) ≥ trace{ DˆZ’ Z} Dˆ- Dˆ(Z’ Z) = Dˆ(I - Z’ Z) = Dˆ(I - Z’ (I – W)) = Dˆ− ( Dˆ−1 + B −1 ) −1 + ( Dˆ−1 + B −1 ) −1 B −1
{
}
{
(5.45)
}
trace ( Dˆ−1 + B −1 ) −1 B −1 = trace ( Dˆ−1 + B −1 ) −1 B −1 ( Dˆ−1 + B −1 ) −1 ≥ 0
(5.46)
Penggabungan (5.46 ) kedalam (5.45) menghasilkan persamaan berikut Trace { Dˆ- Dˆ(Z’ Z)} ≥ trace{ Dˆ− ( Dˆ−1 + B −1 ) −1 } > 0 Trace { Dˆ- Dˆ(Z’ Z)} > 0 trace ( Dˆ) ≥ trace{ DˆZ’ Z} (terbukti) Oleh karena trace ( Dˆ) ≥
trace{ DˆZ’ Z) maka persamaan (5.44) dapat
diinterpretasikan sebagai berikut:
Semakin kecil selisih antara θ dan θ0
(mendekati nol) maka penduga Bayes akan menghasilkan kuadrat tengah galat yang lebih kecil dibandingkan penduga kuadrat terkecil.
Smith (1973)
mengemukakan bahwa pendekatan Bayes bila digunakan untuk proses pendugaan akan memberikan nilai harapan kuadrat tengah galat yang lebih kecil bila dibandingkan dengan penduga kuadrat terkecil.
E. Simpulan Dugaan parameter model menggunakan pendekatan Bayes bersifat bias. Besarnya bias dipengaruhi oleh penetapan prior parameter model. Semakin kecil selisih antara nilai prior yang ditetapkan dengan nilai parameter sesungguhnya, maka semakin kecil bias yang dihasilkan. Oleh karena itu diperlukan kehatihatian dalam penetapan besaran prior.
E. Hasil dan Pembahasan Eksplorasi Data Gingerol Pada hasil pengukuran serbuk Gingerol menggunakan FTIR (Fourier Transform Infrared), jumlah pasangan titik persentase transmitan dan bilangan gelombang yang dihasilkan untuk setiap spektrum sebanyak 1866 titik. Gambar 17 menyajikan spektrum hasil keluaran FTIR untuk 20 contoh serbuk gingerol yang diamati. Secara umum terlihat bahwa keseluruhan spektrum memiliki pola
Persen Transmitan
yang sama, karena setiap senyawa aktif memiliki pola spektrum tertentu.
1 0.8 0.6 0.4 0.2 0
4400
3400
2400
1400
400
Bilangan Gelombang (cm-1)
Gambar 17 Spektrum serbuk Gingerol untuk 20 contoh. Tahapan eksploratif berikut adalah pendekatan kuantitatif untuk melihat kesamaan pola spektrum keluaran FTIR. Tahapan ini diharapkan dapat dimanfaatkan bila pada suatu kondisi diperoleh suatu spektrum yang tidak teridentifikasi jenis senyawa aktifnya, maka dengan mengetahui kesamaan pola spektrum senyawa aktif tersebut dengan senyawa aktif yang sudah teridentifikasi, senyawa aktif tersebut dapat teridentifikasi. Pada setiap contoh dihitung selisih transmitan antara ulangan, rataan dan ragam dari selisih kedua transmitan tersebut disajikan pada Tabel 17. Nilai ragam maksimal diperoleh pada contoh kedua daerah Kulonprogo yaitu sebesar 0.001809. Pada Gambar 18 terlihat bahwa kedua spektrum pada contoh kedua daerah Kulonprogo tersebut relatif sejajar. Sehingga selanjutnya besaran ragam selisih transmitan pada contoh kedua daerah Kulonprogo tersebut dipakai sebagai ragam pembanding ( S 02 , pada penjelasan persamaan 6.8) dalam pengujian kesejajaran antara spektrum Gingerol.
Oleh karena setiap contoh memiliki
spektrum yang sama, pada tahap selanjutnya untuk setiap contoh digunakan ratarata persen transmitan dari dua spektrum ulangan dalam setiap contoh.
Persen Transmitan
Tabel 17 Rataan dan ragam selisih persentase transmitan Gingerol antar ulangan dalam setiap contoh Daerah Contoh Rataan Ragam Kulonprogo 1 0.064785 0.000164 2 0.001809 0.190851 Karanganyar 1 0.130953 0.000561 2 0.111714 0.001398 3 0.009168 3.91E-05 4 0.091665 0.000645 5 0.266308 0.000747 Majalengka 0.063764 0.000349 Balitro 0.029061 0.000254 Bogor 0.010813 1.41E-05 Maksimum 0.001809 1 0.8 0.6 0.4 0.2
0 4400
3400
2400
1400
400
Bilangan Gelombang (cm-1)
Gambar 18 Spektrum serbuk Gingerol Contoh 2 Kulonprogo Tabel 18 F-hit kesejajaran spektrum Gingerol antar contoh dalam daerah yang sama Daerah Kulonprogo
Karanganyar
2 1
0.176394
1
0.085483
2 3 4
Keterangan: F tab 0.05(1865,1865) ∼1
3
4
5
0.70588
0.235705
0.722594
0.230612
0.078801
0.318076
0.396927
0.413781 0.150937
Pada keseluruhan pengujian kesejajaran spektrum gingerol antar contoh dalam daerah yang sama diperoleh nilai F-hit yang lebih kecil dari F-tab (Tabel 18). Hal ini menunjukkan bahwa spektrum gingerol antar contoh dalam daerah yang sama relatif sejajar. Oleh karena itu pada tahap selanjutnya dari setiap daerah dihitung rata-rata persen transmitan dari keseluruhan spektrum daerah tersebut yang akan digunakan untuk pengujian kesejajaran spektrum antar daerah. Tabel 19 F-hit kesejajaran spektrum Gingerol antar daerah Jawa Tengah Majalengka Balitro Bogor
DIY 0.093661 0.668432 Jawa Tengah 1.185382 Majalengka Balitro Keterangan: F tab 0.05(1865,1865) ∼1
0.034376 0.188165 0.540885
0.526098 1.341768 0.128810 0.695839
Tabel 19 menyajikan pengujian kesejajaran spektrum Gingerol antar daerah. Hasil keseluruhan menunjukkan bahwa spektrum gingerol antar daerah relatif sejajar.
Pada pengujian kesejajaran antara spektrum gingerol
daerah Jawa
Tengah dan Majalengka serta Jawa Tengah dan Bogor diperoleh nilai F-hitung sedikit lebih besar dari satu, meski demikian keputusan yang diambil adalah spektrum ketiga daerah tersebut relatif dianggap sejajar. Kondisi ini diperjelas melalui Gambar 19, ketiga daerah tersebut relatif memiliki pola spektrum yang P e rse n T ra n sm ita n
sama. 1 0.8
Jaw a-Tengah
0.6
M ajalengk a
0.4
B ogor
0.2
0 4400
3400
2400
1400
400
Bila n g a n G e lo m b a n g (cm -1)
Gambar 19 Spektrum serbuk Gingerol daerah Jawa Tengah, Majalengka dan Bogor Keseluruhan hasil yang diperoleh memperlihatkan bahwa spektrum yang dihasilkan dari 20 contoh yang digunakan memiliki pola yang relatif sama,
sehingga selanjutnya cukup diperlukan satu model kalibrasi saja untuk ke-20 data contoh tersebut. Berdasarkan literatur diketahui bahwa setiap senyawa kimia memiliki pola spektrum tertentu. Hasil akhir tahapan eksplorasi diatas memperkuat kondisi tersebut, bahwa hanya diperlukan satu model kalibrasi untuk Gingerol yang berasal dari berbagai sumber berbeda.
Langkah-langkah pengerjaan diatas
memberikan alternatif teknik statistika yang dapat digunakan untuk melihat kesamaan pola spektrum.
Langkah pengerjaan diatas dapat diterapkan pada
kondisi terdapat suatu spektrum yang belum teridentifikasi dan ingin diketahui jenis senyawa kimia yang terkandung didalamnya.
Pengujian kesejajaran
spektrum kimia tersebut terhadap spektrum senyawa kimia yang telah teridentifikasi dapat memberi jawaban tentang identifikasi senyawa kimia tersebut. Model Kalibrasi Gingerol Tabel 20 Konsentrasi Gingerol 20 pengamatan Daerah Kulonprogo Karanganyar
Majalengka Balitro Bogor
Contoh 1 2 1 2 3 4 5
Konsentrasi Gingerol Ulangan 1
Ulangan 2
0.63 0.72 0.58 0.52 0.79 0.63 0.78 1.26 1.18 1.24
0.53 0.78 0.53 0.54 0.78 0.63 0.79 1.6 1.14 1.07
Konsentrasi Gingerol dari 20 contoh yang diukur menggunakan HPLC (High Performance Liquid Chromatography) tersaji pada Tabel 20. Pada Gambar 17 disajikan grafik persen transmitan dari 20 contoh yang diperoleh dari hasil pengukuran serbuk Gingerol menggunakan FTIR (Fourier Transform Infrared).
Jumlah pasangan titik
persentase transmitan dan bilangan gelombang yang
dihasilkan untuk setiap contoh sebanyak 1866 titik. Setiap pola spektrum terdiri dari titik yang menunjukkan hubungan antara bilangan gelombang (cm-1) dengan persentase transmittan yang dihasilkan oleh FTIR. Banyaknya titik yang dihasilkan mengakibatkan dimensi yang dihasilkan oleh setiap pola spektrum sangat besar. Bila diperhatikan secara seksama ternyata pola spektrum yang dihasilkan dapat dipartisi menjadi beberapa penggalan garis, dengan setiap partisi memilliki pola spektrum tertentu. Berdasarkan pola yang diperoleh pada setiap partisi, dapat dilakukan pereduksian jumlah titik dalam partisi tersebut. Sebagai contoh pada suatu partisi yang terdiri dari 20 titik dan membentuk suatu pola garis lurus, maka sesungguhnya cukup hanya diambil sedikitnya dua titik saja dari partisi tersebut. Sehingga jumlah data yang semula 20 titik dapat direduksi menjadi dua titik.. Pada penelitian ini dilakukan pereduksian data menggunakan pendekatan regresi terpenggal. Konsep pendekatan ini yaitu dengan membuat sekatan dengan setiap sekatan membentuk suatu persamaan regesi linier sederhana. Kriteria penentuan jumlah titik pada setiap partisi yaitu berdasarkan besaran koefisien Determinasi (R2) yang diperoleh dengan menggunakan regresi linier sederhana tersebut. Jumlah titik yang berada dalam satu partisi akan ditentukan oleh besaran R2 yang ditetapkan ( R02 ). Semakin tinggi nilai penetapan R02 , akan semakin kecil jumlah titik yang dihasilkan untuk setiap partisi. Penguraian konsep pendekatan regresi sekatan diuraikan secara rinci pada BAB III. Pada penelitian ini pereduksian data dicobakan pada beberapa besaran R02 . Hasil pereduksian jumlah pasangan data persentase transmitan dan bilangan gelombang dengan sepuluh kriteria R02 yang digunakan tertera pada Tabel 21 Gambar 20, 21 dan 22 menyajikan spektrum hasil pereduksian menggunakan pendekatan regresi terpenggal untuk R02 = 0.98 (D8), R02 = 0.99 (D9) dan R02 = 0.999 (D4).
Secara keseluruhan dapat terlihat bahwa pendekatan regresi
terpenggal dapat mereduksi jumlah titik tanpa menghilangkan pola spektrum awal. Semakin besar kriteria R02 yang digunakan semakin banyak jumlah titik hasil yang diperoleh.
1
1
0.8
0.8
Pe r s e n T r an s m itan
Persen Transm itan
Tabel 21 Jumlah titik persentase transmitan Gingerol hasil reduksi menggunakan pendekatan Regresi Terpenggal Jumlah Titik Hasil Kode Data R02 (p*) D1 0.8 4 D2 0.83 4 D3 0.85 4 D4 0.88 4 D5 0.9 4 6 D6 0.92 0.95 6 D7 0.98 14 D8 0.99 22 D9 0.999 108 D10
0.6 0.4 0.2
0 4400
3400
2400
1400
0.6 0.4 0.2
0 4400
400
Bilangan Gelom bang (cm -1)
3400
2400
1400
400
Bilan g an Ge lo m b an g (cm -1)
Gambar 20 Spektrum serbuk Gingerol D8
Gambar 21 Spektrum serbuk Gingerol D9
Pe r s e n Trans m itan
1 0.8 0.6 0.4 0.2
0 4400
3400
2400
1400
400
Bilangan Ge lom bang (cm -1)
Gambar 22 Spektrum serbuk Gingerol D10 Model kalibrasi yang akan disusun merupakan suatu fungsi hubungan persentase transmitan (X) yang dihasilkan oleh FTIR dengan konsentrasi Gingerol (y) yang diperoleh dari hasil pengukuran HPLC. Pada penelitian ini ketepatan model yang dihasilkan dilihat dari beberapa kriteria yaitu besaran R2, JKG dan RMSEP. Perangkat lunak yang digunakan adalah Winbugs14.
Hayati (2005), melakukan suatu penelitian pengaruh waktu penyimpanan serbuk gingerol terhadap konsentrasi gingerol. Hasil yang diperoleh menunjukan adanya pengaruh yang cukup berarti waktu simpan terhadap konsentrasi senyawa aktif yang dihasilkan.
Pada penelitian ini terdapat perbedaan waktu simpan
rimpang Jahe dan Temulawak hasil pengamatan contoh berbagai daerah dan waktu simpan rimpang Jahe dan Temulawak hasil percobaan. Sehingga pada penyusunan model kalibrasi perlu ditambahkan peubah dummy waktu simpan. Pada pengamatan menggunakan FTIR, seringkali dijumpai untuk dua spektrum dengan konsentrasi gingerol yang sama diperoleh hasil persen transmitan yang berbeda. Pada pengamatan 20 contoh serbuk gingerol, hal ini dijumpai pada ulangan-1 contoh-1 Kulonprogo dan ulangan1 dan 2 contoh 4 Karanganyar. Ketiga serbuk gingerol tersebut memilik konsentrasi yang sama yaitu 0.63, tetapi memiliki nilai persen transmitan yang berbeda. Gambar 23 menunjukkan tiga contoh dengan besaran konsentrasi gingerol yang sama tersebut memiliki besaran persen transmitan yang berbeda pada tiap bilangan gelombang tertentu.
Arnita (2005) pada penelitiannya menunjukkan perlunya dilakukan
koreksi pencaran pada spektrum gingerol. Koreksi pencaran dapat menjadikan pola dan posisi spektrum tiap contoh lebih mendekati rujukannya dalam hal ini spektrum rata-rata keseluruhan contoh. Hal ini mengakibatkan informasi yang diberikan spektrum tiap contoh relatif sama. Model kalibrasi yang dibentuk dari data yang dikoreksi pencarannya mampu memberikan nilai RMSEP, MSEP dan SEP yang lebih kecil dibanding model kalibrasi yang dibentuk dari data yang
Persen T ran sm itan
Pe rse n Tran smitan
tidak dikoreksi pencarannya. 1 0 .8 0 .6 0 .4 0 .2
0 4 40 0
3 40 0
2 40 0
1 40 0
4 00
Bilangan Ge lo mb ang (cm-1)
Gambar 23 Spektrum serbuk Gingerol dengan konsentrasi 0.63.
0.8 0.6 0.4 0.2
0 4400
3400
2400
1400
400
Bilan g an Ge lo m b an g (cm -1)
Gambar 24 Spektrum serbuk Gingerol 20 contoh setelah dikoreksi pencaran
Gambar 24 menyajikan spektrum 20 contoh setelah dilakukan koreksi pencaran, ternyata pola dan posisi spektrum yang dihasilkan akan lebih mengumpul mendekati spektrum rata-rata keseluruhan contoh Pada tahap awal penyusunan model kalibrasi dilakukan hanya untuk data D8 dengan berbagai kemungkinan model yaitu, model kalibrasi data D8 (Model D8), model kalibrasi data D8 dengan koreksi pencaran (Model D8k), model kalibrasi data D8 dengan pembobot waku simpan (Model D8w)
dan model
kalibrasi data D8 dengan koreksi pencaran serta pembobot waku simpan (Model D8kw). Model kalibrasi dibuat dengan menggunakan 15 contoh, sedangkan 5 contoh lainnya digunakan untuk validasi model. Besaran R2, JKG dan RMSEP untuk setiap model tersaji pada Tabel 22. Hasil pengolahan keempat model diatas menunjukkan bahwa model kalibrasi D8w dan D8kw memberikan hasil R2, JKG dan RMSEP terbaik dibanding model lainnya. Tabel 22 R2, JKG dan RMSEP model D8, D8k, D8w dan D8kw Model D8 D8k D8w D8kw
R2 0.9196 0.9312
0.9929 0.9803
JKG
RMSE
0.1157 0.0990 0.0149 0.0284
0.0878 0.0813 0.0262 0.0435
Berdasarkan hasil penyusunan model kalibrasi untuk D8, pada tahap selanjutnya untuk mendapatkan model kalibrasi terbaik bagi gingerol, disusun model kalibrasi dengan memasukkan pembobotan waktu penyimpanan untuk berbagai data reduksi hasil pendekatan regresi terpenggal. Keseluruhan model dicobakan dengan menggunakan koreksi pencaran dan tanpa koreksi pencaran. Pada tahap pembentukan model kalibrasi, nilai R2, JKG dan RMSE yang dihasilkan untuk berbagai model tertera pada Tabel 23. Pada tahap validasi model, nilai dugaan yang diperoleh untuk 5 contoh serta besaran JKG dan RMSEP yang dihasilkan tertera pada Tabel 24.
Tabel 23 R2, JKG dan RMSE penyusunan model Kalibrasi Gingerol Model
P*
D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
4 4 4 4 4
Tanpa Koreksi Pencaran R2 JKG RMSE 0.7997 0.2883 0.1386 0.8282 0.2473 0.1284 0.8252 0.2516 0.1295 0.8140 0.2677 0.1336 0.8044 0.2815 0.1370 0.7842 0.3106 0.1439 0.9432 0.0818 0.0738 0.9929 0.0149 0.0262
6 6
14 22 108
0.9998 0.8987
0.0002 0.1458
0.0038 0.0986
Dengan Koreksi Pencaran R2 JKG RMSE 0.9381 0.9035 0.8987 0.8956 0.9298 0.9380 0.9324 0.9803 1.0000 0.9015
0.0891 0.1389 0.1458 0.1503 0.1010 0.0892 0.0973 0.0284 0.0000 0.1417
0.0771 0.0962 0.0986 0.1001 0.0821 0.0771 0.0806 0.0435 0.0017 0.0972
Tabel 24. Nilai dugaan konsentrasi Gingerol (y-duga) pada validasi model y (HPLC) 0.63 0.78 0.54 0.63 1.24 JKG RMSEP y (HPLC) 0.63 0.78 0.54 0.63 1.24 JKG RMSEP
D1 0.69 0.73 0.81 0.79 1.04 0.1418 0.1684
D2 0.60 0.67 0.66 0.57 1.25 0.0311 0.0789
D3 0.67 0.72 0.66 0.60 1.25 0.0194 0.0622
D1 0.70 0.47 0.64 0.54 1.18 0.1254 0.1584
D2 0.70 0.60 0.63 0.56 1.24 0.0517 0.1017
D3 0.75 0.64 0.61 0.58 1.25 0.04 0.0895
y-duga (Tanpa Koreksi Pencaran) D4 D5 D6 D7 0.66 0.66 0.68 0.70 0.72 0.73 0.75 0.61 0.66 0.67 0.67 0.69 0.60 0.60 0.59 0.62 1.25 1.26 1.26 1.00 0.0208 0.0211 0.0218 0.1136 0.0645 0.0649 0.066 0.1508 y-duga (Dengan Koreksi Pencaran) D4 D5 D6 D7 0.78 0.77 0.76 0.76 0.66 0.60 0.55 0.49 0.61 0.59 0.59 0.57 0.60 0.60 0.62 0.64 1.23 1.19 1.18 1.23 0.0417 0.0599 0.0747 0.1009 0.0913 0.1095 0.1222 0.142
D8 0.26 0.52 0.78 0.29 1.05 0.4087 0.2859
D9 0.73 0.53 0.44 0.56 1.00 23.9939 2.1906
D8 0.82 0.47 0.64 0.65 1.00 0.1973 0.1987
D9 0.55 0.53 0.32 0.62 1.03 0.1605 0.1792
D10 -14.70 0.42 11.79 3.34 -1.51 376.471 8.6772 D10 -7.90 0.46 0.57 11.73 -0.23 116.042 4.8175
Pada tahap pembentukan model, besaran nilai R2 pada model dengan menggunakan koreksi pencaran relatif lebih tinggi dibandingkan model tanpa koreksi pencaran. Seiring dengan hasil tersebut, besaran nilai JKG dan RMSE pada model dengan menggunakan koreksi pencaran lebih kecil dibandingkan model tanpa koreksi pencaran. Secara keseluruhan nilai R2 terbesar dan nilai JKG serta RMSE terkecil diperoleh pada model D8 dan D9. Namun tidak berarti kedua model tersebut merupakan model terbaik yang dihasilkan. Pada model D8 dan D9 besaran p* yang dihasilkan relatif besar (14 dan 22). dikhawatirkan
mengakibatkan
munculnya
masalah
Hal ini
overparameterisasi.
Permasalahan ini terlihat dengan memperhatikan hasil validasi model pada Tabel 24, model D8, D9 dan D10 ternyata memiliki besaran nilai JKG dan RMSEP lebih besar dibanding model lainnya. Tujuan penyusunan model kalibrasi adalah mendapatkan model terbaik untuk melakukan pendugaan konsentrasi suatu senyawa aktif.
Model kalibrasi terbaik adalah model yang memiliki tingkat
validasi terbaik, artinya nilai dugaan yang diperoleh mendekati nilai pengamatan yang sesungguhnya. Sehingga model terbaik yang digunakan adalah model yang memiliki besaran JKG dan RMSEP terkecil. Secara keseluruhan pada setiap model besaran JKG dan RMSEP yang dihasilkan dengan menggunakan koreksi pencaran cenderung lebih tinggi dibandingkan bila tidak menggunakan koreksi pencaran. Sebagai contoh pada model D4 dengan menggunakan koreksi pencaran dihasilkan JKG dan RMSEP masing-masing sebesar 0.0417 dan 0.0913.
Sedangkan model D4 bila tidak
menggunakan koreksi pencaran menghasilkan JKG dan RMSEP sebesar 0.0208 dan 0.0645. Diantara sepuluh model kalibrasi yang dicobakan, model D3 tanpa menggunakan koreksi pencaran merupakan model dengan besaran JKG dan RMSEP terkecil, JKG untuk model tersebut adalah 0.0194 dan RMSEP sebesar 0.0622. Gambar 25 dan 24 menyajikan plot JKG serta RMSEP untuk D1, D2, D3, D4, D5, D6, D7, D8, D9 dan D10. Besaran JKG dan RMSEP minimum diperoleh pada interval besaran R02 = 0.84 sampai dengan R02 = 0.86, dan ternyata nilai minimum JKG dan RMSEP diperoleh pada R02 = 0.85, titik ini merupakan titik yang memberikan hasil terbaik. Sehingga secara keseluruhan model D3 merupakan model kalibrasi Gingerol yang terbaik untuk digunakan. Gambar 27 menunjukkan plot antara nilai y dugaan (y-duga) pada model D3 dan nilai y hasil pengamatan dengan HPLC (y-(HPLC)). Plot yang diperoleh mendekati pola persamaan garis y-duga = y-(HPLC), sehingga hasil y dugaan yang diperoleh dengan model D3 sangat mendekati nilai y pengamatan (y-(HPLC)). Arnita (2005) menggunakan data yang sama dengan penelitian ini menyusun model kalibrasi untuk Gingerol menggunakan pendekatan Regresi Komponen Utama dengan memasukan peubah waktu simpan sebagai peubah boneka. Sebelumnya data terlebih dahulu dilakukan koreksi pencaran, RMSEP
yang diperoleh dari penelitian tersebut sebesar 0.1096. Memperbandingkan besaran RMSEP yang dihasilkan, model kalibrasi dengan menggunakan pendekatan regresi terpenggal pada tahap awal serta pendekatan Bayes dengan memasukan peubah waktu simpan merupakan alternatif pendekatan yang baik untuk digunakan dalam penyusunan model kalibrasi Gingerol. 0.50 Tanpa Koreksi Pencaran Dengan Koreksi Pencaran
JKG
0.40 0.30 0.20 0.10 0.00 0.8 0.82 0.84 0.86 0.88 0.9 0.92 0.94 0.96 0.98
1
R2-std
0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00
Ta n p a K o re ks i P e n ca ra n Dengan K o re ks i P e n ca ra n
0.8 0.82 0.84 0.86 0.88 0.9 0.92 0.94 0.96 0.98
1
R2-std
Gambar 26. Pola RMSEP pada seluruh model kalibrasi Gingerol
1 .5 y-d u g a
RM S E P
Gambar 25. Pola JKG pada seluruh model kalibrasi Gingerol
1 0 .5 0 0
0 .5
1
1 .5
y-(HPL C )
Gambar 27. Plot y-duga dan y-(HPLC) Gingerol model D3
Eksplorasi Data Kurkumin Tahapan pengujian kesejajaran untuk spektrum Kurkumin serupa dengan langkah-langkah pada pengujian kesejajaran spektrum Gingerol. Pengujian kesajajaran spektrum kurkumin hanya dicobakan pada data 16 pengamatan dari 8 contoh petani dua daerah sentra tanaman obat (Kulonprogo dan Karanganyar). Tabel 25 Rataan dan ragam selisih persentase transmitan Kurkumin antar contoh dalam setiap petani Daerah Contoh Rataan Ragam Kulonprogo 1 0.05107 0.00170 2 0.09343 0.00028 3 0.04730 0.00010 Karanganyar 1 0.04179 0.00016 2 0.02049 0.00014 Balitro 0.02851 0.00018 Bogor 0.01399 0.00008 Sukabumi 0.01773 0.00013 Maksimum 0.00170 Pada setiap contoh dihitung selisih transmitan antara ulangan, rataan dan ragam yang diperoleh dari selisih kedua transmitan tersebut disajikan pada Tabel 25. Nilai ragam maksimal diperoleh pada contoh dari daerah Kuningan yaitu sebesar 0.00170. Besaran nilai ragam selisih transmitan tersebut ternyata masih menunjukkan kesejajaran kedua spektrum, hal ini terlihat pada Gambar 28. Sehingga selanjutnya besaran ragam selisih
transmitan pada contoh daerah
Kulonprogo tersebut dipakai sebagai ragam pembanding dalam pengujian kesejajaran antara spektrum Kurkumin.
Oleh karena setiap contoh memiliki
spektrum yang sama, pada tahap selanjutnya untuk setiap contoh digunakan rata-
Persen T ran smitan
rata persen transmitan dari dua spektrum ulangan dalam setiap contoh. 1 0 .8 0 .6 0 .4 0 .2
0 4400
3400
2400
1400
400
Bilan g an Ge lo mb an g (cm-1)
Gambar 28 Spektrum serbuk Kurkumin contoh ke-1 daerah Kulonprogo
Tabel 26 F-hitung kesejajaran spektrum Kurkumin antar petani dalam daerah yang sama Daerah Kulonprogo
2 0.113718 1 2 Karanganyar 1 Keterangan: F-tabel 0.05(1865,1865) ∼1
3
0.135199 0.016010 0.340390
Pada keseluruhan pengujian kesejajaran spektrum Kurkumin antar petani dalam daerah yang sama diperoleh nilai F-hitung yang lebih kecil dari F-tabel (Tabel 26). Hal ini menunjukkan bahwa spektrum Kurkumin antar petani dalam daerah yang sama relatif sejajar. Oleh karena itu pada tahap selanjutnya dari setiap daerah dihitung rata-rata persen transmitan dari keseluruhan spektrum, yang selanjutnya akan digunakan untuk pengujian kesejajaran spektrum antar daerah. Tabel 27 F-hitung kesejajaran spektrum Kurkumin antar daerah Daerah Karanganyar Balitro Cianjur Bogor Sukabumi Kulonprogo 0.009233 0.292531 0.045139 0.033212 0.031456 Karanganyar 0.476025 0.011950 0.038891 0.008311 Balitro 0.540702 0.476743 0.495371 Cianjur 0.018637 0.014700 Bogor 0.018532 Keterangan: F-tabel 0.05(1865,1865) ∼1 Tabel 27 menyajikan pengujian kesejajaran spektrum Kurkumin antar daerah. Nilai F-hitung keseluruhan lebih kecil dari satu (F-tabel) Hasil tersebut menunjukkan
bahwa
spektrum
Kurkumin
antar
daerah
relatif
sejajar.
Berdasarkan keseluruhan hasil tersebut maka untuk Kurkumin hanya perlu dibentuk satu model kalibrasi dengan menggunakan 20 contoh data yang ada. Model Kalibrasi Kurkumin Konsentrasi Gingerol dari 40 contoh yang diukur menggunakan HPLC (High Performance Liquid Chromatography) tersaji pada Tabel 28 dan Tabel 29. Pada Gambar 29 disajikan grafik persen transmitan dari 40 contoh yang diperoleh dari hasil pengukuran serbuk Kurkumin menggunakan FTIR (Fourier Transform
Infrared). Jumlah pasangan titik persentase transmitan dan bilangan gelombang yang dihasilkan untuk setiap contoh sebanyak 1866 titik. Tabel 28. Konsentrasi Kurkumin 16 pengamatan contoh berbagai daerah Daerah
Contoh
Kulonprogo
Karanganyar
Konsentrasi Kurkumin Ulangan 1
Ulangan 2
1 2
0.65
0.63
1.01
1.13
3
0.92
0.90
1 2
1.61
1.66
0.47
0.50
1.38
1.57
1.57
1.74
1.30
1.24
Balitro Bogor Sukabumi
Tabel 29. Konsentrasi Kurkumin 24 pengamatan hasil percobaan Perlakuan
Persen Transmitan
K0P0 K0P30 K0P60 K0P90 K1P0 K1P30 K1P60 K1P90
Konsentrasi Kurkumin Ulangan 1
Ulangan 2
Ulangan 3
0.85 0.70 0.80 0.74 0.80 0.76 0.83 0.84
0.71 0.85 0.70 0.67 0.87 0.60 0.72 0.72
0.83 0.78 0.63 0.61 0.81 0.85 0.71 0.84
1 0.8 0.6 0.4 0.2
0 4400
3400
2400
1400
400
Bilangan Gelom bang (cm-1)
Gambar 29 Spektrum serbuk Kurkumin 40 pengamatan
Pada tahap awal dilakukan pereduksian data persentase transmitan menggunakan pendekatan regresi terpenggal. Pereduksian data dicobakan pada beberapa besaran R02 , hasil pereduksian jumlah pasangan data persentase transmitan dan bilangan gelombang dengan sepuluh kriteria R02 yang digunakan tertera
pada Tabel 30.
Gambar 30, 31 dan 32 menyajikan spektrum hasil
pereduksian menggunakan pendekatan regresi terpenggal untuk R02 =0.98 (D8), R02 =0.99 (D9) dan R02 =0.999 (D4). Secara keseluruhan dapat terlihat bahwa
pendekatan regresi terpenggal dapat mereduksi jumlah titik tanpa merubah pola spektrum Kurkumin. Semakin besar kriteria R2 yang digunakan semakin banyak jumlah titik hasil yang diperoleh, pola spektrum yang dihasilkan akan semakin mendekati pola spektrum awal. Tabel 30 Jumlah titik persentase transmitan Kurkumin hasil reduksi menggunakan pendekatan Regresi Terpenggal R02
Jumlah Titik Hasil (p*)
0.8 0.83 0.85 0.88 0.9 0.92
2 4 4 4 6
Persen Transmitan
Persen Transm itan
1 0.8 0.6 0.4 0.2
3400
2400
D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
6 6 10 14 54
0.95 0.98 0.99 0.999
0 4400
Kode Data
1400
400
B ilangan G e lombang (cm-1)
Gambar 30 Spektrum serbuk Kurkumin D8.
1 0.8 0.6 0.4 0.2
0 4400
3400
2400
1400
400
Bilangan Gelombang (cm-1)
Gambar 31 Spektrum serbuk Kurkumin D9.
Persen Transm itan
1 0.8 0.6 0.4 0.2
0 4400
3400
2400
1400
400
B ilangan G e lombang (cm-1)
Gambar 32 Spektrum serbuk Kurkumin D10. Model kalibrasi Kurkumin yang akan disusun merupakan suatu fungsi hubungan
persentase transmitan Kurkumin (X) yang dihasilkan oleh FTIR
dengan konsentrasi Kurkumin (y) yang diperoleh dari hasil pengukuran HPLC. Data persentase transmitan yang digunakan adalah data setelah direduksi menggunakan pendekatan regresi terpenggal. Pada penelitian ini ketepatan model yang dihasilkan dilihat dari beberapa kriteria yaitu besaran nilai R2, Jumlah Kuadrat Galat (JKG) dan RMSEP. Model kalibrasi Kurkumin dibuat dengan menggunakan 35 contoh, sedangkan 5 contoh lainnya digunakan untuk validasi model.
Pada tahap
pembentukan model kalibrasi, nilai R2, JKG dan RMSE yang dihasilkan untuk berbagai model tertera pada Tabel 31 Pada keseluruhan model yang diperoleh model D2 memiliki nilai R2 terbesar dan nilai JKG serta RMSE terkecil dibandingkan model yang lainnya. Besaran nilai R2, JKG dan RMSE pada D2 masing-masing adalah 0.03061, 2.8788 dan 0.3481. Tabel 31 R2, JKG dan RMSE penyusunan model Kalibrasi Kurkumin Model p* D1 2 D2 4 D3 4 D4 4 D5 6 D6 6 D7 6 D8 10 D9 14 D10 54
R2
JKG
RMSE
0.0000 0.3061 0.2656 0.0952 0.1864 0.2221 0.2576 0.4696 0.6635 1.0000
4.9058 2.8788 3.0468 3.7536 3.3754 3.2274 3.0800 2.2003 1.3962 0.0000
0.4494 0.3481 0.3738 0.4088 0.3790 0.3709 0.3647 0.2987 0.2288 0.0006
Pada tahap validasi model, nilai dugaan yang diperoleh untuk 5 contoh serta besaran JKG dan RMSEP yang dihasilkan tertera pada tabel 32 Hasil keseluruhan model menunjukkan bahwa model kalibrasi D2 memberikan hasil JKG dan RMSEP terkecil dibanding model lainnya. Pada model D2 diperoleh JKG = 0.057 dan RMSEP = 0.107. Tabel 32 Nilai dugaan konsentrasi Kurkumin (y-duga) pada validasi model y (HPLC) 0.92 1.24
0.85 0.67 0.71 JKG RMSEP
D1 0.84 0.94 1.06 1.06 0.88 0.318 0.252
D2 1.09 1.07 0.84 0.71 0.71 0.057 0.107
D3 1.03 1.13 0.67 0.78 0.71 0.071 0.119
D4 1.00 1.01 0.99 1.00 0.80 0.194 0.197
y-duga D5 D6 1.03 1.00 1.03 1.01 0.99 0.76 0.78 0.82 0.79 0.81 0.093 0.099 0.136 0.141
Gambar 33 dan 32 menyajikan plot JKG
D7 0.92 1.17 0.75 0.78 0.90 0.061 0.111
D8 0.84 1.13 0.43 0.66 0.93 0.242 0.220
D9 1.13 1.41 0.66 0.68 0.71 0.109 0.148
D10 0.43 0.81 0.71 0.99 0.72 0.541 0.329
serta RMSEP untuk model
kalibrasi D1, D2, D3, D4, D5, D6, D7, D8, D9 dan D10. Besaran JKG dan RMSEP minimum diperoleh pada besaran R2standar = 0.83, sehingga titik ini merupakan titik yang memberikan hasil terbaik. Secara keseluruhan model D2 merupakan model kalibrasi Kurkumin yang terbaik untuk digunakan. Gambar 35 menunjukkan plot antara nilai y dugaan (y-duga) pada model D2 dan nilai y hasil pengamatan dengan HPLC (y-(HPLC)). Plot yang diperoleh mendekati pola persamaan garis y-duga = y-(HPLC), artinya hasil y dugaan yang diperoleh dengan model D2 sangat mendekati nilai y pengamatan (y-(HPLC)).
RM SEP
0 .4 0 0 .3 0 0 .2 0 0 .1 0 0 .0 0 0 .8
0 .8 5
0 .9 R
2
0 .9 5
1
std
Gambar 33 Pola JKG pada seluruh model kalibrasi Kurkumin
JKG
0.60 0.50 0.40 0.30 0.20 0.10 0.00 0.8
0.85
0.9
0.95
1
R2std
Gambar 34 Pola RMSEP pada seluruh model kalibrasi Kurkumin
y-duga
1.50 1.00 0.50 0.00 0.00
0.50
1.00
1.50
y-(HPLC)
Gambar 35 Plot y-duga dan y-(HPLC) Kurkumin model D2 F. Simpulan Pada penyusunan model kalibrasi Gingerol dan Kurkumin dijumpai permasalahan dimensi data yang besar, jumlah ukuran contoh yang Sangat kecil dibandingkan jumlah peubah bebas serta adanya multikolinier antara peubah bebas. Dimensi data yang besar menyebabkan perlunya dilakukan pereduksian data, yaitu untuk mempercepat dan mempermudah proses analisa data. Pendekatan regresi terpenggal merupakan teknik reduksi yang baik digunakan untuk mereduksi jumlah persen transmitan yang dihasilkan oleh FTIR. Pendekatan regresi terpenggal memiliki kelebihan karena mempertahankan pola spektrum awal, mudah pengerjaannya, dan menggunakan acuan nilai yang baku yaitu koefisien Determinasi. Pendekatan regresi terpenggal tidak ditujukan untuk menghilangkan kolinearitas antara peubah bebas. Sehingga data hasil pendekatan ini selanjutnya sebaiknya diolah dengan metode pendekatan yang tidak dipengaruhi adanya kolinearitas diantara peubah bebas. pendekatan tersebut adalah pendekatan Bayes.
Salah satu metode
Konsentrasi Gingerol yang dihasilkan dari serbuk Jahe Sangat dipengaruhi oleh waktu penyimpanan serbuk Jahe. Sehingga pada penyusunan model kalibrasi Gingerol perlu dimasukkan peubah dummy waktu simpan. Pendekatan Bayes dengan perilaku parameter model β berhirarki dan σ acak Sangat baik digunakan untuk pembentukan model kalibrasi Gingerol. Pada penyusunan model kalibrasi Gingerol menggunakan pendekatan Bayes dengan perilaku parameter model β berhirarki dan σ acak tidak diperlukan koreksi pencaran spektrum. Nilai RMSEP pada model kalibrasi Gingerol dengan menggunakan pendekatan tersebut jauh lebih kecil bila dibandingkan dengan menggunakan pendekatan lain, seperti Regresi Komponen Utama. Pendekatan Bayes dengan perilaku parameter model β berhirarki dan σ acak juga sangat baik digunakan untuk pembentukan model kalibrasi Kurkumin. Pada penyusunan model kalibrasi Kurkumin tidak diperlukan peubah dummy umur simpan, karena konsentrasi Kurkumin tidak dipengaruhi oleh umur simpan serbuk Temulawak. Nilai RMSEP pada model kalibrasi Kurkumin dengan menggunakan pendekatan tersebut relatif kecil, sehingga ketepatan pendugaan dengan pendekatan ini relatif baik.
BAB VI MODEL KALIBRASI GINGEROL DAN KURKUMIN DENGAN MENGGUNAKAN PENDEKATAN BAYES (Studi Kasus Tanaman Temulawak dan Jahe di Daerah Jawa Tengah, Daerah Istimewa Yogyakarta dan Jawa Barat) A. Pendahuluan Pada BAB III dilakukan pembandingan beberapa pendekatan Bayes non hirarki dan pendekatan Bayes hirarki untuk data n<
Hal ini
mengindikasikan bahwa pendekatan Bayes non hirarki kurang tepat bila diterapkan untuk penyusunan model kalibrasi. Pada pendekatan Bayes berhirarki secara
keseluruhan
menunjukkan
hasil
yang
lebih
baik
dibandingkan
menggunakan pendekatan Bayes non hirarki. Hasil yang diperoleh menunjukkan bahwa model VI relatif lebih baik dan bersifat robust dibandingkan dua model pendekatan Bayes hirarki lainnya. B. Tujuan Pada bab ini akan dilakukan penyusunan model kalibrasi untuk senyawa aktif Gingerol (5-αHidroksil-(1-hidroksi-3metoksifenil)-3-dekana) pada rimpang jahe dan model kalibrasi untuk senyawa aktif Kurkumin (1,7-bis(4-hidroksi-3 metoksipenil)1,6-heptadiena-3,5dione)
pada
rimpang
temulawak
dengan
menggunakan pendekatan Bayes Model VI, yaitu pendekatan Bayes dengan perilaku parameter model β berhirarki dan σ acak.
C. Tinjauan Pustaka Validasi Model Penyusunan suatu model umumnya mempunyai dua tujuan yaitu melakukan pendugaan parameter model atau pendugaan nilai amatan. Pada model yang bertujuan untuk melakukan pendugaan nilai amatan, salah satu langkah penting yang perlu dilakukan adalah menguji kemampuan model saat menduga nilai y. Terdapat beberapa metode pengujian kemampuan model (validasi model), diantaranya adalah dengan membagi data menjadi dua bagian. Data dibagi dengan porsi yang berbeda, data pada bagian pertama digunakan untuk membentuk model dan data selainnya untuk validasi atau pengujian. Salah satu ukuran yang dapat digunakan untuk validasi model adalah dengan mengevaluasi akar kuadrat tengah galat (RMSE = Root Mean Square Error). Model dikatakan valid jika memiliki nilai RMSE yang kecil. Rumusan RMSE dapat dituliskan dalam persamaan berikut: RMSE =
MSE =
2 E ( yˆ − y )
(6.1)
MSE : Mean Square Error (Kuadrat Tengah Galat / KTG). Pada umumnya validasi model dilakukan pada beberapa contoh pengujian dan menggunakan nilai pengujian tersebut untuk menghasilkan nilai RMSE dugaan atau yang disebut dengan RMSEP. Nilai pengujian dugaan (RMSEP) tersebut dapat dituliskan dalam bentuk persamaan berikut: Np
∑ ( yˆ
RMSEP =
− yi ) 2 / N p
i
i =1
(6.2)
yˆ dan y adalah nilai dugaan dan pengamatan pada contoh pengujian, Np adalah jumlah contoh pengujian. Bentuk lain pengukuran yang banyak digunakan dalam validasi model kalibrasi adalah Standard Error Prediction (SEP). SEP dapat dituliskan dalam bentuk persamaan berikut : SEP =
Np
∑ ( yˆ i =1
Deviasi =
i
− yi − Deviasi) 2 /( N p − 1)
Np
∑ ( yˆ i =1
i
− yi ) / N p
(6.3) (6.4)
Deviasi dapat diinterpretasikan sebagai rata-rata selisih nilai dugaan dan pengukuran dalam himpunan prediksi. Ketelitian suatu model (accuracy) dapat dilihat dari nilai RMSEP yang kecil. Sedangkan untuk mengukur ketepatan suatu model (precision) nilai SEP dapat dijadikan sebagai bahan evalusi. Hubungan RMSEP dan SEP dapat ditulis dalam bentuk : RMSEP2 ≈ SEP2 + DEVIASI2
(6.5)
Alasan mengapa persamaan di atas tidak tepat sama adalah bahwa pembagi yang digunakan dalam menghitung SEP adalah Np-1 sedangkan RMSEP adalah Np. Sehingga dapat diuraikan bahwa perbedaan antara ketelitian (accuracy) dan ketepatan (precision) adalah, ketepatan mengacu pada perbedaan antara pengulangan pengukuran, sedangkan ketelitian mengacu pada perbedaan antara nilai dugaan dan nilai pengkuran.(Naes et al. 2002). Kriteria lain yang banyak digunakan untuk validasi model adalah nilai koefisien korelasi antara nilai y pengukuran dan dugaannya pada contoh pengujian, Hildrum et al. (1983) dalam Naes et al. (2002) menyebutnya sebagai Relatif Ability of Prediction (RAP), dan melihat plot antara keduanya. Model dikatakan baik jika pengamatannya berada pada garis lurus yang membentuk sudut 450. Sehingga plot tersebut juga dapat digunakan untuk mengidentifikasi daerah dengan tingkat ketelitian pendugaan yang berbeda (Naes et al. 2002). Analisis Kesejajaran dengan Pendekatan Uji Ragam Erfiani et al (2004) melakukan kajian beberapa metode pendekatan untuk melihat kesamaan pola spektrum keluaran FTIR. Kesamaan pola spektrum dapat didekati dengan melihat kesejajaran pola spektrum.
Beberapa metode yang
dicobakan adalah analisis kesejajaran menggunakan pendekatan Regresi Sederhana, pendekatan uji ragam serta pendekatan metode titik balik. Pada pendekatan uji ragam, pengujian kesejajaran dua buah kurva dilakukan dengan cara menguji ragam dari selisih dua kurva tersebut. Jika Y1 dan Y2 kurva yang merupakan fungsi dari X yang diperoleh dari pengamatan atau Y1i=f(Xi) dan Y2i=f(Xi) dengan i=1,..., n. Jarak antar pengamatan pada kedua kurva tersebut
(di=|Y1i-Y2i|) mempunyai ragam sama dengan nol jika kedua kurva tersebut sejajar. Pengujian hipotesis ragam sama dengan nol, menggunakan statistik uji :
χ
2 hitung
(n −1)sd2 = σ2
(6.6)
...
Hipotesisnya adalah : H0 : σ 2 = 0 H1 : σ 2 ≠ 0
(6.7)
÷2hitung memiliki sebaran Khi-kuadrat dengan derajat bebas (n-1). Kesimpulan Tolak H0 dapat diartikan kedua kurva tidak sejajar. Bila nilai ó2 mendekati nol 2 maka persamaan (6.6) akan menghasilkan nilai χ hitung sebesar tak hingga dan
2 hal tersebut akan cenderung menolak H0 berapapun besar S d . Oleh karena itu uji
tersebut perlu dimodifikasi, salah satunya dengan cara merubah konstan nol pada hipotesis menjadi suatu konstanta k yang nilainya mendekati nol. Konstanta k merupakan batasan nilai suatu ragam masih dianggap nol. Bila k merupakan suatu besaran ragam pembanding ( σ 02 ) yang diduga dari contoh berukuran n, maka persamaan (6.7) dapat dimodifikasi menjadi bentuk hipotesis sebagai berikut: H0 : σ 2 = σ 02 atau H0 :
σ2 =1 σ 02
H1 : σ 2 ≠ σ 02
σ2 ≠1 σ 02
H1 :
Statistik uji yang digunakan adalah Fhit =
(6.8)
S2 , akan mengikuti sebaran F(n-1, n-1) S 02
D. Bahan dan Metode Data yang digunakan adalah data hasil pengukuran HPLC dan FTIR pada ekstrak rimpang Jahe dan Temulawak.
Hasil pengukuran HPLC berupa
konsentrasi Gingerol dari serbuk rimpang Jahe dan konsentrasi Kurkumin dari serbuk rimpang Temulawak. Hasil pengukuran FTIR berupa persen transmitan
Gingerol dari serbuk rimpang Jahe dan persen transmitan Kurkumin dari serbuk rimpang Temulawak pada interval bilangan gelombang tertentu. Simplisia contoh rimpang jahe dan temulawak diperoleh dari tiga sumber yaitu: 1. Data hasil pengamatan rimpang temulawak dan jahe dua daerah sentra produksi tanaman obat yaitu Kulonprogo-Jawa Tengah dan Karanganyar-D.I. Yogyakarta. Pengamatan dilakukan pada periode waktu 27 juli 2003 sampai dengan 1 agustus 2003. Pada masing-masing contoh dilakukan pengamatan (ulangan) sebanyak dua kali 2. Data hasil percobaan rimpang temulawak di Kebun percobaan BiofarmakaIPB yang berlokasi di Cikabayan-Bogor. Percobaan dilakukan pada masa tanam oktober 2003 sampai dengan agustus 2004. Faktor yang dicobakan terhadap tanaman temulawak ada 2 faktor, yaitu: a. Faktor Pupuk Organik dengan 2 taraf pemberian pupuk yaitu K0 = 0 ton/ha K1 = 5 ton/ha b. Pupuk anorganik dengan 4 taraf pada (N= 60 kg/Ha dan K2O= 75 kg/Ha), yaitu: P0 : dosis pupuk P2O5 = 0 kg/Ha P30 : dosis pupuk P2O5 = 30 kg/Ha P60 : dosis pupuk P2O5 = 60 kg/Ha P90 : dosis pupuk P2O5 = 90 kg/Ha Rancangan yang digunakan adalah rancangan faktorial acak kelompok dengan 8 jenis kombinasi perlakuan. Dalam percobaan ini rimpang temulawak diperlakukan dibawah naungan. Jumlah kelompok (ulangan) dalam percobaan ini ditetapkan 3 kelompok sehingga percobaan ini memerlukan sebanyak 24 petak percobaan 3. Pembelian contoh rimpang jahe dan temulawak yang berasal dari Balitro, Bogor, Majalengka dan Sukabumi. Pada masing-masing contoh dilakukan pengamatan (ulangan) sebanyak dua kali Jumlah contoh rimpang Jahe dan Temulawak untuk keseluruhan tersaji pada Tabel 14.
Tabel 14 Jumlah pengamatan rimpang Jahe dan rimpang Temulawak Sumber
Jahe
Temulawak
Kulonprogo
4
6
Karanganyar
10
4
Balitro
2
2
Bogor
2
2
Majalengka
2
-
Sukabumi
-
2
K0P0
-
3
K0P30
-
3
K0P60
-
3
K0P90
-
3
K1P0
-
3
K1P30
-
3
K1P60
-
3
K1P90 Total
-
3
20
40
Pada penelitian ini Spektrometer IR yang digunakan adalah Spektrometer IR (IRP
restige-21/FTIR-8400s,
Shimadzu
Fourier
Transform
Infrared
-1
Spektrophotometer) dengan spesifikasi resolusi: 4 cm , pada kisaran bilangan gelombang : 400 cm-1–4000 cm-1 dan scan : 10. Struktur matriks data keluaran FTIR tersaji pada Tabel 15. Keluaran HPLC berupa konsentrasi Gingerol untuk setiap contoh ekstrak rimpang Jahe dan konsentrasi Kurkumin untuk setiap ekstrak rimpang Temulawak. Tabel 16 menyajikan struktur data keluaran HPLC.
Tabel 15 Matriks data persentase transmitan keluaran FTIR Sampel
1
-1
Bilangan Gelombang (cm ) 3996.249 3994.320 3992.391 3990.462 3988.534 3986.605
……. 399.239
2 . . n
Tabel 16 Struktur data konsentrasi Gingerol Contoh
1
2
3
…..
n
Konsentrasi Gingerol Tahapan analisis dalam penyusunan model kalibrasi dapat diuraikan dalam bentuk diagram seperti tersaji pada Gambar 16. Pada tahap awal dilakukan pengujian kesamaan pola spektrum keluaran FTIR. Tahapan ini dilakukan dengan tujuan memperoleh gambaran kesamaan pola spektrum antar pengamatan pada daerah yang sama atau antar pengamatan pada daerah yang berbeda. Hasil yang diperoleh dapat menjadi acuan penentuan banyaknya model kalibrasi yang harus dibuat untuk setiap senyawa aktif. Apabila antara daerah memiliki pola spektrum yang berbeda, maka model kalibrasi dibuat untuk setiap daerah amatan. Sebaliknya bila antara daerah memiliki pola spektrum yang sama untuk suatu senyawa aktif, maka cukup dibuat satu model kalibrasi untuk setiap senyawa aktif. Dua pola spektrum akan memiliki pola yang sama bila kedua spektrum tersebut sejajar. Pada uraian berikutnya kesamaan pola spektrum disebut sebagai kesejajaran spektrum. Langkah awal pada pengujian kesejajaran spektrum adalah penentuan konstanta k, yang merupakan batasan besaran ragam selisih persentase transmitan dari dua spektrum yang dianggap sejajar. Pada tahap ini dihitung ragam selisih persentase transmitan antar ulangan pada setiap contoh. Maksimum ragam yang diperoleh digunakan sebagai k dalam pengujian hipotesis kesejajaran spektrum. Langkah selanjutnya adalah melakukan pengujian kesejajaran spektrum antara contoh dalam daerah yang sama. Bila ternyata spektrum antara contoh
dalam suatu daerah tidak sejajar maka model kalibrasi dibentuk untuk setiap contoh.
Bila antara contoh tersebut memiliki spektrum yang sejajar, maka
dilanjutkan dengan pengujian kesejajaran spektrum antara daerah yang berbeda. Model kalibrasi akan dibuat untuk setiap daerah bila pola spektrum antara setiap daerah tidak sejajar, sebaliknya bila pola spektrum antara daerah sejajar akan dibuat satu model kalibrasi untuk keseluruhan daerah. Data keluaran FTIR berupa persentase transmitan dan bilangan gelombang umumnya berupa matriks data yang berukuran besar. Keterbatasan perangkat lunak yang tersedia serta untuk mempercepat proses, data keluaran FTIR terlebih dulu direduksi menggunakan pendekatan regresi terpenggal seperti dibahas pada BAB III. Tahapan selanjutnya dibuat model kalibrasi antara data hasil reduksi dengan data konsentrasi keluaran HPLC menggunakan pendekatan Bayes hirarki terbaik yang diperoleh dari hasil kajian pada BAB IV. Data yang dimiliki dibagi menjadi dua, sebagian untuk penyusunan model dan sebagian lagi untuk validasi model. Kebaikan model yang dihasilkan diukur menggunakan Jumlah Kuadrat Galat (JKG) dan Root Mean Square Error Prediction (RMSEP).
BAB VII. PEMBAHASAN UMUM Model kalibrasi adalah model hubungan antara berbagai respons dari instrumen analitik dengan satu atau lebih karakteristik dari suatu bahan aktif. Secara umum model kalibrasi merupakan suatu fungsi matematik dengan data empirik dan pengetahuan untuk menduga informasi pada y yang tidak diketahui berdasarkan informasi pada X yang tersedia (Martens & Naes 1989). Beberapa permasalahan yang dijumpai pada penyusunan model kalibrasi adalah (1) dimensi matriks X yang sangat besar, (2) Jumlah pengamatan (n) yang jauh lebih kecil dibandingkan jumlah peubah bebas (p), (3) Adanya kekolinearan ganda yang sempurna antara peubah bebas X. Beberapa metode yang dapat digunakan untuk pendugaan model kalibrasi dengan mengatasi masalah kolinearitas adalah metode regresi bertatar, regresi ridge, regresi komponen utama, metode Partial Least Square (PLS), metode Neural Network Partial Least Square (NNPLS), regresi linier berganda dengan wavelength, Shrinkage of wavelett coeffisien dan Bayesian wavelet regression. Pada umumnya keseluruhan metode pendekatan tersebut melakukan tahap awal pengolahan (pre-processing), yaitu mereduksi p menjadi p*, dengan p* jauh lebih kecil dari p (p*<<
Hasil yang diperoleh menunjukkan besaran ukuran kebaikan
model yang lebih baik dibanding menggunakan metode komponen utama dan transformasi Fourier. Arnita (2005) menggunakan metode komponen utama dan koreksi pencaran pada tahap awal pengolahan data keluaran FTIR. Penggunaan koreksi pencaran ternyata dapat menjadikan pola dan posisi spektrum tiap contoh lebih mendekati rujukannya dalam hal ini spektrum rata-rata keseluruhan contoh. Hal ini mengakibatkan informasi yang diberikan spektrum tiap contoh relatif sama. Model kalibrasi yang dibentuk dari data yang dikoreksi pencarannya
mampu memberikan nilai RMSEP, MSEP dan SEP yang lebih kecil dibanding model kalibrasi yang dibentuk dari data yang tidak dikoreksi pencarannya. Pada
penelitian
ini
penulis
menggunakan
pendekatan
Regresi
Terpenggal (Segmented Regression) untuk pereduksian data keluaran FTIR. Penerapan pendekatan ini untuk pereduksian data keluaran FTIR belum pernah dilakukan oleh peneliti lain. Hasil penelitian ini menunjukkan adanya kelebihan atau keunggulan penggunaan pendekatan Regresi Terpenggal untuk model kalibrasi. Beberapa kelebihan pendekatan ini adalah (1) Pereduksian data dilakukan dengan tidak mengilangkan pola sebaran data (2) Menanggulangi permasalahan dimensi data yang besar, dan (3) Pengukuran kebaikan hasil menggunakan acuan yang pasti. Secara teori juga dibuktikan bahwa pendekatan regresi terpenggal memungkinkan dilakukan untuk berbagai pola spektrum keluaran FTIR. Pada pendekatan ini suatu spektrum dipenggal menjadi beberapa bagian, dengan tiap bagian membentuk suatu pola garis lurus. Antara tiap bagian dihubungkan oleh satu titik breakpoints. Besaran titik breakpoints akan selalu diperoleh karena vektor dugaan parameter persamaan garis lurus (termasuk didalamnya dugaan titik breakpoints ) pada setiap bagian bersifat konsisten dan asymptotic solution. Pendekatan regresi terpenggal akan mereduksi jumlah titik persen transmitan suatu spektrum (p) menjadi lebih kecil (p*), p*<<
disajikan pada BAB II menunjukkan bahwa pendekatan Bayes ini sangat baik digunakan untuk menyusun model kalibrasi (du Plessis dan van der Merwe 1995; Wigena dan Aunuddin 1998; West 2003; Rahayu 2003; Notodiputro 2003). Kriteria kebaikan model yang diperoleh dilihat dari koefisien Jumlah Kuadrat Galat (JKG) dan R2. Hasil keseluruhan yang diperoleh menunjukkan bahwa pendekatan Bayes memberikan hasil yang lebih baik dibandingkan pendekatan lain. Berdasarkan kajian pustaka tersebut dilakukan kajian simulasi dan teori penyusunan model kalibrasi menggunakan pendekatan Bayes. Model pendekatan Bayes terbaik hasil kajian simulasi, diterapkan pada data pengamatan yang diperoleh dari tiga sumber data yaitu: (1) Data hasil pengamatan rimpang temulawak dan jahe dua daerah sentra produksi tanaman obat yaitu KulonprogoJawa Tengah dan Karanganyar-D.I. Yogyakarta, (2) Data hasil percobaan rimpang temulawak di Kebun percobaan Biofarmaka-IPB yang berlokasi di CikabayanBogor, dan (3) Data hasil pembelian contoh rimpang jahe dan temulawak yang berasal dari Balitro, Bogor, Majalengka dan Sukabumi. Selanjutnya dalam kajian simulasi penyusunan model kalibrasi digunakan pendekatan bayes dengan kondisi data n<
Secara keseluruhan hasil yang diperoleh menunjukkan
pendekatan Bayes berhirarki lebih baik digunakan dibandingkan pendekatan Bayes non hirarki. Pada penelitian ini diperoleh pendekatan Bayes berhirarki yang bersifat robust, yaitu pendekatan yang tidak dipengaruhi oleh jumlah peubah bebas yang digunakan (p), besaran korelasi antara peubah bebas, penetapan nilai awal σ2 dan penetapan sebaran prior â. Pendekatan ini menghasilkan nilai JKG dan RMSE yang lebih baik dibandingkan model lainnya. Pendekatan terbaik yang diperoleh untuk penyusunan model kalibrasi adalah pendekatan Bayes dengan perilaku â berhirarki dan σ acak Secara teori ditunjukkan bahwa sifat-sifat statistik dari dugaan model kalibrasi dengan pendekatan Bayes bersifat bias. Besarnya bias dipengaruhi oleh simpangan antara prior yang ditetapkan dengan nilai parameter yang
sesungguhnya. Semakin besar simpangan antara prior yang ditetapkan dengan nilai parameter yang sesungguhnya, maka bias yang dihasilkan akan semakin besar. Pada penyusunan model kalibrasi Gingerol dan Kurkumin untuk data pengamatan, data persen transmitan hasil keluaran FTIR terlebih dahulu direduksi menggunakan pendekatan Regresi Terpenggal.
Penyusunan model kalibrasi
dilakukan menggunakan pendekatan bayes dengan perilaku â berhirarki dan σ acak.
Pada model kalibrasi Gingerol dimasukkan peubah dummy waktu
penyimpanan, karena untuk Gingerol lama penyimpanan serbuk Jahe akan mempengaruhi konsentrasi Gingerol dari serbuk Jahe tersebut.
Penggunaan
dummy waktu penyimpanan karena dalam penelitian ini tidak dilakukan pengamatan lama penyimpanan serbuk jahe. Dua kategori dummy waktu yang digunakan, yaitu untuk waktu penyimpanan yang relatif sebentar (kurang dari 3 bulan) dan waktu penyimpanan lama (lebih dari 3 bulan).
Model kalibrasi
Gingerol dan Kurkumin yang diperoleh memberikan nilai dugaan konsentrasi pengamatan dengan tingkat ketelitian yang cukup tinggi.
Hasil dugaan
konsentrasi Gingerol dan Kurkumin yang diperoleh mendekati nilai pengamatan yang sesungguhnya. Sunaryo (2005) dan Arnita (2005) menggunakan data yang sama dengan penelitian ini menyusun model kalibrasi Gingerol dan Kurkumin dengan menggunakan dua pendekatan yang berbeda.
Sunaryo (2005) dengan
menggunakan transformasi wavelet dan Regresi Komponen Utama menghasilkan nilai RMSEP untuk penyusunan model kalibrasi Gingerol dan Kurkumin masingmasing sebesar 0.1072 dan 0.1715. Arnita (2005) menggunakan koreksi pencaran dan Regresi Komponen Utama untuk penyusunan model kalibrasi Gingerol menghasilkan RMSEP sebesar 0,1096. Pada penelitian ini besaran RMSEP yang dihasilkan pada penyusunan model kalibrasi Gingerol dan Kurkumin masingmasing sebesar 0.0622 dan 0.107 Sehingga secara umum besaran RMSEP yang diperoleh pada model kalibrasi Gingerol maupun model kalibrasi Kurkumin menggunakan pendekatan Regresi terpenggal dan pendekatan Bayes dengan perilaku â berhirarki dan σ acak jauh lebih rendah bila dibandingkan hasil yang
diperoleh menggunakan Regresi Komponen Utama dengan transformasi wavelet atau regresi Komponen Utama dengan menggunakan koreksi pencaran.
BAB VIII. SIMPULAN UMUM Pada penelitian ini telah dihasilkan dua buah temuan baru yaitu metode pereduksian data keluaran FTIR dan pendekatan terbaik untuk menyusun model kalibrasi Gingerol dan Kurkumin dengan pendekatan Bayes. Metode pereduksian data keluaran FTIR yang ditemukan pada penelitian ini adalah pendekatan Regresi Terpenggal.
Sedangkan pendekatan terbaik untuk menyusun model kalibrasi
Gingerol dan Kurkumin adalah pendekatan Bayes dengan perilaku â berhirarki dan σ acak Data keluaran FTIR memiliki pola perilaku dimensi data yang besar, n<
Pendekatan
ini
memiliki
kelebihan
utama
yaitu
tetap
mempertahankan pola spektrum awal. Data hasil reduksi dengan pendekatan regresi terpenggal tetap memiliki sifat kekolinieran ganda.
Sehingga perlu
penggabungan pendekatan regresi terpenggal dengan metode penyusunan model yang dapat mengatasi permasalahan kekolinieran ganda. Secara umum pendekatan bayes akan menghasilkan nilai dugaan yang berbias, yaitu dipengaruhi oleh besar simpangan antara prior yang ditetapkan dengan nilai parameter yang sesungguhnya. Meski demikian untuk penyusunan model kalibrasi Gingerol dan Kurukumin ditemukan suatu pendekatan bayes yang bersifat robust, yaitu tidak dipengaruhi oleh jumlah peubah bebas yang digunakan (p), besaran korelasi antara peubah bebas, penetapan nilai awal σ2 dan penetapan sebaran prior â. Pendekatan tersebut adalah pendekatan Bayes dengan perilaku â berhirarki dan σ acak.
Penyusunan model kalibrasi Gingerol dan Kurkumin menggunakan pendekatan regresi terpenggal pada tahap awal dan pendekatan Bayes dengan perilaku â berhirarki dan σ acak, memberikan hasil ketepatan yang sangat baik dibandingkan pendekatan lain. Secara umum perilaku pola spektrum keluaran FTIR adalah sama, sehingga pendekatan ini juga dapat digunakan untuk penyusunan model kalibrasi senyawa aktif lain yang menggunakan alat ukur FTIR. Pada penyusunan model kalibrasi suatu senyawa aktif, faktor-faktor yang mempengaruhi besaran konsentrasi senyawa aktif harus dimasukkan kedalam model.
Pada penyusunan model kalibrasi Gingerol, ternyata faktor lama
penyimpanan harus dimasukkan kedalam model. Penelitian ini pada awalnya tidak ditujukan untuk melihat pengaruh waktu penyimpanan terhadap konsentrasi Gingerol dan Kurkumin. Sehingga pada penelitian ini lama penyimpanan tidak tercatat dengan baik, peubah lama penyimpanan yang dimasukkan kedalam model hanya berupa peubah dummy. Sehingga masih diperlukan kajian lebih lanjut penyusunan penyimpanan.
model
kalibrasi
Gingerol
dengan
memperhatikan
waktu
DAFTAR PUSTAKA [Anonim]. 2004. Bayesian Regression with Conjugate and Convenient Priors. http:// home.unchicago.edu/~grynav/bayes/ABSLec12.ppt [15 Juni 2004]. Arnita. 2005. Koreksi pencaran dalam model kalibrasi peubah ganda pada data senyawa gingerol serbuk rimpang (Zingiber Officinale Roscue) [Tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Berger JO. 1985. Statistical Decision Theory and Bayesian Analysis. Ed ke-2. New York: Springer-Verlag. Brown PJ. 1982. Multivariate calibration. J.R. Statistic. Soc. B 44(3):287-321. Brown PJ, Fearn T, Vanucci M. 2001. Bayesian wavelet regression on curves with application to a spectroscopic calibration problem.
Journal of the
American Statistical Association 96(454): 398-408. Chan CC, May CK, Chi TH. 1986. Pungent Compounds of Ginger (Zingiber Officinale Roscoe) Extracted by Liquid Carbon Dioxide. J. Agric. Food Chem. 34(3): 1033-1043. Cheng RCH. 1999.
Regression metamodelling in simulation using Bayesian
methods. Proceedings of the 1999 Winter Simulation Conference. Faculty of Mathematical Studied. University of Southampton. England. http://www.informs-sim.org/wsc99papers/046.PDF {5 April 2004] Danutirto H. 2001. Pengembangan fitofarmaka di Indonesia. Lokakarya dan Pameran Pengembangan Agribisnis Berbasis Biofarmaka: Kerjasama Departemen Pertanian dengan Institut Pertanian Bogor. Jakarta. Tgl. 13-16 November 2001. du Plessis JL. van der Merwe AJ. 1995.A bayesian approach to multivariate conditional calibration. Comp. Stat. and Data Analysis 19:539-552. Erfiani, Sartono B, Juwita IR. 2004a. Uji kesamaan pola dan pereduksian data keluaran Fourier Transform Infrared (FTIR). Studi kasus : Senyawa aktif Gingerol pada Jahe (Zingiber officinale ross.) dan Senyawa aktif Kurkumin pada Temulawak (Curcuma xontorrhizo Roxb.) Komputasi. Edisi Khusus, September 2004: 206-216.
Forum Statistika dan
Erfiani,
Afendi FM, Rumahorbo R.
2004b.
Pereduksian data keluaran
spektrometer Near Infrared (NIR). (Studi kasus : Penerapan pada Regresi Komponen Utama).
Forum Statistika dan Komputasi. Edisi Khusus,
September 2004: 200-205. Fahrmeir L, and Kaufmann H. 1985. Consistency and asymptotic normality of the maximum likelihood estimator in generalized linear Models. Annals of Statistics 13: 342-368 Gelman A, Rubin D. 1992. Inference from iterative simulation using multiple sequences. Statistical sciences 7:457-473 Hadiwigeno S. 1993. Sambutan Kepala Badan Penelitian dan Pengembangan Pertanian Departemen Pertanian. Di dalam: S.S. Sugati, B. Dzulkarnain, N.P. Subanu, B. Wahjoedi, L. Widowati dan W.Winarno (Eds.), Prosiding Seminar Saga Manis dan Tempuyang Bagian I; Bogor, 13-14 Januari 1993. Bogor; Warta tumbuhan obat Indonesia 2(2):1-2. Hayati EK. 2005. Pemilihan Metode Pemisahan untuk Penentuan Konsentrasi Gingerol dan Pola Respons Fourier Transform Infrared pada Rimpang Jahe Emprit (Zingiber Officinale Roscoe) [Tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Herwindiati DE. 1997. Pengkajian Regresi Komponen Utama, Regresi Ridge dan Regresi Kuadrat Terkecil Parsial [Tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Karlsson S. 2001.
Bayesian methods in econometrics linear regression.
http:/web.hhs.se/personal/SuneK/ [16 Juni 2004] Krishtiningrum MN. 1997. Metode Regresi Komponen Utama untuk Kalibrasi Peubah Ganda [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Küchenhoff H, Wellisch U.1997. Asymptotics for generalized linear segmented regression models with an unknown breakpoint. University of Munich, Institute of Statistics, Akademiestraâe 1, D-80799 München. http://citeseer.ist.psu.edu/365239.html. [22 Juni 2004]
Lindley DV, Smith AFM. 1972. Bayes estimates for the linear model. Journal of the Royal Statistical Society, Series B 34:1-41 Lindsay S. 1992. High Performance Liquid Cromatography. England: Jon Wiley and Sons Ltd. Mattjik AA, Sumertajaya IM. 2002. Perancangan Percobaan : Dengan Aplikasi SAS dan Minitab. Ed. Ke-2. Bogor: IPB Press. Martens H, Naes T. 1989. Multivariate Calibration. John Willey & Sons. England: Chichester. Naes T. 1985. Multivariate calibration when the error covariance matrix is structured. Technometrics 27(3): 301-311. Naes T, Issakson T, Fearn T, Davies T. 2002. Multivariate Calibration and Classification. United Kingdom: NIR Publications Chichester. Notodiputro KA. 2003. Pendekatan Statistika dalam Kalibrasi. Conference on Statistical and Mathematical Sciences of Islamis Society in South East Asia Region, Bandung, 25-26 April 2003
Qin J, McAvoy TJ. 1992. Nonliniear PLS modeling using Neural Networks. Computer and Chemical Engineering 16:379-391 Nur MA, Adijuwana H. 1989. Teknik Spektroskopi dalam Analisis Biologi. Bogor: Pusat antar Universitas Ilmu Hayat, Institut Pertanian Bogor. Rahayu W. 2003. Pendekatan Bayes dalam Masalah Kalibrasi [Tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Roy, A. and P. G. Georgopoulos. 1998. Data and Model Assimilation Using a Bayesian Methodology: Markov Chain Monte Carlo Simulation. 3rd CRESP Annual Meeting, June 1998. Environmental and Occupational Health Sciences Institute. A Joint Project of UMDNJ – R. W. Joahnson Medical School and Rutgers University. www.ccl.rutgers.edu/Cresp98/PDFs/bayesNEW.pdf [6 April 2004] Sinambela JM. 1985. Fitoterapi, Fitostandar, dan Temulawak. Prosiding Simposium Nasional Temulawak. Bandung, 17 September 1985. Lembaga Penelitian Universitas Padjajaran. Smith AFM. 1973. A General Bayesian linear model. Journal of the Royal Statistical Society, Series B 35:61-75
Socrates G. 1994. Infrared Characteristic Group Frekuencies Tables and Charts. Ed ke-2, England: John wiley and Sons. Spiegelhalter et al. 2002. WinBUGS User Manual Version 1.4. http://www.mrcbsu.cam.ac.uk/bugs. [ 15 Juni 2004] Sunaryo S. 2005. Model Kalibrasi dengan Transformasi Wavelet sebagai Metode Pra-Pemrosesan [Disertasi]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Watson HJ,. Blackstone JH Jr. 1989. Computer Simulation. Ed. Ke-2. New York:John Wiley & Sons. West M. 2001.
Bayesian Regression Analysis in the “Large P, Small n”
Paradigm. http://www..statduke.edu/papers/working-papers [9 Juli 2002] West M. 2003. Bayesian Factor Regession Models in the “Large P, Small n” Paradigm. Bayesian Statistics 7, pp 000-000, Oxford University http://www..statduke.edu/papers/working-papers [17 April 2003] Wigena. A.H. dan Aunuddin. 1997. Suatu Kajian dan Terapan Metode PLS. Seminar Nasional Statistika IV di ITS Surabaya, 9-10 Desember 1997. Wigena AH, Aunuddin. 1998. Metode PLS untuk mengatasi kolinearitas dalam kalibrasi ganda. Forum Statistika dan Komputasi 3(1):1-4. Wold S et al. 1984. The collinearity problem in linear regression. The partial least squares (PLS) approach to generalized inverses. SIAM J. SCI. Stat. Comput 5(3):753-743 Young HY, Chiang CT, Huang YL, Pan FP, Chen GL. 2002. Analytical and Stability Studies of Ginger Preparations. Journal of Food and Drug Analysis. 10(3):149-153 [serial on line] www.yahoo.com. [April 2003] Young PJ. 1994. Reformulation of the partial least square regression algorithm. Siam J.SCL STAT Comput. 5(1): 225-230.