MODEL KALIBRASI DENGAN TRANSFORMASI WAVELET SEBAGAI METODE PRA-PEMROSESAN
SONY SUNARYO
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2005
PERNYATAAN MENGENAI DISERTASI DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa disertasi dengan judul Model Kalibrasi dengan Transformasi Wavelet sebagai Metode Pra-Pemrosesan adalah karya saya sendiri dibawah arahan komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir disertasi ini.
Bogor, September 2005
Sony Sunaryo NIM G161020011
ABSTRACT SONY SUNARYO. Calibration Model Using Wavelet Transform as Preprocessing Methods . Under supervision of KHAIRIL ANWAR NOTODIPUTRO, LATIFAH K. DARUSMAN and I WAYAN MANGKU. In the modeling E ( y ) = f ( x1 , x 2 , ... , x p ) serious problems will be occurred if the number of observations (n) is less than the number of independent variables (p) and between independent variables are correlated. The real applications of this modeling is in multivariate calibration. Reduction of dimension of independent variables (known as a preprocessing method) is useful to solve these problems. In this research we have stud ied discrete wavelet transformation as a preprocessing method. The study has been done both empirically and theoretically. The exploration of three preprocessing methods, i.e. principal component analysis, Fourier transformation and discrete wavelet transformation (DWT) based on simulated data showed that discrete wavelet transformation resulted in superior goodness of fit when compared with other preprocessing methods, even when using the simplest mother wavelet function such as Haar wavelet. The study showed that the use of any mother wavelet will result in orthogonal matrices. Because the matrix of new variables resulted from DWT which was based on centered matrix X has column sum equal to zero then the statistical properties of the regression of wavelet coefficient are analogous to the statistical properties in the regression model of y on centered independent variables X. If DWT is applied to the original data which are highly correlated, then the resulting variables are generally still correlated. To overcome this problem the regression models are combined with other methods. The combination of DWT and principal component regression has been utilized in this research to predict concentration of gingerol and curcuminoid, and has resulted in better calibration models.
MODEL KALIBRASI DENGAN TRANSFORMASI WAVELET SEBAGAI METODE PRA-PEMROSESAN
SONY SUNARYO
Disertasi sebagai salah satu syarat untuk memperoleh gelar Doktor pada Departemen Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2005
Judul Disertasi
: Model Kalibrasi dengan Transformasi Wavelet sebagai Metode Pra-Pemrosesan
Nama
: Sony Sunaryo
NIM
: G161020011
Program Studi
: Statistika
Disetujui : Komisi Pembimbing
Dr. Ir. Khairil Anwar Notodiputro, M.S. Ketua
Prof. Dr. Ir. Latifah K. Darusman, M.S. Anggota
Dr. Ir. I Wayan Mangku, M.Sc. Anggota
Diketahui : Ketua Program Studi Statistika
Dekan Sekolah Pascasarjana
Dr. Ir. Budi Susetyo, M.S.
Prof. Dr. Ir. Syafrida Manuwoto, M.Sc.
Tanggal Ujian : 20 September 2005
Tanggal Lulus :
PRAKATA Puji dan syukur penulis panjatkan kepada Allah SWT atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian ini adalah pemodelan kalibrasi dengan judul Model Kalibrasi dengan Transformasi Wavelet sebagai Metode Pra-Pemrosesan. Penelitian yang dilakukan penulis merupakan bagian dari payung penelitian Hibah Pasca 2003-2005, yang merupakan kerjasama antara Departemen Statistika dengan Pusat Studi Biofarmaka LPPM, Institut Pertanian Bogor. Disertasi ini memuat dua bab yang merupakan pengembangan dari naskah artikel yang telah diterbitkan ke jurnal ilmiah. Bab 5 berjudul Sifat-sifat Statistik Pendugaan Model Kalibrasi Melalui Transformasi Wavelet Diskret, telah diterbitkan (Prosiding Seminar Nasional Matematika dan Informatika FMIPA-UNS; Surakarta, 7 Mei 2005. hlm 159-168) dan Bab 6 yang berjudul Penerapan Model Kalibrasi dengan Wavelet-PCR terhadap Data Gingerol dan Kurkuminoid telah diterbitkan (StatistikaForum Teori dan Aplikasi Statistika 4: 181-185). Terima kasih yang sedalam-dalamnya penulis sampaikan kepada Bapak Dr. Ir. Khairil Anwar Notodiputro, MS. ; Ibu Prof. Dr. Ir. Latifah K. Darusman, MS. dan Bapak Dr. Ir. I Wayan Mangku, MSc. selaku pembimbing. Di samping itu penghargaan yang tinggi penulis sampaikan kepada Bapak Dr. Ir. Budi Susetyo, MS. selaku ketua Program Studi Statistika Sekolah Pascasarjana IPB, yang telah banyak memberikan dorongan dan fasilitas kepada penulis dalam menyelesaikan studi dan pe nelitian. Tidak lupa terima kasih juga penulis sampaikan kepada ayah, ibu (alm), istri, putra-putri serta seluruh keluarga penulis atas segala do’a dan kasih sayangnya. Semoga karya ilmiah ini bermanfaat.
RIWAYAT HIDUP
Penulis dilahirkan di Kediri, Jawa Timur pada tanggal 25 Juli 1964 sebagai anak ketiga dari pasangan Soewoto dan Siti Masringah (alm). Pendidikan sarjana ditempuh di Jurusan Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember (ITS), Surabaya, lulus tahun 1988. Pada tahun 1994 penulis diterima di Program Studi Statistika pada Program Pascasarjana Institut Pertanian Bogor dan menamatkannya tahun 1997. Pada tahun 2002 penulis mendapat kesempatan untuk mengikuti program doktor pada Program Studi Statistika, Sekolah Pascasarjana Institut Pertanian Bogor, dengan beasiswa dari Due-Like ITS. Penulis bekerja sebagai dosen di Jurusan Statistika FMIPA-ITS sejak tahun 1989. Selama mengikuti pendidikan program doktor, penulis telah menghasilkan beberapa karya ilmiah yang telah dipublikasikan dalam seminar nasional, dan sebagian dipublikasikan dalam jurnal ilmiah nasional. Karya -karya ilmiah tersebut merupakan bagian dari program doktor penulis. Daftar karya-karya ilmiah tersebut dapat dirinci sebagai berikut : 1. Sunaryo S, Setiawan, Djuraidah A dan Saefuddin A. 2003. Sejarah Perkembangan
Statistika
dan
Aplikasinya. Forum Statistika dan
Komputasi, Vol 8 No.1, 2003. 2. Sunaryo S dan Notodiputro KA. 2003. Regresi Fourier dalam Kalibrasi. Prosiding Seminar Nasional Statistika VI, ITS Surabaya, 10 Oktober 2003. 3. Sunaryo S dan Notodiputro KA. 2004. Fungsi Hubung untuk Model yang Memiliki Koefisien Keragaman Konstan. Prosiding Pertemua n Ilmiah
Nasional Basic Science I, UNIBRAW, Malang, 17 Januari 2004. 4. Sunaryo S dan Notodiputro KA. 2004. Reduksi Dimensi Data Spektra dengan Transformasi Fourier dan Wavelet. Prosiding Seminar Nasional Statistika, IPB, Bogor 4 September 2004. 5. Salamah M dan Sunaryo S. 2004. Penyesuaian Kasus Overdispersion pada Pengepasan Model Regresi Respon Biner. Prosiding Seminar Nasional Statistika, IPB, Bogor 4 September 2004.
6. Sunaryo S dan Notodiputro KA. 2004. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kandungan Senyawa Gingerol pada Tanaman Jahe. Statistika - Forum Teori dan Aplikasi Statistika 4: 181-185 , Jurusan Statistika FMIPA UNISBA. 7. Sunaryo S dan Notodiputro KA. 2005. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kandungan Senyawa Kurkumin pada Tanaman Temulawak. Prosiding Seminar Nasional Matematika, halaman 100-107, Jurusan Matematika UNS, Surakarta, 7 Mei 2005. 8. Sunaryo S dan Notodiputro KA. 2005. Sifat-sifat Statistik Pendugaan Model Kalibrasi melalui Metode Transformasi Wavelet Diskret. Prosiding Seminar Nasional Matematika, halaman 159-168, Jurusan Matematika UNS, Surakarta, 7 Mei 2005. 9. Sunaryo S. 2005. Transformasi Wavelet Diskret dalam Regresi Nonparametrik. Inferensi Jurnal Statistika FMIPA-ITS. 1 : 24-32.
DAFTAR ISI Halaman DAFTAR TABEL
.........................................................................................
xi
DAFTAR GAMBAR ........................................................................................
xii
DAFTAR LAMPIRAN ..................................................................................
xiii
PENDAHULUAN Latar Belakang ......................................................................................
1
Tujuan Penelitian ....................................................................................
6
Manfaat Penelitian ..................................................................................
6
TINJAUAN PUSTAKA Senyawa Aktif pada Rimpang jahe dan Temulawak
…………............
7
Spektroskopi FTIR (Fourier Transform Infrared) ………………………
8
HPLC (High Performance Liquid Chromatography) ……………………
10
Kalibrasi Peubah Ganda
…………………………………………….....
11
Regresi Kuadrat Terkecil .........................................................................
14
Model Regresi Terkoreksi Terhadap Nilai Tengah ..................
17
Wavelet ........................................................................................
20
Transformasi Wavelet Diskret (TWD) ......................................
25
Periodisasi Barisan Bilangan Sepanjang N ...............................
26
Diskripsi Algoritma Piramida Secara Matriks …………………
27
EKSPLORASI BERBAGAI METODE PRA-PEMROSESAN DALAM MODEL KALIBRASI Abstrak
………………………………………………………...........
31
Abstract
………………………………………………………………
31
Pendahuluan ............................................................................................
32
Metode dan Bahan Penelitian ...................................................................
32
Hasil dan Pembahasan
..........................................................................
34
...............................................................................................
38
Daftar Pustaka .........................................................................................
38
Simpulan
viii
REDUKSI DIMENSI DENGAN TRANSFORMASI WAVELET DISKRET Abstrak
………………………………………………………...........
40
Abstract
………………………………………………………………
40
Pendahuluan ............................................................................................
41
Metode dan Bahan Penelitian ...................................................................
42
Hasil dan Pembahasan
..........................................................................
42
Sifat-sifat matriks koefesien wavelet ........................................
45
...............................................................................................
51
Daftar Pustaka .........................................................................................
52
Simpulan
SIFAT-SIFAT STATISTIK PENDUGAAN MODEL KALIBRASI MELALUI METODE TRANSFORMASI WAVELET DISKRET Abstrak
………………………………………………………...........
54
Abstract
………………………………………………………………
54
Pendahuluan ............................................................................................
55
Metode dan Bahan Penelitian ...................................................................
55
Hasil dan Pembahasan
56
..........................................................................
Regresi Terhadap Koefisien Wavelet dan Sifat-sifat
Simpulan
Statistiknya ...............................................................................
56
Ilustrasi Data Simulasi ...........................................................
60
...............................................................................................
63
Daftar Pustaka .........................................................................................
64
PENERAPAN MODEL KALIBRASI DENGAN WAVELET –PCR PADA DATA GINGEROL DAN KURKUMINOID Abstrak
………………………………………………………...........
66
Abstract
………………………………………………………………
66
Pendahuluan ............................................................................................
67
Metode Evaluasi ......................................................................................
68
Analisis dan Pembahasan
.....................................................................
71
Penentuan Kadar Gingerol .....................................................
71
Penentuan Kadar Kurkuminoid
77
...........................................
ix
Simpulan
...............................................................................................
82
Daftar Pustaka .........................................................................................
82
PEMBAHASAN UMUM ……………………………………………………
84
SIMPULAN DAN SARAN ………………………………………………….
87
Simpulan
...............................................................................................
87
Saran .......................................................................................................
88
DAFTAR PUSTAKA ……………………………………………………….
89
x
DAFTAR TABEL Halaman 1. Daerah identifikasi spektra IR gingerol
...............................................
9
2. Daerah identifikasi spektra IR kurkuminoid ……………………………..
10
3. Ringkasan hasil analisis model D(nxm ) terhadap y ……………………….
35
4. Akar ciri D*T D pada beberapa kombinasi
.. …………………………. 61
5. Nilai beberapa ukuran kebaikan model ……............................................. 61 6. Ringkasan hasil prediksi untuk suatu pengamatan baru ........................... 62 7. Ringkasan Nilai Kebaikan model Gingerol dengan wavelet D-10 dan PCR
...................................................................................................
74
8. Nilai Y dan Yˆ kadar gingerol dengan wavelet D10-PCR (Pc1-Pc7) .........
75
9. Ringkasan nilai kebaikan model kurkuminoid dengan wavelet D9-PCR (level 0,1,2,4) 10. Dugaan kurkuminoid
........................................................................
79
........................................................................
80
xi
DAFTAR GAMBAR Halaman 1. Struktur gingerol
..............................................
7
2. Struktur kurkuminoid dari temulawak
……………………………..
8
3. Metode- metode kalibrasi peubah ganda dan keterkaitannya
…………..
14
4. Bentuk Haar wavelet ……………………………………………………
21
5. Bentuk-bentuk keluarga wavelet Daubechies (D-2, D-3, D-4 dan D-5) ....
22
6. Skema algoritma piramida .......................................................................
30
7. Plot y vs yˆ untuk data simulasi 1 ………..............................................
36
8. Plot y vs yˆ untuk data simulasi 2 ..........................................................
36
9. Plot y vs yˆ untuk data simulasi 3 ...........................................................
37
10. Plot y dengan yˆ
63
…................................................................................
11. Spektra persen transmitan 1866 titik, untuk 20 contoh serbuk rimpang jahe
..........................................................................................
72
12. Spektra persen transmitan 1024 titik, untuk 20 contoh serbuk rimpang jahe
..........................................................................................
72
13. Plot Y dengan Yˆ kelompok data kalibrasi gingerol ……….…………….
75
14. Plot Y dengan Yˆ kelompok data validasi gingerol (RMSEP =0.1072) .....
76
15. Spektrum 40 contoh pada 1866 titik serbuk rimpang temulawak ………..
77
16. Spektrum 40 contoh pada 1024 titik serbuk rimpang temulawak ………..
78
17. Plot Y dengan Yˆ kelompok data kalibrasi kurkuminoid .........................
81
18. Plot Y dengan Yˆ kelompok data validasi kurkuminoid ..........................
81
xii
DAFTAR LAMPIRAN Halaman 1. Hasil lengkap analisis data simulasi 1 Bab 3 ............................................... 95 2. Hasil lengkap analisis data simulasi 2 Bab 3 ……………………………..
97
3. Hasil lengkap analisis data simulasi 3 Bab 3 ……………………………..
99
4. Program SAS untuk simulasi data 1 pada Bab 3 ………………………... 101 5. Program SAS untuk simulasi data 2 pada Bab 3 ...................................... 102 6. Program SAS untuk simulasi data 3 pada Bab 3 ......................................
103
7. Hasil analisis regresi antara kadar gingerol dengan 12 koefesien wavelet dan 1 peubah dummy .............................................
104
8. Hasil analisis regresi antara kadar kurkuminoid dengan 24 koefesien wavelet
........... .......................................................................
105
9. Hasil lengkap analisis regresi komponen utama kadar gingerol ............................................................................................ 106 10. Hasil lengkap analisis regresi komponen utama kadar kurkuminoid ....................................................................................
107
xiii
1. PENDAHULUAN 1.1. Latar belakang Didalam pembuatan model E ( y) = f ( x1 , x 2 , ... , x p ) permasalahan serius akan muncul jika banyaknya pengamatan (n) jauh lebih kecil dari banyaknya peubah (p) dan antar peubah saling berkorelasi. Kasus-kasus ini membawa ke permasalahan kekhasan pendugaan parameter model. Metode untuk mengatasi hal ini adalah dengan melakukan reduksi dimensi data sehingga diperoleh peubah baru yang dimensinya jauh lebih kecil dari p dan antar peubah baru tidak saling berkorelasi. Metode yang banyak dikenal sampai saat ini adalah Principal Component Regression (PCR) dan Partial Least Square (PLS). Dengan p yang besar proses perhitungan regresi komponen utama (PCR) dan regresi PLS biasanya akan mengalami kendala dalam komputasi. Metode lain untuk reduksi dimensi data adalah dengan mendekomposisi x i = ( xi1 , xi 2 , ... , xip )T ke dalam sekumpulan fungsi basis, seperti dalam metode transformasi Fourier dan metode transformasi wavelet. Metode
wavelet
merupakan metode yang relatif baru, yang berkembang mulai tahun 1983 sampai sekarang dan merupakan alat analisis data untuk berbagai tujuan seperti analisis deret waktu, analisis image (image analysis), reduksi dimensi data, pemodelan nonparametrics dan lain -lain (Percival 2000). Prinsip-prinsip yang ada pada metode wavelet merupakan perpaduan antara ide lama, seperti Haar wavelet yang ditemukan oleh Alfred Haar tahun 1909, dan ide baru yang muncul dengan adanya perkembangan perangkat lunak komputer, seperti penerapan Multi Resolution Analysis untuk menghitung koefis ien-koefisien wavelet dengan algoritma piramid (Mallat 1989). Pembahasan secara luas tentang wavelet dapat dikatagorikan menjadi dua kelompok yaitu transformasi wavelet kontinu (TWK), yang berkembang mulai tahun 1983 sampai sekarang, dan transformasi wavele t diskret (TWD), yang berkembang mulai tahun 1988 sampai sekarang (Percival 2000). Ide dasar metode transformasi wavelet adalah merepresentasikan suatu kurva sebagai kombinasi linear kurva -kurva lain yang relatif lebih sederhana, yang disebut fungsi basis atau fungsi wavelet (Fearn 1999). Fungsi basis tersebut
2
diperoleh dengan dilatasi dan translasi dua jenis fungsi wavelet yang disebut father wavelet, φ , dan mother wavelet ψ (Nason dan Silverman 1997). Dalam analisis Fourier fungsi basis yang digunakan adalah fungsi sinus dan kosinus, sehingga metode wavelet dapat dipandang sebagai perluasan dari analisis Fourier. Dalam metode wavelet jika suatu fungsi yang didekomposisi ke dalam fungsifungsi wavelet diambil bilangan dilatasi dan translasi yang kontinu maka akan termasuk dalam TWK. Sedangkan jika bilangan dilatasi dan translasi berupa bilangan bulat bukan negatif , maka termasuk dalam TWD (Nason dan Silverman 1997). Dengan TWD akan diperoleh koefisien-koefisien wavelet yang jumlahnya sama dengan jumlah titik asal. Berbagai penelitian dalam perkembangan terakhir tentang wavelet adalah penerapan wavelet untuk regresi dan permasalahan statistik lainnya ( Nason dan Silverman 1997), studi simulasi untuk melihat perilaku penduga wavelet dalam regresi nonparametrik (Antoniadis et al. 2001; Sunaryo 2005), Bayes empirik untuk pemilihan threshold wavelet (Johnstone dan Silverman, 2004), penerapan metode wavelet dalam chemometrics (Depczynski et al. 1997), transformasi wavelet ganda diskret dan thresholding (Downie dan Silverman 1996), model regresi PLS-wavelet untuk eksplorasi data dan proses monitoring (Teppola dan Pentti 2000), aplikasi dari analisis wavelet untuk menentukan konsentrasi gula dari solutant cair (McNulty dan Ganapati 1998), penggabungan metode transformasi wavelet dengan metode pemodelan kalibrasi peubah ganda yang lain (Dean et al. 2004; Leung et al. 1998; Naes et al. 2002; Sunaryo dan Notodiputro 2004b; Sunaryo dan Notodiputro 2005a; Tan dan Brown 2002; Yi-yu dan Chen min-jun 2000) , dan masih banyak lagi yang lain. Menurut Percival (2005) ada lebih dari 26000 artikel dan buku sejak tahun 1989 sampai dengan tahun 2004, dan lebih dari 3000 artikel sejak tahun 2004. Pertanyaan terbuka yang belum diteliti adalah bagaimana sifa t-sifat statistik dari hasil dugaan model dengan prapemrosesan metode wavelet. Dengan mengetahui sifat-sifat statistik akan bisa dilakukan pengujian-pengujian terhadap hasil dugaan, sehingga kesimpulan berlaku secara umum dan valid. Kalibrasi peubah ganda menitik beratkan pada penemuan hubungan antara sekumpulan ukuran yang relatif mudah atau murah memperolehnya, dengan
3
sekelompok ukuran lain yang relatif susah (labour intensive) atau mahal memperolehnya. Tujuan kalibrasi peubah ganda adalah menemukan model yang dapat digunakan untuk memprediksi ukuran-ukuran yang mahal dengan teliti dari ukuran-ukuran yang murah (Naes et al. 2002). Secara umum kalibrasi peubah ganda menggunakan suatu fungsi matematika dengan data empirik dan pengetahuan untuk menduga informasi pada Y, ukuran yang mahal, yang tidak diketahui berdasarkan informasi pada X , ukuran yang murah, yang tersedia (Martens dan Naes 1989). Kalibrasi peubah ganda sering diterapkan untuk menduga senyawa aktif dari contoh yang diukur melalui FTIR atau NIR. Sebagai ilustrasi marilah kita tengok potensi penerapannya pada penentuan senyawa aktif tanaman obat. Indonesia dikenal sebagai salah satu negara penghasil tanaman obat dan mempunyai potensi dan prospek pengembangan yang baik. Sekitar 25 obat-obatan yang diresepkan negara industri maju mengandung bahan senyawa aktif hasil ekstraksi tanaman obat (Supriadi 2001). Jahe (Zingeber officinale Roscoe) dan temulawak (Curcuma xanthorrhiza Roxb.) merupakan tanaman obat yang banyak digunakan sebagai bahan baku dalam industri jamu dan farmasi. Saat ini permintaan akan jahe oleh negara importir terus mengalami peningkatan dari tahun ke tahun, akan tetapi permintaan tersebut belum semuanya dapat dipenuhi mengingat produksi jahe masih terserap oleh kebutuhan dalam negeri. Sedangkan setiap industri jamu baik skala kecil maupun skala industri selalu memasukkan temulawak ke dalam racikan. Khasiat dan kualitas tanaman obat tidak terlepas dari senyawa aktif yang dikandungnya. Metode penentuan kadar senyawa aktif dari rimpang tanaman obat yang selama ini digunakan, dilakukan melalui proses yang panjang meliputi penghancuran bahan, pelarutan, dan pengukuran, baik
dengan HPLC (High
Performance Liquid Chromatography) maupun dengan instrumen lainnya. Proses ini memerlukan waktu dan biaya yang relatif mahal. Alternatif cara penentuan lain yang dapat dilakukan adalah dengan mengembangkan model kalibrasi peubah ganda yang menyatakan hubungan antara kadar senyawa aktif hasil pengukuran HPLC dengan data hasil pengukuran dengan FTIR (Fourier Transform Infra Red), yang relatif lebih murah memperolehnya dibanding dengan HPLC.
4
Melalui metode HPLC, suatu senyawa dapat diketahui secara kualitatif dan kuantitatif yaitu dengan mengetahui pola kromatogram dan memperbandingkan luas area terhadap suatu standar senyawa yang diketahui. Sedangkan spektroskopi FTIR memberikan informasi yang mencerminkan gugus fungsi yang terdapat pada suatu senyawa akif dan kuantitatif melalui nilai absorbannya. Setiap jenis senyawa aktif secara kimiawi akan memberikan pola tapak FTIR dan juga pola kromatogram yang tertentu tergantung responnya. Pada kasus ini data pengukuran HPLC berfungsi sebagai data pembanding. Pada pendugaan model kalibrasi peubah ganda sering timbul masalah multikolinearitas di antara peubah persen transmitan (Naes 1985). Selain itu muncul juga masalah bahwa banyaknya peubah bebas (p) jauh lebih besar dari banyaknya pengamatan pada peubah tak bebas (n), sehingga metode baku seperti model regresi ganda biasa sering memberikan solusi yang tidak unik. Oleh karena itu diperlukan suatu metode yang dapat mengatasi kedua masalah tersebut sehingga metode tersebut akan memberikan solusi yang unik dan baik. Beberapa metode untuk pendugaan model kalibrasi peubah ganda yang terdapat dalam literatur antara lain regresi komponen utama, dan metode PLS (Martens dan Naes 1989; Naes et al. 2002). Dalam penyusunan model, regresi komponen utama menggunakan peubah baru yang merupakan kombinasi linear peubah-peubah asal. Metode PLS menghasilkan komponen-komponen yang tidak berkorelasi atau tidak terjadi multikolinearitas tetapi dapat memaksimumkan korelasinya dengan peubah respons (Geladi dan Kowalski 1986). Metode kalibrasi peubah ganda yang lain sampai saat ini adalah jaringan syaraf tiruan (JST), regresi Fourier , wavelet, bayes, dan gabungan antara beberapa metode tersebut. Informasi yang diperoleh dari FTIR untuk setiap contoh (sampel) rimpang ke-i adalah data vektor spektra yang merupakan sederetan ukuran persen transmitan x i = ( xi1 , xi 2 , ... , xip )T , yang diamati pada p titik bilangan gelombang dari spektrum yang sama. Hal inilah yang menyebabkan dalam model kalibrasi peubah ganda Y terhadap X, dimensi X akan tinggi dan terjadi kasus multikolinearitas. Untuk itu perlu dilakukan reduksi dimensi (pra-pemrosesan) data X. Gagasan umum penerapan metode wavelet dalam pemodelan kalibrasi peubah ganda adalah dengan merepresentasikan deretan x sebagai jumlahan m
5
bobot dari fungsi basis (yang disebut fungsi wavelet). Dengan memilih m yang jauh lebih kecil dari p, diharapkan hasil pemodelan kalibrasi peubah ganda masih cukup baik dan valid (Sunaryo dan Notodiputro 2004a). Di Indonesia sampai saat ini kalibrasi peubah ganda khususnya dengan prapemrosesan transformasi wavelet belum banyak dikembangkan dan dikaji. Oleh karena itu penelitian ini akan mengkaji dan menerapkan pemodelan kalibrasi peubah ganda dengan pra -pemrosesan transformasi wavelet. Dengan tujuan utama mengkaji perilaku dan mencari model yang lebih baik untuk menduga kadar gingerol dan kurkuminoid pada rimpang jahe dan temulawak. Disertasi ini ditulis dalam bentuk rangkaian topik-topik penelitian yang dapat berdiri sendiri tetapi membentuk satu kesatuan untuk menjawab tujuan penelitian. Pada Bab 3 dilakukan eksplorasi terhadap berbagai metode reduksi dimensi data X (nxp) menjadi peubah baru, misalkan D (nxm), m < p dalam pemodelan dengan kasus multikolinear dan n lebih kecil dari p. Metode reduksi yang diteliti adalah analisis komponen utama, transformasi Fourier dan transformasi wavelet. Harapan dari peneltian ini mencari potensi untuk diteliti lebih lanjut salah satu metode yang menghasilkan ukuran-ukuran kebaikan model yang lebih baik. Dari kajian pustaka ternyata transformasi wavelet mempunyai potensi untuk diteliti lebih lanjut, dibanding yang lainnya. Maka penelitian ini akan menjustifikasi hal tersebut lewat analisis berbasis data simulasi. Pada bab 4 diteliti lebih lanjut tentang perilaku reduksi dimensi data dengan transformasi wavelet, khususnya transformasi wavelet diskret. Dengan harapan dapat mengetahui lebih mendalam tentang sifat-sifat hasil transformasi dan matriks transformasi yang digunakan. Pada tahap ini kajian teori yang diperoleh akan dijustifikasi dengan contoh-contoh data sederhana agar pemahaman menjadi lebih baik. Dengan mengetahui perilaku transformasi wavelet, maka langkah penelitian selanjutnya dalam Bab 5 adalah meneliti bagaimana sifat-sifat statistik dari pemodelan yang melibatkan peubah baru hasil transformasi wavelet sebagai peubah bebas dalam pemodelan. Hasil yang diharapkan adalah mengetahui dan memahami sifat-sifat bias dan ragam yang dihasilkan, baik untuk penduga parameter model maupun prediksi suatu pengamatan baru. Basis penelitian pada langkah ini, selain kajian teoritis, juga kajian empiris dari data hasil simulasi.
6
Setelah mengetahui sifat-sifat statistik dan perilaku hasil transformasi wavelet, maka penelitian dilanjutkan pada penerapan transformasi wavelet untuk mencari dugaan model kalibrasi terhadap data gingerol dan kurkuminoid yaitu senyawa aktif pada rimpang jahe dan temulawak yang dilakukan pada Bab 6. Analisis yang dilakukan pada Bab 6 mempertimbangkan aspek-aspek kimia yang berkaitan yaitu dengan memperhatikan daerah identifikasi spektra infra merah untuk gugus -gugus fungsi yang ada pada gingerol dan kurkuminoid . Pada bab 7 dilakukan pembahasan secara umum sedangkan Bab 8 membuat suatu simpulan dari rangkaian penelitian tersebut dan memberikan saran-saran yang bisa dilakukan untuk penelitian lebih lanjut.
1.2. Tujuan Penelitian Tujuan dari penelitian ini adalah : 1. Mengkaji secara teoritis sifat-sifat hasil dugaan pemodelan kalibrasi peubah ganda dengan pra-pemrosesan metode wavelet. 2. Mengaplikasikan metode wavelet dalam pengembangan model kalibrasi peubah ganda untuk menentukan kadar senyawa aktif kurkuminoid pada rimpang temulawak dan senyawa aktif gingerol pada rimpang jahe.
1.3. Manfaat Penelitian Penelitian ini diharapkan dapat memberikan metode alternatif dalam mengembangkan model kalibrasi peubah ganda untuk memprediksi kadar senyawa aktif dalam rimpang tanaman obat secara lebih teliti dan relatif lebih murah, atau penanganan pemodelan regresi dengan kasus multikolinearitas dan banyaknya pengamatan contoh (n) lebih kecil dari banyaknya peubah bebas (p).
2. TINJAUAN PUSTAKA
2.1. Senyawa Aktif pada Rimpang Jahe dan Temulawak Menurut Young (2003) rimpang jahe mengandung dua bagian utama yaitu minyak esensial (volatil) yang memberikan aroma dan pembawa rasa pedas yaitu gingerol.
Kandungan gingerol yang cukup tinggi pada rimpang jahe,
menyebabkan jahe memiliki peranan penting dalam dunia pengobatan, baik pengobatan tradisional atau skala industri dengan memanfaatkan kemajuan teknologi. Jahe merupakan salah satu dari beberapa tanaman yang digunakan secara tradisional sebagai obat rematik, demam, radang dan lain-lain (Lee dan Lim 2000). Stuktur gingerol dapat dilihat pada Gambar 1.( Chan et al. , 1986) O (CH2)nCH3 H3CO OH
N-Gingerol Keterangan :
N= 6, 8, 10 n= 4, 6, 8 Gambar 1 Struktur gingerol
Menurut Sinambela (1985), komposisi rimpang temulawak dapat dibagi menjadi dua fraksi utama yaitu zat warna kurkuminoid dan minyak atsiri. Warna kekuningan
temulawak disebabkan adanya kurkuminoid. Kandungan utama
kurkuminoid terdiri dari senyawa kurkumin, desmetoksikurkumin dan bisdesmetoksikurkumin. Struktur kurkuminoid dapat dilihat pada Gambar 2. Disamping tiga senyawa utama tersebut terdapat senyawa lain yang digolongkan termasuk
ke
dalam
senyawa
kurkuminoid
yaitu monometoksikurkumin,
oktahidrokurkumin, dihidrokurkumin , heksahidrokurkumin dan senyawa turunan kurkumin.
8
R1
R2
HO
OH
O
Keterangan: R1 -OCH3 -OCH3 -H
OH
R2 -OCH3 = kurkumin -H = desmetoksikurkumin -H = bis-desmetoksikurkumin
Gambar 2 Struktur kurkuminoid dari temulawak Rimpang temulawak segar, selain terdiri dari senyawa kurkuminoid dan minyak atsiri juga mengandung lemak, protein, selulosa, pati, dan mineral. Menurut Darwis et al. (1991), kurkuminoid temulawak mempunyai khasiat sebagai antibakteri dan dapat merangsang dinding kantong empedu untuk mengeluarkan cairan empedu supaya pencernaan lebih sempurna. Selain itu temulawak digunakan juga sebagai pengobatan gangguan pada hati atau penyakit kuning, batu empedu, memperlancar aliran air empedu, obat demam dan sembelit, memperlancar keluarnya air susu ibu, obat diare, imflamasi pada anus, gangguan perut karena dingin, dan radang dalam perut atau kulit.
2.2. Spektroskopi FTIR ( Fourier Transform Infrared) Aplikasi teknik spektroskopi infra merah sangat luas, baik untuk tujuan analisis kuantitatif maupun kualitatif. Untuk analisis kualitatif dan kuantitatif maka pola spektrum FTIR suatu senyawa perlu dilakukan analisis referensi sebagai pembanding. Instrumentasi spektrum infra merah dibagi kedalam tiga jenis radiasi yaitu infra merah dekat (bilangan gelombang 12800-4000 cm-1), infra merah pertengahan (bilangan gelombang 4000-200 cm-1), dan infra merah jauh (bilangan gelombang 200-10 cm-1) (Nur dan Adijuwana 1989), FTIR termasuk dalam kategori radiasi infra merah pertengahan (bilangan gelombang 4000-200 cm-1). Hampir setiap senyawa yang memiliki ikatan kovalen akan menyerap berbagai frekuensi radiasi elektromagnetik dalam daerah spektrum inframerah. Setiap tipe ikatan yang berbeda mempunyai sifat frekuensi vibrasi yang berbeda,
9
dan karena tipe ikatan yang sama dalam dua senyawa yang berbeda terletak dalam lingkungan yang sedikit berbeda, maka tidak akan ada dua molekul yang berbeda strukturnya akan mempunyai bentuk serapan inframerah atau spektrum inframerah yang tepat sama. Jika I0 adalah intensitas IR yang masuk kedalam contoh dan I adalah intensitas IR yang diteruskan (transmitted) oleh contoh, maka : Absorban (A) = Log (I0 / I) dan %transmitan (%T) = 100 (I/I0). Sehingga hubungan absorban dengan %transmitan adalah : A = - log ( %T/100). Karena kekuatan serapan proporsional terhadap konsentrasi, maka FTIR dapat digunakan untuk analisis kuantitatif yang menghubungkan konsentrasi dengan absorban atau persen transmitan. Untuk menduga konsentrasi suatu senyawa tertentu dala m contoh, diperlukan pengukuran nilai-nilai absorban dari contoh pada berbagai bilangan gelombang. Pembuatan model yang menghu bungkan konsentrasi dengan nilai-nilai absorban dapat digunakan untuk menduga konsentrasi senyawa tertentu yang tidak diketahui dalam contoh. Kegunaan penting dari spektrum infra merah adalah untuk mendeteksi tentang gugus fungsi dari suatu molekul. Dari struktur gingerol dan kurkuminoid yang khas, maka spe ktrum yang dihasilkan dengan FTIR akan khas pula. Menurut Socrates (1994) daerah identifikasi spekta infra merah (IR) untuk gingerol dan kurkuminoid adalah seperti yang terlihat pada Tabel 1 dan Tabel 2.
Tabel 1 Daerah identifikasi spektra IR gingerol No
Jenis vibrasi
Bilangan gelombang cm-1 1 Ikatan hidrogen O-H 3550-3230 2 C-H rentangan asimetri ; CH3 -Ar 2935-2925 3 Aromatik -C=C1625-1590 4 1700-1660 α-β-keton takjenuh 5 R-O-Ar 1310-1210 1050-1010 6 C-H ikatan bidang luar 990-980 Vinil R- CH=CH 2910-230 7 C-H ikatan bidang luar 770-735 o-subsitusi benzen 710-690 Keterangan: (s) kuat; (m) medium; (vs) sangat kuat
intensitas m-s m-s v vs m m m s s s
10
Tabel 2 Daerah identifikasi spektra IR kurkuminoid No Jenis vibrasi Bilangan Gelombang cm -1 1 Ikatan hidrogen OH 3600-3300 2 C-H Alkana 3000-2850 3 Aromatik -C=C- rentangan 1660-1450 4 R-O-Ar 1300-1000 5 C=O keton 1820-1660 6 Sidik jari 900-700 Keterangan: (s) kuat; (m) medium; (vs) sangat kuat
intensitas m-s s s m v s
Jika untuk analisis lanjutan perlu dilakukan pengambilan beberapa data %transmitan hasil pengukuran dengan FTIR, maka daerah identifikasi IR suatu senyawa sangat perlu diperhatikan, pemotongan yang tidak memperhatikan daerah identifikasi bisa mengarah ke pemodelan yang hasilnya kurang baik. Sebagai misal McNulty dan Ganapati (1998) menduga konsentrasi glukosa dalam larutan encer, dimana spektrum masing-masing contoh dihasilkan dari FTIR dengan kisaran bilangan gelombang 10000 cm-1 s/d 4000 cm-1 pada relolusi 4 cm-1 sehingga diperoleh 1500 titik absorban. Karena dalam analisis lanjut hanya dibutuhkan 256 titik, maka penentuan 256 titik dilakukan dengan me mperhatikan daerah identifikasi dari glukosa, yaitu pada kisaran bilangan gelombang 4550 cm-1 s/d 4150 cm-1 dengan resolusi 4 cm-1. Cara yang sama dilakukan oleh Brown et al. (2001) yang memprediksi kandungan lemak, gula, flour dan air dalam suatu contoh adonan kue. Pada awalnya spektrum absorban diukur pada kisaran panjang gelombang 1100 nm s/d 2498 nm dengan resolusi 2 nm, sehingga diperoleh 700 titik absorban. Dari 700 titik hanya dibutuhkan 256 titik, maka langkah yang diambil oleh Brown et al. (2001) adalah membuang titik-titik absorban pada pengamatan 140 titik panjang gelombang pertama, dan 49 titik panjang gelombang terakhir dengan alasan pada kisaran tersebut sedikit mengandung informasi. Kemudian dari pengamatan absorban pada panjang gelombang 1380 nm s/d 2400 nm, resolusi ditingkatkan menjadi 4 nm. Sehingga diperoleh 256 titik absorban.
2.3. HPLC (High Performance Liquid Chromatography ) HPLC merupakan teknik kromatografi cair yang menggunakan tekanan tinggi. HPLC merupakan suatu metode yang dapat digunakan untuk memisahkan dan
11
mengidentifikasi berbagai komponen dalam campuran. Prinsip pemisahan komponen campuran dalam kolom yaitu berdasarkan perbedaan kesetimbangan retensi dan gerakan masing-masing komponen pada pemukaan fase diam dan fase gerak. Zat-zat yang terabsorpsi kuat dalam fase diam akan lama bertahan dalam kolom, sedangkan yang teradsorpsi lemah akan keluar dengan cepat dari kolom. Waktu dari mulai contoh diinjeksikan kedalam HPLC sampai dengan suatu puncak analat (analyte peak ) muncul di detektor pada akhir kolom disebut waktu retensi (retention time). Masing-masing anala t dalam suatu contoh akan mempunyai perbedaan waktu retensi. Waktu retensi mencerminkan keberadaan suatu komponen kimia, dan merupakan penciri kualitatif suatu senyawa. Luas area dibawah kurva mencerminkan konsentrasi secara kuantitatif. HPLC digunakan terutama untuk golongan senyawa tak atsiri, misalnya terpenoid tinggi, segala jenis fenol, alkaloid, lipid, dan gula. HPLC berhasil baik untuk senyawa yang dapat dideteksi di daerah spektrum UV dan spektrum sinar tampak (Harborne 1996). HPLC digunakan untuk mengkuantisasi senyawa aktif yang diperoleh dari berbagai perlakuan. Secara kualitatif dan kuantitatif suatu senyawa aktif dapat diketahui antara lain melalui metoda HPLC dengan mengetahui pola kromatogram dan memperbandingkan luas area terhadap suatu standar senyawa yang diketahui pada waktu retensi tertentu. HPLC dapat digunakan untuk analisis kulitatif dan kuantitatif atau bahkan dapat dimanfaatkan sebagai sarana untuk pemurnian melalui pemisahan secara preparatif. Analisis kuantitatif dengan HPLC dilakukan terhadap hasil ekstraksi suatu contoh. Makin murni ekstrak maka hasil HPLC makin kuantitatif. Tetapi pemurnian suatu ekstrak membutuhkan biaya yang mahal. Pengukuran konsentrasi dengan HPLC memerlukan analisis referensi terhadap ekstrak murni sebagai pembanding.
2.4. Kalibrasi Peubah Ganda Chemometrics adalah dapat dipandang sebagai gabungan antara matematika dan statistika dengan kimia. Kalibrasi peubah ganda merupakan bagian dari Chemometrics yang bertujuan untuk menemukan hubungan antara sekumpulan ukuran yang relatif mudah atau murah memperolehnya, dengan sekelompok
12
ukuran lain yang relatif sulit (labour in tensive) atau mahal memperolehnya. Naes et al. (2002) menyebutkan bahwa tujuan kalibrasi peubah ganda adalah menemukan model yang dapat digunakan untuk memprediksi ukuran-ukuran yang mahal dengan tepat dan akurat dari ukuran-ukuran yang murah. Secara umum kalibrasi peubah ganda menggunakan formula matematika untuk menduga informasi pada Y, yaitu ukuran yang mahal, yang tidak diketahui berdasarkan informasi pada X , yaitu ukuran yang murah, yang tersedia (Martens dan Naes 1989). Formula matematika yang disebut model pada prinsipnya dibagi menjadi dua komponen, yaitu komponen yang terstruktur yang merepresentasikan variasi sistematis dan komponen sisaan yang merepresentasikan perbedaan antara data dengan komponen terstruktur. Pemodelan kalibrasi peubah ganda yang baik akan memperhatikan terhadap kedua komponen tersebut. Secara umum dengan membuat asumsi-asumsi terhadap komponen terstruktur (seperti linear) dan komponen sisaan (seperti mempunyai sebaran normal) akan membuat model lebih baik dan lebih berguna (Ma rten dan Naes 1989). Karena mengandung komponen sisaan, maka parameter-parameter yang ada dalam model diduga secara statistika berdasarkan contoh-contoh data yang representatif dan asumsi sebaran tertentu dari sisaan. Menurut Naes et al. (2002) pembuatan model untuk memprediksi Y dengan kalibrasi peubah ganda, yaitu dengan mempertimbangkan beberapa atau semua pengamatan pada spektrum, akan memberikan hasil lebih baik dibanding dengan pemodelan kalibrasi peubah tunggal yang hanya mempertimbangkan satu puncak pada masing-masing spektrum. Dengan mengkombinasi informasi dari beberapa atau bahkan semua peubah spektrum, permasalahan yang muncul pada pendugaan model kalibrasi ganda adalah kasus multikolinearitas di antara peubah absorban dan banyaknya contoh (n) yang lebih kecil dari banyaknya peubah bebas (p) (Marten dan Naes 1985; Naes et al. 2000), sehingga metode baku seperti model regresi sering memberikan solusi yang tidak stabil. Oleh karena itu diperlukan suatu metode yang dapat mengatasi masalah tersebut, sehingga diperoleh solusi yang lebih stabil. Banyak cara untuk mengatasi masalah multikolinearitas dan banyaknya contoh lebih kecil dari banyaknya peubah bebas, tetapi dalam literatur
13
chemometric ada dua pendekatan yang sangat populer yaitu menggunakan regresi ganda terbakukan, dengan kehati-hatian dalam memilih peubah bebas, dan pendekatan dengan reduksi dimensi data (Naes et al. 2002). Beberapa metode untuk pendugaan model kalibrasi peubah ganda yang ada dalam beberapa literatur antara lain regresi komponen utama, regresi kuadrat terkecil parsial (PLS), regresi fourier, Jaringan Syaraf Tiruan (JST), transformasi wavelet ( Naes et al. 2002; Marten dan Naes 1989; Osborne et al. 1993), dan metode bayes. Menurut Naes et al. (2002) dengan mengambil beberapa koefisien wavelet sebagai reduksi dimensi akan menghasilkan rekontruksi ulang spektrum IR yang cukup mendekati spektrum IR asli. Keterkaitan metode-metode ini dalam kalibrasi peubah ganda dapat dilihat seperti pada Gambar 3. Selain kasus multikolinearitas dan n < p, masalah lain yang muncul dalam pemodelan kalibrasi peubah ganda adalah kesalahan dari pencaran spektrum (Scatter problem), yaitu spektrum yang diamati bisa berbeda dari yang sesungguhnya. Hal ini akan berpengaruh terhadap benar tidaknya pengukuran X dalam pemodelan, dan disebut kesalahan pengukuran peubah-peubah (Error of variables). Menurut Naes et al. (2002) salah satu metode untuk mengatasi masalah ini adalah Multiplicative Scatter Correction (MSC). Dengan MSC keragaman antara spektrum dapat diperkecil.
14
Data n pengamatan p peubah bebas
Y Model Regr. Peubah tunggal
p=1 ?
T
p
n?
Y
Reduksi dimensi ?
T
Komp. Utama PLS Fourier Wavelet JST
Y
Y Koline ari tas dari X ? Penambahan Informasi ?
T T
Regresi Ganda terbakukan
Penambahan Informasi
Y
Bayes
T
Gambar 3 Metode -metode kalibrasi peubah ganda dan keterkaitannya.
2.5. Regresi Kuadrat Terkecil Bentuk umum regresi linear berganda adalah : y = 1 b0 + X 1 b + e
(1)
atau bisa ditulis : y = X β + e, dengan E ( y) = X β , E (e) = 0 dan Var(e) = Iσ 2 ,
(2)
15
[
]
[
dimana b = b1 , b2 , ... , b p , β T = b0 , b1 , ... , bp T
x11 x 21 . X1 = . . xn1
. . . x1 p 1 x11 x . . . x2 p 1 21 . . . . , X = . . . . . . . . . . . x np 1 x n1
x12 x 22 . . . xn 2
x12 x22 . . . xn 2
] x1 p y1 y . . . x2 p 2 . . . , y = dan . . . . . . . . . xnp y n . ..
e1 e 2 . e = . . . en Dugaan kuadrat terkecil dari persamaan (2) adalah : βˆ =
(X
T
X
)
−1
XT y,
yang mempunyai sifat dan konsekwensi sebagai berikut (Searle 1971) : a. βˆ adalah penduga tak bias dari β , yang berarti E ( βˆ ) = β . b. Mempunyai ragam
(
Var( βˆ ) = X
T
X
)
−1
σ2.
(3)
c. Prediksi terhadap nilai E( y) dapat dijelaskan sebagai berikut : Penduga βˆ dapat digunakan untuk menduga model E ( y) = b 0 + b1 x1 + . . . + b p x p dengan Eˆ ( y) = bˆ0 + bˆ1 x1 + . . . + bˆp x p = x T βˆ .
[
]
Sehingga untuk pengamatan x o = 1, xo 1 , xo 2 , . . . , xop , dugaan terhadap E(yo) T
adalah : T yˆ o = Eˆ ( yo ) = bˆ0 + bˆ1 xo 1 + . . . + bˆk xop = x o βˆ ,
(4)
dengan ragam :
(
T T Var [ yˆ o ] = x o Var( βˆ ) x o = x o X T X
)
−1
σ 2 xo .
(5)
16
Karena βˆ adalah penduga tak bias, maka yˆ o juga merupakan penduga tak bias bagi E ( yo ) sehingga MSE( yˆ 0 ) = E ( yˆ o − E( yo )) 2 = Var( yˆ o ) + bias2 ( yˆ o ) = x
T
o
(X X ) T
−1
xo σ 2 .
(6)
d. Prediksi nilai pengamatan tunggal , y f yang tidak diketahui, yang berkaitan dengan vektor nilai x , misalnya x Tf = [1, x f 1 , x f 2 , . . . , x fp ] dapat dijelaskan sebagai berikut : Dari model y f = x Tf β + e f , dimana e f adalah galat random. Dugaan ter baik bagi y f adalah
yˆ f = x Tf βˆ , sehingga
xTf βˆ dapat digunakan untuk T
menduga pengamatan y f yang berhubungan dengan x f , maupun menduga nilai E ( y f ) yang berhubungan dengan xT f . Jika yˆ f digunakan untuk memprediksi peubah random y f , maka bias dari yˆ f adalah : bias( yˆ f ) = E ( yˆ f − y f ) . Karena y f adalah pengamatan yang diperoleh secara bebas dari penurunan βˆ , maka βˆ dan e f saling bebas, atau berarti cov( βˆ , e f ) = 0 .
[ ]
(
T T Var yˆ f = x f Var( βˆ ) x f = x f X T X
)
−1
σ 2x f .
(7)
MSE( yˆ f ) = E( y f − yˆ f ) 2 = E ( x Tf (β − βˆ ) + e f ) 2 = x Tf Var( β − βˆ )
(
= [x f X T
T
X
)
−1
x f + E (e 2f ) + 2 cov( xTf ( β − βˆ ), e f ) x f + 1] σ 2 .
(8)
Jika diperhatikan persamaan (5) dan (8) maka dapat disimpulkan bahwa MSE prediksi nilai tunggal pengamatan baru sama dengan MSE nilai harapan pengamatan baru ditambah σ 2 .
17
2.5.1. Model Regresi Terkoreksi Terhadap Nilai Tengah Dari persamaan (1) dan (2), telah diketahui bahwa X = [ 1
X 1 ] , dimana 1
adalah vektor 1 berukuran nx1. Dengan mendefinisikan vektor nilai tengah (rata rata) dari pengamatan X1 sebagai x
T
= [ x.1 , x. 2 , . . . , x. p ] maka dari definisi ini
mengimplikasikan : T T T 1 1 = n , 1 y = n y dan 1 X 1 = n x .
Sehingga solusi dari βˆ dapat ditulis sebagai berikut : βˆ =
(X
T
X
1T = T X 1 n = T n x
)
−1
X
T
y
[1 X 1 ] X 1
nx X
T 1
T 1 + x S −1 x = n −1 −S x
−1
−1
1T T y X1 ny T X 1 y S −1 n y , X 1T y S −1
−x
T
T
dimana S = X 1 T X 1 − n x x (Bukti lihat Searle 1971). b0 b 1 . Dengan mempartisi β = . . b k bˆ0 = bˆ
b0 = , maka diperoleh : b
y − x T S −1 ( X T y − n y x ) 1 . T S −1 ( X y − n y x ) 1
Sehingga T bˆ = S −1 ( X 1 y − n y x )
(9)
18
T bˆ0 = y − x bˆ .
Jika
(10)
X = X1 − 1 x
tengah, maka X
T
X = ( X1
T
= X1 X
T
yaitu matriks X1 yang terkoreksi terhadap nilai
T
T
− x 1 ) ( X 1 − 1 x) T
T
X1 − n x x
T
=S
y = ( X 1 T − x 1T ) y = X 1 T y − n x y .
Sehingga persamaan (9) dapat ditulis : bˆ = S −1 ( X 1 T y − n y x ) = (X
T
X
)
-1 X
T
y.
(11)
Jika model umum y = 1 b0 + X 1 b + e , ditulis dalam bentuk X1 yang terkoreksi terhadap nilai tengah ( X ), maka diperoleh : y = 1 b0 + [X + 1 x = 1 b0 + 1 x
T
T
] b+ e
b+X b+ e
= 1 β0 + X b + e .
(12)
Dan diduga oleh : yˆ = 1 βˆ 0 + X
T T T bˆ , dan karena βˆ0 = bˆ0 + x bˆ = [ y − x bˆ ] + x bˆ = y , maka
model (12) diduga oleh : yˆ = 1 y + X
bˆ , dengan bˆ diperoleh dari persamaan (11).
Beberapa sifat penulisan model yang terkoreksi terhadap nilai tengah adalah : 1. bˆ dan βˆ0 adalah penduga tidak bias terhadap b dan y . 2. Jika X pada (3) diganti dengan [ 1
X +1 x
T
] maka akan diperoleh (Searle
1971) : T 1 T bˆ0 + x (X X ) −1 x Var = n ˆ b − ( X T X ) −1 x
Sehingga :
−x (X
T
(X T
T
X ) −1
X ) −1
σ 2.
19
Var ( bˆ ) = (X T X ) −1 σ 2 .
(13)
Dengan penguraian nilai singular dari X , persamaan (13) dapat ditulis sebagai : Var ( bˆ ) = σ
p
1
vj ( ) vj , ∑ λj j =1
2
T
(14)
dimana λ j dan v j masing-masing adalah akar ciri ke-j dan vektor ciri ke -j yang bersesuaian dari matriks X
T
X .
Dari (14) dengan mengganti :
T
vj vj
=
v12j
v1 j v2 j v
2 2j
. . . v1 j v p j . . . v2 j v p j .
*
. . v p2 j
maka akan diperoleh : Var (bi ) =
v i21 λ1
+
v i 22 λ2
+ . .. +
v i2p λp
, i = 1, 2, ... , p .
(15)
Sehingga ragam dari bi akan sangat dipengaruhi oleh akar ciri-akar ciri dari X
T
X , semakin kecil akar ciri ke -i maka semakin besar ragam dari bi.
Dalam kasus multikoline aritas akar ciri X
T
X
ada yang mendekati nol,
sehingga ragam dari bi akan besar.
3. Pendugaan nilai harapan pengamatan baru, E( yo ) dapat dijelaskan sebagai berikut : Dari persamaan (5) dengan mengganti
T
xo = [ 1
X
o
T +x T ]
akan
diperoleh ragam prediksi nilai harapan yo : Var [ yˆ o ] =
σ2 T + X o T X X n
−1
X
2 oσ .
(16)
20
Atau bisa ditulis sebagai : σ2 + σ n
Var [ yˆ o ] = tj =
p
T o v j disebut skor
X
X
∑ j =1
2
X
T o vj vj λj
T
X
o
=
σ 2 + σ n
p
2
∑ j =1
t j2 λj
o pada v j . (17)
Dengan mengganti x oT = [ 1
X
o
T + x T ],
maka persamaan (6) akan
diperoleh sama seperti persamaan (17). 4. Pendugaan nilai pengamatan baru yˆ f dapat dijelaskan sebagai berikut : Dengan cara yang sama maka dari persamaan (7) dan (8) dengan mengganti T
x f =[ 1
[ ]
Var yˆ f =
X
f
T
σ2 + n
1 MSE yˆ f = + n
[ ]
+x X
X
T
f
] akan diperoleh :
T
X
X
T
T X f
−1
X
T
X
2 f σ
f
+ 1 σ 2 .
X
maka persamaan (19) dapat
−1
X
Dan dengan penguraian nilai singular dari
(18)
(19)
ditulis: 1 MSE yˆ f = + n
[ ]
p
h j2
j =1
λj
∑
h j = X f T v j disebut skor
X
+1 σ 2,
(20)
f pada v j .
Persamaan (20) menjelaskan bahwa besaran
MSE ( yˆ f ) tidak hanya
tergantung pada besaran akar ciri, tetapi juga tergantung pada skor
X
f pada
vektor ciri v j . 2.6. Wavelet Wavelet berarti gelombang-gelombang kecil (small waves), sedangkan sinus dan kosinus adalah gelombang-gelombang besar (Percival 2005). Suatu fungsi ψ ( . ) bernilai real, disebut wavelet jika memenuhi :
21
∞
1.
∫ψ −∞ ∞
2.
∫ψ
(u ) du = 1
(21)
(u ) du = 0 .
(22)
2
−∞
Sehingga secara umum Wavelet adalah fungsi-fungsi yang mempunyai sifatsifat tertentu, seperti jika diintegralkan pada (− ∞, ∞ ) hasilnya nol, grafik fungsi ada yang di atas dan di bawah sumbu X (Vidacovic dan Meuller 1991). Ada banyak jenis fungsi wavelet, seperti wavelet yang mulus, wavelet yang nilainya tidak nol secara terbatas (compact support), wavelet yang ekspresi matematikanya sederhana, wavelet yang dihasilkan dari filter-filter yang sederhana, dan lain-lain. Fungsi wavelet yang paling sederhana dan paling tua adalah wavelet Haar, yang ditemukan oleh Alferd Haar tahun 1909 (Vidacovic dan Meuller 1991). Beberapa bentuk wavelet dari keluarga Daubechies, yang termasuk wavelet compact support , dapat dilihat pada Gambar 4 dan Gambar 5.
0.0 -0.5 -1.0
psi
0.5
1.0
Wavelet Picture
0.0
0.2
0.4
0.6
0.8
x Haar wavelet
Gambar 4 Bentuk Haar wavelet
1.0
22
Wavelet Picture (Enhanced)
-1.0
-1.0
-0.5
-0.5
0.0
0.0
psi
psi
0.5
0.5
1.0
1.0
1.5
1.5
Wavelet Picture
-1
0
1
2
-1.0
3
-0.5
x Daub cmpct on ext. phase N=2
0.5
1.0
1.5
(Enhanced)
Wavelet Picture (Enhanced)
1.0
Wavelet Picture
0.0
x Daub cmpct on ext. phase N=3
0.5
1.0
psi
0.0
0.5
psi
-0.5
0.0
-1.0
-0.5
-1.0 -1
0
1
x Daub cmpct on ext. phase N=4
2
-2
-1
0
1
2
x Daub cmpct on ext. phase N=5
Gambar 5 Bentuk-bentuk keluarga wavelet Daubechies (D-2, D-3, D-4 dan D-5) Jika ada fungsi wavelet ψ (t ) , yang disebut mother wavelet, maka dapat dibangkitkan sekumpulan fungsi lain, yang akan menjadi fungsi basis dalam suatu ruang fungsi L2 ( R ) (ruang dari semua fungsi yang terintegralkan), dengan cara translasi dan dilatasi dari ψ (t ) . Fungsi-fungsi basis tersebut secara umum ditulis : t −b , (a , b) ∈ R + xR . ψ a
(23)
Dengan mengambil nilai a = 2-j dan b = k 2-j, k,j ∈ Z, maka akan diperoleh sekumpulan fungsi basis yang saling ortogonal, artinya grafiknya tidak saling tumpang tindih. Sebagai misal, ekspresi matematika dari mother wavelet Haar adalah : 1 , 0≤t < 1 2 ψ (t ) = − 1 , 12 ≤ t < 1 0 , selainnya dengan ψ (2t ) , ψ (2 t − 1) , ψ (2t − 2) dan seterusnya adalah saling ortogonal
(24)
23
Perhatikan bentuk fungsi basis ortogonal yang diperoleh dengan cara dilatasi dan translasi dari fungsi mother wavelet ψ (t ) , ψ
j ,k
(t ) = (konst) ψ (2 j t − k ) ,
(25)
maka untuk memperoleh fungsi basis yang ortonormal, besarnya konstanta harus sama dengan 2 j/2 . Hal ini merupakan konsekuensi dari ψ
j ,k
(t ) yang ortogonal,
sehingga 1 = (konst) 2 ∫ψ 2 (2 j t − k ) dt = ( konst) 2 2 − j ∫ψ 2 (u ) du = ( konst) 2 2 − j . Jadi konstanta sama dengan 2 j/2 . Dengan demikian bentuk fungsi basis yang ortonormal adalah : ψ j ,k (t ) = 2
j/ 2
ψ (2 j t − k ) .
(26)
Fungsi basis pada persamaan (26) adalah fungsi basis ortonormal pada ruang L2 (R ) , yaitu ruang dari semua fungsi yang terin tegralkan kudrat ( ∫ f 2 (t ) dt < ∞ ). Sehingga secara formal, jika
f (t ) ∈ L2 (R) , maka f(t) dapat
didekomposisi atau direpresentasikan sebagai kombinasi linear dari fungsi-fungsi basis yang ortonormal (Antoniadis et al. 2001). Di dalam analisis wavelet, selain fungsi ψ (t ) , dikenal juga fungsi lain yang berkaitan dengan ψ (t ) , yang disebut fungsi father wavelet φ (t ) . Fungsi ini juga dapat membangkitkan fungsi basis ortonormal yang menyusun ruang L2 (R ) . Sehingga secara lebih umum fungsi basis dalam L2 (R) , dapat berbentuk :
{φ
jo ,k
,ψ
j, k
}
, j ≥ jo , k ∈ Z ,
(27)
φ 0, 0 (t ) disebut fungsi skala, yang berhubungan dengan ψ
{φ jo ,k , k ∈ Z} akan membentuk anak ruang {ψ j ,k , j ≥ j o , k ∈ Z }. Untuk Haar wavelet bentuk dari
yang
j ,k
(t ) . Himpunan sama
seperti
φ 0, 0 (t ) yang biasa ditulis
φ (t ) , adalah : 1, 0 ≤ t < 1 φ (t ) = 0 , selainnya.
(28)
24
Dimana
hubungannya
dengan
ψ (t )
dapat
ditunjukkan
sebagai
ψ (t ) = φ ( 2t ) − φ (2t − 1) . Fungsi skala atau father wavelet , φ , adalah penyelesaian dari persamaan : φ (t ) = 2
∑k hk φ (2t − k ) .
(29)
Fungsi φ (t ) dapat membangkitkan suatu keluarga ortonormal L2 (R ) , φ j,k = 2
j
φ (2 j t − k ) , j , k ∈ Z .
2
(30)
Mother wavelet ψ dapat diperoleh dari fungsi skala φ melalui persamaan : ψ (t ) = 2
∑g
k
φ (2 t − k ) ,
(31)
k
dimana g k = (− 1) h1−k (Vidacovic dan Meuller 1991). k
Dari persamaan (29) hk merupakan sederetan bilangan yang mentransformasi suatu fungsi menjadi fungsi lain tanpa merubah bentuknya secara prinsip, hanya fungsi tersebut digeser atau diperkecil. Seda ngkan g k pada persamaan (31) akan mentransformasi fungsi menjadi fungsi lain yang bentuk prinsipnya berubah. Sehingga h k dan g k disebut koefisien-koefisien dari low pass dan high pass filters. Koefisien-koefisien ini digunakan untuk perhitungan dari transformasi wavelet diskret. Koefisien-koefisien tersebut diberikan oleh (Morettin 1997) : ∞
hk = 2
∫
gk = 2
∫
−∞ ∞
φ (t ) φ (2 t − k ) dt
ψ (t ) φ ( 2t − k ) dt .
−∞
Berdasarkan fungsi basis (27), untuk
f (t ) ∈ L2 ( R) , maka f(t) dapat
didekomposisi menjadi : f (t ) = ∑ c jo ,k φ jo , k (t ) + k
∑ ∑ d j ,k ψ j, k (t ) .
(32)
j ≥ jo k
Karena fungsi basis saling ortonormal, maka koefisien-koefisien pada persamaan (32) dapat dihitung dengan (Morettin 1997) : c jo ,k =
∞
∫ f (t ) φ jo ,k (t ) dt
−∞
25
∞
d j ,k =
∫ f (t ) ψ j ,k (t ) dt .
−∞
2.6.1. Transformasi Wavelet Diskret (TWD) Di dalam statistika biasanya ingin diperoleh dekomposisi wavelet dari suatu fungsi yang diamati pada sekumpulan data. Misalkan x = ( x0 , x1 , ... , x2 M −1 ) T adalah vektor data berukuran 2M, M bilangan bulat positif. Maka vektor data tersebut dapat dihubungkan dengan potongan-potongan fungsi konstan pada interval [0,1) yang biasa disebut fungsi tangga, dengan persamaan : f (t ) =
2 M −1
∑x k =0
k
I{
k
2M
≤ t <
( k +1) 2M
}.
(33)
Fungsi tangga f(t) pada persamaan (33) termasuk dalam L2 ([0,1]) , sehingga dekomposisi wavelet dari f(t) adalah (Vidacovic dan Meuller 1991) : f (t ) = c0, 0 φ (t ) +
M −1
2 j −1
d j , k ψ j ,k (t ) . ∑ ∑ j =0 k =0
(34)
Persamaan (34) disebut transformasi wavelet diskret, karena nilai j hanya diambil pada bilangan bulat positif saja. Bilangan j pada persamaan (34) disebut level resolusi, dan f(t) dapat diperoleh secara tepat, jika diambil semua level resolusi untuk dekomposisi, yaitu level resolusi 0 sampai dengan (M -1). Koefisien c0,0 disebut koefisien pemulusan atau bagian pendekatan dari suatu fungsi, sedang d j,k disebut koefisien wavelet atau juga disebut bagian detail suatu fungsi. Dengan mengambil nilai ψ
j ,k
(t ) dan φ (t ) untuk berbagai t, maka persamaan (34)
dapat dituliskan dengan notasi matriks, x =W
T
(35)
d
dan karena W ortonormal (bukti lihat Percival 2005) maka d =W x dimana d = (c0 , 0 , d 0, 0 , d 1,1 , d 1,0 , ... , d n −1, 0 )
(36) T
dan
W T adalah matriks yang
elemen-elemen kolomnya adalah nilai dari φ (t ) dan ψ
j , k (t )
untuk berbagai t
∈ [0, 1]. Sifat-sifat menarik dari matriks W T , selain ortonormal, adalah kolom pertama bernilai sama, jumlah unsur tiap kolom yang lain sama dengan nol.
26
Contoh bentuk matriks W T dari Haar wavelet untuk 2 M = 8 adalah : 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553 0.353553
0.707107 0.000000 0.000000 -0.707107 0.0 00000 0.000000 0.000000 0.707107 0.000000 0.000000 -0.707107 0.000000 0.000000 0.000000 0.707107 0.000000 0.000000 -0.707107 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.707107 -0.707107
0.5 0.5 -0.5 -0.5 0.0 0.0 0.0 0.0
0.0 0.0 0.0 0.0 0.5 0.5 -0.5 -0.5
0.353553 0.353553 0.353553 0.353553 -0.353553 -0.353553 -0.353553 -0.353553
Jika ukuran vektor data x sangat besar, maka perhitungan dengan cara matriks akan memerlukan komputasi yang tinggi, sehingga menjadi kurang praktis. Mallat (1989) menemukan algoritma cepat untuk menghitung koefisien wavelet dan koefisien pemulusan pada persamaan (34), yaitu melalui analisis multiresolusi. Algoritmanya disebut algoritma piramida. Dalam analisis multiresolusi hubungan antara φ (t ) dan ψ (t ) dapat dinyatakan sebagai : φ (t ) = 2
∑h
k
φ ( 2t − k ) dan ψ (t ) = 2
k
∑g
k
φ (2t − k )
(37)
k
h k dan g k disebut filter low-pass dan high pass, dan hubungannya untuk k = 0, 1, ..., L-1 adalah g k = ( −1) k h L − 1− k (Percival 2005). Sebagai misal untuk Haar wavele t dapat ditunjukkan bahwa : φ (t ) = φ ( 2t ) + φ (2t − 1) =
1
ψ (t ) = φ ( 2t ) − φ ( 2t − 1) =
1
2 2
1
Sehingga h (0 ) = h(1) =
2
2 φ (2t ) +
1
2 φ (2t ) −
1
2 2
2 φ (2t − 1) 2 φ ( 2t − 1)
dan g (0) = − g (1) =
1
.
2
2.6.2. Periodisasi Barisan Bilangan Sepanjang N Jika
{ at }adalah
yang dinotasikan (Percival 2005) :
barisan bilangan, maka periodisasi
{ a }dilakukan o t
{ at }
sepanjang N
dengan langkah-langkah sebagai berikut
27
•
Potong
{ at } ke dalam barisan berhingga sepanjang N
a 0 , a1 , ... , a N −1 , a N , a N +1 , ... , a 2 N −1 , ...
blok n = 0 •
(38)
blok n = 1
Tambahkan elemen barisan berhingga dengan cara a0
,
a1
+ aN
,
+ ,
a N +1
...
,
a N −1
... ,
...
+ ,
a 2 N −1
+
+
...
+
...
...
...
...
Hasil : a 00
,
a1o
,
...
,
(39)
a oN −1
2.6.3. Diskripsi Algoritma Piramida Secara Matriks M Jika ada x = (x0 , x1 , ... , xp-1 ) T, dan diasumsikan p = 2 , M bilangan bulat
positif maka langkah-langkah dalam algoritma piramida untuk memperoleh matriks transformasi wavelet diskret, dapat dideskripsikan sebagai berikut : 1. Misalkan ada sekumpulan barisan bilangan
{ hk }
sepanjang L , yang
dalam istilah algoritma piramida disebut low-pass filters atau disebut juga filter skala. Maka dapat dicari sekumpulan barisan bilangan lain
{ gk }
yang disebut high-pass filters, dengan aturan korespondensi satu-satu (Percival 2005) : gk Yang berarti
= (−1) k h L − 1− k .
{ g k }diperoleh
dari{ h k
(40)
} dengan
membalik urutannya dan
tanda positif diganti negatif dan sebaliknya pada urutan genap, misalnya
{ hk } = { h0 , h1 , h2 , h3 } maka { g k } = { h3 , − h2 , h1 , − h0 }. p p 2. Bentuk matrik Bj berukuran j x j −1 , j = 1, 2, ... , M dengan baris2 2 baris dari Bj merupakan
{ g k } yang diperiodekan sepanjang
p 2 j −1
.
28
Misalkan
{ g } hasil periodisasi { g } sepanjang o k
k
p 2 j −1
yang dikalikan
-1 pada tiap elemennya, maka baris ke nol dari Bj adalah : b T0 . = g 1o , g 0o , g o p 2
j− 1
−1
, gop 2 j −1
−2
, ... , g 5o , g 4o , g 3o , g o2 ,
baris ke satu dari Bj adalah : T b 1 . = g 3o , g 2o , g 1o , g 0o , g o p 2
j− 1
sampai baris ke T
bp 2
−1 .
= gop 2
j −1
−1
−1
, g op 2 j− 1
−2
, ... , g 5o , g o4 ,
p − 1 dari Bj adalah : 2 , g op 2 j− 1
−2
, ... , g 5o , g 4o , g o3 , g 2o , g 1o , g o0
Baris ke satu diperoleh dari baris ke nol dengan menggeser dua satuan ke kanan, demikian seterusnya untuk memperoleh baris-baris berikutnya dari Bj. 3.
Dengan cara yang sama seperti membentuk matriks Bj , maka bentuk p p matriks Aj berukuran j x j −1 , j = 1, 2 , ... , M dengan baris-baris dari 2 2 Aj merupakan
4.
{ hk } yang diperiodekan sepanjang
Matriks transformasi wavelet diskret adalah :
p 2 j −1
.
29
W
B1 W1 W B 2 A1 2 W3 B3 A2 A1 W4 B 4 A3 A2 A1 . . . . . . = = W j B j A j −1 ... A1 . . . . . . W M BM AM −1 ... A1 VM AM AM −1 ... A1
(41)
Wj berkaitan dengan matriks transformasi koefisien wavelet pada level resolusi M-j, j = 1, 2, ..., M. Sedangkan V M berkaitan dengan matriks koefisien fungsi skala. Perhitungan algoritma piramida secara skema dapat dilihat pada Gambar 6.
30
Data asli
x
A1 x
B1 x d M-1 koefisien wavelet level resolusi M-1
A2 A1 x
B2 A1 x d M-2 koefisien wavelet level resolusi M- 2
A3 A2 A1 x
B3 A2 A1 x d M-3 koefisien wavelet level resolusi M- 3
. . . AM-1 AM-2 … A2 A1 x
AM AM-1 … A2 A1 x
BM AM-1 … A2 A1 x d 0 koefisien wavelet level resolusi 0
Gambar 6 Skema algoritma piramida
3. EKSPLORASI BERBAGAI METODE PRA-PEMROSESAN DALAM MODEL KALIBRASI Abstrak Dalam pendugaan model kalibrasi, permasalahan yang sering muncul adalah kasus multikolinearitas dan jumlah pengamatan contoh jauh lebih kecil dari jumlah peubah bebas. Salah satu cara untuk mengatasinya adalah dengan mereduksi dimensi peubah bebas, yang disebut prapemrosesan data. Ada banyak metode pra-pemrosesan, diantaranya analisis komponen utama, transformasi Fourier dan transformasi wavelet. Pada Bab ini dilakukan eksplorasi dari ketiga metode tersebut. Analisis data simulasi menunjukkan bahwa metode transformasi wavelet mempunyai potensi untuk diteliti lebih lanjut, karena dari beberapa ukuran kebaikan model yang diperoleh transformasi wavelet lebih unggul dibanding yang lainnya. Kata kunci : model kalibrasi, wavelet, Fourier, pra-pemrosesan. Abstract The problems in prediction of calibration model are multicollinearity and the number of sample observations is less than the number of independent variables. Reduction of dimension of independent variables (preprocessing method) is useful to solve these problems. There are many preprocessing methods such as principal component analysis, Fourier transformation and wavelet transformation that commonly used in calibration modeling. The exploration of these three methods based on simulated data showed that wavelet transformation produced better goodness of fit when compared with other preprocessing methods. Therefore, it is instructive to investigate further aspects of the wavelet transformation in calibration modeling. Key words : calibration model, wavelet, Fourier, preprocessing
32
Pendahuluan Kita perhatikan model kalibrasi y = 1 b0 + X b + e , dimana y adalah vektor berukuran (nx1) dan X = [ x 1 , x 2 , ... , x p ] adalah matriks berukuran nxp. Jika korelasi antara x i dan x j untuk i ≠ j semua sama dengan 1 atau -1, maka ( X T X ) menjadi matriks singular. Sehingga b0 dan b tidak dapat diduga dengan metode kuadrat terkecil. Tetapi jika besarnya korelasi antara x i dan x j mendekati 1 atau -1 (kasus multikolinearitas), maka ( X T X ) mendekati singular, b0 dan b masih dapat diduga tetapi tidak stabil atau keragamannya besar. Jika n < p maka permasalahan menjadi tambah kompleks, karena selain penduga b0 dan b tidak stabil, juga derajat bebas sisaan bernilai negatif. Salah satu cara untuk menangani kasus multikolinear dan n < p adalah dengan mereduksi dimensi matriks X
(nxp)
menjadi peubah baru, misalkan D(nxm) sehingga m <
(n-1) < p. Hal inilah yang disebut metode pra-pemrosesan dalam model kalibrasi. Ada beberapa metode pra-pemrosesan, diantaranya adalah analisis komponen utama (PCA), transformasi Fourier dan transformasi wavelet (Naes et al. 2002). Ketiga metode ini mempunyai kemiripan dalam reduksi dimensi data, yaitu melakukan transformasi X menjadi peubah baru D dengan rumus D = X W T , dimana W adalah matriks transformasi yang ortogonal. Pada bab ini dilakukan eksplorasi terhadap ketiga metode pra-pemrosesan tersebut dengan cara mengaplikasikannya terhadap data simulasi, agar diketahui potensi ketiga metode pra-pemrosesan tersebut.
Metode dan Bahan Penelitian
Untuk mengevaluasi metode pra-pemrosesan dengan PCA, transformasi Fourier dan transformasi wavelet (yang dalam penelitian ini diambil fungsi wavelet yang paling sederhana yaitu Haar wavelet), maka akan dibangkitkan 3 data simulasi yang masing- masing menggambarkan kasus multikolinearitas dan n < p.
33
Tahapan simulasi data tersebut dapat dijelaskan sebagai berikut : •
Pembangkitan x = ( x1 , x 2 , ..., x p ) ∼ N ( µ, Σ ) , dengan korelasi antar peubah sangat tinggi (mendekati 1 dan -1 yang dalam penelitian ini diambil 0.99 * ) , dengan langkah- langkah : 1.
Tentukan matriks Ó yang mencerminkan koragam dari p peubah yang saling berkorelasi.
2.
Dari Ó temukan matriks G sedemikian hingga Ó = GTG.
3.
Bangkitkan p peubah acak normal baku yang saling bebas, z1 , z2 , ... , zp, dan ambil z = (z1 , z2 , ... , zp )T .
4.
Tetapkan µ= (E(x1 ), E(x2 ), … , E(xp ))T .
5.
Hitung x = G T z + µ
6.
Ulangi langkah 1 sampai 5, sebanyak n kali, sehingga akan diperoleh matriks X ukuran nxp yang saling berkorelasi.
•
Membangkitkan y = X β + ε , dengan langkah sebagai berikut : a. Tetapkan vektor β b. Hitung yˆ = X β c. Bangkitkan vektor ε d. Hitung nilai pengamatan y = yˆ + ε . Untuk penelitian ini data simulasi pertama diambil n = 20 dan p = 64, data
simulasi kedua n = 40 dan p = 128, serta data simulasi ketiga n = 20 dan p = 256. Program simulasi dalam SAS dapat dilihat pada Lampiran 4, 5 dan 6. Untuk ketiga data simulasi X yang dihasilkan dikoreksi terhadap nilai tengah, kemudian ditransformasi menjadi peubah baru, dari peubah baru ditentukan model regresi terbaik terhadap respon y dengan analisis regresi bertatar. Ukuran kebaikan model dilihat dari R2 , R2 adjust , S dan PRESS yang dihasilkan (Myers 1990). Perhitungan
*
Tanda desimal dalam bilangan dinyatakan dengan titik
34
matriks koefisien wavelet dengan menggunakan software wavetresh 3 seperti yang dijelaskan oleh Nason (1994 dan 1998). Hasil dan Pembahasan Jika X adalah matriks X yang terkoreksi terhadap nilai tengahnya, maka matriks peubah baru hasil transformasi dengan PCA, transformasi Fourier dan transformasi wavelet secara umum adalah : = X ( nxp ) W(Tpxp )
D( nxp )
(42)
W(Tpxp) = [ w1 . , w2 , ... , w p . ] . Untuk PCA wi . adalah vektor berukuran px1 yang merupakan vektor ciri ke-i dari matriks kovarian contoh
X
.
Untuk transformasi Fourier :
W
T
2 π 1. 1 2 π 2. 1 cos 1 cos p p 2 π 1. 2 2 π 2. 2 cos 1 cos p p = . . . . . . . . . 2 π 1. p 2 π 2. p 1 cos cos p p
. .. . ..
. ..
2 π [ p / 2 ]. 1 cos p 2 π [ p / 2 ]. 2 cos p .
2 π 1. 1 sin p 2 π 1. 2 sin p .
.
.
. 2 π [ p / 2]. p . . . cos p
. 2 π 1. p sin p
2 π 2. 1 2 π [ p / 2 ]. 1 . . . sin sin p p 2 π 2. 2 2 π [ p / 2 ]. 2 . . . sin sin p p . . . ... . . . 2 π 2. p 2 π [ p / 2]. p sin . . . sin p p
(43) W adalah ortogonal karena fungsi sinus dan kosinus saling ortogonal. Hal ini dapat ditunjukkan dengan memanfaatkan identitas trigono metri sebagai berikut (William 1994) : p
∑ cos ( j =1 p
∑ sin ( j =1
p , j = 0 2πi j )= p 0 , j ≠ 0
(44)
2π i j ) = 0 , j = 0 , 1 , ... , [ p / 2] , p
dimana [ p / 2] adalah bilangan bulat terbesar kurang dari atau sama dengan p / 2 .
35
p , k = m = 0 atau p / 2 ( p genap ) 2π k j 2π m j cos ( ) cos ( ) = p / 2 , k = m ≠ 0 atau p / 2 ( p genap ) ∑ p p j =1 0 , k ≠m p
0 , k = m = 0 atau p / 2 ( p genap ) 2π k j 2π m j sin ( ) sin ( ) = p / 2 , k = m ≠ 0 atau p / 2 ( p genap ) ∑ p p j =1 0 , k≠m p
p
∑ sin ( j =1
(45)
2π k j 2π m j ) sin ( ) = 0 , untuk semua k dan j . p p
Sedangkan untuk transformasi wavelet, wi . diperoleh dari nilai fungsi father dan mother wavelet (misal Haar wavelet ) pada interval [0,1). Reduksi dimensi diambil D(nxm ) dimana m < p. Matriks W T dalam transformasi wavelet adalah ortogonal (Percival 2005). Ukuran kebaikan model regresi y terhadap peubah baru D(nxm ) untuk masingmasing data simulasi dengan pra-pemrosesan transformasi Haar wavelet, transformasi Fourier dan PCA ringkasannya dapat dilihat pada Tabel 3. Hasil lengkap dapat dilihat di Lampiran 1 sampai Lampiran 3. Tabel 3 Ringkasan hasil analisis model D(nxm ) terhadap y Metode Pra-pemrosesan Haar PCA Wavelet Fourier Simulasi 1 n = 20 p = 64 Simulasi 2 n = 40 p = 128
R2 R2adjust S PRESS R2 R2adjust S PRESS
97.9%
74.0%
89.0%
96.7% 0.1947 1.1959 98.4%
69.1% 0.5974 9.4450 97.3%
85.1% 0.4144 5.2301 96.8%
97.9% 0.0477 0.1280
96.8% 0.0587 0.1697
96.2% 0.0640 0.1922
Sedangkan plot antara y dengan yˆ dapat dilihat pada Gambar 7 sampai Gambar 9.
36
Scatterplot of Y vs FITSPCA1,4,5,9,1, FITSHaarjadi, FITSFour ier(ao,b V ariab le
5
F ITSP C A 1, 4, 5,9,12 F ITSHaarjad i F ITSF ourier(ao,b 1, b5)
4
Y
3
2
1
0 0
1
2
3 Y DUGA
4
5
Gambar 7 Plot y vs yˆ untuk data simulasi 1
Scatterplot of Y vs FITS33PCA, FITSFOURIER, FITSHaarwavelet 2.50
V ariable F IT S33PC A F IT SFO URIER F IT SHaarwavelet
2.25 2.00
Y
1.75 1.50 1.25 1.00
1.00
1.25
1.50 1.75 Y DUGA
2.00
2.25
2.50
Gambar 8 Plot y vs yˆ untuk data simulasi 2
37
Scatterplot of Y vs F ITSHaarwav elet, FITSFourier, FITS19PCA 4.0
Variable FITSHaarw avelet FITSFourier FITS19PC A
3.5 3.0
Y
2.5 2.0 1.5 1.0 0.5 0.5
1.0
1.5
2.0 2.5 Y DUGA
3.0
3.5
4.0
Gambar 9 Plot y vs yˆ untuk data simulasi 3
Tabel 3, Gambar 7 sampai dengan Gambar 9 menunjukkan bahwa dari berbagai ukuran kebaikan model, transformasi wavelet dengan mother wavelet yang paling sederhana saja ternyata lebih unggul dibanding PCA dan transformasi Fourier. Selain itu dari segi korelasi yang dihasilkan ternyata transformasi wavelet mampu memperkecil korelasi dari sekitar 1 dan -1 menjadi banyak yang dibawah 0.5, walaupun ada sebagian yang masih tinggi. Hasil hasil inilah yang akan dikaji lebih lanjut dalam bab-bab berikutnya, karena adanya dugaan dengan mother wavelet yang paling sederhana saja ternyata lebih unggul dibanding metode pra-pemrosesan yang lain. Selain itu hasil simulasi yang diperoleh dalam bab ini dapat memberi penguatan alasan mengapa metode transformasi wavelet sering digunakan sebagai metode prapemrosesan dalam kalibrasi peubah ganda untuk mengatasi kasus n < p, seperti yang dilakukan oleh McMulty dan Ganapati (1998), Shao dan Yadong (2004), Yi- yu dan Chen min-jun (2000), Fearn (1999) dan Brown et al. (2001).
38
Simpulan
Dari eksplorasi data simulasi ternyata transformasi wavelet mempunyai potensi untuk diteliti lebih lanjut, karena walaupun ha nya dengan mother wavelet yang paling sederhana yaitu Haar wavelet telah memberikan hasil ukuran kebaikan model yang lebih baik dibanding PCA dan transformasi Fourier.
Daftar Pustaka
Brown PJ, Fearn T, Vanucci M. 2001. Bayesian Wavelet Regression on Curves with Application to a Spectroscopic Calibration Problem. J Amer Statist Assoc 96: 398-408. Fearn T. 1999. Data Compression : FT or Wavelet. Spectroscopy Europe, London (http://195.173.150.81/td_col.html). McNulty SC, Ganapati M. 1998. Application of Wavelet Analysis Determining Glucose Concentration of Aqueous Solution Using NIR Spectroscopy. HewlettPackard comp. Myers RH. 1990. Classical and Modern Regression with Applicatios. PWS-KENT Pub. Co. Naes T, Isaksoon T, Fearn T, Davies T. 2002. A User Friendly Guide to Multivariate Calibration and Classification. NIR publications, UK. Nason GP, Silverman BW. 1994. The discrete wavelet transform in S. J.comp graph. Stat. 3: 163-191. Nason GP. 1998. Wavethresh 3 software. Department of Mathematics, University of Bristol, UK. (http://www.stats.bris.ac.uk/~wavethresh) [ 20 juni 2003] Percival DB. 2005. Wavelets : Data Analysis, Algorithms and Theory. University Washington. (http://www.ms.washington.edu/~s530/) [18 april 2005]. Shao X, Yadong Zhuang. 2004. Determining of Chlorogenic Acid in Plant Samples by Using Near-Infrared Spectrum with Wavelet Transform Preprocessing. Analytical Sciences 20.
39
William WWS. 1994. Time Series Analysis. Addison-Wesley Pub. Comp. Yi-yu Cheng, Chen min-jun. 2000. A New Computing Multivariate Spectral Analysis Method Based on Wavelet Transform. Journal of Zhejiang University Science 1: 15-19.
4. REDUKSI DIMENSI DENGAN TRANSFORMASI WAVELET DISKRET Abstrak Dari kajian empiris dan kajian pustaka transformasi wavelet diskret mampu menghasilkan model regresi yang mempunyai ukuran kebaikan model relatif baik untuk prediksi. Dalam bab ini akan diteliti lebih jauh tentang sifat-sifat dari matriks koefisien wavelet dan matriks transformasi wavelet. Dengan harapan untuk mengetahui keunggulan dan kelemahan transformasi wavelet dibanding metode transformasi yang lain seperti PCA dan transformasi Fourier. Selain itu akan diteliti pula bagaimana tata cara wavelet dalam mereduksi dimensi. Transformasi wavelet diskret ternyata mempunyai keunggulan dibandingkan transformasi Fourier atau PCA dalam hal banyaknya alternatif memilih berbagai matriks transformasi sehingga hasil reduksi dimensi masih cukup mendekati peubah asal. Sedangkan kelemahannya, ternyata tidak ada jaminan secara matematis bahwa korelasi antara koefesien wavelet menjadi relatif kecil semua. Kata kunci : reduksi dimensi, matriks transformasi wavelet Abstract Empirical and literature studies showed that discrete wavelet transform (DWT) produced regression model with better goodness of fit than the other transform methods. In this chapter we study the properties of the wavelet coefficient matrix. The objective is to elaborate the strength and weakness of discrete wavelet transform compared to the other transform methods, such as principal component analysis and Fourier transform. DWT provides a lot of alternative matrix of transformation which can be selected, in such a way that the resulted of dimension is compatible with the original variables. However, there is no mathematically proof to guarantee that the wavelet coefficients are not correlated. Key words : dimension
reduction, matrix wavelet transform
41
Pendahuluan Dari kajian empiris (Sunaryo dan Notodiputro 2004a, 2004b, 2005) dan kajian pustaka (McNulty dan Ganapati 1998; Shao dan Yadong 2004; Yi- yu dan Chen minjun 2000; Fearn 1999; Brown et al. 2001) transformasi wavelet diskret merupakan metode pra-pemrosesan yang menjanjikan dalam mereduksi dimensi matriks peubah bebas dalam pemodelan kalibrasi. Karena mampu menghasilkan model regresi yang mempunyai ukuran kebaikan model relatif baik untuk prediksi. Dalam transformasi wavelet diskret (TWD) suatu vektor pengamatan dinyatakan sebagai kombinasi linear dari fungsi- fungsi basis yang disebut fungsi wavelet (singkatan dari wave little, Vidacovic dan Meuller 1991). Secara umum TWD dapat ditulis sebagai : f (t ) = c0 , 0 φ( t ) +
M −1
2 j −1
j =0
k =0
∑ ∑d
j ,k
ψ j , k (t ) .
(46)
Koefisien c0,0 disebut koefisien pemulusan atau bagian pendekatan dari suatu fungsi, sedang dj,k disebut koefisien wavelet atau juga disebut bagian detail suatu fungsi. Dengan mengambil nilai ψ j , k (t ) dan φ(t ) untuk berbagai t, maka persamaan (46) dapat dituliskan dengan notasi matriks, x =W
T
d
(47)
dan karena W ortonormal (bukti lihat Percival 2005) maka d =W x
(48)
dimana d = ( c0, 0 , d 0, 0 , d1,1 , d1,0 , ... , d n −1,0 ) T dan W adalah matriks yang elemenelemen kolomnya adalah nilai dari φ(t ) dan ψ j , k (t ) untuk berbagai t ∈ [0, 1] . Matriks TWD, W, adalah matriks ortogonal, untuk apapun mother wavelet yang digunakan. Jika matriks X ( nxp) = [ x 1 , x 2 , ... , x p ] T maka TWD dapat ditulis : D= X
WT .
(49)
Secara empiris salah satu sifat yang diperoleh bahwa matriks koefisien wavelet D hasil transformasi dari matriks X, dapat menurunkan korelasi antar x i dan x j untuk i ≠ j menjadi lebih kecil, walaupun masih ada beberapa yang tetap besar.
42
Dalam bab ini akan diteliti lebih jauh tentang sifat-sifat dari matriks koefisien wavelet D dan matriks TWD, W. Dengan harapan untuk mengetahui keunggulan dan kelemahan transformasi wavelet dibanding metode transformasi yang lain seperti PCA dan transformasi Fourier. Selain itu akan diteliti pula bagaimana tata cara wavelet dalam mereduksi dimensi.
Metode dan Bahan Penelitian Metode yang digunakan dalam penelitian ini adalah analisis teori dari transformasi wavelet diskret. Langkah awal adalah menganalisis bagaimana memperoleh matriks transformasi wavelet sehingga didapatkan matriks W yang ortogonal untuk apapun mother wavelet yang digunakan. Langkah berikutnya adalah menganalisis bagaimana sifat-sifat dari koefisien wavelet yang dihasilkan dari transformasi wavelet diskret. Untuk me mperjelas hasil analisis teori, akan diberikan contoh-contoh dari data sederhana.
Hasil dan Pembahasan Jika ada vektor pengamatan x = ( x0 , x1 , ... , x p −1 ) T , p = 2M, M bilangan bulat positif, maka vektor pengamatan tersebut dapat dinyatakan dalam fungsi tangga pada interval [0.1) : f (t ) =
2 M −1
∑x
k
k =0
I {k
2M
≤ t <
( k +1 ) 2M
}.
(50)
Dengan transformasi wavelet diskret f(t) dapat didekomposisi menjadi : f (t ) = c0 , 0 φ( t ) +
M −1
2 j −1
j =0
k =0
∑ ∑d
j ,k
ψ j , k (t ) .
Sehingga dengan notasi matriks dapat ditulis : x =W
T
d.
Sebagai misal untuk p = 4, maka vektor pengamatan x = ( x 0 , x1 , x 2 , x3 ) T dapat ditulis sebagai :
43
x0 , 0 ≤ t < 14 x , 1 ≤ t < 2 1 4 4 f (t ) = 2 3 x2 , 4 ≤ t < 4 x3 , 34 ≤ t < 1 . Dan dengan transformasi wavelet diskret maka diperoleh : x0 = f (t ∈ [ 0 , 14 )) = c00 φ(t ∈ [0 , 14 )) + d 00 ψ00 (t ∈ [ 0 , 14 )) + d10 ψ10 ( t ∈ [0 , 14 )) + d11 ψ11 (t ∈ [ 0 , 14 )) x1 = f ( t ∈ [ 14 , 24 )) = c 00 φ(t ∈ [ 14 , 24 )) + d 00 ψ00 (t ∈ [ 14 , 24 )) + d10 ψ10 ( t ∈ [ 14 , 24 )) + d 11 ψ11 (t ∈ [ 14 , 24 )) x 2 = f (t ∈ [ 24 , 34 )) = c 00 φ(t ∈ [ 24 , 34 )) + d 00 ψ00 (t ∈ [ 24 , 34 )) + d10 ψ10 (t ∈ [ 24 , 34 )) + d11 ψ11 (t ∈ [ 24 , 34 )) x 3 = f (t ∈ [ 34 , 1)) = c00 φ(t ∈ [ 34 , 1)) + d 00 ψ00 (t ∈ [ 34 , 1)) + d10 ψ10 (t ∈ [ 34 , 1)) + d11 ψ11 (t ∈ [ 34 , 1)) . Yang dalam notasi matriks dapat ditulis : φ(t ∈ [0 , 14 )) x0 x 1 2 1 = φ(t ∈ [ 4 , 4 )) φ(t ∈ [ 24 , 34 )) x2 3 x3 φ(t ∈ [ 4 , 1))
ψ00 (t ∈ [0 , 14 )) ψ10 (t ∈ [0 , 14 )) ψ11 (t ∈ [ 0 , 14 )) ψ00 (t ∈ [ 14 , 24 )) ψ10 (t ∈ [ 14 , 24 )) ψ11 (t ∈ [ 34 , 1)) ψ00 (t ∈ [ 24 , 34 )) ψ10 (t ∈ [ 24 , 34 )) ψ11 (t ∈ [ 24 , 34 )) ψ00 ( t ∈ [ 34 , 1)) ψ10 (t ∈ [ 34 , 1)) ψ11 (t ∈ [ 34 , 1))
c 00 d 00 d 10 d 11
atau : x =W
T
d.
W disebut matriks transformasi wavelet, dan agar diperoleh matriks W yang ortogonal, maka dipilih φ(t ) dan ψ j , k (t ) sedemikian hingga : 1
1. ∫ φ( t ) dt = 1 0 1
2. ∫ψ jk (t ) dt = 0 0
1
3. ∫ψ 2jk (t ) dt = 1 0
44
1
4. ∫ψ jk (t ) ψlm ( t ) dt = 0 untuk j = l dan k = m tidak terjadi secara bersamaan. 0
1
5.
∫ φ(t) ψ
( t ) dt = 0 .
jk
0
Kemudian matriks WT diperoleh dengan mengalikan semua komponen φ(t ) dan 1 untuk t ∈ [ 0, 1) . W ortogonal berarti W T W = W W T = I . p
ψ j , k (t ) dengan
Sebagai misal untuk Haar wavelet (Morettin 1997) : 1 , 0 ≤ t < 1 φ(t ) = 0 , selainnya
(51)
2k + 1 j/ 2 k 2 , 2 j ≤ t < 2 j +1 2k + 1 k +1 ψ jk ( t ) = − 2 j / 2 , ≤t< j j +1 2 2 0 , selainnya .
(52)
Jika p = 4 maka untuk Haar wavelet akan diperoleh :
WT
12 1 = 21 2 1 2
1 2 1 2
− −
1 2 1 2
−
1 2 1 2
0 0
0 0 1 2 − 12
yang memenuhi W T W = W W T = I . Karena W ortogonal maka koefesien wavelet dapat dihitung dengan d =W x. Untuk x yang dimensinya besar, perhitungan koefisien wavelet dengan cara matriks kurang efisien, sehingga Mallat (1989) menemukan suatu algoritma untuk menghitung koefesien wavelet, yang disebut algoritma piramida. Dari contoh sederhana terlihat jumlah elemen tiap kolom dari matriks WT sama dengan nol kecuali kolom pertama yang berhubungan dengan fungsi skala (father wavelet). Hal ini
45
disebabkan karena elemen-elemen selain kolom pertama dari matriks WT diperoleh ∞
dari fungsi mother wavelet yang mempunyai sifat umum
∫ψ(t ) dt = 0 .
−∞
Pembuktian secara lengkap bahwa untuk apapun fungsi mother wavelet akan diperoleh W W T = I dapat dilihat pada Percival (2005).
Sifat-sifat matriks koefisien wavelet Misalkan matriks X berukuran (nxp) dan matriks X yang terkoreksi terhadap nilai rata-ratanya adalah :
X = X −1 x
T
X T1. T X 2. = . . . .T X n.
Dengan transformasi wavelet diskret
X
( nxp )
= D(nxp )
X
T j.
(53)
T
= d j. W akan diperoleh
d T1 . T d 2. . W( pxp) , dimana D = . . . d T n.
(54)
Karena W W T = I , maka D(nxp ) = X
(nxp )
W(Tpxp) .
(55)
Reduksi dimensi diambil m < p, sehingga : T D(*nxm) = X ( nxp) W(*pxm ),
(56)
yaitu dengan memberi nilai nol pada kolom (m+1) sampai dengan p dari matriks W T. Sifat-sifat dari matriks koefisien wavelet D adalah :
46
Teorema 1 : Jumlah elemen tiap kolom dari D sama dengan nol Bukti : Jika D = [ c 00 . d 00 . d 10. ... d M , 2 M −1 ,. ] ,
W T = [ φ. ψ 00. ψ10 . ... ψ M , 2 M −1 , . ]
X =
dan
X T1. T X 2 . . . .T X n.
maka dari
persamaan D( nxm) = X ( nxp) W(Tpxm ) akan diperoleh kolom pertama dari D :
c 00.
X T1. T X 2 . = X φ. = . φ. atau c 00i = . .T X n.
X
T i.
φ . , sehingga
n
n c = ∑ 00i ∑ X Ti. φ. i =1
i =1
=
n
p
∑∑ i =1 j =1
X ij
p
n
p
j =1
i =1
j =1
φj = ∑ φj ∑ X ij = ∑ φ j
n
∑(x i =1
ij
− xj) = 0.
Sedangkan selain kolom pertama dari D, diperoleh :
d lm . = X ψ lm .
d lmi =
X
T i.
ψ lm .
X 1T. T X 2. = . ψ lm. untuk l = 0 , 1 , ... , M dan m = 0 , 1 , ... , 2 l − 1 . .T X n .
47
n
n d = ∑ lmi ∑ X Ti. ψlm. i =1
i =1
=
n
p
∑∑ i =1 j =1
=
p
n
∑ψ ∑ (x lmj
j =1
p
n
j =1
i =1
ψ lmj = ∑ψ lmj ∑ X ij
X ij
i =1
ij
− xj)= 0.
Teorema 2 : Secara umum kovarian antar koefisien wavelet tidak sama dengan nol. Bukti : D(nxp ) = X
(nxp )
COV ( X ) = Σ
X
W(Tpxp) = E (X T X
).
Penguraian spetral (Spectral decomposition) dari kovarian X adalah :
Σ
X
λ1 0 . = P Λ P T , Λ = . . 0
0 λ2 ... .. .
... ...
0 0 . , λ1 ≥ λ2 ≥ . . . ≥ λp . . . λp
Kolom ke i dari matriks P adalah vektor ciri ke- i yang bersesuaian dengan akar ciri λi dari Σ . X
Struktur matriks kovarian dari D dapat digambarkan sebagai berikut Σ D = E ( DT D) =
E (W X T X W T )
= W E (X
T
X )W
(57)
T
= W P Λ PT W T . Karena W P secara umum tidak sama dengan matriks identitas I, maka secara umum Σ D ≠ Λ . Hal ini berarti kovarian antar kolom D secara umum tidak sama dengan nol, atau antar kolom D masih dimungkinkan terjadi korelasi.
48
w1T. T w 2. . Jika W = dan P = [ p . 1 p . 2 . . . p . p ] maka . . wT p. w1T. T w 2. . ΣD = . . wT p.
p ∑ λi p . i p T. i [ w1. w2 . . . . w p . ] . i =1
(58)
Sehingga : p
(
Var ( d k ) = ∑ wTk . λi p . i p T. i wk . i =1
p
(
)
(59)
)
COV ( d k , d l ) = ∑ wTk . λi p . i p T. i wl . . i =1
(60)
Yang berarti besar kovarian atau korelasi antar koefisien wavelet ( d k dan d l ) akan mendekati nol jika ketiga besaran λi , wk . p . i dan p . i w l . mendekati nol. T
T
Sebagai pembanding untuk PCA (principal component analysis) w j . = p . j T
T
atau W P = I (Sharma 1996). Sehingga untuk PCA dijamin antar peubah baru tidak saling berkorelasi. Dengan cara sama seperti penurunan pada transformasi wavelet dapat ditunjukkan bahwa untuk transformasi Fourier juga tidak ada jaminan matematis bahwa korelasi antar peubah baru sama dengan nol.
49
Teorema 3 : Jumlah akar ciri dari
D T D akan sama dengan jumlah akar ciri
X T X
Bukti : tr (Σ D ) = tr(W P Λ P T W T ) = tr ( P T W T W P Λ ) = tr ( Λ ) p
= ∑ λj . j =1
tr (Σ ) = tr( P Λ P T ) X
= tr ( P T P Λ ) p
= ∑ λj . j =1
Jika Σ D didekomposisi dengan penguraian spektral maka : τ1 0 . T Σ D = V L V , dimana L = . . 0
0 τ2 .. . ...
. .. . ..
0 0 . , untuk τ1 ≥ τ 2 ≥ . . . ≥ τ p dan . . τ p
V V T = V TV = I . Sehingga tr (Σ D ) = tr(V L V T ) = tr (V T V L) p
= ∑τ j . j =1
Karena tr ( DT D) = (n − 1) tr ( Σ D ) dan tr ( X T maka jumlah akar ciri dari X T X
.
DT D
X
) = ( n − 1) tr ( Σ
X
)
akan sama dengan jumlah akar ciri
50
T Pada reduksi dimensi dengan transformasi wavelet D(*nxm) = X ( nxp) W(*pxm ) dengan
cara seperti di atas maka dapat ditunjukkan bahwa Σ D* = E ( D * T D * ) =
E (W * X T X W * T )
= W E (X *
T
X )W
(61)
*T
= W P Λ P W *T . *
T
m
tr (Σ D * ) = ∑τ *j .
(62)
j =1
Sehingga proporsi keragaman X yang bisa diterangkan oleh D * adalah : m
m
∑τ *j j =1
atau
p
∑τ j =1
∑τ
j
j =1
* j
(63)
p
∑λ j =1
j
dimana τ *j adalah akar ciri ke-j dari D * T D * , τ j adalah akar ciri ke-j dari D T D dan λj adalah akar ciri ke-j dari X T X . Hal ini berarti kebaikan reduksi jika diukur dari proporsi keragaman peubah asal yang dapat diterangkan oleh peubah baru dari transformasi wavelet, maka akan tergantung pada kemampuan memperoleh jumlah akar ciri yang tidak nol yang proporsinya masih besar dibanding dengan jumlah akar ciri yang diperoleh oleh D T D atau X T X . Ide dasar pembuktian teorema 2 dan 3 di atas diperoleh dari Sharma
(1996) halaman 86-87. Dari uraian sifat-sifat di atas maka transformasi wavelet diskret mempunyai keunggulan dibandingkan transformasi Fourier atau PCA dalam hal banyaknya alternatif memilih berbagai fungsi wavelet yang jumlah akar ciri D * T D * masih besar, sehingga hasil reduksi dimensi masih cukup mendekati peubah asal. Sedangkan kelemahannya, ternyata tidak ada jaminan secara matematis bahwa korelasi antara koefesien wavelet menjadi relatif kecil semua, sehingga masih dimungkinkan terjadi
51
kasus multikolinearitas dalam pemodelan regresi. Akibatnya transformasi wavelet diskret sebaiknya digabung dengan metode lainnya dalam pemodelan regresi.
Simpulan Transformasi wavelet diskret dari peubah asal X
(nxp )
menjadi peubah baru
berupa koefisien wavelet D*(nxm ) dengan m < p mempunyai keunggulan dibandingkan transformasi Fourier atau PCA dalam hal banyaknya alternatif memilih berbagai fungsi wavelet yang jumlah akar ciri D * T D * masih besar, sehingga hasil reduksi dimensi masih cukup mendekati peubah asal. Sedangkan kelemahannya, ternyata tidak ada jaminan secara matematis bahwa korelasi antara koefesien wavelet D*(nxm ) menjadi relatif kecil semua, sehingga masih dimungkinkan terjadi kasus multikolinearitas dalam pemodelan regresi. Akibatnya transformasi wavelet diskret sebaiknya digabung dengan metode lainnya dalam pemodelan regresi.
52
Daftar Pustaka
Brown PJ, Fearn T, Vanucci M. 2001. Bayesian Wavelet Regression on Curves with Application to a Spectroscopic Calibration Problem. J Amer Statist Assoc 96: 398-408. Fearn T. 1999. Data Compression : FT or Wavelet. Spectroscopy Europe, London (http://195.173.150.81/td_col.html). McNulty SC, Ganapati M. 1998. Application of Wavelet Analysis Determining Glucose Concentration of Aqueous Solution Using NIR Spectroscopy. HewlettPackard comp. Morettin PA. 1997. Wavelets in Statistics. Institute of Math. And Stat., University of Sao Paulo, Brazil. Mallat, SG. 1989. Multiresolution Approximations and Wavelet Orthogonal Bases of L2 (r). Transactions of the American Mathematical Society 315: 69-87. Percival DB. 2005. Wavelets : Data Analysis, Algorithms and Theory. University Washington. http://www.ms.washington.edu/~s530/ [18 april 2005]. Sharma S. 1996. Applied Multivariate Techniques. John Wiley & Sons, Inc. New York, USA Shao X, Yadong Zhuang. 2004. Determining of Chlorogenic Acid in Plant Samples by Using Near-Infrared Spectrum with Wavelet Transform Preprocessing. Analytical Sciences 20. Sunaryo S, Notodiputro KA. 2004a. Reduksi Dimensi Data Spektra dengan Fourier dan Wavelet. Seminar Nasional Statistika, Departemen Statistika, IPB, Bogor, 4 September 2004. Sunaryo S, Notodiputro KA. 2004b. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kandungan Senyawa Gingerol pada Tanaman Jahe. Statistika - Forum Teori dan Aplikasi Statistika 4: 181-185 , Jurusan Statistika FMIPA UNISBA Sunaryo S, Notodiputro KA. 2005. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kandungan Senyawa Kurkumin pada Tanaman Temulawak.
53
Prosiding Seminar Nasional Matematika , halaman 100-107, Jurusan Matematika UNS, Surakarta , 7 Mei 2005. Vidacovic B, Meuller P. 1991. Wavelets for Kids. A Tutorial Introduction. AMS Subject Classification, Duke University. Yi-yu Cheng, Chen min-jun. 2000. A New Computing Multivariate Spectral Analysis Method Based on Wavelet Transform. Journal of Zhejiang University Science 1: 15-19.
5. SIFAT-SIFAT STATISTIK PENDUGAAN MODEL KALIBRASI MELALUI METODE TRANSFORMASI WAVELET DISKRET Abstrak Pemodelan kalibrasi dapat dipandang sebagai proses untuk memodelkan hubungan peubah bebas (X), ukuran yang mudah/murah diperoleh, dengan peubah tak bebas (Y). Permasalahan dalam pemodelan kalibrasi adalah multikolinearitas antar peubah bebas, dan banyaknya pengamatan (n) lebih kecil dari banyaknya peubah bebas (p). Dari beberapa kajian empiris dan pustaka ternyata metode transformasi wavelet diskret (TWD) sebagai pra-pemrosesan untuk mereduksi dimensi data X akan memberikan hasil pendugaan model kalibrasi yang lebih memuaskan. Bab ini memfokuskan pada bagaimana sifat-sifat statistik dari dugaan model kalibrasi yang diperoleh dengan pra-pemrosesan metode transformasi wavelet diskret. Penduga parameter pada model regresi terhadap koefisien wavelet ternyata merupakan penduga berbias, tetapi besarnya bias ini dapat dikompensasi dengan ragam penduga yang makin kecil. Kata kunci : model kalibrasi, wavelet Abstract The calibration modeling can be viewed as a process to find relationships between a set of measurements which are easy or cheap to acquire and other measurements which are either expensive or labour intensive. The problems in calibration modeling is multicollinearity and the number of observations less than the number of independent variables. Empirical and literature studies showed that discrete wavelet transform (DWT) produced regression model with better goodness of fit than the other transform methods. This chapter focused on statistical properties estimator of calibration models using DWT as a preprocessing method. The research showed that parameter estimator is bias, but this bias can be compensated with smaller standard deviation. Key Words : calibration model, wavelet
55
Pendahuluan Pemodelan kalibrasi dapat dipandang sebagai proses untuk memodelkan hubungan peubah bebas (X), ukuran yang mudah/murah diperoleh, dengan peubah tak bebas (Y), ukuran yang mahal diperoleh. Permasalahan yang sering muncul dalam pemodelan kalibrasi adalah terjadi multikolinearitas antar peubah bebas, dan banyaknya pengamatan (n) lebih kecil dari banyaknya peubah bebas (p). Sehingga pendugaan model dengan metode regesi baku tidak bisa dilakukan. Metode yang sering digunakan adalah Principal Component Regression (PCR) dan Partial Least Square (PLS). Tetapi dari beberapa kajian empiris dan pustaka ternyata metode- metode tersebut dapat diperbaiki hasilnya dengan metode transformasi wavelet diskret sebagai pemrosesan awal untuk mereduksi dimensi data X (Sunaryo dan Notodiputro 2004, 2005a; Shao dan Yadong 2004; Yi- yu dan Chen min- jun 2000). Perbaikan model dapat dievaluasi dari nilai ukuran- ukuran kebaikan model seperti R2 , R2 adj, S, PRESS dan RMSEP (Root Mean Square of Prediction) yang dihasilkan (McNulty dan Ganapati 1998; Shao dan Yadong 2004;Yi-yu dan Chen min-jun 2000). Bab ini memfokuskan pada bagaimana sifat-sifat statistik dari dugaan model kalibrasi yang diperoleh dengan pemrosesan awal metode transformasi wavelet diskret. Sebagai pendukung hasil kajian teoristis akan dilakukan analisis terhadap data simulasi yang mencerminkan kondisi data real yaitu antar peubah bebas saling berkorelasi dan n < p. Bab ini merupakan penjelasan lebih mendalam dari artikel Sunaryo dan Notodiputro (2005b), dan gagasan dasar untuk memperoleh bukti-bukti dari suatu sifat diperoleh dari Searle (1971), Myer (1990), Naes dan Mevik (2001).
Metode dan Bahan Penelitian Metode yang digunakan pada penelitian ini berupa analisis teori tentang sifatsifat statistik dari model regresi dengan pra-pemrosesan transformasi wavelet diskret. Sifat-sifat statistik yang akan dianalisis adalah bias, ragam dan mean square error (MSE) dari penduga parameter model regresi dan prediksi, baik untuk rata-rata pengamatan baru, maupun pengamatan tunggal.
56
Hasil analisis teori akan dijustifikasi pada data simulasi yang mencerminkan permasalahan pemodelan dengan kasus multikolinearitas antar peubah bebas dan jumlah pengamatan lebih kecil dari jumlah peubah bebas.
Hasil dan Pembahasan Regresi Terhadap Koefisien Wavelet dan Sifat-sifat Statistiknya Misalkan matriks X berukuran (nxp) dan matriks X yang terkoreksi terhadap nilai rata-ratanya adalah :
X = X −1 x
X 1T . T X 2. = . . . .T X n.
T
Dengan transformasi wavelet
diskret
X = D W , sehingga bentuk regresi
(64)
X
T j.
T
= d j. W
akan diperoleh
y = 1 b0 + X b + e dapat ditulis menjadi
regresi terhadap koefisien wavelet : y = 1 b0 + D W b + e = 1 b0 + D q + e .
(65)
Karena D adalah hasil TWD dari matriks X yang terkoreksi terhadap nilai tengahnya, maka rata-rata tiap kolom D juga sama dengan nol (yang telah dibuktikan pada Bab 4), sehingga
pemodelan regresi identik dengan regresi antara y dengan peubah
bebas yang terkoreksi terhadap nilai tengah. Dengan metode kuadrat terkecil dugaan parameter dari persamaan (65) adalah : qˆ = ( D
T
= W (X
D) T
−1
D
X )
T −1
y X
T
(66)
y = W bˆ .
Karena bˆ merupakan pend uga tak bias dari b maka W
T
qˆ juga merupakan
penduga tak bias dari b . Dengan penguraian nilai singular (SVD) matriks D = P L AT maka akan diperoleh :
57
qˆ =
1.
p
∑a j =1
j
1 ) p Tj y τj
(
(67)
Bukti : D = P L AT , L =
τ1 0 . . . 0
0 τ2
... ...
... . ..
0 0 . , untuk τ1 ≥ τ 2 ≥ . . . ≥ τ p . . . τ p
D T D = A L P T P L AT = A L2 A T ( D T D ) −1 = A L −2 A T ( D T D ) −1 D T = A L −2 A T A L P T = A L−1 P T p
1 ) p Tj . τj
= ∑ aj ( j =1
2.
COV ( qˆ ) = ( D
D) −1σ 2
T
= σ2
p
∑a j =1
j
(
1 ) a Tj τj
(68)
Bukti : qˆ = ( D
T
D)
−1
D
T
y
D = P L AT ( D T D ) −1 = A L −2 A T COV ( qˆ ) = ( D
T
D) −1σ 2
= A L− 2 AT σ 2 = σ2
p
∑ j =1
aj (
1 T )aj . τj
Dimana akar ciri dan vektor ciri ke-j dari D
T
D masing- masing adalah τ j dan a j .
58
Pada
model
regresi
yang
terkoreksi
terhadap
nilai
tengah
y = 1 β0 + X b + e . Misalkan y 0 adalah pengamatan yang berhubungan dengan X
ˆ o . Jika yˆ 0 = β0 +
ˆ o b digunakan untuk memprediksi µ = E( y0 ) , maka yˆ 0 T
X
adalah penduga tak bias bagi µ = E( y0 ) . Dengan ragam sebesar : −1 σ2 T T Var ( yˆ 0 ) = + X o X X n
X
2 oσ
(69)
( Bukti lihat Searle 1971). Sehingga MSE ( yˆ 0 ) = Var ( yˆ 0 ) =
σ2 + n
T o X
X
T
(70)
−1
X
2 oσ .
X
Dengan penguraian nilai singular dari X , persamaan (70) bisa ditulis σ2 MSE ( yˆ 0 ) = + σ2 n
p
∑ j =1
t j2 λj
dimana t j = X oT v j disebut skor Jika yˆ 0 = βˆ 0 +
X
,
(71)
o pada v j .
ˆ o b
digunakan untuk memprediksi pengamatan tunggal y 0 ,
MSE ( yˆ 0 ) = E ( y 0 − yˆ 0 ) 2 = Var ( y 0 − yˆ 0 )
(72)
X
T
maka :
1 = + n
X
f
T
X T X
−1
X
f
+ 1 σ 2
(Bukti lihat Searle 1971). Untuk model regresi terhadap koefisien wavelet y = 1 b0 + D q + e , dimana telah diketahui mempunyai sifat bahwa jumlah elemen tiap kolom dari D sama dengan nol. Misalkan y 0 adalah pengamatan yang berhubungan dengan pengamatan
59
baru vektor koefisien wavelet d , maka analog terhadap penurunan menemukan ragam dan MSE dari yˆ 0 akan diperoleh MSE untuk pengamatan tunggal adalah :
σ2 T + σ 2 d ( D T D ) −1 d + σ 2 n p σ2 2 = + σ ∑ ( l 2j / τ j ) + σ 2 , n j =1
MSE( yˆ 0 ) =
dimana d adalah vektor pengamatan baru dan l j = d
T
(73)
a j menyatakan skor dari d
sepanjang vektor ciri ke-j. T Jika D* dan W * T masing- masing merupakan m kolom dari = X (nxp) W(*pxm (nxm) )
D
dan W T dengan m < p, maka regresi terhadap m koefisien wavelet berbentuk
y = 1 q0 + D* q + f dan q diduga dengan : *
qˆ
*
*
= (D
*T
D* )
−1
D
*T
y.
(74)
* W * T qˆ merupakan penduga bias bagi b dengan bias sebesar :
bias = W
qˆ − W * T qˆ *
T
= W
p
∑a
T
j =1
1 T ) p j y − W *T τj
(
j
m
∑ i =1
*
ai (
1 τ
*T
* i
) pi
y, (75)
dimana a i dan τi* adalah vektor ciri dan akar ciri ke- i dari D * T D * . *
Dari persamaan (75) terlihat bahwa bias akan menuju nol, jika m mendekati p. Dapat ditunjukkan pula bahwa COV ( qˆ ) = ( D *
*T
D * ) −1σ 2
= σ2
m
1
* *T a i ( * ) ai ∑ τ i =1
,
(76)
i
MSE( yˆ 0 ) = =
σ2 + σ 2 d T (D n σ2 +σ 2 n
m
∑ i =1
*T
D* )
( l i* 2 / τ i* )
Dari persamaan (76) berarti
−1
d
+ σ 2 + (bias ( yˆ 0 )) 2
(77) + σ 2 + (bias ( yˆ 0 )) 2 .
60
a* 2 Var ( qˆ i* ) = i 1* τ1
+
a *i 22 τ *2
+ ... +
a *im2 τ *m
σ 2 .
(78)
Yang berarti dengan adanya akar ciri dari D * T D * yang mendekati nol, maka makin tinggi ragam dari dugaan parameter regresi. Pada persamaan (73) dan (77) menunjukkan σ2
p
∑( l j =1
2 j
/ τ j) − σ2
bahwa m
∑( l i =1
*2 i
selisih / τi* )
ragam
prediksi
yang
besar,
yaitu
akan diganti dengan MSE yang cenderung lebih
kecil pada persamaan (77). Jika
dimensi
matriks
X
(nxp)
direduksi
menjadi
koefisien
wavelet
D* dengan m < p, maka regresi terhadap koefisien wavelet akan menghasilkan (nxm) dugaan parameter regresi yang berbias. Kebaikan model dugaan yang diperoleh akan tergantung pada kemampuan reduksi yang menghasilkan akar ciri dari D * T D * yang relatif besar, sehingga ragam koefisien regresi yang diperoleh akan kecil.
Ilustrasi Data Simulasi Untuk menggambarkan data real dalam kalibrasi maka dilakukan simulasi untuk memperoleh data X
(10x16)
yang saling berkorelasi sangat tinggi. Kemudian
dengan menentukan koefisien b0 , b1 , ..., b16 dan membangkitkan 10 bilangan acak sebagai vektor residual (e) , akan diperoleh data vektor y = 1 b0 + X b + e . Koefisien regresi yang dipakai dalam data simulasi ini adalah : (b0
b1 .... b16 ) = (-1.90 1.25 0.75 1.00 -1.25 0.75 0.75 -0.50 -0.50 0.25 0.75 -0.75 0.50 -1.00 0.25 1.00 0.50 ).
Karena antar kolom X berkorelasi sangat tinggi dan n < p, maka matriks X T X adalah matriks singular, sehingga dugaan koefisien regresi dengan metode kuadrat terkecil biasa tidak bisa dilakukan. Dengan mengambil 3 level resolusi untuk TWD dari matriks X yang terkoreksi terhadap nilai tengahnya (X ) , maka akan
61
diperoleh nilai akar ciri yang sama dengan akar ciri dari
X T X
. Akar ciri yang tidak
nol adalah 1.15835 0.00179 0.00116 0.00048 0.00020 . Nilai akar ciri D * T D * pada berbagai kombinasi dapat dilihat pada Tabel 4. Tabel 4 Akar ciri D*T D pada beberapa kombinasi c0,0 dan d hanya level 3 1.15819 0.00099 0.00068 0.00037 0.00010 0 0 0 0
Akar ciri D*T D dengan elemen D* adalah c0,0 , dan d c0,0 , c0,0 , c0,0 , level 0,1 d3,0 ,d3,1 ,d3,2 ,d3,3 d3,3 d2,0 ,d2,1 ,d1,0 d2,0 -d0,0 dan 2 1.15811 1.15805 1.15811 1.15818 0.0009045 0.00049 0.0003 0.00043 0.00086 0.0006392 0.00034 0.00026 0.00053 0.0001099 0.00019 0.00005 0.00010 0 0.00005 0 0 0 0 0 0 0
Karena mengandung akar ciri nol maka pendugaan model regresi yang tidak dapat diduga adalah Y terhadap : •
c0,0 dan koefisien wavelet resolusi level 3
•
c0,0 serta koefisien wavelet resolusi level 0, 1 dan 2
•
d2,0 , d2,1 , d2,2 , d2,3 , d1,0 , d1,1 dan d0,0 .
Terlihat dari Tabel 2 dengan adanya c0,0 akar ciri pertama akan besar, sehingga untuk data ini c0,0 bisa dipertimbangkan masuk model. Nilai beberapa ukuran kebaikan model untuk berbagai regresi yang dapat dilakukan dapat dilihat pada Tabel 5.
Tabel 5 Nilai beberapa ukuran kebaikan model Peubah Indepeden dalam model c0,0 , d3,0,d3,1 ,d3,2 ,d3,3 c0,0 , d2,0,d2,1 ,d1,0 c0,0 , d3,3
R2 95.0% 93.5% 94.4%
R2 adj 88.8% 88.3% 82.8%
s 0.137 0.140 0.110
PRESS 0.889 0.442 0.192
62
Jika ada pengamatan baru, ringkasan hasil prediksi dengan berbagai model regresi yang dapat dilakukan dapat dilihat pada Tabel 6.
Tabel 6 Ringkasan hasil prediksi untuk suatu pengamatan baru 95 % CI Peubah Indepeden dalam model c0,0 , d3,0,d3,1,d3,2,d3,3 c0,0 , d2,0,d2,1,d1,0 c0,0 , d3,3
Fits 0.19469 0.29440 0.22753
SE Fits 0.119694 0.080644 0.059117
95 % PI
batas bawah
batas atas
0 0.087103 0.087738
0.527014 0.501705 0.367318
lebar 95% CI 0.527014 0.414602 0.279580
batas bawah
batas atas
-0.30953 -0.12012 -0.06767
0.69891 0.70892 0.52273
Tabel 6 menunjukkan bahwa dengan penambahan akar ciri dari D * T D* yang lebih kecil akan menyebabkan ragam prediksi yang makin besar, walaupun secara teoritis bias prediksinya makin kecil. Dari berbagai alasan di atas maka regresi y terhadap c0,0 dan d3,3 menunjukkan kecenderungan lebih baik dibanding yang lain. Model dugaan regresi wavelet adalah yˆ = 0.725 + 1.15 c0,0 + 11.1 d3,3 . Jika dikembalikan ke peubah asli diperoleh model prediksi : yˆ = -1.58972 + 0.28685 X1 + 0.28685 X2 + 0.28685 X3 + 0.28685 X4 + 0.28685 X5 + 0.28685 X6 + 8.12843 X7 - 7.55474 X8 + 0.28685 X9 + 0.28685 X10 + 0.28685 X11 + 0.28685 X12 + 0.28685 X13 + 0.28685 X14 + 0.28685 X15 + 0.28685 X16 . Plot y dengan yˆ duga dapat dilihat pada Gambar 10.
lebar 95% PI 1.008436 0.829038 0.590404
63
Fitted Line Plot
Y = - 0.00000 + 1.000 Yduga (coo dan d33 da lam model) 1.6
S R- Sq R- Sq (adj)
1.4
0.102855 94.4% 93.7%
1.2
Y
1.0 0.8 0.6 0.4 0.2 0.2
0.4
0.6
0.8 Y duga
1.0
1.2
1.4
Gambar 10 Plot y dengan yˆ
Simpulan 1. Jika dimensi matriks X yang terkoreksi terhadap rata-rata
(X (nxp) )
direduksi menjadi koefisien wavelet D* untuk m < p, maka diperoleh (nxm) dugaan parameter regresi yang berbias. 2. Keragaman koefisien regresi akan dipengaruhi oleh besar kecilnya akar ciri dari D * T D * yang diperoleh. 3. Penghapusan ragam-ragam yang besar dari prediksi nilai y pengamatan baru akan diganti dengan MSE (Mean Square Error) yang cenderung lebih kecil dalam regresi terhadap koefisien wavelet D* . (nxm)
64
Daftar Pustaka
McNulty C S, Ganapati M. 1998. Application of wavelet analysis for determining glucose concentration of aqueous solutions using NIR spectroscopy. HewlettPackard company. Myers RH. 1990. Classical and Modern Regression with Applicatios. PWS-KENT Pub. Co. Naes T, Mevik BH. 2001. Understanding The Collinearity Problem in Regression and Discriminant Analysis. Journal of Chemometrics 15 : 413-426. Percival DB. 2005. Wavelets : Data Analysis, Algorithms and Theory. University Washington. (http://www.ms.washington.edu/~s530/) [18 april 2005]. Searle SR. 1971. Linear Models. John Willey & Sons. Shao X, Yadong Zhuang. 2004. Determining of Chlorogenic Acid in Plant Samples by Using Near-Infrared Spectrum with Wavelet Transform Preprocessing. Analytical Sciences 20. Sunaryo S, Notodiputro KA. 2004. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kandungan Senyawa Gingerol pada Tanaman Jahe. Statistika - Forum Teori dan Aplikasi Statistika 4: 181-185, Jurusan Statistika FMIPA UNISBA Sunaryo S, Notodiputro KA. 2005a. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kandungan Senyawa Kurkumin pada Tanaman Temulawak. Prosiding Seminar Nasional Matematika, halaman 100-107, Jurusan Matematika UNS, Surakarta, 7 Mei 2005. Sunaryo S, Notodiputro KA. 2005b. Sifat-sifat Statistik Pendugaan Model Kalibrasi melalui Metode Transformasi Wavelet Diskret. Prosiding Seminar Nasional Matematika , halaman 159-168, Jurusan Matematika UNS, Surakarta, 7 Mei 2005. Vidacovic B, Meuller P. 1991. Wavelets for Kids. A Tutorial Introduction. AMS Subject Classification, Duke University.
65
Yi-yu Cheng, Chen min-jun. 2000. A New Computing Multivariate Spectral Analysis Method Based on Wavelet Transform. Journal of Zhejiang University Science 1: 15-19.
6. PENERAPAN MODEL KALIBRASI DENGAN WAVELET –PCR PADA DATA GINGEROL DAN KURKUMINOID Abstrak Penentuan kadar senyawa gingerol dan kurkuminoid pada rimpang jahe dan temulawak secara kuantitatif dilakukan melalui proses yang panjang dan mahal dengan pengukuran HPLC. Alternatif untuk memprediksi kadar gingerol dan kurkuminoid masing- masing dalam contoh rimpang jahe dan temulawak adalah dengan mengembangkan model kalibrasi peubah ganda. Karena dalam pemodelan timbul kasus n lebih kecil dari p dan antar variabel bebas saling berkorelasi, pengembangan model dengan cara regresi baku tidak valid. Pada bab ini akan dibahas penerapkan metode gabungan antara transformasi wavelet diskret dengan regresi komponen utama (PCR) untuk menduga kadar gingerol dan kurkuminoid pada rimpang jahe dan temulawak, dan menghasilkan model kalibrasi yang memuaskan. Kata kunci : model kalibrasi, wavelet, principal component regression, gingerol, kurkuminoid
Abstract The determination of concentration of gingerol and curcuminoid compound is usually carried out through a long and expensive process using HPLC instrument. The alternative method to predict such concentration can be done using a multivariate calibration model. Since the number of samples (n) are less than the number of parameters (p) and between the independent variables are correlated, the development of model using conventional regression is no longer valid. The combination of DWT and principal component regression has been adopted in this research to predict concentration of gingerol and curcuminoid and it showed a promising result. Key words : calibration model, wavelet, principal component regression, gingerol, curcuminoid.
67
Pendahuluan
Penentuan kadar senyawa gingerol dan kurkuminoid pada rimpang jahe dan temulawak secara kuantitatif dilakukan melalui proses yang panjang meliputi penghancuran bahan, pelarutan, dan pengukuran dengan HPLC. Proses tersebut memerlukan waktu dan biaya yang relatif mahal (Naes et al. 2002). Pengukuran dengan FTIR relatif lebih mudah dan murah untuk dilakukan daripada pengukuran dengan HPLC. Setiap bentuk spektrum persen transmitan dari FTIR akan mencerminkan gugus fungsi yang terdapat pada senyawa (misal gingerol) dari suatu contoh rimpang. Selain itu intensitas spektra dapat juga digunakan sebagai ukuran secara kuantitatif. Salah satu kelemahan pengukuran data kuantitatif oleh FTIR adalah ketergantungannya terhadap kemurnian contoh yang diukur. Walaupun dengan analisis referensi terhadap senyawa standard, secara umum pola spektrum (pola serapan) yang dihasilkan relatif sama, tetapi jika contoh yang diukur tidak murni maka pengukuran serapan yang terbentuk tidak tajam dan melebar. Hal ini disebabkan untuk contoh yang tidak murni gugus fungsi- gugus fungsi yang sama masih terkandung dalam beberapa senyawa yang berbeda. Untuk contoh yang berupa ekstrak yang murni maka pola serapan yang terbentuk akan lebih tajam dan lebih spesifik. Sehingga cara alternatif untuk memprediksi kadar gingerol dan kurkuminoid pada rimpang jahe dan temulawak adalah dengan mengembangkan model kalibrasi peubah ganda yang menyatakan hubungan kadar senyawa aktif hasil dari HPLC (sebagai peubah tak bebas Y) dengan data hasil pengukuran bilangan gelombang menggunakan FTIR dari serbuk rimpang yang berupa data spektra persen transmitan (sebagai peubah bebas X). Kalibrasi
peubah
ganda
adalah
disiplin
ilmu
yang
tercakup
dalam
chemometrics, untuk menemukan hubungan antara sekumpulan ukuran yang relatif mudah atau murah memperolehnya dengan sekumpulan ukuran yang memerlukan waktu dan biaya yang relatif mahal (Naes et al. 2002). Dari sudut pandang statistika tujuan kalibrasi peubah ganda adalah menemukan model E(Y) = f(X), untuk prediksi Y dengan akurasi dan presisi yang tinggi.
68
Karena biasanya dimensi peubah bebas X sangat tinggi dan antar peubah saling berkorelasi, maka kasus jumlah pengamatan contoh lebih kecil dari jumlah peubah bebas, dan kasus multikolinearitas sering muncul dalam kalibrasi peubah ganda. Sehingga penanganan dengan metode regresi ganda baku secara langsung kurang valid. Model- model kalibrasi peubah ganda yang berkembang sampai saat ini adalah Principal Component Analysis, Partial Least Square, Neural Network, Bayes dan lain- lain . Data spektra persen transmitan (X) akan berupa sederetan data vektor x = (x 1 ,x2 , ... ,x p )T yang berdimensi tinggi dan saling berkorelasi, sehingga pengembangan model kalibrasi peubah ganda E(Y) = f(X) dengan mengikutkan semua data X menjadi tidak efisien. Dengan reduksi dimensi, diharapkan pengembangan model kalibrasi peubah ganda menjadi lebih efisien. Reduksi dimensi yang digunakan dalam bab ini adalah metode transformasi wavelet diskret (TWD), dengan alasan metode ini setelah dikaji ternyata lebih baik dibanding metode lain seperti transformasi Fourier maupun PCA. Karena fokus metode wavelet yang digunakan hanya sebagai reduksi dimensi, bukan untuk mengatasi kasus multikolinearitas, maka dimungkinkan untuk menggunakan hasil keluaran dari metode wavelet sebagai masukan untuk metode kalibrasi peubah ganda yang lain, seperti regresi bertatar atau regresi komponen utama (PCR), sehingga akan diperoleh model yang lebih baik. Pada bab ini akan dibahas penerapan gabungan metode wavelet dan PCR untuk memprediksi kadar senyawa gingerol dan kurkuminoid pada rimpang jahe dan temulawak. Bab ini merupakan pengembangan dari artikel Sunaryo dan Notodiputro (2004, 2005). Perhitungan matriks koefisien wavelet dengan menggunakan software wavetresh 3 seperti yang diterangkan oleh Nason (1994 dan 1998).
Metode Evaluasi Dari 20 contoh masing- masing untuk serbuk rimpang jahe dan 40 contoh serbuk rimpang temulawak dengan FTIR dihasilkan data spektra persen transmitan yang diamati 1866 titik, pada bilangan gelombang
4000 – 400 cm-1 yang
mencerminkan kadar gingerol dan kurkuminoid. Karena jumlah contoh dipandang
69
mencukupi maka contoh-contoh dibagi menjadi 2 kelompok. Untuk rimpang jahe 15 contoh untuk kalibrasi dan 5 contoh untuk validasi, sedangkan untuk temulawak 30 contoh untuk kalibrasi dan 10 contoh sisanya untuk validasi. Pemilihan pada masingmasing kelompok dilakukan secara acak. Karena metode wavelet mensyaratkan jumlah titik harus 2M, untuk M bilangan bulat positif, maka dari 1866 titik diambil 1024 titik dengan memperhatikan daerah identifikasi spektra infra merah gingerol dan kurkuminoid yang memberikan informasi (lihat Tabel 1 dan Tabel 2 pada Bab 2). Dari 1024 titik yang terpilih dilakukan transformasi wavelet diskret (TWD), dengan melihat berbagai kemungkinan resolusi yang menghasilkan koefisien-koefisien wavelet yang jumlahnya lebih kecil dari jumlah contoh untuk kelompok data kalibrasi, serta berbagai fungsi mother wavelet keluarga Daubechies. Alasan pemilihan mother wavelet keluarga Daubechies karena sering dipakai dalam aplikasi dan memberikan hasil pemodelan yang baik (Brown et al. 2001; McNulty dan Ganapati 1998; Yi- yu dan Chen min-jun 2000). Koefisien-koefisien wavelet yang dihasilkan digunakan untuk pengembangan model kalibrasi peubah ganda. Perhitungan matriks wavelet pada penelitian ini menggunakan software wavetresh 3 seperti yang diterangkan oleh Nason (1994 dan 1998). Karena lama penyimpanan berpengaruh terhadap kadar gingerol yang dihasilkan, maka dalam pencarian model prediksi yang lebih baik untuk gingerol diikutkan peubah dummy yang mencerminkan kelompok lama penyimpanan (untuk data pada penelitian ini 3 bulan dan 10 bulan). Sedang untuk waktu penyimpanan tidak berpengaruh terhadap kurkuminoid. Secara matematis TWD tidak menjamin bahwa antara koefisien-koefisien wavelet yang dihasilkan tidak saling berkorelasi, sehingga metode selanjutnya dalam penelitian ini digunakan regresi komponen utama (PCR) untuk menghilangkan kasus multikolinearitas. Langkah- langkah analisis dengan metode Wavelet-PCR dapat dijelaskan sebagai berikut : Dari data spektrum persen transmitan dapat dituliskan matriks X(nxp), dimana n adalah banyaknya contoh dan p adalah banyaknya titik persen transmitan yang diteliti pada masing- masing bilangan gelombang. Konsentarsi senyawa aktif dituliskan dalam
70
y ( nx1 ) . Misalkan matriks X berukuran (nxp) dan X yang terkoreksi terhadap nilai rataratanya adalah :
X = X −1 x
X 1T . T X 2. = . . . .T X n.
T
Dengan transformasi wavelet diskret
X
T
(79)
= d j. W dimana W ditentukan oleh T
j.
mother wavelet tertentu, maka akan diperoleh matriks koefisien wavelet D(nxp) = X (nxp) W T ( pxp) . Kemudian dengan memilih level- level resolusi tertentu yang
jumlah koefisien wavelet yang dihasilkan lebih kecil dari n-1, maka akan diperoleh D*(nxm ) = X (nxp) W * T ( pxm) ,
yang mereduksi pengamatan dari p titik tiap-tiap contoh
menjadi m titik koefisien wavelet yang terpilih. Persamaan regresi antara y ( nx1 ) terhadap D*(nxm ) dapat ditulis : y = 1 q0 + D* q + e .
(80)
Jika m < n maka dugaan kuadrat terkecil dapat dilakukan, yaitu : qˆ = ( D
*T
D* )
−1
D
*T
y .
(81)
Persamaan regresi prediksi linear yang berbentuk : yˆ pred = b0 + b1 x1 + ... + b p x p
= b0 + x b , T
(82) T
dapat dihitung dengan b = W * qˆ dan b0 = y − x b . Jika multikolinearitas masih terjadi antar koefisien wavelet, maka langkah yang bisa diambil adalah menghitung skor komponen utama dari D * . Kemudian meregresikan ulang antara y ( nx1 ) dengan skor-skor komponen utama. Pemilihan model terbaik dapat dilakukan dengan memperhatikan beberapa ukuran kebaikan model prediksi seperti F, PRESS, R2 , Radj dan S.
71
Hasil persamaan yˆ pred dalam (82) akan digunakan untuk memprediksi kadar senyawa aktif kelompok contoh data validasi. RMSEP (Root Mean Square Error of prediction) merupakan salah satu ukuran yang dapat digunakan sebagai ukuran kebaikan hasil prediksi (McNulty dan Ganapati 1998; Shao dan Yadong 2004; Yi-yu dan Chen minjun 2000) .
∑ (yˆ
N pred
RMSEP =
i =1
i pred
− yi
)
2
(83)
N pred
N pred adalah banyaknya contoh untuk validasi. Semakin kecil RMSEP, semakin baik prediksi model yang dihasilkan.
Analisis dan Pembahasan Penentuan Kadar Gingerol Gambar spektra persen transmitan serbuk jahe pada 1866 titik dan 1024 titik terpilih, untuk 20 contoh serbuk rimpang jahe bisa dilihat pada Gambar 11 dan Gambar 12. Dengan mengambil 11 koefisien wavelet (untuk
mother wavelet
Daubechies - 20) pada resolusi 0, 1 dan 3 serta 1 koefisien untuk fungsi skala hasil transformasi wavelet diskret dilakukan pencarian model terbaik untuk prediksi kadar gingerol. Alasan diambil mother wavelet Daubechies – 10 dan level resolusi 0, 1 dan 3, karena perilakunya yang relatif lebih baik dibanding yang lain, dalam arti dapat menangkap ukuran-ukuran kebaikan model seperti R2 dan R2 adj yang relatif lebih baik.
72
SPEKTRUM GIN GEROL PADA 1 866 TITIK 0.9 0.8
% TRANSMITAN
0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0
1000
2000 3000 BIL ANGAN GELOMBANG (cm-1)
4000
Gambar 11 Spektra persen transmitan 1866 titik, untuk 20 contoh serbuk rimpang jahe
SPEKTRUM GIN GEROL PADA 1024 TITI K TERP ILI H 0.9 0.8
% TRANSMITA N
0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0
Gambar 12
1000
2000 3000 BILANGAN GELOMBANG (cm-1)
4000
Spektra persen transmitan 1024 titik, untuk 20 contoh serbuk rimpang jahe
Permasalahan yang timbul ternyata korelasi antar koefisien wavelet masih banyak yang tinggi. Sehingga pemodelan dengan regresi ganda biasa dengan peubah respon kadar gingerol dan peubah bebas koefisien wavelet menjadi kurang valid, karena masih terjadi kasus multikolinearitas. Hal ini terlihat dari analisis regresi antara kadar gingerol dengan 12 koefisien wavelet dan peubah dummy waktu penyimpanan diperoleh R2 yang tinggi (99.9%) sedang semua peubah bebas tidak signifikan, selain itu nilai VIF (Variance Inflantion Factor) masing- masing peubah berkisar antara 43.4 – 681.2 (lihat Lampiran 7). Metode yang digunakan untuk
73
mengatasi kasus multikolinear antar koefisien wavelet dalam penelitian ini adalah PCR. Hasil ukuran-ukuran kebaikan model untuk berbagai kemungkinan kombinasi jumlah komponen utama dapat dilihat pada Tabel 7. Dari Tabel 7 ternyata dengan PCR 7 komponen utama pertama dari 12 komponen utama serta satu peubah dummy menghasilkan model yang relatif lebih baik dibandingkan yang lainnya. Sehingga model inilah yang dipilih untuk model prediksi kadar gingerol. Plot Y dengan Yˆ untuk kelompok kalibrasi dapat dilihat pada Gambar 13. Gambar 13 menunjukkan bahwa model kalibrasi kadar gingerol untuk menduga 15 contoh kelompok data kalibrasi cukup memuaskan. Hasil dari persamaan WaveletPCR dikembalikan lagi ke data asli, dan digunakan untuk mend uga 5 contoh kelompok data validasi. Ringkasan prediksi untuk kelompok contoh data kalibrasi dan kelompok contoh data validasi model wavelet-PCR dapat dilihat pada Tabel 8. Sedangkan plot antara Y dengan Yˆ untuk kelompok contoh data validasi dapat dilihat pada Gambar 14 .
74
Tabel 7 Ringkasan Nilai Kebaikan model Gingerol dengan wavelet D-10 dan PCR Peubah Prediktor (+ dummy) Pc1 Pc1 Pc2
S
R2
R2 adusted
PRESS
RMSEP
**
36.92 26.30**
0.1339 0.1309
86.00% 87.80%
83.70% 84.40%
0.3527 0.3506
0.1741 0.1900
Pc1-Pc3
29.23**
0.1101
92.10%
89.00%
0.3355
0.2121
Pc1-Pc4 Pc1-Pc5
**
31.41 32.23**
0.0963 0.0874
94.60% 96.00%
91.60% 93.00%
0.3433 0.3206
0.1694 0.1821
Pc1-Pc6
24.45**
0.0930
96.10%
92.10%
0.3817
0.1814
Pc1-Pc7 Pc1-Pc8
**
21.85 17.72**
0.0923 0.0968
96.70% 97.00%
92.30% 91.50%
0.5056 0.7859
0.1072 0.1413
Pc1-Pc9
73.86**
0.0455
99.50%
98.10%
0.1622
0.2410
**
0.0526 0.0491
99.50% 99.70%
F
Pc1-Pc10 Pc1-Pc11
50.36 53.03**
97.50% 97.80%
0.8797 1.5704
0.2409 0.2497
Pc1-Pc12
53.38 ** 0.0471 99.90% 98.00% Dengan Regresi Bert atar 59.11** 0.1087 90.80% 89.20%
30.6945
0.1489
0.2816
0.1054
0.1558
0.1558
Pc4 Pc4, Pc9
**
66.78
**
0.0854
94.80%
93.40%
Pc3,Pc4,Pc9 88.50 0.0650 97.30% 96.20% 0.0905 0.1886 Pc3,Pc4,Pc5,Pc9 108.28** 0.0529 98.40% 97.50% 0.0696 0.2139 Pc2, Pc3,Pc4,Pc5,Pc9 233.21** 0.0331 99.40% 99.00% 0.0330 0.2284 Pc2, Pc3,Pc4,Pc5,Pc9, 283.93 ** 0.0278 99.60% 99.30% 0.0322 0.2141 Pc11 Pc2, Pc3,Pc4,Pc5,Pc9, 431.27 ** 0.0211 99.80% 99.60% 0.0230 0.1418 Pc11,Pc12 Keterangan : ** signifikan pada α = 0.01, F: nilai Fhitung uji model regresi, S : Kuadrat Tengah Galat
75
Tabel 8. Nilai Y dan Yˆ kadar gingerol dengan wavelet D10-PCR (Pc1-Pc7) KELOMPOK DATA KALIBRASI Kadar Gingerol dari HPLC DUGAAN (%) (%) 0.63 0.723 0.72 0.789 0.58 0.582 0.53 0.494 0.52 0.624 0.54 0.520 0.79 0.733 0.78 0.755 0.63 0.572 0.63 0.592 0.78 0.748 1.26 1.322 1.60 1.513 1.18 1.236 1.24 1.209
KELOMPOK DATA VALIDASI Kadar Gingerol DUGAAN dari HPLC (%) (%) 0.53 0.583 0.78 0.755 0.79 0.715 1.14 1.304 1.07 1.217
R2 = 96.7 %
Gambar 13 Plot Y dengan Yˆ kelompok data kalibrasi gingerol
76
R2 = 93.9% RMSEP = 0.1072
Gambar 14 Plot Y dengan Yˆ kelompok data validasi gingerol (RMSEP =0.1072) Gambar 14 menunjukkan titik-titik yang ada dekat dengan garis lurus melalui pusat koordinat dan bersudut 45o , sehingga model untuk prediksi data ekternal (yaitu data yang tidak diikutkan dalam pemodelan) cukup memuaskan. Sehingga dapat disimpulkan pada penelitian ini diperoleh model untuk prediksi gingerol dengan R2 = 96.7%; R2 (adj) = 92.30% dan RMSEP = 0.1072. Hasil perhitungan lengkap model terpilih untuk menduga kadar gingerol dapat dilihat pada Lampiran 9. Hasil penelitian ini memperbaiki model untuk data yang sama yang diolah oleh Arnita (2005) dengan PCR tanpa pra-pemrosesan, yang menghasilkan RMSEP = 0.1430. Sedangkan dengan pra-pemrosesan multiplicative scatter corrections (MSC) menghasilkan R2 = 94.6%; R2 (adj) = 91.6% RMSEP = 0.1096.
77
Penentuan kadar kurkuminoid Gambar spektra persen transmitan pada 1866 titik dan 1024 titik, untuk 40 contoh serbuk rimpang temulawak bisa dilihat pada Gambar 15 dan Gambar 16. Dari 40 contoh dibagi menjadi dua kelompok, yaitu 30 untuk kalibrasi dan 10 untuk validasi. Pada model kalibrasi kurkuminoid untuk 30 contoh data kalibrasi, perilaku mother wavelet D9 dengan level resolusi 0, 1, 2, dan 4 lebih baik dari yang lain. Dengan TWD mother wavelet D9 dan level resolusi 0, 1, 2, dan 4, ternyata terjadi kasus yang sama seperti pada rimpang jahe, yaitu korelasi antar koefisien wavelet masih banyak yang tinggi. Sehingga pemodelan dengan regresi ganda biasa dengan peubah respon kadar kurkuminoid dan peubah bebas koefisien wavelet menjadi kurang baik, karena masih terjadi kasus multikolinearitas. Analisis regresi antara kadar kurkuminoid dengan 17 koefisien wavelet diperoleh R2 yang tinggi (99.4%) padahal banyak peubah bebas tidak signifikan, selain itu besarnya VIF (Variance Inflantion Factor) 16.9 sampai dengan 25994.9 (lihat Lampiran 8). Masalah multikolinearitas diatasi melalui PCR. Ringkasan nilai kebaikan model kurkuminoid dengan gabungan wavelet D7-PCR dapat dilihat pada Tabel 9.
SPEKTRUM 1086 TITIK RIMPANG TEMULAWAK 0.8
% TRANSMITAN
0.7
0.6
0.5
0.4
0.3 0
1000
2000 3000 BILANGAN GELOMBANG (cm-1)
4000
Gambar 15 Spektrum 40 contoh pada 1866 titik serbuk rimpang temulawak
78
SPEKTRUM 1024 TITIK SERBUK RIMPAN G TEMULAWAK 0.8
% TRANSMITAN
0.7
0.6
0.5
0.4
0.3 500
1000
1500 2000 2500 3000 BILANGAN GELOMBANG (cm-1)
3500
4000
Gambar 16 Spektrum 40 contoh pada 1024 titik serbuk rimpang temulawak Dari Tabel 9 terlihat model dengan Pc1-Pc20 mempunyai RMSEP terkecil yaitu 0.1715. Sehingga diputuskan model yang lebih baik adalah model yang mengandung Pc1-Pc20 dengan R2 = 97.6% . Sebelum diperoleh hasil seperti Tabel 8, telah diteliti pula model terbaik untuk pengelompokan data menjadi 20 contoh kalibrasi dan 20 contoh untuk validasi, hasilnya ternyata model terbaik adalah menggunakan Pc1, Pc2, Pc4-Pc9 dan Pc14 dalam model dan dihasilkan R2 = 98.80%; RMSEP = 0.2216. Dari hasil ini menunjukan bahwa jika tersedia data baru yang juga diukur kadar kurkuminoidnya melalui HPLC, maka sebaiknya pemodelan kalibrasi yang diperoleh dari penelitian ini diperbaharui. Dengan makin banyaknya jumlah kelompok data kalibrasi maka pencarian model yang lebih baik akan memungkinkan diperbaiki karena kombinasi level- level resolusi yang bisa digunakan juga makin bertambah. Hasil ringkasan kebaikan model untuk menduga kadar kurkuminoid untuk kelompok data kalibrasi (30 contoh ) dan kelompok data validasi (10 contoh) dapat dilihat pada Tabel 10. Sedangkan plot antara Y dari HPLC dengan Yˆ untuk masingmasing kelompok data kalibrasi dan validasi dapat dilihat pada Gambar 17 dan Gambar 18.
79
Tabel 9 Ringkasan nilai kebaikan model kurkuminoid dengan wavelet D9-PCR (level 0,1,2,4) Pc1 Pc1 Pc2 Pc1-Pc3 Pc1-Pc4 Pc1-Pc5 Pc1-Pc6 Pc1-Pc7 Pc1-Pc8 Pc1-Pc9
F 0.92 3.04 1.95 2.13 1.66 1.59 1.91 1.62 2.35
S 0.3359 0.3141 0.3201 0.3120 0.3179 0.3167 0.3037 0.3101 0.2817
R2 3.20% 18.40% 18.40% 25.40% 25.70% 29.30% 37.80% 38.10% 51.40%
R2 adusted 0.00% 12.30% 8.90% 13.50% 10.20% 10.90% 18.00% 14.60% 29.50%
PRESS 3.5334 3.2621 3.9170 3.7701 3.9291 3.9228 4.2741 5.3443 4.5057
RMSEP 0.3214 0.2609 0.2605 0.1852 0.1885 0.1893 0.3446 0.3110 0.4448
Pc1-Pc10
2.80*
0.2635
59.60%
38.30%
3.8407
0.9045
Pc1-Pc11 Pc1-Pc12
2.76* 6.11**
0.2599 0.1900
62.80% 81.20%
40.00% 67.90%
3.6818 2.7628
0.9453 0.2312
Pc1-Pc13
6.30**
0.1826
83.70%
70.40%
3.0305
0.2890
Pc1-Pc14 Pc1-Pc15
7.08** 9.29**
0.1691 0.1459
86.90% 90.90%
74.60% 81.10%
3.0939 2.7006
0.1989 0.2614
Pc1-Pc16
9.93**
0.1378
92.40%
83.10%
3.2138
0.2868
Pc1-Pc17 Pc1-Pc18
8.82** 9.91**
0.1420 0.1312
92.60% 94.20%
82.10% 84.70%
4.0671 3.7260
0.2767 0.3186
Pc1-Pc19
8.66 **
0.1367
94.30%
83.40%
4.5136
0.2720
Pc1-Pc20 Pc1-Pc21
**
13.22 11.54**
0.1093 0.1142
96.70% 96.80%
89.40% 88.40%
3.3007 5.6095
0.1715 0.2017
Pc1-Pc22
26.07**
0.0750
98.80%
95.00%
4.3463
0.4028
Pc1-Pc23 Pc1-Pc24
**
39.92 0.0594 99.40% 31.89** 0.0651 99.40% Dari Regresi Bertatar
96.90% 96.20%
1.6620 2.3469
0.5316 0.5377
86.80%
1.3662
0.2213
89.80%
1.0665
0.6216
92.40%
1.0882
0.4872
95.30%
0.4806
0.3920
96.20%
0.4433
0.4999
96.70%
0.4455
0.5630
Peubah Prediktor
Pc1, Pc2, Pc4, Pc6, Pc7, Pc9-Pc15, Pc20 15.67** 0.1219 92.70% Pc1, Pc2, Pc4, Pc6, Pc7, Pc9-Pc15, Pc20, Pc22 19.18** 0.1073 94.70% Pc1, Pc2, Pc4, Pc6, Pc7, 24.38** 0.0927 96.30% Pc9-Pc15, Pc18, Pc20, Pc22 Pc1, Pc2, Pc4, Pc6, Pc7, Pc9-Pc15, Pc16, Pc18, Pc20, Pc22 37.45** 0.0730 97.90% Pc1, Pc2, Pc4, Pc6, Pc7, Pc9-Pc15, Pc16, Pc18, 44.34** 0.0653 98.40% Pc20, Pc22, Pc23 Pc1, Pc2, Pc4, Pc6-Pc15, Pc16, Pc18, Pc20, Pc22, 47.92 ** 0.0611 98.70% Pc23 Pc1, Pc2, Pc4-Pc15, Pc16, Pc18, Pc20, Pc22, Pc23 52.69 ** 0.0568 99.00% Keterangan ** signifikan pada α = 0.01; * signifikan pada α regresi, S : Kuadrat Tengah Galat
97.10% 0.4089 0.5910 = 0.05 , F: nilai Fhitung uji model
80
Tabel 10 Dugaan kurkuminoid Kelompok data kalibrasi
Kelompok data validasi
Kadar kurkuminoid (%) 0.85 0.71 0.70 0.78 0.80 0.70 0.74 0.67 0.61 0.80 0.87 0.81 0.60 0.85 0.83 0.71 0.72 0.84 0.65 0.63 1.13 1.66 0.90 0.47 0.50 1.38 1.57 1.74 1.30 1.24
Kadar kurkuminoid (%) 0.83 0.85 0.63 0.76 0.72 0.84 1.01 1.61 0.92 1.57
DUGAAN (%) 0.804 0.779 0.716 0.656 0.832 0.676 0.882 0.666 0.615 0.772 0.901 0.853 0.543 0.883 0.764 0.684 0.819 0.790 0.665 0.631 1.105 1.675 0.860 0.606 0.464 1.289 1.496 1.785 1.305 1.244
DUGAAN (%) 0.789 0.931 0.386 0.555 0.728 0.932 0.837 1.892 1.094 1.760
81
R2 = 96.7%
Gambar 17 Plot Y dengan Yˆ kelompok data kalibrasi kurkuminoid
R2 = 92.9% RMSEP = 0.1715
Gambar 18 Plot Y dengan Yˆ kelompok data validasi kurkuminoid
82
Hasil perhitungan lengkap untuk model terpilih untuk menduga kadar kurkuminoid dapat dilihat pada lampiran 10. Terlihat dari Gambar 18 titik-titik yang ada mendekati ke garis lurus melalui pusat koordinat dan membentuk sudut 45o , serta kuadrat korelasi antara Y dengan
Yˆ relatif tinggi (92.9%). Berarti model yang
terpilih ternyata untuk menduga data eksternal memberikan hasil yang relatif baik.
Simpulan Metode Transformasi Wavelet Diskret (TWD) mampu melakukan reduksi dimensi dengan baik, tetapi tidak ada jaminan, bahwa kasus multikolinearitas teratasi. Sehingga TWD sebaiknya digabung dengan metode lain yang mampu mengatasi multikolinearitas dalam pembuatan model kalibrasi peubah ganda. Gabungan wavelet dengan PCR, untuk menduga model prediksi kadar senyawa gingerol dan kurkuminoid pada rimpang jahe dan temulawak, ternyata menghasilkan model yang cukup memuaskan.
Daftar Pustaka Arnita. 2005. Koreksi Pencaran Dalam Model Kalibrasi Peubah Ganda pada Data Senyawa Aktif Gingerol Serbuk Rimpang Jahe (Zingiber Officinale Roscue) [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Brown PJ, Fearn T, Vanucci M. 2001. Bayesian Wavelet Regression on Curves with Application to a Spectroscopic Calibration Problem. J Amer Statist Assoc 96: 398-408. McNulty SC, Ganapati M. 1998. Application of Wavelet Analysis Determining Glucose Concentration of Aqueous Solution Using NIR Spectroscopy. HewlettPackard comp. Naes T, Isaksoon T, Fearn T, Davies T. 2002. A User Friendly Guide to Multivariate Calibration and Classification. NIR publications, UK. Nason GP, Silverman BW. 1994. The discrete wavelet transform in S. J.comp graph. Stat. 3: 163-191.
83
Nason GP. 1998. Wavethresh 3 software. Department of Mathematics, University of Bristol, UK. (http://www.stats.bris.ac.uk/~wavethresh) [ 20 juni 2003] Shao X, Yadong Zhuang. 2004. Determining of Chlorogenic Acid in Plant Samples by Using Near-Infrared Spectrum with Wavelet Transform Preprocessing. Analytical Sciences 20. Sunaryo S, Notodiputro KA. 2004. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kadar Senyawa Gingerol pada Rimpang Jahe. Statistika Forum Teori dan Aplikasi Statistika 4: 181-185 , Jurusan Statistika FMIPA UNISBA Sunaryo S, Notodiputro KA. 2005. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kadar Senyawa Kurkuminoid pada Rimpang Temulawak. Prosiding Seminar Nasional Matematika , halaman 100-107, Jurusan Matematika UNS, Surakarta , 7 Mei 2005. Yi-yu Cheng, Chen min-jun. 2000. A New Computing Multivariate Spectral Analysis Method Based on Wavelet Transform. Journal of Zhejiang University Science 1: 15-19.
7. PEMBAHASAN UMUM
Kajian utama yang diteliti dalam disertasi ini adalah metode transformasi wavelet diskret sebagai metode pra-pemrosesan dalam pemodelan regresi yang terjadi kasus multikolinearitas antar peubah bebas dan banyaknya pengamatan contoh (n) jauh lebih kecil dari banyaknya peubah bebas (p). Dalam penerapan real pemodelan regresi dengan dua kasus tersebut sering terjadi dalam pemodelan kalibrasi peubah ganda. Kajian terhadap transformasi wavelet dilakukan baik secara empiris maupun teoritis. Eksplorasi terhadap tiga metode pra -pemrosesan yaitu analisis komponen utama, transformasi Fourier dan transformasi wavelet pada data simulasi telah dijelaskan pada bab 3. Hasilnya menunjukkan bahwa metode transformasi wavelet diskret (TWD) lebih unggul dibanding dua metode lainnya. Hal ini karena ukuranukuran kebaikan model seperti R2, R2 adjusted, S, dan PRESS yang dihasilkan oleh TWD lebih baik dari metode pra-pemrosesan yang lainnya, walaupun hanya menggunakan fungsi wavelet yang paling sederhana yaitu Haar wavelet (Hasil lengkap lihat Tabel 3). Hal ini sejalan dengan kajian beberapa pustaka (McNulty dan Ganapati 1998; Shao dan Yadong 2004; Yi-yu dan Chen min-jun 2000; Brown et al. 2001) yang secara empiris juga menunjukkan pra-pemrosesan dengan TWD dalam pemodelan kalibrasi memberikan hasil yang relatif baik. Data simulasi yang dibangkitkan diusahakan mencerminkan permasalahan real, yaitu antar peubah bebas saling berkorelasi sangat tinggi dan n jauh lebih kecil dari p. Karena TWD mempunyai potensi untuk diteliti lebih lanjut, maka pada bab 4 diteliti lebih mendalam bagaimana sifat-sifat matematis dari matriks untuk transformasi dan matriks peubah baru yang dihasilkan dari TWD. Hasil kajian menunjukkan ternyata untuk apapun fungsi wavelet yang digunakan maka akan dijamin secara matematis matriks transformasi dalam TWD , yang dinotasikan dengan W, akan ortogonall. Sedangkan matriks peubah baru yang dihasilkan dari TWD suatu matriks X yang terkoreksi terhadap nilai tengahnya ternyata jumlah elemen setiap kolomnya sama dengan nol . Matriks hasil transformasi berupa matriks koefisien wavelet yang dinotasikan dengan D. Dari penurunan secara
85
matematis jika transformasi wavelet diskret dikerjakan pada data asal yang saling berkorelasi tinggi, maka antar peubah baru yang dihasilkan secara umum masih dimungkinkan terjadi korelasi. Hal ini berbeda dengan hasil yang diperoleh dari transformasi dengan analisis komponen utama (PCA), dimana antar peubah baru yang dihasilkan dijamin tidak saling berkorelasi. Peubah baru yang dihasilkan dengan transformasi Fourier secara umum juga masih berkorelasi. Dalam bab 4 juga ditunjukkan bahwa jumlah akar ciri dari peubah baru hasil TWD dari X
DT D , dimana D merupakan
(matriks X yang terkoreksi terhadap nilai
tengah), ternyata akan sama dengan jumlah akar ciri dari X
T
X . Sehingga jika
diambil beberapa kolom dari D untuk reduksi dimensi (dinotasikan D * ), maka proporsi keragaman data asal yang mampu dijelaskan oleh peubah-peubah baru akan dicerminkan oleh jumlah akar ciri D * T D * yang bisa dihasilkan. Karena pada kasus multikolinearitas akar ciri X
T
X
banyak yang mendekati nol ata u
bahkan sama dengan nol, maka kebaikan reduksi akan tercermin oleh kemampuan reduksi sehingga D * T D * mempunyai akar ciri-akar ciri yang besar. Matriks peubah baru yang dihasilkan dari TWD suatu matriks X yang terkoreksi terhadap nilai tengahnya ternyata jumlah elemen setiap kolomnya sama dengan nol. Hal ini berarti jika dibuat model regresi antara peubah tak bebas y terhadap matriks koefisien wavelet D maka sifat-sifatnya akan sama seperti regresi antara y terhadap peubah tak bebas X yang terkoreksi terhadap nilai tengah. Sehingga sifat-sifat statistik dari regresi terhadap koefesien wavelet yang diteliti dalam bab 5 analog dengan sifat-sifat statistik pada model regresi y terhadap X . Jika dilakukan reduksi dimensi, yang berarti hanya mengambil beberapa kolom dari D , maka akan diperoleh penduga parameter regresi yang berbias. Dalam bab 5 ditunjukkan bahwa besarnya bias akan dikonpensasi dengan besarnya ragam penduga yang makin kecil. Dengan bisa mengambil akar ciri-akar ciri dari
D * T D * yang besar maka ragam untuk prediksi pengamatan baru juga
menjadi semakin kecil, sehingga akan diperoleh prediksi yang lebih stabil. Hasil ini secara lengkap dapat dilihat pada persamaan (76) sampai (78) dan Tabel 6.
86
Karena antar koefisien wavelet yang dihasilkan dari TWD masih dimungkinkan saling berkorelasi tinggi, maka penerapan model yang lebih baik dapat digabungkan antara TWD dengan metode lain. Dalam bab 6 dibahas penggabungan metode TWD dengan PCR (Principal Component Regression) untuk menduga kadar gingerol dan kurkuminoid pada rimpang jahe dan temulawak. Hasil penerapan gabungan TWD dan PCR ternyata menghasilkan model kalibrasi yang relatif memuaskan. Untuk gingerol diperoleh hasil : S = 0.0922792 ; R2 = 96.7%; R2 (adj) = 92.3%; PRESS = 0.505570 dan RMSEP = 0.1072 . Sedangkan untuk kurkuminoid diperoleh hasil : S = 0.109252; R2 = 96.7%; R2 (adj) = 89.4%; PRESS = 3.30071 dan RMSEP = 0. 1715 .
8. SIMPULAN DAN SARAN 8.1 Simpulan Dari eksplorasi data simulasi ternyata transformasi wavelet mempunyai potensi untuk diteliti lebih lanjut, karena walaupun hanya dengan mother wavelet yang paling sederhana yaitu Haar wavelet telah memberikan hasil ukuran kebaikan model yang lebih baik dibanding PCA dan transformasi Fourier. Transformasi wavelet diskret dari peubah asal X
(nxp )
menjadi peubah baru
* koefisien wavelet D(nxm ) dengan m < p mempunyai keunggulan dibandingkan
transformasi Fourier atau PCA dalam hal banyaknya alternatif memilih berbagai fungsi wavelet yang jumlah akar ciri D* T D * masih besar, sehingga hasil reduksi dimensi masih cukup mendekati peubah asal. Sedangkan kelemahannya, ternyata tidak ada jaminan secara matematis bahwa korelasi antara koefesien wavelet * D(nxm ) menjadi relatif kecil semua, sehingga masih dimungkinkan terjadi kasus
multikolinearitas dalam pemodelan regresi. Jika dimensi matriks X yang terkoreksi terhadap rata -rata
(X (nxp ) )
direduksi menjadi koefisien wavelet D* untuk m < p, maka diperoleh dugaan (nxm) parameter regresi yang berbias. Keragaman koefisien regresi akan dipengaruhi oleh besar kecilnya akar ciri dari D * T D * yang diperoleh. Penghapusan ragam-ragam yang besar dari prediksi nilai pengamatan baru y akan diganti dengan MSE (Mean Square Error) yang cenderung lebih kecil dalam regresi terhadap koefisien wavelet D * . (nxm) Penerapan metode Tra nsformasi Wavelet Diskret (TWD) pada data gingerol dan kurkuminoidoid ternyata mampu melakukan reduksi dimensi dengan baik, tetapi tidak ada jaminan, bahwa kasus multikolinearitas teratasi. Sehingga TWD sebaiknya digabung dengan metode lain yang mampu mengatasi multikolinearitas dalam pembuatan model kalibrasi peubah ganda.
88
Gabungan wavelet dengan PCR (Principal Component Regression), untuk menduga model prediksi kadar senyawa gingerol dan kurkuminoid pada rimpang jahe dan temulawak, ternyata menghasilkan model yang relatif cukup memuaskan.
8.2 Saran Agar diperoleh model dugaan yang lebih baik maka perlu diteliti lebih lanjut tentang perilaku metode penggabungan antara transformasi wavelet diskret dengan yang lainnya, seperti Partial Least Square, Bayes, Jaringan syaraf tiruan (Artificial Neural Network), continuum regression dan lain-lain. Gabungan transformasi wavelet diskret dengan PCR akan baik jika hubungan tidak linear antara peubah bebas dengan peubah tak bebas tidak terjadi. Selain itu perlu dila kukan penelitian lebih lanjut tentang penemuan mother wavelet yang baik untuk berbagai kondisi data, dan bagaimana sifat-sifat statistiknya. Karena metode wavelet membutuhkan banyak titik harus berjumlah pangkat dari 2, maka perlu diteliti lebih lanjut bagaimana cara mengatasi data yang jumlahnya tidak pangkat dari 2, sehingga tidak perlu membuang data asli.
DAFTAR PUSTAKA Antoniadis A, Jeremie B, Theofanis S. 2001. Wavelet Estimators in Nonparametric Regression : A Comparative Simulation Study. Laboratoire IMAG-LMC, University Joseph Fourier, France. Antoniadis A. 1997. Wavelets in Statisics : A Review. Laboratoire IMAG-LMC, University Joseph Fourier, France. Abramovich F, Trevor C B, Theofanis S. 2000. Wavelet analysis and statistical applications. Institute of Math. And Statistics, University of Kent at Canterbury, UK. Akritas A G. 2000. An Introduction to Wavelet Transforms and Data Compression Using Mathematica. University of Thessaly, Volos, Greece. Arnita. 2005. Koreksi Pencaran Dalam Model Kalibrasi Peubah Ganda pada Data Senyawa Aktif Gingerol Serbuk Rimpang Jahe (Zingiber Officinale Roscue) [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Brown PJ, Fearn T, Vanucci M. 2001. Bayesian Wavelet Regression on Curves with Application to a Spectroscopic Calibration Problem. J Amer Statist Assoc 96: 398-408. Chan CC, May CK, Chi TH. 1986. Pungent Compounds of Ginger (Zingiber Officinale Roscoe) Extracted by Liquid Carbon Dioxide. J. Agric. Food Chem. Vol 34, No 3: 1033-1043. Darwis SN, Haiyah S, Madjo ABD. 1991. Tumbuhan Obat Famili Zingiberaceae. Bogor: Pusat Penelitia dan Pengembangan Industri. Dean N, Murphy TB, Downey G. 2004. Using Unlabelled Data To Update Classification Rules With Applications In Food Authenticity Studies. Technical Report no. 444, Department of Statistics, University of Washington. Depczynski K, Jetter K, Stockler J, Molt K, Niemoller A. 1997. Wavelet Methods in Chemometrics : Quantitative Spectrometric Multi Component Analysis. 15t h IMACS world Congress on Scientific Computation, Modelling and Applied Mathematics 1: 87-92.
90
Downie TR, Silverman BW. 1996. The Discrete Multiple Wavelet Transform and Thresholding Methods. School of Mathematics, University of Bristol, UK. Edwards T. 1999. Discrete Wavelet Transform : Theory and Implementation. Stanford University, New Jersey. Fearn T. 1999. Data Compression : FT or Wavelet. Spectroscopy Europe, London (http://195.173.150.81/td_col.html). Geladi P, Kowalski BR. 1986. Partial least square regression. A tutorial. Anal Chem Ac 185: 1-17. Harborne JB. 1996. Metode Fitokimia. Ed. ke-2. Terjemahan Kosasih Padmawinata. ITB. Bandung. Terjemahan dari: Phytochemical Methods Hayati EK. 2005. Pemilihan Metode Pemisahan untuk Penentuan Konsentrasi Senyawa Aktif Gingerol dan Pola Respon FTIR (Fourier Transform Infrared) pada Rimpang Jahe (Zinge ber officinale Roscoe). [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Johnstone, Ian M, Silverman BW. 2004. Empirical Bayes Selection of Wavelets Threshold. Stanford University. Lee JC, Lim KT. 2000. Effects of Cactus and Ginger Extracts as Dietary Antioxidants on Reactive Oxidant and Plasma Lipid Level. Food Sci. Biotechnol. Vol. 9 No. 2: 83-88 [seri online] Leung AKM, Chau FT, Gao JB. 1998. A review on Applications of Wavelet Transform Techniques in Chemical Analysis : 1989-1997. Chem ometr. Intell. Lab. 43: 165-184. McNulty C S, Ganapati M. 1998. Application of wavelet analysis for determining glucose concentration of aqueous solutions using NIR spectroscopy. HewlettPackard company. Mallat, SG. 1989. Multiresolution Approximations and Wavelet Orthogonal Bases of L 2(r). Transact Amer Math Soc 315: 69-87. Mark, H. 1997. Quantitative Spectroscopic Calibration. Encyclopedia of Analytical Chemistry. Chichester. Mittermayr C R, Brown SD. 2001. Robust Calibration with Respect to Background Variation. Appl Spectros 55.
91
Martens H, Naes T. 1989. Multivariate Calibration. John Willey & Sons. Chichester, England. Morettin PA. 1997. Wavelets in Statistics. Institute of Math. And Stat., University of Sao Paulo, Brazil. Myers RH. 1990. Classical and Modern Regression with Applicatios. PWSKENT Pub. Co. Naes T, Mevik BH. 2001. Understanding The Collinearity Problem in Regression and Discriminant Analysis. Jour. of Chemomet. 15 : 413-426. Naes T. 1985. Multivariate calibration when the error covariance matrix is structured. Technometrics 27: 301-311. Naes T, Isaksoon T, Fearn T, and Davies T. 2002. A User Friendly Guide to Multivariate Calibration and Classification. NIR publications, UK. Nason GP. 1994. Wavelet Regression by Cross-Validation. Stanford University, Stanford. Nason GP, Silverman BW. 1994. The discrete wavelet transform in S. J.comp graph. Stat. 3: 163-191. Nason GP, Silverman BW. 1997. Wavelets for Regression and other Statistical Problems. School of Mathematics, University of Bristol, UK. Nason GP. 1998. Wavethresh 3 software. Department of Mathematics, University of Bristol, UK. (http://www.stats.bris.ac.uk/~wavethresh) [ 20 juni 2003] Notodiputro KA. 2003. Pendekatan Statistika dalam Kalibrasi. Conference on Statistical and Mathematical Sciences of Islamic Society in South East Asia Region, Bandung, 25-25 April 2003. Nur
MA,
Adijuwana
H.
1989. Teknik
Spektroskopi
dalam
Analisis
Biologi.Bogor: Institut Pertanian Bogor Osborne BG, Fearn T, Hindle FH. 1993. Practical NIR Spectrocopy with Applications in Food and Beverage Analysis. Longman Scientific & Technical. London. Percival DB. 2005. Wavelets : Data Analysis, Algorithms and Theory. University Washington. (http://www.ms.washington.edu/~s530/) [18 april 2005]. Percival D. 2000. An Introcuction to Wavelet Analysis of Time series. Symposium Tutorials, June 6, 2000, Kansas City, Missouri, USA.
92
Polikar R. 1999. The Story of Wavelets. IM ACS/IEEE CSCC’99 Proceedings, pages : 5481-5486, Iowa. Searle SR. 1971. Linear Models. John Willey & Sons. Sharma, S, 1996. Applied Multivariate Techniques. John Wiley & Sons, Inc. New York, USA Shao X, Yadong Zhuang. 2004. Determining of Chlorogenic Acid in Plant Samples by Using Near-Infrared Spectrum with Wavelet Transform Preprocessing. Analytical Sciences 20. Sinambela J.M. 1985. Fitoterapi, Fitostandar, dan Temulawak. Prosiding Simposium Nasional Temulawak. Bandung, 17 September 1985. Lembaga Penelitian Universitas Padjajaran. Socrates G. 1994. Infrared Characteristic Group Frequencies Tables and Charts. Ed ke-2. England: John Wiley and Sons Sunaryo S, Notodiputro KA. 2003. Regresi Fourier dalam Kalibrasi. Prosiding Seminar Nasional Matematika dan Statistika VI, Jurusan Statistika, ITS, Surabaya, 11 Oktober 2003. Sunaryo S, Notodiputro KA. 2004a. Reduksi Dimensi Data Spektra dengan Fourier dan Wavelet. Seminar Nasional Statistika, Departemen Statistika, IPB, Bogor, 4 September 2004. Sunaryo S, Notodiputro KA. 2004b. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kandungan Senyawa Gingerol pada Tanaman Jahe. Statistika - Forum Teori dan Aplikasi Statistika 4: 181-185, Jurusan Statistika FMIPA UNISBA Sunaryo S, Notodiputro KA. 2005a. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kandungan Senyawa Kurkumin pada Tanaman Temulawak. Prosiding Seminar Nasional Matematika, halaman 100-107, Jurusan Matematika UNS, Surakarta , 7 Mei 2005. Sunaryo S, Notodiputro KA. 2005b. Sifat-sifat Statistik Pendugaan Model Kalibrasi melalui Metode Transformasi Wavelet Diskret. Prosiding Seminar Nasional Matematika, halaman 159-168, Jurusan Matematika UNS, Surakarta, 7 Mei 2005.
93
Sunaryo S. 2005. Transformasi Wavelet Diskret dalam Regresi Nonparametrik. Inferensi Jurnal Statistika FMIPA-ITS. 1 : 24-32. Supriadi 2001. Tumbuhan Obat Indonesia: Penggunaan dan Khasiatnya. Jakarta. Yayasan Obor Indonesia: xi-xxvii Swierenga H. 1999. Strategy for constructing robust multivariate calibration models. Chemometrics
and
Intelligent
Laboratory
Systems
49:1-17
(http://www.elsevier.com/locate/chemometrics ) Swierenga H. 2000. Development of robust calibration models in near infra-red spectroscopic
applic ations.
Analytica
Chimica
Acta
411:121-135.
(www.elsevier.com/locate/aca). Tan Hu-Wei, Brown SD. 2002. Wavelet Analysis Applied to Removing nonconstant, Varying Spectroscopic Background in Multivariate Calibration. Journal of Chemometrics, 2002, 16 : 228-240. Teppola P, Pentti M. 2000. Wavelet-PLS regression models for both exploratory data analysis and process monitoring. Journal of Chemometrics, 14 : 383399. Tonnensen HH, Karlsen J. 1985. Studies on Curcumin and Curcumnoids Alkaline Degradation of Curcumin. Z Lebens. Vidacovic B, Meuller P. 1991. Wavelets for Kids. A Tutorial Introduction. AMS Subject Classification, Duke University. William WWS. 1994. Time Series Analysis. Addison-Wesley Pub. Comp. Yi-yu Cheng, Chen min-jun. 2000. A New Computing Multivariate Spectral Analysis Method Based on Wavelet Transform. Journal of Zhejiang University Science 1: 15-19. Young HY 2002. Analytical and Stability Studies of Ginger Preparations Journal of Food and Drug Analysis. Vol. 10. No. 3. 2002; 149-153. Yusnira
2005.
Pemilihan
Metode
Pemisahan
untuk
Penentuan
Kadar
Kurkuminoid pada Rimpang Temulawak (Curcuma xanthorrhiza Roxb.) dan Korelasinya dengan Pola Spektrum FTIR [tesis]. Bogor: Program Pascasarjana , Institut Pertanian Bogor.
LAMPIRAN
95
Lampiran 1 Hasil lengkap analisis data simulasi 1 Bab 3 Regression Analysis : Y versus Pc1, Pc4, Pc5, Pc9, Pc12 (Pra-pemrosesan PCA) The regression equation is Y = 1.82 + 0.905 Pc1 - 19.0 Pc4 - 19.1 Pc5 - 26.7 Pc9 + 27.2 Pc12 Predictor Constant Pc1 Pc4 Pc5 Pc9 Pc12
Coef 1.81889 0.9054 -18.979 -19.057 -26.687 27.153
S = 0.414412
SE Coef 0.09267 0.1087 5.310 5.664 7.951 9.022
R-Sq = 89.0%
T 19.63 8.33 -3.57 -3.36 -3.36 3.01
P 0.000 0.000 0.003 0.005 0.005 0.009
VIF 1.0 1.0 1.0 1.0 1.0
R-Sq(adj) = 85.1%
PRESS = 5.23009 Analysis of Variance Source Regression Residual Error Total
DF 5 14 19
SS 19.5453 2.4043 21.9496
MS 3.9091 0.1717
F 22.76
P 0.000
Regression Analysis: Y versus a0, b1, b5 (Pra-pemrosesan Transformasi Fourier) The regression equation is Y = 1.82 - 0.986 a0 - 68.1 b1 - 50.8 b5 Predictor Constant a0 b1 b5
Coef 1.8189 -0.9856 -68.10 -50.81
S = 0.5974 PRESS = 9.44999 Analysis of Variance Source DF Regression 3 Residual Error 16 Total 19
SE Coef 0.1336 0.1591 23.85 25.41 R-Sq = 74.0%
SS 16.2388 5.7109 21.9496
T 13.62 -6.20 -2.86 -2.00
P 0.000 0.000 0.011 0.063
VIF 1.0 1.0 1.0
R-Sq(adj) = 69.1%
MS 5.4129 0.3569
F 15.17
P 0.000
96
Lampiran 1 (Lanjutan) Regression Analysis: Y versus c0_1, d4,14_1, ... (Pra-pemrosesan dengan Haar Wavelet) The regression equation is Y = 1.82 - 0.671 c0_1 - 59.7 d4,14_1 - 73.6 d5,20_1 - 29.2 d5,14_1 + 41.0 d4,15_1 + 27.2 d33_1 + 35.2 d4,3_1
Predictor Constant c0_1 d4,14_1 d5,20_1 d5,14_1 d4,15_1 d33_1 d4,3_1
Coef 1.81889 -0.67071 -59.656 -73.622 -29.178 40.994 27.173 35.22
S = 0.194748
SE Coef 0.04355 0.07255 7.840 8.859 7.264 8.005 7.560 12.49
R-Sq = 97.9%
T 41.77 -9.24 -7.61 -8.31 -4.02 5.12 3.59 2.82
P 0.000 0.000 0.000 0.000 0.002 0.000 0.004 0.015
VIF 2.0 1.2 1.7 1.6 1.5 1.3 1.6
R-Sq(adj) = 96.7%
PRESS = 1.19590 Analysis of Variance Source Regression Residual Error Total
DF 7 12 19
SS 21.4945 0.4551 21.9496
MS 3.0706 0.0379
F 80.96
P 0.000
97
Lampiran 2 Hasil lengkap analisis data simulasi 2 Bab 3. Regression Analysis: Y versus Pc1, Pc4, Pc6, Pc2, Pc7, pc20 (Pra-pemrosesan dengan PCA) The regression equation is Y = 1.51 + 0.291 Pc1 + 1.13 Pc4 + 1.46 Pc6 - 0.983 Pc2 + 1.20 Pc7 – 1.98 Pc20 Predictor Constant Pc1 Pc4 Pc6 Pc2 Pc7 pc20
Coef 1.51246 0.290974 1.1281 1.4628 -0.9827 1.1977 -1.9756
S = 0.0640165
SE Coef 0.01012 0.009389 0.4942 0.5370 0.4616 0.5679 0.8896
R-Sq = 96.8%
T 149.42 30.99 2.28 2.72 -2.13 2.11 -2.22
P 0.000 0.000 0.029 0.010 0.041 0.043 0.033
VIF 1.0 1.0 1.0 1.0 1.0 1.0
R-Sq(adj) = 96.2%
PRESS = 0.192190 Analysis of Variance Source Regression Residual Error Total
DF 6 33 39
SS 4.04445 0.13524 4.17969
MS 0.67408 0.00410
F 164.48
P 0.000
Regression Analysis: Y versus a0, b11, a14, a10, b15, a13 (Pra-pemrosesan dengan Transformasi Fourier) The regression equation is Y = 1.51 - 0.298 a0 - 5.65 b11 - 3.27 a14 + 4.72 a10 - 3.05 b15 - 2.46 a13
Predictor Constant a0 b11 a14 a10 b15 a13
Coef 1.51246 -0.297959 -5.648 -3.266 4.719 -3.048 -2.455
S = 0.0586801
SE Coef 0.00928 0.008963 1.373 1.471 1.385 1.325 1.356
R-Sq = 97.3%
T 163.01 -33.24 -4.11 -2.22 3.41 -2.30 -1.81
P 0.000 0.000 0.000 0.033 0.002 0.028 0.079
VIF 1.1 1.0 1.2 1.2 1.1 1.4
R-Sq(adj) = 96.8%
PRESS = 0.169743 Analysis of Variance Source Regression Residual Error Total
DF 6 33 39
SS 4.06606 0.11363 4.17969
MS 0.67768 0.00344
F 196.81
P 0.000
98
Lampiran 2 (Lanjutan) Regression Analysis: Y versus c0_1, d5,14_1, ... (Pra-pemrosesan dengan HAAR Wavelet) The regression equation is Y = 1.51 - 0.303 c0_1 + 3.99 d5,14_1 + 3.40 d5,17_1 - 5.16 d5,28_1 - 2.64 d5,18_1 + 3.35 d5,1_1 + 5.46 d22_1 + 3.99 d00_1 - 3.92 d10_1
Predictor Constant c0_1 d5,14_1 d5,17_1 d5,28_1 d5,18_1 d5,1_1 d22_1 d00_1 d10_1
Coef 1.51246 -0.302787 3.990 3.398 -5.163 -2.641 3.346 5.4612 3.991 -3.921
S = 0.0476807
SE Coef 0.00754 0.008096 1.106 1.102 1.451 1.278 1.084 0.9828 1.112 1.318
R-Sq = 98.4%
T 200.62 -37.40 3.61 3.08 -3.56 -2.07 3.09 5.56 3.59 -2.98
P 0.000 0.000 0.001 0.004 0.001 0.048 0.004 0.000 0.001 0.006
VIF 1.3 1.2 1.2 1.4 1.3 1.5 1.1 1.2 1.8
R-Sq(adj) = 97.9%
PRESS = 0.127978
Analysis of Variance Source Regression Residual Error Total
DF 9 30 39
SS 4.11149 0.06820 4.17969
MS 0.45683 0.00227
F 200.94
P 0.000
99
Lampiran 3 Hasil lengkap analisis data simulasi 3 Bab 3. Regression Analysis: Y versus Pc2, Pc13, pc19 (Pra-pemrosesan dengan PCA) The regression equation is Y = 1.99 - 10.7 Pc2 + 15.8 Pc13 + 20.2 pc19
Predictor Constant Pc2 Pc13 pc19
Coef 1.9930 -10.658 15.771 20.158
S = 0.660232
SE Coef 0.1476 4.365 6.445 8.666
R-Sq = 52.0%
T 13.50 -2.44 2.45 2.33
P 0.000 0.027 0.026 0.033
VIF 1.0 1.0 1.0
R-Sq(adj) = 43.0%
PRESS = 11.5769
Analysis of Variance Source Regression Residual Error Total
DF 3 16 19
SS 7.5676 6.9745 14.5421
MS 2.5225 0.4359
F 5.79
P 0.007
Regression Analysis: Y versus a2, a3, b1, b7 (Pra-pemrosesan dengan Transformasi Fourier) The regression equation is Y1 = 1.99 - 95.6 a2 + 38.2 a3 - 83.9 b1 - 84.5 b7
Predictor Constant a2 a3 b1 b7
Coef 1.9930 -95.60 38.20 -83.93 -84.47
S = 0.457290
SE Coef 0.1023 17.73 18.08 21.82 15.73
R-Sq = 78.4%
T 19.49 -5.39 2.11 -3.85 -5.37
P 0.000 0.000 0.052 0.002 0.000
VIF 1.4 1.2 1.1 1.2
R-Sq(adj) = 72.7%
PRESS = 5.94824 Analysis of Variance Source Regression Residual Error Total
DF 4 15 19
SS 11.4054 3.1367 14.5421
MS 2.8513 0.2091
F 13.64
P 0.000
100
Lampiran 3 (Lanjutan) Regression Analysis: Y versus d22_1, d4,6_1, ... (Pra-pemrosesan dengan Haar Wavelet) The regression equation is Y = 1.99 - 104 d22_1 + 72.6 d4,6_1 + 33.6 d4,13_1 - 66.0 d00_1 - 60.0 d37_1 - 29.8 d4,4_1 - 26.0 d4,8_1
Predictor Constant d22_1 d4,6_1 d4,13_1 d00_1 d37_1 d4,4_1 d4,8_1
Coef 1.99302 -104.235 72.635 33.598 -66.01 -60.01 -29.763 -26.023
S = 0.253283
SE Coef 0.05664 9.280 8.304 8.320 10.71 10.66 8.330 9.320
R-Sq = 94.7%
T 35.19 -11.23 8.75 4.04 -6.16 -5.63 -3.57 -2.79
P 0.000 0.000 0.000 0.002 0.000 0.000 0.004 0.016
VIF 1.4 1.2 1.3 1.2 1.5 1.4 1.3
R-Sq(adj) = 91.6%
PRESS = 2.39960 Analysis of Variance Source Regression Residual Error Total
DF 7 12 19
SS 13.7722 0.7698 14.5421
MS 1.9675 0.0642
F 30.67
P 0.000
101
Lampiran 4 Program SAS untuk simulasi data 1 pada Bab 3. options ls=64 ps=100 nodate nonumber; title1 'DATA BANGKIT BERKORELASI TINGGI'; proc iml; seed=549065467; n=20; p=64; r=99; sigma=shape(r,p,p); mu=shape(40,p,1); do i=1 to 16; mu[i]=40+(32/i); end; do i=17 to 30 ; mu[i]=900/i; end; do i= 31 to 45; mu[i]=1350/i; end; do i= 46 to 55; mu[i]= 30 +550/i; end; do i=56 to 62; mu[i]=620/i + 20; end; do i=1 to p; sigma[i,i]=100; end; m=repeat(mu`,n,1); g=root(sigma); z=normal(repeat(seed,n,p)); y=z*g + m; X=y; X=X/100; print mu; print X;
102
Lampiran 5 Program SAS untuk simulasi data 2 pada Bab 3. options ls=64 ps=100 nodate nonumber; title1 'DATA BANGKIT BERKORELASI TINGGI'; proc iml; seed=549065467; n=40; p=128; r=99; sigma=shape(r,p,p); mu=shape(40,p,1); do i=1 to 16; mu[i]=40+(32/i); end; do i=17 to 30 ; mu[i]=900/i; end; do i= 31 to 45; mu[i]=1350/i; end; do i= 46 to 55; mu[i]= 30 +550/i; end; do i=56 to 62; mu[i]=620/i + 20; end; do i=63 to 85; mu[i]=40+(170/i); end; do i=86 to 100 ; mu[i]=3000/i; end; do i= 101 to 128; mu[i]= 30 +1280/i; end; do i=1 to p; sigma[i,i]=100; end; m=repeat(mu`,n,1); g=root(sigma); z=normal(repeat(seed,n,p)); y=z*g + m; X=y; X=X/100; print mu; print X;
103
Lampiran 6 Program SAS untuk simulasi data 3 pada Bab 3. options ls=64 ps=100 nodate nonumber; title1 'DATA BANGKIT BERKORELASI TINGGI'; proc iml; seed=549065467; n=20; p=256; r=99; sigma=shape(r,p,p); mu=shape(40,p,1); do i=1 to 5; mu[i]=55 - (2/i); end; do i=6 to 40; mu[i]=60 -(30/i); end; do i=41 to 90 ; mu[i]=59 – (19*i)/90; end; do i= 91 to 180; mu[i]=3600/i; end; do i= 181 to 210; mu[i]= 21 -210/i; end; do i=211 to 256; mu[i]=512/i + 20; end; do i=1 to p; sigma[i,i]=100; end; m=repeat(mu`,n,1); g=root(sigma); z=normal(repeat(seed,n,p)); y=z*g + m; X=y; X=X/100; print mu; print X;
104
Lampiran 7 Hasil analisis regresi antara kadar gingerol dengan 12 koefesien wavelet dan 1 peubah dummy
Regression Analysis: HPLC versus c-00, d-30, ... The regression equation is HPLC = 0.651 - 0.0411 c-00 - 1.62 d-30 + 0.75 d-31 - 1.82 d-32 - 1.55 d-33 + 3.83 d-34 - 5.38 d-35 - 5.90 d-36 - 1.86 d-37 - 0.697 d-10 – 1.17 d-11 + 1.20 d-00 + 0.662 dummy
Predictor Constant c-00 d-30 d-31 d-32 d-33 d-34 d-35 d-36 d-37 d-10 d-11 d-00 dummy
Coef 0.65078 -0.04109 -1.617 0.748 -1.817 -1.546 3.831 -5.375 -5.899 -1.859 -0.6971 -1.1700 1.2000 0.6621
S = 0.0470715
SE Coef 0.04977 0.03357 2.981 1.895 2.162 1.939 2.021 1.698 2.896 1.533 0.7664 0.8298 0.7606 0.1810
R-Sq = 99.9%
T 13.07 -1.22 -0.54 0.39 -0.84 -0.80 1.90 -3.17 -2.04 -1.21 -0.91 -1.41 1.58 3.66
P 0.049 0.436 0.684 0.761 0.555 0.571 0.309 0.195 0.291 0.439 0.530 0.393 0.360 0.170
VIF 111.5 360.9 373.6 681.2 112.2 142.3 51.4 258.3 75.9 341.6 73.8 451.8 43.4
R-Sq(adj) = 98.0%
PRESS = 30.6945 Analysis of Variance Source Regression Residual Error Total
DF 13 1 14
SS 1.53748 0.00222 1.53969
MS 0.11827 0.00222
F 53.38
P 0.107
105
Lampiran 8 Hasil analisis regresi antara kadar kurkuminoid dengan 24 koefesien wavelet Regression Analysis: HPLC versus c00_1, d40_1, ... The regression equation is HPLC = 0.892 - 0.0156 c00_1 - 18.7 d40_1 - 5.9 d41_1 - 4.7 d42_1 – 2.44 d43_1- 31.5 d44_1 - 42.0 d45_1 + 14.8 d46_1 - 11.0 d47_1 – 11.2 d48_1 - 20.4 d49_1 - 1.64 d4,10_1 - 25.9 d4,11_1 – 5.16 d4,12_1 - 16.1 d4,13_1 - 21.7 d4,14_1 + 2.6 d4,15_1 – 1.37 d20_1 - 8.77 d21_1 - 3.51 d22_1 + 3.64 d23_1 - 7.26 d10_1 – 6.18 d11_1 + 2.08 d00_1
Predictor Constant c00_1 d40_1 d41_1 d42_1 d43_1 d44_1 d45_1 d46_1 d47_1 d48_1 d49_1 d4,10_1 d4,11_1 d4,12_1 d4,13_1 d4,14_1 d4,15_1 d20_1 d21_1 d22_1 d23_1 d10_1 d11_1 d00_1
Coef 0.89200 -0.01558 -18.66 -5.93 -4.75 -2.439 -31.524 -41.97 14.810 -10.970 -11.238 -20.391 -1.643 -25.910 -5.161 -16.119 -21.671 2.64 -1.373 -8.767 -3.513 3.643 -7.256 -6.182 2.076
S = 0.0650899
SE Coef 0.01188 0.02791 14.97 19.53 11.97 6.441 9.339 14.58 4.222 3.939 6.451 6.550 3.914 9.230 5.607 7.400 3.550 14.24 7.289 1.571 3.806 5.147 1.293 1.158 1.097
R-Sq = 99.4%
T 75.06 -0.56 -1.25 -0.30 -0.40 -0.38 -3.38 -2.88 3.51 -2.78 -1.74 -3.11 -0.42 -2.81 -0.92 -2.18 -6.10 0.19 -0.19 -5.58 -0.92 0.71 -5.61 -5.34 1.89
P 0.000 0.601 0.268 0.774 0.708 0.720 0.020 0.035 0.017 0.039 0.142 0.026 0.692 0.038 0.400 0.081 0.002 0.860 0.858 0.003 0.398 0.511 0.002 0.003 0.117
VIF 37.4 361.7 1905.9 2834.2 166.8 857.0 871.7 148.3 113.8 75.3 75.4 16.9 391.3 205.3 65.4 158.8 25994.9 19026.3 260.7 696.3 9893.6 1048.6 578.1 3435.7
R-Sq(adj) = 96.2%
PRESS = 2.34687 Analysis of Variance Source Regression Residual Error Total
DF 24 5 29
SS 3.24230 0.02118 3.26348
MS 0.13510 0.00424
F 31.89
P 0.001
106
Lampiran 9 Hasil lengkap analisis regresi komponen utama kadar gingerol Regression Analysis: HPLC versus Pc1, Pc2, ... The regression equation is HPLC = 0.729 - 0.0246 Pc1 + 0.260 Pc2 + 0.604 Pc3 - 0.313 Pc4 - 1.14 Pc5 0.47 Pc6 + 2.55 Pc7 + 0.369 dummy
Predictor Constant Pc1 Pc2 Pc3 Pc4 Pc5 Pc6 Pc7 dummy
Coef 0.72894 -0.02459 0.2604 0.6036 -0.3134 -1.1404 -0.472 2.554 0.3690
S = 0.0922792
SE Coef 0.06733 0.02091 0.1421 0.2332 0.4227 0.6066 1.028 2.429 0.2361
R-Sq = 96.7%
T 10.83 -1.18 1.83 2.59 -0.74 -1.88 -0.46 1.05 1.56
P 0.000 0.284 0.116 0.041 0.486 0.109 0.662 0.334 0.169
VIF 11.4 4.5 1.6 2.6 1.2 1.0 2.8 19.2
R-Sq(adj) = 92.3%
PRESS = 0.505570
Analysis of Variance Source Regression Residual Error Total
DF 8 6 14
SS 1.48860 0.05109 1.53969
MS 0.18608 0.00852
F 21.85
P 0.001
107
Lampiran 10 Hasil lengkap analisis regresi komponen utama kadar kurkuminoid
Regression Analysis: HPLC versus Pc1- Pc20 (KURKUMINOID) The regression equation is HPLC = 0.892 + 0.0223 Pc1 - 0.189 Pc2 - 0.0165 Pc3 - 0.938 Pc4 - 0.275 Pc5 1.72 Pc6 - 3.87 Pc7 - 0.868 Pc8 - 7.61 Pc9 - 6.95 Pc10 + 4.94 Pc11 + 15.7 Pc12 + 7.43 Pc13 - 9.18 Pc14 + 11.6 pc15 + 8.32 pc16 + 3.33 pc17 + 14.9 pc18 - 3.76 pc19 - 22.9 pc20
Predictor Constant Pc1 Pc2 Pc3 Pc4 Pc5 Pc6 Pc7 Pc8 Pc9 Pc10 Pc11 Pc12 Pc13 Pc14 pc15 pc16 pc17 pc18 pc19 pc20
Coef 0.89200 0.022268 -0.18900 -0.01653 -0.9378 -0.2751 -1.7169 -3.8684 -0.8682 -7.609 -6.948 4.943 15.659 7.428 -9.181 11.600 8.325 3.333 14.861 -3.757 -22.904
S = 0.109252
SE Coef 0.01995 0.007559 0.02934 0.09174 0.2134 0.3201 0.5451 0.8031 0.9464 1.264 1.467 1.680 2.206 2.859 3.102 3.503 4.026 5.134 7.096 8.124 8.875
R-Sq = 96.7%
T 44.72 2.95 -6.44 -0.18 -4.39 -0.86 -3.15 -4.82 -0.92 -6.02 -4.74 2.94 7.10 2.60 -2.96 3.31 2.07 0.65 2.09 -0.46 -2.58
P 0.000 0.016 0.000 0.861 0.002 0.412 0.012 0.001 0.383 0.000 0.001 0.016 0.000 0.029 0.016 0.009 0.069 0.533 0.066 0.655 0.030
VIF 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
R-Sq(adj) = 89.4%
PRESS = 3.30071 Analysis of Variance Source Regression Residual Error Total
DF 20 9 29
SS 3.15606 0.10742 3.26348
MS 0.15780 0.01194
F 13.22
P 0.000