PENDEKATAN REGRESI KONTINUM DALAM MODEL KALIBRASI
SETIAWAN
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2007
PERNYATAAN MENGENAI DISERTASI DAN SUMBER INFORMASI Dengan ini saya menyatakan bahwa disertasi dengan judul Pendekatan Regresi Kontinum dalam Model Kalibrasi adalah karya saya sendiri dengan arahan komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir disertasi ini.
Bogor, Mei 2007
Setiawan NIM G161020021
ABSTRAK SETIAWAN. Pendekatan Regresi Kontinum dalam Model Kalibrasi. Dibimbing oleh KHAIRIL ANWAR NOTODIPUTRO, LATIFAH K. DARUSMAN, dan I GUSTI PUTU PURNABA. Pada pemodelan regresi ganda y(nx1) = X(nxp) β ( px1) + ε (nx1) permasalahan serius akan muncul jika di antara peubah bebas saling berkorelasi (dikenal sebagai masalah ill conditioned) dan banyaknya pengamatan jauh lebih kecil dari pada banyaknya peubah bebas ( n << p dan disebut masalah singularitas). Regresi kontinum (RK) merupakan pendekatan yang dapat digunakan untuk mengatasi masalah ill conditioned, tetapi bila n << p akan mengalami kendala komputasi, sehingga diperlukan metode prapemrosesan dalam bentuk pereduksian dimensi peubah bebas. Terdapat beberapa metode prapemrosesan di antaranya : analisis komponen utama, transformasi Fourier, dan transformasi wavelet. Dari hasil kajian empiris dan pustaka dapat ditunjukkan bahwa transformasi wavelet diskret (TWD) memberikan hasil pendugaan model regresi yang lebih baik dibandingkan dengan metode prapemrosesan yang lain. Pada penelitian ini akan dikaji kombinasi antara RK dengan TWD sebagai metode prapemrosesan untuk mengatasi masalah ill conditioned dan singularitas. Kajian dilakukan secara empiris maupun teoritis. Kedua masalah tersebut sering terjadi pada pemodelan kalibrasi peubah ganda. Salah satu penerapan kalibrasi di bidang kimia adalah pemodelan hubungan antara konsentrasi zat aktif yang diukur oleh High Performance Liquid Chromatography dengan absorbans spektrum Fourier Transform Infrared. Pola spektrum diharapkan dapat menduga nilai konsentrasi zat aktif. Eksplorasi terhadap tiga metode, yaitu : RK, regresi komponen utama (RKU), dan regresi kuadrat terkecil parsial (RKTP) yang dilakukan terhadap data simulasi pada berbagai struktur korelasi matriks peubah bebas menunjukkan bahwa RK mempunyai kinerja yang lebih unggul dibanding metode lainnya. Jika ketiga metode tersebut masing-masing dikombinasikan dengan TWD menunjukkan bahwa RK-TWD mempunyai ukuran kebaikan model yang lebih unggul dibandingkan dengan metode RKU-TWD maupun RKTP-TWD. Aplikasi pendekatan RK-TWD pada data konsentrasi senyawa gingerol dan senyawa kurkuminoid memberikan hasil root mean squares error of prediction (RMSEP) 0.0453 dan 0.0867. Nilai ini lebih kecil dibandingkan dengan hasil pendekatan RKU-TWD maupun RKTP-TWD.
ABSTRACT SETIAWAN. Continuum Regression approach in Calibration Model. Supervised by KHAIRIL ANWAR NOTODIPUTRO, LATIFAH K. DARUSMAN and I GUSTI PUTU PURNABA. Serious problems of multiple regression modeling, y(nx1) = X(nxp) β( px1) +ε (nx1) , will be occurred if independent variables are correlated (known as an ill conditioned problem) and the number of observations is much less than the number of independent variables ( n<< p, known as singularity problem). Continuum regression (CR) approach is useful to solve the ill conditioned problem; however, problem on computing will be encountered but if n is far less than p; therefore, the preprocessing method is needed in order to reduce the dimension of independent variables. There are some preprocessing methods such as principal component analysis, Fourier transformation and wavelet transformation. Empirical and literature studies have shown that the discrete wavelet transformation (DWT) has produced regression model with better goodness of fit compared to the other preprocessing methods. In this study, the combination of CR and DWT as a preprocessing method is applied to solve the problems. The study has been done both empirically and theoretically. These problems are often found on modeling of multivariate calibration. The application of calibration model on chemistry is on modeling of the relationship between concentration of active compound detected by High Performance Liquid Chromatography with spectrum absorbance determined by Fourier Transform Infrared. The concentration of active material could be estimated by the pattern of spectrum. The exploration of the three methods, i.e., CR, principal component regression (PCR), and partial least squares regression (PLSR) using simulated data of various correlation matrix structure of independent variables showed that CR gives a better performance compared with the other methods. If each the methods to be combined with DWT, CR-DWT indicates a better goodness of fit compared with PCR-DWT and PLSR-DWT methods. The application of CR-DWT approach to the concentration of gingerol and curcuminoide data produced root mean squares error of prediction (RMSEP) of 0.0453 and 0.0867. These figures are smaller than those of PCR-DWT and PLSRDWT approaches.
PENDEKATAN REGRESI KONTINUM DALAM MODEL KALIBRASI
SETIAWAN
Disertasi sebagai salah satu syarat untuk memperoleh gelar Doktor pada Departemen Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2007
Judul Disertasi
: Pendekatan Regresi Kontinum dalam Model Kalibrasi
Nama
: Setiawan
NIM
: G161020021
Disetujui : Komisi Pembimbing
Prof. Dr. Ir. Khairil Anwar Notodiputro, M.S. Ketua
Prof. Dr. Ir. Latifah K. Darusman, M.S. Anggota
Dr. Ir. I Gusti Putu Purnaba, DEA. Anggota
Diketahui : Ketua Program Studi Statistika
Dr. Ir. Aji Hamim Wigena, MSc. Tanggal Ujian : 15 Mei 2007
Dekan Sekolah Pascasarjana
Prof. Dr. Ir. Khairil Anwar Notodiputro, M.S. Tanggal lulus :
PRAKATA Puji syukur penulis panjatkan ke hadhirat Allah SWT atas segala rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil penulis selesaikan. Disertasi ini ditulis berdasarkan hasil penelitian dengan tema Pendekatan Regresi Kontinum dalam Model Kalibrasi. Penelitian ini merupakan bagian dari payung penelitian Hibah Pascasarjana 2003-2005 yang merupakan kerjasama antara Departemen Statistika dengan Pusat Studi Biofarmaka LPPM-IPB. Disertasi ini memuat tiga bab yang merupakan pengembangan dari naskah artikel yang diterbitkan dalam jurnal ilmiah. Bab 3 merupakan pengembangan dari tiga artikel, yaitu : (a) Regresi Kontinum sebagai Bentuk Umum dari Regresi Kuadrat Terkecil, Regresi Komponen Utama serta Regresi Kuadrat Terkecil Parsial, telah diterbitkan (Prosiding Seminar Nasional Statistika VII Jurusan Statistika FMIPA ITS Surabaya 26-11-2005); (b) Regresi Kontinum dengan prapemrosesan Transformasi Wavelet dalam Model Kalibrasi, telah diterbitkan (Prosiding Seminar Nasional FMIPA UNESA Surabaya 17-12-2005); serta (c) Regresi Kontinum dengan prapemrosesan Transformasi Wavelet Diskret, sedang menunggu penerbitan di Jurnal Ilmu Dasar. Bab 4 merupakan pengembangan dari artikel berjudul Sifat-sifat Statistik dari Regresi Kontinum, telah dipublikasikan (Makalah Seminar Nasional Matematika, Statistika dan Pendidikan Matematika Jurusan Matematika FMIPA UNPAD Bandung 22 April 2006). Bab 5 merupakan pengembangan dari dua artikel, yaitu : (a) Penerapan Regresi Kontinum pada Model Kalibrasi untuk Menentukan Kadar Senyawa Aktif pada Rimpang Jahe, telah diterbitkan (Prosiding Seminar Nasional Basic Science III FMIPAUNIBRAW, Malang 25-02-2006); serta (b) Pengembangan Model Kalibrasi untuk Menentukan Kadar Senyawa Aktif pada Rimpang Temulawak dengan Metode Regresi Kontinum Wavelet, sedang menunggu penerbitan di Jurnal Tropika (2007). Penulis menyadari bahwa karya ilmiah ini dapat
diselesaikan atas
pertolongan Allah SWT, melalui jasa baik dari berbagai pihak. Oleh karena itu, pada kesempatan ini penulis mengucapkan rasa terima kasih dengan penuh rasa hormat kepada Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, M.S. selaku ketua komisi pembimbing yang telah dengan tulus dan penuh kesabaran membimbing,
mengarahkan, serta memberikan motivasi. Kepada anggota komisi pembimbing : Ibu Prof. Dr. Ir. Latifah K. Darusman, M.S. dan Bapak Dr. Ir. I Gusti Putu Purnaba, DEA. penulis juga mengucapkan terima kasih atas saran dan masukannya. Penghargaan khusus kepada Bapak Bambang DH, Bapak Sugiyanta, Bapak I Wayan Reda Susila, Bapak Imam Munajat, Bapak Nur Iriawan, Bapak Daniel M Rosyid, Bapak Sony Sunaryo, Bapak Dwiatmono Agus Widodo, Ibu Budi Nurani, Ibu Atiek Iriany, Ibu Aniek Iriany serta seluruh teman seangkatan dan sejawat atas segala partisipasinya. Tak lupa ungkapan terima kasih yang tulus penulis sampaikan kepada orangtua dan adik-adik. Kepada istri penulis tercinta Nurul Nawarina, serta anak-anak tersayang : Yusron Hudan, Arsya Razak dan Aflah Hilmy penulis sampaikan terima kasih atas motivasi, dukungan, doa, ketabahan, kesabaran dan kasih sayangnya selama penulis menempuh studi. Semoga Allah SWT senantiasa memberikan taufiq, hidayah, dan inayahNya pada kita semua. Semoga karya ilmiah ini bermanfaat.
Bogor, Mei 2007
Setiawan
RIWAYAT HIDUP Penulis dilahirkan di Gresik, Jawa Timur pada tanggal 30 Oktober 1960 dari pasangan H. Matoha dan Mardliyah. Pendidikan Sarjana (S1) ditempuh di Departemen Statistika dan Komputasi Fakultas Pertanian IPB antara tahun 1979 sampai 1983. Pada tahun 1989 penulis diterima di Program Magister Sains (S2) Program Studi Statistika pada Program Pascasarjana Institut Pertanian Bogor dan menamatkannya tahun 1992. Pada tahun 2002 penulis mendapat kesempatan untuk mengikuti program Doktor (S3) pada Program Studi Statistika, Sekolah Pascasarjana Institut Pertanian Bogor, dengan beasiswa dari Due-Like ITS. Sejak tahun 1987 penulis bekerja sebagai dosen di Jurusan Statistika FMIPA-ITS. Pada tahun 1995-1997 penulis menjabat sebagai Ketua Program Studi Diploma III Statistika FMIPA ITS. Beberapa karya ilmiah yang telah penulis hasilkan dan dipublikasikan dalam seminar nasional maupun internasional, serta sebagian dipublikasikan dalam jurnal ilmiah nasional. Karya-karya ilmiah tersebut beberapa diantaranya merupakan bagian dari rangkaian penelitian
selama penulis menjalani
program Doktor.
Daftar karya ilmiah tersebut adalah : 1. Setiawan, Winahyu WS, Widodo DW. 1999. An Application of Supreme in Modelling Both of Number of Infant Mortality and Number of Marternal Mortality. Proceding International Conference on Mathematics and its Application. SEAMS GMU, Jogyakarta July 26-29, 1999.
2. Sunaryo S, Setiawan, Djuraidah A, Saefuddin A. 2003. Sejarah Perkembangan
Statistika
dan
Aplikasinya.
Forum
Statistika
dan
Komputasi, Vol 8 No.1, 2003.
3. Setiawan, Notodiputro KA. 2003. Pendekatan Bayes dengan Prior Normal dalam Kalibrasi. Prosiding Seminar Nasional Statistika VI. Jurusan Statistika FMIPA ITS, Surabaya tanggal 11 Oktober 2003. 4. Setiawan, Notodiputro KA. 2004. Model Linear dengan Koefisien Keragaman Konstan. Prosiding Pertemuan Ilmiah Nasional Basic Science I. UNIBRAW, Malang, 17 Januari 2004.
5. Setiawan, Notodiputro KA. 2005a.
Regresi Kontinum sebagai Bentuk
Umum dari RKT, RKU, serta RKTP.
Prosiding Seminar Nasional
Statistika VII. Jurusan Statistika FMIPA ITS, Surabaya tanggal
26
Nopember 2005. 6. Setiawan,
Notodiputro
KA.
2005b.
Regresi
Kontinum
dengan
prapemrosesan Transformasi Wavelet dalam Model Kalibrasi. Prosiding Seminar Nasional MIPA. FMIPA UNESA, Surabaya tanggal 17 Desember
2005. 7. Setiawan, Notodiputro KA. 2006a. Penerapan Regresi Kontinum pada Model Kalibrasi untuk Menentukan Kadar Senyawa Aktif pada Rimpang Jahe. Prosiding Seminar Nasional Basic Science III. FMIPA-UNIBRAW, Malang tanggal 25 Februari 2006. 8. Setiawan, Notodiputro KA. 2006b.
Sifat-sifat Statistik dari
Regresi
Kontinum. Makalah Seminar Nasional Matematika, Statistika dan Pendidikan Matematika. Jurusan Matematika FMIPA UNPAD. Bandung
22 April 2006. 9. Setiawan, Notodiputro KA. 2007a. Pengembangan Model Kalibrasi untuk Menentukan Kadar Senyawa Aktif pada Rimpang Temulawak dengan Metode Regresi Kontinum-Wavelet. Jurnal Tropika, siap terbit. 10. Setiawan,
Notodiputro
KA.
2007b.
Regresi
Kontinum
dengan
prapemrosesan Transformasi Wavelet Diskret. Jurnal Ilmu Dasar, siap terbit
DAFTAR ISI Halaman DAFTAR TABEL
. . . . .. . . . . . . . . . . . . . . . .
xii
DAFTAR GAMBAR
. . . . .. . . . . . . . . . . . . . . . .
xiii
DAFTAR LAMPIRAN
. . . . .. . . . . . . . . . . . . . . . .
xv
Latar Belakang
. . . . .. . . . . . . . . . . . . . . . .
1
Tujuan Penelitian
. . . . .. . . . . . . . . . . . . . . . .
8
Manfaat Penelitian
. . . . .. . . . . . . . . . . . . . . . .
9
. . . . .. . . . . . . . . . . . . . . . .
10
PENDAHULUAN
TINJAUAN PUSTAKA Temulawak dan Jahe
Spektroskopi Fourier Transform Infrared
. . . . .. . . . . . . . .
13
Kromatografi
. . . . .. . . . . . . . . . . . . . . . .
17
Model Kalibrasi
. . . . .. . . . . . . . . . . . . . . . .
18
Kondisi Terkini dari Pengembangan Model Kalibrasi . . . . . . . . .
19
Regresi Kontinum
. . . . .. . . . . . . . . . . . . . . . .
20
Transformasi Wavelet
. . . . .. . . . . . . . . . . . . . . . .
23
Validasi
. . . . .. . . . . . . . . . . . . . . . .
31
KINERJA DAN PERMASALAHAN REGRESI KONTINUM Abstrak
. . . . .. . . . . . . . . . . . . . . . .
34
Abstract
. . . . .. . . . . . . . . . . . . . . . .
34
Pendahuluan
. . . . .. . . . . . . . . . . . . . . . .
35
Metode
. . . . .. . . . . . . . . . . . . . . . .
35
Hasil dan Pembahasan
. . . . .. . . . . . . . . . . . . . . . .
37
Optimasi Fungsi Kriteria Umum dalam Regresi Kontinum . .
37
Kinerja Regresi Kontinum pada berbagai Struktur Korelasi Matriks Peubah Bebas pada Kasus n > p . . . . . .
41
Regresi Kontinum dengan prapemrosesan Transformasi Wavelet Diskret . . . . . . . . . . . . . . . . . . . . . .
48
. . . .. . . . . . . . . . . . . . . . .
52
Simpulan
x
SIFAT-SIFAT STATISTIK DARI REGRESI KONTINUM Abstrak
. . . . .. . . . . . . . . . . . . . . . .
54
Abstract
. . . . .. . . . . . . . . . . . . . . . .
54
Pendahuluan
. . . . .. . . . . . . . . . . . . . . . .
55
Metode
. . . . .. . . . . . . . . . . . . . . . .
55
Sifat-sifat Statistik dari Regresi Kontinum
. . . . . . . . . .
57
Hasil Simulasi
. . . . . . . . . . . . . . . . . . . . . 60
Simpulan
. . . . .. . . . . . . . . . . . . . . . .
62
PENERAPAN REGRESI KONTINUM PADA MODEL KALIBRASI UNTUK DATA KADAR SENYAWA AKTIF TEMULAWAK DAN JAHE Abstrak
. . . . .. . . . . . . . . . . . . . . . .
63
Abstract
. . . . .. . . . . . . . . . . . . . . . .
63
Pendahuluan
. . . . .. . . . . . . . . . . . . . . . .
64
. . . . .. . . . . . . . . . . . . . . . . . . . .
64
Metode
Hasil dan Pembahasan
. . . . .. . . . . . . . . . . . . . . . .
Model Kalibrasi Kadar Gingerol
68
. . . . .. . . . . . . . .
69
.. . . . . . . . .
75
Simpulan
. . . . .. . . . . . . . . . . . . . . . .
81
PEMBAHASAN UMUM
. . . . .. . . . . . . . . . . . . . . . .
82
SIMPULAN DAN SARAN
. . . . .. . . . . . . . . . . . . . . . .
85
DAFTAR PUSTAKA
. . . . .. . . . . . . . . . . . . . . . .
87
LAMPIRAN
. . . . .. . . . . . . . . . . . . . . . .
91
Model Kalibrasi Kadar Kurkuminoid
xi
DAFTAR TABEL Halaman 1 Grup frekuensi untuk beberapa senyawa organik . . . . . . . . . .
16
2 Daerah identifikasi spektrum infrared gingerol . . . . . . . . . . . . .
17
3 Daerah identifikasi spektrum infrared kurkuminoid
. . . . . . . . .
17
4 Ringkasan ukuran kebaikan model pada beberapa tingkat δ untuk data Naes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
5 Ringkasan ukuran kebaikan model pada beberapa tingkat δ untuk data simulasi pada berbagai tingkat koefisien korelasi antar peubah bebas. .
43
6
Ringkasan ukuran kebaikan model hasil pendugaan RK, RKTP, serta RKU dengan metode prapemrosesan TWD . . . . . . . . .
7 Ringkasan ukuran kebaikan model
. . . . . . . . . . . . . ......
51 60
8 Nilai dugaan y untuk data kelompok 1 . . . . . . . . . . . . . . . . . . 61 9 Hasil prediksi nilai y untuk data kelompok validasi
. . . . . . . . . . 61
10
Ringkasan ukuran kebaikan model kadar gingerol
. . . . . . . . . . 71
11
Kadar gingerol hasil pengamatan, hasil dugaan serta hasil prediksi . . . 73
12
Selang prediksi 95% kadar gingerol (y)
13
Ringkasan ukuran kebaikan model kadar kurkuminoid
14
Kadar kurkuminoid hasil dugaan serta hasil prediksi . . . . . . . . . . 79
15
Selang prediksi 95% kadar kurkuminoid (y)
. . . . . . . . . . . . . . 73 . . . . . . 77
. . . . . . . . . . . . 80
xii
DAFTAR GAMBAR Halaman 1 Struktur kurkuminoid dari temulawak . . . . . . . . . . . . . . . . . . 11 2 Struktur gingerol dari jahe
. . . . . . . . . . . . . . . . . . 13
3 Spektrum infrared asam etanoat
. . . . . . . . . . . . . . . . . . 14
4 Bentuk wavelet Haar
. . . . . . . . . . . . . . . . . . 23
5 Bentuk-bentuk keluarga wavelet Daubechies (D-2. D-3, D-4, D-5)
. . . 24
6 Diagram pencar antara y dengan yˆ pada beberapa tingkat δ untuk data Naes . . . . . . . . . . . . . . . . . . . . . . . . . . 42
7 Diagram pencar antara y dengan yˆ pada beberapa tingkat δ untuk data simulasi dengan koefisien korelasi 0.70 . . . . . . . . . . . . . . 43 8 Diagram pencar antara y dengan yˆ pada beberapa tingkat δ untuk data simulasi dengan koefisien korelasi 0.80 . . . . . . . . . . . . . . 44 9 Diagram pencar antara y dengan yˆ pada beberapa tingkat δ untuk data simulasi dengan koefisien korelasi 0.90 . . . . . . . . . . . . . . 44 10 Diagram pencar antara y dengan yˆ pada beberapa tingkat δ untuk data simulasi dengan koefisien korelasi 0.99 . . . . . . . . . . . . . . 45 11 Histogram RMSEP hasil pendugaan metode RK, RKTP serta RKU untuk data simulasi 1000 kali dengan tingkat koefisien korelasi 0.70 . . . . . . 46 12 Histogram RMSEP hasil pendugaan metode RK, RKTP serta RKU untuk data simulasi 1000 kali dengan tingkat koefisien korelasi 0.80 . . . . . . 47 13 Histogram RMSEP hasil pendugaan metode RK, RKTP serta RKU untuk data simulasi 1000 kali dengan tingkat koefisien korelasi 0.90 . . . . . . 47 14 Histogram RMSEP hasil pendugaan metode RK, RKTP serta RKU untuk data simulasi 1000 kali dengan tingkat koefisien korelasi 0.99 . . . . . . 48 15 Diagram pencar antara y dengan yˆ hasil pendugaan metode RK-TWD, RKU-TWD, RKTP-TWD untuk data simulasi n=20, p=128 . . 51 16 Diagram pencar antara y dengan yˆ hasil pendugaan metode RK-TWD, RKU-TWD, RKTP-TWD untuk data simulasi n=20, p=256 . . 51 17 Spektrum infrared gingerol untuk 20 contoh serbuk jahe pada 1866 titik . . . . .. . .. . . . . . . . . . . . . . . . . .
69
18 Spektrum infrared gingerol untuk 20 contoh serbuk jahe pada 1024 titik . . . . . . . . . . . . . . . . . . . . . . . .
69
2 , RMSEP model 19 Diagram pencar antara δ dengan R 2 , R predik
kadar gingerol
. . . . . . . . . . . . . . . . . . . . . . . . . . 71 xiii
20 Diagram pencar antara y dengan yˆ (δ =0.45) serta yˆ (δ =0.5) kadar gingerol . .
72
Diagram pencar antara y dengan y predik kadar gingerol . . . . . . . . . 74 21 Spektrum infrared kurkuminoid untuk 40 contoh serbuk temulawak pada 1866 titik . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 22 Spektrum infrared kurkuminoid untuk 40 contoh serbuk temulawak pada 1024 titik . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 2 23 Diagram pencar antara δ dengan R 2 , R predik , RMSEP model
kadar kurkuminoid
. . . . . . . . . . . . . . . . . . . . . . . . . .
77
24 Diagram pencar antara y dengan yˆ (δ =0.5) serta yˆ (δ =opt ) model kadar kurkuminoid . . . . . . . . . . . . . . . . . . . . . .
78
25 Diagram pencar antara y dengan y predik kadar kurkuminoid . . . . . .
80
xiv
DAFTAR LAMPIRAN Halaman
1 Tahapan simulasi data
. . . . . . . . . . . . . . . . . . 90
2 Pogram SAS untuk data simulasi dengan koefisien korelasi 0.70, 0.80, 0.90 dan 0.99 . . . . . . . . . . . . . . . . .
91
3 Program SAS untuk data simulasi n=20, p=128
. . . . . . . . . 92
4 Program SAS untuk data simulasi n=20, p=256
. . . . . . . . . 93
xv