PENDEKATAN MODEL RATA-RATA SEBAGAI METODE ALTERNATIF DALAM PENANGANAN REGRESI BERDIMENSI TINGGI
NIDA ASHMA ADILAH
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Pendekatan Model Rata-Rata sebagai Metode Alternatif dalam Penanganan Regresi Berdimensi Tinggi adalah benar karya saya denganarahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Agustus 2015 Nida Ashma Adilah NIM G14110026
ABSTRAK NIDA ASHMA ADILAH. Pendekatan Model Rata-Rata sebagai Metode Alternatif dalam Penanganan Regresi Berdimensi Tinggi. Dibimbing oleh BAGUS SARTONO dan LA ODE ABDUL RAHMAN. Pendekatan model rata-rata mengatasi kekurangan pada regresi berdimensi tinngi dengan jumlah peubah penjelas (π) lebih banyak dari jumlah amatannya (π). Kondisi π < π memberikan pengaruh matriks rancangan peubah penjelas tidak mempunyai matriks kebalikan yang bersifat unik sehingga tidak dapat menggunakan metode kuadrat terkecil untuk pendugaan parameter regresi. Tujuan penelitian ini adalah menduga respon dengan merata-ratakan nilai dugaan respon setiap kelompok model yang terboboti. Data yang digunakan adalah data spektrum FTIR (Fourier Transform Infrared) serbuk tanaman obat yang memiliki komposisi utama berupa temulawak dan komposisi campuran berupa bangle dan kunyit. Penelitian ini hanya berfokus pada pendugaan persentase temulawak sajayang diperoleh dari pengukuran spektroskopi FTIR pada bilangan gelombang 4000-650 cm-1. Hasil penelitian menunjukkan bahwa pengelompokan peubah penjelas yang lbaik adalah kelompok dengan model yang lebih sedikit dengan peubah penjelas yang lebih banyak pada setiap kelompoknya. Pembobot model yang terbesar adalah model yang memiliki nilai korelasi antara nilai dugaan respon kelompokdanpeubah responnya terkuat. Kata kunci: data spektrum FTIR, pendekatan model rata-rata, regresi berdimensi tinggi
ABSTRACT NIDA ASHMA ADILAH. Model Averaging Approach as Alternative Method for High-Dimensional Regression. Supervised by BAGUS SARTONO and LA ODE ABDUL RAHMAN. Model averaging approach is used to overcome the problems of highdimensional regression, that is the number of predictors (π) more than the number of observations (π). The condition of π < π effects the design matrix has no unique general inverse matrix. So that least-square method can not be used. The purpose of this research is to estimate response value by averaging the response value of each model with their weights. The data that used in this research is FTIR (Fourier Transform Infrared) spectrum data of herb powder which contain ginger as primary composition and mixture compositions (bangle and turmeric). This study focuses on estimating the proportion of ginger from FTIR spectroscopic measurementbetween 4000-650 cm-1. The result showed that better grouping of predictors is a group with fewer models with more predictors in each model. The largest model weight is a model that has largest coefficient correlation between fitted value and its response. Keywords: FTIR spectrum data, high-dimensional regression, model averaging approach
PENDEKATANMODEL RATA-RATASEBAGAI METODE ALTERNATIF DALAM PENANGANAN REGRESI BERDIMENSI TINGGI
NIDA ASHMA ADILAH
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015
PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa taβala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Desember 2014 ini ialah Analisis Regresi, dengan judul Pendekatan Model Rata-Rata sebagai Metode Alternatif dalam Penanganan Regresi Berdimensi Tinggi. Terima kasih penulis ucapkan kepada Bapak Dr Bagus Sartono, MSi dan Bapak La Ode Abdul Rahman, MSi selaku pembimbing. Di samping itu, penghargaan penulis sampaikan kepada Bapak Rudi Heryanto, MSi selaku kepala laboratorium Pusat Studi Biofarmaka IPB, Bapak Dr Farit Mochamad Affendiselaku dosen Departemen Statistika yang telah membantu dalam mendesain penelitian. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, serta seluruh keluarga, atas segala doa dan kasih sayangnya. Semoga karya ilmiah ini bermanfaat.
Bogor, Agustus 2015 Nida Ashma Adilah
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
2
TINJAUAN PUSTAKA
2
Spektroskopi FTIR (Fourier Transform Infrared)
2
Pendekatan Model Rata-rata
3
Korelasi Marjinal (Marginal Correlation)
3
Pembobot Model
3
METODE
4
Data
4
Prosedur Analisis Data
4
HASIL DAN PEMBAHASAN
6
Eksplorasi Data
6
Korelasi Marjinal antara Nilai Absorban dan Persentase Temulawak
8
Penentuan Kandidat Model dan Optimasi Pembobot Model
9
Perbandingan Nilai Jumlah Kuadrat Sisaan SIMPULAN DAN SARAN
12 13
Simpulan
13
Saran
14
DAFTAR PUSTAKA
14
LAMPIRAN
15
RIWAYAT HIDUP
16
DAFTAR TABEL 1 2 3 4
Daerah identifikasi spektrum IR kurkuminoid Pembobot model dan nilai korelasi marjinal pengelompokan tipe 1 Pembobot model dan nilai korelasi marjinal pengelompokan tipe 2 Pembobot model dan nilai korelasi marjinal pengelompokan tipe 3
2 9 10 11
DAFTAR GAMBAR 1 Spektrum inframerah serbuk simplisia dengan temulawak 100% 2 Perbandingan spektrum FTIR serbuk simplisia temulawak, bangle, dan kunyit 3 Perbandingan spektrum inframerah temulawak 100% - 80% 4 Nilai korelasi antara nilai absorban dan persentase temulawak 5 Sebaran nilai korelasi antara nilai absorban dan persentase temulawak 6 Perbandingan nilai jumlah kuadrat sisaan untuk setiap tipe pengelompokan
6 7 7 8 8 12
DAFTAR LAMPIRAN 1 Kode dan komposisi sampel
15
1
PENDAHULUAN Latar Belakang Beberapa data hasil penelitian kimia sering kali menggunakan analisis statistika untuk mendeskripsikan suatu gugus fungsi, mengklasifikasi senyawa tertentu, mengetahui hubungan antara satu peubah dan peubah lainnya atau memprediksi suatu peubah menggunakan model yang terbangun dari peubahpeubah yang ada. Salah satu data yang memerlukan analisis statistika cukup intensif adalah data spektrum FTIR (Fourier Transform Infra Red) suatu serbuk simplisia yang digunakan untuk mengidentifikasi kandungan komposisi tanaman temulawak, kunyit, dan bangle. Data ini merupakan hasil percobaan Pusat Studi Biofarmaka LPPM IPB tahun 2015. Data sampel sebanyak 280 serbuk simplisia dengan kombinasi komposisi tanaman obat tertentu dianalisis menggunakan ATRFTIR (Attenuated Total Reflectance Fourier Transform Infra Red) sehingga diperoleh 1798 spektrum FTIR berupa nilai reflektan yang telah dikonversi menjadi nilai absorban untuk dicatat sebagai peubah penjelas dengan peubah respon persentase komposisi utama yaitu temulawak. Analisis statistika diperlukan untuk mengetahui persentase temulawak dalam serbuk simplisia berdasarkan spektrum FTIR. Dengan demikian diperlukan pendugaan hubungan antara spektrum FTIR dengan kandungan temulawak. Salah satu analisis statistika yang digunakan untuk mengetahui hubungan suatu peubah dengan peubah lainnya adalah analisis regresi (Draper &Smith 1992). Metode Kuadrat Terkecil adalah salah satu metode pendugaan parameter dalam pemodelan analisis regresi. Pendugaan parameter regresi diperoleh dengan menyelesaikan persamaan π½Μ = (πΏβ² πΏ)β1 πΏβ² π¦, dengan π½Μ sebagai vektor penduga parameter regresi, matriks πΏ adalah matriks rancangan peubah bebas, dan π¦ adalah vektor peubah respon. Salah satu syarat cukup dalam menggunakan metode ini adalah banyaknya amatan (n) harus lebih besar dari banyaknya peubah penjelas (p) agar matriks (πΏβ² πΏ) mempunyai matriks kebalikan. Sedangkan jika π β€ π maka akan menyebabkan matriks (πΏβ² πΏ) bersifat singular dan tidak memiliki matriks kebalikan (Notodiputro 2003). Artinya, terdapat kendala pendugaan parameter regresi menggunakan MKT pada data spektrum FTIR, yaitu adanya masalah pada tingginya dimensi peubah penjelas yang dilibatkan sedangkan jumlah amatannya sangat terbatas atau yang biasa disebut regresi berdimensi tinggi (high-dimensional regression). Oleh karena itu, diperlukan metode lain untuk mengatasi permasalahan regresi berdimensi tinggi. Regresi berdimensi tinggi merupakan kondisi dimana banyaknya peubah penjelas (p) lebih besar dari banyaknya amatan (n). Metode yang dapat dilakukan untuk analisis data berdimensi tinggi antara lain analisis komponen utama, partial-least square, Metode Lasso, Bayesian Lasso, least-angle regression, the smoothly clipped absolute deviation, dan pendekatan model rata-rata (Ando dan Li 2014). Pada penelitian ini diharapkan tetap menggunakan MKT pada pendugaan parameter regresi tetapi tetap dapat mengatasi kendala regresi berdimensi tinggi. Sehingga metode yang dapat diterapkan sebagai solusi alternatif adalah pendekatan model rata-rata. Pendekatan model rata-rata yaitu analisis regresi
2
dengan mengelompokkan peubah penjelas berdasarkan kriteria tertentu kemudian nilai dugaan respon dari model yang dibangun pada setiap kelompok dirataratakan dengan bobot tertentu. Kriteria pengelompokan yang digunakan adalah korelasi marjinal. Salah satu alasan penerapan metode ini adalah hasil simulasi menunjukkan bahwa metode ini memberikan hasil prediksi yang lebih valid dari metode lainnya seperti lasso, grup lasso, dan smoothly clipped absolute deviation (Ando dan Li 2014). Tujuan Penelitian Tujuan dari penelitian ini adalah menerapkan pendekatan model rata-rata dalam menangani masalah pendugaan respon pada regresi berdimensi tinggi (high-dimensional regression).
TINJAUAN PUSTAKA Spektroskopi FTIR (Fourier Transform Infrared) Spektroskopi FTIR adalah teknik pengukuran untuk mengumpulkan spektrum inframerah (IR). Spektrum IR suatu senyawa dapat menggambarkan struktur molekul senyawa tersebut dengan mengukur absorbsi radiasi, refleksi atau emisi di daerah IR. Spektroskopi IR dibagi menjadi tiga jenis radiasi yaitu inframerah dekat (bilangan gelombang 12800β4000 cm-1), inframerah tengah (bilangan gelombang 4000-200 cm-1), dan inframerah jauh (bilangan gelombang 200-10 cm-1). FTIR merupakan salah satu teknik spektroskopi inframerah pertengahan (Nur & Adijuwana 1989). Spektrum inframerah senyawa tumbuhan dapat diukur dalam bentuk cairan, bentuk gerusan dalam minyak nujol, dan bentuk padat yang dicampur dengan kalium bromide. Setiap senyawa akan menyerap berbagai frekuensi radiasi elektromagnetik dalam daerah spektrum inframerah. Setiap ikatan yang berbeda mempunya sifat frekuensi vibrasi yang berbeda pula. Tipe ikatan yang sama dalam dua senyawa yang berbeda dan terletak di lingkungan yang berbeda, maka molekul tersebut tidak akan mempunyai struktur serapan yang tepat sama. FTIR dapat digunakan untuk analisis kuantitatif yang menghubungkan konsentrasi dengan nilai absorban. Nilai absorban merupakan nilai yang diukur pada berbagai bilangan gelombang yang digunakan untuk menduga konsentrasi suatu senyawa. Tabel 1 Daerah identifikasi spektrum IR kurkuminoid No 1 2 3 4 5 6
Jenis Vibrasi Ikatana Hidrogen OH C-H alkana Karbonil Aromatik -C=C rentangan R - O-Ar Sidik Jari
Bilangan Gelombang (cm-1) 3600-3300 3000-2850 1820-1660 1660-1450 1300-1000 900-700
Intensitas sedang-kuat Kuat sangat kuat Kuat Sedang
3
Pendekatan Model Rata-Rata Pendekatan model rata-rata (model averaging approach) adalah suatu pendekatan untuk meningkatkan keakuratan pendugaan regresi klasik dengan membuat beberapa kelompok berbeda. Pada data berdimensi tinggi, model-model berbeda tersebut diperoleh dengan memodelkan π terhadap kelompok-kelompok peubah π dengan banyak peubah π di masing-masing kelompok lebih sedikit dari banyaknya amatan. Misalkan, peubah penjelas dikelompokkan menjadi M kelompok, yaitu π΄1 , π΄2 , β¦ π΄π dan dari setiap kelompok disusun model regresi linear ππ , π = 1,2, β¦ , π dengan π adalah banyaknya peubah penjelas pada setiap kelompok. Model hasil pengelompokan dapat dituliskan sebagai berikut: ππ βΆ π¦ = βπβπ΄π π½π π₯π + π, dengan π΄π adalah kelompok peubah penjelas, π₯π dan π¦ merupakan peubah penjelas dan peubah respon yang telah dibakukan. Kemudian dituliskan dengan notasi matriks π¦ = πΏπ π½π + πΊ, dengan πΏπ adalah matriks peubah penjelas pada kelompok ke-k, π½π adalah parameter regresi sebanyakπpada model ke-k dan πΊ merupakan vektor sisaan berdimensi π amatan. Koefisien regresi didapatkan menggunakan MKT: 2 π½Μπ = ππππππ βπ¦ β πΏπ π½π β sehingga didapatkan π½Μπ = (πΏβ²π πΏπ )β1 πΏβ²π π¦dan nilai dugaan respon kelompok keπadalah πΜ π = πΏπ π½Μπ , untuk π = 1, β¦ , π. Nilai dugaan respon akhir πΜ diduga dengan merata-ratakan nilai dugaan respon setiap kelompokdengan bobot tertentu. Korelasi Marjinal (Marginal Correlation) Korelasi marjinal (marginal correlation) merupakan nilai yang menjelaskan kekuatan hubungan antara peubah respon dan peubah penjelasnya. Asumsi matriks rancangan X telah dibakukan sehingga pada setiap kolom π adalah 2 (π β 1)β1 βπΏ(π) β = (π β 1)β1 πΏβ²(π) πΏ(π) = 1 dan vektor peubah respon yang 2
dibakukan pula (π β 1)β1 βπ¦β = (π β 1)β1 π¦ β² π¦ = 1, sehingga nilai korelasi marjinal dapat diduga dengan πΎΜ = (π β 1)β1 πΏβ² π¦. Pembobot Model Pembobot model merupakan bobot yang diberikan pada nilai dugaan respon setiap model. Pembobot model yang dipilih adalah pembobot yang dapat meminimumkan kriteria validasi silang. Validasi silang membagi data menjadi dua yaitu data latih dan data validasi. Data latih akan digunakan untuk membentuk suatu model, sedangkan data validasi akan digunakan untuk penentuan bobot dari respon pada model yang terbentuk sebelumnya dari data latih. Validasi silang lipat K yaitu salah satu metode validasi silang dengan membagi seluruh data secara acak ke dalam πΎ subcontoh. Salah satu subcontoh digunakan sebagai data validasi, sedangkan πΎ β 1 subcontoh digunakan sebagai data latih. Proses validasi silang dilakukan pada setiap kelompok peubah yang
4
sebelumnya terbentuk dan berulang sampai πΎ kali, dengan masing-masing K subcontoh digunakan satu kali sebagai validasi model. Misalkan, matriks Hat πΏπ (πΏβ²π πΏπ )β1 πΏπ dinotasikan sebagai π―π maka nilai dugaan respon akhir adalah sebagai berikut: π
πΜ =
π
π
β π€π πΜ π = β π€π πΏπ (πΏβ²π πΏπ )β1 πΏβ²π π¦ π=1 π=1
= β π€π π―π = π―(π€)π¦ π=1
π€π merupakan pembobot model yang diduga melalui proses validasi silang. Pembobot model yang dipilih adalah bobot yang meminimumkan kriteria validasi silang: π€ Μ = ππππππππππ πΆπ(π€) denganππ = {π€ β [0,1]π βΆ 0 β€ π€π β€ 1} dan βπ π=1 π€π = 1 (Ando dan Li 2014). Jumlah kuadrat sisaan dari nilai dugaan respon data validasi pada validasi silang lipat πΎ digunakan untuk membentuk kriteria validasi silang: β²
β²
πΆπ(π€) = (π¦ β πΜ ) (π¦ β πΜ ) = (π¦ β π―(π€)π¦) (π β π―(π€)π¦)
METODE Data Data yang digunakan dalam penelitian ini merupakan data hasil percobaan yang dilakukan oleh Pusat Studi Biofarmaka LPPM IPB yang bekerjasama dengan Depertemen Statistika IPB tahun 2015. Data sampel merupakan data spektrum FTIR persentase tanaman obat pada serbuk simplisia dengan berat empat gram yang mengandung dua komposisi yaitu komposisi utama dan kompisisi campuran. Komposisi utama berupa temulawak, sedangkan komposisi campuran terdiri dari kunyit dan bangle. Proses pengambilan data dimulai dengan penyiapan sampel dalam bentuk simplisia, kemudian pencampuran komposisi sampel. Penelitian ini hanya menduga kandungan temulawak pada serbuk simplisia tanaman obat yang dijadikan sebagai peubah respon. Jumlah sampel dalam penelitian ini sebanyak 280 dengan kombinasi persentase komposisi utama dan komposisi campuran ditunjukkan pada Lampiran 1. Kemudian dilanjutkan dengan analisis menggunakan ATR-FTIR sehingga diperoleh 1798 (p = 1798) spektrum FTIR berupa nilai absorban yang dicatat sebagai peubah penjelas pada bilangan gelombang 4000-650 cm-1. Prosedur Analisis Data Analisis dalam penelitian menggunakan Ms. Excel 2007 dan Minitab 16. Tahapan analisis yang dilakukan dalam penelitian ini adalah sebagai berikut: 1. Melakukan eksplorasi data 2. Menentukan kandidat model a. Menghitung korelasi marjinal antara peubah penjelas dan peubah respon
5
b. Mengurutkan peubah penjelas yang memiliki nilai korelasi terkuat hingga yang terlemah, kemudian lakukan pengelompokan berdasarkan nilai korelasi marjinalnya c. Pengelompokan dilakukan sebanyak tiga kali untuk melihat karakteristik setiap tipe pengelompokan: ο· Pengelompokan tipe 1 : Membentuk 9 model dengan masing-masing model mempunyai kurang lebih 200 peubah penjelas yaitu 7 model dengan 200 peubah penjelas dan 2 model dengan 199 peubah penjelas ο· Pengelompokan tipe 2 : Membentuk 10 model dengan masing-masing model mempunyai kurang lebih 180 peubah penjelas yaitu 8 model dengan 180 peubah penjelas dan 2 model dengan 179 peubah penjelas ο· Pengelompokan tipe 3 : Membentuk 12 model dengan masing-masing model mempunyai kurang lebih 150 peubah penjelas yaitu 10 model dengan 150 peubah penjelas dan 2 model dengan 149 peubah penjelas d. Berdasarkan hasil pengelompokan tersebut, didapatkan peubah penjelas yang lebih kecil dari amatannya (π < π), sehingga memungkinkan untuk melakukan pendugaan parameter regresi menggunakan MKT pada setiap kelompok dan didapatkan nilai dugaan responnya sebagai berikut: π
πΜ π = β π½Μπ.π π₯π.π π=1
keterangan: π : 1, 2, 3, β¦ , π π : 1, 2, 3, β¦ , π πΜ π : vektor nilai dugaan respon kelompok ke-π π½Μπ.π : dugaan parameter regresi ke-π pada kelompok ke-π π₯π.π ο·
: vektor peubah penjelas ke-π pada kelompok ke-π Pengelompokan tipe 1 : πΜ 1 = π½Μ1.1 π₯1.1 + π½Μ2.1 π₯2.1 + β― + π½Μ200.1 π₯200.1 πΜ 2 = π½Μ1.2 π₯1.2 + π½Μ2.2 π₯2.2 + β― + π½Μ200.2 π₯200.2 . . . πΜ 9 = π½Μ1.9 π₯1.9 + π½Μ2.9 π₯2.9 + β― + π½Μ199.9 π₯199.9
ο·
Pengelompokan tipe 2 : πΜ 1 = π½Μ1.1 π₯1.1 + π½Μ2.1 π₯2.1 + β― + π½Μ180.1 π₯180.1 πΜ 2 = π½Μ1.2 π₯1.2 + π½Μ2.2 π₯2.2 + β― + π½Μ180.2 π₯180.2
πΜ 10
. . . = π½Μ1.10 π₯1.10 + π½Μ2.10 π₯2.10 + β― + π½Μ179.10 π₯179.10
6
ο·
Pengelompokan tipe 3 : πΜ 1 = π½Μ1.1 π₯1.1 + π½Μ2.1 π₯2.1 + β― + π½Μ150.1 π₯150.1 πΜ 2 = π½Μ1.2 π₯1.2 + π½Μ2.2 π₯2.2 + β― + π½Μ150.2 π₯150.2
. . . πΜ 12 = π½Μ1.12 π₯1.12 + π½Μ2.12 π₯2.12 + β― + π½Μ149.12 π₯149.12 e. Menduga nilai dugaan respon akhir pada setiap kelompok ο· Pengelompokan tipe 1: πΜ = π€ Μ1 πΜ 1 + π€ Μ 2 πΜ 2 + β― + π€ Μ 9 πΜ 9 ο· Pengelompokan tipe 2: πΜ = π€ Μ1 πΜ 1 + π€ Μ 2 πΜ 2 + β― + π€ Μ10 πΜ 10 ο· Pengelompokan tipe 3: πΜ = π€ Μ1 πΜ 1 + π€ Μ 2 πΜ 2 + β― + π€ Μ12 πΜ 12 3. Mengoptimasi pembobot model (π€ Μ) a. Melakukan validasi silang lipat 10, sehingga diperoleh nilai dugaan respon yang merupakan data validasi {πΜ 1 , β¦ , πΜ π } untuk menduga pembobot model. b. Memilih dugaan pembobot model π€ Μ yang meminimumkan nilai kriteria πΆπ(π€).
HASIL DAN PEMBAHASAN Eksplorasi Data Teknik spektroskopi FTIR dapat menghasilkan spektrum FTIR dari suatu senyawa yang kompleks. Pola spektrum disusun oleh serapan vibrasi dari seluruh konsituen dalam senyawa. Spektrum FTIR dijadikan alat investigasi komposisi suatu sampel biologis. Gambar 1 merupakan plot antara nilai-nilai absorban dan bilangan gelombang 4000-650 cm-1 dari 10 sampel serbuk simplisia tanaman obat yang memiliki kandungan temulawak murni, sehingga dari plot tersebut dapat dilihat pola spektrumnya. 0,60 Sampel 1
Nilai Absorban
0,50
Sampel 2
0,40
Sampel 3
0,30
Sampel 4
0,20
Sampel 5
0,10
Sampel 6
-0,10
3999 3788 3578 3367 3157 2946 2735 2525 2314 2104 1893 1682 1472 1261 1051 840
0,00
Bilangan Gelombang
Sampel 7 Sampel 8
Gambar 1 Spektrum inframerah serbuk simplisia dengan temulawak 100%
7
Gambar 1 memperlihatkan pola yang sama untuk puncak atau lembah setiap spektrum pada selang bilangan gelombang tertentu. Puncak atau lembah yang cukup jelas adalah pada bilangan gelombang 3500-3200cm-1, 3000-2850cm-1, 1700-1550cm-1, dan 1130-930cm-1. Hal itu menunjukkan bahwa puncak atau lembah yang terbentuk merupakan daerah identifikasi yang terdapat ikatan-ikatan kimia yaitu ikatan hidrogen O-H, C-H alkana, aromatik βC=C, dan R-O-Ar. 0,6
Nilai Absorban
0,5 0,4 0,3
Temulawak
0,2
Bangle Kunyit
0,1
-0,1
3999 3788 3578 3367 3157 2946 2735 2525 2314 2104 1893 1682 1472 1261 1051 840
0
Bilangan Gelombang
Gambar 2 Perbandingan spektrum FTIR serbuk simplisia temulawak, bangle, dan kunyit Gambar 2 merupakan gambar sampel spektrum temulawak, bangle, dan kunyit murni. Jika gambar sampel spektrum tersebut dibandingkan, secara kasat mata dapat dilihat perbedaannya. Perbedaan spektrum tersebut adalah adanya pergeseran puncak atau lembah yang mengindikasikan bahwa adanya perbedaan ikatan kimia antara temulawak, bangle, dan kunyit. 0,6 T 100% 0,5
T 80% T 90%
Nilai Absorban
0,4
T 92% 0,3
T 93% T 94%
0,2
T 95% 0,1
T 96% T 97%
-0,1
3999 3822 3645 3468 3291 3114 2937 2760 2583 2406 2228 2051 1874 1697 1520 1343 1166 989 812
0
T 98% T 99%
Bilangan Gelombang
Gambar 3 Perbandingan spektrum inframerah temulawak 100% - 80% Persentase temulawak yang dominan pada serbuk simplisia akan memiliki pola spektrum yang sama dengan puncak atau lembah yang sama. Oleh karena adanya kemiripan setiap spektrum FTIR serbuk simplisia dengan persentase
8
temulawak yang dominan, maka dilakukan analisis regresi untuk mengetahui persentase temulawak melalui nilai absorban dari spektrum tersebut. Korelasi Marjinal antara Nilai Absorban dan Persentase Temulawak
1 0,8 0,6 0,4 0,2 0 -0,2 -0,4 -0,6 -0,8 -1
x1798 x1719 x1640 x1561 x1482 x1403 x1324 x1245 x1166 x1087 x1008 x929 x850 x771 x692 x613 x534 x455 x376 x297 x218 x139 x60
Nilai Korelasi
Analisis korelasi antara persentase temulawak dan nilai absorban pada bilangan gelombang 4000-650 cm-1 sebagai peubah respon dan peubah penjelas dilakukan untuk mengelompokkan peubah penjelas.
Peubah Penjelas
Gambar 4 Nilai korelasi antara nilai absorban dan persentase temulawak Nilai korelasi antara nilai absorban dan persentase temulawak sebagian besar kuat seperti ditunjukkan pada Gambar 4, namun pada rentang bilangan gelombang ke-550 hingga ke-570 (x550-x570) dan bilangan gelombang ke-1308 hingga ke-1518 (x1308-x1518) mempunyai nilai korelasi yang rendah sehingga mengindikasikan bahwa nilai absorban pada rentang bilangan gelombong tersebut tidak memberikan pengaruh nyata terhadap perbedaan persentase temulawak.
Gambar 5 Sebaran nilai korelasi antara nilai absorban dan persentase temulawak Seperti ditunjukkan Gambar 5, sebaran nilai korelasi menunjukkan jumlah peubah penjelas dengan korelasi kuat lebih banyak dibandingkan dengan peubah penjelas yang memiliki korelasi lemah, sehingga dalam penelitian ini seluruh peubah penjelas akan digunakan untuk menduga persentase temulawak tanpa menyisihkan peubah-peubah penjelas yang memiliki korelasi lemah.
9
Penentuan Kandidat Model dan Optimasi Pembobot Model Penentuan kandidat model dilakukan dengan melakukan pengelompokan peubah penjelas yang sebelumnya telah dibakukan dan diurutkan berdasarkan nilai korelasi marjinal yang terkuat hingga terlemah. Pengelompokan diulang sebanyak 3 kali untuk mengetahui tipe pengelompokan yang paling baik. Pengelompokan Tipe 1 Pengelompokan tipe 1 yaitu pengelompokan peubah penjelas dengan membentuk 9 model yang terdiri dari 200 peubah penjelas pada 7 model dan 199 peubah penjelas pada 2 model. Model-model pengelompokan tipe 1 adalah: πΜ 1 = πΜ 2 = πΜ 3 = πΜ 4 = πΜ 5 = πΜ 6 = πΜ 7 = πΜ 8 = πΜ 9 =
2.200π₯1.1 0.187π₯1.2 β0.37π₯1.3 1.173π₯1.4 β0.03π₯1.5 0.174π₯1.6 0.478π₯1.7 0.371π₯1.8 0.793π₯1.9
+ + β + + + + β β
0.600π₯2.1 0.078π₯2.2 0.171π₯2.3 0.230π₯2.4 0.474π₯2.5 0.044π₯2.6 0.062π₯2.7 0.314π₯2.8 0.402π₯2.9
+ + + + + + + + +
β¦ β¦ β¦ β¦ β¦ β¦ β¦ β¦ β¦
+ + β β β + β + +
0.143π₯200.1 0.039π₯200.2 0.388π₯200.3 0.109π₯200.4 0.013π₯200.5 0.021π₯200.6 0.709π₯200.7 0.382π₯199.8 0.176π₯199.9
Pembobot model diduga dengan meminimumkan JKS (jumlah kuadrat sisaan) dan nilai JKS paling minimum yang didapatkan adalah 0.2114. Tabel 2 merupakan tabel pembobot model dan nilai korelasi marjinal antara nilai dugaan respon dan peubah respon pada setiap model. Tabel 2 Pembobot model dan nilai korelasi marjinal pengelompokan tipe 1 Model Ke-
Pembobot Model
Nilai Korelasi (πΜ π , π¦)
1 2 3 4 5 6 7 8 9
0.2149 0.2114 0.0518 0.0791 0.1230 0.1467 0.0708 0.1022 0.0000
0.9991 0.9988 0.9989 0.9981 0.9986 0.9987 0.9983 0.9980 0.9967
Tabel 2 menjelaskan bahwa nilai korelasi tertinggi terdapat pada model 1 sebesar 0.9991 dengan pembobot model sebesar 0.21492. Setelah dilakukan pembobotan model, maka nilai dugaan respon akhirnya didapatkan sebagai berikut:
10
β0.290 β0.240 β0.235 β0.265 β0.279 β0.308 β0.238 β0.256 . . . . πΜ = 0.215 + 0.211 + β―+ 0 = . . . . . . . . [ 0.485 ] [ 0.601 ] [ 0.517 ] [ 0.538 ] Hasil perhitungan nilai korelasi antara nilai dugaan respon akhir dan peubah responnya sebesar 0.9996, artinya nilai korelasi setelah diboboti lebih besar dari nilai korelasi model pertama. Pengelompokan Tipe 2 Pengelompokan tipe 2 yaitu pengelompokan peubah penjelas dengan 180 peubah penjelas pada 8 model dan 179 peubah penjelas pada 2 model terahir. Model-model yang terbangun pada pengelompokan tipe 2 sebagai berikut: πΜ 1 = πΜ 2 = πΜ 3 = πΜ 4 = πΜ 5 = πΜ 6 = πΜ 7 = πΜ 8 = πΜ 9 = πΜ 10 =
7.710π₯1.1 β β2.12π₯1.2 β 0.425π₯1.3 β β0.60π₯1.4 β β0.16π₯1.5 β 0.658π₯1.6 β β0.03π₯1.7 β β2.97π₯1.8 β β0.51π₯1.9 β 0.347π₯1.10 β
6.690π₯2.1 + 0.393π₯2.2 + 0.370π₯2.3 + 0.230π₯2.4 + 0.474π₯2.5 + 0.214π₯2.6 + 1.139π₯2.7 + 0.042π₯2.8 + 0.205π₯2.9 + 0.147π₯2.10 +
β¦ β¦ β¦ β¦ β¦ β¦ β¦ β¦ β¦ β¦
+ β + β + + β + β β
0.010π₯180.1 0.288π₯180.2 0.105π₯180.3 0.230π₯180.4 0.014π₯180.5 0.129π₯180.6 0.111π₯180.7 0.279π₯180.8 0.075π₯179.9 0.826π₯179.10
Penentuan pembobot model juga dilakukan dengan meminimumkan JKS. Namun pada pengelompokan tipe 2 ini nilai JKS paling minimum adalah 0.265. Tabel 3 Pembobot model dan nilai korelasi marjinal pengelompokan tipe 2 Model ke-
Pembobot Model
Nilai Korelasi (πΜ π , π¦)
1 2 3 4 5 6 7 8 9 10
0.226 0.152 0.133 0.120 0.000 0.175 0.055 0.119 0.014 0.006
0.999 0.998 0.999 0.998 0.997 0.998 0.998 0.998 0.997 0.995
Tabel 3 menunjukkan tabel perbandingan pembobot model dan nilai korelasi peubah respon terhadap nilai dugaan respon setiap kelompoknya.Nilai korelasi tertinggi terdapat pada model 1 sebesar 0.9990 dengan pembobot model sebesar 0.2559.
11
β0.263 β0.292 β0.239 β0.225 β0.288 β0.378 β0.267 β0.264 . . . . π Μ = 0.226 + 0.152 + β― + 0.006 = . . . . . . . . [ 0.470 ] [ 0.627 ] [ 0.518 ] [ 0.570 ] Berdasarkan hasil perhitungan tersebut, nilai korelasi antara nilai dugaan respon akhir dan peubah respon adalah 0.9995. Nilai tersebut lebih besar dari nilai korelasi kelompok yang membangun model pertama. Pengelompokan Tipe 3 Pengelompokan tipe 3 yaitu pengelompokan peubah penjelas yang terdiri dari 150 peubah penjelas pada 10 model dan 149 peubah penjelas pada 2 model: πΜ 1 = πΜ 2 = πΜ 3 = πΜ 4 = πΜ 5 = πΜ 6 = πΜ 7 = πΜ 8 = πΜ 9 = πΜ 10 = πΜ 11 = πΜ 12 =
14.30π₯1.1 β β1.70π₯1.2 β 0.205π₯1.3 + 0.604π₯1.4 β β0.40π₯1.5 + β0.06π₯1.6 + β0.22π₯1.7 β 0.065π₯1.8 β 0.027π₯1.9 β 0.027π₯1.10 β β0.62π₯1.11 β 0.104π₯1.12 β
11.05π₯2.1 + 3.281π₯2.2 + 0.251π₯2.3 + 1.472π₯2.4 + 0.911π₯2.5 + 0.249π₯2.6 + 0.214π₯2.7 + 0.046π₯2.8 + 0.086π₯2.9 + 0.071π₯2.10 + 0.043π₯2.11 + 0.345π₯2,12 +
β¦β β¦+ β¦+ β¦β β¦+ β¦+ β¦+ β¦β β¦β β¦β β¦β β¦β
0.403π₯150.1 0.023π₯150.2 1.954π₯150.3 0.433π₯150.4 0.027π₯150.5 0.175π₯150.6 0.007π₯150.7 0.244π₯150.8 0.012π₯150.9 0.244π₯150.10 0.058π₯149.11 1.365π₯149.12
Pembobot model pada pengelompokan tipe 3 yang dipilih adalah pembobot model yang paling meminimumkan nilai JKS. Nilai JKS paling minimum pada pengelompokan ini adalah 0.445. Tabel 4 Pembobot model dan nilai korelasi marjinal pengelompokan tipe 3 Model ke-
Pembobot Model
Nilai Korelasi(πΜ π , π¦)
1 2 3 4 5 6 7 8 9 10 11 12
0.338 0.153 0.022 0.093 0.038 0.000 0.181 0.092 0.018 0.064 0.000 0.000
0.999 0.998 0.998 0.998 0.997 0.996 0.998 0.997 0.996 0.996 0.996 0.994
12
Tabel 4 menunjukkan pembobot-pembobot model yang didapatkan untuk setiap kelompok model. Nilai korelasi tertinggi terdapat pada model 1 sebesar 0.9990 dengan pembobot model sebesar 0.338. Pembobot-pembobot tersebut digunakan untuk memboboti nilai dugaan respon setiap kelompoknya, sehingga didapatkan nilai dugaan respon akhirnya sebagai berikut: β0.246 β0.317 β0.290 β0.274 β0.298 β0.275 β0.388 β0.251 . . . . πΜ = 0.338 + 0.153 + β―+ 0 = . . . . . . . . [ 0.491 ] [ 0.596 ] [ 0.618 ] [ 0.525 ] Hasil perhitungan nilai korelasi marjinal antara nilai dugaan respon akhir dan peubah respon sebesar 0.9992 lebih besar dari nilai korelasi kelompok peubah penjelas yang membangun model pertama. Perbandingan Nilai Jumlah Kuadrat Sisaan Berdasarkan perbandingan nilai korelasi antara nilai dugaan respon akhir dan peubah respon π¦ pada setiap tipe pengelompokan menunjukkan bahwa pendekatan model rata-rata efisien untuk diterapkan karena nilai korelasinya lebih besar dari nilai korelasi antara nilai dugaan respon pada masing-masing model dan peubah respon. Sedangkan untuk melihat tipe pengelompokan yang paling baik, dapat dilakukan dengan melihat perbandingan nilai jumlah kuadrat sisaan yang juga dijadikan sebagai kriteria validasi silang. 0,5000 0,4500 0,4000 0,3500 0,3000 0,2500 0,2000 0,1500 0,1000 0,0500 0,0000
0,4457
0,2658 0,2110
Tipe 1
Tipe 2
Tipe 3
Jumlah Kuadrat Sisaan
Gambar 6 Perbandingan nilai jumlah kuadrat sisaan untuk setiap tipe pengelompokan Gambar 6 memperlihatkan bahwa pengelompokan tipe 1 menghasilkan nilai sisaan paling kecil yaitu 0.211. Artinya, pendekatan model rata-rata lebih baik diterapkan dengan mengelompokkan peubah penjelas dengan model yang lebih sedikit yang banyaknya peubah penjelas masing-masing kelompoknya lebih banyak.
13
Ilustrasi Penerapan Pendekatan Model Rata-Rata Berdasarkan model dan pembobot model yang didapatkan dari hasil perhitungan, maka pada penelitian ini dapat dilakukan pendugaan persentase komposisi temulawak suatu serbuk simplisia tanaman obat. Suatu serbuk simplisia tanaman obat dengan komposisi temulawak yang sudah diketahui sebelumnya yaitu 88% diukur dengan ATR-FTIR, pengukuran tersebut menghasilkan 1798 nilai absorban pada bilangan gelombang 4000-650 cm-1. Nilai-nilai tersebut dikelompokkan sesuai dengan salah satu tipe pengelompokan, misalnya pengelompokan tipe 1. Nilai dugaan respon setiap kelompoknya diduga dengan menerapkan model-model pada pengelompokan tipe 1. Tabel 5 Ilustrasi perhitungan nilai dugaan respon akhir Model ke-k 1 2 3 4 5 6 7 8 9
πΜ π 0.8702 0.8705 0.8708 0.8702 0.8696 0.8697 0.8706 0.8699 0.8699 πΜ
π€π 0.2149 0.2114 0.0518 0.0791 0.1230 0.1467 0.0708 0.1022 0.0000
πΜ π Γ π€π 0.1870 0.1840 0.0451 0.0687 0.1069 0.1276 0.0616 0.0889 0.000 0.8701
Tabel 5 menujukkan hasil perhitungan nilai dugaan persentase komposisi temulawak yaitu sebesar 0.8701 atau 87.01% dan memiliki selisih 0.0099 atau 0.99% dengan persentase komposisi temulawak sesungguhnya. Sehingga dapat dinyatakan bahwa pendekatan model rata-rata ini tepat digunakan.
SIMPULAN DAN SARAN Simpulan Nilai absorban pada bilangan gelombang 3500-3200 cm-1, 3000-2850 cm-1, 1700-1550 cm-1, dan 1130-930 cm-1 merupakan daerah identifikasi yang berpengaruh terhadap pendugaan persentase temulawak karena mencirikan kandungan ikatan-ikatan kimia tertentu. Penelitian ini menunjukkan bahwa pengelompokan yang paling baik adalah pengelompokan dengan model lebih sedikit dengan peubah penjelas lebih banyak. Nilai korelasi terbesar yaitu model 1 pada masing-masing kelompok sehingga diberikan pembobot model paling besar pula. Artinya, hasil pembobotan model menunjukkan bahwa semakin besar nilai korelasi maka semakin besar pula pembobot modelnya. Selain itu, nilai korelasi antara nilai dugaan respon akhir dan peubah respon lebih besar dari nilai korelasi antara nilai dugaan respon setiap kelompok dan peubah respon. Berdasarkan hal ini, pendekatan model rata-rata tepat dalam menangani regresi berdimensi tinggi.
14
Saran Penelitian ini hanya fokus dalam pendugaan persentase komposisi utama saja yaitu persentase temulawak. Penelitian selanjutnya dapat mengkaji kembali data ini untuk pendugaan persentase komposisi campuran yang terdiri dari persentase bangle dan kunyit. Selain itu, dalam mengelompokkan peubah penjelas sebaiknya tidak ditentukan secara subjektif. Namun sebaiknya menggunakan metode lain yang dapat meminimumkan resiko kesalahan.
DAFTAR PUSTAKA Ando T, Li KC. 2014. A Model-Averaging Approach for High-Dimensional Regression. Journal of the American Statistical Assosiation. 109(505): 254265. Draper N, Smith H. 1992. Analisis Regresi Terapan. Ed ke-2. Sumantri B, penerjemah. Jakarta (ID): Gramedia Pustaka Utama. Terjemahan dari: Applied Regression Analysis. Notodiputro KA. 2003. Pendekatan Statistika dalam Kalibrasi. Proseding Konferensi Statistika dan Matematika Masyarakat Islam Asia Tenggara Bandung. Nur MA, Adijuwana H. 1989. Teknik Spektroskopi dalam Analisis Biologi. Bogor: Institut Pertanian Bogor. Tibshirani R. 1996. Regression Shrinkage and Selection via the LASSO. Journal of the Royal Statistical Society Series B. 58(1): 267-288.
15
Lampiran 1 Kode dan komposisi sampel Kode TML KYT BGL 3.96.1 3.96.2 3.96.3 3.96.4 3.96.5 3.92.1 3.92.2 3.92.3 3.92.4 3.92.5 3.88.1 3.88.2 3.88.3 3.88.4 3.88.5 3.84.1 3.84.2 3.84.3 3.84.4 3.84.5 3.8.1 3.8.2 3.8.3 3.8.4 3.8.5 3.76.1 3.76.2 3.76.3 3.76.4
kunyit 0.00 100.00 0.00 0.00 0.25 0.50 0.75 1.00 0.00 0.50 1.00 1.50 2.00 0.00 0.75 1.50 2.25 3.00 0.00 1.00 2.00 3.00 4.00 0.00 1.25 2.50 3.75 5.00 0.00 1.50 3.00 4.50
komposisi (%) bangle Temulawak 0.00 100.00 0.00 0.00 100.00 0.00 1.00 99.00 0.75 99.00 0.50 99.00 0.25 99.00 0.00 99.00 2.00 98.00 1.50 98.00 1.00 98.00 0.50 98.00 0.00 98.00 3.00 97.00 2.25 97.00 1.50 97.00 0.75 97.00 0.00 97.00 4.00 96.00 3.00 96.00 2.00 96.00 1.00 96.00 0.00 96.00 5.00 95.00 3.75 95.00 2.50 95.00 1.25 95.00 0.00 95.00 6.00 94.00 4.50 94.00 3.00 94.00 1.50 94.00
Kode 3.76.5 3.72.1 3.72.2 3.72.3 3.72.4 3.72.5 3.68.1 3.68.2 3.68.3 3.68.4 3.68.5 3.64.1 3.64.2 3.64.3 3.64.4 3.64.5 3.6.1 3.6.2 3.6.3 3.6.4 3.6.5 3.4.1 3.4.2 3.4.3 3.4.4 3.4.5 3.2.1 3.2.2 3.2.3 3.2.4 3.2.5
kunyit 6.00 0.00 1.75 3.50 5.25 7.00 0.00 2.00 4.00 6.00 8.00 0.00 2.25 4.50 6.75 9.00 0.00 2.50 5.00 7.50 10.00 0.00 3.75 7.50 11.25 15.00 0.00 5.00 10.00 15.00 20.00
komposisi (%) bangle Temulawak 0.00 94.00 7.00 93.00 5.25 93.00 3.50 93.00 1.75 93.00 0.00 93.00 8.00 92.00 6.00 92.00 4.00 92.00 2.00 92.00 0.00 92.00 9.00 91.00 6.75 91.00 4.50 91.00 2.25 91.00 0.00 91.00 10.00 90.00 7.50 90.00 5.00 90.00 2.50 90.00 0.00 90.00 15.00 85.00 11.25 85.00 7.50 85.00 3.75 85.00 0.00 85.00 20.00 80.00 15.00 80.00 10.00 80.00 5.00 80.00 0.00 80.00
16
RIWAYAT HIDUP Penulis dilahirkan di Kendal pada tanggal 17 November1993 dari ayah Ruswito dan ibu Nur Alifah. Penulis adalah putri pertama dari tiga bersaudara. Tahun 2011 penulis lulus dari SMA Negeri 1 Kendal dan pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) melalui jalur undangan SNMPTN dan diterima di Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam. Selama mengikuti perkuliahan, penulis menjadi asisten praktikum Metode Statistika pada tahun ajaran 2014/2015, dan pengajar mata pelajaran matematika di suatu bimbingan belajar untuk kelas XI SMA. Penulis juga pernah aktif sebagai anggota Beta Club Himpunan Keprofesian Gamma Sigma Beta pada tahun 2013 dan menjadi bendahara Beta Club Himpunan Keprofesian Gamma Sigma Beta pada tahun 2014. Pada bulan Juni - Agustus 2014 penulis melaksankan Praktik Lapangan di Balai Besar Penelitian dan Pengem-bangan Bioteknologi dan Sumberdaya Genetik Pertanian (BB Biogen) dengan judul Pengaruh Varietas terhadap Pertumbuhan Tanaman Jewawut (Setaria Italic) dengan Analisis Rancangan Acak Lengkap. Penulis juga aktif mengikuti lomba non akademik seperti lomba kesenian. Beberapa prestasi yang diraih oleh penulis adalah Juara II akustik PORSTAT tahun 2013, Juara II Drama Musikal SPIRIT FMIPA tahun 2014, dan Juara I Akustik PORSTAT tahun 2014.