REGRESI SPLINE BIRESPON UNTUK MEMODELKAN KADAR GULA DARAH PENDERITA DIABETES MELITUS 1 1
Dhina Oktaviana P, 2I Nyoman Budiantara
Mahasiswa Jurusan Statistika ITS Surabaya, 2Dosen Jurusan Statistika ITS Surabaya ABSTRAK
Dalam persoalan sehari-hari sering dijumpai model regresi yang memiliki respon lebih dari satu dan pola kurva regresi (hubungannya) tidak diketahui. Misalnya pada kasus penderita Diabetes Melitus (DM). DM adalah penyakit kronis yang telah menjadi penyebab kematian terbesar keempat di dunia (Tandra, 2009). Jenis DM yang paling banyak ditemukan di Indonesia adalah DM tipe 2 (Subekti, 2009), dimana pankreas masih bisa memproduksi insulin, tetapi kualitasnya buruk sehingga tidak dapat berfungsi dengan baik. Buruknya kualitas insulin, salah satunya diakibatkan oleh banyaknya kadar lemak (kolesterol dan trigliserida). Diagnosis DM dapat diketahui melalui pemeriksaan kadar gula darah (puasa dan 2 jam pasca puasa). Berdasarkan hal tersebut, maka pendekatan Spline Birespon dapat digunakan untuk memodelkan kadar gula darah (y) dan kadar lemak (t) penderita DM tipe 2. Penelitian ini bertujuan untuk mengkaji bentuk estimasi model Spline dalam regresi nonparametrik birespon dan menerapkannya pada data kadar gula darah penderita DM tipe 2 yang melakukan cek kesehatan di Laboratorium “X” Surabaya. Dari hasil pembahasan dan analisis dapat ditentukan bentuk estimasi model Spline dalam regresi nonparametrik birespon dan model terbaik yang menjelaskan hubungan antara kadar gula darah dengan kadar lemak penderita DM tipe 2. Berdasarkan nilai GCV minimum, 0,000000002, model Spline birespon terbaik adalah model spline linier dengan 1 titik knot. Dimana pola perubahan kadar gula darah puasa terjadi pada kadar kolesterol 188 mg/dl dan kadar trigliserida 361 mg/dl, sedangkan pola perubahan kadar gula darah 2 jam pasca puasa terjadi pada kadar kolesterol 125 mg/dl dan kadar trigliserida 350 mg/dl. Kata kunci : Regresi, Spline Birespon, Diabetes Melitus
1.
PENDAHULUAN Analisis regresi merupakan salah satu analisis dalam statistika yang digunakan untuk menyelidiki pola hubungan fungsional antara variabel respon dan variabel prediktor (mencari bentuk estimasi kurva regresi) (Budiantara, 2009). Pada umumnya terdapat dua pendekatan dalam mengestimasi kurva regresi, yaitu pendekatan parametrik dan nonparametrik (Budiantara, 2005). Dalam pendekatan parametrik terdapat asumsi yang sangat kuat dan kaku yaitu bentuk kurva regresi diketahui. Berbeda dengan pendekatan parametrik, dalam regresi nonparametrik bentuk kurva regresi tidak diketahui. Pendekatan regresi nonparametrik yang cukup populer adalah Spline. Diantara model-model regresi nonparametrik, Spline merupakan model regresi yang mempunyai interpretasi statistik dan visual sangat khusus dan sangat baik. Disamping itu, kelebihan Spline adalah cenderung mencari sendiri estimasi data kemanapun pola data tersebut bergerak. Pada umumnya Spline adalah suatu estimator yang diperoleh dengan meminimumkan Penalized Least Square (PLS). Namun penyelesaian optimasi ini secara matematika relatif sulit (Budiantara, 2007(a)). Untuk mengatasi hal ini maka digunakan optimasi Least Square (LS). Dengan pendekatan ini diharapkan diperoleh perhitungan matematik dan interpretasi statistik yang relatif mudah dan sederhana (Budiantara, 2007(a)). Penelitian dengan menggunakan Spline telah banyak dilakukan, namun penelitian yang menyangkut estimator model Spline dalam regresi nonparametrik birespon belum banyak dikembangkan. Dalam persoalan sehari-hari sering dijumpai model regresi yang memiliki respon lebih dari satu dan pola kurva regresinya tidak diketahui. Penelitian dengan menggunakan birespon pernah dilakukan oleh Wang, Guo dan Brown (2000), Ariyanto (2006) dan Semiati (2010). Wang, Guo dan Brown (2000) dan Ariyanto (2006) menggunakan smoothing Spline untuk memodelkan data hormon kortisol dan ACTH. Sedangkan Semiati (2010) dengan menggunakan Deret Fourier mengaplikasikannya pada data kadar gula darah penderita Diabetes Melitus (DM). DM adalah penyakit kronis yang paling sering ditemukan pada abad 21 dan telah menjadi penyebab kematian terbesar keempat di dunia. Tanda awal yang dapat diketahui bahwa seseorang menderita DM yaitu dilihat langsung dari efek peningkatan kadar gula darah. Klasifikasi atau jenis diabetes ada bermacam-macam, tetapi di Indonesia yang paling banyak ditemukan adalah DM tipe 2 (Subekti, 2009). Pada DM tipe 2, pankreas masih bisa memproduksi insulin, tetapi kualitasnya buruk sehingga tidak dapat berfungsi dengan baik. Kualitas insulin yang buruk ini salah satunya diakibatkan oleh kadar lemak. 1
Semakin banyak jaringan lemak, jaringan otot dan tubuh akan semakin resisten terhadap kerja insulin (Tandra, 2009). Berdasarkan uraian tersebut, peneliti ingin mengkaji bentuk estimasi model Spline dalam regresi nonparametrik birespon dan menerapkannya pada data kadar gula darah penderita DM tipe 2. 2. LANDASAN TEORI Dalam bab ini diuraikan beberapa tinjauan pustaka sebagai pendukung dalam penelitian ini. 2.1 Regresi Parametrik Regresi parametrik merupakan pendekatan model regresi yang digunakan apabila bentuk kurva regresi (pola hubungan variabel respon dan variabel prediktor) diketahui. Macam-macam model regresi parametrik antara lain adalah regresi parametrik linear, kuadrat, kubik, polinomial derajat k dan lain-lain (Budiantara, 2009). Model yang telah digunakan secara luas adalah model regresi polinomial. Secara umum model regresi polinomial derajat ke-k (Gujarati, 1992) diberikan sebagai berikut. yi = β0 + β1xi + β2xi2 + … + βkxik + εi, dimana yi adalah variabel respon, xi, xi2,…, xik adalah variabel prediktor, β1, β2, …, βk merupakan parameter yang tidak diketahui dan εi adalah error random yang independen berdistribusi N(0,σ2). 2.2 Regresi Nonparametrik Spline Regresi nonparametrik merupakan metode pendekatan regresi yang sesuai untuk pola data yang tidak diketahui bentuk kurva regresinya atau tidak terdapat informasi masa lalu yang lengkap tentang bentuk pola data (Eubank,1988). Menurut Eubank (1999) bentuk model regresi nonparametrik adalah sebagai berikut. yi = f(ti) + εi; i = 1, 2, …, n, (1) dengan yj adalah variabel respon sedangkan fungsi f merupakan kurva regresi yang tidak diketahui bentuknya, dan ti variabel prediktor, serta εi diasumsikan berdistribusi N(0,σ2). Pendekatan regresi nonparametrik memiliki fleksibilitas yang tinggi, karena data diharapkan mencari sendiri bentuk estimasi kurva regresinya tanpa dipengaruhi oleh faktor subyektifitas peneliti (Eubank, 1988). Spline merupakan fungsi potongan polinomial yang memiliki sifat tersegmen dan kontinu (spline polynomial truncated). Bentuk umum model Spline disajikan pada persamaan 2.2. , (2) dimana αi, i = 0, 1, …, p dan βj, j = 1, …, K merupakan parameter. Persamaan 2.2 merupakan Spline derajat p dengan K titik knot k1, k2, ..., kK. Titik knot merupakan titik perpaduan bersama dimana terdapat perubahan pola perilaku pada interval yang berbeda (Budiantara, 2007(b)). Regresi Spline adalah regresi dimana kurva regresinya berupa fungsi Spline. Secara umum model regresi nonparametrik Spline dapat ditulis sebagai berikut. ; i = 1, 2, …, n (3) dimana p adalah derajat polinomial dan K adalah banyaknya titik knot pada fungsi truncated, serta εi merupakan error random independen dengan mean nol dan varians σ2. 2.3 Pemilihan Titik Knot Optimal dan Model Terbaik Model Spline yang terbaik adalah model dengan titik knot yang optimal, dimana model ini merupakan model yang paling sesuai dengan data. Menurut Wahba (1990) dan Wang (1998), salah satu metode yang paling banyak dipakai dan disukai karena kelebihan yang dimilikinya adalah Generalized Cross Validation (GCV). Dibandingkan metode lain, misal Cross Validation (CV), metode GCV mempunyai sifat optimal asimtotik (Wahba, 1990). Titik knot yang optimal diperoleh dari nilai GCV yang paling minimum. Model terbaik dipilih berdasarkan nilai GCV yang paling minimum. Metode GCV secara umum didefinisikan sebagai berikut. (4) dengan:
;
;
adalah titik-titik knot dan N adalah jumlah observasi
2
2.5 Diabetes Melitus Diabetes Melitus (DM) atau yang biasa disebut kencing manis merupakan suatu keadaan yang ditandai oleh kadar gula darah yang melebihi nilai normal karena tubuh tidak lagi memiliki insulin atau insulin tidak dapat bekerja dengan baik (Tandra, 2009). DM adalah penyakit kronis yang paling sering ditemukan pada abad 21 dan telah menjadi penyebab kematian terbesar keempat di dunia. Setiap tahun ada 3,2 juta kematian yang disebabkan langsung oleh diabetes. Itu berarti ada 1 orang per 10 detik atau 6 orang per menit yang meninggal akibat penyakit yang berkaitan dengan diabetes (Tandra, 2009). Orang Asia, termasuk Indonesia adalah ras yang mudah terkena diabetes. Pada tahun 1995 Indonesia menempati urutan ketujuh sebagai negara dengan penderita diabetes terbanyak di dunia (4,5 juta orang). Sekarang angka ini meningkat sampai 8,4 juta dan diperkirakan pada 2025 akan menjadi 12,4 juta orang, atau urutan kelima terbanyak di dunia (Tandra, 2009). Tanda awal yang dapat diketahui bahwa seseorang menderita DM yaitu dilihat langsung dari efek peningkatan kadar gula darah. Diagnosa DM dapat ditegakkan jika hasil pemeriksaan gula darah puasa mencapai level 126 mg/dl atau bahkan lebih, dan pemeriksaan gula darah dua jam setelah puasa (minimal delapan jam) mencapai level 180 mg/dl (Khomsah, 2008). Klasifikasi atau jenis diabetes ada bermacammacam, tetapi di Indonesia yang paling banyak ditemukan adalah DM tipe 2 (Subekti, 2009). Jenis diabetes yang lain ialah diabetes tipe 1, diabetes kehamilan dan diabetes tipe lain. Pada DM tipe 2, pankreas masih bisa memproduksi insulin, tetapi kualitasnya buruk sehingga tidak dapat berfungsi dengan baik sebagai kunci untuk memasukkan gula ke dalam sel. Akibatnya, gula dalam darah meningkat. Buruknya kualitas insulin, salah satunya diakibatkan oleh banyaknya kadar lemak. Pada umumnya lemak dalam tubuh manusia terdiri dari kolesterol total, kolesterol LDL, kolesterol HDL dan trigliserida. 3.
METODOLOGI Data yang digunakan dalam penelitian ini adalah data sekunder yang diambil dari data kadar gula darah dan kadar lemak penderita DM tipe 2 yang melakukan cek kesehatan di Laboratorium “X” Surabaya pada bulan April 2011. Berdasarkan data tersebut, diketahui bahwa terdapat 91 orang yang melakukan tes kadar gula darah sekaligus lemak yang terdiagnosis menderita DM tipe 2. Variabel respon (y) yang digunakan adalah kadar gula darah puasa (y1) dan kadar gula darah dua jam pasca puasa (2jpp) (y2). Sedangkan variabel prediktor (t) yang digunakan adalah kadar kolesterol total (t1) dan kadar trigliserida (t2). Langkah-langkah yang dilakukan meliputi dua tahapan. Berikut penjelasan langkah-langkah analisis dalam penelitian ini. 1. Tahap pertama, digunakan untuk menjawab tujuan pertama. Berikut langkah-langkah yang dilakukan pada tahap ini. a. Membangun model regresi nonparametrik birespon b. Mendekati kurva regresi f(t) dan g(t) pada poin (a) dengan fungsi Spline truncated s(t) c. Membuat model regresi nonparametrik birespon dalam bentuk matriks d. Menentukan matrik bobot W (varian kovarian e. Menentukan estimator untuk parameter
dan
)
dengan menggunakan optimasi WLS.
f. Menyajikan estimasi 2. Tahap kedua, digunakan untuk menjawab tujuan kedua. Pada tahap ini digunakan software Minitab dan Matlab dengan langkah-langkah sebagai berikut. a. Membuat plot antar variabel b. Memodelkan data (tij, ) dan (tij, ) menggunakan Spline truncated birespon untuk berbagai nilai p dan K c. Menentukan matrik bobot W d. Menghitung estimator parameter
dengan menggunakan optimasi WLS
e. Memilih titik knot optimal berdasarkan GCV minimum f. Menentukan model Spline terbaik dengan menghitung nilai GCV minimum g. Membuat estimasi model regresi Spline birespon terbaik
3
4.
ANALISIS DATA DAN PEMBAHASAN Dalam bab ini akan disajikan hasil analisis dari tujuan penelitian, yaitu mengenai bentuk estimasi model Spline dalam regresi nonparametrik birespon dan aplikasinya pada data kadar gula darah penderita Diabetes Melitus (DM) tipe 2. 4.1 Estimasi Model Spline Dalam Regresi Nonparametrik Birespon Misalkan y adalah variabel respon dan t adalah variabel prediktor, maka hubungan variabel y dan t dalam regresi birespon dapat dinyatakan dalam bentuk umum sebagai berikut. y1j = f1(t1j) + g1(t2j)+ ε1j y2j = f2(t1j) + g2(t2j)+ ε2j Bentuk kurva regresi f1(t1j), g1(t2j), f2(t1j) dan g2(t2j) diasumsikan tidak diketahui. Error random ε1j dan ε2j saling berkorelasi. Dimana error random ε1j, j = 1, 2, …, n saling independen dengan mean nol dan variansi σ12, dan error random ε2j, j = 1, 2, …, n juga saling independen dengan mean nol dan variansi σ22. Berdasarkan persamaan 2., bentuk umum fungsi Spline truncated s(t) derajat p dengan K titik knot k1, k2, ..., kK dan dua prediktor diberikan sebagai berikut. (5) Secara umum model regresi nonparametrik Spline dengan derajat p dan K titik knot dapat ditulis sebagai berikut. ; i = 1, 2, …, n
(6)
Untuk memudahkan, fungsi Spline truncated s(t) yang digunakan diasumsikan berderajat 2 dengan 2 titik knot (kuadratik 2 knot), maka persamaan 5 menjadi sebagai berikut. ; untuk respon 1 ; untuk respon 2 Jika dalam model birespon kurva regresi f(t) didekati dengan fungsi Spline truncated kuadratik 2 knot, maka berdasarkan persamaan 6 modelnya menjadi sebagai berikut.
Berikut model regresi nonparametrik Spline birespon jika disajikan dalam bentuk matriks.
Dengan menguraikan fungsi s dan memisahkan antara parameter dengan variabel maka persamaan tersebut dalam bentuk matrik dapat ditulis sebagai berikut. (7)
4
dimana:
––
–––
–– ––
––
––
––
–––
dengan:
Sedangkan matrik O adalah matrik nx8 yang semua elemennya bernilai nol (0). Apabila ditentukan matrik W (varian kovarian dan ) adalah sebagai berikut
––
maka untuk memperoleh estimator
––
––
–– ––
––
––
–– ’
pada persamaan 7, dilakukan optimasi WLS yaitu dengan
menyelesaikan persamaan sebagai berikut. (8) Untuk menyelesaikan optimasi pada persamaan 8, maka dilakukan derivatif parsial. Dengan memisalkan fungsi
, maka
(9) Prosesnya selanjutnya adalah menurunkan persamaan 9 terhadap 5
dan dihasilkan
(10) Setelah diturunkan terhadap , hasil (10) disamakan dengan nol. (11) Berdasarkan persamaan (11), didapatkan estimator
sebagai berikut.
Sehingga bentuk estimasi model Spline dalam regresi nonparametrik birespon menjadi sebagai berikut. , maka diperoleh
Jika matrik titik knot, sedangkan
. Matrik H( ) merupakan fungsi dari
adalah titik-titik knot.
4.2 Model Kadar Gula Darah Penderita DM Tipe 2 Untuk menjawab tujuan kedua, yaitu memodelkan kadar gula darah penderita DM tipe 2 maka terlebih dahulu dilakukan analisis deskriptif setelah itu dilakukan pemodelan dengan menggunakan Spline birespon. 4.2.1 Analisis Deskriptif Sebelum memodelkan kadar gula darah penderita DM tipe 2 dengan Spline birespon, maka perlu dilihat deskripsi statistik untuk menggambarkan karakteristik data kadar gula darah dan lemak penderita DM tipe 2, sedangkan untuk melihat pola hubungan antar variabel dapat dilihat dari scatterplot. Tabel 1. Statistik Deskriptif Kadar Gula Darah dan Lemak Penderita DM Tipe 2 Variabel
Rata-Rata
Deviasi Standar
Minimum
Maksimum
Gula Darah Puasa
286,87
76,33
181
479
Gula Darah 2JPP
196,74
63,33
126
404
Kolesterol
213,37
42,30
115
336
Trigliserida
188,3
134,9
63
806
Berdasarkan Tabel 1 dapat diketahui bahwa penderita DM tipe 2 yang melakukan cek kesehatan di Laboratorium “X” Surabaya pada bulan April 2011 rata-rata memiliki gula darah puasa dan 2 jpp masingmasing adalah sebesar 196,74 mg/dl dan 286,87 mg/dl. Sedangkan kadar kolesterol rata-ratanya adalah sebesar 213,37 mg/dl dan kadar trigliserida rata-ratanya adalah sebesar 188,3 mg/dl. 500
400
450
Gula Darah 2JPP
Gula Darah Puasa
350 300 250 200
400 350 300 250
150 200
100 100
150
200
250
300
100
350
150
200
250
300
350
Kolesterol
Kolesterol
Gambar 2. Scatterplot of Gula Darah 2JPP vs Kolesterol
Gambar 1. Scatterplot of Gula Darah Puasa vs Kolesterol
6
Pola hubungan antara variabel gula darah puasa dan gula darah 2jpp dengan kolesterol masingmasing disajikan pada Gambar 1 dan Gambar 2. Berdasarkan kedua gambar tersebut dapat diketahui bahwa tidak terlihat pola hubungan antara variabel yang mengikuti pola tertentu. 500
400
450
Gula Darah 2JPP
Gula Darah Puasa
350 300 250 200
400 350 300 250
150 200 100 0
100
200
300
400 500 Trigliserida
600
700
800
900
0
Gambar 3. Scatterplot of Gula Darah Puasa vs Trigliserida
100
200
300
400 500 Trigliserida
600
700
800
900
Gambar 4. Scatterplot of Gula Darah 2JPP vs Trigliserida
Pada Gambar 3 dan Gambar 4 memperlihatkan pola hubungan antara variabel gula darah puasa dan gula darah 2jpp dengan trigliserida. Pola hubungan antara variabel tersebut tidak mengikuti pola tertentu. Berdasarkan Gambar 1, Gambar 2, Gambar 3 dan Gambar 4 pola data akan dimodelkan dengan menggunakan regresi nonparametrik birespon dengan pendekatan Spline truncated. Dari variabel-variabel tersebut dibuat model spline linier sampai spline kuadratik dengan 2 titik knot. Dari estimasi model yang diperoleh, dihitung nilai-nilai GCV-nya. Model Spline terbaik adalah Spline dengan GCV terkecil. Pemilihan titik knot pada model dilakukan dengan menggunakan program komputer, dimana titik knot optimal berkaitan dengan nilai GCV terkecil. 4.2.2 Model Spline Linier Birespon Kadar Gula Darah Penderita DM Tipe 2 Dengan Satu Titik Knot Pemilihan model birespon Spline linier terbaik diperoleh berdasarkan nilai GCV yang minimum. Beberapa titik knot dan nilai GCV model spline linier dari data kadar gula darah penderita DM tipe 2 dengan satu titik knot disajikan pada Tabel 4.2. Tabel 2. Titik Knot dan Nilai GCV untuk Spline Linier Satu Titik Knot Titik Knot Respon 1
Titik Knot Respon 2
Nilai GCV
190 190
137
170
139
0,000022108
160
146
134
0,000321746
188
361
125
350
0,000000002*
211
80
214
87
0,000016378
199
182
209
212
0,000000940
k1 adalah titik knot pada t1 (kadar kolesterol) untuk respon 1 (kadar gula darah puasa), k2 adalah titik knot pada t2 (kadar trigliserida) untuk respon 1 (kadar gula darah puasa), λ 1 adalah titik knot pada t1 (kadar kolesterol) untuk respon 2 (kadar gula darah 2 jam pasca puasa), sedangkan λ2 adalah titik knot pada t2 (kadar trigliserida) untuk respon 2 (kadar gula darah 2 jam pasca puasa). Berdasarkan Tabel 2 dapat diketahui bahwa model birespon Spline linier terbaik dengan satu titik knot adalah model dengan titik knot pada t1 = 188 dan t2 = 361 untuk respon 1 dan pada t1 =125 dan t2 = 350 untuk respon 2. Model ini mempunyai nilai GCV paling minimum diantara model birespon Spline linier satu knot yang lain, yaitu 0,000000002. Berikut disajikan bentuk persamaan dari estimasi model terbaik pada regresi Spline linier dengan satu titik knot.
7
4.2.3 Model Spline Kuadratik Birespon Kadar Gula Darah Penderita DM Tipe 2 Dengan Satu Titik Knot Seperti pada model Spline linier, pemilihan model Spline kuadratik terbaik diperoleh berdasarkan nilai GCV yang paling minimum. Tabel 3 menyajikan beberapa titik knot dan nilai GCV dari Spline kuadratik satu knot data kadar gula darah penderita DM tipe 2. Tabel 3. Titik Knot dan Nilai GCV untuk Spline Kuadratik Satu Titik Knot Titik Knot Respon 1
Titik Knot Respon 2
Nilai GCV
143 204
110
188
77
0,000234292
134
203
148
0,000001024*
247
224
255
197
0,000126514
281
765
324
568
0,004152838
187
135
188
127
0,000022965
Berdasarkan Tabel 3 dapat diketahui bahwa model birespon Spline kuadratik satu knot terbaik adalah model dengan nilai GCV sebesar 0,000001024. Model ini memiliki titik knot pada t1 = 204 dan t2 = 134 untuk respon 1 dan pada t1 = 203 dan t2 = 148 untuk respon 2. Berikut disajikan bentuk persamaan estimasi model terbaik pada regresi Spline kuadratik dengan satu titik knot.
4.2.4 Model Spline Kombinasi (Linier dan Kuadratik) Birespon Kadar Gula Darah Penderita DM Tipe 2 Dengan Satu Titik Knot Model Spline kombinasi merupakan model yang terbentuk dari kombinasi model linier (derajat 1) dan model kuadratik (derajat 2). Terdapat beberapa kombinasi antara model linier dan kuadratik dalam memodelkan kadar gula darah penderita DM tipe 2. Beberapa titik knot dan nilai GCV model Spline kombinasi data kadar gula darah penderita DM tipe 2 dengan satu titik knot disajikan pada Tabel 4. Tabel 4. Titik Knot dan Nilai GCV untuk Spline Kombinasi Satu Titik Knot Kombinasi Derajat
Titik Knot Respon 1
Titik Knot Respon 2
Nilai GCV
2111
281
182
250
87
0,000094856
1212
199
119
125
86
0,000431073
1221
235
110
282
110
0,000026815*
2121
197
137
190
212
0,009953104
2211
211
182
214
212
0,001023172
Berdasarkan Tabel 4 dapat diketahui bahwa model birespon Spline kombinasi terbaik dengan satu titik knot adalah model dengan titik knot pada t1 = 235 dan t2 = 110 untuk respon 1 dan pada t1 = 282 dan t2 = 110 untuk respon 2. Model ini mempunyai nilai GCV paling minimum diantara model birespon Spline kombinasi satu knot yang lain, yaitu 0,000026815. Berikut disajikan bentuk persamaan dari estimasi model terbaik pada regresi Spline kombinasi dengan satu titik knot.
4.2.5 Model Spline Linier Birespon Kadar Gula Darah Penderita DM Tipe 2 Dengan Dua Titik Knot Setelah dilakukan pemodelan dengan menggunakan satu titik knot, maka berikut disajikan pemodelan Spline linier dengan menggunakan dua titik knot. Beberapa titik knot dan nilai GCV model 8
Spline data kadar gula darah penderita DM tipe 2 dengan dua titik knot disajikan pada Tabel 5. k1 adalah titik knot 1 pada t1 untuk respon 1, k2 adalah titik knot 1 pada t2 untuk respon 1, k1* adalah titik knot 2 pada t1 untuk respon 1, k2* adalah titik knot 2 pada t2 untuk respon 1, λ1 adalah titik knot 1 pada t1 untuk respon 2, λ2 adalah titik knot 1 pada t2 untuk respon 2, λ1* adalah titik knot 2 pada t1 untuk respon 2, sedangkan λ2* adalah titik knot 2 pada t2 untuk respon 2. Tabel 5. Titik Knot dan Nilai GCV untuk Spline Linier Dua Titik Knot Titik Knot Respon 1
Titik Knot Respon 2
Nilai GCV
150 245
191
128
247
182
224
134
568
0,022564968
284
223
261
262
320
134
212
0,024490212
125
227
106
261
205
224
134
568
0,000001252
245
324
179
247
233
261
73
133
0,000131634
184
217
106
130
183
224
104
189
0,000000429*
Model birespon Spline linier terbaik dengan dua titik knot adalah model dengan nilai GCV sebesar 0,000000429. Model ini memiliki titik knot pada 184, 217, 106 dan 130 untuk respon 1 dan 183, 224, 104 dan 189 untuk respon 2. Berikut disajikan bentuk persamaan dari estimasi model terbaik pada regresi Spline linier dengan dua titik knot.
4.2.6 Model Spline Kuadratik Birespon Kadar Gula Darah Penderita DM Tipe 2 Dengan Dua Titik Knot Beberapa titik knot dan nilai GCV model Spline data kadar gula darah penderita DM tipe 2 dengan dua titik knot disajikan pada Tabel 6. Tabel 6. Titik Knot dan Nilai GCV untuk Spline Kuadratik Dua Titik Knot Titik Knot Respon 1
Titik Knot Respon 2
Nilai GCV
184 213
227
88
216
205
324
130
765
0,024027153
252
170
350
210
261
87
765
0,002313423*
213
247
96
129
207
233
104
261
3,327352379
284
324
104
247
262
299
133
226
0,682790329
184
217
135
216
183
324
104
135
1,370163325
Berdasarkan Tabel 6 dapat diketahui bahwa model birespon Spline kuadratik terbaik dengan dua titik knot adalah model dengan titik knot terletak pada 213, 252, 170 dan 350 untuk respon 1 dan terletak pada 210, 261, 87 dan 765 untuk respon 2. Model ini mempunyai nilai GCV paling minimum diantara model birespon Spline kuadratik dua knot yang lain, yaitu 0,002313423. Berikut disajikan bentuk persamaan dari estimasi model terbaik pada regresi Spline kuadratik dengan dua titik knot.
9
4.2.7 Model Spline Kombinasi (Linier dan Kuadratik) Birespon Kadar Gula Darah Penderita DM Tipe 2 Dengan Dua Titik Knot Model birespon Spline kombinasi dua knot terbaik adalah model dengan nilai GCV sebesar 0,000000068. Nilai tersebut merupakan nilai paling minimum diantara nilai GCV yang lain. Hal ini dapat dilihat pada Tabel 7 yang menyajikan beberapa titik knot dan nilai GCV model Spline kombinasi dua knot data kadar gula darah penderita DM tipe 2. Tabel 7. Titik Knot dan nilai GCV untuk Spline Kombinasi Dua Titik Knot Kombinasi Derajat
Titik Knot Respon 1
Titik Knot Respon 2
Nilai GCV
2112 1222
150
284
88
179
150
261
104
212
0,000082051
213
284
130
765
150
320
80
212
0,001637709
2122
213
247
130
179
207
320
87
130
0,000000068*
2212
245
247
129
170
207
320
87
212
0,000381901
2221
227
247
130
765
150
205
104
130
0,000245574
Berdasarkan Tabel 7 dapat diketahui bahwa model birespon Spline kombinasi terbaik dengan dua titik knot adalah model dengan titik knot terletak pada 213, 247, 130 dan 179 untuk respon 1 dan terletak pada 207, 320, 87 dan 130 untuk respon 2. Berikut disajikan bentuk persamaan dari model terbaik pada regresi Spline kombinasi dengan dua titik knot.
4.2.8 Model Birespon Kadar Gula Darah Penderita DM Tipe 2 Spline Optimal Setelah mendapatkan model Spline dalam regresi nonparametrik birespon menggunakan bentuk linier, kuadratik dan kombinasi dengan titik knot yang berbeda-beda, maka tahap selanjutnya adalah memilih model Spline birespon terbaik berdasarkan nilai GCV paling minimum. Berikut ditampilkan nilai GCV pada semua model terbaik. Tabel 8. Nilai GCV Pada Masing Masing Model Spline Birespon Model Spline Nilai GCV
Linier 1 titik knot* 0,000000002
Kuadratik 1 titik knot 0,000001024
Kombinasi 1 titik knot 0,000026815
Linier 2 titik knot 0,000000429
Kuadratik 2 Kombinasi titik knot 2 titik knot 0,002313423 0,000000068
Berdasarkan Tabel 8 dapat diketahui bahwa nilai GCV paling minimum adalah sebesar 0,000000002. Sehingga model terbaik yang menjelaskan kadar gula darah penderita DM tipe 2 adalah model Spline linier dengan satu titik knot dengan bentuk model sebagai berikut.
Nilai MSE yang dihasilkan dari model optimal tersebut adalah sebesar 5,9x10-9. Untuk memudahkan intepretasi model regresi nonparametrik birespon kadar gula darah penderita DM tipe 2, maka dibuat model parsial dari model optimal yang telah terbentuk. 1. Dengan asumsi kadar trigliserida tetap Ketika kadar kolesterol kurang dari 188 mg/dl dan lebih dari 115 mg/dl, maka kadar gula darah puasa penderita DM tipe 2 mengikuti model -3,48701t1. Sedangkan jika kadar kolesterol 188 mg/dl atau lebih, tetapi tidak melebihi 336 mg/dl, maka kadar gula darah puasa mengikuti model 444,61624 -5,85199t1. Berikut model parsial untuk respon 1 (kadar gula darah puasa) dengan mengasumsikan kadar trigliserida tetap. 10
yˆ1
3,48701t1
; t1 188
444,61624 5,85199t1 ; t1 188
Intepretasi yang dapat diperoleh berdasarkan model tersebut adalah pada kadar kolesterol kurang dari 188 mg/dl dan lebih dari 115 mg/dl, jika kadar kolesterol meningkat sebesar satu mg/dl, maka kadar gula darah puasa penderita DM tipe 2 akan cenderung berkurang sebesar 3,48701. Pada kadar kolesterol 188 mg/dl atau lebih, tetapi tidak melebihi 336 mg/dl, jika kadar kolesterol meningkat sebesar satu mg/dl, maka kadar gula darah puasa penderita DM tipe 2 akan cenderung berkurang sebesar 5,85199 mg/dl. Untuk respon 2 (kadar gula darah 2 jam pp), ketika kadar kolesterol kurang dari 125 mg/dl dan lebih dari 115 mg/dl, maka kadar gula darah 2 jam pp penderita DM tipe 2 mengikuti model – 0,07187t1. Sedangkan jika kadar kolesterol 125 mg/dl atau lebih, tetapi tidak melebihi 336 mg/dl, maka kadar gula darah 2 jam pp mengikuti model – 456,67375 + 3,58152t1. Berikut model parsial yang dihasilkan.
yˆ 2
0,07187t1
; t1 125
– 456,67375+ 3,58152t1 ; t1 125
Intepretasi yang dapat diperoleh adalah pada kadar kolesterol kurang dari 125 mg/dl dan lebih dari 115 mg/dl, jika kadar kolesterol meningkat sebesar satu mg/dl, maka kadar gula darah 2 jam pp penderita DM tipe 2 akan cenderung berkurang sebesar 0,07187. Pada kadar kolesterol 125 mg/dl atau lebih, tetapi tidak melebihi 336 mg/dl, jika kadar kolesterol meningkat sebesar satu mg/dl, maka kadar gula darah 2 jam pp penderita DM tipe 2 akan cenderung meningkat pula sebesar 3,58152 mg/dl. 2. Dengan asumsi kadar kolesterol tetap Ketika kadar trigliserida kurang dari 361 mg/dl dan lebih dari 63 mg/dl, maka kadar gula darah puasa penderita DM tipe 2 mengikuti model 1,83572t2. Sedangkan jika kadar trigliserida 361 mg/dl atau lebih, tetapi tidak melebihi 806 mg/dl, maka kadar gula darah puasa mengikuti model 23.053,6296 – 62,02475t2. Berikut model parsial untuk respon 1 (kadar gula darah puasa) dengan mengasumsikan kadar kolesterol tetap.
yˆ1
1,83572t 2
;t2
361
23.053,6296 – 62,02475t 2 ; t 2
361
Pada kadar trigliserida kurang dari 361 mg/dl dan lebih dari 63 mg/dl, jika kadar trigliserida meningkat sebesar satu mg/dl, maka kadar gula darah puasa penderita DM tipe 2 akan cenderung meningkat pula sebesar 1,83572. Pada kadar trigliserida 361 mg/dl atau lebih, jika kadar trigliserida meningkat sebesar satu mg/dl, tetapi tidak melebihi 806 mg/dl, maka kadar gula darah puasa penderita DM tipe 2 akan cenderung berkurang sebesar 62,02475 mg/dl. Untuk respon 2 (kadar gula darah 2 jam pp), ketika kadar trigliserida kurang dari 350 mg/dl dan lebih dari 63 mg/dl, maka kadar gula darah 2 jam pp penderita DM tipe 2 mengikuti model 1,38989t2. Sedangkan jika kadar trigliserida 350 mg/dl atau lebih, tetapi tidak melebihi 806 mg/dl, maka kadar gula darah 2 jam pp mengikuti model -28.939,1725 – 84,07324t2. Berikut model parsial yang dihasilkan.
yˆ 2
1,38989t 2
;t2
350
- 28.939,1725 – 84,07324t 2 ; t 2
350
Pada kadar trigliserida kurang dari 350 mg/dl dan lebih dari 63 mg/dl, jika kadar trigliserida meningkat sebesar satu mg/dl, maka kadar gula darah 2 jam pp penderita DM tipe 2 akan cenderung meningkat pula sebesar 1,38989. Pada kadar trigliserida 350 mg/dl atau lebih, tetapi tidak melebihi 806 mg/dl, jika kadar trigliserida meningkat sebesar satu mg/dl, maka kadar gula darah 2 jam pp penderita DM tipe 2 akan cenderung berkurang sebesar 84,07324 mg/dl. 5.
KESIMPULAN Berikut kesimpulan dan saran berdasarkan hasil analisis dan pembahasan dalam penelitian ini. 5.1 Kesimpulan Jika diberikan model regresi nonparametrik Spline birespon sebagai berikut 11
,
maka dari hasil pembahasan dan analisis yang telah dilakukan didapatkan kesimpulan sebagai berikut. 1.
Bentuk estimasi model Spline dalam regresi nonparametrik birespon adalah matrik
, dengan
.
2. Model Spline birespon terbaik yang menjelaskan kadar gula darah penderita DM tipe 2 adalah model spline linier dengan 1 titik knot Nilai GCV yang dihasilkan adalah sebesar 0,000000002. Berikut estimasi modelnya.
Berikut intepretasi model Spline birespon terbaik kadar gula darah penderita DM tipe 2. 1. Dengan asumsi kadar trigliserida tetap Baik pada kadar kolesterol kurang dari 188 mg/dl dan lebih dari 115 mg/dl maupun 188 mg/dl atau lebih, tetapi tidak melebihi 336 mg/dl, jika kadar kolesterol meningkat, maka kadar gula darah puasa penderita DM tipe 2 akan cenderung berkurang. Pada kadar kolesterol kurang dari 125 mg/dl dan lebih dari 115 mg/dl, jika kadar kolesterol meningkat, maka kadar gula darah 2 jam pp penderita DM tipe 2 akan cenderung berkurang, namun pada kadar kolesterol 125 mg/dl atau lebih, tetapi tidak melebihi 336 mg/dl, jika kadar kolesterol meningkat, maka kadar gula darah 2 jam pp penderita DM tipe 2 akan cenderung meningkat pula. 2. Dengan asumsi kadar kolesterol tetap Pada kadar trigliserida kurang dari 361 mg/dl dan lebih dari 63 mg/dl, jika kadar trigliserida meningkat, maka kadar gula darah puasa penderita DM tipe 2 akan cenderung meningkat pula, namun pada kadar trigliserida 361 mg/dl atau lebih, tetapi tidak melebihi 806 mg/dl, jika kadar trigliserida meningkat, maka kadar gula darah puasa penderita DM tipe 2 akan cenderung berkurang. Pada kadar trigliserida kurang dari 350 mg/dl dan lebih dari 63 mg/dl, jika kadar trigliserida meningkat, maka kadar gula darah 2 jam pp penderita DM tipe 2 akan cenderung meningkat pula, namun pada kadar trigliserida 350 mg/dl atau lebih, tetapi tidak melebihi 806 mg/dl, jika kadar trigliserida meningkat, maka kadar gula darah 2 jam pp penderita DM tipe 2 akan cenderung berkurang. 5.2 Saran Pada penelitian ini diketahui hubungan antara kadar gula darah dan kadar lemak, serta masih banyak permasalahan yang belum dikaji secara mendalam dan detail. Oleh karena itu, berikut beberapa saran yang dapat direkomendasikan pada masyarakat, pemerintah dan penelitian selanjutnya. 1. Berdasarkan hasil analisis diketahui bahwa DM tipe 2 berhubungan dengan kadar kolesterol dan trigliserida. Disarankan kepada masyarakat untuk menjaga kesehatan agar terhindar dari DM tipe 2, selain itu, bila sudah terkena diabetes, upaya tersebut bisa mengontrol gula darah dan mencegah timbulnya komplikasi. 2. Indonesia adalah ras yang mudah terkena diabetes dan saat ini telah menjadi urutan kelima negara dengan penderita DM terbanyak. Oleh karena itu disarankan kepada pemerintah dan instansi terkait untuk melakukan upaya guna mencegah penderita yang lebih banyak. 3. Karena faktor penyebab DM tipe 2 sangat banyak maka untuk penelitian selanjutnya disarankan melakukan pengembangan metode untuk variabel prediktor yang lebih dari dua dan menggunakan Spline dengan derajat tidak hanya satu dan dua. DAFTAR PUSTAKA Adams, L.B. 2005. Hyperlipidemia. Diakses di http://www.umn. edu/let/pubs/adol_book.shtm. Tanggal akses: 5 Maret 2011. Ariyanto, F. 2006. Smoothing Spline Bivariat Dalam Regresi Nonparametrik dan Aplikasinya. Laporan Tesis S2 Jurusan Statistika, Fakultas MIPA, Institut Teknologi Sepuluh Nopember. Surabaya. 12
Budiantara, I. N. 2005. Regresi Spline Linear. Makalah Seminar Nasional Matematika, Jurusan Matematika, FMIPA Universitas Diponegoro (UNDIP), Semarang. . 2007(a). Model Keluarga Spline Polinomial Truncated Dalam Regresi Semiparametrik. Jurnal Matematika, Ilmu Pengetahuan Alam dan Pengajarannya (MIPA), Vol. 36, No.1, pp. 1-16. Malang: Universitas Negeri Malang. . 2007(b). Inferensi Statistik Untuk Model Spline. Jurnal Ilmiah Matematika dan Statistika (Matstat), Vol. 7, No.1, pp. 1-14. Jakarta: Universitas Bina Nusantara. . 2009. Spline Dalam Regresi Nonparametrik Dan Semiparametrik: Sebuah Pemodelan Statistika Masa Kini dan Masa Mendatang. Pidato Pengukuhan Untuk Jabatan Guru Besar Dalam Bidang Ilmu Matematika Statistika dan Probabilitas, Pada Jurusan Statistika, Fakultas MIPA, Institut Teknologi Sepuluh Nopember. Surabaya: ITS Press. Eubank, R. L. 1988. Spline Smoothing and Nonparametric Regression. New York: Marcel Dekker. . 1999. Nonparametric Regression and Spline Smoothing Second Edition. New York: Marcel Dekker. Gujarati, D. 1992. Essentials of Econometrics. New York: McGRAW-Hill.Inc. Khomsah. 2008. Penyakit Diabetes Mellitus (DM). Diakses di http://www.infopenyakit.com/2008/03/ penyakit-diabetes-mellitus-dm.html. Tanggal akses: 5 Maret 2011. Semiati, R. 2010. Regresi Nonparametrik Deret Fourier Birespon. Laporan Tesis S2 Jurusan Statistika, Fakultas MIPA, Institut Teknologi Sepuluh Nopember. Surabaya. Subekti, I. 2009. Apa Itu Diabetes: Patofisiologi, Gejala dan Tanda. Materi Penyuluhan Pasien Pada Penatalaksanaan Diabetes Melitus Terpadu Edisi Kedua. Jakarta: Balai Penerbit FKUI. Tandra, H. 2009. Segala Sesuatu Yang Harus Anda Ketahui Tentang Diabetes. Jakarta: PT Gramedia Pustaka Utama. Wahba, G. 1990. Spline Models For Observational Data. Pennsylvania: SIAM. Wang, Y. 1998. Spline Smoothing Models With Correlated Errors. Journal of the American Statistical Association. Vol. 93, pp. 341-348. Wang Y., Guo W. dan Brown, M.B. 2000. Smoothing Spline For Bivariate Data With Application To Association Between Hormones. Statistica Sinica. Vol. 10, pp. 377-397.
13