PENGEMBANGAN ALGORITMA EXPECTATION MAXIMIZATION (EM) PADA METODE PENDUGAAN RANDOM DAN FIXED EFFECT PADA MODEL GLMMs 1)
A. A. R. Fernandes1) dan W. H. Nugroho1) Staf Pengajar Program Studi Statistika Jurusan Matematika FMIPA UB ABSTRAK
Beberapa variabel respon berkategori yang hanya memiliki dua kelompok atau golongan dalam pengamatan pada setiap subyeknya diklasifikasikan menjadi sukses atau gagal. Kondisi seperti ini cenderung berdistribusi binomial. Kejadian berdistribusi binomial seringkali ditemukan pada variabel respon yang saling berkorelasi untuk data longitudinal. Data longitudinal dengan variabel respon berdistribusi binomial dapat dimodelkan dalam Generalized Linear Mixed Models (GLMMs). GLMMs biasa digunakan untuk memodelkan data longitudinal pada penelitian klinik maupun studi epidemiologi seperti penyakit kanker dan lainnya. Tujuan dari penelitian ini adalah ingin menguji apakah algoritma Expecation Maximization (EM) untuk menduga parameter model GLMMs lebih baik daripada algoritma yang biasa digunakan yaitu algoritma Newton Rhapson (NR). Penelitian ini menggunakan simulasi empat data penelitian di bidang kesehatan. Berdasarkan atas data penelitian, dapat disimpulkan bahwa algoritma EM lebih baik untuk menduga parameter model GLMMs dibandingkan dengan algoritma NR. Kata kunci: GLMMs, algoritma EM, dan algoritma NR ABSTRACT Some uncategorized response variables having only two groups or classes in the observations on each subject should be classified as successful or failed. Conditions such as these tend to the binomial distribution. Genesis binomial distribution is often found in the response variables correlated to longitudinal data. Longitudinal data with binomial distributed response variables can be modeled in Generalized Linear Mixed Models (GLMMs). GLMMs are a popular way to model longitudinal data arising in clinical trials and epidemiological studies of cancer and other diseases. The purpose of this research is to consider the use of the Expecation Maximization (EM) algorithm for parameter estimation of GLMMs model, and comparing the result with classical algorithm, called Newton Rhapson (NR). The approach is illustrated by application to four datasets which applied in medical research for simulation study. Based from the four datasets, we can conclude that the EM algorithm is the best solution to estimate the parameter in GLMMs rather than NR algorithm. Keywords: GLMMs, NR algorithms, and EM algorithms
1
manfaat penelitian adalah sebagai alternatif penyelesaian masalah pada analisis data longitudinal dengan respon binom, dan pengembangan algoritma EM pada model longitudinal diharapkan agar dapat digunakan sebagai alternatif terbaik untuk pendugaan parameter model, sehingga tidak akan terjadi lagi in admissible solution.
PENDAHULUAN Dalam dunia nyata sering ditemui kejadian yang memiliki dua kemungkinan, misalkan sehat atau sakit, hujan atau tidak, dan lain sebagainya, di mana tipe data tersebut disebut data biner. Secara umum data biner ini diasumsikan menyebar binomial, yang dinotasikan dalam bentuk sukses (angka 1), atau gagal (angka 0). Data longitudinal adalah data yang diperoleh dari pengukuran berulang (repeated measures) pada beberapa individu (unit cross-sectional) dalam waktu berturutturut (unit waktu). Verbekke dan Molenberghs [1] memperkenalkan metode analisis Generalized Linear Mixed Model (GLMMs) yang digunakan pada data longitudinal dengan respon binom. Pada model GLMMs, terdapat dua efek yang diduga, yaitu pertama, efek tetap (fixed effect) adalah efek dari adanya perlakuan (treatment) dan efek dari adanya concomittant variables (variabel penyerta), dan kedua, efek acak (random effect) yaitu efek dari adanya perbedaan antar individu (subject specific). Kedua metode tersebut secara simultan diduga dengan pendekatan Maximum Likelihood (ML) untuk pendugaan efek tetap, dan Restricted Maximum Likelihood (REML) untuk pendugaan efek acak, dengan bantuan pendekatan iterasi Newton Rhapson (NR). Belakangan ini, muncul beberapa kelemahan yang terjadi dalam algoritma Newton Rhapson (NR) seperti hasil yang muncul dalam algoritma tersebut adalah ragam yang negatif, yang menimbulkan inadmissible solution yaitu solusi yang tidak dapat diterima. Meng dan Dyk [2] telah mengembangkan algoritma Expectation Maximization yang menggunakan dua langkah (penduga, dan maksimisasi), pada model mixed effect dengan kasus respon kuantitatif (data berskala interval dan rasio). Oleh karena itu, pada penelitian ini mengangkat pengembangan algoritma Expectation Maximization (EM) pada metode pendugaan efek tetap (fixed effect) dengan menggunakan ML, dan pada metode pendugaan efek acak (random effect) dengan menggunakan REML pada model GLMMs, yang merupakan keberlanjutan dari penelitian yang dilakukan oleh Meng dan Dyk [2], di mana perbedaannya, pada penelitian ini melibatkan variabel respon binom. Pada penelitian ini ingin sekaligus membandingkan apakah algoritma EM lebih baik dibandingkan algoritma NR, dengan melihat nilai goodness of fit yaitu Akaike Information Criterion (AIC) dari kedua algoritma tersebut.
TINJAUAN TEORI Generalized Linear Mixed Model (GLMMs) Generalized Linear Mixed Model (GLMMs) adalah pengembangan dari Generalized Linear Model (GLMs). Model GLMs untuk respon binom dikenal dengan regresi logistik. Agresti [3] menyatakan, jika terdapat variabel respon Yi dan i adalah peluang sukses bagi variabel Yi , maka: 1, P ( Yi 1) i Yi 0 , P ( Yi 0 ) 1 i
Jika banyaknya percobaan yang dinotasikan dengan n sebanyak 1 maka Yi mengikuti sebaran Bernoulli, dan jika n ≥ 2 maka Yi mengikuti sebaran Binomial (ni, i). Sehingga diperoleh model logistik sebagai berikut (Fahrmeir, dan Gerhard, [4]):
ln i 1 i
i
0 1 X i1 ... p X ip
exp( o 1 x i1 ... p x ip )
1 exp( o 1 x i1 ... p x ip )
g( i ) = ln i 1 i
g(i) adalah link function logit dari sebaran binom Generalized Linear Mixed Models (GLMMs) merupakan perluasan dari Generalized Linear Models (GLMs) untuk data berkorelasi seperti pada data longitudinal dengan menambahkan efek acak pada persamaannya. Variabel respon dalam GLMMs diasumsikan saling bebas dengan penambahan efek acak pada masing-masing subyek. Secara umum model dalam GLMMs adalah : g( i ) = XT β + ZT bi + ei bi N (0,D), dan ei N (0,Ri) di mana : Si : subyek pengamatan, i=1,2,3,…,N Wj : pengamatan masing-masing subyek, j=1,2,3,…,n g( i ) : fungsi link (logit)
ij
X
Tujuan dan Manfaat Penelitian Adapun tujuan penelitian yang akan diperoleh adalah melakukan pendugaan parameter pada model GLMMs menggunakan algoritma EM, sekaligus, menguji kebaikan algoritma EM dengan NR, menggunakan nilai AIC yang terkecil. Sedangkan
Z
bi
2
: nilai tengah untuk subyek ke-i, pengamatan
ke-j : vektor kovariat untuk efek tetap subyek kei, pengamatan ke-j : penduga efek tetap : vektor kovariat efek acak untuk subyek kei, pengamatan ke-j : penduga efek acak untuk subyek ke-i
ei : galat model D : ragam efek acak Ri : ragam galat Menurut Saavedra [5], asumsi dalam GLMMs adalah : 1. Nilai ekspektasi dari variabel respon berhubungan dengan kovariat dan efek acak seperti : g( i ) =
x (t 1) x (t ) f ' ' ( x (t ) )
di mana
dan mengikuti GLMs di mana y memiliki fungsi kepekatan keluarga eksponensial f( y | β,D,σ2) di mana D merupakan matriks peragam. 3. Efek acak bi saling bebas dengan mengikuti
H (t )
i 1
n
i 1
j 1
i
xij xik N i exp( j xij ) i
1 exp( j xij ) i
2
N i i (1 i )
H-1 adalah matriks ragam koragam yang merupakan invers dari H
g (t )
( j ) j
xi y i Nx ij ( xi ) xij ( yi N i i ) i
j
i
Perbedaan antara persamaan di atas dengan persamaan sebelumnya adalah pada penyertaan efek acak bi di dalam model, fungsi efek acak dalam persamaan di atas adalah untuk mengatasi korelasi antar masing-masing pengamatan yang mungkin timbul dalam data longitudinal. Efek acak merupakan komponen variasi yang tidak dijelaskan dalam variabel prediktor. Sedangkan efek tetap merupakan pengaruh yang ditimbulkan oleh variabel prediktor. Menurut Molenberghs dan Verbekke [1] efek acak dapat diduga dengan metode Maximum Likelihood (ML), yaitu didapatkan dengan mengintegralkan efek acak. Menurut Jiang [7], persamaan likelihood untuk masing-masing subyek adalah : N
j k
i
ij = XT β + ZT bi ln 1 ii i
j k
2 ( j )
= XT V-1X -1 V adalah matriks diagonal dengan elemen
GLMMs dapat digunakan untuk menganalisis data longitudinal diskrit, termasuk untuk respon binom (Hardin dan Hilbe, [6]). Hubungan antara variabel respon dengan parameter efek tetap dan efek acak seperti pada persamaan berikut : Y ij |b i ~ Bernoulli( ij )
N
2 ( j )
xij xik N i i (1 i )
bi ~ N (0, D)
L( , D ) f yi , D
f ' ( x (t ) )
( t 1) ( t ) ( H (t ) ) 1 g ( t )
bi untuk masing-masing subyek sehingga y i1 ,..., y in diasumsikan saling bebas,
distribusi normal,
1
di mana : x(t+1) : titik hasil iterasi ke-t+1 x(t) : titik awal atau titik hasil iterasi ke-t f’(x) : turunan pertama dari f(x) f’’(x): turunan kedua dari fungsi f(x) Analog dengan persamaan di atas , maka persamaan pendekatan untuk parameter β adalah :
g E (Yij bi ) = XT β + ZT bi
2. Pemberian
= XT (Yi -
i
i )
maka penduga efek tetap β(r+1) = β(r) + (XT V-1 X)-1 (XT (Yi -
i ))
dengan cara yang sama, penduga efek tetap diperoleh: b(r+1) = b (r) + DZT V-1 (Yi - i )
Persamaan ini harus diselesaikan secara iterasi (r adalah indeks untuk tiap iterasi, dengan r = 0, 1, 2, …), proses ini diulang sampai diperoleh β dan b yang konvergen atau j ( t 1) j (t ) . β dianggap konvergen jika nilai δ kurang dari 10-6. Adanya keterkaitan antara kedua persamaan di atas menyebabkan kemungkinan algoritma NR memberikan hasil yang tidak konvergen, dan bahkan menciptakan ragam yang negatif karena adanya dua ragam yang digunakan untuk kedua persamaan, yaitu ragam galat model dan ragam efek acak.
f ij y ij b i , f b i D db i
Algoritma Newton Rhapson (NR) Untuk menyelesaikan persamaan dalam model GLMMs tidaklah mudah karena βj yang akan diduga bersifat nonlinier, untuk itu diperlukan metode iterasi. Menurut Khuri [8], iterasi perlu dilakukan jika nilai optimum tidak dapat diperoleh secara langsung. Metode iterasi yang digunakan adalah algoritma Newton Raphson (NR). Pendekatan NR secara umum didefinisikan sebagai berikut: Suatu titik x pada suatu fungsi f(x) yang nonlinier didekati dengan menggunakan metode Newton Raphson adalah (Verbekke dan Molenberghs, [1]) :
Algoritma Expectation Maximization (EM) Algoritma EM pada hakekatnya seperti yang telah diteliti oleh Meng [2] adalah perbaikan dari algoritma NR untuk pendekatan model longitudinal pada respon kontinyu. Pada persamaan sebelumnya, Ri adalah ragam galat, dengan menggunakan pendekatan berikut: Ri = 2 Ini, untuk i = 1, 2, …, n di mana bi dan ei dibawah asumsi normalitas yaitu bi N (0,D), dan ei N (0,Ri), maka metode Maximum Likelihood untuk mengestimasi 2 dan D menjadi:
3
T ˆ 2 N 1 e i e i
p adalah banyaknya parameter yang diestimasi. Menurut Agresti (2002), algoritma terbaik adalah algoritma yang menghasilkan nilai AIC terkecil.
ˆ n 1 b b T D i i
Persamaan di atas adalah M-step (Maximization Step) pada EM-Algoritma, karena ei dan bi adalah tidak dketahui. Langkah algoritma EM adalah mengganti 2 dan D dengan:
ˆ | y, = ˆ ) 2 = E(
2
2 = = N 1 e i T e i 2 n i 2 tr ( Vi 1
ˆ | y, = ˆ ) D = E( D
D = n 1 b i b i T D DZ i T Vi 1 Z i D
METODE PENELITIAN Data yang diperoleh adalah dua data primer dari pasien penderita demam berdarah, dan pasien penderita decubitus wound, dan dua data sekunder dari pasien Age Related Macular Degeneration (ARMD), dan percobaan pada tikus hamil. Metode yang digunakan dalam penelitian ini adalah teringkas pada langkah-langkah berikut: 1. Pembentukan model regresi logistik sebagai inisialisasi efek tetap dalam GLMMs 2. Eksplorasi data : a. Mean profile, untuk mengetahui pengaruh efek tetap b. Variance profile, untuk mengetahui pengaruh efek acak c. Concomitant variable, untuk mengetahui pengaruh variabel penyerta. 3. Pembentukan model tentatif dengan penentuan jumlah efek tetap awal dan efek acak sementara. Efek tetap dan efek acak sementara diperoleh dari eksplorasi data, jika mean profile dan variance profile berpengaruh maka perlu adanya penyertaan efek acak dan efek tetap dalam model. 4. Pendugaan parameter efek tetap dan acak menggunakan metode Maximum Likelihood (ML) dan Restricted Maximum Likelihood (REML) dengan algoritma NR dan EM. Apabila diperoleh nilai yang signfikan maka beranjak ke tahap selanjutnya, namun bila kondisi ini tidak dipenuhi kembali ke tahap pembentukan model awal (tahap 3). 5. Pemeriksaan signifikansi penduga parameter efek tetap pada model awal, bila terdapat efek tetap (selain efek tetap waktu) yang tidak signifikan maka kembali ke tahap 3 dan membentuk kembali model awal tanpa mengikutsertakan efek tetap selain waktu yang tidak signifikan tersebut ke dalam model. 6. Menghitung nilai loglikelihood semua model efek acak. Nilai loglikelihood dibandingkan dengan menggunakan likelihood ratio test, model efek acak didapat dari nilai likelihood ratio test yang signifikan dengan nilai -2loglikelihood terkecil. 7. Pemilihan efek tetap berdasarkan efek acak yang telah ditentukan pada tahap 5. Model efek tetap diperoleh dari nilai AIC model secara keseluruhan dengan menyertakan efek acak yang telah diketahui. 8. Pemeriksaan signifikansi kembali terhadap efek tetap setelah penyertaan efek acak ke dalam model. 9. Membandingkan hasil pendekatan pendugaan parameter dengan metode ML menggunakan algoritma NR dan EM menggunakan nilai AIC.
Bagian kanan persamaan di atas, ragam 2 dan D ˆ 2 dan belum diketahui, sehingga diganti dengan
ˆ pada persamaan di atas sebagai nilai awal. D ˆ akan di update Dengan iterasi, nilai ˆ 2 dan D menggunakan persamaan di atas dengan menggunakan pendekatan algoritma EM, sehingga skema algoritma EM adalah sebagai berikut: Tetapkan r = 0, 1, 2, ... adalah urutan iterasi, dan ˆ ( r )
dan bˆ ( r ) adalah nilai duga parameter efek tetap dan
efek acak pada iterasi ke r. Langkah-langkah pendugaan parameter dengan algoritma EM adalah sebagai berikut: Langkah 0: Menetapkan r = 0, ˆ 2 ( r ) = 1 dan Dˆ ( r ) = In
Langkah 1: Menetapkan r = r + 1, update persamaan ˆ ( r ) dan bˆ ( r ) menggunakan:
T ˆ 1 ˆ ( r ) X i V i ( r 1) X i
X 1
i
T
1 ˆ V i ( r 1) y i
T ˆ 1 ˆ bˆ ( r ) D ( r 1) Z i V i ( r 1) ( y i X ( r ) )
di mana
T ˆ ˆ ˆ2 V i ( r 1) Z i D ( r 1) Z i ( r 1) I n
Langkah 2:
Memperbaharui nilai
e b
1 ˆ 2 ( r ) = N
ˆ = n 1 D (r)
di mana
ˆ ˆ 2 ( r ) dan D (r)
~ 1 e ir 1) ˆ 2 ( r 1) n i ˆ 2 ( r 1) tr(Vi ( r 1) T T ˆ 1 ˆ ˆ ˆ i ( r ) b ir ) D ( r 1) D ( r 1) Z i Vi ( r 1) Z i D ( r 1) i ( r 1)
T
ˆ - Zi bˆ ei(r) = yi - Xi (r) (r)
Langkah 3: Mengulang langkah 1 dan 2 hingga konvergen yaitu j( r 1) j( r ) 10 6 Indikator Pembanding Algoritma NR dan EM Pemilihan algoritma terbaik dengan menggunakan AIC (Akaike Information Criteria), yang didefinisikan pada persamaan berikut: AIC = -2loglikelihood + 2p
4
Pembentukan model longitudinal Generalized Linear Mixed Model (GLMMs) menggunakan bantuan software SAS 9.1.3 dan Splus 3. Penggunaan Splus 3 untuk membentuk macro Algoritma NR, sedangkan penggunaan SAS 9.1.3 untuk menjalankan GLMMs dengan algoritma EM.
1
0.9 Prporsi Kesembuhan
0.8
HASIL DAN PEMBAHASAN Eksplorasi Data Eksplorasi data yang meliputi mean profile, variance profile dan concomintant structure merupakan tahap awal pembentukan model data longitudinal menggunakan Generalized Linear Mixed Model (GLMMs) yang berguna untuk membentuk model awal Eksplorasi mean profile menggambarkan perubahan perubahan proporsi kejadian sukses untuk keseluruhan subyek setiap unit waktu. Eksplorasi variance profile bertujuan untuk mengetahui adanya pengaruh efek acak. Efek acak perlu ditambahkan pada model jika dalam grafik variance profile terdapat fluktuasi nilai residual setiap unit waktu. Eksplorasi terhadap concomitant variable perlu juga untuk dilakukan. Pengaruh variabel pengiring tidak dapat diabaikan karena variabel pengiring dapat mempengaruhi respon. Berikut disajikan eksplorasi data pertama tentang pasien penderita demam berdarah (data pertama), sebagai berikut: Proporsi Kesembuhan
0.4 0.3 0.2 0.1
Gambar 1. Mean profile
Residual
15 10
2
Waktu (Hari)
3
Gambar 2. Variance profile 1
Proporsi Kesem buhan
Perlakuan
0.0134
0.8 0.7 0.6
-0.0381
-4.1145
Perlakuan
0.0134
J. Kelamin
0.5 0.4 0.3 0.2
40
50
0.8227
0.0001
0.2243
0.0001
0.4127
0.9264
0.0245
0.5835
1.5233
-0.0381
0.8121
0.0001
0.2243
0.0001
0.4127
0.9269
0.0244
0.6865
Dari tabel di atas dapat kita lihat bahwa variabel time signifikan pada α sebesar 5% untuk kedua algoritma. Nilai penduga bertanda positif mengindikasikan adanya peningkatan kesembuhan pasien penderita demam berdarah sepanjang waktu 1
0.1
Jenis Kelamin
1.5233
Intersep Waktu
0.9
1
30
Tabel 2 Pendugaan Parameter GLMMs Model dengan Algoritma EM data pertama Parameter Penduga SE P-value
4
Keragaman
0
-4.1526
J. Kelamin
5 1
20
Intersep Waktu
20
0
10
Tabel 1 Pendugaan Parameter GLMMs Model dengan Algoritma NR data pertama Parameter Penduga SE P-value
4
Kontrol
0
0
Pembentukan Model GLMMs Dari hasil eksplorasi memperlihatkan bahwa keempat data layak untuk dilakukan pemodelan. Hasil pendugaan model Generalized Linear Mixed Model (GLMMs) untuk data pertama yaitu data mengenai pasien penderita demam berdarah, disajikan sebagai berikut:
0.5
25
0.2
Berdasarkan Gambar 1 di atas menunjukkan adanya kecenderungan peningkatan proporsi kesembuhan pasien yang menunjukkan adanya penambahan efek tetap dalam model GLMMs yang akan dibentuk . Gambar 2 menunjukkan adanya perubahan keragaman respon mengindikasikan perlu menyertakan efek acak selain efek tetap ke dalam model tentatif. Dari Gambar 3 dan 4 dapat diketahui bahwa masing-masing variabel yaitu jenis kelamin (sex) memiliki pengaruh yang relatif sama antara pria dan wanita, sehingga perlu dipertimbangkan penyertaan variabel sex. Sedangkan pada variabel usia (age), grafik yang terbentuk relatif berbeda untuk masing-masing umur, sehingga variabel usia tetap disertakan dalam model.
0.6
3
0.3
Gambar 4. Concomitant: Usia
0.7
2 Waktu (Hari)
0.4
Um ur (tahun)
1
1
0.5
0
0.8
0
0.6
0.1
0.9
0
0.7
2
1 = Pria 2 = Wanita
Gambar 3. Concomitant: Jenis Kelamin
5
hingga 4 hari. Sedangkan untuk variabel penyerta usia, terlihat adanya pengaruh yang signifikan dan positif pada kedua algoritma. Artinya, semakin muda pasien, tingkat kesembuhan semakin tinggi. Terlihat pula pada kedua algoritma untuk variabel penyerta jenis kelamin terlihat pengaruh yang signifikan terhadap peningkatan kesembuhan pasien penderita demam berdarah. Mengingat jenis kelamin adalah variabel dummy (1: pria, dan 0: wanita), mengindikasikan wanita memiliki tingkat kesembuhan yang lebih cepat jika dibandingkan pria. Secara keseluruhan, dua penduga parameter, dengan menggunakan metode Newton Rhapson maupun Expectation Maximization tidak menunjukkan perbedaan yang berarti. Hasil pendugaan model Generalized Linear Mixed Model (GLMMs) untuk data kedua tentang pasien penderita decubitus wound sebagai berikut:
Tabel 5 Pendugaan Parameter GLMMs Model dengan Algoritma NR data ketiga Parameter Penduga SE P-value
-7.9810
Perlakuan
0.3773
0.2295
J. Kelamin
1.7048
0.2435
Waktu Usia
0.4663
0.0367
1.3731
0.0001
0.0180
0.0415
0.0001
9.8084
0.0267
Perlakuan
0.7373
1.7504
0.6752
J. Kelamin
5.6219
1.9092
Waktu Usia
1.4297
0.0757
0.1795
0.1335
0.0357
0.0158
0.0001
0.0001
0.3890
Intersep
-3.0394
255.6900
Usia
1.2234
1.2475
0.2540
0.0059
0.9909
0.0001
0.3278
Dari tabel di atas terlihat kedua metode pendugaan parameter pada model GLMMs memperlihatkan hasil yang serupa pada signifikansi nilai pendugaan, akan tetapi menunjukkan hasil yang berbeda pada nilai duganya. Terlihat adanya evolusi (perubahan pada tiap waktu) dari respon pasien penderita Age Related Macular Degeneration (ARMD). Untuk pendugaan dengan menggunakan algoritma NR, terlihat bahwa dari minggu ke minggu, pasien penderita ARMD dapat sembuh sebesar exp(0.4024) atau 1.495 kali lebih baik dari minggu sebelumnya. Sedangkan untuk pendugaan dengan menggunakan algoritma EM, terlihat bahwa dari minggu ke minggu, pasien penderita ARMD dapat sembuh sebesar exp(0.2540) atau 1.289 kali lebih baik dari minggu sebelumnya. Hasil pendugaan GLMMs untuk data keempat tentang pemberian daun sirih dan hidrogen peroksida pada tikus hamil sebagai berikut:
0.0985
-22.3161
0.0144
Waktu
Tabel 4 Pendugaan Parameter GLMMs Model dengan Algoritma EM data kedua Parameter Penduga SE P-value Intersep
Usia
0.4024
1.2192
Tabel 6 Pendugaan Parameter GLMMs Model dengan Algoritma EM data ketiga Parameter Penduga SE P-value
0.0001
0.0410
-4.9556
Waktu
Tabel 3 Pendugaan Parameter GLMMs Model dengan Algoritma NR data kedua Parameter Penduga SE P-value Intersep
Intersep
0.0001
Tabel 7 Pendugaan Parameter GLMMs Model dengan Algoritma NR data keempat Parameter Penduga SE P-value
0.5730
0.0047
Dari Tabel 3 dan 4 memperlihatkan bahwa kedua algoritma pendugaan parameter menunjukkan perbedaan yang cukup besar, baik itu dilihat dari signifikansi nilai pendugaan, maupun besarnya nilai dugaan itu. Pada pendugaan parameter dengan algoritma NR memperlihatkan adanya pengaruh waktu, usia, dan jenis kelamin pasien terhadap respon penderita decubitus wound. Sedangkan pada pendugaan parameter dengan algoritma EM memperlihatkan hanya pengaruh waktu dan jenis kelamin pasien saja yang berpengaruh terhadap respon penderita decubitus wound. Hasil pendugaan GLMMs untuk data ketiga tentang pasien penderita Age Related Macular Degeneration (ARMD) sebagai berikut:
Intersep
-0.8451
Perlakuan
-0.6082
Time
Bobot
0.8751
-0.0105
1.2888
0.5120
0.1322
0.0001
0.0092
0.2529
0.1715
0.0004
Tabel 8 Pendugaan Parameter GLMMs Model dengan Algoritma EM data keempat Parameter Penduga SE P-value Intersep
-4.2533
10.8690
Perlakuan
-2.7751
1.6630
Time
Bobot
4.1998
-0.0537
0.6999
1.5615
0.0145
0.0801
0.5112
0.1116
Pada tabel di atas memperlihatkan bahwa kedua algoritma pendugaan parameter menunjukkan perbedaan yang cukup besar, baik itu dilihat dari 6
signifikansi nilai pendugaan, maupun besarnya nilai dugaan itu. Pada pendugaan parameter dengan algoritma NR memperlihatkan adanya pengaruh waktu dan efek perlakukan pemberian daun sirih dan hidrogen peroksida dengan peningkatan jaringan nekrotik pada tikus hamil. Sedangkan pada pendugaan parameter dengan algoritma EM memperlihatkan hanya pengaruh waktu saja yang berpengaruh terhadap peningkatan jaringan nekrotik pada tikus hamil.
2.
Saran Dari hasil penelitian ini disarankan beberapa hal sebagai berikut: 1. Algoritma EM dapat digunakan sebagai penyelesaian masalah pada analisis data longitudinal dengan respon binom, dan cenderung dapat meningkatkan akurasi model yang lebih baik, jika dibandingkan algoritma NR yang saat ini lebih sering digunakan. Sehingga dapat disarankan bahaw pengembangan EM ini adalah alternatif terbaik pendugaan parameter model GLMMs. 2. Pada penelitian selanjutnya disarankan untuk menggunakan kriteria p-value yang ikut menetapkan pemilihan algoritma terbaik. Disarankan pula untuk mempelajari pengembangan algoritma EM pada analisis data longitudinal dengan respon ordinal maupun respon poison.
Perbandingan Algoritma NR dan EM pada Model GLMMs Berdasarkan hasil pendugaan parameter model GLMMs, baik itu dari signifikansi nilai pendugaan, maupun besarnya nilai duga cenderung memberikan perbedaan pada kedua algoritma yaitu Algoritma NR dan Algoritma EM. Untuk menguji algoritma mana yang terbaik, menggunakan kriteria Akaike Information Criterion (AIC), di mana algoritma terbaik adalah algoritma yang menghasilkan nilai AIC terkecil. Tabel berikut merangkum nilai AIC maupun jumlah iterasi pada masing-masing algoritma, dan persen keefektifan. Tabel 9 Hasil Perbandingan Algoritma NR dan EM Jumlah Iterasi AIC Data keNR EM NR EM Data 1
23
22
169.1
163.0
Data 3
39
11
1255.8
915.4
Data 2 Data 4
41 46
27 21
410.2 113.2
model pada keempat data penelitian dengan menggunakan algoritma EM. Algoritma Expectation Maximization (EM) lebih baik dibandingkan algoritma Newton Rhapson (NR) yang saat ini kerapkali digunakan dalam menduga parameter model GLMMs. Hal ini terlihat dari keempat data penelitian, nilai AIC algoritma EM lebih kecil daripada nilai AIC algoritma NR.
DAFTAR PUSTAKA [1] Molenbergs.G., dan Verbekke, G., 2005. Model for Discrete Longitudinal Data. Springer Series in statistics. New – York:Springer –Verlag. [2] Meng, X, dan Dyk, D. 2008. Fast EM Type Implementations for Mixed Effect Models. Journal of the Royal Statistical Society. Series B. Vol. 60, No. 3. Pp 559-578. [3] Agresti, A. 2002. An Introduction to Categorical Data Analysis. John Wiley & Sons. New York. [4] Fahrmeir, L. dan T. Gerhard. 1994 . Multivariate Statistical Modelling Based on Generalized Linier Models. John Willey dan Sons , New York. [5] Saavedra, P.A.T. 2006. Percentile Curves In Binary Longitudinal Data. http://grad.uprm.edu/tesis/torressaavedra.pdf. Tanggal akses : 18 Oktober 2010. [6] Hardin, J. W. dan J. Hilbe. 2007. Generalized Linear Models and Extensions. Stata Press. Texas [7] Jiang, J. 2007. Linear and Generalized Linear Mixed Models and Their Application. Springer Series in Statistics. New York. [8] Khuri, A. 2003. Advanced Calculus with Application In Statistics. John Wiley and Son. New Jersey.
312.8 81.9
Dari tabel di atas dapat dilihat bahwa nilai AIC terendah pada keempat data penelitian dihasilkan oleh algoritma Expectation Maximization (EM). Terlihat pula jumlah iterasi yang diperlukan algoritma EM untuk mencapai titik konvergen dalam pendugaan parameter lebih sedikit jika dibandingkan jumlah iterasi dengan algoritma NR pada data yang sama. Dengan demikian dapat disimpulkan bahwa pendugaan parameter model Generalized Linear Mixed Model (GLMMs) dengan algoritma Expectation Maximization (EM) memberikan hasil yang lebih baik dibandingkan dengan algoritma Newton Rhapson (NR). KESIMPULAN DAN SARAN Kesimpulan Dari hasil penelitian yang dilakukan dapat diambil kesimpulan sebagai berikut: 1. Algoritma Expectation Maximization (EM) dapat digunakan untuk menduga parameter pada model Generalized Linear Mixed Model (GLMMs). Hal ini terlihat dengan terbentuknya
7