PENAKSIRAN PARAMETER MODEL REGRESI POISSON DENGAN METODE EXACT GENERALIZED ESTIMATING EQUATIONS (EGEE) UNTUK MULTIPLE-RANDOM EFFECTS Anisah Nurul Hayati Pembimbing : Dr. Yekti Widyaningsih, M.Si dan Dr. Dian Lestari Program Studi Matematika, Fakultas MIPA
Abstrak Salah satu metode yang cocok untuk mengatasi data berkorelasi adalah Generalized Estimating Equations (GEE). GEE dibagi menjadi 2 model regresi, yaitu model regresi population-averaged (PA) dan model regresi cluster-specific (CS). Pada kenyataannya, apabila model regresi CS-GEE yang lebih sesuai, namun model regresi PA-GEE yang digunakan, maka GEE akan menghasilkan penaksiran yang bias. Untuk mengatasinya, dapat digunakan metode yang menggabungkan model regresi PA dan model regresi CS. Metode tersebut dinamakan Exact Generalized Estimating Equations (EGEE). EGEE merupakan perluasan dari Generalized Estimating Equations (GEE) dengan menggunakan matriks varians-kovarians yang sebenarnya yang diperoleh dari variansi total. EGEE dibagi menjadi 2 model regresi, yaitu model regresi dengan single-random effect dan model regresi dengan multiple-random effects. Tugas akhir ini membahas mengenai penaksiran parameter model regresi dengan metode EGEE untuk multiplerandom effects pada kasus variabel respon yang berdistribusi Poisson. Kata Kunci: Generalized Estimating Equations (GEE), model regresi Poisson, multiple-random effects, maksimum likelihood
Abstract One of the appropriate method to solve the correlated data is Generalized Estimating Equations (EGEE). GEE is divided into 2 regression models, there are population average (PA) regression model and clustered-specific (CS) regression model. In fact, if the data follow CS regression model, but PA regression model is used, then GEE leads to biased estimates. To solve this problem, it can be used the method for combining PA regression model and CS regression model. The method is Exact Generalized Estimating Equations. EGEE is an extension of Generalized Estimating Equations (GEE) with the exact variance-covariance matrix. EGEE is divided into 2 regression models, there are regression model for single-random effect and regression model for multiple-random effects. This thesis discussed about estimating regression parameter of EGEE for multiple-random effects with the response variable from Poisson distribution. Keywords: Generalized Estimating Equations (GEE), Poisson regression model, multiple-random effects, maximum likelihood
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
Pendahuluan Statistika merupakan salah satu cabang ilmu matematika yang sudah tidak asing lagi dan tentunya sering diaplikasikan di dunia nyata. Statistika sangat erat hubungannya dengan data. Secara umum, statistika dikenal sebagai suatu ilmu yang mempelajari bagaimana mendisain, mengumpulkan, menyajikan, menganalisis, dan menginterpretasikan data. Ilmu statistika dibagi menjadi 2 bagian, yaitu statistika deskriptif dan statistika inferensi. Statistika deskriptif mempelajari bagaimana menyajikan atau mendeskripsikan data. Hasil keluarannya dapat berupa tabel frekuensi, histogram, diagram lingkaran, diagram batang, dan lain-lain. Sedangkan statistika inferensi mempelajari bagaimana menganalisis data sampel dan memberlakukannya pada populasi. Analisis regresi merupakan salah satu metode yang ada dalam statistika inferensi. Analisis regresi digunakan untuk menganalisis hubungan antar variabel melalui pemodelan (Montgomery et al., 2001). Dalam menganalisis hubungan antar variabel, ditentukan terlebih dahulu variabel apa yang dipengaruhi dan variabel apa saja yang mempengaruhi. Biasanya variabel yang dipengaruhi disebut sebagai variabel respon dan variabel yang mempengaruhi disebut sebagai variabel penjelas. Langkah awal dalam analisis regresi adalah menentukan model regresi, dengan parameterparameter di dalam model regresi tersebut perlu ditaksir. Salah satu metode penaksiran parameter dalam model regresi adalah ordinary least squares (OLS). Namun, agar OLS dapat digunakan, terdapat beberapa asumsi yang harus dipenuhi, salah satunya adalah data yang tidak berkorelasi. Apabila datanya berkorelasi, maka OLS tidak dapat digunakan. Salah satu metode yang dapat digunakan untuk mengatasi masalah ini adalah Generalized Estimating Equations (GEE). Terdapat beberapa model regresi yang dapat menggunakan metode GEE, yaitu model regresi dengan variabel respon yang berdistribusi normal, binomial, Poisson, Gamma, dan invers Gaussian. Kegunaan yang paling utama dari GEE adalah mengatasi ketidak-bebasan pada data longitudinal dan data terklaster. Data dapat dikatakan sebagai data longitudinal, apabila individu yang sama diukur berulang-ulang pada waktu yang berbeda-beda. Sedangkan data dapat dikatakan sebagai data terklaster, apabila terdapat klasifikasi alami pada pengamatan yang terbentuk menjadi klasterklaster.
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
GEE memiliki 2 model regresi, yaitu model regresi population-averaged (PA) dan model regresi cluster-specific (CS). Model regresi PA merupakan model regresi yang memberikan ratarata individu terhadap populasi. Sedangkan model regresi CS merupakan model regresi yang memberikan bentuk spesifik untuk tiap-tiap klaster (Hardin and Hilbe, 2003). Perbedaan antara model regresi PA dan model regresi CS adalah model regresi CS memberikan pengaruh acak untuk tiap klaster, sedangkan model regresi PA tidak demikian. Beberapa peneliti menyebutkan bahwa apabila model cluster-specific (CS) yang lebih sesuai, namun model population-averaged (PA) yang digunakan, maka GEE akan memberikan penaksiran yang bias (Zeger et al., 1988; Heagerty and Kurland, 2001). Cara untuk mengatasinya, adalah dengan memberikan model regresi gabungan dari model regresi PA dan model regresi CS. Metode ini dikenal dengan Exact Generalized Estimating Equations (EGEE). Dikatakan exact, karena metode ini memberikan matriks varians-kovarians yang sebenarnya. Terdapat 2 bentuk model regresi dengan EGEE berdasarkan jumlah pengaruh acak klasternya, yaitu model regresi dengan single-random effect (satu pengaruh acak klaster) dan model regresi dengan multiple-random effects (lebih dari satu pengaruh acak klaster). Dalam metode EGEE, variabel respon dapat berdistribusi selain normal seperti pada GEE, yaitu Binomial, Poisson, Gamma, ataupun invers Gaussian. Metode EGEE dapat digunakan pada data longitudinal dan data terklaster. Sebagai aplikasi yang akan digunakan selanjutnya, akan dibahas mengenai data terklaster, yaitu banyaknya kasus gizi buruk di Kediri, Jawa Timur. Kondisi Kota Kediri sudah terbentuk secara alami sebagai data terklaster, dengan klasternya adalah kecamatan, sedangkan pengamatan-pengamatan di dalam klasternya adalah desa. Kota Kediri merupakan kota yang cukup besar dan maju dalam bidang industri, sehingga dapat disimpulkan bahwa kota ini merupakan kota yang cukup makmur. Dengan keadaan tersebut, maka banyaknya kasus gizi buruk merupakan fenomena/kasus yang jarang terjadi. Jadi, banyaknya kasus gizi buruk dapat diasumsikan berdistribusi Poisson. Dengan data tersebut,ingin dicari faktor yang dianggap mempengaruhinya, dengan faktorfaktornya adalah variabel-variabel yang dapat bernilai tetap dan acak. Untuk variabel yang bernilai acak, yang akan dipakai adalah sejumlah 2 variabel. Sehingga, untuk menganalisis banyaknya kasus gizi buruk di Kediri, akan digunakan model regresi EGEE dengan multiplerandom effects.
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
Oleh karena itu, sesuai dengan penjelasan di atas, maka tujuan dari penelitian ini adalah membahas mengenai bagaimana cara menaksir parameter model regresi Poisson dengan metode Exact Generalized Estimating Equations (EGEE) untuk multiple random-effects.
Pembahasan Pada tahun 1986, Liang dan Zeger memperkenalkan suatu pendekatan alternatif untuk melakukan penaksiran parameter model regresi apabila pengamatannya berkorelasi. Pendekatan tersebut adalah Generalized Estimating Equations atau dikenal dengan GEE. Korelasi ini dapat muncul karena individu yang sama diukur berulang-ulang pada waktu yang berbeda (data longitudinal) atau terjadi klasifikasi alami pada pengamatan yang terbentuk menjadi klasterklaster (data terklaster). Dalam metode GEE, pada data longitudinal, individu-individu diasumsikan saling bebas, sedangkan hasil-hasil pengamatan dari setiap individu tersebut saling berkorelasi. Pada data terklaster, klaster-klaster diasumsikan saling bebas, sedangkan hasil-hasil pengamatan di dalam setiap klaster saling berkorelasi. Pada proses penaksiran parameter dengan metode GEE, terdapat pemilihan working correlation matrix (WCM) yang disesuaikan dengan kondisi data. Akan tetapi, pemilihan WCM tidak akan dibahas pada tulisan ini. Ekspektasi model regresi GEE secara umum adalah sebagai berikut: (
dengan
)
klaster dan
pengamatan pada klaster ke- .
Terdapat tiga komponen penting yang dimiliki oleh GEE, yaitu: 1.
Komponen acak, yaitu variabel respon
berdistribusi acak tertentu, seperti normal,
binomial, poisson, gamma, atau invers Gaussian, yang mengikuti distribusi keluarga eksponensial. 2.
Komponen sistematik, yaitu variabel penjelas
yang dikombinasikan dalam model
sebagai fungsi linier dari parameter-parameter. Komponen ini memiliki penduga linier dengan
.
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
,
3.
Fungsi penghubung, yaitu suatu fungsi yang menghubungkan kombinasi linier dari variabel penjelas,
dengan taksiran µ yang disesuaikan dengan distribusi dari
variabel respon , dinyatakan dengan lambang (
).
GEE memiliki 2 model regresi, yaitu model regresi population-averaged (PA) dan model regresi cluster-specific (CS). Model regresi PA merupakan model regresi yang memberikan ratarata individu terhadap populasi, sedangkan model regresi CS merupakan model regresi yang memberikan bentuk spesifik untuk tiap-tiap klaster (Hardin and Hilbe, 2003). Maksud dari tiap klaster memiliki bentuk spesifik dalam model regresi CS adalah terdapat pengaruh acak klaster untuk masing-masing klaster yang ada. Agar lebih jelas, dapat dilihat pada bentuk model regresi yang akan dijelaskan selanjutnya. Model regresi CS dibagi menjadi 2, yaitu model regresi CS dengan single-random effect dan model regresi CS dengan multiple-random effects. Dikatakan single-random effect, karena model CS-GEE hanya memberikan satu pengaruh acak klaster. Sedangkan, untuk model CSGEE dengan multiple-random effects memberikan pengaruh acak klaster lebih dari satu. Berikut ini merupakan gambar dari pembagian model regresi GEE. GEE Model populationaveraged (PA)
Model clusterspecific (CS)
Single-random effect
Mutiple-random effects
Gambar 3.1. Pembagian model regresi Generalized Estimating Equations (GEE) Secara umum, ekspektasi model regresi PA adalah: (
)
Ekspektasi model regresi CS dengan single-random effect adalah: (
)
Sedangkan ekspektasi model regresi CS dengan multiple-random effects adalah: (
)
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
dengan
(indeks untuk klaster) dan
klaster ke- ), serta variabel penjelas sebanyak (random-effect) sebanyak
(indeks untuk pengamatan pada buah, dan variabel desain untuk pengaruh acak
faktor.
Dari persamaan (3.3) terlihat bahwa model regresi CS dengan single-random effect memberikan satu pengaruh acak klaster, yaitu
. Sedangkan dari persamaan (3.4) yang
merupakan model regresi CS dengan multiple-random effects memberikan pengaruh acak klaster lebih dari satu, sebanyak , yaitu
. Untuk menaksir parameter model regresi GEE,
dapat digunakan maksimum likelihood. Model regresi PA-GEE lebih dikenal dibandingkan model regresi CS-GEE, sehingga akan dilihat terlebih dahulu bagaimana cara penaksiran parameter model regresi PA-GEE. Penaksiran parameter model regresi PA-GEE menggunakan maksimum likelihood. Diasumsikan variabel respon umum bentuk pdf dari variabel respon
memiliki distribusi dari keluarga eksponensial, secara dapat ditulis sebagai berikut (Mc Cullagh and Nelder,
1989): ( dengan
merupakan parameter kanonik yang diketahui and
+ merupakan parameter dispersi
yang diketahui. Parameter kanonik merupakan parameter yang bentuknya menyesuaikan dengan fungsi penghubung dari variabel respon
. Sedangkan parameter dispersi digunakan untuk
mengatasi masalah over-dispersi maupun under-dispersi. ingin dibentuk menjadi anggota distribusi keluarga
Sebagai contoh, apabila eskponensial, maka:
{ ( { ( {
)} )
} }
Sehingga, persamaan di atas dapat disesuaikan dengan persamaan (3.5) dengan:
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
Dapat dilihat bahwa parameter kanoniknya adalah
, yang bentuknya menyesuaikan dengan
fungsi penghubung seperti pada tabel fungsi penghubung dan parameter dispersinya adalah . Mean dan variansi dari
yang termasuk dalam anggota distribusi keluarga eksponensial
secara berturut-turut adalah Bentuk pdf dari
dan
. Selanjutnya, akan dicari bentuk likelihood.
yang termasuk dalam anggota distribusi keluarga eksponensial adalah sebagai
berikut. +
( Dan pdf bersamanya adalah:
(
+
(
(
+
+
∏
+
(
Sehingga likelihood-nya menjadi, |
∏
(
+
(∑
+
Jadi, log-likelihood-nya adalah:
(
(∑
++
∑
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
Berdasarkan persamaan di atas, telah diketahui bentuk log-likelihood dari distribusi keluarga eksponensial. Dari bentuk ini, akan dicari persamaan penaksiran parameternya. Dengan menggunakan aturan rantai,
(
)
∑
(
*
∑ Persamaan di atas dapat dibuat dalam bentuk matriks menjadi: ∑(
dengan (
) (
*
⁄ ⁄
⁄ ⁄
⁄ ⁄
⁄
⁄
⁄
merupakan matriks berukuran )
sebagai turunan ekspektasi dari model regresi terhadap masing-masing unsur dalam , merupakan invers dari matriks varians-kovarians dari merupakan matriks residual berukuran
berukuran
, dan
untuk klaster ke- .
Taksiran akhir parameternya dapat dicari dengan bentuk persamaan: ∑(
*
Persamaan di atas dikenal dengan Generalized Estimating Equations (GEE). Jika hasil dari tidak dalam bentuk tertutup, maka dibutuhkan iterasi Newton-Raphson untuk menyelesaikannya. Iterasi dilakukan berulang kali hingga diperoleh taksiran parameter yang konvergen. Namun sebaliknya, apabila hasil dari
memiliki bentuk tertutup, maka dapat
dicari secara langsung tanpa menggunakan iterasi tersebut.
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
Sudah dijelaskan sebelumnya, bahwa GEE memiliki 2 model regresi, yaitu model regresi PA dan model regresi CS. Namun, apabila model regresi CS yang lebih sesuai, tetapi model regresi PA yang digunakan, maka GEE akan memberikan penaksiran yang bias (Zeger et al., 1988; Heagerty and Kurland, 2001). Cara untuk mengatasinya, adalah dengan memberikan model gabungan dari model PA dan model CS. Cara ini dikenal dengan Exact Generalized Estimating Equations (EGEE). Dikatakan exact, karena dapat memberikan matriks varianskovarians
sebenarnya.
Matriks
varians-kovarians
sebenarnya
dapat
dihitung
dengan
menggunakan variansi total. EGEE memiliki 2 model regresi, yaitu model regresi dengan single-random effect dan model regresi dengan multiple-random effects. Single-random effect
dan multiple-random
effects pada EGEE memiliki makna yang sama dengan single-random effect dan multiplerandom effects pada GEE. Berikut ini merupakan gambar dari pembagian model regresi EGEE. EGEE
Model dengan singlerandom effect
Model dengan mutiplerandom effects
Gambar 3.2. Pembagian model regresi Exact Generalized Estimating Equations (EGEE) Ekspektasi model regresi EGEE dengan single-random effect adalah: (
)
Pada model regresi ini,
dapat dikatakan sebagai single-random effect karena klaster-
klaster yang terpilih sebagai sampel merupakan hasil dari pengambilan secara acak (random). Sedangkan ekspektasi model regresi EGEE untuk multiple-random effects adalah: ( dengan sebanyak
dan
)
sama seperti dengan yang dijelaskan pada persamaan (3.4), variabel penjelas
buah, dan variabel desain untuk pengaruh acak (random-effect) sebanyak
faktor.
Untuk menaksir parameternya pun, EGEE juga menggunakan maksimum likelihood sama seperti GEE.
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
Persamaan (3.11) merupakan ekspektasi model regresi EGEE untuk multiple-random effects secara umum. Untuk variabel respon yang berdistribusi Poisson, bentuk model regresi EGEE dengan multiple-random effects-nya adalah: (
)
(
)
( (
(
)
)
(
)
( dengan
)
) merupakan vektor kolom parameter berukuran
variabel penjelas berukuran
dengan
vektor kolom random-effect berukuran
),
variabel independen, , dan
(
, dengan
merupakan
merupakan vektor kolom variabel desain
untuk pengaruh acak (random-effect) berukuran
berdistribusi
merupakan vektor kolom
. Random-effect,
, diasumsikan
,.
Pada kasus random slopes, diasumsikan
. Sehingga, untuk kasus ini, bentuk
model regresinya adalah:
Namun, apabila tidak menggunakan kasus random slopes, maka model regresinya seperti pada persamaan (3.12). Pada tulisan ini, yang akan dibahas adalah model regresi yang tidak menggunakan kasus random slopes. Variabel desain untuk pengaruh acak (random-effect) dengan variabel penjelas
, namun letak perbedaanya adalah variabel
pengambilan beberapa kategori secara acak (random). Misalnya ). Sedangkan variabel
ada (
memiliki kegunaan yang sama merupakan hasil dari
kategori dari
kategori yang
merupakan faktor tetap. Perbedaan keduanya dapat terlihat
pada aplikasi data yang akan dibahas pada bab 4. Selanjutnya, untuk ekspektasi model regresinya memiliki bentuk sebagai berikut:
(
(
)
)
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
Karena
dan berdasarkan MGF dari distribusi multivariate-normal, maka persamaan
di atas menjadi: (
)
( ) Karena
dapat direpresentasikan sebagai kombinasi linier dari elemen matriks
yang unik dari
, yaitu
, maka ekspektasi dari model regresi
dapat ditulis
sebagai berikut:
[
dengan
] merupakan matriks berukuran
( )
merupakan kombinasi vektor parameter berukuran ( adalah
dan baris ke- dari matriks
perkalian kronecker berukuran
adalah ( dan
)
[
) dan
. Baris ke- dari matriks , dengan
merupakan
merupakan matriks duplikasi berukuran
(Magnus and Abadir, 2005). Agar lebih jelas, dapat dilihat penurunan rumusnya sebagai berikut. Akan dilihat bentuk dan . Pertama, untuk [ [
[
.
] (
)
(
]
)
]
]
[
]
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
Dan kedua, untuk . [
] ]
[ [(
)(
[
)]
]
Dengan mensubstitusi
(
dan
ke dalam persamaan (3.13), maka:
(
)
(
)
(
)
Pembentukan ekspektasi model regresi dalam bentuk matriks ini dilakukan untuk mempermudah penaksiran parameternya. Selanjutnya untuk melakukan penaksiran parameter pada model regresi Poisson untuk multiple-random effects-nya, dapat digunakan metode EGEE. Penaksiran parameter model regresi Poisson dengan metode EGEE untuk multiple-random effects menggunakan maksimum likelihood. Hasil dari persamaan penaksiran parameter tersebut memiliki bentuk yang similar dengan GEE. Hanya saja terdapat perbedaan pada penurunan rumusnya. Agar lebih jelas, dapat dilihat penurunannya sebagai berikut.
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
)
Sebelumya akan dilihat bentuk pdf dari multiple-random effects, yaitu
(
, dengan
sebelumnya bahwa
. Telah disebutkan
,, sehingga bentuk pdf dari
adalah sebagai berikut: (
) )
(
Setelah diketahui bentuk pdf dari multiple-random effects, bentuk pdf dari
dan
, kemudian akan dicari
. Dengan menggunakan pdf bersyarat, diperoleh bentuk pdf keduanya
adalah sebagai berikut: | |
(
(
+
)
Dan pdf bersamanya adalah:
(
|
+
(
(
|
+
(
|
(
∏
(
+
)
)
(
)
|
)
|
)
Sehingga likelihood-nya menjadi: | ∏
(
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
|
(∑
+
Jadi, log-likelihood-nya adalah: | (
|
(∑
∑
++
| Untuk mendapatkan persamaan penaksiran parameternya, digunakan aturan rantai sebagai
berikut.
|
(
*
∑
(
∑
(
*
)
∑ Persamaan di atas dapat dibuat dalam bentuk matriks menjadi: ∑(
dengan (
) (
*
⁄ ⁄
⁄ ⁄
⁄ ⁄
⁄
⁄
⁄
merupakan matriks berukuran )
sebagai turunan dari ekspektasi model regresi terhadap masing-masing unsur dalam dan
,
merupakan invers dari matriks varians-kovarians dari merupakan matriks residual berukuran
berukuran
untuk klaster ke- .
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
,
Terbukti bahwa persamaan (3.8) memiliki bentuk yang similar dengan persamaan (3.14). Taksiran akhir parameter model regresinya dapat dicari dengan bentuk persamaan berikut: ∑(
*
Persamaan di atas merupakan persamaan yang dikenal sebagai Exact Generalized Estimating Equations (EGEE) untuk multiple-random effects. Jadi, untuk variabel respon yang berdistribusi Poisson, persamaan (3.14) dapat diubah menjadi bentuk: ∑(
*
∑
dengan,
merupakan transpos dari matriks
(
]
)
yang berukuran
dan
diagonal berukuran elemen ke-
[
(
, merupakan matriks
yang merupakan fungsi variansi untuk distribusi Poisson dengan
adalah
(
).
Apabila variabel respon yang berdistribusi Poisson ingin dibentuk menjadi distribusi keluarga eksponensial, maka bentuknya akan menjadi seperti pada persamaan (3.6), yang kemudian diperoleh
. Karena
, maka persamaan (3.16) menjadi:
∑
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
Matriks kovariansi (2.18),
(
yaitu
*(
)
)(
(
)
diadaptasi dari bentuk total variansi yang terdapat pada persamaan (
(
|
))
|
))
dan
(
)
)+
(
(
| ))
( (
(
| ))
)
(
)
( (
( (
)
)
*(
)(
(
)+
) (
(
)
(
(
)
(
)
(
)
)
)
Variansi dan kovariansi di atas jika dibentuk menjadi matriks varians-kovarians akan memiliki bentuk:
dengan,
merupakan matriks diagonal berukuran (
) dan elemen ke)
(
dengan elemen ke-
dari
adalah:
adalah (
). Sedangkan untuk elemen ke-
dari
adalah: (
(
) (
(
(
)
(
)
) )
)
Sehingga bentuk matriks varians-kovariansi
(
menjadi:
)
Jadi, Exact Generalized Estimating Equations (EGEE) untuk multiple-random effects dengan variabel respon yang berdistribusi Poisson adalah sebagai berikut: ∑
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
Karena taksiran akhir parameternya tidak dalam bentuk tertutup, maka diperlukan proses iterasi untuk mendapatkan hasil akhirnya. Iterasi yang digunakan adalah iterasi Newton-Raphson, dengan pada metode ini, parameter awal yang diambil haruslah tepat agar hasil akhir menjadi konvergen. Langkah-langkah iterasi Newton-Raphson untuk menyelesaikan sistem persamaan di atas adalah sebagai berikut. 1. Hitung nilai taksiran awal
, yang terdiri dari
dan
dengan menggunakan model
regresi Poisson sederhana. 2. Hitung matriks kovariansi
.
3. Hitung kembali [∑
]
[∑
4. Lakukan prosedur 2 hingga 3 sampai nilai taksiran parameter
] konvergen.
Data yang digunakan pada aplikasi pemodelan adalah membahas mengenai kasus gizi buruk di Kediri, Jawa Timur. Data diperoleh dari Potensi Desa Tahun 2008 (BPS, 2009). Faktorfaktor yang dianggap mempengaruhi banyaknya kasus gizi buruk adalah jumlah keluarga yang anggotanya menjadi buruh tani, jumlah sekolah, dan jumlah tenaga medis (Martinah, 2008). Sedangkan faktor acak yang digunakan dalam pemodelan ini adalah industri (industri kulit, industri kain-tenun, dan industri makanan dan minuman yang diambil secara acak dari 7 kategori) dan penyandang cacat (tuna netra, tuna rungu-wicara, dan tuna laras yang diambil secara acak dari 9 kategori). Sebelumnya ditentukan terlebih dahulu bahwa “kecamatan” dibentuk sebagai klaster, dengan simbol
dan “desa” sebagai pengamatan-pengamatan di dalam setiap klaster, dengan
simbol . Dari 24 kecamatan, diambil secara acak 14 kecamatan, dari setiap kecamatan dipilih 2 desa secara acak juga. Dengan menggunakan software, diperoleh model regresi Poisson awalnya adalah: (
)
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
dengan, = banyaknya kasus gizi buruk dalam 3 tahun terakhir pada kecamatan ke- desa ke- . = banyaknya keluarga yang anggotanya menjadi buruh tani pada kecamatan ke- desa ke- . = banyaknya sekolah (TK, SD, SMP, SMU, dan SMK) pada kecamatan ke- desa ke- . = banyaknya tenaga medis (dokter, dokter gigi, bidan, dukun dayi, dan tenaga kesehatan lainnya) pada kecamatan ke- desa ke- . = banyaknya industri pada kecamatan ke- desa ke- (faktor acak). = banyaknya penyandang cacat pada kecamatan ke- desa ke- (faktor acak). Kemudian, dengan menggunakan software lain, diperoleh model regresi Poisson yang optimal sebagai berikut: (
)
dengan
kecamatan dan
desa pada kecamatan ke- .
Penutup Berdasarkan uraian sebelumnya, terdapat simpulan sebagai berikut: 1.
Exact Generalized Estimating Equations (EGEE) merupakan solusi yang digunakan ketika ingin memakai model regresi PA-GEE dan CS-GEE secara bersamaan dengan memberikan matriks varians-kovarians yang sebenarnya.
2.
Model regresi EGEE tidak menggunakan Working Correlation Matrix (WCM) seperti yang terdapat pada model regresi GEE, dikarenakan EGEE telah menggunakan matriks varians-kovarians yang sebenarnya.
3.
EGEE memiliki 2 model regresi, yaitu model regresi dengan single-random effect dan model regresi dengan multiple-random effects.
4.
Pada model regresi EGEE dengan multiple-random-effects, diasumsikan bahwa randomeffects tersebut berdistribusi multivariate-normal.
5.
Taksiran parameter model regresi EGEE dapat dicari dengan menggunakan maksimum likelihood.
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013
6.
Dalam kasus khusus, dengan variabel responnya berdistribusi Poisson, diperlukan pendekatan Newton-Raphson. Hal ini dikarenakan hasil akhirnya tidak dalam bentuk tertutup, sehingga diperlukan iterasi untuk menyelesaikannya.
Daftar Pustaka Badan Pusat Statistika. (2009). Statistika Potensi Desa Provinsi Jawa Timur. Jawa Timur : BPS. Demidenko, Eugene. (2007). Poisson Regression for Clustered Data. International Statistical Review, 75, 96-113. Demidenko, Eugene. (2004). Mixed Model: Theory and Applications. Canada : John Wiley & Sons, Inc. Hardin, Joseph M. and Hilbe, James W. (2003). Generalized Estimating Equations. London : Chapman & Hall/CRC. Heagerty, P. J. and Kurland, B. F. (2001). Misscpecified Maximum Likelihood Estimates And Generalized Linear Mixed Model. Biometrika, 88, 973-985. Magnus, J. R. and Abadir, K. M. (2005). Matrix Algebra. Cambridge : Cambridge University Press. Martinah. (2008). Meluasnya Fenomena Gizi Buruk. Dikutip dari: Koran Republika yang diterbitkan pada tahun Selasa, 18 Maret 2008. McCullagh, P. and Nelder J.A. (1989). Generalized Linear Models. London : Chapman & Hall. Montgomery, D. C., Peck, E. A.,and Vining, G.G. (2001). Introduction to Linear Regression Analysis (3rd ed.). Canada : John Wiley & Sons, Inc. Zeger, S. L., Liang, K. Y., & Albert, P. A. (1988). Models for Longitudinal Data: A Generalized Estimating Equations Approach. Biometrics, 44, 1049-1060. Zorn, Christopher J. W. (2001). Generalized Estimating Equations for Correlated Data: A Review with Applications. American Journal of Political Sciences, 470-490.
Penaksiran parameter..., Anisah Nurul Hayati, FMIPA UI, 2013