1 Seminar Nasional Statistika IX Institut Teknologi Sepuluh Nopember, 7 November 2009
REGRESI COX MULTIVARIAT DENGAN DISTRIBUSI WIEBULL MULTIVARIAT 1
Irfan Wahyudi
1
Mahasiswa S-3 Statistika FMIPA ITS, Surabaya Kampus ITS Sukolilo, Surabaya 60111 e-mail:
1
[email protected]
ABSTRAK Resistensi parasit malaria terhadap suatu obat anti malaria adalah kemampuan parasit malaria untuk dapat bertahan hidup, berkembang biak, dan menimbulkan gejala penyakit dalam tubuh manusia meskipun pengobatan secara teratur dengan dosis tertentu sudah diberikan sampai batas-batas yang masih dalam toleransi kemampuan penderita. Penelitian ini menghasilkan prosedur dan langkah-langkah untuk mendapatkan faktor-faktor yang berpengaruh terhadap resistensi parasit malaria. Metode yang digunakan untuk menganalisis data survival ini adalah Regresi Cox Multivariat dengan distribusi Weibull Multivariat. Pendugaan parameter dapat diperoleh dengan metode Maximum Likelihood Estimation (MLE), sedangkan untuk memperoleh nilai parameter tersebut digunakan metode iterasi Newton Raphson. Untuk pengujian hipotesis digunakan metode Maximum Likelihood Ratio Test (MLRT). Kata kunci:
Resistensi parasit malaria; Regresi Cox Multivariat; Distribusi Weibull Multivariat; Maximum Likelihood Estimation (MLE); Likelihood Ratio Test (LRT).
Pendahuluan Parasit malaria mempunyai kemampuan yang luar biasa dalam membentuk resistensi terhadap obat antimalaria. Hal ini mendorong perlunya usaha pembuatan obat anti malaria baru yang mampu mengatasi masalah resistensi tersebut. Pembuatan obat malaria yang baru bukanlah suatu pekerjaan yang mudah dan pembuatan obat tersebut memerlukan biaya yang besar (Tjitra, 2000). Hasil survey awal yang sudah dilaksanakan di Rumah Sakit Umum Abepura Jayapura, Puskesmas Kota Raja, dan Puskesmas Hedam Abepura, menurut dokter dan perawatnya, kurang lebih 50% yang berobat tiap harinya dan rawat inap adalah pasien penyakit malaria. Kemudian kurang lebih 75% pasien penderita malaria adalah jenis Plasmodium falciparum. Pemberian obat terhadap pasien malaria oleh dokter masih dominan obat klorokuin, alasan dokter 1
2
memberikan obat itu karena obat ini merupakan obat antimalaria standar untuk pengobatan profilaksis, pengobatan malaria klinis dan pengobatan radikal malaria tanpa komplikasi dalam program pemberantasan malaria. Namun pada akhir-akhir ini obat klorokuin sudah banyak yang resisten parasit positif (Tjitra, 2004), sehingga beberapa dokter sudah beralih memberikan obat kombinasi antimalaria antara lain amodiakuin plus sulfadoksin, klorokuin plus sulfadoksin, kina plus doksisiklin, dan lain sebagainya terhadap pasien penyakit malaria. Sampai saat ini belum ada obat malaria yang dapat dijamin selalu sensitif atau selalu mengakibatkan parasit negatif setelah memakan obat antimalaria. Dalam statistika, data lama hidup atau panjang waktu sampai terjadinya suatu peristiwa tertentu disebut data survival. Data survival meliputi waktu survival,
terjadinya
respon terhadap
perlakuan dan karakteristik
yang
berhubungan dengan respon survival. Waktu survival merupakan waktu dari awal perlakuan sampai terjadinya respon pertama kali yang ingin diamati. Data survival banyak dijumpai pada penelitian kedokteran, khususnya tentang penyakit kronis untuk menguji tingkat ketahanan hidup seorang pasien terhadap penyakit tersebut. Respon berupa lama waktu suatu peristiwa yang diharapkan terjadi, mungkin belum terjadi dalam periode pengumpulan data diakhiri sehingga tidak dapat diamati waktu survivalnya. Pengamatan seperti inilah yang dikatakan sebagai pengamatan yang disensor (Collet, 1994). Metode Hazard Multirespon Cox atau Regresi Cox adalah metode yang dapat digunakan untuk menganalisa data survival yang dikombinasikan dengan data biner yang merupakan status/koding terjadi atau tidak terjadinya suatu kejadian (variabel sensor). Karakteristik dari regresi Cox ini adalah mengakomodasikan adanya data tersensor (Rahayu, 2003). Penelitian ini bertujuan untuk mendapatkan penaksir parameter pada model regresi Cox multivariat, mendapatkan statistik uji untuk menguji parameter pada model regresi Cox multivariat, mendapatkan prosedur untuk memperoleh model regresi Cox multivariat terbaik, menentukan model waktu survival pada data waktu survival parasit malaria dan akan diaplikasikan untuk menentukan
2
3
faktor-faktor apa saja yang berpengaruh terhadap resistensi parasit
malaria
menggunakan regresi Cox multivariat dengan distribusi Weibull. Distribusi Weibull Multivariat Jika variabel random ,
dilakukan transformasi
maka didapatkan variabel random
Y
, .
mempunyai distribusi MVE (Multivariate Exponensial).
Fungsi survival bersama dari
dapat dinyatakan dalam bentuk
= = = exp(
) . Untuk mencari
dimana.
FY1 (y1) ∴ . Secara umum,
Berdistribusi Weibull dengan parameter
berdistribusi Weibull dengan parameter .
⇒ Jacobian
Transformasi
p.d.f dari
adalah
Fungsi distribusi dari
adalah
3
. Misalkan
4
p.d.f bersama dimana
adalah
determinan dari matriks Jacobian ,
Sehingga diperoleh
dimana
, dan nilai
dari
sehingga diperoleh
dimana
. Jadi
Estimasi Parameter Distribusi Weibull Multivariat Misalkan
populasi
X
dengan
p.d.f
nya
tujuannya adalah menaksir parameter dengan menggunakan metode MLE (Maximum Likelihood Estimation). 4
5
1. Langkah pertama, ambil n sampel random yaitu ,
x1, x2,..., xn dimana
,
.
2. Langkah ke-dua, membuat fungsi Likelihood .
3. Langkah
ke-tiga,
membuat
dari
funsi
Likelihood.
. 4. Langkah ke-empat, menurunkan
terhadap parameter-
parameternya, baik turunan pertama maupun turunan ke dua. Untuk dapat
dihasilkan
bentuk
yang
implisit
h(0, 1,..., k )
dan
juga diperoleh turunan keduanya 5. Langkah ke-lima, menggunakan iterasi Newton Raphson
(m1) m H1((m) )h((m) ) , iterasi berhenti
bilangan yang sangat kecil dan
jika
(m1) (m)
dimana
adalah Norm dari vektor.
Model Regresi Cox Para
ahli
parasitologi
menggunakan
metode
kuantitatif
untuk
mengembangkan epidemologi dan untuk menguji hipotesis dalam analisis data. Dari aspek statistika penulis akan membahas tentang pemodelan dengan menggunakan regresi Cox dan regresi logistik dan perbandingan bias pada parameter kedua model yang diperoleh dari metode taksiran Maximum Likelihood. Regresi Cox adalah metode regresi yang digunakan untuk menganalisis data survival. Analisis mengenai data survival disebut analisis survival. Data survival diperoleh dari catatan waktu yang dicapai suatu objek sampai terjadinya peristiwa tertentu yang disebut sebagai failure event. Menurut Cox dan Oakes (1984) dalam menentukan waktu survival, T, terdapat tiga elemen yang harus diperhatikan yaitu: waktu awal (time origin), definisi failure event keseluruhan harus jelas, dan skala waktu sebagai satuan penggukuran harus jelas.
5
6
Perbedaan antara analisis survival dengan analisis statistik lainnya adalah adanya data tersensor. Menurut Miller (1998) data dikatakan tersensor jika pengamatan waktu survival hanya sebagian, tidak sampai terjadi failure event. Penyebab terjadinya data tersensor antara lain: Melebihi batas akhir periode penelitian, Terjadi kematian pada masa perawatan di rumah sakit, Terjadi pengunduran diri karena sebab tertentu misalnya meninggal dunia di perjalanan menuju rumah sakit yang dirujukkan. Jika T melambangkan waktu survival dan mempunyai distribusi peluang f(t), maka fungsi distribusi kumulatif dinyatakan t
sebagai berikut:
F(t) P(T t) f (u) du .
Fungsi survival, S(t), didefinisikan
0
sebagai probabilitas suatu objek bertahan setelah waktu ke – t, yaitu S(t) = P(T > t) = 1 – P(T
t) = 1 – F(t). Fungsi hazard merupakan laju
failure/kegagalan sesaat dengan asumsi individu telah bertahan sampai waktu ke –
P(t T t t T t) h(t) lim . Sehingga t0 t
t, yang didefinisikan sebagai
diperoleh hubungan antara fungsi survival dan fungsi hazard yaitu
h(t)
f t St .
Hubungan antara fungsi kumulatif hazard, H(t), dan fungsi survival, S(t), adalah: t
H(t) = - ln S(t) dimana
H(t) h(t) dt . 0
Model Regresi Cox Multirespon Jika resiko failure pada waktu tertentu bergantung pada nilai x1, x2, ..., xp dari p variabel penjelas, X1, X2, ..., Xp, maka nilai variabel tersebut diasumsikan telah tercatat sebagai time origin. Misalkan h0(t) sebagai fungsi hazard untuk setiap objek dengan nilai dari semua variabel penjelas penyusun vektor x adalah nol, maka fungsi h0(t) dikatakan sebagai fungsi baseline hazard (Collet, 1994). Model
umum
hazard
multirespon
untuk
hi (t) h0(t)exp(1i x1 2i x2 ...pi xp)
6
respon
ke
i
adalah
atau dapat ditulis sebagai
7
hi (t ) h0i (t )exp(iT x) ,
i
dengan
dan
dimana
x
t
,
.
Penaksiran Parammeter Regresi Cox Multirespon Dalam menentukan model terbaik, maka ditaksir koefisien variabel penjelas X1, X2, ..., Xp dalam komponen linier model, yaitu
1, 2 ,...,p dan
fungsi baseline hazard. Dua komponen tersebut dapat ditaksir secara terpisah. Pada kasus dimana terdapat lebih dari satu atau lebih data survival yang tersensor. Ambil data sebanyak n sampel, dan terdapat r sampel failure dengan waktu yang berbeda, urutan waktu failure yaitu
t(1) t(2) t(n) , dimana t( j) adalah
urutan waktu failure ke-j. Dan n-r individu yang survive (bertahan) dalam waktu * * t(1) t(2) t(*nr) dinyatakan tersensor, maka fungsi likelihood untuk
nr
L(B) f (ti )Si (tl*) dimana l1 i1 n
model hazard multirespon dapat dinyatakan
B [12 k ]T . Jika data yang diperoleh terdiri atas n pengamatan waktu survival ditunjukkan oleh
t(1) , t(2) ,..., t(n) dimana δi adalah indikator sensor yang bernilai
nol bila tersensor kanan untuk waktu survival ke-i, ti (i = 1, 2, ..., n) dan bernilai 1 untuk lainnya. Maka, fungsi likelihood dapat dinyatakan dalam bentuk
L(B) { fi (xi , t)}i {Si (xi , t)}1i . i1 n
Untuk
mendapatkan
penaksir
maka
persamaan
Si (xi , t)1 1F(ti )diturunkan pertama terhadap parameter-parameternya dan i
disamadengankan
nol
serta
turunan
kedua
untuk
mendapatkan
titik
maksimumnya. Metode yang digunakan untuk mendapatkan nilai penaksir parameter adalah dengan menggunakan metode iterasi numerik Newton – Raphson (Collet, 1994).
7
8
Pengujian Parameter Model Setelah mendapatkan variabel penjelas yang masuk dalam model maka langkah selanjutnya adalah melakukan uji signifikansi pada parameter model. Dengan metode MLRT (Maximum Likelihood Ratio Test) dapat ditentukan statistik uji. 1. Uji Srentak
ˆ1, ˆ2,..., ˆk
Dengan MLE diperoleh
Uji hipotesis:
, Minimal ada satu
a)
dimana
Membuat fungsi Likelihood di bawah populasi membuat fungsi Likelihood di bawah
b)
Memaksimumkan dan
c)
dan
,
,
. dengan MLE didapat
.
Membuat rasio Menentukan
Daerah Penolakan: Tolak 2.
jika
.
Uji Parsial Uji hipotesis
: untuk
Statistik uji
;
:
Daerah penolakan : Tolak
apabila
Kesimpulan Penelitian ini akan menghasilkan prosedur dan langkah-langkah untuk menentukan faktor-faktor apa saja yang berpengaruh terhadap resistensi parasit malaria menggunakan regresi Cox multivariat dengan distribusi Weibul 8
9
Daftar Pustaka Callas, W., Pastides, Harris dan Hosmer, D. W. (1998), Empirical Comparison of Proportional Hazards, Poisson and Logistic Regression Modeling of Occupational Cohort Data, American Journal of Industrial Medicine, Wiley-Liss, Inc. Burlington. Collet, D. (1994), Modelling Survival Data In Medical Research, Chapman and Hall, London. Cox, D. R. and Oakes, D. (1984), Analysis of Survival Data, Chapman and Hall, London. Langner, I., Bender, R., Lenz-Tonjes., R., Kuchenhoff, H., dan Blettner, M. (2003), Bias of Maximum Likelihood Estimates In Logistic and Cox regression Models: A Comparative Simulation Study. SFB 368 Disussion Paper 362, Munchen. Le, C. (1997). Applied Survival Analysis. John Wiley and Sons Inc, New York. Mc.Cullagh, P. dan Nedler, J.A, 1989. Generalized Linear Models. Chapman and Hall, London. Miller, R. (1998). Survival Analysis. John Wiley and Sons. Inc, New York. NIAID, 2000. The Epidemology of Febrile Malaria Episodes in an Area of Unstable and Seasonal Transmision. Transaction of the Royal Society of Tropical Medicine and Higiene, 94(6): 645-651. Rahayu, P. (2003), Regresi Survival Hazard Proporsional Cox Sebagai Metode Alternatif Bagi Regresi Logistik Biner Dalam Mengidentifikasi Faktor Resiko. Studi Kasus Kematian Penderita Penyakit Jantung Koroner di RSUD Dr. Soetomo Surabaya, Thesis, Surabaya. Stanford T, Shulman, 1994. The Biologic & Clinical Basis of infections Diseases (terjemahan). Gadjah Mada University Press, pp 502-513. Tjitra E, 2000. Obat Antimalaria: Dalam Malaria Epidemology, Patogenesis, Manifestas Klinis & Penanganannya. Jakarta: Penerbit Buku Kedokteran AGC, hal. 201 - 202
9