1
1. PENDAHULUAN 1.1. Latar Belakang Dalam bidang biomedis seringkali ada kebutuhan untuk menganalisis hubungan antara peubah penjelas yang pengukurannya dilakukan secara berulang antar waktu (kovariat longitudinal) dengan peubah respon dalam suatu model regresi primer. Sebagai ilustrasi adalah hubungan antara daya tahan hidup pasien AIDS dengan banyaknya sel CD4+ dalam limfosit yang pengukurannya dilakukan secara berulang. Contoh lain adalah hubungan antara kejadian BBLR (Berat Bayi Lahir Rendah) dengan status gizi ibu yang direpresentasikan oleh berat badan ibu sebelum dan selama kehamilan. Hasil pengukuran longitudinal dalam hal ini dapat dijadikan sebagai penanda biologis (biomarker) bagi terjadinya suatu kejadian yang menjadi perhatian. Dalam kasus-kasus semacam ini, ingin diketahui bagaimana pengaruh profil longitudinal dari peubah penjelas (yang mungkin cukup kompleks) terhadap peubah respon yang menjadi perhatian. Dalam analisis data longitudinal yang baku, seperti dapat dijumpai dalam Laird dan Ware (1982), atau Verbeke dan Mollenberghs (2000), peubah respon merupakan hasil pengukuran longitudinal, sedangkan peubah penjelas bisa longitudinal atau sesaat, atau gabungan dari keduanya. Dengan demikian pemodelan peubah respon skalar dengan peubah penjelas longitudinal dalam hal ini tidak dapat diterapkan secara langsung. Salah satu pendekatan yang dilakukan untuk memodelkan hubungan antara peubah penjelas longitudinal dengan peubah respon skalar - yang dalam kepustakaan seringkali disebut primary endpoint - adalah pemodelan bersama (joint modeling). Pendekatan ini seringkali digunakan untuk memodelkan hubungan antara data longitudinal (sebagai peubah penjelas) dengan data daya tahan hidup (sebagai peubah respon), seperti dapat dijumpai dalam Henderson et al. (2000), serta Tsiatis dan Davidian (2004). Pemodelan bersama dengan respon primer berupa data biner diantaranya dapat dijumpai dalam Zhang dan Lin (1999), Li et al. (2004, 2007a, 2007b), serta Horrocks dan Heuvel (2009). Prinsip umum dari pendekatan model bersama adalah penggabungan dua model, yaitu submodel-1 yang diasumsikan mengikuti model linier campuran (linear mixed model) - mungkin setelah ditransformasi - untuk memodelkan data
2
pengukuran berulang, serta submodel-2 yaitu model regresi primer yang diasumsikan mengikuti model linier terampat (generalized linear model) untuk respon primer yang mengikuti sebaran keluarga eksponensial, atau model proporsional hazard untuk respon primer yang berupa data daya tahan hidup. Dalam pendekatan model bersama, peubah respon dalam model regresi primer bergantung pada kovariat longitudinal melalui pengaruh acak spesifik subyek. Dengan kata lain, pengaruh acak yang dihasilkan dari model campuran (submodel-1) menjadi peubah bebas pada model regresi primer (submodel-2). Namun karena pengaruh acak tak teramati, maka pendekatan naive dengan cara mensubstitusi langsung nilai dugaan OLS (Ordinary Least Squares) setiap subyek dari submodel-1 ke dalam submodel-2 sebagai peubah penjelas akan menghasilkan nilai dugaan parameter model regresi primer yang berbias, khususnya yang mengukur pengaruh kovariat longitudinal terhadap peubah respon primer (Zhang dan Lin 1999; Wang et al. 2000). Studi pembandingan beberapa metode pendugaan parameter dalam model bersama antara lain dilakukan oleh Zhang dan Lin (1999) dan Wang et al. (2000). Selama ini metode pendugaan parameter pada model bersama didasarkan atas asumsi bahwa hasil pengukuran longitudinal mengikuti model linier campuran dengan pengaruh acak dan galat intra-subyek menyebar normal. Namun dalam prakteknya tidak semua data dapat memenuhi asumsi ini. Ketidaknormalan dapat terjadi pada pengaruh acak, galat intra-subyek maupun keduanya. Selain itu dalam data longitudinal adakalanya deret data yang diamati tidak terlalu panjang, dan seringkali tidak lengkap. Karena itu perlu dicari pendekatan lain yang lebih kekar (robust) terhadap sebaran pengaruh acak maupun galat intra-subyek. Berkaitan
dengan
asumsi
kenormalan,
beberapa
penulis
berusaha
mengajukan pendekatan yang lebih kekar terhadap asumsi sebaran normal dari pengaruh acak. Misalnya Tsiatis dan Davidian (2001) menurunkan suatu penduga yang tidak memerlukan asumsi parametrik dari pengaruh acak untuk respon primer berupa daya tahan hidup. Demikian juga Li et al. (2004) mengajukan penduga kecukupan (sufficiency estimator) dan penduga bersyarat (conditional estimator) untuk respon primer yang berasal dari sebaran keluarga eksponensial. Pendekatan lain diajukan dengan mengendurkan asumsi kenormalan pengaruh
3
acak. Song (2002) mengajukan model bersama semiparametrik pada respon primer berupa data daya tahan hidup, dimana sebaran pengaruh acak tidak dispesifikasikan, namun hanya diasumsikan mengikuti fungsi kepekatan mulus yang dinyatakan sebagai fungsi kepekatan normal dikalikan suatu fungsi polinomial. Pendekatan serupa juga dilakukan oleh Li et al. (2007) terhadap respon primer yang berupa data biner. Namun pendekatan ini menimbulkan beban komputasi jika pengaruh acaknya banyak. Beberapa kajian terhadap pengaruh salah spesifikasi sebaran pengaruh acak terhadap sifat-sifat penduga parameter model bersama telah dilakukan. Pada peubah respon primer yang berupa daya tahan hidup, kajian tentang asumsi kenormalan pengaruh acak dilakukan oleh Song et al. (2002) dan Hsieh et al. (2006). Hasil temuan penulis-penulis tersebut mengindikasikan bahwa penduga parameter model bersama cukup kekar terhadap salah spesifikasi sebaran pengaruh acak. Namun Li et al. (2007) yang mengkaji hal yang sama terhadap peubah respon primer biner yang dimodelkan dengan regresi logistik memperoleh hasil yang berlawanan, bias cukup besar terjadi terutama untuk sebaran pengaruh acak yang bimodus. Rizopoulos dan Verbeke (2008) menyatakan bahwa ketika banyaknya pengukuran berulang untuk setiap subyek meningkat, maka salah spesifikasi sebaran pengaruh acak memberikan efek yang minimum untuk beberapa nilai dugaan parameter. Selama tiga dekade terakhir, sebaran peubah ganda t (multivariate t distribution) telah dikenal sebagai salah satu generalisasi yang berguna sebagai pendekatan kekar, terutama terhadap pencilan, misalnya dalam model regresi linier (Zellner 1976; Lange et al. 1989) dan model linier campuran (Pinheiro et al. 2001; Song et al. 2007; Lin 2008; Wang & Fan 2010). Kotz dan Nadarajah (2004), serta Nadarajah dan Kotz (2008) menyatakan bahwa dibandingkan sebaran normal ganda, sebaran peubah ganda t menawarkan alternatif yang lebih dapat hidup terus (viable) berkaitan dengan sebaran data di dunia riil, karena mempunyai ekor yang lebih realistis. Dalam bidang ekonomi sebaran t juga sering digunakan untuk pemodelan data ekonomi yang seringkali sebarannya berekor gemuk atau panjang. Namun Lange (1989) juga mencatat bahwa analisis yang sesuai untuk lokasi jika sebaran data tidak simetrik merupakan isu yang perlu diperhatikan.
4
Dalam konteks pemodelan bersama dengan respon primer berupa data daya tahan hidup, pendekatan kekar terhadap pencilan dikaji oleh Li et al. (2009) dengan mengasumsikan galat intra-subyek menyebar t-student. Namun untuk jenis peubah respon primer yang lain, belum ada kajian mengenai penggunaan sebaran t sebagai pendekatan kekar terhadap asumsi kenormalan dalam model bersama. Berkaitan dengan permasalahan di atas, beberapa hal yang diajukan dalam pertanyaan penelitian ini adalah: 1. Bagaimana pengaruh pelanggaran asumsi sebaran normal terhadap sifatsifat penduga parameter model bersama ? 2. Bagaimana pengaruh banyaknya deret data longitudinal pada submodel1 terhadap sifat-sifat penduga parameter model bersama ? 3. Bagaimana kinerja sebaran t sebagai pendekatan kekar terhadap assumsi kenormalan galat intra-subyek dalam model bersama?
1.2. Tujuan Penelitian Berdasarkan pertanyaan penelitian yang diuraikan di atas, maka penelitian ini bertujuan untuk: 1. Membuat formulasi model bersama dengan pengaruh acak menyebar t beserta pendugaan parameternya. 2. Mengevaluasi pengaruh banyaknya deret data longitudinal pada submodel-1 terhadap sifat-sifat penduga parameter model bersama. 3. Mengkaji penggunaan sebaran t untuk galat intra-subyek sebagai pendekatan yang lebih kekar terhadap asumsi kenormalan.
1.3. Kebaruan Penelitian (Novelty) Dalam penelitian ini dikaji pendekatan kekar terhadap asumsi kenormalan menggunakan sebaran t sebagai alternatif terhadap asumsi kenormalan galat intrasubyek. Penelitian dilakukan melalui kajian sifat-sifat statistika dari penduga model bersama dalam keadaan terjadi pelanggaran asumsi kenormalan galat intrasubyek.
5
Penelitian tentang model bersama belum banyak dilakukan, bahkan mungkin belum ada di Indonesia. Untuk respon primer yang berasal dari sebaran keluarga eksponensial, model bersama tidak dapat diimplementasikan secara langsung melalui perangkat lunak yang tersedia. Walaupun pada awalnya penelitian tentang model
bersama
dikembangkan
dalam
bidang
biomedis,
tetap
terbuka
kemungkinan diaplikasikan pada bidang lain seperti pertanian, peternakan, kehutanan, pendidikan dan sebagainya yang mempunyai permasalahan serupa.
1.4. Sistematika Penulisan Disertasi Secara keseluruhan disertasi ini dirancang menjadi enam bab. Pendahuluan disajikan dalam Bab 1. Bab 2 berisi tinjauan ulang mengenai analisis data longitudinal dengan pendekatan model linier campuran beserta pendugaan parameternya. Pada Bab 3 dilakukan kajian terhadap pemodelan bersama, meliputi beberapa pendekatan terhadap model bersama, metode pendugaan parameter, pengujian hipotesis serta contoh penerapan terhadap data. Pendekatan kekar yang diajukan dibahas dalam Bab 4. Pada bab ini dikaji mengenai sebaran peubah ganda t, serta formulasi pemodelan bersama atas dasar sebaran t beserta pendugaan parameternya. Dalam bab ini juga dibahas kajian simulasi ketaknormalan pengaruh acak dan galat intra-subyek, berikut pendekatan kekar atas dasar sebaran t untuk galat intra-subyek. Selanjutnya pembahasan secara umum dipaparkan dalam Bab 5, sedangkan berbagai temuan dalam penelitian ini disajikan dalam bentuk kesimpulan dan saran pada Bab 6.