BAB I PENDAHULUAN
1.1. Latar Belakang Masalah Analisis survival merupakan metode statistik yang digunakan untuk analisis pada data-data survival. Data survival merujuk pada data antar kejadian, yaitu data lama waktu sampai terjadinya suatu peristiwa (event). Event dalam survival analisis dapat berupa kematian, terjangkit penyakit, kesembuhan dari penyakit, kembali terjangkit penyakit setelah sembuh dan lain sebagainya. Terdapat banyak metode dalam analisis survival yang dapat digunakan, sesuai dengan data yang diperoleh serta maksud dan tujuan yang diinginkan. Pada dasarnya, metode-metode tersebut bertujuan untuk mengestimasi fungsi survival dan fungsi hazard. Fungsi survival yaitu probabilitas suatu individu bertahan (survive) lebih lama dari suatu waktu tertentu. Sedangkan fungsi hazard merupakan tingkat (rate) terjadinya suatu event. Fungsi survival maupun fungsi hazard dapat diestimasi secara parametrik maupun secara nonparametrik. Estimasi dengan metode parametrik dilakukan dengan mengasumsikan data survival mengikuti suatu distribusi tertentu. Estimasi dengan metode paramterik sangat baik digunakan jika distribusi dari data survival diketahui, karena akan diperoleh estimasi fungsi survival dan fungsi hazard yang akurat. Namun, estimasi dengan metode parametrik terkadang tidak mudah untuk dilakukan, terutama untuk distribusi-distribusi dengan fungsi densitas yang rumit. Selain itu, untuk memperoleh estimasi fungsi survival dan fungsi hazard dengan metode parametrik, masih terdapat parameter dari distribusi yang perlu untuk diestimasi. Untuk itu, metode nonparametrik dapat digunakan sebagai alternatif untuk mengestimasi fungsi survival dan fungsi hazard. Kelebihan metode nonparametrik dibandingkan dengan metode parametrik adalah metode nonparametrik tidak memerlukan asumsi data survival berdistribusi tertentu, sehingga dapat mengatasi
1
2 kesulitan yang muncul pada metode parametrik digunakan yaitu informasi tentang distribusi dari populasi. Penelitian dalam bidang kesehatan terutama pada penyakit-penyakit kronis seperti kanker seringkali berhadapan dengan masalah ketidakpastian tentang penyebab kematian. Pasien kanker bisa saja meninggal dunia secara alami, namun demikian pasien tersebut bisa saja memiliki harapan hidup yang lebih lama jika saja pasien tersebut tidak menderita kanker. Dalam kasus seperti ini diperlukan metode yang dapat mengestimasi proporsi dari unit penelitian yang meninggal karena sebab tertentu, misalnya kanker. Survival relatif merupakan salah satu metode dalam analisis survival yang dapat digunakan untuk tujuan tersebut. Survival relatif merupakan rasio dari peluang tahan hidup terobservasi (observed survival) dengan peluang tahan hidup yang diharapkan (expected survival). Survival relatif biasanya digunakan untuk mengestimasi efek dari suatu penyakit tertentu terhadap kematian, tetapi penyebab kematian tidak diketahui secara pasti. Survival relatif diestimasi tanpa perlu mengetahui penyebab kematian. Hal ini dikarenakan survival relatif membandingkan kematian yang dapat disebabkan oleh berbagai macam hal dalam grup pengamatan, terhadap kematian dalam populasi yang lebih luas. Survival relatif dapat diestimasi tanpa pengaruh kovariat maupun dimodelkan dengan pengaruh kovariat. Estimasi survival relatif tanpa pengaruh kovariat dapat dilakukan dengan menggunakan metode Ederer I, Ederer II, dan Hakulinen (Rutherford dkk., 2012; Pokhrel, 2007). Perbedaan ketiga metode tersebut terletak pada estimasi tahan hidup harapan. Sedangkan pemodelan survival relatif dengan pengaruh kovariat dapat dilakukan antara lain dengan model Est`eve atau model Hakulinen-Tenkanen (Dickman dkk., 2004). Model survival relatif Est`eve memodelkan relatif survival berdasarkan data tiap unit penelitian. Sedangkan model Hakulinen-Tenkanen dimodelkan menggunakan data tiap grup atau kelompok. Pada penelitian tentang penyakit-penyakit kronis seperti kanker seringkali dilihat juga event-event selain kematian, misalnya pertama kali menderita kanker,
3 kembali menjalani perawatan di rumah sakit, atau kenaikan stadium dari kanker tersebut. Kasus-kasus seperti di atas dapat dimodelkan menggunakan model multistatus. Model multistatus merupakan salah satu metode dalam analisis survival di mana event yang menjadi perhatian lebih dari satu. Model multistatus dapat diestimasi menggunakan beberapa metode, yaitu metode Markov, Non-Markov, maupun Semi-Markov. Dari ketiga metode tersebut, metode Markov merupakan metode yang banyak digunakan dalam pemodelan multistatus karena kesederhanaan modelnya (Meira-Machado dkk., 2009). Model multistatus Markov paling sederhana yaitu model multistatus Markov waktu homogen (time homogeneous multistate Markov model), di mana intensitas transisi diasunsikan konstan sepanjang waktu (Andersen dan Keiding, 2002; MeiraMachado dkk., 2009). Asumsi kehomogenan intensitas transisi terhadap waktu memudahkan untuk mengestimasi model multistatus. Namun dalam tataran praktis asumsi tersebut sulit dipenuhi. Salah satu solusinya yaitu menggunakan model multistatus Markov dengan intensitas transisi konstan dalam satu interval waktu, namun berbeda antar interval-interval waktu. Model tersebut dikenal dengan model Markov sepotong-sepotong dengan intensitas konstan (Markov piecewise constant intensities). Dalam tesis ini akan dibahas estimasi survival relatif pada data multistatus menggunakan model Markov sepotong-sepotong dengan intensitas konstan. Model Markov sepotong-sepotong dengan intensitas konstan dipilih karena asumsi intensitas konstan dalam suatu interval waktu lebih mudah dipenuhi dalam tataran praktis. Estimasi model tersebut akan dilakukan menggunakan metode estimasi maksimum likelihood.
1.2. Tujuan dan Manfaat Penelitian Berdasarkan latar belakang masalah di atas, tujuan dari penelitian ini adalah sebagai berikut: 1. Mempelajari konsep model survival relatif pada data multistatus untuk mengestimasi efek kovariat terhadap fungsi model relatif survival pada data mul-
4 tistatus. 2. Melakukan studi kasus untuk model survival relatif pada data multistatus. Selanjutnya hasil dari penelitian ini diharapkan menambah wawasan bagi siapa saja, terutama yang mendalami bidang analisis data survival sehingga dapat digunakan sebagai acuan untuk penelitian yang lebih lanjut.
1.3. Pembatasan Masalah Pembatasan masalah sangat diperlukan supaya tidak terjadi penyimpangan dari tujuan awal penelitian. Oleh karena itu, pembahasan pada penelitian ini difokuskan pada estimasi model surival relatif pada data multistatus. Model survival relatif yang digunakan adalah model survival relatif berdasar model Est`eve yang dimodelkan dengan model multistatus Markov. Model multistatus Markov yang digunakan yaitu model multistatus Markov sepotong-sepotong dengan intensitas konstan. Estimasi pada model tersebut dilakukan dengan menggunakan estimasi metode maksimum likelihood.
1.4. Tinjauan Pustaka Suryani (2008) membahas tentang model survival relatif berdasar model yang diperkenalkan oleh Est`eve dkk. (1990). Metode survival relatif tersebut merupakan metode survival relatif yang diestimasi menggunakan metode maksimum likelihood. Pembahasan tentang model survival relatif juga dilakukan oleh Aryawati (2014) yang membahas model survival relatif dengan pendekatan yang diperkenalkan oleh Hakulinen dan Tenkanen (1987). Metode Est`eve digunakan untuk data unit atau data yang tidak dikelompokkan. Sedangkan metode Hakulinen-Tenkanen digunakan untuk data berkelompok. Pohar dkk. (2009) menggunakan algoritma Ekspektasi-Maksimasi (EM) untuk mengestimasi model regresi survival relatif di mana penyebab kematian (event) diperlakukan sebagai data hilang. Metode yang dikembangkan Pohar dkk. (2009) tersebut tidak memerlukan asumsi terkait baseline dari excess hazardnya. Therneau dan Grambsch (2000) menggunakan perluasan model regresi Cox untuk memodelkan survival relatif. Dari beberapa model survival
5 relatif yang ada, model survival relatif Est´eve dan model survival relatif HakulinenTenkanen merupakan model survival relatif yang paling populer dan menjadi rujukan untuk pengembangan model-model survival relatif. Model survival relatif, baik model Est´eve, model Hakulinen-Tenkanen, maupun model-model survival relatif yang lain hanya bisa digunakan untuk data dengan event tunggal. Untuk itu, model survival relatif diperluas untuk model multistatus, di mana model multistatus dapat digunakan untuk kasus multievent. Andersen dan Keiding (2002) menulis tentang beberapa bentuk model multistatus seperti competing risk dan model illness-death. Tulisan sejenis juga dipaparkan oleh Hougaard (2000). Pembahasan terkait model multistatus lebih banyak berfokus pada model multistatus Markov. Meira-Machado dkk. (2009) membahas beberapa macam model multistatus Markov dan menyebutkan model multistatus Markov dipilih karena kesederhanaan modelnya. Estimasi terkait model multistatus Markov dibahas oleh Kalbfleisch dan Lawless (1985). Dalam tulisannya tersebut, dibahas prosedur estimasi model multistatus Markov tanpa dan dengan pengaruh kovariat. Estimasi dilakukan dengan menggunakan metode estimasi maksimum likelihood. Dalam pengembangan selanjutnya, Saint-Pierre dkk. (2003) menulis tentang estimasi maksimum likelihood untuk model Markov homogen dan model Markov sepotong-sepotong dengan intensitas konstan, di mana terdapat pengaruh kovariat dalam model tersebut. Dalam tesis ini akan dibahas perluasan model survival relatif Est`eve yang dimodelkan menggunakan model multistatus markov sepotong-sepotong dengan intensitas konstan berdasarkan penelitian dari Huszti dkk. (2012).
1.5. Metodologi Penelitian Metode yang digunakan dalam penelitian ini adalah studi literatur dengan referensi utama yang digunakan adalah Huszti dkk. (2012), Pada penelitian ini difokuskan pada estimasi model survival relatif pada data multistatus. Model survival relatif yang digunakan adalah model survival relatif aditif yang diperkenalkan oleh Est`eve dkk. (1990). Sedangkan model multistatus yang digunakan adalah model
6 multistatus Markov sepotong-sepotong dengan intensitas konstan (Markov Piecewise Constants Intensities, Markov PCI). Estimasi parameter dari model dilakukan dengan menggunakan metode maksimum likelihood. Fungsi likelihood yang digunakan dibentuk dengan menghitung likelihood tiap transisi untuk seluruh individu yang menjadi subjek penelitian. Terakhir dilakukan studi kasus menggunakan model survival relatif pada data multistatus.
1.6. Sistematika Penulisan Tesis ini ditulis dengan sistematika penulisan sebagai berikut. Pendahuluan yang berisi tentang latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, tinjauan pustakan, metode penelitian, sistematika penulisan diberikan pada Bab I. Bab II berisi landasan teori yang menunjang pembahasan, di antaranya data survival, data tersensor, fungsi survival, fungsi hazard, model relative survival additif, model multistatus, proses stokastik, rantai Markov waktu diskret, dan rantai Markov waktu kontinu. Bab III berisi pembahasan model survival relatif Markov. Bab IV studi kasus dengan data real berdasarkan model yang dibahas dalam Bab III. Bab V merupakan penutup yang berisi kesimpulan dan saran terkait model survival relatif Markov.