BAB I PENDAHULUAN
1.1 Latar Belakang Masalah Analisis data survival merujuk pada sekumpulan metode statistika digunakan untuk menganalisis data antar kejadian, dimana variabel outputnya berupa lama waktu hingga terjadinya sebuah kejadian dengan memperhatikan variabel-variabelnya. Kejadian itu dapat berupa kematian, terjangkit penyakit, kesembuhan dari penyakit, dan lain sebagainya tergantung kepada bidang ilmu yang akan dipelajari. Berdasarkan contoh-contoh tersebut, hal yang cukup penting untuk diamati adalah lama waktu sampai terjadinya suatu event pada suatu unit penelitian / individu yang biasa disebut waktu survival. Biasanya diukur dalam hari, minggu, bulan dan tahun. Kendala yang sering muncul dalam analisis data survival adalah adanya pengamatan yang tidak lengkap, yang secara umum dapat dikelompokkan menjadi
data
tersensor
(censored)
dan
data
terpotong
(truncated).
Ketidaklengkapan data yang diperoleh dapat disebabkan oleh beberapa faktor, beberapa faktor tersebut misalnya keterbatasan informasi, keterbatasan sumber daya, dan terjadi hal yang tidak terduga. Masalah dari data tersensor dapat dibagi menjadi beberapa tipe penyensoran, namun dalam penelitian ini hanya akan dibahas untuk data yang tersensor kanan. Dalam data survival jika ingin mempelajari data yang melibatkan banyak variabel penjelas, maka dapat digunakan regresi. Regresi yang sering digunakan untuk menganalisis data survival juga ada bermacam-macam, yaitu regresi parametrik, regresi nonparametrik dan regresi semiparametrik. Regresi parametrik menuntut syarat bahwa baseline survival atau hazardnya mengikuti suatu distribusi tertentu. Jika syarat tersebut tidak dipenuhi dapat digunakan regresi nonparametrik yang salah satunya adalah regresi Rank. Kemudian jika baseline hazardnya mengikuti model nonparametrik
sedangkan variabel-variabel independennya mengikuti model parametrik maka digunakan regresi semiparametrik, dimana yang sangat terkenal adalah regresi Cox. Regresi Cox atau sering dikenal dengan model hazard proporsional dapat digunakan untuk mengetahui hubungan antara waktu hidup dengan satu atau lebih kovariat (variabel independen). Sehingga, jika terdapat kovariat yang tak teramati maka akan menimbulkan kerancuan. Sebagai ilustrasi, sebuah penelitian dilakukan untuk mengetahui apakah sebuah terapi efektif diterapkan untuk mengetahui waktu survival penderita leukimia. Ketika dilakukan analisis menggunakan regresi Cox tanpa mengamati adanya kovariat yang tak teramati, didapatkan hasil bahwa terapi tersebut tidak efektif, namun para ahli medis meyakini bahwa terapi adalah metode terbaik dalam perawatan. Asumsi dari para ahli medis tersebut belum tentu salah karena sebagian penelitian bisa jadi terdapat keberagaman data yang disebabkan oleh kovariat yang tidak teramati. Kovariat yang tidak teramati disebut dengan frailty. Gagasan munculnya model frailty (kelemahan) terjadi bahwa setiap individu pasti memiliki kelemahan yang berbeda-beda (heterogen) sehingga dapat dikatakan bahwa individu yang paling lemah (frail) akan mengalami kematian yang lebih cepat daripada individu lainnya (Therneau dan Grambasch, 2000). Analisis survival memiliki asumsi bahwa populasi yang diamati bersifat homogen, tetapi dalam banyak kasus populasi harus mempertimbangkan unsur keheterogenan dalam sampel (Wienke, 2003). Oleh karena itu, diperlukan suatu model frailty dalam analisis data survival. Pada skripsi ini, membahas prosedur estimasi parameter dari variabelvariabel penjelas dan frailty pada model shared gamma frailty dengan menggunakan metode maximum hierarchical likelihood yang dikenalkan oleh Ha.dkk (2011). Model shared gamma frailty merupakan salah satu model frailty yang mampu memperhitungkan heterogenitas untuk mengukur dependensi antara waktu-waktu survival terhadap faktor acak yang tidak teramati, yang terkadang diabaikan dalam penelitian. Model ini merupakan
perluasan dari model Cox dengan memperhatikan adanya penyensoran kanan pada data observasi. Estimasi parameter dilakukan dengan memaksimumkan fungsi profile hierarchical likelihood yang dibangun dari fungsi survival bersama pasangan observasi. Dengan Retricted Maximum Partial Likelihood (REMPL) turunan kedua pendekatan Laplace (
) pada adjusted profile
h-likelihood. Kemudian diperoleh parameter dependensi dari model dengan memanfaatkan metode Breslow untuk mengestimasi parameter beta dan algoritma Newton Raphson, sehingga dapat menyederhanakan prosedur estimasi dan mengurangi waktu komputasi. 1.2
Rumusan dan Batasan Masalah Perumusan masalah merupakan suatu hal yang sangat penting dilakukan
dalam suatu penulisan agar sesuai dengan tujuan yang akan dicapai. Perumusan masalah yang jelas akan memudahkan dalam perancangan dan pelaksanaan penulisan, sehingga infomasi yang diperoleh sesuai dengan harapan. Pembatasan masalah penulis memberikan aplikasi model dalam studi kasus serta analisa dari hasil yang diperoleh. Dalam skripsi ini penulis juga membatasi pemodelan dengan asumsi bahwa shared frailty mengikuti distribusi Gamma terutama untuk kasus data tersensor kanan dan bagaimana mengestimasi masing-masing parameter dengan memaksimumkan fungsi Hierarchical Likelihood nya menggunakan pendekatan algoritma Newton Raphson. 1.3
Tujuan Penelitian Penulisan laporan tugas akhir ini memiliki tujuan untuk :
1. Mempelajari teori Hierarchical Likelihood pada suatu distribusi tertentu, misalnya pada skripsi ini dengan distribusi gamma. 2. Mengestimasi parameter pada suatu model dalam Regresi Cox, yaitu dengan memaksimumkan fungsi Hierarchial Likelihood melalui algoritma Newton Raphson.
3. Memahami dan menganalisis suatu studi kasus data hirarki frailty pada Regresi Cox sehingga dapat memiliki kecukupan model yang ada. 4. Mengetahui apakah frailty dalam studi kasus berpengaruh terhadap variabel output
1.4 Manfaat Penelitian Penulisan tugas akhir ini diharapkan bisa memberikan manfaat sebagai berikut: 1. Penelitan ini dapat diterapkan untuk menangani masalah-masalah yang berkaitan dengan ilmu dalam penelitian ini 2. Menambah
wawasan
dan
ilmu
pengetahuan
tentang hierarchical
likelihood dapat dikembangkan ke bidang-bidang lainnya 3. Bagi peneliti lain, penelitian ini nantinya dapat menjadi salah satu referensi untuk pembaharuan metode yang lebih baru
1.5 Metode Penelitian Skripsi ini dikerjakan dengan mengkaji beberapa metode secara teoritis dan studi kasus dengan mengacu pada beberapa literatur. Literatur-literatur tersebut diperoleh dengan mempelajari buku-buku,jurnal maupun artikel atau situs jaringan internet yang berhubungan dengan materi. Dalam pengerjaan skripsi ini tak lepas dari software penunjang diantaranya R dan excell untuk melakukan analisis data sesuai studi kasus yang didapat. 1.6 Tinjauan Pustaka Ide dan inspirasi dalam penulisan penelitian ini berawal dari beberapa penelitian yang telah dilakukan sebelumnya dengan tema yang sama. Ada beberapa penelitian terdahulu mengenai frailty dalam bentuk skripsi yang penulis temukan, diantaranya adalah adalah Trisnawaty (2007) melakukan estimasi dari parameter variabel-variabel penjelas dan variabel frailty dengan menggunakan EM algoritma, dimana frailty yang digunakan diasumsikan berdistribusi gamma.
Putri (2011) melakukan estimasi dari parameter-parameter parameter dan variabel frailty dengan metode Modified EM algoritma. Kemudian Jayanti (2008) dalam penelitiannya yang berjudul “Estimasi Nested Frailty Model dalam Regresi Cox dengan Gibbs Sampling” melakukan estimasi parameter dengan model nested frailty menggunakan metode Gibbs Sampling. Selanjutnya adalah Wulandari (2014) dalam tesisnya yang berjudul “Pendekatan Hierarchical Likelihood untuk Model Lognormal Frailty dalam Analisis Data Survival”. Dalam penelitiannya tersebut Dewi mengestimasi parameter variabel-variabel penjelas dan variabel frailty berdasarkan turunan pertama pendekatan Laplace (
) menggunakan EM algoritma dengan
memanfaatkan penelitian Ha,dkk (2001) Lee, dkk (2003) melakukan estimasi model frailty dengan hierarchical generalisasi linear model dengan regresi poisson. Estimasi yang melibatkan beberapa model seleksi dengan memaksimumkan HGLM persamaan regresinya. Penelitian-penelitan tersebut menjadi referensi penulis untuk memahami konsep dari frailty yang kemudian memunculkan ide untuk membahas materi dalam bentuk metode baru yang digunakan untuk mengestimasi model frailty. Kemudian penulis mempelajari metode yang dicetuskan oleh Ha, dkk (2011) sebagai perbandingan dengan penelitian sebelumnya. Penulis membahas untuk mengestimasi
frailty dengan memaksimumkan fungsi hierarki likelihoodnya
menggunakan turunan laplace orde kedua dengan Retricted Maximum Partial Likelihood (REMPL) yang diasumsikan berdistribusi gamma. 1.7 Sistematika Penulisan Ruang lingkup pembahasan tugas akhir ini akan diuraikan secara sistematis dalam lima bab sebagai berikut : BAB I
Pendahuluan Dalam bab ini akan dibahas latar belakang penulisan skripsi, rumusan masalah, batasan masalah, tujuan penelitian skripsi, metode penelitian, tinjauan pustaka serta sistematika penulisan.
BAB II
Landasan Teori Bab ini berisi tentang yang berhubungan toeri dan definisi-definisi yang mendukung dengan materi yang dibahas
BAB III
Estimasi Model shared Frailty Gamma melalui Maximum Hierarchical Likelihood dalam Regresi Cox Bab ini membahas secara menyeluruh mengenai proses dan estimasi parameter dari model Frailty yang berdistribusi Gamma dengan
memaksimumkan
fungsi
Hierarchical
Likelihood
menggunakan algoritma Newton Raphson. BAB IV
Studi Kasus Dalam bab ini membahas tentang aplikasi analisis menggunakan metode maksimum hierarchial likelihood untuk model shared frailty gamma pada contoh kasus data hirarki yang ada pada package frailtyHL dan digunakan simulasi untuk membandingkan hasil estimasi model Cox dengan asumsi waktu survival independen dengan hasil estimasi dari model frailty.
BAB V
Kesimpulan dan Saran Dalam bab yang terakhir ini berisikan kesimpulan akhir proses yang diperoleh dari pemecahan masalah. Kemudian bab ini juga berisi saran penulis sebagai akibat dari kekurangan yang terjadi dari hasil penelitian yang dilakukan sehingga bermanfaat untuk kelanjutan atau pengembangan dari pembahasan sebelumnya.