BAB I
PENDAHULUAN
1.1.
Latar Belakang Masalah Secara umum, analisis survival dapat didefinisikan sebagai seperangkat
metode yang digunakan untuk menganalisis data di mana variabel outputnya berupa lama waktu hingga terjadinya sebuah peristiwa dengan melihat variabel-variabel yang menjadi perhatian. Peristiwa tersebut dapat berupa kematian, munculnya sebuah penyakit, kambuhnya sebuah penyakit, pernikahan, perceraian dan lain sebagainya tergantung kepada bidang ilmu yang akan dipelajari. Lama waktu menuju terjadinya sebuah peristiwa biasa disebut waktu survival yang biasanya diukur dalam hari, minggu, bulan, atau tahun. Dalam menganalisis data survival tidak dapat digunakan regresi linear biasa karena regresi linear biasa tidak mampu menangani adanya observasi yang tersensor, yaitu observasi yang tidak teramati karena hilang ataupun tidak lengkap. Sebagai contoh, akan dilakukan pengamatan waktu survival pasien yang mengidap kanker. Namun dalam selang waktu survival ada pasien yang pindah rumah sakit sehingga tidak dapat diamati lagi. Ada beberapa tipe pensersoran, namun dalam penelitian ini hanya akan dibahas untuk data yang tersensor kanan karena pada umumnya tipe pensersoran inilah yang muncul pada data survival. Ada beberapa metode yang digunakan untuk menganalisis hubungan antara seperangkat variabel prediktor dengan waktu survival. Metode-metode tersebut meliputi metode parametrik, nonparametrik dan semiparametrik. Dalam metode parametrik diasumsikan bahwa distribusi yang mendasari waktu survival mengikuti suatu distribusi tertentu seperti misalnya eksponensial, gamma, Weibull dan lain sebagainya. Jika distribusi yang mendasari waktu survival tidak diketahui, artinya
1
2
data tidak mengikuti suatu distribusi tertentu yang sudah ada, maka digunakan metode nonparametrik. Dalam metode nonparametrik terdapat dua metode yang terkenal, yaitu metode Kaplan-Meier dan Nelson-Aalen. Namun Kaplan-Meier lebih sering digunakan dibanding Nelson-Aalen. Metode Kaplan-Meier digunakan untuk memperoleh statistik desktiptif univariat untuk data survival meliputi nilai tengah dan membandingkan survival experience antara dua atau lebih grup dari individu. Seandainya data survival yang ingin dipelajari adalah data yang melibatkan banyak variabel penjelas, maka dapat digunakan regresi. Regresi yang sering digunakan untuk menganalisis data survival juga ada bermacam-macam, yaitu regresi parametrik, regresi nonparametrik dan regresi semiparametrik. Regresi parametrik menuntut syarat bahwa baseline survival atau hazardnya mengikuti suatu distribusi tertentu. Jika syarat tersebut tidak dipenuhi dapat digunakan regresi nonparametrik yang salah satunya adalah regresi Rank. Kemudian jika baseline hazardnya mengikuti model nonparametrik sedangkan variabel-variabel independennya mengikuti model parametrik maka digunakan regresi semiparametrik, dimana yang sangat terkenal adalah regresi Cox. Seperti regresi linear biasa, tujuan dari metode regresi Cox adalah untuk mengetahui hubungan antara waktu survival dengan variabel-variabel prediktor. Dalam regresi Cox, fungsi hazard secara penuh dipengaruhi oleh vektor kovariat. Sehingga, jika terdapat kovariat yang tak teramati maka akan menimbulkan kerancuan. Sebagai ilustrasi, sebuah penelitian dilakukan untuk mengetahui apakah sebuah terapi efektif diterapkan untuk mengetahui waktu survival penderita leukemia. Ketika dianalisis menggunakan regresi Cox tanpa mengamati adanya kovariat yang tak teramati, didapatkan hasil bahwa terapi tersebut tidak efektif, namun para ahli medis meyakini bahwa terapi tersebut adalah metode terbaik. Keyakinan para ahli medis tersebut belum tentu salah karena bisa jadi terdapat heterogenitas data yang
3
disebabkan oleh kelompok atau kovariat yang tak teramati. Kelompok tersebut yang disebut dengan frailty. Ada dua macam frailty yang selama ini dikembangkan oleh para peneliti, yaitu one-component frailty (frailty satu komponen) dan multi-component frailty atau sering disebut multilevel frailty. Distribusi yang mendasari frailty ada berbagai macam, yaitu gamma, inverse Gaussian, lognormal dan lain sebagainya. Begitupun metode pendekatan yang digunakan untuk melakukan estimasi parameternya. Terdapat berbagai macam pendekatan seperti misalnya algoritma EM, algoritma MEM, Gibbs sampling, penalized likelihood dan lain sebagainya. Dalam penelitian ini penulis tertarik untuk membahas pendekatan yang diperkenalkan oleh Ha, dkk (2001) yaitu hierarchical likelihood yang digunakan untuk mengestimasi parameter dari variabel-variabel penjelas dan frailty yang diasumsikan berdistribusi lognormal. Untuk metode lognormal frailty, McGilchrist & Aisbett (1991) dan McGilchrist (1993) menggunakan parsial likelihood Cox, namun metode tersebut tidak dapat menangani adanya ties. Klein (1992) dan Nielsen dkk (1992) menggunakan prosedur estimasi EM. Dalam prosedur model gamma frailty memang memberikan solusi analitis, namun tidak untuk distribusi lainnya, selain itu estimasi varians untuk parameter yang diamati tidak tersedia secara langsung. (Ha, dkk, 2001) Dalam prosedur hierarchical likelihood akan memberikan algoritma yang lebih efisien untuk model frailty dengan distribusi yang lebih beragam, termasuk gamma dan lognormal. Oleh sebab itu, berdasarkan beberapa kelebihan dari hierarchical likelihood yang dikemukakan oleh Ha, dkk (2001) penulis tertarik untuk membahas pendekatan hierarchical likelihood yang nantinya digunakan untuk mengestimasi model lognormal frailty satu komponen pada data survival dua level.
4
1.2.
Tujuan dan Manfaat Penelitian Berdasarkan latar belakang masalah di atas, tujuan dari penelitian ini adalah
sebagai berikut: a.
Mempelajari pendekatan hierarchical likelihood untuk model.
b.
Mengetahui apakah frailty berpengaruh terhadap variabel keluaran.
c.
Melakukan perbandingan dengan pendekatan terdahulu.
d.
Mendapatkan nilai estimasi dari parameter-parameter model.
Selanjutnya, beberapa manfaat yang dapat diambil dari hasil penelitian ini adalah: a.
Memperbaharui ilmu dengan cara melakukan penelitian terhadap metode baru di bidang analisis survival.
b.
Menambah khazanah ilmu bagi penulis, khususnya di bidang statistika kesehatan dan di bidang matematika pada umumnya.
c.
Bagi peneliti lain, penelitian ini nantinya dapat menjadi salah satu referensi untuk pembaharuan metode yang lebih baru.
d.
Penelitan ini dapat diterapkan untuk menangani masalah-masalah yang berkaitan dengan ilmu dalam penelitian ini.
1.3.
Pembatasan Masalah Pada penelitian ini, batasan masalah sangat diperlukan supaya tidak terjadi
penyimpangan dari tujuan awal. Oleh karena itu, pembahasan hanya akan difokuskan pada pendekatan hierarchical likelihood untuk model lognormal frailty satu komponen, terutama untuk kasus data tersensor kanan. Data tersensor kanan yang dimaksud merupakan salah satu kasus khusus observasi tidak lengkap pada data antar kejadian.
1.4.
Tinjauan Pustaka Ada beberapa penelitian terdahulu mengenai frailty dalam bentuk skripsi yang
penulis temukan, diantarnya adalah “Estimasi untuk Model Frailty Gamma dalam
5
Regresi Cox” yang disusun oleh Trisnawaty pada tahun 2007. Dalam penelitiannya tersebut Trisnawaty melakukan estimasi dari parameter variabel-variabel penjelas dan variabel frailty dengan menggunakan EM algoritma, dimana frailty yang digunakan diasumsikan berdistribusi gamma. Data yang digunakan untuk aplikasinya adalah data infeksi ginjal yang merupakan data survival berstruktur dua level. Pada tahun 2011 dalam skripsinya yang berjudul “Estimasi Model Shared Frailty Gamma pada Regresi Cox dengan Algoritma Modified EM (MEM) ”, Putri meneliti apa yang diteliti oleh Trisnawaty (2007) dengan metode Modified EM algoritma. Selanjutnya frailty juga menjadi perhatian Jayanti (2008) dalam penelitiannya yang berjudul “Estimasi Nested Frailty Model dalam Regresi Cox dengan Gibbs Sampling”. Penelitian-penelitan tersebut menjadi referensi penulis untuk memahami konsep dari frailty yang kemudian memunculkan ide untuk membahas materi dalam bentuk metode baru yang digunakan untuk mengestimasi model frailty. Kemudian penulis mempelajari metode yang dicetuskan oleh Ha, dkk (2001) di mana metode ini bukan hanya digunakan untuk mengestimasi frailty yang diasumsikan berdistribusi gamma namun juga lognormal. Dalam penelitian ini nantinya akan dilakukan perbandingan dengan salah satu metode yang sudah digunakan oleh penelitianpenelitian yang terdahulu tersebut di atas. Pada tahun 1991 McGilchrist dan Aisbett melakukan penelitian mengenai frailty didalam analisis survival. Dalam jurnalnya yang bertajuk “Regression with Frailty in Survival Analysis” memusatkan perhatian pada model regresi untuk analisis survival dengan menambahkan efek frailty. Kemudian dua tahun sesudahnya yaitu tahun 1993, dua peneliti tersebut mengembangkan penelitian tentang frailty yang mereka tuangkan ke dalam jurnalnya yang berjudul “REML Estimation for Survival Models with Frailty”. REML adalah kependekan dari Restricted Maximum Likelihood, merupakan metode yang dipakai untuk mengestimasi model survival dengan penambahan frailty. Lee dan Nelder (1996) mengusulkan untuk menggunakan
6
hierarchical likelihood untuk inferensi model dengan efek random (frailty) dalam jurnalnya
yang
berjudul
“Hierarchical
Generalized
Linear
Models
(with
Discussion)”. Selanjutnya Ha, dkk (2001) mewujudkan usulan tersebut dalam hasil penelitiannya yang berjudul “Hierarchical Likelihood Approach for Frailty Models”. Ha, dkk membahas mengenai model frailty, prosedur hierarchical likelihood dan sekilas penjelasan mengenai kelebihan pendekatan tersebut dibandingkan dengan pendekatan-pendekatan terdahulu.
1.5.
Metodologi Penelitian Metode penelitian yang digunakan adalah metode literatur, yaitu peneliti
menggunakan jurnal-jurnal, buku-buku, artikel-artikel serta hasil penelitian-penelitian terdahulu yang dapat mendukung penelitian ini yang penulis dapatkan di perpustakaan maupun melalui internet. Penulis berangkat dari pemahaman mengenai munculnya frailty dalam data survival dua level yang kemudian dilanjutkan dengan pemodelan frailty tersebut. Setelah itu dilakukan proses matematis untuk didapatkan formula yang digunakan untuk mengestimasi parameter menggunakan pendekatan hierarchical likelihood. Selanjutnya dilakukan aplikasi untuk dapat dibandingkan dengan metode atau pendekatan terdahulu.
1.6.
Sistematika Penulisan Tesis ini disusun dengan sistematika penulisan sebagai berikut:
BAB I PENDAHULUAN Bab ini berisi tentang latar belakang masalah, tujuan dan manfaat penelitian, pembatasan masalah, tinjauan pustaka, metodologi penelitian dan sistematika penulisan.
7
BAB II LANDASAN TEORI Bab ini berisi tentang teori-teori yang akan digunakan dalam pembahasan, di antaranya adalah variabel random, distribusi log normal, distribusi bersyarat, fungsi likelihood, analisis survival yang meliputi data survival, data tersensor serta regresi Cox, data multilevel dan frailty, metode Newton-Raphson dan Akaike Information Criterion (AIC). BAB III PENDEKATAN HIERARCHICAL LIKELIHOOD UNTUK MODEL LOGNORMAL FRAILTY SATU KOMPONEN DALAM ANALISIS DATA SURVIVAL DUA LEVEL Bab ini berisi pembahasan mengenai prosedur estimasi model lognormal frailty dengan menggunakan pendekatan hierarchical likelihood. BAB IV STUDI KASUS Pada bab ini akan dibahas mengenai aplikasi data infeksi ginjal menggunakan model lognormal frailty. Data yang digunakan diambil dari jurnal McGilchrist dan Aisbett (1991). BAB V KESIMPULAN DAN SARAN Dalam bab terakhir ini penulis menyampaikan kesimpulan dari hasil pebahasan pada bab-bab sebelumnya dan saran yang nantinya dapat digunakan oleh peneliti selanjutnya untuk mengembangkan metode atau model dalam penelitian.