PERBANDINGAN MODEL COX PROPORTIONAL HAZARD DAN MODEL PARAMETRIK BERDASARKAN ANALISIS RESIDUAL (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull )
Muthmainnah
PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2007 M/1428 H PERBANDINGAN MODEL COX PROPORTIONAL HAZARD
DAN MODEL PARAMETRIK BERDASARKAN ANALISIS RESIDUAL (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull )
Skripsi Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Sains Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta
Oleh : MUTHMAINNAH 103094029740
PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2007 M/1428 H
PERBANDINGAN MODEL COX PROPORTIONAL HAZARD DAN MODEL PARAMETRIK BERDASARKAN ANALISIS RESIDUAL (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull ) Skripsi Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Sains Pada Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta Oleh : Muthmainnah 103094029740 Menyetujui, Pembimbing I
Pembimbing II
Suma’inna, M.Si
Sarini Abdullah, M.Stats
Mengetahui, Ketua Program Studi Matematika
Nur Inayah, M.Si NIP. 150 326 911
PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UIN SYARIF HIDAYATULLAH JAKARTA Dengan ini menyatakan bahwa skripsi yang ditulis oleh : Nama
: Muthmainnah
NIM
: 103094029740
Program Studi : Matematika Judul Skripsi
: Perbandingan Model Cox Proportional Hazard dan Model Parametrik Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull )
Dapat diterima sebagai syarat kelulusan untuk memperoleh gelar Sarjana Sains pada Program Studi Matematika, Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta. Jakarta, Agustus 2007 Menyetujui, Pembimbing I
Pembimbing II
Sarini Abdullah, M.Stats
Suma’inna, M.Si Mengetahui,
Dekan Fakultas Sains dan Teknologi
Ketua Program Studi Matematika
Dr. Syopiansyah Jaya Putra, M. Sis
Nur Inayah, M.Si
NIP. 150 317 956
NIP. 150 326 911
PENGESAHAN UJIAN Skripsi yang berjudul “Perbandingan Model Cox Proportional Hazard dan Model Parametrik Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker ParuParu yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull )” telah diuji dan dinyatakan lulus dalam sidang Munaqosah Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta pada hari Rabu, 29 Agustus 2007. Skripsi ini telah diterima sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu (S1) pada Program Studi Matematika. Jakarta, Agustus 2007 Tim Penguji, Penguji I
Penguji II
Hermawan Setiawan, M.Si
Nur Inayah, M.Si
NIP. 250 000 505
NIP. 150 326 911
Mengetahui, Dekan Fakultas Sains dan Teknologi
Dr. Syopiansyah Jaya Putra, M. Sis NIP. 150 317 956
PERNYATAAN DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-BENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI ATAU LEMBAGA MANAPUN. Jakarta, Agustus 2007
Muthmainnah 103094029740
“Sesungguhnya dalam penciptaan langit dan bumi, dan silih bergantinya malam dan siang, terdapat tanda-tanda bagi orang-orang yang berakal.” (Ali Imran : 190)
ABSTRACT Muthmainnah, Comparation Of Cox Propotional Hazard Model and Parametric Model Based On Residual Analyzes (Case Study : Lungs cancer data from S-Plus 2000 software example data and simulation for exponensial and weibull distribution) (Supervised by Sarini Abdullah, M.Stats dan Suma’inna, M.Si) The Cox Propotional Hazard Model widely used in survival analyzes. It has more advantage than parametric model because it doesn’t need functional form specification from baseline hazard function, and assumptions checked about distribution form that must be done in parametric model. Even tough it has easiness like mention above, but it doesn’t mean that The Cox Proportional Hazard Model always better than parametric model. If the survival time’s distributions are known, than parametric model gives better result. It happens because from parametric model’s result some quantity calculation can be done, such as hazard or survival value for some observation with some characteristics. In this Final Project, Cox Proportional Hazard Model was compared with parametric model based on Cox-Snell, Martingale, deviance, normal deviate and log-odds residual types. Both models was compared using lungs cancer data that processed by S-Plus 2000 software. Simulation was used because getting conclusion can’t be done using just one data set. Generally, if the distributions are known, than parametric model gives better result. For residual analyzes, normal-deviate and log-odds residual can be used to choosing matched model for some data. Key Words : Cox Proportional Hazard Model, Parametric Model, Residual
ABSTRAK
Muthmainnah, Perbandingan Model Cox Proportional Hazard dan Model Parametrik Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull) (Dibawah bimbingan Sarini Abdullah, M.Stats dan Suma’innah M.si) Model Cox proportional hazard dipergunakan secara luas dalam analisis survival. Model Cox proportional hazard ini mempunyai keuntungan lebih dari model parametrik karena tidak memerlukan spesifikasi bentuk fungsional dari fungsi baseline hazard dan juga tidak memerlukan pengecekan asumsi-asumsi mengenai kelayakan bentuk distribusi yang diharuskan pada model parametrik. Walaupun memiliki beberapa kemudahan seperti yang disebutkan di atas, akan tetapi model Cox proportional hazard tidak selalu lebih baik daripada model parametrik. Jika distribusi dari survival time diketahui, maka model parametrik memberikan hasil yang lebih baik. Hal ini karena dari hasil model parametrik dapat dilakukan perhitunganperhitungan kuantitas tertentu, misalnya nilai hazard maupun survival untuk suatu observasi dengan karakteristik tertentu. Dalam Skripsi ini dilakukan perbandingan antara model Cox proportional hazard dan model parametrik berdasarkan beberapa tipe residual (Cox-Snell, Martingale, dan deviance), serta dua residual baru yaitu, normal-deviate dan log-odds. Perbandingan kedua model dilakukan dengan menggunakan data kanker paru-paru yang diolah dengan menggunakan software S-Plus 2000. Karena pengambilan kesimpulan tidak cukup hanya dengan menggunakan satu set data, maka dalam skripsi ini dilakukan simulasi. Secara umum, jika distribusinya diketahui maka model parametrik memberikan hasil yang lebih baik. Untuk analisis residualnya, residual normal-deviate dan residual logodds odds dapat digunakan untuk pemilihan model yang cocok untuk suatu data. Kata kunci: Model Cox proportional hazard, model parametrik, residual
KATA PENGANTAR
Segala puji dan syukur penulis haturkan ke hadirat Allah swt yang telah melimpahkan rahmat dan hidayah-Nya kepada penulis sehingga dapat menyelesaikan skripsi yang berjudul “Perbandingan Model Cox Proportional Hazard dan Model Parametrik Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker ParuParu yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull)” dengan baik. Penulisan skripsi ini merupakan salah satu syarat kelulusan memperoleh gelar Sarjana Sains di Program Studi Matematika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta. Pada kesempatan ini penulis ingin mengucapkan terima kasih yang tak terhingga dan memberikan penghargaan yang sebesar-besarnya kepada: 1. Bapak Dr. Syopiansyah Jaya Putra, M.Sis, Dekan Fakultas Sains dan Teknologi. 2. Ibu Nur Inayah, M.Si, Ketua Program Studi Matematika. Terima kasih atas nasehat dan bimbingan selama penulis kuliah di Fakultas Sains dan Teknologi Program Studi Matematika. 3. Ibu Sarini Abdullah, M.Stats selaku pembimbing I dan ibu Suma’inna, M.Si selaku pembimbing II. Terima kasih atas bimbingan, pengertian, ilmu yang sangat bermanfaat dan waktu yang telah disisihkan demi selesainya skripsi ini. 4. Seluruh dosen yang telah mengajarkan ilmu-ilmu yang bermanfaat bagi penulis.
5. Bapak dan mama tercinta yang tak henti-hentinya memberikan doa dan semangat. Mas Ruri dan adik-adikku ( Arif dan Khatim ), Mbah kakung dan Mbah putri, Yayuk Susun, semua Om dan Tente. Sahabat-sahabatku yang paling setia dalam suka dan duka (cewek-cewek dan cowok-cowok centil: Dini Anggraini, Rina Yuanita, Yosy witasary, Zulfa Saida, Dennis Sugianto, Muhammad Iqbal, Rochdian Sandhi). “Kake” (Aji Kalimasada) yang selalu setia mendengarkan keluh kesah penulis. Teman-teman kos-kosan: (Mba Yenny, Mba Fahrah, Farrah, Dila, Ai, Gina, Rara, Nurul dan Arma). Teman-teman seperjuangan: (Citra anisa, Farida Yasmin, Mahmud Dzuldzalali, Muhammad Riyadi, Retno Rondiyahwati, Suparno, dan Zamzamiah). Teman-teman mahasiswa Matematika angkatan 2002, 2004-2006, serta seluruh pihak yang telah membantu terselesainya panulisan skripsi ini yang tidak dapat penulis sebutkan satu persatu. Penulis menyadari bahwa masih selalu ada langit di atas langit, dan begitu juga dengan skripsi ini yang penulis yakin masih bisa untuk disempurnakan dan dikembangkan lagi. Oleh karena itu, penulis membuka diri untuk saran dan kritik yang membangun. Dan akhir kata, penulis berharap mudah-mudahan skripsi ini memberikan manfaat bagi kita semua. Amin! Jakarta,
Agustus 2007
Penulis
DAFTAR ISI
HALAMAN JUDUL LEMBAR PENGESAHAN ABSTRAK ......................................................................................................
i
ABSTRACT ..................................................................................................
ii
KATA PENGANTAR ....................................................................................
iii
DAFTAR ISI ..................................................................................................
v
DAFTAR GAMBAR ......................................................................................
vii
BAB I
PENDAHULUAN ...........................................................................
1
1.1 Latar Belakang ..........................................................................
1
1.2 Perumusan Masalah ..................................................................
3
1.3 Pembatasan Masalah ................................................................
3
1.4 Tujuan Penelitian ......................................................................
3
BAB II LANDASAN TEORI ......................................................................
5
2.1 Definisi Survival Time ...............................................................
5
2.2 Jenis Data pada Analisis Survival ..............................................
8
2.2.1 Data Tersensor ..................................................................
8
2.2.2 Data Terpancung ..............................................................
9
2.3 Model Cox proportional hazard ................................................
10
2.4 Model Parametrik ......................................................................
12
2.4.1 Distribusi Eksponensial ....................................................
13
2.4.2 Distribusi Weibull ............................................................
15
2.5 Residual .....................................................................................
16
2.5.1 Residual Cox-Snell (rCi ) ..................................................
16
2.5.2 Residual Martingale ( rMi ) ...............................................
19
2.5.3 Residual Deviance (rDi ) ...................................................
20
2.5.4 Residual Baru ...................................................................
20
BAB III METODOLOGI ...............................................................................
28
3.1 Pengumpulan Data .....................................................................
28
3.2 Pengolahan Data ........................................................................
28
3.3 Analisis Data .............................................................................
29
BAB IV ANALISIS HASIL ...........................................................................
31
4.1 Data Kanker Paru-Paru ..............................................................
31
4.2 Simulasi .....................................................................................
42
BAB V KESIMPULAN DAN SARAN .........................................................
48
5.1 Kesimpulan ................................................................................
48
5.2 Saran ..........................................................................................
49
DAFTAR PUSTAKA .....................................................................................
50
LAMPIRAN ...................................................................................................
52
DAFTAR GAMBAR
Gambar 3.1
Tahapan Pengolahan Data ...................................................
28
Gambar 3.2
Tahapan Simulasi ................................................................
29
Gambar 4.1
Plot Residual Cox-Snell dan Residual Martingale Data Kanker Paru-Paru untuk Model Cox proportional hazard ................ ...............................................................................................31
Gambar 4.2
Plot Residual Deviance, Normal-deviate, dan Log-odds Data Kanker Paru-Paru untuk Model Cox proportional hazard ... ...............................................................................................32
Gambar 4.3
Histogram Residual Cox-Snell dan Martingale Data Kanker Paru-Paru untuk Model Cox proportional hazard ................ ...............................................................................................33
Gambar 4.4
Histogram Residual Deviance, Normal-deviate, dan Log-odds Data Kanker Paru-Paru untuk Model Cox proportional hazard ............................................................................................... ...............................................................................................34
Gambar 4.5
Plot Residual Cox-Snell, Martingale dan Deviance Data Kanker Paru-Paru untuk Model Parametrik ...................................... ...............................................................................................35
Gambar 4.6
Plot Residual Log-odds dan Normal-deviante Data Kanker ParuParu untuk Model Parametrik................................................ ...............................................................................................36
Gambar 4.7
Histogram Residual Cox-Snell Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru ................. ...............................................................................................37
Gambar 4.8
Histogram Residual Martingale Model Eksponensial (bawah) dan Model Weibull (atas) Data Kanker Paru-Paru ............... ...............................................................................................38
Gambar 4.9
Histogram Residual Deviance Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru ................. ...............................................................................................39
Gambar 4.10 Histogram Residual Normal-deviate Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru ........... ...............................................................................................40 Gambar 4.11 Histogram Residual Log-odds Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru ................. ...............................................................................................41 Gambar 4.12 Histogram dan QQ-Plot Residual Normal-deviate (atas) dan Residual Log-odds (bawah) Model Cox Proportional hazard dari Data yang Berdistribusi Eksponensial .................................. ...............................................................................................44
Gambar 4.13 Histogram dan QQ-Plot Residual Normal-deviate Model Eksponensial (atas) dan Model Weibull (bawah) dari Data yang Berdistribusi Eksponensial ................................................... ...............................................................................................45 Gambar 4.14 Histogram dan QQ-Plot Residual Log-odds Model Eksponensial (atas) dan Model Weibull (bawah) dari Data yang Berdistribusi Eksponensial ......................................................................... ...............................................................................................46 Gambar 4.15 Histogram Model Eksponensial dan Model Weibull dari Data yang Berdistribusi Weibull dengan 40% Data Tersensor Kanan ............................................................................................... ...............................................................................................47
BAB I PENDAHULUAN
1.1 Latar Belakang Model Cox proportional hazard digunakan secara luas dalam analisis survival. Model Cox proportional hazard ini mempunyai keuntungan lebih dari model parametrik karena tidak memerlukan spesifikasi bentuk fungsional dari fungsi baseline hazard dan juga tidak memerlukan pengecekan asumsi-asumsi mengenai kelayakan bentuk distribusi yang diharuskan pada model parametrik. Walaupun memiliki beberapa kemudahan seperti yang disebutkan di atas, akan tetapi model Cox proportional hazard tidak selalu lebih baik daripada model parametrik. Jika distribusi dari survival time diketahui, maka model parametrik memberikan hasil yang lebih baik. Hal ini karena dari hasil model parametrik dapat dilakukan perhitungan-perhitungan kuantitas tertentu, misalnya nilai hazard maupun survival untuk suatu observasi dengan karakteristik tertentu. Berdasarkan pemaparan di atas, maka muncul suatu pertanyaan yaitu, model mana yang lebih baik (Cox proportional hazard dan parametrik) digunakan untuk memodelkan suatu data tertentu. Oleh karena itu pada skripsi ini akan dilakukan perbandingan model Cox proportional hazard dengan model parametrik. Perbandingan dilakukan pada suatu contoh data untuk melihat pada kondisi atau tipe data seperti apa model Cox proportional hazard lebih baik daripada model parametrik, dan sebaliknya.
Pengecekan residual sangat penting dalam penentuan ketepatan kecocokan model. Oleh karena itu, pada skripsi ini akan dibahas beberapa tipe residual untuk perbandingan. Dalam hal ini digunakan residual Cox-Snell, Martingale, deviance dan perhitungan residualnya. Selain itu akan digunakan residual baru yang diperkenalkan oleh Nardi dan Schemper, yaitu residual log-odds dan residual normal-deviate. Untuk menentukan residual yang terbaik dalam penentuan kecocokan model, maka beberapa tipe residual tersebut akan diterapkan pada suatu data. Akan tetapi satu set data tidak cukup untuk membuat kesimpulan atau menggeneralisasi hasil perbandingan model Cox proportional hazard dengan model parametrik. Hal ini karena setiap set data bergantung pada sifat dasar penelitian yang dilakukan. Oleh karena itu, diperlukan suatu simulasi dengan menggunakan data yang dihasilkan dari pembangkit angka acak pada Software S-plus 2000 dan dilakukan perbandingan model untuk angka acak tersebut. Harapan dari simulasi ini adalah kejelasan perbedaan antara model Cox proportional hazard dan model parametrik dapat tercapai.
1.2 Perumusan Masalah Perumusan masalah dalam penulisan skripsi ini adalah :
a. Bagaimana perbandingan antara model Cox proportional hazard
dengan
model parametrik? b. Bagaimana simulasi dalam pembentukan model Cox proportional hazard dan parametrik? c. Residual apa yang terbaik dalam menentukan model yang cocok untuk suatu data?
1.3 Pembatasan Masalah Dalam skripsi ini model yang dianalisis adalah model Cox proportional hazard dan model parametrik. Untuk model parametrik dibatasi, yaitu hanya model eksponensial dan model Weibull. Jenis data pada skripsi ini pun dibatasi, yaitu hanya data tersensor tipe I (data tersensor kanan).
1.4 Tujuan Penelitian Adapun tujuan dari penulisan skripsi ini adalah a.
Membandingkan model Cox proportional hazard dengan model
parametrik
berdasarkan beberapa jenis residual (residual Cox-Snell, Martingale, deviance, normal-deviate, dan log-odds).
b. Melakukan simulasi dalam pembentukan model Cox proportional hazard dan parametrik.
c. Menentukan jenis residual yang terbaik dalam menentukan model yang cocok untuk suatu data berdasarkan hasil simulasi.
BAB II LANDASAN TEORI
2.1 Definisi Survival Time Survival time adalah waktu untuk kejadian pada suatu peristiwa yang telah dirumuskan dengan baik [1]. Metode ini adalah dasar pengembangan dalam ilmuilmu kedokteran dan biologi. Metode ini juga digunakan secara luas dalam ilmuilmu sosial dan ekonomi. Selain itu metode ini juga dapat diterapkan dengan baik dalam bidang teknik (analisis reliability dan failure time). Secara umum, aplikasi survival time dalam suatu pengamatan dapat dijelaskan melalui disrtibusi dari survival time. Misalkan T > 0 adalah peubah acak yang menggambarkan survival time, dan t menggambarkan suatu titik waktu dalam range T, maka ada beberapa cara untuk menentukan distribusi peluang dari T. Di antaranya yang berguna dalam aplikasi survival time adalah : a. Fungsi Kepadatan Peluang ( pdf ) Fungsi f disebut fungsi kepadatan peluang bagi peubah acak kontinu X bila memenuhi sifat-sifat berikut ini: 1) f ( x) ≥ 0 untuk semua x ∈ R ∞
2)
∫ f ( x)dx = 1
−∞
b
3) p (a < x < b) = ∫ f ( x)dx . a
Sedangkan fungsi distribusi kumulatif dari T adalah: t
F(T) = P(T ≤ t ) = ∫ f (u )du , untuk T peubah acak. 0
b. Fungsi Survival Fungsi survival S(t) didefinisikan sebagai berikut :
S (t ) = P(T > t ) .
(2.1)
Fungsi ini menyatakan bahwa suatu pengamatan dilakukan terhadap individu yang masih bertahan hingga waktu t [11]. Berdasarkan definisi (2.1) dan juga bahwa
F (t ) = P(T ≤ t ) ,
(2.2)
maka didapat hubungan
S (t ) = 1 − P(T ≤ t ) = 1 − F (t ) .
(2.3)
Selain itu dapat diperoleh hubungan
f (t ) =
− dS (t ) = − S ' (t ) . dt
(2.4)
Hal ini dapat ditunjukkan sebagai berikut : f (t ) =
dF (t ) F (t + Δt ) − F (t ) P (T ≤ t + Δt ) − P (T ≤ t ) = lim = lim Δt →0 Δt →0 Δt dt Δt
[1 − S (t + Δt )] − [1 − S (t )] − [ S (t + Δt ) − S (t )] = lim Δt → 0 Δt → 0 Δt Δt
= lim =
− dS (t ) = − S ' (t ) . dt
c. Fungsi Hazard
(2.5)
Fungsi Hazard h(t) didefinisikan sebagai :
h(t ) = lim+ Δt →0
= lim+ Δt → 0
P(t ≤ T < t + Δt | T ≥ t ) Δt 1 P (t ≤ T < t + Δ t , T ≥ t ) . P (T ≥ t ) Δt
=
P(t ≤ T < t + Δt ) 1 1 dF (t ) = lim+ Δ t → 0 S (t ) S (t ) dt Δt
=
f (t ) . S (t )
(2.6)
Berdasarkan (2.5) dan (2.6) diperoleh hubungan sebagai berikut: h(t ) =
− S ' (t ) d (− log S (t )) = . S (t ) dt
(2.7)
Fungsi hazard kumulatif didefinisikan sebagai: t
d (− log S (u )) du = − log S (t ) . du 0 t
H (t ) = ∫ h(u )du = ∫ 0
Dengan demikian diperoleh
− H (t ) = log(S (t ) . Jika kedua ruas dijadikan dalam bentuk eksponensial, maka exp(− H (t )) = exp(log(S (t )) . Sehingga diperoleh S (t ) = exp(− H (t ))
(2.8)
2.2 Jenis Data pada Analisis Survival
Ada dua jenis data pada analisis survival, yaitu censoring data (data tersensor) dan truncation data (data terpancung).
2.2.1 Data Tersensor
Data tersensor adalah data yang telah mengalami penyensoran. Penyensoran terjadi jika tidak dapat diketahui secara pasti waktu terjadinya suatu kejadian. Ada beberapa hal yang menyebabkan penyensoran terjadi, antara lain jika kejadian yang hendak diamati tersebut belum berlangsung hingga batas waktu pengamatan berakhir. Data tersensor terdiri dari dua jenis, yaitu : a. Data Tersensor Tipe I Data tersensor tipe I ini disebut juga data tersensor kanan karena failure time ke kanan missing. Data tersensor kanan adalah tipe data yang umum dalam analisis survival. Penyensoran dilakukan ketika hanya diketahui bahwa survival time melebihi sebuah nilai tertentu [11]. Sebagai contoh, penelitian kematian karena kanker selama lima tahun. Survival time akan melakukan penyensoran kanan pada pasien yang: • Masih hidup pada akhir periode lima tahun. • Mengalami penurunan atau menjadi hilang untuk tindakan selanjutnya selama penelitian. • Meninggal karena beberapa penyebab lain selama penelitian.
b. Data Tersensor Tipe II Data tersensor tipe II ini disebut juga data tersensor kiri . Data tersensor kiri adalah data yang mengalami penyensoran pada waktu
sekarang ketika kejadian yang diamati telah terjadi pada saat seseorang masuk dalam penelitian [11]. Karena itu hanya diketahui bahwa waktu kejadian adalah kurang dari suatu nilai tertentu. Sebagai contoh, pada penelitian balita yang mampu berjalan pada usia satu tahun. Maka balita yang telah mampu berjalan sebelum usia satu tahunlah yang masuk dalam penelitian.
2.2.2 Data Terpancung
Data tepancung adalah data yang telah mengalami pemancungan. Pemancungan merupakan suatu cara dalam menentukan apakah seseorang akan diikutsertakan atau tidak dalam pengamatan. Data terpancung terdiri dari dua jenis, yaitu : a. Data Terpancung kiri Pada data terpancung kiri, pemancungan terjadi ketika seseorang yang belum mengalami kejadian yang diamati termasuk dalam penelitian (atau secara bersamaan, ketika seseorang yang telah mengalami kejadian telah keluar pada awal penelitian) [11]. Sebagai contoh, pada suatu penelitian angka kematian berdasarkan observasi pada suatu populasi dengan batas waktu tertentu. Hanya orangorang yang hidup pada awal penelitianlah yang masuk dalam penelitian, karena penelitian angka kematian bergantung pada peserta yang masih hidup pada awal penelitian.
b. Data Terpancung kanan Pada data terpancung kanan, pemancungan terjadi ketika seseorang yang telah mengalami kejadian yang diamati masuk dalam penelitian (atau secara bersamaan, ketika seseorang yang belum mengalami kejadian telah keluar dengan berakhirnya penelitian) [11]. Sebagai contoh, pada penelitian angka kematian berdasarkan riwayat kematian. Hanya orang-orang yang meninggal, dengan berakhirnya penelitian yang akan masuk.
Dari beberapa jenis data yang ada pada analisis survival di atas, dalam skripsi ini data yang digunakan adalah data tersensor tipe I (penyensoran kanan) karena tipe ini yang paling sederhana dan tidak rumit.
2.3 Model Cox proportional hazard
Model Cox proportional hazard digunakan secara luas dalam analisis survival. Model Cox proportional hazard ini mempunyai keuntungan lebih dari model parametrik karena tidak memerlukan spesifikasi bentuk fungsional dari fungsi baseline hazard dan juga tidak memerlukan pengecekan asumsi-asumsi mengenai kelayakan bentuk distribusi yang diharuskan pada model parametrik. Model proportional hazard dapat ditulis: _
_
'
h(t , X ) = h0 (t )e X β = h0 (t )e _
β1 X 1 + β 2 X 2 +...+ β p X p
dengan X = ( X 1 , X 2 ,..., X p ) adalah vektor yang berisi p kovariat.
(2.9)
β = ( β1 , β 2 ,..., β p ) adalah vektor pada parameter regresi. h0(t) adalah sebuah peubah baseline hazard yang menggambarkan model hazard ketika semua kovariatnya nol. Model Cox dikatakan proporsional karena tidak bergantung pada waktu, hanya bergantung pada kovariat-kovariatnya. Berdasarkan persamaan (2.8), maka fungsi survival dari model Cox
proportional hazard adalah: S (t , x) = exp(− H (t , x))
(2.10)
dengan t
H (t , x) = ∫ h(u )du , 0
maka t
_
S (t , x) = exp(− ∫ h0 (u ) exp( x β ' )du ) .
(2.11)
0
Berdasarkan persamaan (2.6), maka :
f (t , x) = h(t , x) S (t , x) .
(2.12)
Fungsi survival dapat digambarkan dalam cara yang lain. Berdasarkan persamaan (2.11), karena variabelnya adalah u maka exp( xβ ' ) dapat dikeluarkan. Sehingga menjadi : _
⎞ ⎞ ⎛ ⎛ S(t,x) = exp ⎜⎜ exp( x β ' ) ∫ h0 (u )du ⎟⎟ = exp⎜⎜ ∫ h0 (u )du ⎟⎟ 0 ⎠ ⎠ ⎝0 ⎝ _
dengan
t
t
exp( x β ')
(2.13)
t
S 0 (t , x) = exp ∫ h0 (u )du , 0
maka _
S (t , x) = S 0 (t , x) exp( x β ')
(2.14)
dengan S 0 (t,x) adalah sebuah fungsi survival saat semua kovariat bernilai nol.
2.4 Model Parametrik
Walaupun model parametrik tidak mempunyai kemudahan seperti pada model Cox proportional hazard karena memerlukan pengecekan terhadap asumsi-asumsi, akan tetapi hasil yang diperoleh dari model paremetrik lebih baik. Pada beberapa keadaan, Efron dan Oakes menunjukan bahwa nilai parameter pada model parametrik lebih tepatguna daripada hasil model Cox proportional hazard [6]. Dalam skripsi ini dilakukan perbandingan antara model Cox proportional hazard dengan dua model parametrik, yaitu model eksponensial dan model Weibull.. 2.4.1 Distribusi Eksponensial
Dalam teori peluang dan statistik, distribusi eksponensial termasuk distribusi yang kontinu. Distribusi eksponensial sering digunakan untuk model waktu antara kejadian-kejadian bebas yang terjadi pada nilai rata-rata konstan [10]. Distribusi eksponensial mempunyai satu parameter λ dan fungsi hazardnya selalu konstan.
Fungsi kepadatan peluang (pdf) dari distribusi eksponensial adalah: f (t ) = λe − λt , t ≥ 0, λ > 0 . Sifat-sifat distribusi eksponensial: u
1) E(T) = lim ∫ tλe −λt dt = u →∞
0
1
λ
.
Bukti: u
u
E (T ) = lim ∫ tλe −λt dt = lim λ ∫ te −λt dt u →∞
u →∞
0
0
u ⎡− t ⎤ 1 = lim λ ⎢ e − λt + ∫ e − λt dt ⎥ u →∞ λ 0 ⎣λ ⎦ u
= lim − te − λt + ∫ e − λt dt u →∞
0
= lim − te − λt − u →∞
= lim 0 − u →∞
1
λ
1
λ
e − λt
e − λu −
1
λ
u 0
e0
1 = . 2 ) – (E(T)) 2 = 1 . 2) Var(T) =λE(T 2
λ
Bukti: u
Var (T ) = E (T 2 ) − ( E (T )) 2 = lim ∫ t 2 λe λt dt − u →∞
0
u ⎡ ⎤ 1 = ⎢ lim ∫ t 2 λ e − λt dt ⎥ − u →∞ 0 ⎣ ⎦ λ
⎡ ⎛ − t 2 − λt u 1 − λt ⎞⎤ 1 = ⎢lim λ ⎜⎜ e + ∫ e 2tdt ⎟⎟⎥ − λ ⎢⎣u →∞ ⎝ λ 0 ⎠⎥⎦ λ u ⎡ ⎛ ⎞⎤ 1 = ⎢lim⎜⎜ − t 2 e −λt + 2 ∫ te −λt dt ⎟⎟⎥ − ⎢⎣u →∞⎝ 0 ⎠⎥⎦ λ
1
λ2
(2.15)
⎡ ⎛ 2 ⎞⎤ 1 = ⎢lim⎜ − t 2 e −λt + 2 ⎟⎥ − 2 λ ⎠⎦ λ ⎣u →∞ ⎝ 2 1 1 = 0+ 2 − 2 = 2 .
λ
λ
λ
u
3) S (t ) = lim ∫ λe −λt dt = e −λt . u →∞
t
Bukti: u
S (t ) = lim ∫ λe u →∞
u
dt = lim λ ∫ e −λt dt
− λt
u →∞
t
⎡ 1 = lim λ ⎢ − e − λt u →∞ ⎣ λ = lim − e − λt u →∞
u t
t
⎤ ⎥⎦
u t
= lim− e − λu + e − λt u →∞
= e − λt .
4) h(t ) =
f (t ) λe − λt = − λt = λ , nilai hazard konstan. S (t ) e
5) P(T > t + Δt | T > t ) = P (T > Δt ) , sifat ini disebut “memoryless property”. Bukti: P(T>t+ Δt | T > t ) = =
P(T > t + Δt , T > t ) P(T > t + Δt ) S (t + Δt ) = = P(T > t ) P(T > t ) S (t ) e − λ ( t + Δt ) = e − λ ( Δt ) = S ( Δt ) = P (T > Δt ). − λt e
2.4.2 Distribusi Weibull
Distribusi Weibull adalah generalisasi dari distribusi eksponensial. Pada distribusi eksponensial nilai hazardnya adalah konstan. Hal ini sering kali
tidak sesuai dengan keadaan sebenarnya. Akan tetapi pada distribusi Weibull nilai hazardnya tidak konstan. Oleh karena itu distribusi Weibull lebih mendekati pada keadaan sebenarnya. Distribusi Weibull mempunyai dua parameter, yaitu λ dan γ . Fungsi kepadatan peluang (pdf) dari distribusi Weibull adalah: f (t ) = λ γ ( λt ) γ −1 exp[−(λt ) γ ] ; t > 0, λ > 0, γ > 0, (2.16) dan fungsi survival dari distribusi Weibull adalah: S (t ) = exp[−(λt ) γ ] .
(2.17)
Fungsi hazard dari distribusi Weibull adalah: h(t ) = λγ (λt ) γ −1 .
(2.18)
Jika γ > 1 maka h(t ) monoton naik, γ = 1 maka h(t ) konstan dan jika γ < 1 maka h(t ) monoton turun. Kondisi ini menjelaskan bahwa hazard akan meningkat ketika γ > 1 , konstan seperti halnya pada distribusi eksponensial jika γ = 1 , dan menurun pada γ < 1 .
2.5 Residual
Residual adalah jarak antara nilai sebenarnya dengan garis model taksiran [2]. Ada beberapa jenis residual. Pada skripsi ini akan dibahas lima jenis residual, yaitu residual Cox-Snell, Martingale, deviance, log-odds dan normal-deviate. 2.5.1 Residual Cox-Snell (rCi ) ^
Residual Cox-Snell didefinisikan sebagai nilai kumulatif hazard ( H i (ti ) )
dari suatu model,
^
rCi = H i (t i ) .
(2.19)
Residual ini sangat luas penggunaannya dalam analisis data survival. Residual Cox-Snell mempunyai beberapa sifat, yaitu : a. Tidak simetri. b. berdistribusi mendekati nol. c.
tidak bernilai negatif.
d. Mempunyai distribusi dengan kemiringan yang tinggi, karena residual Cox-snell berdistribusi eksponensial ketika pencocokan model benar dan juga mean dan variansnya satu. Misalkan dibentuk fungsi hazard dengan subjek i, i=1, 2,…,n seperti di bawah ini: ^
^
^
h i (t ) = exp( β ' xi) h 0 (t )
(2.20)
dengan ^
^
^
^
β ' xi = β 1 x1i + β 2 x 2i + … β p x pi , dan hazard kumulatif : ^
t ^
t
^
^
^
t ^
H i (t i ) = ∫ hi (u )du = ∫ exp( β 'x1 ) h 0 (u )du = exp( β ' x1 ) ∫ h 0 (u )du 0
0
^
0
^
= exp( β ' xi ) H 0 (t i ) .
(2.21)
Berdasarkan (2.19) dan (2.20) diperoleh residual Cox-Snell pada model Cox
Proportional hazard untuk subjek ke-i dan waktu t i adalah : ^
^
rCi = exp ( β ' xi) H 0 (t i )
(2.22)
^
dengan H 0 (t i ) adalah estimasi dari baseline fungsi hazard kumulatif pada waktu t i . Pada analisis parametrik, model failure time lebih dikenal sebagai “accelerated model”. Accelerated model untuk Ti adalah: log Ti = μ + α 1 x1i + α 2 x 2i + ... + α p x pi + σε i ; i = 1,2,..., n ,
(2.23)
dengan
n = jumlah data
ε i = peubah acak dengan distribusi probabilitas yang sama log Ti = variabel dependen
μ , σ , α j = parameter tidak diketahui dengan j = 1,2,..., p xi = ( x1i ,..., x pi ) T = variabel penjelas. Untuk model parametrik, residual Cox-Snell didefinisikan sama dengan residual Cox-snell pada model Cox proportional hazard, yaitu: ^
^
rCi = H i (t i ) = − log S i (t i ) ,
dengan ^ ^ ^ ^ ⎛ ⎞ ⎜ log t − μ − α 1 x1i + α 2 x 2i − ... − α p x pi ⎟ S i (t ) = S εi (rsi ) = S εi ⎜ ⎟. ^ ⎜ ⎟ σ ⎝ ⎠ ^
^
^
Keterangan: S εi (ε ) = fungsi survival dari ε i pada model parametrik ^
αj
= koefisien estimasi dari x ji
(2.24)
^
^
μ , σ = nilai estimasi dari μ dan σ . Pada model Weibull, fungsi survival adalah : S i (t ) = S ε i (rsi ) = exp(−e rsi ) .
(2.25)
Untuk model eksponensial, fungsi survival sama seperti pada model Weibull dengan skala parameter σ ditentukan 1. Jika model yang digunakan sesuai dengan data, maka residual CoxSnell akan berdistribusi eksponensial dengan mean satu. Dengan demikian,
maka residual Cox-Snell dapat digunakan untuk mengecek keberhasilan model dengan memeriksa plot dari rCi dengan hazard kumulatif dari rCi . Jika model yang digunakan sesuai, maka plot akan menjadi garis lurus melewati titik asal serta melandai.
2.5.2 Residual Martingale (rMi )
Residual Martingale didefinisikan sebagai: rMi = δ i − rCi ,
(2.26)
dengan ⎧1 untuk data tidak tersensor ⎩0 untuk data tersensor
δi = ⎨
i =1,2,...., n dan rCi adalah residual Cox-Snell. Range residual Martingale antara − ∞ dan satu, dan negatif pada data
yang tersensor. Residual Martingale dapat menjadi gambaran mengenai perbedaan antara hasil pengamatan (δ i ) dengan angka prediksi pada kejadian-
kejadian (rCi ) . Ketika perbedaan antara hasil pengamatan dengan angka prediksi untuk subjek ke-i cukup besar, itu menunjukan bahwa subjek ke-i tidak akan cocok dengan model dan mengakibatkan suatu nilai yang besar pada rMi . Karena range dari rCi adalah (0, ∞ ), dan δ i hanya bernilai 0 atau 1, itu menerangkan bahwa residual Martingale bernilai (− ∞, 1) dan kesimetrisan dari distribusi residual martingale mendekati nol.
Sifat-sifat residual Martingale adalah: 1) E (rMi ) = 0 . 2) Cov (rMi , rMj ) = 0 pada sampel besar.
2.5.3 Residual Deviance (rDi )
Residual deviance adalah modifikasi dari residual Martingale. Residual deviance didefinisiskan sebagai berikut : 1
rDi = sgn( rMi )[− 2{rMi + δ i log(δ i − rMi )}]2 ,
(2.27)
dengan sgn(rMi ) adalah tanda dari residual Martingale dan δ i adalah variabel indicator. Residual Martingale dikenal sebagai suatu usaha untuk mendapatkan residual Martingale yang simetris mendekati nol dengan menyusutkan residual Martingale kedalam range (−∞, 0) terhadap nol dan memperluasnya kedalam
range (0, 1) terhadap + ∞ .
2.5.4 Residual Baru
Menurut Nardi dan Schemper, prediksi survival model cox pada subjek i ^
= 1,2,…,n dikatakan sempurna jika S i (t i ) = 0,5 dan terprediksi benar jika ^
m
^
m
t i ≈ t i , dengan t i adalah pengamatan failuire time dan t i sebuah estimasi median survival time [5]. Untuk mengukur residual dapat dilakukan dengan
salah satu cara berikut: ^
m
a) Menghitung perbedaan antara t i dan t i . Tetapi ini tidak dapat dilakukan pada kasus pengamatan yang tersensor karena pengamatan survival time t i tidak dapat dihitung. ^
b) Bandingkan S i (t i ) dengan 0,5.
^
m
Oleh karena itu, hitung pusat residual pada median survival time t i , ^
m
apakah pada t i subjek ke-i akan gagal atau tidak. Jika survival melebihi ^
m
t i dapat dianggap sebagai variabel biner dan juga berdistribusi binomial ^
dengan parameter (1, S i (t i )) . Dengan transformasi logit atau probit, dapat didefinisikan dua tipe residual yaitu, residual log-odds dan residual normaldeviate.
Residual log-odds dan residual normal-deviate mempunyai sifat yang serupa dengan sifat-sifat residual pada umumnya, seperti : ^
a) Residual akan menjadi nol untuk prediksi yang sempurna, jika S i (t i ) =0,5 maka L i (t i ) dan N i (t i ) bernilai nol. b) Permulaan dari prediksi sempurna akan menunjukkan residual menjadi lebih besar pada nilai mutlak. Ini benar untuk L i (t i ) dan N i (t i ) yang ^
^
mendekati L i (t i ) , ∞ ketika S i (t i ) ≈ 1 dan − ∞ ketika S i (t i ) ≈ 0 . 1) Residual Log-odds ( Li ) Residual log-odds didefinisikan sebagai : Li (t i ) = log
Anggap fungsi survival
S i (t i ) ………………… (2.28) 1 − S i (t i )
S (t ) diketahui benar,
Li
diperkirakan
Jika T peubah acak kontinu, maka F (t ) = 1 − S (T ) akan
berdistribusi
berdistribusi logistik dengan mean nol dan varians
π2 3
.
Bukti:
uniform pada interval (0, 1)
Jika dimisalkan F (T ) = U ,
maka ⎧ 1, 0 < u < 1 f (u ) = ⎨ ⎩0, lainnya
menjadi pdf dari U. Jika dimisalkan S (T ) = V ,
maka V = 1−U .
Jika
dimisalkan
A = {0 < u < 1}
ruang
sampel
dari
U,
dan
B = {0 < u < 1} ruang sampel V, maka diperoleh fungsi distribusi V, yaitu
:
G (v) = P(V ≤ v) = P(1 − U ≤ v) = P(1 − v ≤ U ) = 1 − P(U ≤ 1 − v) = 1 − FU (1 − v) = v, 0 < v < 1 dan didapat : ⎧0, v ≤ 0 ⎪ G (v) = ⎨v, 0 < v < 1 , ⎪1, v ≥ 1 ⎩
sehingga diketahui bahwa V = S (T ) adalah berdistribusi uniform pada (0, 1). Untuk mendapatkan distribusi dari L i , digunakan cara yang sama seperti sebelumnya, yaitu: Jika
dimisalkan
A = {0 < S i < 1} ruang
B = {−∞ < Li < ∞} ruang sampel Li (t i ) = log
fungsi distribusi L i , yaitu :
sampel
Si ,
dan
S i (t i ) , maka diperoleh 1 − S i (t i )
⎛ ⎛⎛ S ⎞ ⎞ el ⎜ ≤ ⎟ = ≤ F (l ) = P( L ≤ 1) = P⎜⎜ ⎜ log 1 P S ⎟ ⎟ ⎜ 1 + el ⎝⎝ 1− S ⎠ ⎠ ⎝
⎞ 1 ⎞ ⎛ ⎟⎟ = P⎜ S ≤ −l ⎟ e + 1⎠ ⎝ ⎠
1
⎛ 1 ⎞ = GS ⎜ − l ⎟= ⎝ e +1⎠
e −l +1
∫ 1ds = e 0
1 , +1
−∞ < L < ∞
,
(2.29)
−l
jika diketahui bahwa pdf dari Li adalah: dF (1) e −l f (l ) = = , −∞ < L < ∞ dl 1 + e −l
(
)
Bentuk umum pdf dari distribusi logistik ( μ , β ) adalah:
f (x | μ, β ) =
1
e
β ⎡
⎛ x−μ ⎞ −⎜⎜ ⎟⎟ ⎝ β ⎠
⎢1 + e ⎢⎣
⎛ x−μ ⎞ −⎜⎜ ⎟⎟ ⎝ β ⎠
⎤ ⎥ ⎥⎦
2
, − ∞ < x < ∞ , − ∞μ < ∞ , β > 0
(2.30)
dengan mean E[X ] = μ
dan varians Var [ X ] =
π 2β 2 3
.
Jadi, diketahui bahwa Li berdistribusi logistik dengan mean nol dan variansi
π2 3
.
^
Pada kasus tersensor, salah satu S i (t i ) dapat diganti dengan nilai ^
c
S i (t i ) median atau mean. Jika digunakan median maka Li mempunyai 2
bentuk : ^
li = log m
c
S i (t i )
.
(2.31)
log 1 + e li .
(2.32)
^
2 − S i (t i ) c
Jika digunakan mean, maka Li berbentuk : 1 + e li
e
li = li − e
c
e
lie
(
e
)
Bentuk mean didapatkan dengan penjelasan sebagai berikut: e−y
x
(
P Li ≤ x | Li ≤ l
c i
)=
∫ l(−∞,l c ) ( y)
−∞
i
(1 + e ) F (l )
−y 2
dy
,
c i
maka
(
l c 1 i 1 ⎧⎪ c e li e−x dx = l − log 1 + e li l = E (L i | Li ≤ l ) = x 2 c ∫ c ⎨ i lic x − F (li ) ⎪⎩ 1 + e F (li ) −∞ (1 + e ) c
c i
c
c i
1 + e li
c
=l − c i
e
lic
(
c
)
log 1 + e li .
2) Residual Normal-deviate ( N i ) Residual normal-deviate didefinisikan sebagai :
)⎫⎪⎬⎪ ⎭
⎧^ ⎫ N i = Φ −1 ⎨S i (t i )⎬ , ⎩ ⎭
(2.33)
dengan Φ adalah standar distribusi normal kumulatif. Anggap fungsi survival S (T ) benar, N i diperkirakan sebuah standar distribusi normal.
Bukti : Jika dimisalkan A = {0 < s < 1} ruang sampel S (T ) , B = {−∞ < N < ∞} ruang sampel N, maka diperoleh fungsi distribusi dari N adalah: G (n) = P( N ≤ n) = P (Φ −1 ( s ) ≤ n) Φ ( n)
= P( s ≤ Φ (n)) =
∫ 1ds = Φ(n) .
(2.34)
0
^
Pada kasus tersensor, salah satu S i (t i ) dapat digantikan dengan pengandaian nilai median atau mean. ^
S i (t i ) Jika digunakan pengandaian median , maka N i berbentuk: 2 n =− e i
2
1 ^
2π S i (t i )
e
−
n1e 2
.
(2.35)
c
Bentuk di atas didapatkan dengan penjelasan sebagai berikut :
(
) ∫ f (N x
P Ni ≤ x | Ni ≤ n = c i
i
)
≤ x | N i ≤ n dx = c i
l (−∞ ,nc ) ( y )
x
−∞
∫
i
x
1
( ) ∫ l( −∞
− ∞ , nic
) ( y ) 2π e
− y2
2
e
2π P N i ≤ nic
2
dy
(
)
l (−∞ ,n c ) ( x)
1 ; Φ (nic )
−∞
1 = Φ nic
− y2
1
dy
Misalkan f N | N ≤ n c ( x) = i
i
i
f (N i , N i ≤ nic ) = f (N i ≤ nic )
1 2π
e
− x2
2
i
maka, ∞
(
) ∫ xf
n = E Ni | Ni ≤ n = c i
c i
−∞
=−
1
( )
2π Φ n
c i
e
−
nic
2
( x)dx = N |N ≤nc
=−
i
i
i
1 ^
2π S i (t i ) c
nic
1
∫x
e
−
nic
( )
2π Φ n
−∞
2
2
c i
e
− x2
2
dx
BAB III METODOLOGI
3.1 Pengumpulan Data
Dalam skripsi ini digunakan satu set data, yaitu data mengenai penderita kanker paru-paru yang diambil dari contoh data pada software S-plus 2000. Data tersebut dapat dilihat pada lampiran 1.
3.2 Pengolahan Data
Pengolahan data pada skripsi ini menggunakan software S-Plus 2000. Adapun tahapan pengolahan datanya adalah seperti pada gambar 3.1 dan tahapan simulasinya dapat dilihat pada gambar 3.2.
Data
Model
Cox- PH Eksponensial Weibull
Evaluasi Model Histogram
Plot
Model terbaik
Gambar 3.1 Tahapan Pengolahan Data
Membangkitkan angka acak yang berdistribusi eksponensial dan Weibull
Angka acak yang berdistribusi eksponensial
Model
Angka acak yang berdistribusi Weibull dengan 40% tersensor
Cox- PH Eksponensial Weibull
Cox- PH Eksponensial Weibull
Model
Evaluasi Model Plot
Histogram
Model Terbaik
Residual terbaik untuk pengecekan model
Gambar 3.2 Tahapan Simulasi
3.3 Analisis Data
Berdasarkan survival study dilakukan pencocokan antara model Cox proportional hazard dengan model parametrik (eksponensial dan Weibull) dengan menggunakan suatu set data yang telah diambil (data kanker paru-paru). Setelah itu dilakukan evaluasi model dengan beberapa residual, yaitu Cox-Snell, Martingale, deviance dan dua tipe residual baru, residual log-odds dan normal-deviate.
Pengecekan residual ini sangat penting dalam menentukan ketepatan pada pencocokan model. Suatu model dikatakan cocok untuk suatu data dan jenis residual mana yang terbaik, jika distribusi dari suatu residualnya tertutup pada distribusi modelnya. Satu set data yang digunakan tidak cukup untuk membuat kesimpulan atau menggeneralisasi hasil perbandingan model Cox proportional hazard dan model parametrik, karena setiap set data bergantung pada sifat dasar hasil yang ingin didapat dari suatu penelitian. Karena itu dicoba melakukan simulasi dengan sampel random dari distribusi eksponensial dan weibull. Setelah itu model yang dibentuk dari sampel random tersebut dibandingkan, dan diharapkan diperoleh perbedaan yang jelas antara model Cox proportional hazard dan model parametrik.
BAB IV ANALISIS HASIL
4.1 Data Kanker Paru-paru
Data yang digunakan adalah data kanker paru-paru, yang terdiri dari 228 pengamatan. Ada 19 pengamatan dengan missing value dan 209 pengamatan tanpa missing value. Pengamatan tanpa missing value inilah yang digunakan dalam analisis. Dari 209 pengamatan terdapat 62,7% tersensor kanan. Terdapat 6 variabel untuk membentuk model Cox proportional hazard dari data kanker paru-paru, yaitu ph.ecog (perkiraan para dokter mengenai nilai pemeriksaan ECOG), sex (umur), inst (kode untuk lembaga yang merawat pasien), wt.loss (Berkurangnya berat badan pada 6 bulan terakhir), ph.karno (perkiraan para dokter mengenai nilai Karnofsky), pat.karno (perkiraan pasien mengenai nilai Karnofskynya).
Gambar 4.1 Plot Residual Cox-Snell dan Residual Martingale Data Kanker Paru-Paru untuk Model Cox proportional hazard
Pada plot-plot pembentukan model Cox proportional hazard dengan menggunakan 6 variabel yang telah disebutkan di atas, terlihat bahwa pada gambar
4.1 residual Cox-Snell dan Martingale menunjukan hasil yang tidak bagus. Seharusnya jika model yang digunakan sesuai dengan data, maka plot residual CoxSnell akan menjadi garis lurus melewati titik asal serta melandai, sedangkan pada gambar 4.1 tidak demikian. Begitupun untuk residual Martingale, seharusnya residual Martingale bernilai (− ∞, 1) dan kesimetrisan dari distribusi residual martingale mendekati nol, namun pada gambar 4.1 tidak demikian.
Gambar 4.2 Plot Residual Deviance, Normal-deviate, dan Log-odds Data Kanker Paru-Paru untuk Model Cox Proportional hazard
Pada gambar 4.2, residual normal-deviate dan residual log-odds menunjukkan hasil yang baik. Hal ini ditunjukkan dengan penyebaran plot yang tidak berpola dan memusat sekitar nol, walaupun terlihat ada outlier.
Gambar 4.3 Histogram Residual Cox-Snell dan Martingale Data Kanker Paru-Paru untuk Model Cox Proportional hazard
Kurva tebal pada histogram menunjukan density secara teori. Sedangkan kurva halus menunjukan density dari hasil pengamatan (data kenker paru-paru). Pada gambar 4.3 kedua kurva pada residual Cox-Snell dan Martingale tidak berimpit, ini menunjukan bahwa model tidak cocok sama seperti hasil dari plot.
Gambar 4.4 Histogram Residual Deviance, Normal-deviate dan Log-odds Data Kanker Paru-Paru untuk Model Cox Proportional hazard
Dari gambar 4.4 semakin memperkuat hasil dari plot, bahwa untuk data kanker paru-paru cocok menggunakan model Cox proportional hazard dengan analisis residual menggunakan residual log-odds dan normal-deviate. Kedua kurva pada histogram residual log-odds dan normal-deviate saling berimpit, namun residual log-odds lah yang lebih berimpit.
Seperti halnya dalam pembentukan model Cox proportional hazard untuk data kenker paru-paru, pembentukkan model parametrik untuk data kanker paruparu juga dilakukan dengan menggunakan 6 variabel.
Gambar 4.5 Plot Residual Cox-Snell, Martingale dan Deviance Data Kanker Paru-Paru unruk Model Parametrik
Dari gambar 4.5, sulit ditentukan mana yang lebih baik antara model eksponensial atau model Weibull, karena hasil plot hampir sama.
Gambar 4.6 Plot Residual Log-odds dan Normal-deviante Data Kanker ParuParu unruk Model Parametrik
Gambar 4.6 pun sama seperti gambar 4.5, yaitu sulit untuk menentukan model mana yang lebih baik. Namun pada histogram lebih bisa terlihat perbedaannya, seperti yang akan dijelaskan pada gambar 4.7, 4.8, 4.9, 4.10, dan 4.11.
Gambar 4.7 Histogram Residual Cox-Snell Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru
Pada gambar 4.7 terlihat bahwa, untuk residual Cox-Snell hasil yang diperoleh tidak baik. Namun jika dibandingkan antara model eksponensial dan model Weibull, maka model eksponensial yang lebih baik karena kedua kurva pada model eksponensial yang lebih berimpit.
Gambar 4.8 Histogram Residual Martingale Model Eksponensial (bawah) dan Model Weibull (atas) Data Kanker Paru-Paru
Pada gambar 4.8 terlihat bahwa, untuk residual Martingale hasil yang diperoleh juga tidak baik. Namun jika dibandingkan antara model eksponensial dan model Weibull, maka model Weibull yang lebih baik karena kedua kurva pada model Weibull yang lebih berimpit.
Gambar 4.9 Histogram Residual Deviance Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru
Sama seperti pada residual Cox-Snell dan Martingale, gambar 4.9 menunjukan bahwa hasil yang diperoleh dari residual deviance tidak terlalu baik. Namun jika dibandingkan antara model eksponensial dan model Weibul, maka model eksponensial yang lebih baik karena kedua kurva pada model eksponensial yang lebih berimpit.
Gambar 4.10 Histogram Residual Normal-deviante Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru
Pada gambar 4.10, jika dibandingkan antara model eksponensial dengan model weibull, maka model eksponensial yang lebih baik. Tetapi ini masih belum menunjukan hasil yang baik
Gambar 4.11 Histogram Residual Log-odds Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru
Pada gambar 4.10, residual log-odds model Weibul sudah menunjukan hasil yang baik. Namun hasil yang diperoleh tidak sebaik hasil dari model Cox Proportional hazard. Hasil dari Cox proportional hazard dan model parametrik terangkum pada tabel 4.1. Dari tabel terlihat bahwa dari keenam variabel yang digunakan pada pembentukan model Cox proportional hazard semua variabelnya signifikan, pada model eksponensial tidak ada satupun variabel yang signifikan dan pada model Weibull hanya log (scale) yang signifikan. Kesignifikanan z-value pada log (scale) dalam model Weibull menunjukkan bahwa model eksponensial diperbaiki oleh model Weibull. Tetapi hasil yang diperoleh dari kedua model parametrik tersebut tidak terlalu berbeda, dan
berdasarkan prinsip parsimony “pilih model yang lebih sederhana“ maka pilihannya adalah model eksponensial. Tabel 4.1 Analisis Data Kanker Paru-Paru Faktor
Cox-PH z-value rr (p-value)
Eksponensial z-value Estimate (p-value) Accelerations
Weibull z-value Estimate (p-value) Accelerations
ph.ecog
3.76 (0.00017)*
2.22
-3.12 (0.090)
-0.64
-3.91 (0.061 )
-0.55
sex
-3.38 (0.00073 )*
0.55
3.02 (0.127)
0.53
3.34 (0.155)
0.41
inst
-2.12 (0.03400)*
0.98
1.93 (0.717)
0.02
2.13 (0.452)
0.01
wt.loss
-2.04 (0.04100)*
0.99
1.63 (0.382)
0.01
2.03 (0.572)
0.01
ph.karno
2.00 (0.04600)*
1.02
-1.45 (0.537)
-0.01
-2.19 (0.390)
-0.01
pat.karno
-1.98 (0.04800)*
0.99
1.52 (0.475)
0.01
2.03 (0.572)
0.01
-5.83 (0.007)*
-0.38
log(scale)
rr : relative risk Dari hasil tersebut, terlihat bahwa model Cox proportional hazard jauh lebih baik digunakan untuk memodelkan data kanker paru-paru dibandingkan dengan model parametrik.
4.2 Simulasi
Satu set data yang digunakan seperti analisis di atas tidak cukup untuk menggeneralisasi pengujian sifat-sifat residual, karena setiap set data bergantung pada sifat dasar penelitian yang dilakukan. Selain itu kita juga tidak dapat mengontrol setiap kasus dengan missing value atau penelitian dengan angka penyensoran yang besar. Oleh karena itu, kita hasilkan sampel random dari distribusi eksponensial dan distribusi Weibull untuk pembentukan model Cox proportional hazard dan model
accelerated failure time. Residual normal-deviate dan residual log-odds dibandingkan antar model untuk menghasilkan model yang terbaik. Sampel dengan ukuran 200 dihasilkan menggunakan pembangkit angka acak pada software S-plus. Sebuah kovariat dan grup diasumsikan mengikuti distribusi binomial dengan peluang ½ untuk grup 1 atau grup 0. Rata-rata dari subjek yang dimasukkan dalam penelitian adalah konstan dengan waktu diasumsikan mengikuti distribusi uniform pada interval (0,1). Untuk distribusi eksponensial survival time T dibangkitkan dengan hazard h(t | grup = 0) = 1 dan h(t | grup = 1) = 1/2. Sampel random tanpa penyensoran yang dihasilkan digunakan dalam analisis. Untuk distribusi Weibull survival time T dibangkitkan dengan parameter shape (λ) = 2 dan scale (γ) = 0,5 untuk grup 0 dan shape (λ) = 2 dan
scale (γ) = 2
untuk grup 1. Sampel random dengan 40% penyensoran kanan yang dihasilkan digunakan dalam analisis. Setelah pembentukan model Cox proportional hazard dan model parametrik (eksponensial dan Weibull), residual normal-deviate dan residual log-odds dibandingkan. Hanya kedua jenis residual ini yang digunakan karena pada hasil dari data kanker paru-paru, kedua jenis residual inilah yang dapat mengidentifikasikan kecocokan model dengan baik. Hal ini diperoleh dari hasil analisis statistik yang biasa digunakan untuk melihat kecocokan mode, yaitu uji parsial parameter dalam model. Hasil dari penelitian tanpa penyensoran yang tadi telah diperoleh ditunjukkan seperti gambar 4.5 dan 4.6 dan 4.7.
Gambar 4.12 Histogram dan QQ-Plot Residual Normal-deviate (atas) dan Residual Log-odds (bawah) Model Cox proportional hazard dari Data yang Berdistribusi Eksponensial
Dari gambar 4.12 terlihat bahwa berdasarkan residual normal-deviate dan residual log-odds, model Cox proportional hazard cukup baik untuk diterapkan pada data. Hal ini ditunjukkan dari berimpitnya kurva density yang diperoleh dari model Cox proportional hazard dengan kurva density yang seharusnya (distribusi normal untuk residual normal-deviate dan distribusi logistik untuk residual logodds).
Gambar 4.13
Histogram dan QQ-Plot Residual Normal-deviate Model Eksponensial (atas) dan Model Weibull (bawah) dari Data yang Berdistribusi Eksponensial
Akan tetapi, berdasarkan gambar 4.13 density dari residual normal-deviate untuk model eksponensial lebih berimpit dengan density secara teoritis.
Gambar 4.14 Histogram dan QQ-Plot Residual Log-odds Model Eksponensial (atas) dan Model Weibull (bawah) dari Data yang Berdistribusi Eksponensial
Gambar 4.14 pun memberikan indikasi yang serupa, walaupun tidak terlalu jelas perbedaan antara hasil dari model eksponensial dan model Weibull. Model eksponensial lebih bagus dibandingkan dengan model Weibull, sesuai dengan yang diharapkan.
Gambar 4.15 Histogram Model Eksponensial dan Model Weibul dari Data yang Berdistribusi Weibull dengan 40% Data Tersensor Kanan
Dari gambar 4.8 terlihat bahwa density dari residual normal-deviate model Weibull yang lebih mendekati density secara teoritis dibandingkan model eksponensial. Namun hasil yang diperoleh tidak terlalu bagus. Hal ini disebabkan karena sebanyak 40% data tersensor kanan.
BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan
1)
Dari hasil contoh data kanker paru-paru dapat disimpulkan, jika distribusi dari survival time tidak diketahui, maka model Cox proportional hazard lebih baik dibandingkan dengan model parametrik.
2)
Dari hasil simulasi : a. Jika distribusi diketahui maka model parametrik (dengan distribusi yang sesuai) memberikan hasil yang lebih baik dibandingkan model Cox proportional hazard. b. Walaupun tidak lebih baik daripada model parametrik, tetapi model Cox proportional hazard tetap cocok untuk memodelkan data. c. Untuk data yang tersensor sama seperti pada poin a dan b di atas, namun hasil yang diperoleh tidak terlalu baik.
3)
Residual normal deviate dan log-odds dapat digunakan untuk pemilihan model yang cocok untuk suatu data.
5.2 Saran
Model Cox proportional hazard lebih baik diterapkan jika tidak diketahui dengan pasti distribusi dari survival time. Akan tetapi ini hanya berdasarkan satu set data (yaitu data penderita kanker paru-paru) dan simulasi pada dua distribusi (eksponensial dan Weibull). Untuk data dengan distribusi lainnya belum diperiksa. Selain itu simulasi untuk data yang berdistribusi eksponensial hanya dicoba dengan
λ =1 untuk grup 1 dan λ =
1 untuk grup 2. Sedangkan untuk data yang berdistribusi 2
Weibull hanya dicoba dengan λ = 2 , γ =
1 untuk grup 1 dan λ = 2 , γ = 2 untuk 2
grup 2. Untuk nilai yang lain belum dicoba oleh karena itu cobalah untuk penelitian lebih lanjut.
DAFTAR PUSTAKA
[1]
Abdullah, Sarini, New residuals and Their Application in Model Selection,
Thesis The University of New South Wales Departement of Statistics, New South Wales, 2004.
[2]
Hanke, John E., Business Forcasting, Prentice Hall, New Jersey, 1998
[3]
Kalbfleisch, J. D. dan Prentice, R. L. The Statistical analysis of Failure Time
Data, John Wiley and Sons, 1980.
[4]
Klein, John P., Moeschberger, Melvin L. Survival Analysis Techniques for
Censored and Truncated Data, Spinger, New York, 1997.
[5]
Nardi, A. dan Schemper, M., New Residual for Cox Regression and Their
Application to Outlier screening, Biometrics,1999.
[6]
Nardi, A. dan Schemper, M., Comparing Cox and Parametric Models in
Clinical Studies, Springer: New York, 2000.
[7]
Therneau, T. M. dan Grambsch, P. M., Modelling Survival Data. Extending
The Cox Model, Spinger:New York, 2000. [8]
Walpole, R. E., Pengantar Statistik,. Gramedia Pustaka Utama. Jakarta, 1995.
[9]
Weibull, W., A statistical distribution function of wide applicability,
Appl.Mech.-Trans. ASME 18(3), 293-297, 1951.
[10]
http://en.wikipedia.org/wiki/Exponential Distribution, 27 Maret 2007
[11]
http://en.wikipedia.org/wiki/Survival Analysis, 31 Maret 2007
[12]
http://en.wikipedia.org/wiki/Probability_density_function, 2 April 2007
[13]
http://en.wikipedia.org/wiki/Survival or Failure Time, 11 April 2007
[14]
http://en.wikipedia.org/wiki/Weibull_distribution, 11 April 2007
J.
LAMPIRAN
1. Data Penderita Kanker Paru-Paru 1 2
inst 3.00
sex 1.00
ph.ecog 1.00
ph.karno 90.00
pat,karno 100.00
wt.loss NA
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
3.00 3.00 5.00 1.00 12.00 7.00 11.00 1.00 7.00 6.00 16.00 11.00 21.00 12.00 1.00 22.00 16.00 1.00 21.00 11.00 6.00 11.00 15.00 12.00 12.00 4.00 13.00 13.00 1.00 12.00 1.00 7.00 16.00 12.00 1.00 22.00 15.00 1.00
1.00 1.00 1.00 1.00 1.00 2.00 2.00 1.00 1.00 1.00 2.00 2.00 1.00 1.00 1.00 1.00 1.00 2.00 1.00 1.00 2.00 1.00 1.00 1.00 2.00 1.00 1.00 1.00 1.00 2.00 1.00 1.00 2.00 1.00 2.00 1.00 2.00 1.00
0.00 0.00 1.00 0.00 1.00 2.00 2.00 1.00 2.00 1.00 2.00 1.00 NA 1.00 1.00 1.00 2.00 2.00 1.00 1.00 0.00 1.00 0.00 0.00 1.00 0.00 3.00 1.00 2.00 1.00 2.00 2.00 2.00 2.00 2.00 2.00 1.00 2.00
90.00 90.00 90.00 100.00 50.00 70.00 60.00 70.00 70.00 80.00 70.00 90.00 60.00 80.00 80.00 90.00 50.00 60.00 90.00 80.00 100.00 70.00 90.00 90.00 90.00 100.00 60.00 80.00 70.00 90.00 60.00 60.00 50.00 70.00 50.00 70.00 70.00 50.00
90.00 90.00 60.00 90.00 80.00 60.00 80.00 80.00 70.00 80.00 70.00 90.00 70.00 70.00 90.00 100.00 70.00 60.00 80.00 80.00 70.00 80.00 100.00 80.00 80.00 100.00 70.00 70.00 50.00 90.00 70.00 80.00 60.00 100.00 50.00 60.00 90.00 40.00
15.00 15.00 11.00 0.00 0.00 10.00 1.00 16.00 34.00 27.00 23.00 5.00 32.00 60.00 15.00 -5.00 22.00 10.00 NA 17.00 -8.00 16.00 13.00 0.00 6.00 -13.00 20.00 -7.00 20.00 -1.00 20.00 -11.00 -15.00 10.00 NA 28.00 4.00 24.00
Data Penderita Kanker Paru-Paru (Lanjutan) 41 42
1.00 5.00
2.00 1.00
1.00 1.00
80.00 80.00
100.00 60.00
15.00 10.00
43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85
11.00 10.00 12.00 7.00 7.00 1.00 3.00 13.00 22.00 3.00 12.00 21.00 1.00 6.00 1.00 5.00 22.00 3.00 1.00 22.00 12.00 21.00 11.00 3.00 3.00 16.00 5.00 22.00 6.00 13.00 3.00 5.00 2.00 21.00 12.00 1.00 6.00 3.00 1.00 4.00 13.00 11.00 21.00
2.00 2.00 2.00 1.00 2.00 1.00 1.00 1.00 2.00 2.00 1.00 1.00 1.00 1.00 1.00 2.00 1.00 2.00 2.00 2.00 1.00 1.00 2.00 1.00 1.00 2.00 2.00 1.00 1.00 1.00 2.00 1.00 1.00 2.00 2.00 2.00 2.00 1.00 1.00 1.00 1.00 1.00 2.00
2.00 0.00 2.00 1.00 2.00 0.00 1.00 0.00 1.00 1.00 0.00 0.00 0.00 1.00 0.00 0.00 2.00 1.00 1.00 2.00 1.00 1.00 1.00 1.00 2.00 2.00 0.00 0.00 1.00 0.00 1.00 2.00 1.00 1.00 1.00 0.00 1.00 0.00 0.00 0.00 1.00 1.00 1.00
60.00 90.00 70.00 60.00 60.00 90.00 80.00 90.00 90.00 90.00 80.00 90.00 100.00 90.00 90.00 100.00 70.00 80.00 90.00 70.00 90.00 80.00 90.00 80.00 70.00 70.00 90.00 100.00 80.00 90.00 80.00 70.00 80.00 90.00 90.00 100.00 80.00 90.00 90.00 100.00 70.00 80.00 80.00
70.00 90.00 60.00 70.00 60.00 70.00 70.00 90.00 100.00 90.00 70.00 100.00 90.00 80.00 80.00 80.00 60.00 80.00 80.00 70.00 80.00 100.00 80.00 60.00 50.00 NA 70.00 80.00 100.00 90.00 90.00 100.00 80.00 80.00 90.00 80.00 70.00 NA 70.00 80.00 90.00 80.00 90.00
11.00 27.00 NA 7.00 -24.00 30.00 10.00 2.00 4.00 9.00 0.00 0.00 7.00 15.00 NA 5.00 18.00 10.00 -3.00 8.00 68.00 NA 0.00 0.00 8.00 2.00 3.00 0.00 23.00 -1.00 29.00 0.00 3.00 3.00 19.00 0.00 -2.00 15.00 30.00 5.00 15.00 8.00 -1.00
Data Penderita Kanker Paru-Paru (Lanjutan) 86 87
16.00 6.00
1.00 1.00
1.00 1.00
80.00 80.00
80.00 90.00
1.00 14.00
88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131
22.00 21.00 13.00 1.00 11.00 22.00 5.00 10.00 1.00 12.00 3.00 12.00 11.00 3.00 1.00 6.00 13.00 6.00 13.00 12.00 26.00 1.00 21.00 3.00 13.00 1.00 10.00 3.00 6.00 1.00 3.00 1.00 16.00 15.00 22.00 26.00 3.00 11.00 1.00 22.00 7.00 12.00 16.00 12.00
2.00 1.00 2.00 1.00 1.00 1.00 1.00 2.00 2.00 1.00 1.00 1.00 1.00 2.00 2.00 2.00 1.00 1.00 1.00 1.00 2.00 1.00 1.00 2.00 1.00 1.00 1.00 2.00 2.00 1.00 1.00 1.00 1.00 1.00 1.00 2.00 2.00 1.00 1.00 1.00 1.00 1.00 2.00 2.00
1.00 0.00 1.00 2.00 0.00 1.00 1.00 1.00 0.00 2.00 1.00 1.00 1.00 0.00 0.00 1.00 1.00 1.00 2.00 1.00 1.00 1.00 1.00 2.00 0.00 1.00 1.00 0.00 1.00 2.00 2.00 2.00 2.00 1.00 0.00 2.00 1.00 2.00 0.00 1.00 1.00 1.00 2.00 0.00
80.00 100.00 90.00 70.00 100.00 80.00 90.00 80.00 100.00 80.00 80.00 90.00 90.00 90.00 100.00 80.00 70.00 90.00 50.00 80.00 80.00 90.00 100.00 60.00 90.00 80.00 80.00 90.00 80.00 70.00 70.00 60.00 70.00 80.00 90.00 70.00 70.00 60.00 90.00 80.00 80.00 80.00 80.00 90.00
80.00 90.00 80.00 70.00 90.00 100.00 80.00 60.00 90.00 60.00 80.00 100.00 100.00 70.00 100.00 90.00 80.00 70.00 NA 90.00 100.00 90.00 80.00 50.00 70.00 90.00 100.00 100.00 100.00 70.00 60.00 70.00 60.00 90.00 90.00 80.00 80.00 60.00 90.00 80.00 60.00 90.00 60.00 60.00
1.00 4.00 39.00 2.00 -1.00 23.00 8.00 14.00 13.00 7.00 25.00 0.00 0.00 10.00 15.00 3.00 4.00 0.00 32.00 14.00 -3.00 NA 5.00 11.00 10.00 5.00 6.00 1.00 15.00 20.00 20.00 30.00 24.00 11.00 0.00 10.00 0.00 -3.00 17.00 20.00 13.00 0.00 28.00 4.00
Data Penderita Kanker Paru-Paru (Lanjutan) 132 133
4.00 16.00
2.00 1.00
1.00 1.00
80.00 80.00
80.00 80.00
52.00 20.00
134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177
6.00 13.00 1.00 22.00 12.00 13.00 1.00 5.00 21.00 3.00 26.00 1.00 11.00 26.00 16.00 16.00 12.00 13.00 13.00 22.00 5.00 16.00 32.00 NA 26.00 4.00 12.00 1.00 32.00 10.00 11.00 6.00 7.00 16.00 11.00 21.00 6.00 12.00 13.00 2.00 2.00 16.00 1.00 13.00
1.00 2.00 1.00 2.00 2.00 1.00 1.00 1.00 2.00 1.00 1.00 2.00 1.00 2.00 1.00 1.00 1.00 2.00 1.00 1.00 2.00 2.00 1.00 1.00 2.00 1.00 1.00 2.00 2.00 2.00 1.00 1.00 1.00 2.00 2.00 1.00 1.00 1.00 1.00 2.00 1.00 2.00 1.00 2.00
0.00 1.00 0.00 2.00 1.00 2.00 1.00 0.00 2.00 1.00 2.00 1.00 1.00 1.00 0.00 1.00 0.00 0.00 1.00 0.00 0.00 1.00 2.00 2.00 1.00 2.00 1.00 1.00 0.00 1.00 2.00 1.00 1.00 0.00 1.00 0.00 1.00 0.00 1.00 0.00 1.00 0.00 1.00 1.00
100.00 80.00 90.00 60.00 80.00 80.00 90.00 100.00 70.00 80.00 70.00 80.00 80.00 90.00 100.00 90.00 100.00 100.00 70.00 90.00 90.00 80.00 70.00 70.00 90.00 70.00 80.00 80.00 90.00 90.00 60.00 90.00 80.00 90.00 80.00 100.00 90.00 100.00 90.00 90.00 90.00 100.00 90.00 80.00
90.00 70.00 70.00 40.00 70.00 60.00 90.00 100.00 60.00 70.00 70.00 90.00 100.00 90.00 80.00 80.00 90.00 90.00 60.00 100.00 90.00 60.00 30.00 80.00 90.00 60.00 70.00 90.00 90.00 100.00 70.00 80.00 70.00 90.00 60.00 100.00 90.00 90.00 100.00 80.00 60.00 90.00 80.00 100.00
5.00 49.00 6.00 37.00 0.00 NA -5.00 15.00 -16.00 38.00 8.00 0.00 30.00 2.00 2.00 13.00 27.00 0.00 -2.00 7.00 0.00 4.00 10.00 20.00 7.00 27.00 -2.00 17.00 8.00 2.00 36.00 2.00 16.00 3.00 33.00 4.00 0.00 0.00 2.00 10.00 37.00 6.00 12.00 0.00
Data Penderita Kanker Paru-Paru (Lanjutan) 178 179
1.00 13.00
1.00 2.00
2.00 1.00
60.00 80.00
80.00 70.00
-2.00 NA
180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223
1.00 7.00 13.00 1.00 16.00 32.00 12.00 12.00 2.00 3.00 15.00 22.00 16.00 16.00 12.00 1.00 22.00 12.00 32.00 21.00 1.00 32.00 15.00 22.00 32.00 3.00 26.00 33.00 5.00 13.00 21.00 33.00 1.00 6.00 15.00 11.00 11.00 11.00 13.00 21.00 11.00 2.00 22.00 11.00
2.00 2.00 1.00 1.00 2.00 2.00 2.00 2.00 2.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 2.00 1.00 2.00 1.00 2.00 1.00 2.00 2.00 2.00 1.00 2.00 2.00 1.00 2.00 2.00 1.00 1.00 2.00 1.00 1.00 2.00 1.00 2.00 2.00 1.00 2.00
1.00 0.00 0.00 0.00 0.00 1.00 0.00 0.00 2.00 0.00 1.00 0.00 1.00 2.00 1.00 1.00 1.00 0.00 1.00 1.00 0.00 1.00 1.00 1.00 0.00 0.00 0.00 2.00 0.00 2.00 1.00 1.00 0.00 1.00 1.00 2.00 1.00 1.00 1.00 2.00 2.00 0.00 1.00 1.00
80.00 100.00 100.00 100.00 90.00 80.00 90.00 90.00 70.00 90.00 80.00 90.00 80.00 60.00 90.00 90.00 90.00 100.00 80.00 90.00 100.00 90.00 90.00 60.00 90.00 100.00 100.00 NA 80.00 60.00 80.00 90.00 100.00 80.00 90.00 70.00 80.00 90.00 90.00 80.00 70.00 80.00 80.00 80.00
90.00 100.00 100.00 90.00 100.00 90.00 80.00 100.00 90.00 80.00 60.00 90.00 90.00 70.00 80.00 80.00 90.00 100.00 90.00 90.00 80.00 70.00 90.00 60.00 100.00 100.00 90.00 70.00 90.00 60.00 70.00 80.00 90.00 70.00 70.00 100.00 90.00 70.00 80.00 60.00 30.00 80.00 90.00 90.00
13.00 0.00 5.00 -5.00 NA -1.00 0.00 5.00 20.00 8.00 12.00 8.00 14.00 NA NA 33.00 -2.00 6.00 0.00 4.00 0.00 0.00 37.00 5.00 0.00 1.00 0.00 NA 23.00 -3.00 NA 10.00 -2.00 23.00 0.00 31.00 10.00 18.00 -10.00 7.00 3.00 11.00 2.00 0.00
Data Penderita Kanker Paru-Paru (Lanjutan) 224 225
1.00 1.00
1.00 1.00
1.00 1.00
80.00 80.00
80.00 60.00
0.00 3.00
226 227 228 229
13.00 32.00 6.00 22.00
1.00 2.00 1.00 2.00
0.00 2.00 1.00 1.00
90.00 60.00 90.00 80.00
90.00 70.00 100.00 90.00
-5.00 5.00 1.00 0.00
2. Program S-Plus 2000 Model Cox Proportional Hazard Data Penderita Kanker ParuParu #Cox-Ph model untuk data kanker paru #Status=indikator kematian (2) atau pensensoran (1)
#Mencocokkan model Cox-Ph dan mendapatkan model cox-Ph terbaik inst<-lung$v1 time<-lung$v2 status<-lung$v3 age<-lung$v4 sex<-lung$v5 ph.ecog<-lung$v6 ph.karno<-lung$v7 pat.karno<-lung$v8 meal.cal<-lung$v9 wt.loss<-lung$v10 #Model akhir untuk model cox-ph lung.cox
base.havg<--log(base.savg) base.s0<-rep(jump.surv,nrep) base.h0<--log(base.s0) #Residual Cox-Snell x<-cbind(ph.ecog1,sex1,inst1,wt.loss1,ph.karno1,pat.karno1) tx<-cbind(id,time1,status1,x) ords<-order(time1) ord.tx<-tx[ords,] ord.txh<-cbind(ord.tx,base.h0) ord.xtb<-ord.txh[,4:9]%*%coef(ph1) ord.extb<-exp(ord.xtb) ord.rci<-ord.extb*ord.txh[,10] rci<-ord.rci[order(ord.txh[,1])] rci1<-status1-resid(ph1) xtb<-ord.xtb[order(ord.txh[,1])] #Modifikasi residual Cox-Snell rci.mod<-1-status+rci1 #Residual Martingale rmi<-status1-rci1 rmi1<-resid(ph1) mu<-mean(rmi1) #Residual deviance rdi<-sign(rmi1)*sqrt(-2*(rmi1+status1*log(status1-rmi1))) rdi1<-resid(ph1,type="deviance") #Residual Normal deviate shat<-(base.s0[order(ord.txh[,1])])^(exp(xtb)) shat1<-exp(-rci) ni<-qnorm(shat) nmi<-ni nmi[status1==0]<-qnorm(shat[status1==0]/2) nei<-ni nei[status1==0]<--exp(-(ni[status1==0]^2)/2)/(sqrt(2*pi)*shat[status1==0])
#residual Log-odds li<-log(shat/(1-shat)) lmi<-li lmi[status1==0]<-log(shat[status1==0]/(2-shat[status1==0])) lei<-li lei[status1==0]<-li[status1==0](1+exp(li[status1==0]))*log(1+exp(li[status1==0]))/exp(li[status1==0]) par(mfrow=c(2,2)) plot(xtb[status1==1],rci1[status1==1],type="p",pch=".", xlim=c(min(xtb),max(xtb)),ylim=c(min(rci1),max(rci1)),xlab="linear predictor",ylab="residual") points(xtb[status1==0],rci1[status1==0],type="p",pch="*") title(main="Residual Cox-Snell Model Cox-PH",cex=.6)
plot(xtb[status1==1],rmi1[status1==1],type="p",pch=".",
xlim=c(min(xtb),max(xtb)),ylim=c(min(rmi1),max(rmi1)),xlab="linear predictor",ylab="residual") points(xtb[status1==0],rmi1[status1==0],type="p",pch="*") title(main="Residual Martingale Model Cox-PH",cex=.6) abline(mu) mu2<-mean(rdi1) plot(xtb[status1==1],rdi1[status1==1],type="p",pch=".", xlim=c(min(xtb),max(xtb)),ylim=c(min(rdi1),max(rdi1)),xlab="linear predictor",ylab="residual") points(xtb[status1==0],rdi1[status1==0],type="p",pch="*") title(main="Residual Deviance Model Cox-PH",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) abline(mu2) mu3<-mean(ni) plot(xtb[status1==1],ni[status1==1],type="p",pch=".", xlim=c(min(xtb),max(xtb)),ylim=c(min(ni),max(ni)),xlab="linear predictor",ylab="residual") points(xtb[status1==0],ni[status1==0],type="p",pch="*") title(main="Residual Normal Deviate Model Cox-PH",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) abline(mu3) mu4<-mean(lmi) plot(xtb[status1==1],lmi[status1==1],type="p",pch=".", xlim=c(min(xtb),max(xtb)),ylim=c(min(lmi),max(lmi)),xlab="linear predictor",ylab="residual") points(xtb[status1==0],lmi[status1==0],type="p",pch="*") title(main="Residual Log-Odds Model Cox-PH",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) abline(mu4) #Histogram Residual Cox-Snell hist(rci1,xlab="Residual Cox-Snell Model Cox-PH") den.rci1<-density(rci1) den.rci1<-density(rci1,width=1.5) den.rci1$y<-den.rci1$y*length(rci1)*0.5 lines(den.rci1,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(rci1)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(rci1) qqline(rci1) #Histogram Residual Martingale hist(rmi1,xlab="Residual Martingale Model Cox-PH") den.rmi1<-density(rmi1) den.rmi1<-density(rmi1,width=1.5) den.rmi1$y<-den.rmi1$y*length(rmi1)*0.5 lines(den.rmi1,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(rmi1)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(rmi1)
qqline(rmi1) #Histogram Residual Deviance hist(rdi1,xlab="Residual Deviance Model Cox-PH") den.rdi1<-density(rdi1) den.rdi1<-density(rdi1,width=1.5) den.rdi1$y<-den.rdi1$y*length(rdi1)*0.5 lines(den.rdi1,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(rdi1)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(rdi1) qqline(rdi1)
#Histogram Residual Normal Deviate hist(ni,xlab="Residual Normal Deviate Model Cox-PH") den.ni<-density(ni) den.ni<-density(ni,width=1.5) den.ni$y<-den.ni$y*length(ni)*0.5 lines(den.ni,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(ni)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(ni) qqline(ni) #Histogram Residual Log-Odds hist(lmi,xlab="Residual Log-Odds Model Cox-PH") den.lmi<-density(lmi) den.lmi<-density(lmi,width=3) den.lmi$y<-den.lmi$y*length(lmi)*1 lines(den.lmi,lwd=2) xs<-seq(-3,3,.01) ys<-dlogis(xs) ys<-ys*length(lmi)*1 lines(xs,ys,lwd=2,type="o") plot(qlogis(ppoints(lmi)),sort(lmi)) #logistic qqplot abline(lm(sort(lmi)~qlogis(ppoints(lmi))))
3. Program S-Plus 2000 Model Parametrik Data Penderita Kanker Paru-Paru inst<-lung$v1 time<-lung$v2 status<-lung$v3
age<-lung$v4 sex<-lung$v5 ph.ecog<-lung$v6 ph.karno<-lung$v7 pat.karno<-lung$v8 meal.cal<-lung$v9 wt.loss<-lung$v10 ldata<-lung[,c(1,2,3,5,6,7,8,10)] inds<-is.na(apply(ldata,1,sum)) lung1<-ldata[!inds,] dim(lung1) attach(lung1) inst1<-lung1$inst time1<-lung1$time status1<-lung1$status sex1<-lung1$sex ph.ecog1<-lung1$ph.ecog ph.karno1<-lung1$ph.karno pat.karno1<-lung1$pat.karno wt.loss1<-lung1$wt.loss #Model parametrik exp.lung1<survReg(Surv(time1,status1)~ph.ecog1+sex1+inst1+wt.loss1+ph.karno1+pat.karn o1,data=lung1,na.action=na.exclude,dist="exp") summary(exp.lung1) weib.lung1<survReg(Surv(time1,status1)~ph.ecog1+sex1+inst1+wt.loss1+ph.karno1+pat.karn o1,data=lung1,na.action=na.exclude,dist="weib") summary(weib.lung1)
#Standarisasi residual intcp<-rep(1,209) pre.exp
rcimod.exp<-1-status1+rci.exp rcimod.weib<-1-status1+rci.weib #Residual Martingale rmi.exp<-status1-rci.exp rmi1.exp<-resid(exp.lung1) rmi.weib<-status1-rci.weib rmi1.weib<-resid(weib.lung1) #Residual Deviance rdi.exp<-sign(rmi1.exp)*sqrt(-2*(rmi1.exp+status1*log(status1-rmi1.exp))) rdi1.exp<-resid(exp.lung1,type="deviance") rdi.weib<-sign(rmi1.weib)*sqrt(-2*(rmi1.weib+status1*log(status1-rmi1.weib))) rdi1.weib<-resid(weib.lung1,type="deviance") #Residual Normal Deviate shat.exp<-exp(-rci.exp) ni.exp<-qnorm(shat.exp) nmi.exp<-ni.exp nmi.exp[status1==0]<-qnorm(shat.exp[status1==0]/2) nei.exp<-ni.exp nei.exp[status1==0]<--exp((ni.exp[status1==0]^2)/2)/(sqrt(2*pi)*shat.exp[status1==0]) shat.weib<-exp(-rci.weib) ni.weib<-qnorm(shat.weib) nmi.weib<-ni.weib nmi.weib[status1==0]<-qnorm(shat.weib[status1==0]/2) nei.weib<-ni.weib nei.weib[status1==0]<--exp((ni.weib[status1==0]^2)/2)/(sqrt(2*pi)*shat.weib[status1==0]) #Residual Log-Odds li.exp<-log(shat.exp/(1-shat.exp)) lmi.exp<-li.exp lmi.exp[status1==0]<-log(shat.exp[status1==0]/(2-shat.exp[status1==0])) lei.exp<-li.exp lei.exp[status1==0]<-li.exp[status1==0](1+exp(li.exp[status1==0]))*log(1+exp(li.exp[status1==0]))/exp(li.exp[statu s1==0]) li.weib<-log(shat.weib/(1-shat.weib)) lmi.weib<-li.weib lmi.weib[status1==0]<-log(shat.weib[status1==0]/(2-shat.weib[status1==0])) lei.weib<-li.weib lei.weib[status1==0]<-li.weib[status1==0](1+exp(li.exp[status1==0]))*log(1+exp(li.exp[status1==0]))/exp(li.exp[statu s1==0])
par(mfrow=c(2,2)) plot(pre.exp[status1==1],rci.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(rci.exp),max(rci.exp)),xlab="line ar predictor",ylab="residual") points(pre.exp[status1==0],rci.exp[status1==0],type="p",pch="*") title(main="Residual Cox-Snell Model Eksponensial",cex=.6) plot(pre.weib[status1==1],rci.weib[status1==1],type="p",pch=".",
xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(rci.weib),max(rci.weib)),xlab=" linear predictor",ylab="residual") points(pre.weib[status1==0],rci.weib[status1==0],type="p",pch="*") title(main="Residual Cox-Snell Model Weibull",cex=.6) plot(pre.exp[status1==1],rmi1.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(rmi1.exp),max(rmi1.exp)),xlab="li near predictor",ylab="residual") points(pre.exp[status1==0],rmi1.exp[status1==0],type="p",pch="*") title(main="Residual Martingale Model Eksponensial ",cex=.6) plot(pre.weib[status1==1],rmi1.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(rmi1.weib),max(rmi1.weib)),xlab ="linear predictor",ylab="residual") points(pre.weib[status1==0],rmi1.weib[status1==0],type="p",pch="*") title(main="Residual Martingale Model Weibull ",cex=.6) plot(pre.exp[status1==1],rdi1.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(rdi1.exp),max(rdi1.exp)),xlab="li near predictor",ylab="residual") points(pre.exp[status1==0],rdi1[status1==0],type="p",pch="*") title(main="Residual Deviance model Eksponensial",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.weib[status1==1],rdi1.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(rdi1.weib),max(rdi1.weib)),xlab ="linear predictor",ylab="residual") points(pre.weib[status1==0],rdi1[status1==0],type="p",pch="*") title(main="Residuals Deviance Model Weibull",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.exp[status1==1],nmi.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(nmi.exp),max(nmi.exp)),xlab="line ar predictor",ylab="residual") points(pre.exp[status1==0],nmi.exp[status1==0],type="p",pch="*") title(main="Residual Normal Deviate Model Eksponensial",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.weib[status1==1],nmi.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(nmi.weib),max(nmi.weib)),xlab=" linear predictor",ylab="residual") points(pre.weib[status1==0],nmi.weib[status1==0],type="p",pch="*") title(main="Residual Normal Deviate Model Weibull",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2)
plot(pre.exp[status1==1],lmi.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(lmi.exp),max(lmi.exp)),xlab="line ar predictor",ylab="residual") points(pre.exp[status1==0],lmi.exp[status1==0],type="p",pch="*") title(main="Residual Log-Odds Model Eksponensial",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.weib[status1==1],lmi.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(lmi.weib),max(lmi.weib)),xlab=" linear predictor",ylab="residual") points(pre.weib[status1==0],lmi.weib[status1==0],type="p",pch="*") title(main="Residual Log-Odds Model Weibull",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) #Histogram Residual Cox-Snell Model Eksponensial hist(rci.exp,xlab="Residual Cox-Snell Model Eksponensial")
den.rci.exp<-density(rci.exp) den.rci.exp<-density(rci.exp,width=1.5) den.rci.exp$y<-den.rci.exp$y*length(rci.exp)*0.5 lines(den.rci.exp,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(rci.exp)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(rci.exp) qqline(rci.exp) #Histogram Residual Cox-Snell Model Weibull hist(rci.weib,xlab="Residual Cox-Snell Model Weibull") den.rci.weib<-density(rci.weib) den.rci.weib<-density(rci.weib,width=1.5) den.rci.weib$y<-den.rci.weib$y*length(rci.weib)*0.5 lines(den.rci.weib,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(rci.weib)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(rci.weib) qqline(rci.weib) #Histogram Residual Martingale Model Eksponensial hist(rmi1.exp,xlab="Residual Martingale Model Eksponensial") den.rmi1.exp<-density(rmi1.exp) den.rmi1.exp<-density(rmi1.exp,width=1.5) den.rmi1.exp$y<-den.rmi1.exp$y*length(rmi1.exp)*0.5 lines(den.rmi1.exp,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(rmi1.exp)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(rmi1.exp) qqline(rmi1.exp) #Histogram Residual Martingale Model Weibull hist(rmi1.weib,xlab="Residual Martingale Model Weibull") den.rmi1.weib<-density(rmi1.weib) den.rmi1.weib<-density(rmi1.weib,width=1.5) den.rmi1.weib$y<-den.rmi1.weib$y*length(rmi1.weib)*0.5 lines(den.rmi1.weib,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(rmi1.weib)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(rmi1.weib) qqline(rmi1.weib)
#Histogram Residual Deviance Model Eksponensial
hist(rdi1.exp,xlab="Residual Deviance Model Eksponensial") den.rdi1.exp<-density(rdi1.exp) den.rdi1.exp<-density(rdi1.exp,width=1.5) den.rdi1.exp$y<-den.rdi1.exp$y*length(rdi1.exp)*0.5 lines(den.rdi1.exp,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(rdi1.exp)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(rdi1.exp) qqline(rdi1.exp) #Histogram Residual Deviance Model Weibull hist(rdi1.weib,xlab="Residual Deviance Model Weibull") den.rdi1.weib<-density(rdi1.weib) den.rdi1.weib<-density(rdi1.weib,width=1.5) den.rdi1.weib$y<-den.rdi1.weib$y*length(rdi1.weib)*0.5 lines(den.rdi1.weib,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(rdi1.weib)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(rdi1.weib) qqline(rdi1.weib)
#Histogram Residual Normal Deviate Model Eksponensial hist(nmi.exp,xlab="Residual Normal Deviate Model Eksponensial") den.nmi.exp<-density(nmi.exp) den.nmi.exp<-density(nmi.exp,width=1.5) den.nmi.exp$y<-den.nmi.exp$y*length(nmi.exp)*0.5 lines(den.nmi.exp,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(nmi.exp)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(nmi.exp) qqline(nmi.exp) #Histogram Residual Normal Deviate Model Weibull hist(nmi.weib,xlab="Residual Normal Deviate Model Weibull") den.nmi.weib<-density(nmi.weib) den.nmi.weib<-density(nmi.weib,width=1.5) den.nmi.weib$y<-den.nmi.weib$y*length(nmi.weib)*0.5 lines(den.nmi.weib,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(nmi.weib)*0.5 lines(xs,ys,lwd=2,type="o") qqnorm(nmi.weib)
qqline(nmi.weib) #Histogram Residual Log-Odds Model Eksponensial hist(lmi.exp,xlab="Residual Log-Odds Model Eksponensial") den.lmi.exp<-density(lmi.exp) den.lmi.exp<-density(lmi.exp,width=3) den.lmi.exp$y<-den.lmi.exp$y*length(lmi.exp)*1 lines(den.lmi.exp,lwd=2) xs<-seq(-3,3,.01) ys<-dlogis(xs) ys<-ys*length(lmi.exp)*1 lines(xs,ys,lwd=2,type="o") plot(qlogis(ppoints(lmi.exp)),sort(lmi.exp)) #logistic qqplot abline(lm(sort(lmi.exp)~qlogis(ppoints(lmi.exp)))) #Histogram Residual Log-Odds Model Weibull hist(lmi.weib,xlab="Residual Log-Odds Model Weibull") den.lmi.weib<-density(lmi.weib) den.lmi.weib<-density(lmi.weib,width=3) den.lmi.weib$y<-den.lmi.weib$y*length(lmi.weib)*1 lines(den.lmi.weib,lwd=2) xs<-seq(-3,3,.01) ys<-dlogis(xs) ys<-ys*length(lmi.weib)*1 lines(xs,ys,lwd=2,type="o") plot(qlogis(ppoints(lmi.weib)),sort(lmi.weib)) #logistic qqplot abline(lm(sort(lmi.weib)~qlogis(ppoints(lmi.weib))))
4. Program S-Plus 2000 Untuk Simulasi set.seed(373) npat<-100 rate1<-1 rmult<-1/2 stimes1<-rexp(npat,rate=rate1) #menghasilkan sampel random pada survival time berukuran 100 dari distribusi eksponensial stimes2<-rexp(npat,rate=rmult)
stimes<-c(stimes1,stimes2) stimes group<-rep(0:1,rep(npat,2)) #menghasilkan laporan grup kovariat group etimes<-runif(npat*2) etimes quantile(etimes+stimes,probs=seq(0,1,.10),na.rm=F) #sensor pada x tahun #gunakan max(stimes) (tanpa pensensoran) x<-max(stimes)+1 event<-rep(1,npat*2) event[(etimes+stimes)>x]<-0 stimes[(etimes+stimes)>x]<-x-etimes[(etimes+stimes)>x]
ph1<-coxph(Surv(stimes,event)~group,method="breslow") ph1z<-cox.zph(ph1) #plot(ph1z) base.avg<-survfit(ph1) base.zero<-survfit(ph1,data.frame(group=0)) jump.times<-base.zero$time jump.surv<-base.zero$surv numd<-base.zero$n.event numr<-base.zero$n.risk nrep<--diff(c(numr,0)) base.savg<-rep(base.avg$surv,nrep) base.havg<--log(base.savg) base.s0<-rep(jump.surv,nrep) base.h0<--log(base.s0) #Residual Cox-Snell rci<-event-resid(ph1) #rci #Modifikasi Residual Cox-Snell rci.mod<-1-event+rci #Residual Martingale rmi<-resid(ph1) #Residual Deviance rdi<-resid(ph1,type="deviance") #Residual Normal Deviate Shat<-exp(-rci) ni<-qnorm(Shat) #Residual Log-Odds li<-log(Shat/(1-Shat)) #HISTOGRAM par(mfrow=c(2,2)) hist(ni)
den.ni<-density(ni) den.ni<-density(ni,width=1.5) den.ni$y<-den.ni$y*length(ni)*0.5 lines(den.ni,lwd=2) xs<-seq(-3,8,.05) xs ys<-dnorm(xs) ys<-ys*length(ni)*0.5 lines(xs,ys,type="o",lwd=2) qqnorm(ni) qqline(ni) hist(li) den.li<-density(li) den.li<-density(li,width=3) den.li$y<-den.li$y*length(li)*1 lines(den.li,lwd=2) xs<-seq(-6,6,.1) ys<-dlogis(xs) ys<-ys*length(li)*1 lines(xs,ys,type="o",lwd=2) plot(qlogis(ppoints(li)),sort(li)) abline(lm(sort(li)~qlogis(ppoints(li))))
#Residual Normal Deviate pada Model Parametrik expfit<-survReg(Surv(stimes,event)~group,dist="exponential") expfit2<-survReg(Surv(stimes,event)~group,dist="weibull") ests1<-coef(expfit) ests2<-coef(expfit2) #Nilai skala yang dihasilkan dari expfit1--expfit2 scale1<-1 scale2<-0.9471844 rsi1<-(log(stimes)-(ests1[1]+ests1[2]*group))/scale1 rsi2<-(log(stimes)-(ests2[1]+ests2[2]*group))/scale2 Shat1<-exp(-exp(rsi1)) Shat2<-exp(-exp(rsi2)) ni1<-qnorm(Shat1) ni2<-qnorm(Shat2) #Residual Log-Odds pada Model Parametrik li1<-log(Shat1/(1-Shat1)) li2<-log(Shat2/(1-Shat2)) par(mfrow=c(2,2)) hist(ni1) den.ni1<-density(ni1) den.ni1<-density(ni1,width=1.5) den.ni1$y<-den.ni1$y*length(ni1)*0.5 lines(den.ni1,lwd=2)
xs<-seq(-3,3,.1) ys<-dnorm(xs) ys<-ys*length(ni1)*0.5 lines(xs,ys,type="o",lwd=2) qqnorm(ni1) qqline(ni1) hist(ni2) den.ni2<-density(ni2) den.ni2<-density(ni2,width=1.5) den.ni2$y<-den.ni2$y*length(ni2)*0.5 lines(den.ni2,lwd=2) xs<-seq(-3,3,.1) ys<-dnorm(xs) ys<-ys*length(ni2)*0.5 lines(xs,ys,type="o",lwd=2) qqnorm(ni2) qqline(ni2) par(mfrow=c(2,2)) hist(li1) den.li1<-density(li1) den.li1<-density(li1,width=1.5) den.li1$y<-den.li1$y*length(li1)*0.5 lines(den.li1,lwd=2) xs<-seq(-3,3,.1) ys<-dlogis(xs) ys<-ys*length(li1)*0.5 lines(xs,ys,type="o",lwd=2) plot(qlogis(ppoints(li1)),sort(li1)) abline(lm(sort(li1)~qlogis(ppoints(li1)))) hist(li2) den.li2<-density(li2) den.li2<-density(li2,width=1.5) den.li2$y<-den.li2$y*length(li2)*0.5 lines(den.li2,lwd=2) xs<-seq(-3,3,.1) ys<-dlogis(xs) ys<-ys*length(li2)*0.5 lines(xs,ys,type="o",lwd=2) plot(qlogis(ppoints(li2)),sort(li2)) abline(lm(sort(li2)~qlogis(ppoints(li2)))) #Distribusi Weibull set.seed(373) n<-100 shap1<-2 shap2<-2 scal1<-.5 scal2<-2 stims1<-rweibull(n,shap1,scall) stims2<-rweibull(n,shap2,scal2) stims<-c(stims1,stims2) group<-rep(0:1,rep(n,2))
etims<-runif(n*2) quantile(etims+stims,probs=seq(0,1,.10),na.rm=F) x<-1.5247752 evnt<-rep(1,n*2) evnt[(etims+stims)>x]<-0 stims[(etims+stims)>x]<-x-etims[(etims+stims)>x] fit1<-survReg(Surv(stims,evnt)~group,dist="Eksponensial") fit2<-survReg(Surv(stims,evnt)~group,dist="Weibull") ests<-coef(fit1) lhat1<-exp(-ests[1]) lhat2<-exp(-sum(ests)) times<-seq(0,max(stims),.1) Shat1<-exp(-exp(log(times)-ests[1])) Shat2<-exp(-exp(log(times)-sum(ests))) par(mfrow=c(2,2)) km1<-survfit(Surv(stims,evnt)~group) plot(km1,lty=c(1,4)) plot(km[1],conf.int="n",xlim=c(0,max(stims))) lines(tims,Shat1,lty=4) plot(km1[2],conf.int="n",xlim=c(0,max(stims))) lines(tims,Shat2,lty=4) ph1<-coxph(Surv(stims,evnt)~group,method="breslow") ph1z<-cox.zph(ph1) plot(ph1z) 1p.ph1<-ph1$linear.predictors #Perhitungan Estimasi Nelson-Aalen pada baseline Hazard base.avg<-survfit(ph1) base.zero<-survfit(ph1,data.frame(group=0)) jump.time<-base.zero$time jump.surv<-base.zero$surv numd<-base.zero$n.event numr<-base.zero$n.risk nrep<--diff(c(numr,0)) base.savg<-rep(base.avg$surv,nrep) base.havg<--log(base.savg) base.s0<-rep(jump.surv,nrep) base.h0<--log(base.s0) #Residual Cox-Snell rci<-evnt-resid(ph1) #Modifikasi Residual Cox-Snell rci.mod<-1-evnt+rci #Residual Martingale rmi<-resid(ph1) #Residual Deviance rdi<-resid(ph1,type="deviance")
#Residual Normal Deviate Scap<-exp(-rci) ni<-qnorm(Scap) #Residual Log-Odds li<-log(Scap/(1-Scap)) lmi<-li lmi[event==0]<-log(Scap[event==0]/(2-Scap[event==0])) #HISTOGRAM par(mfrow=c(2,2)) hist(nimpmean,xlab="Residual Normal Deviate") den.nimpmean<-density(nimpmean) den.nimpmean<-density(nimpmean,width=1.5) den.nimpmean$y<-den.nimpmean$y*length(nimpmean)*0.5 lines(den.nimpmean,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(nimpmean)*0.5 lines(xs,ys,type="o",lwd=2) qqnorm(nimpmean) qqline(nimpmean) hist(lmi,xlab="Residual Log-Odds") den.lmi<-density(lmi) den.lmi<-density(lmi,width=3) den.lmi$y<-den.lmi$y*length(lmi)*1 lines(den.lmi,lwd=2) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(lmi)*0.5 lines(xs,ys,type="o",lwd=2) plot(qlogis(ppoints(lmi1)),sort(lmi1)) abline(lm(sort(lmi1)~qlogis(ppoints(lmi1)))) #Residual Normal Deviate pada Model Parametrik fit1<-survReg(Surv(stims,evnt)~group,dist="Eksponensial") fit2<-survReg(Surv(stims,evnt)~group,dist="Weibull") ests1<-coef(fit1) ests2<-coef(fit2) #Nilai skala yang dihasilkan dari expfit1--expfit2 scale<-1 scale2<-.660931 rs1<-(log(stims)-(ests[1]+ests[2]*group))/scale1 rs2<-(log(stims)-(ests[1]+ests[2]*group))/scale2 Scap1<-exp(-exp(rs1)) Scap2<-exp(-exp(rs2)) ni1<-qnorm(Scap1) ni2<-qnorm(Scap2)
#Residual Log-Odds pada Model Parametrik li1<-log(Scap1/(1-Scap1)) li2<-log(Scap2/(1-Scap2))
lmi1<-li1 lmi1[evnt==0]<-log(Scap1[evnt==0]/(2-Scap1[evnt==0])) lmi2<-li2 lmi2[evnt==0]<-log(Scap2[evnt==0]/(2-Scap2[evnt==0])) den.nimp1<-density(nimp1) den.nimp2-density(nimp2) hist(nimp2,xlab="Residual Normal Deviate") den.nimp2<-density(nimp2) den.nimp2<-density(nimp2,width=1.5) den.nimp2$y<-den.nimp2$y*length(nimp2)*0.5 lines(den.nimp1,lwd=2,lty=1,col=1) lines(den.nimp2lwd=2,lty=1,col=1) xs<-seq(-3,3,.01) ys<-dnorm(xs) ys<-ys*length(nimp1)*.5 lines(xs,ys,type="o",lwd=2) legend(0,40,c("Eksponensial","Weibull"),lty=1:2) qqnorm(nimp2) qqline(nimp2) den.lmi1<-density(lmi1,width=3) den.lmi2-density(lmi2width=3) hist(lmi2,xlab="Residual Log-Odds") den.lmi2<-density(lmi2) den.lmi2<-density(lmi2,width=1.5) den.lmi2$y<-den.lmi2$y*length(lmi2)*1 lines(den.lmi1,lwd=2,lty=1,col=1) lines(den.lmi2lwd=2,lty=1,col=1) xs<-seq(-6,6,.05) ys<-dlogis(xs) ys<-ys*length(lmi2)*1 lines(xs,ys,lwd=2,type="o") legend(2,70,c("Eksponensial","Weibull"),lty=1:2)