ANALISIS DATA SURVIVAL MENGGUNAKAN MODEL HAZARD PROPORSIONAL
YUDA SUSANTI G54103014
DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2008
ABSTRACT YUDA SUSANTI. Survival Data Analysis Using Proportional Hazard Model. Supervised by HADI SUMARNO and KUTHA ARDANA. A lot of events occured in daily life are connected with time, for example a salesman who needs time to sell an amount certain item, time duration which is needed to recover from disease, etc. Data about time duration of an event is called survival data. Commonly, survival data can not be observed completely. Therefore, an accurate method is needed to analyze the survival data. Proportional hazard model is employed to analyze and determine the survival rate from censored data affected one or more explanatory variables. This model assumed that the hazard rate of group is proportional to the hazard rate of another group. The model would be applied to determine the survival rate of the Multiple Myeloma patients.
ABSTRAK YUDA SUSANTI. Analisis Data Survival Menggunakan Model Hazard Proporsional. Dibimbing oleh HADI SUMARNO dan KUTHA ARDANA. Banyak peristiwa yang terjadi dalam kehidupan sehari-hari terkait dengan waktu, seperti seorang sales yang membutuhkan waktu untuk menjual sejumlah barang tertentu, lamanya waktu yang diperlukan oleh seseorang untuk memperoleh kesembuhan dari penyakit yang dideritanya, dan lain-lain. Data tentang lamanya waktu dari suatu peristiwa disebut dengan data survival. Data survival pada umumnya tidak dapat diamati secara utuh. Karenanya diperlukan suatu metode analisis yang tepat untuk menentukan tingkat survival dari data tersebut. Model hazard proporsional digunakan untuk menganalisis dan menentukan tingkat survival dari data tersensor yang dipengaruhi satu atau lebih peubah penjelas. Model ini mengasumsikan bahwa fungsi resiko untuk individu pada suatu grup proporsional dengan fungsi resiko pada grup lain. Model ini diaplikasikan untuk menentukan tingkat bertahan pasien Multiple Myeloma.
ANALISIS DATA SURVIVAL MENGGUNAKAN MODEL HAZARD PROPOSIONAL
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Oleh : YUDA SUSANTI G54103014
DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2008
Judul Skripsi Nama NRP
: Analisis Data Survival Menggunakan Model Hazard Proporsional : Yuda Susanti : G54103014
Menyetujui: Pembimbing I,
Pembimbing II,
Dr. Ir. Hadi Sumarno, M.S. NIP. 131 430 804
Ir. N. K. Kutha Ardana, M.Sc. NIP. 131 842 412
Mengetahui: Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. drh. Hasim, DEA NIP. 131 578 806
Tanggal Lulus:
PRAKATA Alhamdulillaahi Rabbil ’Aalamiin, segala puji dan syukur penulis panjatkan kehadirat Allah SWT atas segala karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Shalawat serta salam semoga selalu tercurah kepada Nabi Muhammad SAW beserta keluarga, sahabat, dan pengikutnya hingga akhir jaman. Karya ilmiah ini berjudul “Analisis Data Survival Menggunakan Model Hazard Proporsional”. Karya ilmiah ini disusun sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains pada Departemen Matematika. Penulis mengucapkan terima kasih kepada Bapak Hadi Sumarno dan Bapak Kutha Ardana selaku dosen pembimbing atas waktu yang diberikan, bimbingan dan saran yang telah diberikan, serta Bapak Putu Purnaba atas kesediaannya menjadi penguji yang juga telah memberikan saran dan masukan yang dibutuhkan penulis. Ungkapan terima kasih juga disampaikan kepada: 1. Mimi dan Bapak tercinta, adik-adikku: Lia, Fajar, Aldi yag tersayang, serta seluruh keluarga atas segala doa, kasih sayang, serta dukungan yang telah diberikan kepada penulis. 2. Seluruh dosen Departemen Matematika FMIPA IPB atas ilmu dan nasihat yang bermanfaat sehingga membantu penulis dalam menyelesaikan karya ilmiah ini, serta kepada seluruh staf Departemen Matematika yang telah membantu penulis selama belajar di Departemen Matematika IPB. 3. Niken, Nidia, dan Lia M atas kesediaannya menjadi pembahas dalam seminar tugas akhir penulis. 4. Teman-teman Wisma Ayu Depan yang telah memberikan semangat, motivasi dan membantu dalam pelaksanaan seminar. 5. Semua teman seperjuangan, senasib, dan sepenanggungan, Matematika 40. Terima kasih atas kenangan dan kebersamaan dalam segala suasana hati. Biar jauh di mata, namun tetap di hati. 6. Biru Muda, kakak-kakak kelas Matematika 39, serta adik-adik Matematika angkatan 41, 42 dan 43. 7. Semua pihak yang telah memberikan dukungan kepada penulis yang tidak dapat disebut satu per satu sehingga karya ilmiah ini dapat diselesaikan. Penulis menyadari bahwa penulisan karya ilmiah ini masih jauh dari sempurna. Oleh karena itu kritik dan saran yang membangun sangat penulis harapkan sebagi pemicu untuk bisa berkarya lebih baik di masa mendatang. Semoga karya ilmiah ini dapat bermanfaat bagi pihak yang membutuhkan. Bogor, Februari 2008
Yuda Susanti
RIWAYAT HIDUP Penulis dilahirkan di Cirebon pada tanggal 9 November 1985 sebagai anak pertama dari empat bersaudara dari pasangan Bapak Sujana dan Ibu Susilowati. Pada tahun 1997 penulis menyelesaikan pendidikan dasar di SDN 06 PAGI Jakarta Timur, kemudian melanjutkan studi ke sekolah menengah pertama di SLTPN 139 Jakarta Timur hingga tahun 2000. Pada tahun 2003 penulis menyelesaikan pendidikan menengah atas di SMUN 44 Jakarta Timur dan pada tahun yang sama diterima di Departemen Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Semasa menjadi mahasiswa, penulis aktif di organisasi kemahasiswaan tingkat fakultas dan tingkat departemen. Pada periode tahun 2004-2005 penulis menjadi Bendahara Dua Serambi Ruhiyah Mahasiswa FMIPA (SERUM-G), dan pada periode waktu yang sama menjadi staf Departemen Kerohanian Matematika di Gugus Mahasiswa Matematika (GUMATIKA). Pada periode tahun 2005-2006 penulis menjadi Bendahara Umum SERUM-G. Pada periode tahun 2005-2007 penulis menjadi Asisten Praktikum Pendidikan Agama Islam untuk tingkat TPB, serta kepanitiaan yang diselenggarakan oleh Badan Eksekutif Mahasiswa FMIPA pada periode 2004/2005 dan periode 2005/2006.
vii
DAFTAR ISI Halaman DAFTAR ISI ................................................................................................................................ vii DAFTAR TABEL ........................................................................................................................ viii DAFTAR GAMBAR ................................................................................................................... viii DAFTAR LAMPIRAN ................................................................................................................ viii I.
PENDAHULUAN I.1 Latar Belakang ................................................................................................................. 1 I.2 Permasalahan ................................................................................................................... 1 I.3 Tujuan .............................................................................................................................. 1
II. LANDASAN TEORI ............................................................................................................ 1 III. MODEL III.1 Contoh Data Survival .................................................................................................... III.2 Model Hazard Proporsional untuk Dua Populasi ......................................................... III.3 Bentuk Umum Model Hazard Proporsional ................................................................. III.4 Fitting Model Hazard Proporsional .............................................................................. III.5 Fungsi Survivor Model Hazard Proporsional ............................................................... III.6 Penduga Fungsi Hazard dan Fungsi Survivor .............................................................. III.7 Algoritma Penentuan Rasio Hazard ............................................................................. III.8 Standar Error dan Selang Kepercayaan untuk Rasio Hazard ......................................
4 4 5 5 7 8 9 9
IV. CONTOH KASUS ................................................................................................................ 10 V. SIMPULAN .......................................................................................................................... 15 DAFTAR PUSTAKA .................................................................................................................. 15 LAMPIRAN .................................................................................................................................. 16
vii
DAFTAR TABEL Halaman 1 Contoh Data Tidak Tersensor ................................................................................................ 4 2 Contoh Data Tersensor ........................................................................................................... 4 3 Hasil Analisis Survival Model Hazard Proporsional ............................................................. 10
DAFTAR GAMBAR Halaman 1 Fungsi Hazard Usia Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan ................................................................... 2 Fungsi Hazard Jenis Kelamin Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan ................................................................... 3 Fungsi Hazard Nitrogen Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan ................................................................... 4 Fungsi Hazard Kalsium Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan ................................................................... 5 Fungsi Hazard Hemoglobin Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan ................................................................... 6 Fungsi Hazard %Plasma Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan ................................................................... 7 Fungsi Hazard Protein Bence-Jones Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan ...................................................................
11 11 12 12 13 13 14
DAFTAR LAMPIRAN Halaman 1 2 3 4 5 6 7 8
Kode Program Analisis Survival dengan Peubah Gabungan ................................................ Kode Program Analisis Survival dengan Peubah Interaksi (NHB) ...................................... Kode Program Analisis Survival dengan Peubah Interaksi (N&HB) ................................. Kode Program Analisis Survival dengan Peubah Tunggal ................................................... Output Analisis Survival dengan Peubah Gabungan ............................................................. Output Analisis Survival dengan Peubah Interaksi (N&HB) ................................................ Output Analisis Survival dengan Peubah Interaksi (NHB) ................................................... Output Analisis Survival untuk tiap-tiap Peubah Tunggal a. Usia ..................................................................................................................................... b. Jenis Kelamin ..................................................................................................................... c. Nitrogen .............................................................................................................................. d. Kalsium ............................................................................................................................... e. Hemoglobin ........................................................................................................................ f. % Plasma ............................................................................................................................ g. Protein Bence-Jones ........................................................................................................... 9 Data Survival Times dari 48 pasien Multiple Myeloma ........................................................
17 17 18 18 19 20 20 21 22 23 23 24 25 26 27
viii
I. PENDAHULUAN I.1 Latar Belakang Banyak peristiwa terjadi dalam kehidupan sehari-hari yang terkait dengan waktu, misalnya waktu yang diperlukan oleh seorang sales untuk menjual sejumlah barang tertentu, lamanya waktu yang diperlukan oleh seseorang untuk memperoleh kesembuhan dari penyakit yang dideritanya dan lain-lain. Data pengamatan di atas disebut data survival. Data survival adalah data tentang pengamatan jangka waktu dari awal pengamatan sampai terjadinya suatu peristiwa (survival time). Data survival pada umumnya tidak dapat diamati secara utuh (tersensor), sehingga diperlukan suatu analisis survival untuk menganalisis dengan tepat. Seringkali terjadinya peristiwa tersebut ditentukan oleh faktor lain. Ketahanan pasien penderita suatu penyakit misalnya dipengaruhi oleh jenis kelamin, kondisi psikologi, denyut jantung, kadar serum hemoglobin, merokok atau tidak dan kebiasaan diet. Faktor-faktor tersebut dimungkinkan mempunyai pengaruh
yang kuat pada saat pasien bertahan hidup yang dipandang sebagai peubah penjelas. I.2 Permasalahan Untuk melakukan analisis data tersensor, dapat digunakan metode Life Table atau Kaplan-Meier. Kedua metode tersebut masih sesuai digunakan pada saat ingin membandingkan karakteristik dua populasi. Namun apabila yang ingin dibandingkan adalah lebih dari dua populasi, misalnya ingin melihat perbedaan karakteristik tingkat pendidikan, jenis pekerjaan dan lain-lain, maka metode Life Table atau Kaplan-Meier menjadi tidak praktis, sehingga diperlukan metode lain yang lebih tepat dan sesuai. I.3 Tujuan Berdasarkan masalah di atas penulisan ini bertujuan untuk memodelkan dan melakukan analisis data survival pada kasus pasien Multiple Myeloma dengan melihat peubah penjelas, menggunakan model hazard proporsional.
II. LANDASAN TEORI Definisi 1. Data Survival Data survival adalah data tentang pengamatan jangka waktu dari awal pengamatan sampai terjadinya suatu peristiwa (survival time). Peristiwa itu dapat berupa kegagalan, kematian, respon, timbulnya gejala dan lain-lain. ( Lee, 1992 ) Definisi 2. Waktu Awal Waktu awal yaitu waktu pada saat terjadinya kejadian awal, seperti waktu seseorang divonis menderita kanker, waktu pemberian perlakuan dan lain-lain. ( Lee, 1992 ) Definisi 3. Waktu Akhir Waktu akhir yaitu waktu pada saat terjadinya kejadian akhir seperti kematian, respon dari perlakuan dan lain-lain. ( Lee, 1992 ) Definisi 4. Data Tersensor dan Data Tidak Tersensor Data tersensor adalah data yang tidak bisa diamati secara utuh, karena adanya individu yang hilang ataupun dengan alasan lain,
sehingga tidak dapat diambil datanya atau sampai akhir pengamatan individu tersebut belum mengalami peristiwa (resiko). Jika berada dalam kondisi sebaliknya maka disebut data tidak tersensor. ( Lee, 1992 ) Definisi 5. Fungsi Survivor Misalkan T peubah acak dengan fungsi kepekatan peluang f (t ) . Fungsi sebaran untuk T yaitu t
F (t ) = P (T < t ) = ∫ f (u )du 0
Fungsi survivor adalah fungsi yang menyatakan peluang seseorang dapat bertahan hingga atau lebih dari waktu t ( mengalami kejadian sesudah waktu t ) yang didefinisikan sebagai berikut : S (t ) = P(T ≥ t ) . Teorema 1. Fungsi Survivor Fungsi survivor S (t ) dengan S (t ) = P (T ≥ t ) memiliki fungsi kepekatan peluang dari T , dS (t ) yaitu : f (t ) = − dt
2
Bukti : P(T ≥ t ) = 1 − P (T < t ) , = 1 − F (t ) dengan F (t ) = P (T < t ) karena S (t ) = P (T ≥ t ) , maka
maka h(t ) = −
ln S (t ) = − ∫ h(u )du 0
ln S (t ) = − H (t )
dS (t ) dF (t ) = 0− dt dt dS (t ) ⇔ = 0 − f (t ) dt dS (t ) ⇔ = − f (t ) dt dS (t ) ⇔ f (t ) = − dt ▪ Terbukti ( Collett, 1994 )
Definisi 6. Peluang Bersyarat Jika P ( B ) > 0 maka peluang bersyarat dari kejadian A setelah diketahui kejadian B P( A ∩ B) . ialah P ( A | B ) = P( B) ( Hogg and Craig, 1995 ) Definisi 7. Fungsi Hazard Fungsi hazard yaitu fungsi yang menyatakan peluang seseorang mengalami resiko atau suatu kejadian seperti kegagalan atau meninggal pada waktu t dengan syarat bahwa seseorang itu telah bertahan hingga waktu t, fungsinya diberikan: P (t ≤ T ≤ t +δ t | T ≥ t ) h(t ) = lim δt δ t →0 Dari definisi di atas diperoleh hubungan antara fungsi survivor dengan fungsi hazard.
definisi
peluang
P (t ≤ T < t + δ t ) P (t ≤ T ≤ t + δ t | T ≥ t ) = P (T ≥ t ) =
F (t + δ t ) − F (t )
S (t ) ⎛ F (t + δ t ) − F (t ) ⎞ 1 h (t ) = lim ⎜ ⎟ δ t →∞ δt ⎝ ⎠ S (t )
h (t ) =
f (t ) S (t )
Karena f (t ) = −
dS (t ) dt
dt t
S (t ) = 1 − F (t ) ⇔
Dengan menggunakan bersyarat, diperoleh:
d ( ln S (t ) )
S (t ) = exp ( − H (t ) )
( Collett, 1994 )
Definisi 8. Metode Parametrik Metode parametrik adalah metode analisis yang memiliki asumsi sebaran. Misalnya data yang diamati menyebar normal, menyebar binom dan lain-lain. ( Lee, 1992 ) Definisi 9. Metode Non-Parametrik Metode non-parametrik adalah metode analisis yang tidak berdasarkan asumsi sebaran tertentu. ( Lee, 1992 ) Definisi 10. Metode Maximum Likelihood Misalkan X 1 , X 2 , ..., X n masing-masing peubah acak yang saling bebas dari sebaran yang memiliki fungsi kepekatan peluang f ( x, θ ) dengan parameter θ dimana θ ∈ Ω , Ω adalah ruang parameter. Fungsi kepekatan peluang bersama dari X 1 , X 2 , ..., X n adalah
f ( x1 , θ ) f ( x2 , θ )... f ( xn , θ ) merupakan fungsi dari θ dinotasikan dengan L (θ ) yang kemudian disebut fungsi Likelihood dan dituliskan sebagai : L (θ , x1 , x2 ,..., xn ) = f ( x1 ; θ ) f ( x2 ; θ )... f ( xn ; θ ) dimana θ ∈ Ω . Andaikan dicari fungsi sederhana dari x1 , x2 , ..., xn yaitu u ( x1 , x2 , ..., xn ) sehingga θ = u ( x1 , x2 , ..., xn ) membuat fungsi Likelihood maksimum untuk semua θ ∈ Ω . Statistik U ( X 1 , X 2 ,..., X n ) disebut penduga kemungkinan maksimum dari θ dinotasikan dengan θ = U ( X 1 , X 2 , ..., X n ) . ( Hogg and Craig, 1995 ) Teorema 2. Deret Taylor Jika diberikan fungsi f, f ∈ ^ n +1[a, b ] , f kontinu dan terturunkan sampai turunan ke n + 1 . Misalkan x0 ∈ [a, b] untuk setiap x ∈ [a, b] terdapat c = c( x) yang terletak
antara x dan x0 maka
3
f ''(x 0 ) (x − x 0 )2 2! f ( n ) (x 0 ) f ( n +1) (x 0 ) (x − x 0 ) n + (x − x 0 ) n +1 +... + (n + 1)! n!
f (x ) = f (x 0 ) + f '(x 0 )( x − x 0 ) +
( Stewart, 2003) Definisi 11. Ragam Ragam dari peubah acak X adalah nilai harapan dari kuadrat selisih antara X dengannilai harapannya, dinotasikan dengan σ X2 . Secara matematis dapat dinyatakan
sebagai σ X2 = var( X ) = E ⎡⎣(X − E [X ]) 2 ⎤⎦ . Cara lain menetukan ragam, yaitu σ X2 = E ⎡⎣ (X − E [X ]) 2 ⎤⎦ = E ⎡⎣ X 2 − 2X E [ X ] + ( E [X ]) 2 ⎤⎦ Karena E adalah operator linier maka 2 σ X2 = E ⎡⎣ X 2 ⎤⎦ − 2E [ X ] E [ X ] + ( E [X ]) = E ⎡⎣ X 2 ⎤⎦ − 2 ( E [ X ]) + ( E [X ]) 2
2
= E ⎡⎣ X 2 ⎤⎦ − ( E [ X ]) Akar kuadrat dari σ X2 yaitu σ X disebut simpangan baku dari X . ( Hogg and Craig, 1995 ) 2
Sifat Ragam Bila X suatu peubah acak dan a konstanta, maka: σ aX2 = a 2σ X2 = a 2σ 2 . (Walpole,1992) Ragam bagi Penduga Parameter Ragam bagi penduga parameter θ yang Likelihood memaksimumkan fungsi didefinisikan sebagai berikut −1
⎛ ⎛ d ln L (θ ) ⎞ ⎞ var(θˆ) = ⎜ − E ⎜ ⎟ ⎟⎟ 2 ⎜ ⎝ dθ ⎠⎠ ⎝ Ketika nilai harapan dari turunan persamaan sulit diperoleh, selanjutnya ragam dari θˆ diperoleh dari pendekatan 2
−1
⎛ d 2 ln L(θ ) ⎞ var(θˆ) ≈ − ⎜ ⎟ 2 ⎝ dθ ⎠ ˆ Dan standar error θ merupakan akar dari ragam θˆ yaitu s.e.(θˆ) = var(θˆ)
( Collett, 1994)
Definisi 12. Uji Hipotesis Uji hipotesis adalah suatu aturan yang digunakan untuk menerima atau menolak
suatu hipotesis dari hasil amatan yang diperoleh. Hipotesis mengenai populasi yang akan diterima kebenarannya sampai ada bukti untuk menolaknya dinamakan hipotesis nol ( H 0 ). Apabila hipotesis ini ditolak kebenarannya maka ada hipotesis lain yang kita anggap benar, yaitu hipotesis tandingan ( H1 ) . Dalam perumusan hipotesis dikenal dua macam hipotesis yaitu a. Hipotesis satu arah 1. H 0 : μ ≤ μ0 2. H 0 : μ ≥ μ0 . H 1 : μ > μ0 H 1 : μ < μ0 b. Hipotesis dua arah H 0 : μ = μ0 H1 : μ ≠ μ0
( Hogg and Craig, 1995)
Definisi 13. Selang Kepercayaan Selang kepercayaan adalah selang yang dapat dipercaya pada tingkat kepercayaan tertentu. Contoh μ , σ diketahui: Bila X adalah nilai tengah contoh acak berukuran n, yang diambil dari suatu populasi dengan ragam diketahui, maka selang kepercayaan (1 − α )100% bagi μ adalah X − Zα / 2
σ
< μ < X + Zα / 2
σ
n n Besaran Zα / 2 adalah nilai yang luas daerah disebelah kanan di bawah kurva normal baku
adalah
α 2
.
( Wallpole, 1992 )
Definisi 14. Statistik Uji Wald Uji Wald digunakan untuk menguji parameter β . Berdasarkan hipotesis H 0 : βi = 0 H1 : β i ≠ 0
dengan statistik uji-nya adalah: βˆi Wi = s.e.( βˆi ) dimana: βˆ = penduga β i
i
s.e.( βˆi ) = standar error βˆi i = 1, 2,..., p Statistik uji Wald akan megikuti sebaran normal baku Ζ . Kaidah pengambilan keputusan yaitu tolak hipotesis nol jika nilai
4
Z ( Z hit ) memenuhi Z hit > Zα / 2 untuk taraf
nyata uji α . (Collett, 1994)
Definisi 15. Statistik −2 ln L Statistik −2 ln L digunakan untuk menguji peranan peubah secara bersamasama. Bila model memiliki p peubah penjelas,maka model reduksi akan memiliki q < p peubah bebas. Pengurangan ini berdasarkan hasil uji Wald untuk setiap peubah yang tidak nyata. Statistik uji-nya yaitu: ⎛L ⎞ −2 ln L = −2 ln ⎜ 0 ⎟ ⎝ L1 ⎠ dimana:
L0 = nilai likelihood peubah penjelas tereduksi L1 = nilai likelihood dengan semua peubah penjelas Berdasarkan hipotesis: H 0 : β p +1 = β p + 2 = ... = β p + q = 0
H1 : minimal ada satu nilai βi ≠ 0, i = 1, 2,..., p, p + 1,..., p + q Statistik −2 ln L akan mengikuti sebaran Chi-Square dengan derajat bebas p − q . Kaidah keputusan yang diambil adalah jika −2 ln L > χ p − q (α ) , maka hipotesis nol ditolak.
(Collett, 1994)
III. MODEL III. 1 Contoh Data Survival Data yang termasuk dalam data survival memenuhi empat kriteria, yaitu: 1. Waktu kejadian, t j . 2. Banyaknya objek yang diamati, n j . 3. Banyaknya objek yang meninggal, d j . 4. Banyaknya objek yang tersensor, c j . Jika
∑c
dilakukan ∑ cj ≠ 0
j
= 0 maka pengamatan tersebut secara utuh, sebaliknya jika disebut dengan data survival
tersensor. Tabel 1. Contoh Data Tidak Tersensor j Waktu dj nj Sˆ (t ) 0 1 2 3 4
11 13 14 15 17
Dimana Sˆ j = Sˆ (t j ) =
11 10 5 3 1 nj
1 5 2 2 1
n0
1.000 0.909 0.455 0.2732 0.091 (3.1.1)
dengan n0 = banyaknya individu dalam satu himpunan data Sˆ = Sˆ (t ) = penduga fungsi survivor j
nj
j
= banyaknya individu dengan waktu kelangsungan hidup ≥ t
Tabel 2. Contoh Data Tersensor Periode dj cj nj Waktu 0-12 16 4 48 12-24 10 4 28 24-36 1 0 14 36-48 3 1 13 48-60 2 2 9 60-… 4 1 5 Dalam mengamati suatu data yang dibutuhkan adalah populasi atau contoh yang akan dijadikan objek. ( Sanella , 2006 ) III. 2 Model Hazard Proporsional untuk Dua Populasi Misalkan tersedia data survival untuk individu suatu populasi, maka dapat dihitung fungsi hazard untuk individu dalam populasi f (t ) tersebut yaitu h1 (t ) = 1 . S1 (t ) Apabila ada populasi lain dengan fungsi hazard h2 (t ) , dan h2 (t ) dapat dinyatakan
proporsional
terhadap
h1 (t ) ,
maka
h2 (t ) = ψ .h1 (t ) , dengan ψ merupakan konstan ψ > 0 . Karena ψ > 0 maka dapat dilakukan transformasi dengan menggunakan ψ = exp( β ) , fungsi eksponen, yaitu ⎧> 1 , β > 0 ⎪ −∞ < β < ∞ , ψ ⎨= 1 , β = 0 ⎪< 1 , β < 0 ⎩
.
5
hi (t ) = exp( β1x 1i + β 2 x 2i + ... + β j x ji )h0 (t )
Misal X adalah peubah indikator dengan
⎧1, jika individu mendapat perlakuan baru X =⎨ ⎩0, jika individu mendapat perlakuan standar Jika xi adalah nilai dari X untuk individu ke- i , i = 1, 2, ..., n maka fungsi hazard untuk individu itu dapat ditulis βx (3.2.1) hi (t ) = e i h0 (t ) Persamaan (3.2.1) adalah model hazard proporsional untuk membandingkan dua populasi. III. 3 Bentuk Umum Model Hazard Proporsional Model hazard proporsional pada persamaan (3.2.1) dapat dibuat lebih umum yaitu resiko kematian individu ke-i bergantung pada nilai x1i , x2 i ,..., x pi dari p
peubah penjelas
X 1 , X 2 ,..., X p . Himpunan
nilai peubah penjelas pada model hazard proporsional direpresentasikan oleh vektor x i , sehingga xi = (x1 , x 2 ,..., x p ) . Misalkan h0 (t ) adalah fungsi hazard dari individu yang nilai peubah penjelasnya membuat vektor x i sama dengan nol, h0 (t ) disebut baseline fungsi hazard . Maka hazard untuk individu ke-i dapat ditulis sebagai berikut hi (t ) = ψ ( xi ) ho (t ) dengan , ψ ( xi ) adalah nilai fungsi dari vektor peubah penjelas untuk individu ke-i. ψ ( xi ) dapat diartikan sebagai hazard pada waktu t untuk individu yang vektor peubah penjelasnya adalah x i , yang relatif terhadap hazard individu yang peubah penjelasnya x = 0 . ψ ( xi ) tidak mungkin negatif maka dapat ditulis ψ ( xi ) = exp(ηi ) dimana ηi adalah kombinasi linier p peubah penjelas pada xi ,yaitu ηi = β1 x1i + β 2 x2i + ... + β p x pi p
= ∑ β j x ji j =1
dengan β i = koefisien dari peubah penjelas x1 , x2 , ... x p . Maka bentuk umum hazard
proporsional menjadi
⎛ p ⎞ = exp ⎜ ∑ β j x ji ⎟ h0 (t ) ⎜ j =1 ⎟ ⎝ ⎠ p ⎛ ⎞ h (t ) ⇔ i = exp ⎜ ∑ β j x ji ⎟ ⎜ j =1 ⎟ h0 (t ) ⎝ ⎠
(3.3.1)
⎛ h (t ) ⎞ ⇔ log ⎜ i ⎟ = β1x 1i + β 2 x 2i + ... + β j x ji ⎝ h0 (t ) ⎠ (3.3.2)
Persamaan (3.3.2) di atas menunjukkan bahwa model hazard proporsional juga dapat dilihat sebagai model linier logaritma dari rasio hazard. III. 4 Fitting Model Hazard Proporsional Fitting model hazard proporsional (persamaan 3.3.1) dalam pengamatan survival data memerlukan pendugaan koefisien yang belum diketahui dari peubah penjelas X 1 , X 2 ,..., X P pada komponen linier β , β 2 ..., β , j = 1, 2,..., p . Ada dua komponen 1
p
dari model yaitu β j dan ho (t ) yang akan diduga secara terpisah.
β j akan diduga
terlebih dahulu yang kemudian akan dipergunakan untuk mengkonstruksi pendugaan baseline fungsi hazard ho (t ) . Penduga β j
Parameter
βj
pada
model
hazard
proporsional merupakan parameter yang belum diketahui dan akan diduga dengan menggunakan metode maximum likelihood. Fungsi likelihood adalah peluang bersama dari data pengamatan yang dianggap sebagai fungsi dari parameter yang tidak diketahui dalam asumsi model. Pendugaan β j dengan metode maximum likelihood adalah nilai ketika fungsi likelihood maximum. Misal data disediakan untuk n individu yang terdiri dari r waktu kematian yang tidak tersensor dan n-r individu tersensor kanan, diurutkan menjadi t1 < t2 < ... < tr . Diasumsikan hanya ada satu orang yang meninggal pada tiap waktu kematian, jadi tidak ada data yang saling terkait. Hal lain yang perlu dipertimbangkan adalah peluang kematian individu ke-i yang meninggal pada waktu kematian t j , dengan syarat t j menjadi satu-satunya waktu pengamatan dari r waktu
6
kematian t1 , t 2 ,..., t r , sehingga dinotasikan menjadi P ( A | B ) . Misalkan kejadian A adalah individu dengan nilai peubah penjelas x ji meninggal pada saat t j dan kejadian B adalah kematian tunggal pada saat t j , maka P ( A ∩ B ) = P ( A ) sehingga P ( A | B) = =
P ( A ∩ B) P ( B)
(3.4.1) Pembilang pada ekspresi di atas adalah bentuk sederhana dari resiko kematian pada waktu t j untuk individu yang nilai peubah Jika pembilang itu adalah
individu ke-i yang meninggal pada saat t j , fungsi hazard ini dapat ditulis menjadi hi (t j ) . Penyebutnya adalah jumlah dari resiko kematian pada waktu t j (dinotasikan hl (t j ) ) untuk semua individu yang mempunyai resiko kematian pada waktu t j . Ini adalah penjumlahan nilai hl (t j ) didalam himpunan resiko t j ,
( R (t ) ) .
Dengan
j
R (t j ) adalah
himpunan resiko pada waktu t j yang terdiri dari individu-individu yang bertahan hidup hingga t j . Sehingga peluang dalam ekspresi (3.4.1) menjadi
hi (t j )
∑
l ∈R (t j )
hl (t j )
P( A | B) =
∑
l∈R ( t j
=
∑
l ∈R ( t j
(3.3.1),
ji
∑
⎛ exp ⎜ ⎜ ⎝
j =1
∑
⎞ ⎟⎟ ⎠
∑
adalah
indikator
sensor
yaitu
maka persamaan (3.6) dapat ditulis δi
⎡ ⎛ p ⎞ ⎤ ⎢ exp ⎜ ∑ β j x ji ⎟ ⎥ ⎜ ⎟ ⎥ r ⎢ ⎝ j =1 ⎠ L( β ) = ∏ ⎢ ⎥ ⎛ p ⎞ j =1 ⎢ exp ⎜ ∑ β j x jl ⎟ ⎥ ∑ ⎢ l ∈R ( t ) ⎜ j =1 ⎟⎥ ⎝ ⎠⎦ ⎣ Jika persamaan di atas di ln-kan maka diperoleh j
δ ⎛ ⎡ p ⎤ ⎞ ⎜ ⎢ exp ⎛⎜ β x ⎞⎟ ⎥ ⎟ ⎜ j =1 j ji ⎟ ⎥ ⎟ n ⎜ ⎢ ⎝ ⎠ ln L( β ) = ⎜ ln ⎢ ⎥ ⎟ p ⎛ ⎞⎥ ⎟ i =1 ⎜ ⎢ exp ⎜ β j x jl ⎟ ⎟ ⎜ ⎢ ⎜ j =1 ⎟⎥ ⎟ ⎜ ⎣ l ∈R ( t ) ⎝ ⎠⎦ ⎠ ⎝ ⎡ ⎛ p ⎞ ⎤ ⎢ exp ⎜ β j x ji ⎟ ⎥ ⎜ j =1 ⎟ ⎥ n ⎢ ⎝ ⎠ = δ i ln ⎢ ⎥ p ⎛ ⎞ i =1 ⎢ exp ⎜ β j x jl ⎟ ⎥ ⎢ l ∈R ( t ) ⎜ j =1 ⎟⎥ ⎝ ⎠⎦ ⎣ n ⎡ p ⎛ ⎛ p ⎞ ⎞⎤ exp ⎜ β j x jl ⎟ ⎟ ⎥ = δ i ⎢ β j x ji − ln ⎜ ⎜ ⎟⎟ ⎜ ⎢ j =1 i =1 ⎝ j =1 ⎠ ⎠ ⎥⎦ ⎝ l ∈R ( t ) ⎣ i
∑
∑
∑
∑
j
∑
∑
∑
∑
j
∑ ∑
∑
∑
j
β j dapat diperoleh dengan
Penduga
⎞ ⎟⎟ h0 (t ) j =1 ⎠ ⎛ p ⎞ exp ⎜ β j x jl ⎟h0 (t ) ⎜ ⎟ ) ⎝ j =1 ⎠ j
ji
(3.4.3)
p
∑β x
j
(3.4.2) ⎛ p ⎞ exp ⎜ β j x jl ⎟ ⎜ j =1 ⎟ l ∈R ( t j ) ⎝ ⎠ Misal data terdiri dari n pengamatan survival time, dinotasikan t1 , t 2 ,..., t n .
,
dengan menggunakan persamaan maka baseline fungsi hazard adalah ⎛ exp ⎜ ⎜ ⎝
∑β x
⎧0 , jika individu ke-i mengalami sensor kanan ⎩1 , selainnya
P[kematian tunggal pada saatt j ]
.
∏
p
δi = ⎨
P[individu dengan nilai peubah penjelasx ji meninggal pada saatt j ]
penjelasnya x ji
r
j =1
δi
P( A) P( B)
=
L( β ) =
⎛ exp ⎜ ⎜ ⎝
⎞ β j x ji ⎟ ⎟ j =1 ⎠ ⎛ p ⎞ exp ⎜ β j x jl ⎟ ⎜ ⎟ ) ⎝ j =1 ⎠ p
∑
∑
, sehingga dengan mengambil hasil peluang bersyarat di atas, memberikan fungsi likelihood
memaximumkan fungsi ln-likelihood yaitu dengan mencari solusi dari d ln L ( β j ) =0 d βj Turunan pertama ln L ( β j )
terhadap
( )
dinotasikan u β j , sehingga u (β j ) =
d ln L ( β j ) d βj
,
Jadi βˆ j dapat diperoleh dari persamaan u ( βˆ j ) = 0 d ln L( βˆ j ) =0 d βˆ j
βj ,
7
⎛ n ∂ ⎜ ∑ δi ⎜ i =1 ⇔ ⎝
⎡ p ⎛ ⎛ p ⎢ ∑ β j x ji − ln ⎜ ∑ exp ⎜ ∑ β j x jl ⎜ j =1 ⎜ ⎢ j =1 ⎝ ⎝ l ∈R (t ) ⎣ ˆ ∂β j j
⎞ ⎞⎤ ⎞ ⎟⎟ ⎟ ⎥ ⎟ ⎟ ⎠ ⎠ ⎥⎦ ⎟⎠ =0
⎡ ⎛ p ⎞ p exp ⎜ ∑ β j x jl ⎟∑ x jl ⎢ ∑ ⎜ ⎟ j =1 p ⎢ l ∈R (t ) ⎝ j =1 ⎠ ⇔ ∑ δ i ⎢∑ x ji − ⎛ p ⎞ i =1 ⎢ j =1 exp ⎜ ∑ β j x jl ⎟ ∑ ⎢ ⎜ ⎟ l ∈R (t ) ⎝ j =1 ⎠ ⎣ n
j
j
⎤ ⎥ ⎥ ⎥=0 ⎥ ⎥ ⎦
Standar Error dan Selang Kepercayaan βˆ j Ragam
βˆ j
dari
dapat
didefinisikan
sebagai berikut
( )
var βˆ j
⎛ 2 ⎜ ∂ ln L β j ≈ −⎜ 2 ⎜ ∂β j ⎝
( ) ⎞⎟
−1
⎟ ⎟ ⎠
Penduga parameter β j di atas sulit dicari
secara analitis tapi lebih mudah diselesaikan secara numerik, namun dalam karya ilmiah ini hal tersebut tidak dibahas lebih mendalam.
2 2 ⎛ ⎡ ⎛ ⎞ ⎤ ⎞⎟ ⎛ p ⎞ p ⎛ p ⎞⎛ p ⎞ ⎜ ⎢ ⎜ exp ⎜ β j x jl ⎟ x jl ⎟ ⎥ exp ⎜ β j x jl ⎟ ⎜ x jl ⎟ ⎜ n ⎜ j =1 ⎟ j =1 ⎟ ⎥ ⎟ ⎜ j =1 ⎟ ⎜ j =1 ⎟ ⎜ l∈R (t ) ⎢ l∈R (t ) j ⎝ ⎠ j ⎝ ⎠⎝ ⎠ +⎝ ⎠ ⎥⎟ var( βˆ j ) ≈ − ⎜ δ i ⎢ − 2 ⎜ i =1 ⎢ ⎥⎟ ⎛ p ⎞ p ⎛ ⎛ ⎞⎞ ⎜ exp ⎜ β j x jl ⎟ ⎢ ⎥⎟ ⎜ exp ⎜ β j x jl ⎟ ⎟ ⎜ ⎟ ⎜ j =1 ⎟⎟ ⎜ ⎜ l ∈R ( t ) l∈R ( t j ) ⎢ ⎥⎟ ⎝ j =1 ⎠ j ⎝ ⎠⎠ ⎝ ⎣ ⎦⎠ ⎝
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
2 2 ⎛ ⎡ ⎛ ⎞ ⎤ ⎞⎟ ⎛ p ⎞ p ⎛ p ⎞⎛ p ⎞ ⎜ ⎢ ⎜ ⎟ exp ⎜ β j x jl ⎟ x jl ⎥ exp ⎜ β j x jl ⎟ ⎜ x jl ⎟ ⎜ n ⎢ ⎜ j =1 ⎟ j =1 ⎟ ⎥ ⎟ ⎜ j =1 ⎟ ⎜ j =1 ⎟ ⎜ l∈R (t ) l ∈R ( t j ) ⎝ ⎠ j ⎝ ⎠⎝ ⎠ −⎝ ⎠ ⎥⎟ ≈ ⎜ δi ⎢ 2 p ⎜ i =1 ⎢ ⎥⎟ ⎛ ⎞ p ⎛ ⎞ ⎛ ⎞ ⎜ exp ⎜ β j x jl ⎟ ⎢ ⎥⎟ ⎜ ⎟ exp x β ⎜⎜ ⎜ j =1 ⎟ j jl ⎟ ⎟ ⎜ ⎜ l∈R (t ) ⎟ l ∈R ( t j ) ⎢ ⎥⎟ ⎝ ⎠ j ⎝ j =1 ⎠⎠ ⎝ ⎦⎠ ⎣ ⎝
∑
∑
∑
∑
∑
∑
∑
∑
∑
−1
−1
∑
∑
(3.4.4)
Standar error dari βˆ j adalah akar dari ragam βˆ j , yaitu
s .e .( βˆ j ) = var( βˆ j ) ⎛ ⎜ ⎜ n = ⎜ δi ⎜ i =1 ⎜ ⎜ ⎝
∑
⎡ ⎛ p ⎞⎛ p ⎢ exp ⎜ β j x jl ⎟ ⎜ x jl ⎜ j =1 ⎟ ⎜ j =1 ⎢ l ∈R (t ) ⎝ ⎠⎝ ⎢ ⎢ ⎛ p ⎞ exp ⎜ β j x jl ⎟ ⎢ ⎜ ⎟ l ∈R (t ) ⎢ ⎝ j =1 ⎠ ⎣
∑
∑
∑
j
∑
∑
j
⎛ ⎛ p ⎞ p ⎞ ⎜ exp ⎜ β j x jl ⎟ x jl ⎟⎟ ⎜ j =1 ⎟ j =1 ⎜ ⎝ ⎠ ⎠ − ⎝ l ∈R (t ) 2 p ⎛ ⎛ ⎞⎞ ⎜ exp ⎜ β j x jl ⎟ ⎟ ⎜ ⎟⎟ ⎜ ⎝ j =1 ⎠⎠ ⎝ l ∈R (t ) 2
∑
j
j
yaitu (1 − α )100% selang kepercayaan untuk
(
).
∑
∑
j
Standar error di atas dapat digunakan untuk mencari selang kepercayaan untuk βˆ ,
βˆ j adalah βˆ j ± Zα / 2 . s.e. βˆ j
∑
∑
⎞ ⎟ ⎟ ⎠
2
⎤⎞ ⎥⎟ ⎥⎟ ⎥⎟ ⎥⎟ ⎥⎟ ⎥⎟ ⎦⎠
−1
(3.4.5)
III. 5 . Fungsi Survivor Model Hazard Proporsional Fungsi hazard kumulatif untuk individu ke- i adalah diperoleh dengan cara mengintegralkan kedua sisi pada persamaan (3.3.1)
8
⎛ p ⎞t hi (u )du = exp ⎜ β j x ji ⎟ h0 (u )du (3.5.1) ⎜ j =1 ⎟ 0 ⎝ ⎠0 sehingga fungsi hazard kumulatif untuk individu ke- i adalah ⎛ p ⎞ H i (t ) = exp ⎜ β j x ji ⎟ H 0 (t ) (3.5.2) ⎜ j =1 ⎟ ⎝ ⎠ Dengan mengalikan tiap sisi dari persamaan (3.5.2) dengan −1 dan mengeksponenkannya, serta menggunakan persamaan S (t ) = exp {− H (t )} , akan diperoleh fungsi survivor untuk individu ke- i yaitu ⎛ p ⎞ − H i (t ) = − exp ⎜ β j x ji ⎟ H 0 (t ) ⎜ j =1 ⎟ ⎝ ⎠ t
∑
∫
∫
∑
∑
⎛ p ⎞ − H i (t ) = −H 0 (t ) exp ⎜ β j x ji ⎟ ⎜ j =1 ⎟ ⎝ ⎠ ⎡ ⎛ p exp ( − H i (t ) ) = exp ⎢ − H 0 (t ) exp ⎜ ∑ β j x ji ⎜ j =1 ⎢⎣ ⎝
∑
exp ( − H i (t ) ) = ⎡⎣exp ( −H 0 (t ) ) ⎤⎦ S i (t ) = ⎣⎡S 0 (t ) ⎦⎤
∑
l ∈D (t j )
1− ξ
⎞ ⎟⎟ ⎠= ⎞
⎛ p exp ⎜ βˆ j x jl ⎟ ⎜ j =1 ⎟ ⎝ ⎠
∑
∑
l ∈R (t j
⎛ p exp ⎜ ∑ βˆ j x jl ⎜ j =1 ) ⎝
untuk j = 1, 2,..., r D(t j ) = kumpulan semua
⎞ ⎟⎟ ⎠
(3.6.3) dj
kematian
individu pada waktu t j . R(t j ) = kumpulan semua individu yang
mempunyai resiko kematian ( n j ) pada waktu tj Pada kasus tidak adanya keterkaitan waktu kematian, yaitu dimana d j = 1 , untuk j = 1, 2,..., r , maka sisi kiri
(3.5.3)
dan
fungsi
hazard h0 (t ) . Penduga baseline fungsi hazard telah diturunkan oleh (Kalbfleisch dan Prentice, 1973) menggunakan pendekatan metode maximum likelihood. Misal ada r waktu kematian yang diurutkan meningkat yaitu t1 < t2 < ... < tr , dan ada d j kematian, serta n j individu yang mempunyai resiko kematian
pada waktu t j . Penduga baseline fungsi hazard pada waktu t j yaitu
⎛ exp ⎜ ∑ βˆ j x jl ⎜ j =1 ⎝
⎟ ∑ ⎟ ⎛ ⎠ ⎛ ⎞ ⎞ ˆ exp ⎜ ∑ β j x jl ⎟ ⎟ ⎜ ⎜ ⎝ j =1 ⎠ ⎟ ξˆj = ⎜ 1 − ⎛ p ˆ ⎞⎟ ⎜ exp ⎜ ∑ β j x jl ⎟ ⎟ ∑ ⎜ l ∈R (t ) ⎟ ⎝ j =1 ⎠⎠ j ⎝ dimana x ji adalah nilai peubah penjelas ke-j
peubah ini adalah βˆ1 , βˆ2 ,..., βˆP . Penduga fungsi hazard untuk individu ke- i adalah ⎛ p ⎞ hˆi (t ) = exp ⎜ ∑ βˆ j x ji ⎟ hˆ0 (t ) (3.6.1) ⎜ j =1 ⎟ ⎝ ⎠ dimana x ji adalah nilai peubah penjelas ke-j
baseline
adalah solusi dari persamaan
p
⎛ p βˆ x exp ⎜ ⎜ j =1 j jl ⎝
p
X 1 , X 2 , ..., X p dan koefisien penduga dari
i = 1, 2,..., n ,
(3.6.2)
persamaan (3.6.3) akan mempunyai bentuk tunggal, sehingga persamaan tersebut dapat diselesaikan untuk mendapatkan
III. 6 Penduga Fungsi Hazard dan Fungsi Survivor Misal komponen linier dari model hazard proporsional terdiri dari p peubah penjelas
untuk individu ke- i , hˆ0 (t ) adalah penduga
dimana ξˆ j
⎞⎤ ⎟⎟ ⎥ ⎠ ⎥⎦
⎛ p ⎞ exp⎜ ∑ β j x ji ⎟ ⎜ ⎟ ⎝ j =1 ⎠
⎛ p ⎞ exp⎜ ∑ β j x ji ⎟ ⎜ ⎟ ⎝ j =1 ⎠
hˆ0 (t j ) = 1 − ξˆ j
⎞
untuk individu ke- i . Diasumsikan bahwa resiko kematian adalah konstan untuk waktu kematian yang berdekatan. Lalu, ξˆ dapat dianggap sebagai j
penduga dari peluang individu yang bertahan hidup dari t j sampai t( j +1) . Maka penduga baseline fungsi survivor yaitu k
Sˆ0 (t ) = ∏ ξˆj
(3.6.4)
j =1
untuk tk ≤ t < t( k +1) , k = 1, 2,..., r − 1 , nilai penduga baseline fungsi survivor sama dengan nol untuk t ≥ tr . Kumulatif baseline fungsi hazard yaitu H 0 (t ) = − ln S 0 (t ) , maka penduganya adalah k
Hˆ 0 (t ) = − ln Sˆ0 (t ) = −∑ ln ξˆj
(3.6.5)
j =1
untuk tk ≤ t < t( k +1) , k = 1, 2,..., r − 1 Penduga baseline fungsi hazard, fungsi survivor, dan kumulatif fungsi hazard pada persamaan (3..6.2), (3.6.4), dan (3.6.5) dapat digunakan untuk mencari hubungan penduga untuk individu dengan nilai peubah penjelas
9
x ji . Dengan mengintegralkan kedua sisi dari persamaan (3.6.1) , akan diperoleh t t p ˆ (u )du = exp ⎛⎜ βˆ x ⎞⎟ hˆ (u )du (3.6.6) h i j ji ∑ ∫0 ⎜ j =1 ⎟∫ 0 ⎝ ⎠0 Sehingga penduga fungsi hazard kumulatif untuk individu ke- i adalah ⎛ p ⎞ (3.6.7) Hˆ i (t ) = exp ⎜ ∑ βˆ j x ji ⎟ Hˆ 0 (t ) ⎜ j =1 ⎟ ⎝ ⎠ dengan mengalikan tiap sisi dari persamaan (3.6.7) dengan −1 dan mengeksponenkannya, serta menggunakan persamaan Sˆ (t ) = exp −Hˆ (t ) , akan diperoleh penduga
(
)
fungsi survivor untuk individu ke- i yaitu ⎛ − Hˆ i (t ) = − exp ⎜ ⎜ ⎝
p
∑ βˆ x j
ji
j =1
⎛ − Hˆ i (t ) = − Hˆ 0 (t ) exp ⎜ ⎜ ⎝
⎞ ⎟⎟ Hˆ 0 (t ) ⎠
(
(
)
(
)
exp −Hˆ i (t ) = ⎡⎢exp − Hˆ 0 (t ) ⎤⎥ ⎣ ⎦ Sˆi (t ) = ⎡Sˆ0 (t ) ⎤ ⎣ ⎦
p
∑ βˆ x j
j =1
ji
⎞⎤ ⎟⎟ ⎥ ⎠ ⎦⎥
⎛ p ⎞ exp⎜ ∑ βˆ j x ji ⎟ ⎜ ⎟ ⎝ j =1 ⎠
⎛ p ⎞ exp⎜ ∑ βˆ j x ji ⎟ ⎜ ⎟ ⎝ j =1 ⎠
(3.6.8)
var ( x − x0 ) 2!
+ ...
⎛ dg (x ) ⎞ var ( g (x ) ) ≈ ⎜ ⎟ var(x ) ⎝ dx ⎠ (3.8.1) Standar error dari ψˆ dapat diperoleh dari standar error βˆ j dengan menggunakan persamaan (3.21), dari hasil tersebut diperoleh pendekatan ragam untuk ψˆ dalam βˆ j , yaitu
(
)
2
var (ψˆ ) ≈ exp( βˆ j ) var( βˆ j )
III. 7 Algoritma Penentuan Rasio Hazard 1. Misalkan ada p populasi, yaitu populasi 1, 2,..., p . 2. Fungsi hazard untuk populasi ke-i yaitu βx hi (t ) = e i h0 (t ) , i = 1, 2,..., p . 3. Fungsi hazard untuk populasi ke-i+1 βx yaitu hi+1 (t ) = e h0 (t ) , i = 1, 2,..., p . i +1
4. Maka rasio hazard populasi ke- i + 1 terhadap populasi ke-i yaitu βx h (t ) e h0 (t ) ψ = i+1 = βx = eβ ( x − x ) hi (t ) e h0 (t ) i +1
i +1
2
2
untuk t( k ) ≤ t < t( k +1) , k = 1, 2,..., r − 1 .
i
∑
2
∑
)
k⎤ ⎡ n g k ( x0 ) var ( g ( x) ) = var ⎢ ( x − x0 ) ⎥ ⎣ k=0 k ! ⎦ ⎡ ( x − x0 ) + ...⎤ ≈ var ⎢ g ( x0 ) + g '( x0 ) ( x − x0 ) + g ''( x0 ) ⎥ 2! ⎣⎢ ⎦⎥
≈ 0 + ⎣⎡ g '( x0 )⎦⎤ var ( x − x0 ) + ⎣⎡ g ''( x0 )⎦⎤
⎞ βˆ j x ji ⎟ ⎟ j =1 ⎠ p
⎡ ⎛ exp −Hˆ i (t ) = exp ⎢ −Hˆ 0 (t ) exp ⎜ ⎜ ⎝ ⎣⎢
III. 8 Standar Error dan Selang Kepercayaan untuk Rasio Hazard Parameter β adalah logaritma dari rasio resiko kematian pada waktu t untuk individu pada populasi satu yang relatif terhadap populasi yang berbeda. Rasio hazard itu sendiri adalah ψ = exp( β ) dan hubungan penduga rasio hazard dengan rasio hazard adalah ψˆ = exp( βˆ ) . Dengan menggunakan sifat ragam dan pendekatan deret Taylor, maka ragam dari suatu fungsi g ( x) dengan x adalah peubah acak, diberikan
i
≈ (ψˆ ) 2 var( βˆ j )
(3.8.2)
sehingga standar error untuk ψˆ dapat didefinisikan sebagai berikut (3.8.3) s.e.(ψˆ ) = ψˆ s.e.( βˆ j )
(1 − α )100% rasio hazard adalah ψˆ ± Z α / 2 (s .e .(ψˆ ))
selang kepercayaan untuk (3.8.4)
9
IV. CONTOH KASUS Multiple myeloma adalah penyakit yang berbahaya yang ditandai dengan penimbunan plasma sel yang tidak normal dan sel darah putih dalam sumsum tulang. Perkembangbiakan plasma sel yang tidak normal dalam tulang menyebabkan rasa sakit dan merusak jaringan tulang. Pasien yang mengidap multiple myeloma selalu mengalami kekurangan darah sehingga menyebabkan kambuhnya infeksi dan lemah. Salah satu universitas di USA telah memeriksa hubungan antara peubah penjelas yang mempengaruhi dan waktu ketahanan (survival times dalam satuan bulan) dari pasien. Dalam pengamatan peubah respon utama adalah waktu dari diagnosa waktu awal sampai pasien meninggal. Pada data lampiran 9 terdapat 48 pasien multiple myeloma, 48 pasien tersebut berusia antara 50 sampai dengan 80 tahun. Beberapa dari mereka belum meninggal pada saat pengamatan berakhir, pasien tersebut termasuk jenis sensor kanan. Untuk pasien dengan status meninggal pada saat pengamatan dengan survival times tertentu ditandai dengan angka 1, sedangkan 0 menjelaskan bahwa pasien mengalami sensor kanan.
Pada waktu diagnosis nilai dari peubahpeubah yang mempengaruhi tingkat survival pasien kemudian dicatat, meliputi : a. Usia pasien (tahun) b. Jenis kelamin pasien (0=pria, 1=wanita) c. Kandungan nitrogen dalam darah d. Kandungan kalsium dalam darah e. Kandungan hemoglobin dalam darah f. Persentase sel plasma g. Kandungan protein Bence-Jones dalam urine (0=tidak ada, 1=ada) Diantara 48 pasien tersebut ada 60,4% pasien laki-laki, sisanya wanita dan 31,25% pasien yang mengandung protein Bence-Jones pada urine sisanya tidak mengandung protein Bence-Jones. Banyaknya pasien yang meninggal pada tiap waktu kematian dan banyaknya pasien yang beresiko meninggal pada tiap waktu kematian tersebut akan dihitung. Diberikan data 48 pasien Multiple Myeloma (lihat lampiran 9). Semua hasil analisis data 48 pasien Multiple Myeloma menggunakan SAS 9.1 for Windows (Statistics Aplication Software) menggunakan model hazard proporsional.
Dilakukan analisis survival dengan peubah-peubah penjelas untuk melihat pengaruh peubah penjelas terhadap tingkat bertahan hidup pasien : a. Fungsi hazard untuk tiap peubah tunggal adalah h(t ) = exp( β X ) h0 (t )
b. Fungsi hazard untuk peubah gabungan adalah hi (t ) = exp( β1 X 1i + β 2 X 2 i + β 3 X 3 i + β 4 X 4 i + β 5 X 5 i + β 6 X 6 i + β 7 X 7 i ) h0 (t ) X 1 = usia, X 2 = jenis kelamin, X 3 = nitrogen, X 4 = kalsium
X 5 = hemoglobin, X 6 = % plasma, X 7 = protein Bence-Jones
Tabel 3. Hasil Analisis Survival Model Hazard Proporsional
Peubah penjelas Usia Jenis kelamin Nitrogen Kalsium Hemoglobin % Plasma Protein
βˆ 0.00973 0.06583 0.01868 -0.08570 -0.13291 0.00145 -0.53939
Peubah Tunggal Nilai p s.e. βˆ 0.02783 0.35449 0.00559 0.13173 0.05939 0.00570 0.38823
0.7267 0.8527 0.0008 0.5153 0.0252 0.7986 0.1647
ψˆ
βˆ
1.010 1.068 1.019 0.918 0.876 1.001 0.583
-0.01936 -0.25090 0.02083 0.01312 -0.13524 -0.00159 -0.64044
Peubah Gabungan Nilai p s.e. βˆ 0.02792 0.40229 0.00593 0.13244 0.06889 0.00658 0.42669
0.4882 0.5328 0.0004 0.9211 0.0496 0.8085 0.1334
ψˆ 0.981 0.778 1.021 1.013 0.874 0.998 0.527
11
Peubah penjelas Usia Jenis kelamin Nitrogen Kalsium Hemoglobin % Plasma Protein
Peubah Tunggal Selang kepercayaan 0.956 - 1.066 0.533 - 2.140 1.008 - 1.030 0.709 - 1.188 0.779 - 0.984 0.990 - 1.013 0.272 - 1.248
Peubah Gabungan Selang kepercayaan 0.929 - 1.036 0.354-1.712 1.009-1.033 0.782-1.314 0.763-1.000 0.986-1.011 0.228-1.216
a. Pengaruh Usia Secara teori kondisi seorang pasien multiple myeloma dipengaruhi oleh faktor usia yaitu banyak diderita oleh seseorang yang berusia >50 tahun terutama seseorang yang berusia sekitar 70 tahun, hanya sedikit sekali kasus multiple myeloma yang diderita oleh seseorang yang berusia < 40 tahun (www.mayoclinic.com). Semakin tua usia seseorang maka kondisi tubuhnya akan semakin lemah sehingga dapat dikatakan tingkat bertahan hidupnya rendah. Tunggal
Gabungan
Gambar 1. Fungsi Hazard Usia Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan Dari Gambar 1 dapat dilihat bahwa untuk analisis survival peubah tunggal semakin bertambah usia seorang pasien maka resiko kematiannya semakin tinggi, sedangkan untuk analisis survival peubah gabungan semakin bertambah usia pasien maka resiko kematiannya semakin rendah, dan hasil analisis pada Tabel 3 menunjukkan bahwa untuk analisis survival peubah tunggal dengan nilai ψ = 1.010 , artinya pasien yang berusia satu tahun lebih tua maka resiko kematiannya 1.010 kali lebih tinggi dibandingkan pasien yang berusia satu tahun lebih muda, sedangkan untuk analisis survival peubah gabungan nilai ψ = 0.981 , artinya pasien yang berusia satu tahun lebih tua mempunyai resiko kematian 0.981 kali lebih rendah dibandingkan pasien yang berusia satu tahun lebih muda.
Namun dilihat dari nilai p > α = 0.05 untuk analisis survival peubah tunggal maupun analisis survival peubah gabungan yang menunjukkan bahwa peubah penjelas usia tidak berpengaruh nyata terhadap tingkat bertahan hidup pasien. Dengan demikian tidak terdapat perbedaan tingkat bertahan hidup antara pasien yang berusia lebih muda dengan pasien yang berusia lebih tua.
b. Pengaruh Jenis Kelamin Seorang pria yang terkena penyakit multiple myeloma akan lebih beresiko berkembang penyakitnya dibandingkan seorang pasien wanita. (www.mayoclinic.com) Dari Tabel 3 hasil analisis survival peubah tunggal nilai ψ = 1.068 , hal tersebut menunjukkan bahwa pasien wanita lebih tinggi resiko kematiannya 1.068 kali dibandingkan dengan pasien pria. . Tapi hasil analisis survival peubah gabungan diperoleh nilai ψ = 0.778 yang berarti pasien wanita memiliki resiko kematian lebih rendah 0.778 kali dibandingkan pasien pria. Namun dilihat dari nilai p > α = 0.05 untuk analisis survival peubah tunggal maupun analisis survival peubah gabungan yang menunjukkan bahwa peubah penjelas jenis kelamin tidak berpengaruh nyata terhadap tingkat bertahan hidup pasien. Dengan demikian tidak terdapat perbedaan tingkat bertahan hidup antara pasien wanita dengan pasien pria. Jenis Kelamin h(t) 1,200 1,000 0,800 0,600 0,400 0,200 0,000
Tunggal Gabungan
1
2
1
0
x
Gambar 2. Fungsi Hazard Jenis Kelamin Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan
12
c. Pengaruh Nitrogen
Gabungan
Gabungan
Tunggal Tunggal
Gambar 3. Fungsi Hazard Nitrogen Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan Dari Gambar 3 dapat dilihat bahwa analisis peubah gabungan memiliki resiko kematian yang lebih tinggi dibandingkan analisis peubah tunggal. Pada Tabel 3 hasil analisis survival peubah tunggal maupun analisis survival peubah gabungan menunjukkan bahwa nitrogen berpengaruh nyata terhadap tingkat bertahan hidup pasien. Hal ini menunjukkan bahwa terdapat perbedaan tingkat bertahan hidup antara pasien yang kandungan nitrogennya tinggi dengan pasien yang kandungan nitrogennya rendah. Nilai rasio hazard nitrogen hasil analisis survival peubah tunggal dan analisis survival peubah gabungan sebesar 1.019 dan 1.021, hal ini berarti untuk setiap kenaikan nitrogen sebesar satu satuan pada seorang pasien, maka mempunyai resiko kematian lebih tinggi 1.019 kali untuk analisis survival peubah tunggal dan 1.021 kali untuk analisis survival peubah gabungan dibandingkan pasien yang kandungan nitrogennya turun satu satuan. Dengan kata lain seorang pasien yang kandungan nitrogennya naik satu satuan peluang bertahan hidupnya akan lebih kecil dibandingkan pasien yang kandungan nitrogennya turun satu satuan.
d. Pengaruh Kalsium Kandungan kalsium yang lebih tinggi dalam darah pada seorang pasien multiple myeloma akan lebih beresiko untuk berkembang penyakitnya dibandingkan pasien yang kandungan kalsiumnya normal, hal tersebut dapat terjadi ketika kalsium terlarut ke dalam darah. (www.mayoclinic.com)
Gambar 4. Fungsi Hazard Kalsium Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan Gambar 4 menunjukkan untuk analisis survival peubah tunggal semakin banyak kandungan kalsium dalam darah maka resiko kematiannya semakin rendah, sedangkan analisis survival peubah gabungan semakin banyak kandungan kalsium dalam darah maka resiko kematiannya semakin tinggi. Pada Tabel 3 hasil analisis survival peubah tunggal nilai ψ = 0.918 , hal tersebut menunjukkan bahwa pasien yang kandungan kalsiumnya lebih tinggi mempunyai resiko kematian yang lebih rendah 0.918 kali dibandingkan dengan pasien yang kandungan kalsiumnya lebih rendah. Tapi hasil analisis survival peubah gabungan diperoleh nilai ψ = 1.013 yang berarti pasien yang kandungan kalsiumnya lebih tinggi mempunyai resiko kematian yang lebih tinggi 1.013 kali dibandingkan dengan pasien yang kandungan kalsiumnya lebih rendah. Namun dilihat dari nilai p > α = 0.05 untuk analisis survival peubah tunggal maupun analisis survival peubah gabungan yang menunjukkan bahwa peubah penjelas kalsium tidak berpengaruh nyata terhadap tingkat bertahan hidup pasien. Dengan demikian tidak terdapat perbedaan tingkat bertahan hidup antara pasien yang kalsium dalam daranhnya tinggi dengan pasien kalsium dalam darahnya rendah.
e. Pengaruh Hemoglobin Hemoglobin sangat diperlukan oleh seseorang, apalagi seorang pasien yang mengidap multiple myeloma yang selalu mengalami kekurangan darah, sehingga semakin banyak hemoglobin dalam darah maka akan semakin baik untuk kondisi pasien yang mengidap multiple myeloma. Pada Tabel 3 hasil analisis survival peubah tunggal dan peubah gabungan, hemoglobin berpengaruh nyata terhadap tingkat bertahan hidup pasien, artinya tingkat bertahan hidup
1314
pasien yang kandungan hemoglobinnya tinggi berbeda dengan tingkat bertahan hidup pasien yang kandungan hemoglobinnya rendah. Nilai rasio hazard hemoglobin hasil analisis survival peubah tunggal dan analisis survival peubah gabungan sebesar sebesar 0.876 dan 0.874, artinya untuk setiap kenaikan hemoglobin sebesar satu satuan pada seorang pasien, maka mempunyai resiko kematian lebih kecil 0.876 kali untuk analisis survival peubah tunggal dan 0.874 kali untuk analisis survival peubah gabungan dibandingkan pasien yang kandungan hemoglobin nya turun satu satuan. Dengan kata lain seorang pasien yang kandungan hemoglobin nya naik satu satuan peluang bertahan hidupnya akan lebih besar dibandingkan pasien yang kandungan hemoglobin nya turun satu satuan.
____ : Gabungan - - - - : Tunggal
Gambar 5. Fungsi Hazard Hemoglobin Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan
f. Pengaruh Sel Plasma (%) Persentase sel plasma yang nomal adalah <5%, tapi pada pasien multiple myeloma persentase sel plasma meningkat hingga >10%, maka seorang pasien multiple myeloma yang persentase sel plasmanya di atas normal akan lebih beresiko berkembang penyakitnya. (www.mayoclinic.com) Tunggal
Gabungan
Gambar 6. Fungsi Hazard % Sel Plasma Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan Dari Gambar 6 dapat dilihat untuk analisis peubah tunggal semakin banyak persentase sel
plasma dalam darah maka resiko kematiannya semakin tinggi, sedangkan analisis peubah gabungan semakin banyak persentase sel plasma dalam darah maka resiko kematiannya semakin rendah. Pada Tabel 3 hasil analisis survival peubah tunggal nilai ψ = 1.001 , hal tersebut menunjukkan bahwa pasien yang persentase sel plasmanya lebih tinggi mempunyai resiko kematian yang lebih tinggi 1.001 kali dibandingkan dengan pasien yang persentase sel plasmanya lebih rendah. Tapi hasil analisis survival peubah gabungan diperoleh nilai ψ = 0.998 yang berarti pasien yang persentase sel plasmanya lebih tinggi mempunyai resiko kematian yang lebih rendah 0.998 kali dibandingkan dengan pasien yang persentase sel plasmanya lebih rendah. Namun dilihat dari nilai p > α = 0.05 untuk analisis survival peubah tunggal maupun analisis survival peubah gabungan yang menunjukkan bahwa peubah penjelas persentase sel plasma tidak berpengaruh nyata terhadap tingkat bertahan hidup pasien. Dengan demikian tidak terdapat perbedaan tingkat bertahan hidup antara pasien yang persentase sel plasma dalam daranhnya tinggi dengan pasien persentase sel plasma dalam daranhnya rendah.
g. Pengaruh Protein Bence-Jones Multiple myeloma adalah kanker yang menyerang sumsum tulang yang mengakibatkan produksi protein yang berlebihan dan membuat saluran ginjal tersumbat. Maka seorang pasien multiple myeloma yang kandungan proteinnya lebih banyak akan lebih beresiko berkembang penyakitnya dibandingkan yang kandungan proteinnya sedikit. (http://kiamat.info) Pada Tabel 3 nilai rasio hazard protein Bence-Jones hasil analisis survival peubah tunggal dan analisis survival peubah gabungan sebesar sebesar 0.583 dan 0.527, artinya pasien yang mengandung protein Bence-Jones maka mempunyai resiko kematian lebih kecil 0.583 kali untuk survival analisis peubah tunggal dan 0.527 kali untuk analisis survival peubah gabungan dibandingkan pasien yang tidak mengandung protein Bence-Jones. Namun dilihat dari nilai p > α = 0.05 untuk analisis survival peubah tunggal maupun analisis survival peubah gabungan yang menunjukkan bahwa peubah penjelas protein Bence-Jones tidak berpengaruh nyata terhadap tingkat bertahan hidup pasien.
14
Dengan demikian tingkat bertahan hidup pasien yang mengandung protein Bence-Jones sama dengan tingkat bertahan hidup pasien yang tidak ada kandungan protein BenceJones.
Protein h(t) 1,500 1,000
T unggal
0,500
Gabungan
0,000 1
2
1
0
x
Gambar 7. Fungsi Hazard Protein BenceJones Analisis Survival dengan Peubah Tunggal dan Peubah Gabungan. Melihat hasil analisis di atas, ternyata peubah penjelas yang berpengaruh nyata terhadap tingkat bertahan hidup pasien adalah nitrogen dan hemoglobin. Akan dilihat apakah ada interaksi antara kedua peubah penjelas tersebut. Pertama, dilakukan analisis survival dengan dua peubah penjelas yaitu nitrogen dan hemoglobin. Kedua, dilakukan analisis survival dengan tiga peubah penjelas yaitu nitrogen, hemoglobin, dan interaksi nitrogenhemoglobin (NHB). Kemudian dengan statistik −2 ln L dapat ditentukan adakah interaksi antara nitrogen dan hemoglobin. Bentuk interaksinya adalah perkalian antara
nilai nitrogen dan nilai hemoglobin, yaitu X 1 X 2 = X 1. X 2 , dimana X 1 X 2 =nitrogen-hemoglobin( NHB ) X 1 = nitrogen ( N ),
X 2 = hemoglobin ( HB ) Maka model hazard proporsional untuk pasien ke- i setelah ada interaksi yaitu
hi (t ) = exp( β1 X 1 + β 2 X 2 + β12 X 1 X 2 )h0 (t )
Hasil analisis survival dengan peubah penjelas nitrogen dan hemoglobin Analysis of Maximum Likelihood Estimates Parameter Standard Variable DF Estimate nitrogen hemoglobin
1 1
0.01857 -0.13364
Error 0.00567 0.06205
Chi-Square
Hazard Pr > ChiSq
10.7121 4.6384
0.0011 0.0313
95% Hazard Ratio Ratio Confidence Limits 1.019 0.875
1.007 0.775
1.030 0.988
hi (t ) = exp( 0.01857X 1 - 0.13364 X 2 )h0 (t ) −2 ln L = 202.938 Hasil analisis survival dengan peubah penjelas nitrogen, hemoglobin, dan NHB Analysis of Maximum Likelihood Estimates Variable
DF
nitrogen HB NHB
1 1 1
Parameter Estimate 0.02339 -0.12164 -0.0004803
Standard Error 0.04456 0.12643 0.00440
Chi-Square
Pr > ChiSq
0.2756 0.9257 0.0119
0.5996 0.3360 0.9132
hi (t ) = exp( 0.65551 X 1 - 0.38293 X 2 - 0.05201 X 1 X 2 )h0 (t ) 2 −2 ln L = 202.926 , χ 5%;1 = 3.84
Dari hasil analisis survival dengan peubah penjelas nitrogen dan hemoglobin terlihat bahwa nilai-p nitrogen dan hemoglobin < α = 0.05 , artinya nitrogen dan hemoglobin berpengaruh terhadap tingkat bertahan hidup pasien. Sedangkan hasil
Hazard Ratio 1.024 0.885 1.000
95% Hazard Ratio Confidence Limits 0.938 0.691 0.991
1.117 1.134 1.008
15
analisis survival dengan peubah penjelas nitrogen, hemoglobin, dan NHB menunjukkan bahwa nilai-p ketiga peubah penjelas itu > α = 0.05 , artinya ketiga peubah penjelas itu tidak berpengaruh terhadap tingkat bertahan hidup pasien. Untuk menentukan adakah
interaksi antara nitrogen dan hemoglobin maka nilai stastistik −2 ln L = 202.938 − 202.926 = 0.012 Disebabkan karena nilai statistik −2 ln L lebih 2 , dengan demikian dapat kecil dari χ 5%;1 disimpulkan bahwa tidak ada interaksi antara nitrogen dan hemoglobin.
V. SIMPULAN Analisis survival dengan model hazard proporsional dapat digunakan untuk menganalisis data yang tersensor dan data survival yang peubah-peubah penjelasnya dianalisis secara bersamaan . Model hazard proporsional diterapkan pada kasus pasien Multiple Myeloma, untuk memeriksa pengaruh peubah penjelas terhadap tingkat bertahan hidup pasien. Hasil analisis survival dengan peubah tunggal dan analisis survival dengan peubah gabungan menunjukkan bahwa kandungan nitrogen dan hemoglobin dalam darah berpengaruh
terhadap tingkat bertahan hidup pasien. Pengaruh nitrogen berbanding terbalik dengan tingkat bertahan hidup pasien, sedangkan hemoglobin berbanding lurus dengan tingkat bertahan hidup pasien. Namun demikian nitrogen dan hemoglobin tidak terdapat interaksi diantara keduanya dalam penentuan tingkat bertahan hidup pasien. Peubah penjelas lainnya seperti usia, jenis kelamin, kandungan kalsium, kandungan protein Bence-Jones, dan persentase sel plasma tidak berpengaruh nyata terhadap tingkat bertahan hidup pasien.
DAFTAR PUSTAKA Collet, D. 1994. Modelling Survival Data in Medical Research. 3th ed. London Glasgow-Weinheim-Newyork-TokyoMelbour ne-Madrass: Chapman and Hall.
Mayoclinic.http://www.mayoclinic.com/healt h/multiple-myeloma/DS00415. 22 September 2007.
Hogg, V. R. and T. A. Craig. 1995. Introduction to Matkhematical Statistics, 5th ed. New Jersey: Prentice Hall, englewood Cliffs publisher.
Sannella, Eryta. 2006. Penyelesaian masalah data survival dengan menggunakan metode nonparametrik [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Kiamat.http://kiamat.info/Multiple%20Myelo ma.htm. 22 September 2007. Lee, E. T. 1992. Statistical Methods for Survival Data Analysis. Second ed. New York: A wiley Interscience Publication.
Stewart, J. 2003. Kalkulus. Edisi ke-4, jilid kedua. Terjemahan. Jakarta: Erlangga. Walpole, E.R. 1992. Pengantar Stastistika, edisi ke-3. Terjemahan. Jakarta: PT. Gramedia Pustaka Utama.
LAMPIRAN
17
Lampiran 1. Kode Program Analisis Survival dengan Peubah Gabungan title; footnote; title1 "Multiple Myeloma"; *** Proportional Hazards Models *** ; options pageno=1; proc phreg data=WORK._TMP_; model T * STATUS (0) = USIA KELAMIN NITROGEN KALSIUM HEMOGLOBIN PLASMA PROTEIN / corrb covb risklimits; baseline out=work._surv survival=_surviv_ upper=_sdfucl_ lower=_sdflcl_; run; quit; goptions reset=all device=WIN; ** Survival plot **; title; footnote; title1 "Multiple Myeloma"; goptions ftext=SWISS ctext=BLACK htext=1 cells; proc gplot data=work._surv ; label t = 'Survival Time'; axis2 minor=none major=(number=6) label=(angle=90 'Survival Distribution Function'); symbol1 i=stepj c=BLUE l=1 width=1; symbol2 i=stepj c=BLUE l=2 width=1; plot _sdflcl_ * t=2 _sdfucl_ * t=2 _surviv_ * t=1 / overlay description="SDF of t" frame cframe=CXF7E1C2 caxis=BLACK vaxis=axis2 hminor=0 name='SDF'; run; quit; goptions ftext= ctext= htext= reset=symbol;
Lampiran 2. Kode Program Analisis Survival dengan Peubah Interaksi (NHB) title; footnote; title1 "NHB"; *** Proportional Hazards Models *** ; options pageno=1; proc phreg data=Skripsiq.INTERAKSI; model T * STATUS (0) = NITROGEN HB NHB / corrb covb risklimits; baseline out=work._surv survival=_surviv_ upper=_sdfucl_ lower=_sdflcl_; run; quit; goptions reset=all device=WIN; ** Survival plot **; title; footnote; title1 "NHB"; goptions ftext=SWISS ctext=BLACK htext=1 cells; proc gplot data=work._surv ; label t = 'Survival Time'; axis2 minor=none major=(number=6) label=(angle=90 'Survival Distribution Function'); symbol1 i=stepj c=BLUE l=1 width=1; symbol2 i=stepj c=BLUE l=2 width=1; plot _sdflcl_ * t=2 _sdfucl_ * t=2 _surviv_ * t=1 / overlay description="SDF of t"
18
frame cframe=CXF7E1C2 caxis=BLACK vaxis=axis2 hminor=0 name='SDF';
run; quit; goptions ftext= ctext= htext= reset=symbol;
Lampiran 3. Kode Program Analisis Survival dengan Peubah Interaksi (N&HB) title;
footnote; title1 "Model Tereduksi"; *** Proportional Hazards Models *** ; options pageno=1; proc phreg data=Skripsiq.Multiple_Myeloma; model T * STATUS (0) = NITROGEN HEMOGLOBIN / corrb covb risklimits; baseline out=work._surv survival=_surviv_ upper=_sdfucl_ lower=_sdflcl_; run; quit; goptions reset=all device=WIN; ** Survival plot **; title; footnote; title1 "Model Tereduksi"; goptions ftext=SWISS ctext=BLACK htext=1 cells; proc gplot data=work._surv ; label t = 'Survival Time'; axis2 minor=none major=(number=6) label=(angle=90 'Survival Distribution Function'); symbol1 i=stepj c=BLUE l=1 width=1; symbol2 i=stepj c=BLUE l=2 width=1; plot _sdflcl_ * t=2 _sdfucl_ * t=2 _surviv_ * t=1 / overlay description="SDF of t" frame cframe=CXF7E1C2 caxis=BLACK vaxis=axis2 hminor=0 name='SDF'; run; quit; goptions ftext= ctext= htext= reset=symbol;
Lampiran 4. Kode Program Analisis Survival Peubah Tunggal title; footnote; title1 "USIA"; *** Proportional Hazards Models *** ; options pageno=1; proc phreg data=Skripsiq.Multiple_Myeloma; model T * STATUS (0) = USIA / corrb covb risklimits; baseline out=work._surv survival=_surviv_ upper=_sdfucl_ lower=_sdflcl_; run; quit; goptions reset=all device=WIN; ** Survival plot **; title; footnote; title1 "USIA"; goptions ftext=SWISS ctext=BLACK htext=1 cells; proc gplot data=work._surv ; label t = 'Survival Time'; axis2 minor=none major=(number=6) label=(angle=90 'Survival Distribution Function');
19
symbol1 i=stepj c=BLUE l=1 width=1; symbol2 i=stepj c=BLUE l=2 width=1; plot _sdflcl_ * t=2 _sdfucl_ * t=2 _surviv_ * t=1 / overlay description="SDF of t" frame cframe=CXF7E1C2 caxis=BLACK vaxis=axis2 hminor=0 name='SDF'; run; quit; goptions ftext= ctext= htext= reset=symbol;
Lampiran 5. Output Analisis Survival dengan Peubah Gabungan Multiple Myeloma The PHREG Procedure Model Information Data Set WORK._TMP_ Dependent Variable t Censoring Variable status Censoring Value(s) 0 Ties Handling BRESLOW Number of Observations Read Number of Observations Used
48 48
Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 48
36
12
25.00
Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Criterion -2 LOG L AIC SBC Test
Without Covariates
With Covariates
215.940 215.940 215.940
199.701 213.701 224.786
Testing Global Null Hypothesis: BETA=0 Chi-Square DF Pr > ChiSq
Likelihood Ratio Score Wald
16.2390 23.1127 18.4471
7 7 7
0.0230 0.0016 0.0101
Analysis of Maximum Likelihood Estimates Variable usia kelamin nitrogen kalsium hemoglobin plasma protein
DF
Parameter Estimate
Standard Error
Chi-Square
Pr > ChiSq
Hazard Ratio
1 1 1 1 1 1 1
-0.01936 -0.25090 0.02083 0.01312 -0.13524 -0.00159 -0.64044
0.02792 0.40229 0.00593 0.13244 0.06889 0.00658 0.42669
0.4806 0.3890 12.3397 0.0098 3.8537 0.0587 2.2529
0.4882 0.5328 0.0004 0.9211 0.0496 0.8085 0.1334
0.981 0.778 1.021 1.013 0.874 0.998 0.527
95% Hazard Ratio Confidence Limits 0.929 0.354 1.009 0.782 0.763 0.986 0.228
1.036 1.712 1.033 1.314 1.000 1.011 1.216
20
Lampiran 6. Output Analisis Survival dengan Peubah Interaksi
(N&HB)
N&HB The PHREG Procedure Model Information Data Set Dependent Variable Censoring Variable Censoring Value(s) Ties Handling
SKRIPSIQ.MULTIPLE_MYELOMA t status 0 BRESLOW
Number of Observations Read Number of Observations Used
48 48
Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 48
36
12
25.00
Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Criterion -2 LOG L AIC SBC
Without Covariates
With Covariates
215.940 215.940 215.940
202.938 206.938 210.105
Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio 13.0017 2 0.0015 Score 17.7597 2 0.0001 Wald 14.8576 2 0.0006
Variable nitrogen hemoglobin
Analysis of Maximum Likelihood Estimates Parameter Standard Hazard DF Estimate Error Chi-Square Pr > ChiSq 1 1
0.01857 -0.13364
0.00567 0.06205
10.7121 4.6384
95% Hazard Ratio Ratio Confidence Limits
0.0011 0.0313
1.019 0.875
Lampiran 7. Output Analisis Survival dengan Peubah Interaksi (NHB) NHB The PHREG Procedure Model Information Data Set Dependent Variable Censoring Variable Censoring Value(s) Ties Handling
WORK._TMP_1 t status 0 BRESLOW
Number of Observations Read Number of Observations Used
48 48
1.007 0.775
1.030 0.988
21
Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 48
36
12
25.00
Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Criterion -2 LOG L AIC SBC
Without Covariates
With Covariates
215.940 215.940 215.940
202.926 208.926 213.677
Testing Global Null Hypothesis: BETA=0 Test Likelihood Ratio Score Wald
Chi-Square
DF
Pr > ChiSq
13.0136 18.3977 14.9386
3 3 3
0.0046 0.0004 0.0019
Analysis of Maximum Likelihood Estimates Variable
DF
Parameter Estimate
nitrogen HB NHB
1 1 1
0.02339 -0.12164 -0.0004803
Standard Error
Chi-Square
Pr > ChiSq
Hazard Ratio
0.04456 0.12643 0.00440
0.2756 0.9257 0.0119
0.5996 0.3360 0.9132
1.024 0.885 1.000
95% Hazard Ratio Confidence Limits
Lampiran 8. Output Analisis Survival untuk tiap-tiap Peubah Tunggal a. Usia USIA The PHREG Procedure Model Information Data Set Dependent Variable Censoring Variable Censoring Value(s) Ties Handling
WORK._TMP_4 t status 0 BRESLOW
Number of Observations Read Number of Observations Used
48 48
Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 48 36 12 25.00 Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics
0.938 0.691 0.991
1.117 1.134 1.008
22
Criterion
Without Covariates
With Covariates
215.940 215.940 215.940
215.817 217.817 219.401
-2 LOG L AIC SBC
Testing Global Null Hypothesis: BETA=0 Test
Chi-Square
DF
Pr > ChiSq
0.1225 0.1222 0.1222
1 1 1
0.7263 0.7266 0.7267
Likelihood Ratio Score Wald
Analysis of Maximum Likelihood Estimates Variable usia
DF
Parameter Estimate
Standard Error
Chi-Square
Pr > ChiSq
Hazard Ratio
1
0.00973
0.02783
0.1222
0.7267
1.010
95% Hazard Ratio Confidence Limits 0.956
b. Jenis Kelamin Jenis Kelamin The PHREG Procedure Model Information Data Set Dependent Variable Censoring Variable Censoring Value(s) Ties Handling
SKRIPSIQ.MULTIPLE_MYELOMA t status 0 BRESLOW
Number of Observations Read Number of Observations Used
48 48
Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 48
36
12
25.00
Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Criterion -2 LOG L AIC SBC
Without Covariates
With Covariates
215.940 215.940 215.940
215.906 217.906 219.489
Testing Global Null Hypothesis: BETA=0 Test Likelihood Ratio Score Wald
Chi-Square
DF
Pr > ChiSq
0.0343 0.0345 0.0345
1 1 1
0.8531 0.8527 0.8527
1.066
23
Analysis of Maximum Likelihood Estimates Variable kelamin
DF
Parameter Estimate
Standard Error
Chi-Square
Pr > ChiSq
Hazard Ratio
1
0.06583
0.35449
0.0345
0.8527
1.068
95% Hazard Ratio Confidence Limits 0.533
2.140
c. Nitrogen Nitrogen The PHREG Procedure Model Information Data Set Dependent Variable Censoring Variable Censoring Value(s) Ties Handling
SKRIPSIQ.MULTIPLE_MYELOMA t status 0 BRESLOW
Number of Observations Read Number of Observations Used
48 48
Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 48
36
12
25.00
Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Criterion
Without Covariates
With Covariates
215.940 215.940 215.940
207.453 209.453 211.037
-2 LOG L AIC SBC
Testing Global Null Hypothesis: BETA=0 Test Likelihood Ratio Score Wald
Chi-Square
DF
Pr > ChiSq
8.4867 13.9357 11.1712
1 1 1
0.0036 0.0002 0.0008
Analysis of Maximum Likelihood Estimates Variable
DF
Parameter Estimate
nitrogen
1
0.01868
Standard Error
Chi-Square
Pr > ChiSq
Hazard Ratio
0.00559
11.1712
0.0008
1.019
95% Hazard Ratio Confidence Limits 1.008
d. Kalsium Kalsium The PHREG Procedure Model Information Data Set Dependent Variable
SKRIPSIQ.MULTIPLE_MYELOMA t
1.030
24
Censoring Variable Censoring Value(s) Ties Handling
status 0 BRESLOW
Number of Observations Read Number of Observations Used
48 48
Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 48
36
12
25.00
Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Criterion
Without Covariates
With Covariates
215.940 215.940 215.940
215.494 217.494 219.078
-2 LOG L AIC SBC
Testing Global Null Hypothesis: BETA=0 Test
Chi-Square
DF
Pr > ChiSq
0.4458 0.4240 0.4233
1 1 1
0.5043 0.5149 0.5153
Likelihood Ratio Score Wald
Analysis of Maximum Likelihood Estimates Variable kalsium
DF
Parameter Estimate
Standard Error
Chi-Square
Pr > ChiSq
Hazard Ratio
1
-0.08570
0.13173
0.4233
0.5153
0.918
95% Hazard Ratio Confidence Limits 0.709
e. Hemoglobin Hemoglobin The PHREG Procedure Model Information Data Set Dependent Variable Censoring Variable Censoring Value(s) Ties Handling
SKRIPSIQ.MULTIPLE_MYELOMA t status 0 BRESLOW
Number of Observations Read Number of Observations Used
48 48
Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 48
36
12
25.00
1.188
25
Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Criterion
Without Covariates
With Covariates
215.940 215.940 215.940
211.068 213.068 214.652
-2 LOG L AIC SBC
Testing Global Null Hypothesis: BETA=0 Test
Chi-Square
DF
Pr > ChiSq
4.8717 5.1446 5.0082
1 1 1
0.0273 0.0233 0.0252
Likelihood Ratio Score Wald
Variable hemoglobin
DF
Parameter Estimate
1
-0.13291
Analysis of Maximum Likelihood Estimates Standard Error Chi-Square Pr > ChiSq 0.05939
5.0082
Hazard Ratio
0.0252
0.876
95% Hazard Ratio Confidence Limits 0.779
f. % Plasma Plasma The PHREG Procedure Model Information Data Set Dependent Variable Censoring Variable Censoring Value(s) Ties Handling
SKRIPSIQ.MULTIPLE_MYELOMA t status 0 BRESLOW
Number of Observations Read Number of Observations Used
48 48
Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 48
36
12
25.00
Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Criterion -2 LOG L AIC SBC
Without Covariates
With Covariates
215.940 215.940 215.940
215.875 217.875 219.459
0.984
26
Test
Testing Global Null Hypothesis: BETA=0 Chi-Square DF Pr > ChiSq
Likelihood Ratio 0.0645 Score 0.0651 Wald 0.0651 Analysis of Maximum Likelihood 95% Hazard Ratio Variable DF Confidence Limits plasma 0.990
1 1.013
1 0.7996 1 0.7985 1 0.7986 Estimates
Parameter
Standard
Hazard
Estimate
Error
Chi-Square
Pr > ChiSq
Ratio
0.00145
0.00570
0.0651
0.7986
1.001
g. Protein Protein The PHREG Procedure Model Information Data Set Dependent Variable Censoring Variable Censoring Value(s) Ties Handling
SKRIPSIQ.MULTIPLE_MYELOMA t status 0 BRESLOW
Number of Observations Read Number of Observations Used
48 48
Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 48
36
12
25.00
Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Criterion -2 LOG L AIC SBC
Without Covariates
With Covariates
215.940 215.940 215.940
213.890 215.890 217.473
Testing Global Null Hypothesis: BETA=0 Test Likelihood Ratio Score Wald
Chi-Square
DF
Pr > ChiSq
2.0501 1.9707 1.9303
1 1 1
0.1522 0.1604 0.1647
Analysis of Maximum Likelihood Estimates Variable protein
DF 1
Parameter Estimate -0.53939
Standard Error 0.38823
Chi-Square 1.9303
Pr > ChiSq 0.1647
Hazard Ratio 0.583
95% Hazard Ratio Confidence Limits 0.272
1.248
23
Lampiran 9. Data Survival Times dari 48 pasien Multiple Myeloma No. Pasien 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
t 13 52 6 40 10 7 66 10 10 14 16 4 65 5 11 10 15 5 76 56 88 24 51 4 40 8
Status 1 0 1 1 1 0 1 0 1 1 1 1 1 1 0 1 0 1 0 0 1 1 1 1 0 1
Usia 66 66 53 69 65 57 52 60 70 70 68 50 59 60 66 51 55 67 60 66 63 67 60 74 72 55
Jenis Kelamin 0 0 1 0 0 1 0 0 0 0 0 1 0 0 1 1 0 1 0 0 0 0 1 0 0 0
Nitrogen 25 13 15 10 20 12 21 41 37 40 39 172 28 13 25 12 14 26 12 18 21 10 10 48 57 53
Kalsium 10 11 13 10 10 8 10 9 12 11 10 9 9 10 9 9 9 8 12 11 9 10 10 9 9 12
Hemoglobin 14,6 12 11,4 10,2 13,2 9,9 12,8 14 7,5 10,6 11,2 10,1 6,6 9,7 8,8 9,6 13 10,4 14 12,5 14 12,4 10,1 6,5 12,8 8,2
Plasma 18 100 33 30 66 45 11 70 47 27 41 46 66 25 23 80 8 49 9 90 42 44 45 54 28 55
Protein 1 0 1 1 0 0 1 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 1 0
NHB 365,0 156,0 171,0 102,0 264,0 118,8 268,8 574,0 277,5 424,0 436,8 1737,2 184,8 126,1 220,0 115,2 182,0 270,4 168,0 225,0 294,0 124,0 101,0 312,0 729,6 434,6
29 27
27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
18 5 16 50 40 1 36 5 10 91 18 1 18 6 1 23 15 18 12 12 17 3
1 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 1 0 1 1 0
Keterangan: Status: 1 Paseien yang meninggal 0 Pasien yang tersensor
51 70 53 74 70 67 63 77 61 58 69 57 59 61 75 56 62 60 71 60 65 59
0 1 0 0 1 0 0 0 0 1 1 0 1 1 0 1 1 1 1 1 1 0
12 130 17 37 14 165 40 23 13 27 21 20 21 11 56 20 21 18 46 6 28 90
Jenis Kelamin: 1 Wanita 0 Pria
15 8 9 13 9 10 9 8 10 11 10 9 10 10 12 9 10 9 9 10 8 10
14,4 10,2 10 7,7 5 9,4 11 9 14 11 10,8 5,1 13 5,1 11,3 14,6 8,8 7,5 4,9 5,5 7,5 10,2
100 0 172,8 23 0 1326,0 28 0 170,0 11 1 284,9 22 0 70,0 90 0 1551,0 16 1 440,0 29 0 207,0 19 0 182,0 26 1 297,0 33 0 226,8 100 1 102,0 100 0 273,0 100 0 56,1 18 0 632,8 3 0 292,0 5 0 184,8 85 1 135,0 62 0 225,4 25 0 33,0 8 0 210,0 6 1 918,0 Sumber: Krall et.all. dalam Collett D.
Protein: 1 Ada kandungan protein 0 Tidak ada kandungan protein
30 28 27
31