Analisis Antar Kejadian Data Antar Kejadian (DAK)
Pengantar Analisis Antar Kejadian
event-history data time-to-event data
Dr. Danardono, MPH
data durasi
[email protected]
data survival Program Studi Statistika Jurusan Matematika UGM
Analisis Antar Kejadian Analisis data yang memanfaatkan informasi kronologis dari kejadian-kejadian atau peristiwa (events)
Pengantar Analisis Antar Kejadian – p.1/140
Analisis "Buku Harian"
Analisis "Riwayat Hidup"
Mahasiswa A
Person A
Mahasiswa B
Person B
03:30 tidur
11:00 tidur
7 th
masuk SD
7 th
masuk SD
08:50 bangun
05:00 bangun
10 th
keluar SD
13 th
masuk SMP
09:13 kuliah, terlambat
08:58 kuliah, on time
12 th
pengamen jalanan
16 th
masuk SMU
09:30 ngantuk ... zzz
09:30 aktif ....
13 th
terlibat penjambretan
19 th
masuk PT
11:30 capek, lapar
11:30 belajar, fresh
16 th
terlibat curanmor
23 th
mencari pekerjaan
12:00 mau makan
12:20 makan
18 th
terlibat perampokan
24 th
bekerja di prsh. X
13:00 kuliah
21 th
bos mafia gang X
28 th
kepala cabang
...
25 th
pertikaian antar gang
...
dst...
...
dst...
dompet ketinggalan 12:20 pulang dulu... ...
dst...
dst... Pengantar Analisis Antar Kejadian – p.2/140
Pengantar Analisis Antar Kejadian – p.3/140
Analisis Rekam Medis Person A 0 th lahir normal 1-5 th sehat 5-16 th sehat 16-40 th merokok 40 th gejala kanker paru ... dst ...
Aplikasi AAK epidemiologi
Person B 0 th lahir normal 1-5 th sehat 5-16 th sehat 16-21th berhenti merokok 21 th sehat ... dst ...
biostatistika sosiologi psikologi demografi ekonomi
Pengantar Analisis Antar Kejadian – p.4/140
Contoh DAK a) Representasi data antar kejadian S 2 1 t (waktu)
b) Alternatif representasi (data survival)
Contoh DAK S S : state space (status)) Contoh 1: data survival, kejadian (event) yang menjadi perhatian adalah kematian status 1 : hidup 2: mati Contoh 2: event yang menjadi perhatian adalah saat anak disapih (berhenti disusui oleh ibunya) status 1 : 2:
t (waktu)
c) Alternatif representasi
Pengantar Analisis Antar Kejadian – p.5/140
disusui disapih
Contoh 3: event yang menjadi perhatian adalah saat seseorang mulai bisa naik sepeda status 1 : 2:
belum bisa naik sepeda bisa naik sepeda
Contoh 4: data multistatus (multistate) dengan tiga macam status yang irreversible, misalnya tahapan penyakit yang progresif.
3 2 1 t (waktu)
status 1 : 2: 3:
stadium 1 stadium 2 stadium 3
S 3 2 1 t (waktu)
Contoh 5: data multistatus dengan kemungkinan beberapa status yang irreversible status 1 : sehat 2: sakit 3: meninggal
t (waktu) Pengantar Analisis Antar Kejadian – p.6/140
Pengantar Analisis Antar Kejadian – p.7/140
Rancangan Pengumpulan Data
Tersensor dan Terpotong Kendala yang sering muncul dalam DAK adalah adanya data tersensor (censored) dan terpotong (truncated).
S a) Cross-sectional
3 2 1
b) Panel
t
t2
S
1 2 3
3 2 1
S c) Event-oriented (longitudinal)
t1
t2
S (state space):
t3
t4
: : :
left-truncated
right-censored
left-censored
right-truncated
t (waktu)
t (waktu)
sehat sakit meninggal
t
3 2 1
t Pengantar Analisis Antar Kejadian – p.8/140
Tersensor Kanan (Right-censored)
Pengantar Analisis Antar Kejadian – p.9/140
Terpotong Kiri (Left-Truncated)
obs. lengkap
obs. lengkap unobserved period
unobserved period terpotong kiri
tersensor kanan event
t (waktu)
event
t (waktu)
Contoh: Suatu eksperimen menggunakan tikus percobaan dilakukan untuk mengetahui seberapa lama tikus dapat hidup setelah pemberian suatu zat yang dapat mengakibatkan kanker. Tipe I: Jika saat tersensornya ditentukan lebih dahulu Tipe II: Jika saat tersensornya ditentukan setelah tercapai persentase atau banyak sampel tertentu yang telah mendapatkan event. Pengantar Analisis Antar Kejadian – p.10/140
Contoh: Suatu studi tentang morbiditas dan mortalitas pegawai pada suatu institusi dilakukan ketika pegawai telah berusia 40 tahun ke atas. Apabila seorang pegawai telah meninggal sebelum berusia 40, dia tidak masuk dalam sampel (left-truncated).
Pengantar Analisis Antar Kejadian – p.11/140
Tersensor Kiri (Left-Censored)
Terpotong Kanan (Right-Truncated)
obs. lengkap
obs. lengkap unobserved period
unobserved period Terpotong Kanan
Tersensor kiri event
event
t (waktu)
t (waktu)
Contoh: Suatu studi dilakukan untuk mengetahui faktor-faktor yang mempengaruhi usia pertama kali merokok. Apabila responden ingat usia saat dia pertama kali merokok, dikatakan observasi yang diperoleh adalah lengkap. Bila responden tidak ingat kapan dia mulai merokok, tapi hanya ingat mulai merokok sebelum usia tertentu, maka dikatakan observasi tersebut tersensor kiri.
Contoh: Suatu studi tentang AIDS dilakukan secara retrospektif. Yang menjadi perhatian adalah durasi mulai infeksi HIV sampai terdiagnosis AIDS. Hanya individu yang telah terdiagnosis AIDS sebelum mulai studi saja yang akan masuk dalam studi. Individu yang belum terdiagnosis AIDS tidak masuk dalam studi adalah sampel yang terpotong kanan.
Pengantar Analisis Antar Kejadian – p.13/140
Pengantar Analisis Antar Kejadian – p.12/140
Fungsi Survival
Fungsi Survival 1.0
Probabilitas satu individu hidup (tinggal dalam suatu status) lebih lama daripada t
0.8
S(t) = P (T > t)
untuk t = 0 untuk t = ∞
0.4
S(t)
( 1 S(t) = 0
0.6
S(t) adalah fungsi non-increasing terhadap waktu t dengan sifat
0.2
Hubungan S(t) dengan distribusi kumulatif F (t)
0.0
S(t) = 1 − F (t)
0.0
0.5
1.0
1.5
2.0
t
Pengantar Analisis Antar Kejadian – p.14/140
Pengantar Analisis Antar Kejadian – p.15/140
Fungsi Hazard
Fungsi Hazard Kumulatif
Tingkat (rate) terjadinya suatu event H(t) =
t
h(x)dx
0
P (t ≤ T < t + ∆t | T ≥ t) h(t) = lim ∆t→0 ∆t
Hubungan H(t) dengan S(t) H(t) = − log S(t)
Hubungan h(t), S(t) dan f (t) h(t) =
Z
f (t) S(t)
Pengantar Analisis Antar Kejadian – p.16/140
4 3 0
1
2
h(t) 0
1
2
h(t)
3
4
5
Fungsi Hazard
5
Fungsi Hazard
Pengantar Analisis Antar Kejadian – p.17/140
0.0
0.5
1.0
1.5
2.0
0.0
t
0.5
1.0
1.5
2.0
t
Pengantar Analisis Antar Kejadian – p.18/140
Pengantar Analisis Antar Kejadian – p.19/140
4 3 0
1
2
h(t) 0
1
2
h(t)
3
4
5
Fungsi Hazard
5
Fungsi Hazard
0.0
0.5
1.0
1.5
2.0
0.0
0.5
t
1.0
1.5
2.0
t
Pengantar Analisis Antar Kejadian – p.20/140
Fungsi Hazard
Pengantar Analisis Antar Kejadian – p.21/140
Model Eksponensial Eksponensial (λ > 0, t ≥ 0)
5
fungsi densitas
4
f (t) = λ exp(−λt)
3
fungsi hazard
2
h(t)
h(t) = λ fungsi survival
1
S(t) = exp(−λt)
0
mean 0.0
0.5
1.0
1.5
E(t) =
2.0
1 λ
t
Pengantar Analisis Antar Kejadian – p.22/140
Pengantar Analisis Antar Kejadian – p.23/140
Model Eksponensial
Kurva survival untuk model eksponensial dengan dua nilai λ yang berbeda
Kurva hazard untuk model eksponensial dengan dua nilai λ yang berbeda
0.3
λ = 0.1
0.1
λ = 0.1 λ = 0.3
0.0
0.0
0.2
λ = 0.3
0.2
0.4
S(t)
h(t)
0.6
0.4
0.8
0.5
1.0
0.6
Model Eksponensial
0
10
20
30
0
40
10
20
30
40
t
t
Pengantar Analisis Antar Kejadian – p.24/140
Pengantar Analisis Antar Kejadian – p.25/140
Model Weibull
Weibull (α, λ > 0,t ≥ 0) Parameter α dan λ sering disebut sbg. shape dan scale.
Kurva survival untuk model Weibull dengan beberapa nilai α yang berbeda 1.0
Model Weibull
fungsi densitas
0.8
f (t) = αλ(λt)α−1 exp(−(λt)α )
0.6
fungsi hazard
0.4
S(t)
h(t) = αλ(λt)α−1
0.2
fungsi survival S(t) = exp(−(λt)α )
α=2
0.0
mean
α = 0.1 α=4
E(t) =
Γ(1 + 1/α) λ
0
1
2
α=1
3
4
t
Pengantar Analisis Antar Kejadian – p.26/140
Pengantar Analisis Antar Kejadian – p.27/140
Model Weibull
Kurva hazard untuk model Weibull dengan beberapa nilai α yang berbeda
Kurva survival dan hazard untuk model Weibull dengan beberapa nilai α yang berbeda 4
0.8
3
1.0
4
Model Weibull
3
α=4
0.6
2
α=2
0.4
h(t)
S(t)
2
α=1
α=1
0.2
1
1
h(t)
α=4
α=2
α = 0.1
α = 0.1
0
1
2
3
4
α = 0.1
α=1
α=2
0
0.0
0
α=4
0
t
1
2
3
4
0
1
2
t
4
t
Pengantar Analisis Antar Kejadian – p.28/140
Pengantar Analisis Antar Kejadian – p.29/140
Model Gamma
Model Log-normal
Gamma (β, λ > 0,t ≥ 0)
log-normal (σ > 0,t ≥ 0)
fungsi densitas
3
fungsi densitas
λ(λt)β−1 exp(−λt) f (t) = Γ(β)
1 2 exp − 2 (log(t) − µ) f (t) = 2σ tσ 2π 1 √
fungsi hazard
fungsi hazard h(t) = f (x)/S(x)
h(t) = f (x)/S(x)
fungsi survival
fungsi survival
1 S(t) = 1 − I(λt, β) = 1 − Γ(β)
Z
λt
u
β−1 −u
e
S(t) = 1 − Φ
du
0
mean
mean E(t) = β/λ Pengantar Analisis Antar Kejadian – p.30/140
log(t) − µ σ
E(t) = exp(µ + σ 2 /2) Pengantar Analisis Antar Kejadian – p.31/140
Estimasi Parameter
Estimasi Parameter
Data: (Ti = ti , δi ), i = 1, 2, . . . , n yang independen satu sama lain
Fungsi likelihood untuk data tersensor kanan
dengan Ti : durasi atau waktu antar kejadian ( 0 jika i tersensor δi = 1 jika i mendapatkan kejadian (event)
L(θ) ∝
n Y
f (ti , θ)δi S(ti , θ)1−δi
i=1
dengan θ = (θ1 , . . . , θp ) adalah p parameter yang akan diestimasi; f (ti , θ) adalah fungsi densitas untuk i yang mendapatkan kejadian dan S(ti , θ) adalah fungsi survival untuk i yang tidak mendapatkan kejadian.
Pengantar Analisis Antar Kejadian – p.32/140
Pengantar Analisis Antar Kejadian – p.33/140
Estimasi Parameter
Estimasi Parameter
Fungsi log-likelihood untuk data tersensor kanan
Digunakan metode kemungkinan maksimum (MLE: Maximum Likelihood Estimation) untuk mengestimasi θ .
ℓ(θ) ∝
n X i=1
(δi ) log(f (ti , θ)) +
n X i=1
(1 − δi ) log(S(ti , θ))
dengan θ = (θ1 , . . . , θp ) adalah p parameter yang akan diestimasi; f (ti , θ) adalah fungsi densitas untuk i yang mendapatkan kejadian dan S(ti , θ) adalah fungsi survival untuk i yang tidak mendapatkan kejadian.
ˆ adalah (θˆ1 , . . . , θˆp ) yang memaksimumkan MLE dari θ , ditulis θ ℓ(θ) ˆ = max ℓ(θ) ℓ(θ) semua θ ˆ adalah penyelesaian dari θ ∂ℓ(θ) = 0, ∂θj
Pengantar Analisis Antar Kejadian – p.34/140
j = 1, 2, . . . , p
Pengantar Analisis Antar Kejadian – p.35/140
Eksponensial - data lengkap
Eksponensial - data lengkap
Fungsi log-likelihood
Interval konfidensi 100(1 − α)% untuk λ dibentuk berdasarkan µ/µ yang berdistribusi chi-square dengan derajad statistik 2nˆ bebas 2n
ℓ(λ) = n log λ − λ
n X
ti
ˆ 2 λχ 2n,α/2
i=1
2n
MLE dari λ ˆ = Pnn λ
<λ<
ˆ 2 λχ 2n,1−α/2 2n
dengan χ22n,p adalah kuantil ke-p dari distribusi chi-square dengan derajad bebas 2n.
i=1 ti
Mean dari Eksponensial: µ = E(x) = 1/λ, sehingga µ ˆ = t¯, Pn ¯ dengan t = i=1 ti /n
Pengantar Analisis Antar Kejadian – p.36/140
Pengantar Analisis Antar Kejadian – p.37/140
Eksponensial - data lengkap
Eksponensial - data tersensor
Diketahui waktu remisi (minggu) dari 21 pasien leukemia akut: 1, 1, 2, 2, 3, 4, 4, 5, 5, 6, 8, 8, 9,10, 10, 12, 14, 16, 20, 24, 34
Data: (Ti = ti , δi ), i = 1, 2, . . . , n yang independen satu sama lain demikian juga dengan Ti dan δi Fungsi likelihood
Interval konfidensi 95% untuk λ dari data di atas: ˆ 2 λχ 2n,α/2
ˆ 2 λχ 2n,1−α/2
L(λ) =
<λ< 2n 2n 0, 106 × 62, 777 0, 106 × 25, 999 <λ< 42 42 0, 066 < λ < 0, 156
λδi exp(−λti )
i=1
Fungsi log-likelihood ℓ(λ) =
n X i=1
Pengantar Analisis Antar Kejadian – p.38/140
n Y
"
δi log λ − λ
n X i=1
ti
#
Pengantar Analisis Antar Kejadian – p.39/140
Eksponensial - data tersensor
Eksponensial - data tersensor
MLE dari λ
Dalam suatu penelitian 10 tikus percobaan terpapar (exposed) ke suatu jenis penyakit kanker. Setelah 5 tikus mati percobaan dihentikan diperoleh data lama hidup tikus sbb: 4, 5, 8, 9, 10, 10+, 10+, 10+, 10+, 10+. (tanda + menunjukkan tersensor)
Pn δi ˆ = Pi=1 λ n i=1 ti
Bila banyaknya data yang lengkap adalah k ˆ = Pnk λ
i=1 ti
Pengantar Analisis Antar Kejadian – p.40/140
Pengantar Analisis Antar Kejadian – p.41/140
Metode Non-Parametrik untuk Survival
Kaplan-Meier
Penduga untuk S(t) bila data tidak tersensor:
Estimator untuk S(t) (sering disebut juga sebagai Product-Limit estimator)
ˆ = s S(t) N
dimana s adalah banyaknya individu yang masih hidup lebih lama dari t ; N adalah total banyaknya individu Untuk Data yang tersensor:
( 1 ˆ = Q S(t)
ti ≤t (1
−
di Yi )
jika t < t1 jika ti ≤ t
dimana di adalah banyaknya event dan Yi adalah banyaknya individu yang beresiko (number at risk )
Kaplan-Meier Nelson-Aalen
Pengantar Analisis Antar Kejadian – p.42/140
Pengantar Analisis Antar Kejadian – p.43/140
Kaplan-Meier
Nelson-Aalen
Variansi dari KM estimator (Greenwood’s formula)
Estimator untuk fungsi hazard kumulatif:
ˆ ˆ 2 var[S(t)] = S(t)
X
ti ≤t
di Yi (Yi − di )
di ti ≤t Yi
Alternatif: ˆ ˆ var[S(t)] = S(t)
2 [1
( 0 ˆ H(t) = P
dengan variansi
ˆ − S(t)] Y (t)
ˆ H(t)) ˆ Var( =
jika t < t1 jika ti ≤ t
X di Yi2
ti ≤t
Pengantar Analisis Antar Kejadian – p.44/140
Kaplan-Meier
Kaplan-Meier di SPSS ˆ S(t)
t
di
Yi
4
1
10
5
1
9
0, 9(1
6
1
8
0, 8(1
8
3
7
0, 7(1
10
2
4
0, 4(1
11
1
2
0, 2(1
12
1
1
0, 1(1
Pengantar Analisis Antar Kejadian – p.45/140
1 10 ) − 91 ) − 81 ) − 73 ) − 52 ) − 21 ) − 11 )
(1 −
Survival Analysis for TIME
= 0, 9
Time
Status
= 0, 8 = 0, 7
4,00 5,00 6,00 8,00 8,00 8,00 10,00 10,00 11,00 12,00
= 0, 4 = 0, 2 = 0, 1 = 0, 0
1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00
Number of Cases:
Pengantar Analisis Antar Kejadian – p.46/140
Cumulative Standard Survival Error ,9000 ,8000 ,7000
,0949 ,1265 ,1449
,4000
,1549
,2000 ,1000 ,0000
,1265 ,0949 ,0000
10
Censored:
0
Cumulative Number Events Remaining 1 2 3 4 5 6 7 8 9 10
(
,00%)
9 8 7 6 5 4 3 2 1 0
Events: 10
Pengantar Analisis Antar Kejadian – p.47/140
Kaplan-Meier di SPSS
Kaplan-Meier di SPSS
KM time /STATUS=status(1) /PRINT TABLE MEAN /PLOT SURVIVAL HAZARD .
Survival Function 1,2
1,0
Menu: Analyze – Survival – Kaplan-Meier
,8
,6
,4
Cum Survival
,2
0,0
-,2 2
4
6
8
10
12
14
TIME
Pengantar Analisis Antar Kejadian – p.49/140
Pengantar Analisis Antar Kejadian – p.48/140
Fungsi Hazard kumulatif di SPSS
Kaplan-Meier di R library(survival) c1<-survfit(Surv(TIME,STATUS)˜1,data=contohKM)
Cumulative Hazard Function 2,5
2,0
windows(width=5,height=5) plot(c1,col=3) par(new=T) plot(c1,col=2,lwd=2,conf.int=F)
1,5
1,0
Cum Hazard
,5
0,0
-,5 2
4
6
8
10
12
plot(c1,xlab="time",col=3,fun="cumhaz") par(new=T) plot(c1,col=2,lwd=2,conf.int=F,fun="cumhaz")
TIME
(Lebih rumit dari SPSS, tapi lebih powerful dan fleksibel) Pengantar Analisis Antar Kejadian – p.50/140
Pengantar Analisis Antar Kejadian – p.51/140
Fungsi Hazard Kumulatif di R
0.0
0.0
0.2
0.5
0.4
1.0
0.6
1.5
0.8
2.0
1.0
Kaplan-Meier di R
0 0
2
4
6
8
10
2
4
12
6
8
10
12
time
Pengantar Analisis Antar Kejadian – p.52/140
Median Survival Time
Pengantar Analisis Antar Kejadian – p.53/140
Model Eksponensial - KM
1.0
1.0
n=100, tanpa sensor
0.0
0.0
0.2
0.2
0.4
0.4
S(t)
0.6
0.6
0.8
0.8
λ = 0.1
0
2
4
6
8
10
12 0
10
20
30
40
t Pengantar Analisis Antar Kejadian – p.54/140
Pengantar Analisis Antar Kejadian – p.55/140
Model Eksponensial - KM
Model Eksponensial - KM
1.0
n=75, tanpa sensor
1.0
n=100, tanpa sensor
λ = 0.1 0.8 0.6 0.0
0.2
0.4
S(t) 0.0
0.2
0.4
S(t)
0.6
0.8
λ = 0.3
0
5
10
15
20
0
10
20
t
30
40
t Pengantar Analisis Antar Kejadian – p.56/140
Model Eksponensial - KM
Pengantar Analisis Antar Kejadian – p.57/140
Model Eksponensial - KM
1.0
n=15, tanpa sensor
1.0
n=30, tanpa sensor
λ = 0.1 0.8 0.6 0.0
0.2
0.4
S(t) 0.0
0.2
0.4
S(t)
0.6
0.8
λ = 0.1
0
10
20
30
40
t
0
5
10
15
t Pengantar Analisis Antar Kejadian – p.58/140
Pengantar Analisis Antar Kejadian – p.59/140
Model Eksponensial - KM
Model Eksponensial - KM
0.8 0.6 0.4
S(t) 0.4
S(t)
0.6
0.8
1.0
n= 75 , 74.67 persen tersensor
1.0
n= 75 , 56 persen tersensor
0.2
λ = 0.1
0.0
0.0
0.2
λ = 0.1
0
2
4
6
8
10
12
14
0
2
4
t
6
8
10
t Pengantar Analisis Antar Kejadian – p.60/140
Data ASI 1 2 3 4 5
dur 16 1 4 3 36
Pengantar Analisis Antar Kejadian – p.61/140
KM Data ASI
d race pvty smk alco agmth ybirth yschool 1 1 0 0 1 24 82 14 1 1 0 1 0 26 85 12 0 1 0 0 0 25 85 12 1 1 0 1 1 21 85 9 1 1 0 1 0 22 82 12
pc3 0 0 0 0 0
KM dur /STATUS=d(1) /PRINT TABLE MEAN /PLOT SURVIVAL HAZARD .
Survival Function 1,0
,8
,6
Cum Survival
,4
,2
Survival Function Censored
0,0 0
50
100
150
200
DURATION
Pengantar Analisis Antar Kejadian – p.62/140
Pengantar Analisis Antar Kejadian – p.63/140
Median Survival Time ASI
Hazard Kumulatif ASI
1.0
Cumulative Hazard Function 7
0.8
6
0.6
5
4
0.4
3
0.2
2
0.0
Cum Hazard
1
0
2
4
6
8
10
12
0 Survival Function -1
Censored 0
20
40
60
80
100
120
140
DURATION
Pengantar Analisis Antar Kejadian – p.64/140
Pengantar Analisis Antar Kejadian – p.65/140
Membandingkan Distribusi Survival
Membandingkan Distribusi Survival
Membandingkan dua populasi yang masing-masing mempunyai fungsi survival S1 (t) dan S2 (t)
Metode Non-parametrik Untuk data tidak tersensor
Hipotesis null: H0 : S1 (t) = S2 (t)
Wilcoxon (1945)
Hipotesis alternatif: H1 : S1 (t) > S2 (t) H1 : S1 (t) < S2 (t) H1 : S1 (t) 6= S2 (t)
Mann-Whitney (1947) Sign test (1977)
Pengantar Analisis Antar Kejadian – p.66/140
Pengantar Analisis Antar Kejadian – p.67/140
Membandingkan Distribusi Survival
Logrank Test
Metode Non-parametrik
Berdasarkan observed dan expected event pada setiap event-time
Untuk data tersensor Gehan’s generalized Wilcoxon test (1965) the Cox-Mantel test (Cox 1959, 1972; Mantel, 1966)
Untuk 2 grup Statistik penguji:
the logrank test (1972)
χ2 =
Peto and Peto’s generalized Wilcoxon test (1972) Cox’s F-test (1964)
(O1 − E1 )2 (O2 − E2 )2 + E1 E2
dengan χ2 ∼Chi-square(df=1)
Pengantar Analisis Antar Kejadian – p.68/140
Pengantar Analisis Antar Kejadian – p.69/140
Logrank Test
Logrank Test
Contoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20
Contoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20
H0 : S1 (t) = S2 (t) H1 : S1 (t) 6= S2 (t)
H0 : S1 (t) = S2 (t) H1 : S1 (t) 6= S2 (t)
t
Pengantar Analisis Antar Kejadian – p.70/140
dt
n1t
n2t
e1t
e2t
t : event-time dt : banyaknya event n1 , n2 : number at risk e1t , e2t : expected event
Pengantar Analisis Antar Kejadian – p.71/140
Logrank Test
Logrank Test 23
Contoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20
16
grup 1
18 20 24 15
H0 : S1 (t) = S2 (t) H1 : S1 (t) 6= S2 (t)
t 15 18 19 20 23
dt
n1t
n2t
e1t
e2t
18 19 19 20
t : event-time dt : banyaknya event n1 , n2 : number at risk e1t , e2t : expected event
t 15 18 19 20 23
dt
n1t
n2t
e1t
e2t
t : event-time dt : banyaknya event n1 , n2 : number at risk e1t , e2t : expected event
Pengantar Analisis Antar Kejadian – p.72/140
Logrank Test
t 15 18 19 20 23
dt 1
n1t 5
n2t 5
grup 2
Pengantar Analisis Antar Kejadian – p.73/140
Logrank Test
e1t
e2t
grup 1
grup 1
grup 2
grup 2
t : event-time dt : banyaknya event n1 , n2 : number at risk e1t , e2t : expected event
Pengantar Analisis Antar Kejadian – p.74/140
t 15 18 19 20 23
dt 1
n1t 5
n2t 5
e1t
e2t e1t = e2t =
n1t n1t +n2t n2t n1t +n2t
× dt × dt
Pengantar Analisis Antar Kejadian – p.75/140
Logrank Test
t 15 18 19 20 23
dt 1
n1t 5
n2t 5
Logrank Test
e1t 0,5
grup 1
grup 1
grup 2
grup 2
e2t 0,5 e1t = e2t =
n1t n1t +n2t n2t n1t +n2t
× dt × dt
t 15 18 19 20 23
dt 1 1
n1t 5 4
n2t 5 4
e1t 0,5 0,5
e2t 0,5 0,5
Pengantar Analisis Antar Kejadian – p.76/140
Logrank Test
t 15 18 19 20 23
dt 1 1 2
n1t 5 4 3
n2t 5 4 3
Pengantar Analisis Antar Kejadian – p.77/140
Logrank Test
e1t 0,5 0,5 1,0
grup 1
grup 1
grup 2
grup 2
e2t 0,5 0,5 1,0
t 15 18 19 20 23
Pengantar Analisis Antar Kejadian – p.78/140
dt 1 1 2 1
n1t 5 4 3 3
n2t 5 4 3 1
e1t 0,5 0,5 1,0 0,75
e2t 0,5 0,5 1,0 0,25
Pengantar Analisis Antar Kejadian – p.79/140
Logrank Test
t 15 18 19 20 23
dt 1 1 2 1 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
Logrank Test
e1t 0,5 0,5 1,0 0,75 1,0
grup 1
Contoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20
grup 2
H0 : S1 (t) = S2 (t) H1 : S1 (t) 6= S2 (t)
t 15 18 19 20 23
e2t 0,5 0,5 1,0 0,25 0
dt 1 1 2 1 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0 3,75
e2t 0,5 0,5 1,0 0,25 0 2,25
Pengantar Analisis Antar Kejadian – p.80/140
Pengantar Analisis Antar Kejadian – p.81/140
Logrank Test
Logrank Test
Contoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20
Contoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20
H0 : S1 (t) = S2 (t) H1 : S1 (t) 6= S2 (t)
H0 : S1 (t) = S2 (t) H1 : S1 (t) 6= S2 (t)
t 15 18 19 20 23
dt 1 1 2 1 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0 3,75
e2t 0,5 0,5 1,0 0,25 0 2,25
E1 = 3, 75 E2 = 2, 25
Pengantar Analisis Antar Kejadian – p.82/140
t 15 18 19 20 23
dt 1 1 2 1 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0 3,75
O1 = 1 O2 = 5
e2t 0,5 0,5 1,0 0,25 0 2,25
E1 = 3, 75 E2 = 2, 25
Pengantar Analisis Antar Kejadian – p.83/140
Logrank Test
Logrank Test
Contoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20
Contoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20
H0 : S1 (t) = S2 (t) H1 : S1 (t) 6= S2 (t)
H0 : S1 (t) = S2 (t) H1 : S1 (t) 6= S2 (t)
t 15 18 19 20 23
dt 1 1 2 1 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0 3,75
e2t 0,5 0,5 1,0 0,25 0 2,25
E1 = 3, 75 E2 = 2, 25 O1 = 1 O2 = 5
t 15 18 19 20 23
dt 1 1 2 1 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
Logrank Test
Model Regresi
Contoh: grup 1: 23, 16+, 18+, 20+, 24+ grup 2: 15, 18, 19, 19, 20
Data ASI (penyapihan)
t 15 18 19 20 23
dt 1 1 2 1 1
n1t 5 4 3 3 2
n2t 5 4 3 1 0
e1t 0,5 0,5 1,0 0,75 1,0 3,75
e2t 0,5 0,5 1,0 0,25 0 2,25
χ2
= = =
e2t 0,5 0,5 1,0 0,25 0 2,25
χ2
= = =
(O1 − E1 )2 (O2 − E2 )2 + E1 E2 (5 − 2, 25)2 (1 − 3, 75)2 + 3, 75 2, 25 5, 378
Pengantar Analisis Antar Kejadian – p.85/140
Pengantar Analisis Antar Kejadian – p.84/140
H0 : S1 (t) = S2 (t) H1 : S1 (t) 6= S2 (t)
e1t 0,5 0,5 1,0 0,75 1,0 3,75
(O1 − E1 )2 (O2 − E2 )2 + E1 E2 (1 − 3, 75)2 (5 − 2, 25)2 + 3, 75 2, 25 5, 378
p-value= 0, 0204 < 0, 05
Pengantar Analisis Antar Kejadian – p.86/140
Pengantar Analisis Antar Kejadian – p.87/140
Model Regresi
Model Regresi
Data ASI (penyapihan)
Data ASI (penyapihan)
variabel respon : Lama periode menyusui (minggu) dan status menyusui (disapih atau belum)
variabel respon : Lama periode menyusui (minggu) dan status menyusui (disapih atau belum)
variabel penjelas: ras (kulit putih, hitam, yang lain); tingkat kemiskinan, perokok atau tidak, peminum atau tidak, usia ibu (saat melahirkan), pendidikan ibu, pemeriksaan kehamilan
variabel penjelas: ras (kulit putih, hitam, yang lain); tingkat kemiskinan, perokok atau tidak, peminum atau tidak, usia ibu (saat melahirkan), pendidikan ibu, pemeriksaan kehamilan
Bagaimana pengaruh variabel penjelas terhadap variabel respon?
Pengantar Analisis Antar Kejadian – p.88/140
Model Regresi
Pengantar Analisis Antar Kejadian – p.89/140
Model Regresi Parametrik
Model Regresi untuk data antar kejadian:
AFT (accelerated failure-time model)
Model Regresi Parametrik
model linear dalam log durasi (lama antar kejadian)
Regresi Cox
model hazard proporsional
Model Hazard Aditif
Pengantar Analisis Antar Kejadian – p.90/140
Pengantar Analisis Antar Kejadian – p.91/140
Model Regresi Parametrik
Model AFT
Representasi fungsi hazard AFT
Model AFT dapat ditulis sebagai fungsi hazard atau survival
h(t | X) = h0 (exp(Xβ)t) exp(Xβ)
dengan X adalah matriks (n × p) dari variabel penjelas; β T = (β1 . . . βp ) adalah vektor (p × 1) parameter regresi.
H(t | x) = H0 (exp(xβ)t),
untuk semua t
S(t | x) = S0 (exp(xβ)t),
untuk semua t
atau
Representasi log T
dengan H0 adalah baseline fungsi hazard kumulatif dan S0 baseline fungsi survival
log T = µ + Xα + σǫ
dengan αT = (α1 . . . αp ) dan µ adalah parameter regresi; ǫ adalah suku error berdistribusi tertentu dan σ > 0 adalah suatu parameter skala.
Pengantar Analisis Antar Kejadian – p.93/140
Pengantar Analisis Antar Kejadian – p.92/140
Model AFT
Fungsi Survival Model AFT, Eksponensial (λ = 0,9):
Fungsi hazard Model AFT, Eksponensial (λ = 0,9):
1.0
3.0
Model AFT
2.5
h(t | x) = h0 (t)x = xλ
0.4
hazard dipercepat
survival diperlambat
0.0
survival dipercepat 0
1
2
3
4
5
Survival dipercepat: S(t | 2) = exp(−2λt)
t
1.0
hazard diperlambat: h(t | 0,5) = 0,5λ
hazard diperlambat
0.5
baseline survival
baseline hazard
0.0
0.2
Survival diperlambat: S(t | 0,5) = exp(−0,5λt)
Baseline hazard: h0 (t) = λ
1.5
S(t)
0.6
Baseline survival: S0 (t) = exp(−λt)
h(t)
2.0
0.8
S(t | x) = S0 (xt) = exp(−xλt)
0
1
2
3
4
hazard dipercepat: h(t | 2) = 2λ
t Pengantar Analisis Antar Kejadian – p.94/140
Pengantar Analisis Antar Kejadian – p.95/140
Model AFT
Fungsi Survival Model AFT, Weibull(λ = 1, α = 0,5):
Fungsi hazard Model AFT, Weibull(λ = 1, α = 0,5): 4
1.0
Model AFT
3
h(t | x) = h0 (xt)x = αλx(xλt)α−1 Baseline hazard: h0 (t) = αλ(λt)α−1
0.4
2
S(t)
0.6
Baseline survival: S0 (t) = exp(−(λt)α )
survival diperlambat
h(t)
0.8
S(t | x) = S0 (xt) = exp(−(xλt)α )
0.2 0.0
survival dipercepat
0
1
2
3
4
Survival dipercepat: S(t | 3) = exp(−(3λt)α )
hazard diperlambat: h(t | 0,3) = αλ0,3(0,3λt)α−1
1
hazard diperlambat
baseline hazard hazard dipercepat 0
Survival diperlambat: S(t | 0,3) = exp(−(0,3λt)α )
baseline survival
0
1
2
t
3
4
hazard dipercepat: h(t | 3) = αλ3(3λt)α−1
t Pengantar Analisis Antar Kejadian – p.96/140
Pengantar Analisis Antar Kejadian – p.97/140
Estimasi Parameter
Estimasi Parameter
Data: (ti , δi , xi ), i = 1, 2, . . . , n yang independen satu sama lain
Fungsi likelihood untuk data tersensor kanan
dengan ti adalah durasi atau waktu antar kejadian ( 0 jika i tersensor δi = 1 jika i mendapatkan kejadian (event)
L(θ) ∝
xi = x1i . . . xpi adalah vektor variabel penjelas untuk
subyek (individu) i
Pengantar Analisis Antar Kejadian – p.98/140
n Y i=1
f (ti , θ | xi )δi S(ti , θ | xi )1−δi
dengan θ = (θ1 , . . . , θp ) adalah p parameter yang akan diestimasi; f (ti , θ | xi ) adalah fungsi densitas untuk i yang mendapatkan kejadian dan mempunyai variabel penjelas xi ; S(ti , θ) | xi adalah fungsi survival untuk i yang tidak mendapatkan kejadian (tersensor kanan) dan mempunyai variabel penjelas xi .
Pengantar Analisis Antar Kejadian – p.99/140
Estimasi Parameter
Estimasi Parameter
Contoh Data: Data 90 laki-laki yang terdiagnosis kanker larynx (library KMsurv dalam R). stage time age diagyr delta
: : : : :
Stage of disease (1=stage 1, 2=stage 2, 3=stage 3, 4=stage 4) Time to death or on-study time, months Age at diagnosis of larynx cancer Year of diagnosis of larynx cancer Death indicator (0=alive, 1=dead)
Pengantar Analisis Antar Kejadian – p.101/140
Pengantar Analisis Antar Kejadian – p.100/140
Hazard Proporsional
Kurva survival untuk model eksponensial dengan dua nilai λ yang berbeda
Misalkan ada dua orang yang masing-masing mempunyai hazard λ1 = 0, 1 dan λ2 = 0, 3
0.6
hazard ratio: 0,3 λ2 λ1 = 0,1 = 3
0.4
λ = 0.1 λ = 0.3
0.0
0.2
S(t)
0.8
1.0
Hazard Proporsional
10
20
30
40
20
30
40
0.2
λ = 0.3 λ = 0.1
0.0
h(t)
0.4
0
0
10
t
Pengantar Analisis Antar Kejadian – p.102/140
Pengantar Analisis Antar Kejadian – p.103/140
Hazard Proporsional
Cox’s Regression Model
Misalkan ada dua orang yang masing-masing mempunyai hazard λ1 = 0, 1 dan λ2 = 0, 3
Cox’s regression model atau Cox’s proportional hazards (Cox;1972,1975):
hazard ratio: 0,3 λ2 λ1 = 0,1 = 3
h(t | x) = h0 (t)ψ(x, β)
konstant, independen terhadap waktu
dengan x = (x1 , . . . , xp ) adalah vektor kovariat (variabel independen) dan β ′ = (β1 , . . . , βp ) adalah parameter dari model regresi
Pengantar Analisis Antar Kejadian – p.104/140
Pengantar Analisis Antar Kejadian – p.105/140
Cox’s Regression Model
Cox’s Regression Model
Cox’s regression model atau Cox’s proportional hazards (Cox;1972,1975):
Cox’s regression model atau Cox’s proportional hazards (Cox;1972,1975):
h(t | x) = h0 (t)ψ(x, β)
fungsi hazard bergantung pada x
=
baseline hazard × fungsi kovariat tdk bergantung pd x
h(t | x) = h0 (t)ψ(x, β)
fungsi hazard bergantung pada x
=
baseline hazard × fungsi kovariat tdk bergantung pd x
Bentuk fungsional dari ψ(x, β) ψ(x, β) = exp(xβ) ψ(x, β) = exp(1 + xβ) ψ(x, β) = log(1 + exp(xβ))
Pengantar Analisis Antar Kejadian – p.106/140
Pengantar Analisis Antar Kejadian – p.107/140
Cox’s Regression Model
Cox’s Regression Model
Cox’s regression model atau Cox’s proportional hazards (Cox;1972,1975):
Model: h(t | x) = h0 (t) exp(xβ)
h(t | x) = h0 (t)ψ(x, β)
fungsi hazard bergantung pada x
=
baseline hazard × fungsi kovariat tdk bergantung pd x
Misalkan: ( 0 x = 1
Bentuk fungsional dari ψ(x, β)
placebo obat baru
ψ(x, β) = exp(xβ) ψ(x, β) = exp(1 + xβ) ψ(x, β) = log(1 + exp(xβ))
Pengantar Analisis Antar Kejadian – p.108/140
Pengantar Analisis Antar Kejadian – p.109/140
Cox’s Regression Model
Cox’s Regression Model
Model:
Model: h(t | x) = h0 (t) exp(xβ)
h(t | x) = h0 (t) exp(xβ)
Hazard ratio:
Hazard ratio: h(t | x = 1) h(t | x = 0)
=
h0 (t) exp(1 × β) h0 (t) exp(0 × β)
h(t | x = 1) h(t | x = 0)
Pengantar Analisis Antar Kejadian – p.110/140
h0 (t) exp(1 × β) h0 (t) exp(0 × β) = exp(β)
=
Pengantar Analisis Antar Kejadian – p.111/140
Cox’s Regression Model
Cox’s Regression Model
Model:
Model: h(t | x) = h0 (t) exp(xβ)
h(t | x) = h0 (t) exp(xβ)
Hazard ratio:
Hazard ratio: h(t | x = 1) h(t | x = 0)
h(t | x = 1) h(t | x = 0)
h0 (t) exp(1 × β) h0 (t) exp(0 × β) = exp(β)
=
jika β = 0 ⇒ obat baru dan placebo sama efeknya
h0 (t) exp(1 × β) h0 (t) exp(0 × β) = exp(β)
=
jika β < 0 ⇒ obat baru memberikan efek yang lebih baik daripada placebo (resiko kematian lebih rendah)
Pengantar Analisis Antar Kejadian – p.112/140
Pengantar Analisis Antar Kejadian – p.113/140
Cox’s Regression Model
Cox’s Regression Model
Model:
Model: h(t | x) = h0 (t) exp(xβ)
h(t | x) = h0 (t) exp(xβ)
Hazard ratio: h(t | x = 1) h(t | x = 0)
Secara umum nilai estimasi β dapat digunakan untuk mengidentifikasi faktor resiko (risk factors, prognostic factors) yang berkaitan dengan variabel dependen time-to-event T .
h0 (t) exp(1 × β) h0 (t) exp(0 × β) = exp(β)
=
jika β > 0 ⇒ obat baru memberikan efek yang lebih buruk daripada placebo (resiko kematian lebih tinggi)
Pengantar Analisis Antar Kejadian – p.114/140
Pengantar Analisis Antar Kejadian – p.115/140
Estimasi untuk β
Cox’s Regression Model Model:
Parametrik: h0 (t) ditentukan dari distribusi probabilitas tertentu h(t | x) = h0 (t) exp(xβ)
Semi-Parametrik: Partial-likelihood Non-Parametrik: Smoothing, GAM
Dapat dituliskan dalam H(t | x) atau S(t | x) H(t | x) = H0 (t) exp(xβ)
S(t | x) = S0 (t)exp(xβ )
dengan H0 adalah baseline hazard kumulatif dan S0 adalah baseline survival
Pengantar Analisis Antar Kejadian – p.116/140
Partial likelihood
Pengantar Analisis Antar Kejadian – p.117/140
Partial likelihood
Cox (1972,1975): L(β) =
Y
k∈D
exp(xk β) j∈Rk exp(xj β)
ψ(1)
P
ψ(2)
x adalah vektor kovariat (variabel penjelas)
ψ(3)
β adalah parameter regresi yang akan diestimasi
ψ(4)
D adalah himpunan indeks j dari semua waktu kejadian (semua tj yang mendapatkan kejadian) Rk adalah himpunan resiko (risk set) , semua individu (subyek) yang belum mendapatkan kejadian pada saat tertentu
Pengantar Analisis Antar Kejadian – p.118/140
waktu
D = {1, 2, 3}
▽Pengantar Analisis Antar Kejadian – p.119/140
Partial likelihood
Partial likelihood
ψ(1)
ψ(1)
ψ(2)
ψ(2)
ψ(3)
ψ(3) ψ(1)+ψ(2)+ψ(3)+ψ(4)
ψ(4)
ψ(1) ψ(1)+ψ(2)
ψ(3)
ψ(3) ψ(1)+ψ(2)+ψ(3)+ψ(4)
ψ(4)
waktu
waktu
D = {1, 2, 3} R3 = {1, 2, 3, 4} R1 = {1, 2, }
D = {1, 2, 3} R3 = {1, 2, 3, 4}
▽Pengantar Analisis Antar Kejadian – p.119/140
Partial likelihood ψ(1)
Partial likelihood ψ(1)
ψ(1) ψ(1)+ψ(2)
ψ(2)
ψ(1) ψ(1)+ψ(2)
ψ(2)
ψ(2) ψ(2)
ψ(3)
▽Pengantar Analisis Antar Kejadian – p.119/140
ψ(3) ψ(1)+ψ(2)+ψ(3)+ψ(4)
ψ(4)
ψ(2) ψ(2)
ψ(3)
ψ(3) ψ(1)+ψ(2)+ψ(3)+ψ(4)
ψ(4)
waktu
waktu
D = {1, 2, 3} R3 = {1, 2, 3, 4} R1 = {1, 2, } R2 = {2}
D = {1, 2, 3} R3 = {1, 2, 3, 4} R1 = {1, 2, } R2 = {2} ▽Pengantar Analisis Antar Kejadian – p.119/140
▽Pengantar Analisis Antar Kejadian – p.119/140
Partial likelihood
Contoh Partial likelihood Diketahui data sebagai berikut:
ψ(1) ψ(2) ψ(3)
ψ(1) ψ(1)+ψ(2)
t
δ
x
ψ(2) ψ(2)
5
1
2,58
7
1
1,36
2
1
-0,54
4
0
3,30
ψ(3) ψ(1)+ψ(2)+ψ(3)+ψ(4)
ψ(4)
waktu
D = {1, 2, 3} R3 = {1, 2, 3, 4} R1 = {1, 2, } R2 = {2}
ψ(2) ψ(1) )( ) ψ(1) + ψ(2) ψ(2) ψ(3) ) ( ψ(1) + ψ(2) + ψ(3) + ψ(4)
L(β) = (
Pengantar Analisis Antar Kejadian – p.119/140
▽Pengantar Analisis Antar Kejadian – p.120/140
Contoh Partial likelihood
Contoh Partial likelihood
Diketahui data sebagai berikut:
Diketahui data sebagai berikut: ψ(1) = e2,58β
t
δ
x
t
δ
x
5
1
2,58
5
1
2,58
7
1
1,36
7
1
1,36
2
1
-0,54
2
1
-0,54
4
0
3,30
4
0
3,30
2
4
5
7
waktu
ψ(2) = e1,36β ψ(3) = e-0,54β ψ(4) = e3,30β
2
4
5
7
waktu
▽Pengantar Analisis Antar Kejadian – p.120/140
▽Pengantar Analisis Antar Kejadian – p.120/140
Contoh Partial likelihood
Contoh Partial likelihood
Diketahui data sebagai berikut:
Diketahui data sebagai berikut:
ψ(1) = e2,58β
t
δ
x
5
1
2,58
7
1
1,36
2
1
-0,54
4
0
3,30
ψ(1) ψ(1)+ψ(2)
ψ(2) = e1,36β ψ(3) = e-0,54β
t
δ
x
ψ(2) ψ(2)
5
1
2,58
ψ(3) ψ(1)+ψ(2)+ψ(3)+ψ(4)
7
1
1,36
2
1
-0,54
4
0
3,30
ψ(4) = e3,30β
2
4
5
ψ(1) = e2,58β
e2,58β e2,58β +e1,36β
ψ(2) = e1,36β
e1,36β e1,36β
ψ(3) = e-0,54β
e-0,54β e2,58β +e1,36β +e-0,54β +e3,30β
ψ(4) = e3,30β
7
2
waktu
4
5
7
waktu
▽Pengantar Analisis Antar Kejadian – p.120/140
Contoh Partial likelihood
▽Pengantar Analisis Antar Kejadian – p.120/140
Contoh Partial likelihood −1.5
Diketahui data sebagai berikut:
2,58
7
1
1,36
2
1
-0,54
4
0
3,30
ψ(2) = e1,36β
e1,36β e1,36β
ψ(3) = e-0,54β
e-0,54β e2,58β +e1,36β +e-0,54β +e3,30β
ψ(4) = e3,30β
−2.0 −2.5
1
−3.0
5
−4.0
x
2
4
5
−4.5
δ
log.likelihood(β)
t
e2,58β e2,58β +e1,36β
−3.5
ψ(1) = e2,58β
7
waktu
−3
−2
−1
Mencari penduga β yang memaksimalkan fungsi partial likelihood ψ(1) ψ(2) ψ(3) L(β) = ( )( )( ) ψ(1) + ψ(2) ψ(2) ψ(1) + ψ(2) + ψ(3) + ψ(4) Pengantar Analisis Antar Kejadian – p.120/140
0
1
β
L(β) =
e2,58β e2,58β + e1,36β
e2,58β
e-0,54β + e1,36β + e-0,54β + e3,30β
Pengantar Analisis Antar Kejadian – p.121/140
−2.0 −2.5 −3.0 −4.5
−4.0
−3.5
log.likelihood(β)
−2.5 −3.0 −3.5 −4.5
−4.0
log.likelihood(β)
−2.0
−1.5
Contoh Partial likelihood
−1.5
Contoh Partial likelihood
−3
−2
−1 −0.655
0
1
−3
β
L(β) =
e2,58β e2,58β + e1,36β
−2
−1 −0.655
0
1
β
e2,58β
e-0,54β + e1,36β + e-0,54β + e3,30β
Pengantar Analisis Antar Kejadian – p.122/140
Estimasi β yang memaksimalkan L(β) adalah ˆ(β) = -0,655 dengan nilai partial likelihood log(L(-0,655)) = -1,575, atau
L(-0,655) = 0,207
Contoh Partial likelihood
Contoh Partial likelihood
> X tt d x 1 5 1 2.58 2 7 1 1.36 3 2 1 -0.54 4 4 0 3.30 > coxph(Surv(tt,d)˜x,data=X) Call: coxph(formula = Surv(tt, d) ˜ x, data = X)
> m<-coxph(Surv(tt,d)˜x,data=X) > m$loglik [1] -2.079442 -1.574940
Pengantar Analisis Antar Kejadian – p.123/140
coef exp(coef) se(coef) z p x -0.655 0.519 0.718 -0.913 0.36 Likelihood ratio test=1.01
on 1 df, p=0.315
n= 4
Pengantar Analisis Antar Kejadian – p.124/140
Pengantar Analisis Antar Kejadian – p.125/140
Partial Likelihood dengan ties
Partial Likelihood dengan ties
Data: t1 < t2 < . . . < tn(D) dengan n(D) adalah banyaknya waktu t yang mendapatkan kejadian; dk adalah banyaknya kejadian saat tk (jika dk >1 dinamakan ties); Dk adalah himpunan P individu yang mendapatkan kejadian saat tk ; Sk = j∈D xj adalah jumlahan nilai variabel x pada saat tk .
Digunakan 3 metode: Breslow L(β) =
Y
k∈D
Efron L(β) =
Y
k∈D
Diskret t1
t2
t3
exp(Sk β) hP
j∈Rk exp(xj β)
idk
exp(Sk β) Qdk hP
i∈Rk exp(xi β) −
j=1
j−1 dk
P
i∈Dk exp(xi β)
i
t4
waktu
Pengantar Analisis Antar Kejadian – p.127/140
Pengantar Analisis Antar Kejadian – p.126/140
Non-proporsionalitas
Non-proporsionalitas 0.4 0.3
0.4 5
10
20
25
0
15 t
20
25
15
20
25
0
10
15
20
t Pengantar Analisis Antar Kejadian – p.128/140
25
15
20
25
15
20
25
5 2
h(t)=0,2
0
h(t)=0,1
0 5
10
h(t)=0.04*t
4
4 3 H(t)
h(t)=0,2
1
h(t)=0,2
0
5
t
2
0.2 10
10
5
1.0 0.6
S(t)
0.4
h(t)=0.04*t
0.0 5
5
t
0.8
1.0 0.8 0.6 0.4 0.2
h(t)=0,2
0.0
S(t)
15 t
h(t)=0,1
0
0.1
0.0 0
3
25
H(t)
20
1
15 t
h(t)=0.04*t
0.0
0.1
0.1
h(t)=0.04*t
0.0 10
0.2
h(t)
0.2
h(t)
0.2
h(t)
0.2 0.1
h(t)=0,1
0.0
5
h(t)=0,2
h(t)=0,2
h(t)=0,1
0
Hazard non-proporsional
0.3
0.3
0.3
h(t)=0,2
h(t)=0,2 h(t)
Hazard proporsional
0.4
Hazard non-proporsional
0.4
Hazard proporsional
0
5
10
15 t
20
25
0
5
10
t Pengantar Analisis Antar Kejadian – p.129/140
Stratifikasi
Cox’s Regression Model: R
Baseline hazard berbeda antar strata namun parameter β sama untuk tiap strata
Data ASI:
m1<-coxph(Surv(DUR,D)˜SMK+ALCO+race+PVTY, data=bfeed) summary(m1)
hj (t | x) = h0j exp(xβ)
dengan j = 1, . . . , s adalah banyaknya strata. Estimasi untuk β menggunakan partial likelihood ℓ(β) = ℓ1 (β) + ℓ2 (β) + . . . + ℓs (β)
dengan ℓj (β), j = 1, . . . , s adalah partial likelihood yang dihitung hanya pada subset data dalam strata ke-j .
Pengantar Analisis Antar Kejadian – p.130/140
Pengantar Analisis Antar Kejadian – p.131/140
Cox’s Regression Model: R
Cox’s Regression Model: SPSS
Data ASI:
Data ASI:
Call: coxph(formula = Surv(DUR, D) ˜ SMK + ALCO n= 927 coef exp(coef) se(coef) z SMK 0.288 1.33 0.0768 3.75 ALCO 0.141 1.15 0.1218 1.16 raceblack 0.178 1.19 0.1041 1.71 raceother 0.345 1.41 0.0950 3.63 PVTY -0.162 0.85 0.0882 -1.84
SMK ALCO raceblack raceother PVTY
+ race + PVTY, data = bfeed) p 0.00018 0.25000 0.08700 0.00029 0.06600
COXREG dur /STATUS=d(1) /CONTRAST (race)=Indicator(1) /METHOD=ENTER smk alco race pvty /PRINT=CI(95) .
exp(coef) exp(-coef) lower .95 upper .95 1.33 0.750 1.147 1.55 1.15 0.868 0.907 1.46 1.19 0.837 0.974 1.47 1.41 0.708 1.172 1.70 0.85 1.176 0.715 1.01
Pengantar Analisis Antar Kejadian – p.132/140
Pengantar Analisis Antar Kejadian – p.133/140
Cox’s Regression Model: SPSS
Cox’s Regression Model Kurva survival: status merokok
Data ASI:
,1578 ,3264 -,1480
,1041 ,0950 ,0882
Variable SMK ALCO RACE(1) RACE(2) PVTY
Exp(B) 1,3173 1,1450 1,1709 1,3859 ,8624
Wald 12,8651 1,2384 12,5149 2,2981 11,7917 2,8191
df 1 1 2 1 1 1
Sig ,0003 ,2658 ,0019 ,1295 ,0006 ,0932
R ,0322 ,0000 ,0285 ,0053 ,0305 -,0088
1.0
S.E. ,0768 ,1217
0.8
B ,2756 ,1354
tidak merokok merokok 0.6
Variable SMK ALCO RACE RACE(1) RACE(2) PVTY
Exp(B) Upper 1,5313 1,4534 1,4359 1,6697 1,0251
0.0
0.2
0.4
S(t)
95% CI for Lower 1,1331 ,9021 ,9548 1,1504 ,7256
0
20
40
60
80
bulan
Pengantar Analisis Antar Kejadian – p.134/140
Pengantar Analisis Antar Kejadian – p.135/140
Cox’s Regression Model
Proses Cacah
Kurva survival: status merokok, dengan memasukkan variabel lain
Proses cacah (counting process) dalam AAK: {N (t), Y (t), Z(t)}
1.0
2 1 0.8
N (t) 0
0.6
tidak merokok merokok
0.4
S(t)
Y (t)
1
0.2
0
0.0
Z(t)
0
20
40
60
80
t
bulan
Pengantar Analisis Antar Kejadian – p.136/140
Pengantar Analisis Antar Kejadian – p.137/140
Proses Cacah
Proses Cacah
Proses cacah (counting process) dalam AAK: {N (t), Y (t), Z(t)}
Model hazard multiplikatif Data: {Ni (t), Yi (t), Z i (t)}, t ≥ 0 untuk individu ke-i, i = 1, 2, . . . , n
2 1
Yi (t)h(t | Z i (t)) = Yi (t)h0 (t) exp(Z i (t)β)
N (t) 0 Y (t)
dengan Yi (t) adalah proses resiko saat t
1
( 1 Yi (t) = 0
0
Z(t)
jika i beresiko untuk mendapat kejadian jika i tidak beresiko untuk mendapat kejadian
dan Z i (t) adalah nilai variabel penjelas individu i saat t
t Pengantar Analisis Antar Kejadian – p.138/140
Proses Cacah Partial likelihood untuk n individu L(β) =
n Y Y i=1 t≥0
(
dengan ( 1 ∆Ni (t) = 0
Y (t) exp(Z i (t)β) Pin j=1 exp(Z j (t)β)
)∆Ni (t)
jika Ni (t) − Ni (t−) = 1 yang lain
Dalam praktek ∆Ni (t) adalah indikator δi dalam data survival (indikator apakah individu mendapatkan kejadian atau tidak)
Pengantar Analisis Antar Kejadian – p.140/140
Pengantar Analisis Antar Kejadian – p.139/140