11.Négymezős táblázatok Egyezés mérése: kappa statisztika Kockázat becslés: esélyhányados (OR) Kockázat becslés: relatív kockázat (RR)
Az egyezés mérése:Cohen’s Kappa
Kappa: az egyezés mérése két nominális (bináris) változó között. Jacob Cohen (1923 – 1998).
H0: =0 HA: 0
2
Megfigyelt gyakoriságok Teszt 1 Teszt II
Pozitív Negatív Total
Positív
Negatív
Total
a
b
R1=a+b
R1/N
c
d
R2=c+d
R2/N
N
N
C1=a+c
C2=b+d
C1/N
C2/N
Egyezések . Teszt I pozitív és negatív eredményeinek valószínűsége C1/N és C2/N Teszt II pozitív és negatív eredményeinek valószínűsége:R1/N és R2/N ad Megfigyelt egyezési valószínűség: pobs=(a+d)/N p O
N
3
Várt gyakoriságok
A valószínűségi függetlenség alapján :
aˆ R1 C1 P( AB) P( A) P( B) N N N
Test I
Pozitív Pozitív Negatív
aˆ
R1 C1 N N N
A várt egyezési valószínűség :
Negatív R C dˆ 2 2 N N N
aˆ dˆ pE N 4
Cohen’s kappa pobserved
ad N
P( AB) P( A) P( B)
aˆ dˆ pE N
pO pE 1 pE
aˆ R1 C1 RC (a b)( a c) aˆ 1 1 aˆ N N N N N
(c d )(b d ) P( AB) P( A) P( B) dˆ N
Standard error (SE) :
l Si Z i 1 2 se( ) p p { S Z } E E i i 2 (1 pE ) N i 1 N
A teszt statisztika
se ( )
2
² eloszlás 1 df.
²táblázat(α=0,05; FG=1)–érték = 3.841 (=1.96²) 5
Kappa tulajdonságai (Fleiss) Kiváló (jó) egyezés
:
κ0,75
Közepes egyezés
:
0,4κ<0,75
Gyenge egyezés
:
κ<0,4
Megjegyzés: Létezik ötfokozatú bosztás is. 6
Az adat táblázat
7
Példa
Ditchburn and Ditchburn(1990) Üledékes vizsgálat alapján 229 gennyes vizeletet vizsgáltak mikrobiológiai laboratóriumban a standardnak tekintett tenyésztéssel, és egy „gyors”- teszttel. A vizsgálatok eredményeit szintén négymezős táblázatban összefoglalva kapjuk: Tenyésztés
“Gyors” teszt
Pozitív
Negatív
Összesen
Pozitív
84
43
127
Negatív
10
92
102
Összesen 94 135 a d 84 92 pO 0,77 N 229
229
8
Várt gyakoriság
Megoldás:
aˆ C1 R1 94 127 P( AB) P( A) P( B) * 229 52,131 N N N 229 229
Tenyésztés Pozitív Negatív
“Gyors” teszt Pozitív Negatív
74,869
52,131 41,869
a d 84 92 pO 0,77 N 229
60,131
aˆ dˆ 52,131 60,131 pE 0,49 N 229
pO pE 0,546 1 pE
0,4< κ=0,546 <0,75 → közepes egyezés. 9
Altman DG, Bland JM. Statistics Notes: Diagnostic tests : sensitivity and specificity BMJ 1994; 308 : 1552
Megfigyelt gyakoriságok
Patológia
pozitív
negatív
Össz
pozitív
231
32
263
negatív
27
54
81
Összesen
258
86
344
Ultrahang
10
Várt gyakoriságok R1C1 aˆ R1 C1 ˆ P( AB) P( A) P( B) a N N N N
aˆ ˆ d
=(263/344)*(258/344)*344=197,25 =(81/344)*(86/344)*344=20,25 Patológia Ultrahang
pozitív
pozitív 197,25
negatív (-) Összesen
negatív
258
Össz 263
20,25
81
86
344
11
Cohen’s kappa
Megfigyelt és várt egyezési valószínűségek pObs 0,828 pExp 0,63 Cohen’s kappa (κ)=0,53. 0,4<κ≤0,75 -> közepes egyezés
pobs
a d 231 54 0,828 N 344
aˆ dˆ 197 ,25 20,25 pE 0,63 N 344
pobs pE 0.828 0.632 0,53 1 pE 1 0.632 12
Példa Egy vizsgálatban a megfigyelt ( pO=0,85) és várt (pE=0,5) valószínűségeket megadták. Számoljuk ki az egyezés mértékét (kappát)! Megoldás:
H0: =0 HA: 0
Közepes egyezés : 0,4<κszámított=0,7<0,75
pO pE 0,85 0,5 0,35 0,7 1 pE 1 0,5 0,5 13
Vizsga feladat
Egy diagnosztikus tesztnél a 300 vizsgálatból 270 valódi pozitív és 30 valódi negatív eredményt találtak. Mekkora a módszer pozitív prediktív értéke? Számítsa ki a kappa értékét!
14
Megoldás
Az adatok alapján: PPV=a/(a+b)=270/270=1
PO=(a+d)/N=(270+30)/300=1 PE=(E(a)+E(d))/N=(243+3)/300=246/300=0,82
E(a)=(270*270)/300=243 és E(d)=(30*30)/300=3 Kappa=(1-0,82)/(1-0,82)=1 Teszt I Teszt II
pozitív
negatív
Össz
pozitív
a=270
0
270
negatív
0
d=30
30
270
30
300
Összesen
15
Odds ratio Esélyhányados
Mérőszámok Új esetek száma a vizsgált periódusba n incidencia A kockázatnak kitett populáció száma a vizsgálat kezdetén Azaz a vizsgált betegség egy adott(érintett) populációbeli előfordulási gyakoriságát az adott időtartam alatt incidenciának nevezzük.
A létező esetek száma prevalenci a Az érintett populáció száma
a vizsgált időpontban.
Azaz a vizsgált betegség egy adott(érintett) populációbeli előfordulási gyakoriságát a vizsgált időpontban prevalenciának nevezzük.
Megjegyzés: a prevalenciát becsülhetjük az incidencia értékkel. 17
(Epidemiológiai) vizsgálatok típusai ESETKONTROLL Kockázati tényező ?
Kockázati tényező ?
Időben VISSZAMENVE
vizsgálja a kockázati tényezőt
KOHORSZ
ESET
EXPONÁLT
Megbetegedés ?
KONTROLL
NEM EXPONÁLT
Megbetegedés ?
Kiindulva a jelenből
Időben ELŐRE HALADVA vizsgálja a betegség fellépését
18
Mérőszámok
Kohorsz Incidencia Relatív kockázat (RR)
Eset-Kontroll Esélyhányados (odds ratio)
Keresztmetszeti Prevalencia Esélyhányados (odds ratio) 19
Kohorsz vizsgálatok
Egy populációból vagy annak egy reprezentatív mintájából indul ki és a betegség és a kockázati tényező együttes jelenlétét vizsgálja minden egyes egyén estében a vizsgálat időpontjában. Időben ELŐRE HALADVA vizsgálja a kockázati tényező hatását a betegség kialakulására Kiinduláskor minden személy mentes a vizsgált betegségtől. Csak az exponáltság (kockázati tényező) megléte vagy nem léte ismert. A betegség kialakulásakor „válik szét” a „beteg” és kontroll csoport Incidenciát csak kohorsz vizsgálatban tudunk mérni!!! 20
Eset-kontroll vizsgálatok
Időben VISSZAMENVE vizsgálja a kockázati tényező hatását a betegség kialakulására.
Már ismert a diagnózis, így az „eset” csoportba kerülnek az adott betegségben szenvedők, és a feltételezett „rizikó tényező(k)” hatását vizsgálja a megfelelően kiválasztott kontroll csoporthoz viszonyítva.
21
Keresztmetszeti vizsgálatok
Egy populációból vagy annak egy reprezentatív mintájából indul ki és a betegség és a kockázati tényező együttes jelenlétét vizsgálja minden egyes egyén estében a vizsgálat időpontjában. Csak a vizsgált tényező időpontbeli gyakoriságai mérhetők és azok összefüggései elemezhetők, a keresztmetszeti vizsgálatokat szokás prevalencia vizsgálatoknak is nevezni. Tisztázatlan eredetű megbetegedések – elsősorban fertőző megbetegedések – rövid idő alatti halmozódása esetén Etiológiai hipotézisek felállításához vezethet, amely hipotézisek tesztelése azután eset–kontroll vagy kohorszvizsgálatban történhet. 22
Esélyhányados és a relatív kockázat Az esélyhányados (OR) az exponáltság és a nem exponáltság esélyarányát méri össze az esetcsoport (a : b) és a kontrollcsoport (c : d) vonatkozásában Relatív kockázat (RR) csak prospektív (kohorsz) vizsgálatokban mérhető, a p1, p2 valószínűségek(incidenciák) hányadosa. Véletlen (=nincs) kockázat esetén mind az OR, mind a RR 1-gyel egyenlő. Döntés: 95%-os konfidencia intervallummal
23
Az esély (esélyérték, odds) valószínűségszámítási fogalma
Ha az A esemény valószínűsége P(A), akkor az A esemény bekövetkezésének esélye: Odds( A )
P( A) P( A) P( A ) 1 P( A)
amely megadja, hogy mennyiszer valószínűbb az A esemény bekövetkezése a be nem következés valószínűségéhez viszonyítva. Kiszámítása klasszikus valószínűség esetén: „kedvező” esetek száma osztva a „kedvezőtlen” esetek számával 24
A négymezős gyakorisági táblázat Megbetegedés Kockázati tényező:
Összesen
Igen
Nem
Igen
a
b
a+b
Nem
c
d
c+d
a+c
b+d
N
Összesen
a ad b OR( EH ) c bc d
a /(a b) RR c /(c d )
SE( OR)
1 1 1 1 a b c d
1 1 1 1 SE( RR) a ab c cd
LN(OR)1,96
95% KI = e LN(RR)1,96
95% KI = e
1 1 1 1 a b c d
1 1 1 1 a a b c c d
25
Esélyhányados (Odds ratio) Eset-kontroll (vagy keresztmetszeti) vizsgálatokban egy kiválasztott „rizikó” tényező (pl.: dohányzás) adott (vizsgált) betegség kialakulására vonatkozó kockázatát adja meg. H0: OR=1 (esélyhányados a populációban1 ) HA: OR1
26
Példa A dohányzás hatását vizsgálták a cervix HPV fertőzés kialakulásánál. H0: OR=1 HA: OR1
HPV Igen
Nem
Dohányzás Igen
56
143
199
Nem
90
438
528
146
581
727
Total
ad 56 * 438 OR 1,91 cb 90 *143
SE ( OR)
Total
1 1 1 1 0, 20 56 143 90 438 27
Eredmények ad 56 * 438 OR 1,91 cb 90 *143
95% CI = 2,718
SE ( OR)
1 1 1 1 0, 20 56 143 90 438
ln (1.91) 1.96 1 1 1 1 56 143 90 438
1,30 ; 2,80
Az OR=1,91 és 95% konfidencia intervallum (95%KI) [1,30 – 2.80] NEM tartalmazza 1-t, így HA –t fogadjuk el. Azaz 1,9 szeres kockázat a dohányosoknál a cervix HPV fertőzés kialakulása.
28
Példa Középiskolások körében vizsgálták a drog kipróblás lehetséges kockázati tényezőit .
29
SPSS Eredmény row * column Crosstabul ation Count column 1,00 row
1,00 2,00
2,00 13 20 33
Total
37 190 227
Total 50 210 260
Risk Esti mate
Value Odds Rat io f or row (1,00 / 2,00) For cohort column = 1,00 For cohort column = 2,00 N of Valid Cases
95% Conf idence Interv al Lower Upper
3,338
1,527
7,296
2,730 ,818 260
1,459 ,690
5,108 ,970
30
Számolás H0: OR=1 HA: OR1
row * column Crosstabul ation
SE ( OR )
Count
1 1 1 1 0.399 13 37 20 190
column 1,00 row Total
1,00 2,00
2,00 13 20 33
37 190 227
Total 50 210 260
OR=(13*190)/ (37*20)=3,337 ln(OR)=1,205 SE=0,399 Alsó határ =exp(1,205–1,96*0,399)=1,5269 Felső határ=exp(1,205+1,96*0,399)=7,296 Mivel a 95% konfidencia intervallum [1,53 – 7,29] –on kívül esik az 1, így HA –t fogadjuk el . 31
Példa
A szívkoszorúér megbetegedés kialakulásának kockázatát vizsgálták 906 önkéntesnél, akik közül 479 dohányzott. Dohányzik * Szívkoszorúér betegség Crosstabulation Count
Dohányzik Total
Nem Igen
Szívkos zorúér betegs ég Nem Igen 394 56 33 423 427 479
Total 450 456 906 32
SPSS eredmény
H0: OR=1 HA: OR1
Dohányzik * Szívkoszorúér betegség Crosstabulation Count
Dohányzik
Nem Igen
Total
Szívkos zorúér betegs ég Nem Igen 394 56 33 423 427 479
Total 450 456 906
Risk Estimate
Value Odds Ratio for Dohányzik (Nem / Igen) For cohort Szívkoszorúér betegs ég = Nem For cohort Szívkoszorúér betegs ég = Igen N of Valid Cases
95% Confidence Interval Lower Upper
90,185
57,419
141,648
12,099
8,694
16,836
,134
,105
,172
906
OR=(423*394)/ (56*33)=90,185 ln(OR)=4,501 SE=0,23 Alsó határ =exp(4,501–1,96*0,23)=57,41 Felső határ=exp(4,501+1,96*0,23)=141,648 Mivel a 95% konfidencia intervallum [57,4 – 141,6] –on kívül esik az 1, így HA –t fogadjuk el. 33
Relative Risk (RR) Relatív Kockázat
Null – és alternatív hipotézis H0: RR=1 HA: RR1
35
Relatív kockázat (Relative risk) Kockázati tényező
Van Nincs Összesen RR
I exp I nem exp
95% CI = e
a /( a b) c /(c d )
Diagnózis Pozitív Negatív Összesen a b a+b c d c+d a+c b+d n=a+b+c+d SE ( RR )
1 1 1 1 a ab c cd
ln ( RR ) 1.96 1 1 1 1 a a b c c d
, ahol e 2,718 36
Kockázat becslés kohorsz vizsgálatban
Egy kohorsz vizsgálatban a dohányzás kockázatát vizsgálták a tüdőrák kialakulására. Az összegyűjtött adatokat a következő táblázatban foglalták össze. (Forrás: MASD’93, UK) Számoljuk ki a dohányzás relatív kockázatát a betegség kialakulásában! Tüdőrák
Igen
Nem
Összesen
Incidencia
Dohányzik
39
29961
30000
39/30000=1,30
Nem-dohányzik
6
59994
60000
6/60000=0,10
Összesen
45
89555
90000
A relatív kockázat(relative risk /RR/)=13,0 (1,30/0,10)
37
Relatív kockázat (RR) Betegség Igen Nem Összesen Dohányzik 39 29961 30000 Nem dohányzik 6 59994 60000 Total 45 89955 90000 RR
a /(a b) 39 / 30000 13,0 c /(c d ) 6 / 60000
95% KI = 2,718
SE( RR)
1 1 1 1 0,438 39 30000 6 60000
ln (13.0 ) 1.96 1 1 1 1 39 30000 6 60000
alsó határ 2.718ln(13.0)1.96*0.438 5.504
felső határ 2.718ln(13.0)1.96*0.438 30.70
38
Relatív kockázat /Relative risk (RR)/
H0: RR=1 HA: RR1 I exp a /( a b) RR 13,0 RR= I nem exp c /(c d ) Konfidencia intervallum (RR – hez számított): 95% KI = e
ln ( RR ) 1.96 1 1 1 1 a a b c c d
, és e 2,718
Példánkban RR=13,0 és a 95% konfidencia intervallum [5,5 – 30,7]. NEM tartalmazza 1-t, így HA –t fogadjuk el. Azaz 13 – szor (szignifikánsan) magasabb a tüdőrák kockázata a dohányosoknál a nem dohányosokhoz viszonyítva. 39
Kérdések
Melyik statisztikát használjuk az egyezés mérésére? A kappa=0,3 érték esetén az egyezés mértéke...... Hogyan számoljuk ki a megfigyelt valószínűséget (pO) az egyezés méréséhez (a kappához)? Eset-kontroll vizsgálatoknál a betegségre vonatkozólag milyen kockázat becslést számolunk, azaz mi a próba statisztika neve? Kohorsz vizsgálatoknál a betegségre vonatkozólag milyen kockázat becslést számolunk, azaz mi a próba statisztika neve? Keresztmetszeti vizsgálatoknál a betegségre vonatkozólag milyen kockázat becslést számolunk, azaz mi a próba statisztika neve? A kohorsz vizsgálat definiciója Az eset-kontroll vizsgálat definiciója A keresztmetszeti vizsgálat definiciója Mi az esélyhányadosra (odds ratio) vonatkozó nullhipotézis? Mi az relatív kockázatra (relative risk) vonatkozó nullhipotézis? Mi az egyezés mérésére (kappa) vonatkozó nullhipotézis? Mi az esélyhányadosra (odds ratio) vonatkozó alternatív hipotézis? Mi az relatív kockázatra (relative risk) vonatkozó alternatív hipotézis? Mi az egyezés mérésére (kappa) vonatkozó alternatív hipotézis? Egy vizsgálatban a megfigyelt ( pO=0,85) és várt (pE=0,5) valószínűségeket megadták. Számoljuk ki az egyezés mértékét (kappát)! Egy tanulmányban 50 pozitív méhnyak kenetből 40 HPV pozitív fertőzést diagnosztizáltak, míg 60 normál méhnyak kenetből 10 HPV pozitív fertőzést. Számítsa ki az esélyhányadost a HPV fertőzés kockázatára pozitív cytológia esetén! Egy tanulmányban 20 pozitív méhnyak kenetből 8 HPV pozitív fertőzést diagnosztizáltak, míg 20 normál méhnyak kenetből 10 HPV pozitív fertőzést. Számítsa ki az esélyhányadost a HPV fertőzés kockázatára pozitív cytológia esetén! Egy tanulmányban a dohányzás kockázatát vizsgálták a HPV fertőzés kialakulására. A kockázat mérésére 1,58 értéket (odds ratio) kaptak, és a 95%KI [1,061 - 2,398]. Ezek alapján .... hipotézist fogadjuk el. Egy tanulmányban a dohányzás kockázatát vizsgálták a HPV fertőzés kialakulására. A kockázat mérésére 1,58 értéket (odds ratio) kaptak ,és a 95%KI [0,961 - 2,598].. Ezek alapján .... hipotézist fogadjuk el. Egy diagnosztikus tesztnél a 300 vizsgálatból 270 valódi pozitív és 30 valódi negatív eredményt találtak. Számítsa ki a kappa értékét!
40