Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Hana Tomášková (Ing. Ph.D.) Přírodovědecká fakulta, katedra informatiky
[email protected] konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik
Obsah přednášky 3: • Senzitivita a specificita, prediktivní hodnota • Normální rozdělení – vlastnosti, příklad • Výpočet intervalů spolehlivosti • Velikost výběru
Senzitivita a specificita Označení výsledků diagnostické testu ve vztahu k diagnóze Skutečnost Výsledek test Nemocný Zdravý (N+) (N -) Pozitivní (T+) SP FP Negativní (T -) FN SN SP-správně pozitivní, FP – falešně poz., FN – falešně negativní, SN – správně neg.
• Senzitivita – pravděpodobnost pozitivního výsledku testu u osoby s nemocí P(T+|N+) = SP/(SP +FN) • Specificita – pravděpodobnost negativního výsledku testu u osoby bez nemocí P(T -|N -) = SN/(SN +FP)
Prediktivní hodnota • Pokud je v testovacím souboru stejné zastoupení nemocných osob, jaký je jejich podíl v populaci, potom platí pro výpočet prediktivních hodnot následující vztahy: • Pozitivní prediktivní hodnota – pravděpodobnost, že osoba s pozitivním výsledkem testu má nemoc P(N+|T+) = SP/(SP +FP) • Negativní prediktivní hodnota – pravděpodobnost, že osoba s negativním výsledkem testu je bez nemocí P(N-|T-) = SN/(SN +FN) Výsledek test
Skutečnost Nemocný (N+)
Zdravý (N -)
Pozitivní (T+)
SP
FP
Negativní (T -)
FN
SN
Věta o úplné pravděpodobnosti • • •
Ai ∩ Aj = ∅
i ≠ j,
i, j = 1,2, … , k
A1 ∪ A2 ∪ … ∪ Ak = U
P( Ai ) > 0
P (C ) =
k
∑ P (C | A ) i
i =1
⋅ P ( Ai )
Bayesova věta: P (Aj | C ) =
P (C | Aj ) ⋅ P (Aj ) k
∑ P (C | A ) i
⋅ P ( Ai )
i =1
P (Aj ∩ C ) = P ( Aj | C ) ⋅ P (C ) = P (C | Aj ) ⋅ P (Aj ) P ( Aj | C ) =
P (C | Aj ) ⋅ P (Aj ) P (C )
Bayesův vzorec Pokud v testovacím je jiný podíl nemocných osob, než je jejich zastoupení v populaci, tak se pro prediktivní hodnotu musí použít Bayesův vzorec se skutečnou prevalencí nemoci. Bayesův vzorec pro pozitivní prediktivní hodnotu: + + + + + P T N P T N P N ( ∩ ) ( | ). ( ) P (N + | T + ) = = P (T + ) P (T + | N + ).P (N + ) + P (T + | N − ).P (N − ) Bayesův vzorec pro negativní prediktivní hodnotu: P (T − ∩ N − ) P (T − | N − ).P (N − ) − − P (N | T ) = = − P (T ) P (T − | N − ).P (N − ) + P (T − | N + ).P (N + )
P(N+) - pravděpodobnost výskytu nemoci v populaci, ze které byla osoba vybrána. Nazývá se prevalence nemoci (podíl osob s nemocí ve zkoumané populaci). Jev N- je jevem opačným k jevu N+ a jeho pravděpodobnost se vypočte P( N − ) = 1 − P( N + )
Bayesův vzorec - příklad Provádělo se ověřování kvality nového testu pro diagnostiku poruchy sluchu. Test byl ověřován u osob, u nichž byl stav sluchu vyšetřen dříve podrobnými klinickými postupy.
Skutečnost test
N+
N-
T+
50
300
T-
25
870
Celkem
75
1170
Senzitivita P(T+/N+)=
50/75= 0.67
Specificita P(T-/N-)=
870/1170=
0.74
Bayesův vzorec - příklad Prediktivní hodnoty Pozitivní pred. hodnota
Pozitivní pred. hodnota
P(N+)
0,3
P(N+)
0,12
P(N-)
0,7
P(N-)
0,88
P(T+/N-)
0,256
P(T+/N-)
0,256
P(N+/T+)
52,70%
P(N+/T+)
26,17%
Negativní pred. hodnota
Negativní pred. hodnota
P(T-/N+)
0,33
P(T-/N+)
0,33
P(N-/T-)
83,88%
P(N-/T-)
94,24%
P(N+) - prevalence
Normální rozdělení N(µ, σ2) 1 x−µ
X má normální rozdělení se stř. hodn. µ a rozptylem σ2
− ( 1 f ( x) = e 2 σ 2π
σ
)2
π=3,141 … , e=2,718… Příklad: U souboru 183 mužů nás zajímalo jak vypadá pravděpodobnostní rozdělení pro změřenou výšku. Počet Aritmetický průměr
183 175,2
Směrodatná odchylka
6,3
Šikmost
0,08
Špičatost
2,91
9 5% po p u lac e 9 9% po p u lac e
1 75 , 2± 1 ,9 6 *6 , 3: ( 1 6 2 ,9 1 75 , 2± 2 ,5 8 *6 , 3 : 1 5 8 ,9
18 7 ,5 ) 19 1 ,5 )
N(175,2;6,32) výška
f(x) 155 156 157 158 159 160 . . . . . 188 189 190 191 192 193 194 195 196 197
0,000370902 0,000609284 0,000975974 0,001524456 0,002321929 0,003448584 . . . . . 0,008040769 0,00575131 0,00401138 0,002728216 0,001809345 0,001170097 0,000737871 0,000453729 0,000272064 0,000159075
Normální rozdělení N(µ, σ2) -vlastnosti
68 % plochy pod křivkou je v intervalu (µ - σ, µ + σ) 95 % plochy pod křivkou je v intervalu (µ - 1,96 σ, µ + 1,96 σ) 99 % plochy pod křivkou je v intervalu (µ - 2,58 σ, µ + 2,58 σ)
BODOVÉ A INTERVALOVÉ ODHADY • Na základě sledování určitého znaku v reprezentativním výběru z příslušné populace můžeme odhadnout, jaká je hodnota znaku v celé populaci. • Statistické charakteristiky z výběrových souborů bodové odhady. • Odpovídající charakteristiky v základním souboru parametry populace a značí se písmeny řecké abecedy.
Odhady parametrů populace Příklad • Aritmetický průměr z výběru ( x ) o rozsahu n je tedy bodovým odhadem populačního střední hodnoty µ. • Výběrová charakteristika se liší od skutečné neznámé hodnoty příslušného parametru v definovaném základním souboru - výběrová chyba. • Výběrová chyba vzniká vlivem náhodných výkyvů závisejících na tom, které prvky ze základního souboru budou do výběru zařazeny.
Příklad V soboru 180 mužů ve věku 45 – 60 let byla naměřena průměrná hladina HDL cholesterolu (mmol/l). Tento soubor byl náhodně rozdělen na dvě části . Soubor Celý (n = 180) Výběr 1 (n = 90) Výběr 2 (n = 90)
ar. průměr 1,34 1,30 1,38
sm. odchylka 0,31 0,28 0,34
Jak je vidět z tabulky, průměrné hodnoty se nepatrně liší.
Intervaly spolehlivosti • Intervalový odhad je interval, ve kterém je s velkou pravděpodobností populační parametr obsažen. Tento interval se nazývá interval spolehlivosti (IS). • Lze zvolit, s jakou pravděpodobností má být zaručeno, že interval spolehlivosti skutečně obsahuje neznámý parametr populace. • Např. 95% IS pro střední hodnotu je rozmezí, ve kterém je střední hodnota obsažena s pravděpodobností 0,95.
Intervalový odhad střední hodnotu Se stanoví na základě výběrového průměru (x) a střední chyby tohoto průměru (se ):
95% IS : x ± t0,975 se
kde t0,975 je kvantil Studentova (t) rozdělení pro (n-1) stupňů volnosti, n je rozsah výběru. Obecně se vyhledává kvantil (1-α/2), α je zvolená pravděpodobnost chyby. n>30 - kvantil normálního rozdělení:
95% IS : x ± 1,96 se
99% IS : x ± 2,58se
Intervalový odhad Příklad: Ve vzorku 120 mužů vybraných z populace mužů ČR ve věku 35 – 44 let, bez chronické nemoci, byl výběrový průměr indexu BMI = 26, výběrová směrodatná odchylka 2,49. Řešení: Výběrový průměr = 26, střední chyba průměru se = 2,49/√120. 95%IS = 26±1,96.0,23 = 26±0,45 ≈ (25,55; 26,45) Můžeme říci, že průměrná hodnota BMI populace mužů ČR ve věku 35 – 44 let se bude nacházet v intervalu od 25,55 do 26,45 s 95% pravděpodobností.
Intervalový odhad populační pravděpodobnosti n - rozsah náhodného výběru r - počet lidí s danou vlastností p = r/n - relativní četnost výskytu vlastnosti ve výběru 95% interval spolehlivosti pro populační pravděpodobnost π
p (1 − p ) 95% IS : p ± 1,96 n
Příklad V náhodně vybraném souboru 190 studentů středních škol kouřilo 68 chlapců. Řešení: p = 68/190 = 0,358, tj. 35,8%. 0,358(1 − 0,358) 95% IS : 0,358 ± 1,96 = 0,358 ± 0,068 ≈ (0,290;0,426) 190
Tento odhad vyjádřený v procentech říká, že procento středoškoláků kuřáků v populaci studentů středních škol je s 95% spolehlivostí v rozmezí 29,0 % až 42,6%.
Příklad IS v publikaci Rev Saude Publica. 2010 Oct;44(5):901-11. Self-rated health among adults in Southern Brazil. [Article in English, Portuguese] Peres MA, Masiero AV, Longo GZ, da Rocha GC, Matos IB, Najnie K, de Oliveira MC, de Arruda MP, Peres KG. Abstract OBJECTIVE: To analyze factors associated with self-rated health in adults. METHODS: A population-based, cross-sectional study was performed with a sample of 2,051 adults aged between 20 and 59 years, in the city of Lages (168,382 inhabitants), Southern Brazil, in 2007. Household questionnaires were applied to obtain data on self-rated health, socioeconomic and demographic conditions, smoking habit, lifestyle and self-reported morbidities. Blood pressure, weight, height and abdominal circumference were measured. multivariable analysis was performed using Poisson regression, adjusted for the sampling design effect and stratified by sex.
RESULTS: Prevalence of positive self-rated health was 74.2% (95% CI: 71.3;77.0), significantly higher in men (82.3%, 95%CI: 79.3;85.0) than in women (66.9%, 95%CI: 63.2;70.7). Poorer, less educated and older men showed higher prevalences of negative selfrated health. After adjustment, high blood pressure levels and reporting chest wheezing were strongly associated with negative selfrated health in men. Prevalence of negative self-assessment was higher in poorer, less educated and older women and in those who showed abdominal obesity. High blood pressure levels, diabetes, chest wheezing and shortness of breath remained associated with the outcome after adjustment in women. The number of morbidities selfreported by women and men showed an association with negative self-rated health. CONCLUSIONS: Women and individuals who were older, poorer or less educated considered their health condition to be fair or poor. The higher the number of self-reported morbidities, the greater the proportion of individuals with negative self-rated health; the effect of morbidities was greater in women.
Intervalový odhad a velikost vzorku Příklad Ze souboru 30 studentek LF kouří 5 dívek. kuřáci % kuřáků r n p 5 30 17% 17 100 17% 50 300 17% 83 500 17% 167 1 000 17% 1667 10 000 17%
D95% IS výběrová chyba 13% 3% 30% 7% 9% 24% 4% 12% 21% 3% 13% 20% 2% 14% 19% 1% 15,9% 17,4%
Sledujeme vztah mezi přesností výsledků a rozsahem výběru.
Stanovení požadovaného rozsahu výběru •
Pokud máme předepsánu velikost výběrové chyby D můžeme odvodit požadovaný rozsah výběru.
•
Odhad výběrové chyby je:
D=t
s n
•
t je kvantil Studentova t rozdělení (n>30 - Normálního rozdělení).
•
Z uvedeného výrazu, pak můžeme vyjádřit odhad potřebného rozsahu výběru
t 2s2 n= 2 D
Příklad Jaký by měl být rozsah výběru, kdyby průměrný index BMI u mužů bez chronické nemoci ve věku 55 – 64 let měl být se spolehlivostí 0,95 odhadnut tak, aby jeho výběrová chyba byla nejvýše 0,4? Bodový odhad populační směrodatné odchylky, vypočítaný ze vzorku této populace, je 2,98. Řešení: Za hodnotu kvantilu pro spolehlivost 0,95 dosadíme t = 1,96, protože se předpokládá, že požadovaný rozsah výběru bude větší než 30. Požadovaná výběrová chyba D = 0,4 a směrodatná odchylka s = 2,98. Pro směrodatnou odchylku je většinou znám pouze její odhad z tzv. „předvýběru“ nebo z literárních údajů. Požadovaný rozsah výběru je
1,96 2 2,98 2 n= = 213 2 0,4