Epidemiologické ukazatele
Testování statistických hypotéz a analýza kategoriá kategoriální lních dat
Populace Nemocní Kontroly Celkem
Rizikový faktor Přítomen Nepřítomen a b c d a+c b+d
Celkem a+b c+d n
Exponovaní Neexponovaní
Prof. RNDr. Jana Zvárová, DrSc.
Incidence exponovaných
IE =
a a+c
Incidence neexponovaných
IN =
b b+d
Incidenci většinou přepočítáváme na 1 000, 10 000 nebo 100 000 osob. 1
Epidemiologické ukazatele
Záznam epidemiologických dat Populace Nemocní Kontroly Celkem
Rizikový faktor Přítomen Nepřítomen a b c d a+c b+d
3
Relativní riziko
Celkem a+b c+d n
RR =
IE IN
• odhaduje sílu asociace mezi rizikovým faktorem a
nemocí nemocí
Exponovaní Neexponovaní
• vyjadřuje, kolikrát častěji se může nemoc vyvinout v populaci exponovaných ve srovnání s populací neexponovaných
a, b, c, d ... pozorované (absolutní) četnosti v jednotlivých skupinách
n = a+b+c+d 2
4
Volba hladiny významnosti
Epidemiologické ukazatele
- hladina významnosti souvisí s chybami, kterých se při rozhodnutí můžeme dopustit:
Atributivní riziko
AR = I E − I N
Rozhodnutí
• část incidence exponované populace, která může být vysvětlena pouze přítomností rizikového faktoru • umožňuje odhalit stupeň maximálního poklesu výskytu onemocnění u exponované populace v případě, že umíme odstranit vliv rizikového faktoru
Skutečnost H0 platí
H1 platí
Nezamítneme H0 (nevýznamný výsledek)
Správné rozhodnutí
Chyba II. druhu (β)
Zamítneme H0 (významný výsledek)
Chyba I. druhu (α)
Správné rozhodnutí
- hladina významnosti (α) je předepsaná hodnota, kterou pravděpodobnost chyby I. druhu nesmí překročit Obvykle α = 0,05 (zamítáme na 5% hladině významný výsledek) nebo α = 0,01 (zamítáme na hladině 1% - vysoce významný výsledek)
5
Příklad
7
Sběr dat
Chceme ověřit, zda progresivní polyartritida (PAP) souvisí s výskytem antigenu HLA-DR4. Domníváme se, že ano (to je naše medicínská hypotéza). Sestavíme tedy nulovou a alternativní hypotézu (nezapomeňte, že nulovou hypotézu volíme opačně, než je dokazované tvrzení). Tedy:
H0: PAP nesouvisí s výskytem HLA-DR4 H1: PAP souvisí s výskytem HLA-DR4
- tato fáze je velmi důležitá a měla by být konzultována se statistikem - sebraný vzorek dat musí být objektivní, reprezentativní a dostatečně velký Př. (pokračování): Nasbíraná data – pozorované četnosti ve čtyřpolní tabulce
Antigen HLA-DR4 Výskyt PAP Ano Ne 46 28 Ano Ne 50 184 96 212 Celkem 6
Celkem 74 234 308 8
Volba vhodné vhodného testu
Příklad (pokrač (pokračová ování) Výpoč Výpočet oč očeká ekávaných hodnot:
Rozhodnutí o platnosti nebo neplatnosti hypotézy činíme na základě aplikace vhodného statistického testu. Každý statistický test je charakterizován testovou statistikou funkcí, která ze sesbíraných dat "vytvoří" jedno číslo.
Př.: χ2 = ∑
(pozorovaná četnost - očekávaná četnost )2 očekávaná četnost
Antigen HLA-DR4 Výskyt PAP Ano Ne 46 28 Ano 50 184 Ne 96 212 Celkem
Celkem 74 234 308
Výskyt antigenu je rozdělen v poměru 96:212. V případě platnosti hypotézy nezávislosti obou znaků očekáváme, že ve stejném poměru budou rozděleny i skupiny s PAP a bez PAP. Tedy pro skupinu (PAP-Ano, HLA-DR4-Ano):
~ χ 2 (df )
Očekávaný počet = 96/308 . 74 = 23
11
9
Naměř ené é a oč Naměřen očeká ekávané vané hodnoty
Krok 5: Výpočet hodnoty testové statistiky
Výskyt PAP Ano
Sesbíraná data je třeba zpracovat a dosadit do předpisu testové statistiky.
Ne Celkem
Antigen HLA-DR4 Ano Ne 46 28 23 51 50 184 73 161 96 212
Celkem 74 234 308
Červeně jsou vyznačeny četnosti očekávané v případě, že platí hypotéza nezávislosti.
Po dosazení:
10
χ 2 = 43,61 12
Krok 5: Urč Určení ení kritické kritické hodnoty
Statistická a klinická významnost Statistická významnost
Po dosazení naměřených hodnot do testové statistiky zamítáme hypotézu, pokud výsledná hodnota přesáhne jistou mez, nazývanou kritická hodnota.
?
Je-li statistický test zamítnut (významný) na předepsané hladině α (hladina významnosti).
Klinická významnost
Jak tuto hodnotu určit?
Je-li efekt významný z hlediska klinické praxe (např. překročení prahové hodnoty).
Kritickou hodnotou testu je takové číslo, které testová statistika překročí v případě, že nulová hypotéza je pravdivá, s pravděpodobností nejvýše α.
G
PH 0 (T ≥ kα ) ≤ α
Pojmy statistické a klinické významnosti bývají často ztotožňovány. Toto ztotožnění je však třeba provádět opatrně, neboť bývá nepřesné.
Kritické hodnoty jsou tabelovány. 13
Příklad (dokonč (dokončení ení)
Kontingenč Kontingenční tabulky
Testová statistika:
χ 2 = 43,61
Testové kriterium:
χ 2 ≥ χ12−α (1) = 3,84
Rozhodnutí:
χ = 43,61 ≥ 3,84 = χ 2
15
- kontingenční tabulky slouží ke studování vztahů mezi dvěma znaky Kontingenční tabulka r x s: 2 1− 0 , 05
Znak 2
(1)
Znak 1
Kategorie 1
...
Kategorie s
Kategorie 1
n11 ... nr1 n•1
... ... ... ...
n1s ... nrs n•s
...
H0 zamítáme na hladině 5%
Kategorie r
n1• nr• n
Zjistili jsme významnou souvislost mezi výskytem antigenu HLA-DR4 a PAP na 5% hladině.
- kontingenční tabulka typu 2x2 se nazývá 14
čtyřpolní tabulka
16
Test hypotézy o shodnosti struktur
Příklad (dokonč (dokončení ení) H0:
Pravděpodobnosti skupin jsou v jednotlivých krajích stejné. Nulová hypotéza neplatí.
- test shodnosti pravděpodobnostní struktury nějakého znaku za různých podmínek
H1:
Př.:
Testová statistika:
Stejná věková struktura pacientů ve dvou nemocnicích.
3
4
χ = n∑∑ 2
- tzv. χ2-test dobré shody použitý na kontingenční tabulku
i =1 j =1
Testové kriterium: Rozhodnutí:
nij2 ni.n. j
− n ~ χ 2 ((3 - 1)( . 4 − 1)) = χ 2 (6)
χ 2 ≥ χ 12− 0,05 (6 )
χ 2 = 10,45 < 12,59 = χ 2 (6) 1 − 0,05 H0 tedy nelze zamítnout na 5% hladině.
17
Dosaž Dosažená ená hladina významnosti
Příklad Studie percentuálních zastoupení krevních skupin ve třech krajích severního Skotska. Je ve všech krajích stejné percentuelní zastoupení krevních skupin? Oblast Eskdale Annadale Nithdale Celkem
19
A 33 54 98 185
B 6 14 35 55
0 56 52 115 223
AB 5 5 5 15
Alternativní postup při rozhodnutí o platnosti či neplatnosti hypotézy: Určíme pravděpodobnost p, s jakou bychom mohli obdržet pozorovaná data nebo data stejně nebo více odporující nulové hypotéze za předpokladu, že je nulová hypotéza pravdivá, tato hodnota se nazývá dosažená hladina významnosti.
Celkem 100 125 253 478
!
Čím menší p, tím méně důvěryhodné je H0.
Pro účely statistické analýzy volíme hladinu významnosti α a zamítneme H0, je-li:
p <α 18
20
Pravidla statistického rozhodování
McNemarův test • Máme náhodný výběr 18 pacientů, kteří byli léčeni dvěma různými antihypertenzivy A, B. Kaž Každý pacient dostá dostával po dobu jednoho mě měsíce léka A a po odezně odeznění jeho případných účinků inků po dobu jednoho měsíce lé lék B. Výsledek byl klasifiková klasifikován jako úspě spěch nebo neú neúspě spěch.
• hladina testu α : pravdě pravděpodobnost chyby 1. druhu, tj.. zamí zamítnutí tnutí platné platné nulové nulové hypoté hypotézy • kritický obor : výsledky pokusu, př při nichž nichž se zamí zamítá nulová á hypoté é za nulov hypot • síla testu (1-β): pravdě pravděpodobnost zamí zamítnutí tnutí nulové nulové hypoté hypotézy, jestliž jestliže nulová nulová hypoté hypotéza neplatí neplatí • kritický obor i hladina testu se volí volí před pokusem, pokusem, nezá nezávisle na jeho výsledku
21
Obecný postup při testování hypotéz
23
Dosažená hladina testu • Hladinu testu α volí volíme př předem (nesmí (nesmí záviset na datech) • Dosaž Dosažená ená hladina ( p value ) je nejmenší nejmenší hladina, na které které bychom př při daných datech nulovou hypoté hypotézu zamí zamítli • Dosaž Dosažená ená hladina ( p value ) je pravdě pravděpodobnost naš našeho výsledku a vš všech výsledků výsledků ješ ještě méně podporují podporujících nulovou hypoté hypotézu • Jednoduché Jednoduché pravidlo: p value < α H0 zamí zamítáme
• Formulujeme nulovou hypoté hypotézu H0 a alternativu H1. • Zvolí Zvolíme hladinu významnosti α. • Získá skáme data. • Vybereme vhodný statistický test. • Spoč Spočteme hodnotu testové testového krité kritéria. • Najdeme v tabulká tabulkách př přísluš slušnou kritickou hodnotu. • Provedeme statistické statistické rozhodová rozhodování následují sledujícím způ způsobem: JeJe-li hodnota testové testového krité kritéria vě větší než než kritická kritická hodnota, zamí zamítneme nulovou hypoté hypotézu H0 ve prospě prospěch alternativy H1 na hladině hladině významnosti α.
⇒
22
24
Obecné schéma statistického rozhodování Skutečnost Rozhodnutí
H0 platí
H0 neplatí
H0 zamítnout
chyba 1. druhu α
správně
H0 nezamítnout
správně
chyba 2. druhu β
815
25
Chyba 1.a 2. druhu (α, β) H0 x H 1
H0
H1
β
α
26