Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
1
ME´NEˇ NEZˇ MINIMUM ZE STATISTIKY Michaela Sˇedova´
1
´ vod U
Prˇi prˇ´ıpraveˇ tohoto semina´rˇe jsem se opı´rala nejen o zkusˇenosti sve´, ale take´ o pra´ce jiny´ch. Veˇtsˇina prˇ´ıkladu˚ v tomto textu pocha´zı´ bud’ z prˇedna´sˇek a cvicˇenı´ doc. Zva´ry [1], nebo z knihy, jejı´zˇ autorkou je prof. Zva´rova´ [2]. Publikace teˇchto dvou autoru˚ vrˇele doporucˇuji k hlubsˇ´ımu prostudova´nı´. Zacˇneˇme prˇ´ıkladem prˇevzaty´m z knihy [2]. Prˇ´ıklad 1. Byla provedena studie syndromu na´hodne´ho u´mrtı´ deˇtı´. Ta se zameˇrˇila na dveˇ skupiny. Prvnı´ tvorˇily deˇti, ktere´ byly nalezeny te´meˇrˇ mrtve´, bez zna´mek zˇivota. Vsˇechna dalsˇ´ı vysˇetrˇenı´ byla negativnı´, zotavily se beˇhem neˇkolika dnu˚. Tuto skupinu jsme nazvali „te´meˇrˇ ztracene´“. Druhou skupinu tvorˇily norma´lnı´ deˇti. U kazˇde´ho dı´teˇte byla zjisˇteˇna dlouhodoba´ promeˇnlivost tepove´ frekvence (LTV, definova´na jako rozdı´l mezi min. a max. hodnotami novorozenecke´ tepove´ ´ daje jsou zaznamenane´ v tabulce 1. frekvence). U Tabulka 1: Nameˇrˇene´ hodnoty LTV pro „te´meˇrˇ ztracene´“ a norma´lnı´ deˇti ve studii syndromu na´hodne´ho u´mrtı´ deˇtı´ Te´meˇrˇ 9.33, 15.5, 21.17, 13.83, 24.67, 18.0, 9.33, 7.00, 8.83, 5.0 ztracene´ 20.6, 22.67, 14.17, 11.0, 9.33, 13.33, 11.67, 8.17, 9.17, 23.00, 7.67, 9.67, 17.33, 22.33, 8.33, 15.17 Norma´lnı´ 29.00, 17.33, 17.83, 11.33, 14.33, 31.33, 20.67, 27.83, 32.0, 19.0, 32.5, 22.33, 35.0, 31.17, 13.67
Ve studii z prˇ´ıkladu 1 bychom chteˇli zjistit, zda se „te´meˇrˇ ztracene´“ deˇti neˇjak lisˇ´ı od norma´lnı´ch z hlediska LTV. Na prvnı´ pohled vidı´me, zˇe rozlisˇenı´ mezi skupinami nenı´ jednoznacˇne´, ve skupineˇ „te´meˇrˇ ztraceny´ch“ deˇtı´ jsou hodnoty LTV od 5,00 do 24,67, ve skupineˇ norma´lnı´ch deˇtı´ jsou hodnoty LTV od 11,33 do 35,00. Zajı´ma´me se tedy o to, zda se tyto skupiny lisˇ´ı alesponˇ „v pru˚meˇru“. A v pru˚meˇru se skutecˇneˇ lisˇ´ı, „te´meˇrˇ ztracene´“ deˇti majı´ pru˚meˇrne´ LTV mensˇ´ı nezˇ deˇti norma´lnı´ (13.70 resp. 23.69). Proble´m je v tom, zˇe nemu˚zˇeme veˇdeˇt, zda je tento rozdı´l pouze na´hodny´ (tj. kdybychom zopakovali tenty´zˇ pokus s jiny´mi deˇtmi, mohli bychom dostat i opacˇny´ vztah), nebo zda zde existuje neˇjake´ systematicke´
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
2
posunutı´, trend, ktery´ na´hodny´ nenı´ (tj. podobne´ vy´sledky bychom dostali vzˇdy prˇi opakova´nı´ pokusu). K tomuto rozlisˇenı´ bychom meˇli postupneˇ dospeˇt. Protozˇe zde chceme pracovat s pojmem na´hody, dosta´va´me se na pole teorie pravdeˇpodobnosti a matematicke´ statistiky. Abychom jejı´ za´veˇry doka´zali dobrˇe interpretovat, je potrˇeba pochopit zpu˚sobu uvazˇova´nı´, ktery´ je v tomto oboru obvykly´, naucˇit se cˇ´ıst statisticke´ vy´sledky a umeˇt rozlisˇit, co statistika umı´ a co neumı´ (bohuzˇel, cˇasto jı´ bud’ pohrda´me, anebo ji naopak stavı´me do role veˇsˇtecke´ koule). Tento text si neklade za cı´l sta´t se minikurzem statistiky. K tomu je mozˇne´ doporucˇit citovanou literaturu. Radeˇji nezˇ vy´cˇtem vsˇech mozˇny´ch statisticky´ch pojmu˚, metod a testu˚ budeme spı´sˇ na prˇ´ıkladech ilustrovat zpu˚sob statisticke´ho uvazˇova´nı´, ze ktere´ho vsˇechny popsane´ postupy vycha´zı´. To by snad meˇlo ulehcˇit jak cˇetbu odborne´ medicı´nske´ literatury, tak komunikaci se statistikem v prˇ´ıpadeˇ vlastnı´ho vy´zkumu. Je vsˇak potrˇeba zacˇ´ıt od zacˇa´tku . . . Statistika popisna´ versus induktivnı´ Je podstatny´ rozdı´l mezi popisnou (deskriptivnı´) a induktivnı´ statistikou. Popisna´ statistika • Urcˇity´m zpu˚sobem popisuje, charakterizuje data. Shrnuje databa´zi jednotlivy´ch pozorova´nı´ do neˇjake´ prˇehledne´ formy, ukazuje, „co vlastneˇ ma´me“. • Pouzˇ´ıva´ k tomu popisne´ chrakteristiky (pru˚meˇr, media´n, . . . ), grafy (histogram, krabicovy´ diagram, bodovy´ graf, . . . ). • Omezuje sva´ tvrzenı´ na dana´ data, necˇinı´ si na´rok zobecnˇovat, deˇlat za´veˇry. Induktivnı´ statistika • Na za´kladeˇ dat se snazˇ´ı zobecnit pozorova´nı´ na veˇtsˇ´ı soubor, populaci. • Pracuje s na´hodou, odhady, testy. • Velkou roli zde hraje spra´vna´ interpretace. Ve veˇtsˇineˇ pracı´ se setka´me s obeˇma typy. Publikace zpravidla obsahujı´ tabulky charakterizujı´cı´ populaci, ktera´ byla zarˇazena do studie (aby bylo naprˇ. videˇt, zˇe je reprezentativnı´). Veˇtsˇinou ale take´ uva´dı´ vy´sledky statisticky´ch testu˚ a majı´ ambici sve´ vy´sledky zobecnit (naprˇ. tvrdit, zˇe dany´ le´k u´cˇinkuje nejen u konkre´tnı´ch pacientu˚, kterˇ´ı byli zarˇazeni do studie, ale zˇe by u´cˇinkoval i u ostatnı´ch). Ujasneˇme si nejprve pa´r za´kladnı´ch pojmu˚.
3
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy Meˇrˇ´ıtko Studii prova´dı´me tak, zˇe na statisticky´ch jednotka´ch sledujeme jejich vlastnosti; hodnoty znaku˚ ve zvolene´m meˇrˇ´ıtku. Meˇrˇ´ıtko je • Kvalitativnı´ (zpravidla vyja´drˇene´ slovem, znakem, . . . ) – nula-jednicˇkove´ (jev nastal/nenastal, naprˇ. pacient prˇezˇil/neprˇezˇil) – nomina´lnı´ (neˇkolik kategoriı´, naprˇ. krevnı´ skupina) - v literaturˇe se mu˚zˇeme setkat s pojmem faktor – ordina´lnı´ (kategorie jsou jisty´m zpu˚sobem rˇazene´, naprˇ. bolest je silna´, mı´rna´, zˇa´dna´) • Kvantitativnı´ (vyja´drˇene´ cˇ´ıslem)
– intervalove´ (spojite´, naby´vajı´ hodnoty z neˇjake´ho intervalu, naprˇ. vy´sˇka, LTV) – diskre´tnı´ (ordina´lnı´, naprˇ. pocˇet pacientu˚, kterˇ´ı navsˇtı´vı´ ambulanci beˇhem jednoho dne) Pravdeˇpodobnost Prˇedpokla´da´me, zˇe beˇhem studie realizujeme na´hodny´ pokus, tedy pokus, jehozˇ vy´ledek nenı´ prˇedem zna´m. Vy´sledek tohoto pokusu nazveme na´hodny´ jev (oznacˇme ho A). Na´s zajı´ma´ pravdeˇpodobnost tohoto na´hodne´ho jevu, P(A). Je to mı´ra cˇastosti vy´skytu jevu A, „nadeˇje“, zˇe nastane. Tato mı´ra je vyja´drˇena cˇ´ıslem v interavalu [0, 1]. V prˇ´ıpadeˇ nemozˇne´ho jevu A je P(A) = 0, v prˇ´ıpadeˇ jiste´ho jevu A je P(A) = 1. Na strˇednı´ sˇkole jsme se zrˇejmeˇ setkali s klasickou definicı´ pravdeˇpodobnosti: • Mnozˇinu mozˇny´ch vy´sledku˚ pokusu rozdeˇlı´me na n stejneˇ pravdeˇpodobny´ch elementa´rnı´ch jevu˚ ω1 , ω2 , . . . , ωn . • Z toho m elementa´rnı´ch jevu˚ je prˇ´ıznivy´ch jevu A. • Potom P (A) =
m . n
Prˇ´ıklad 2. Ha´zenı´ kostkou • Jev A: padne sude´ cˇ´ıslo • Elementa´rnı´ jevy: padne 1, 2, 3, 4, 5, 6, vsˇechny s pravdeˇpodobnostı´ • P (A) =
3 6
=
1 2
1 6
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
4
Ovsˇem ma´me-li intervalovy´ (spojity´) znak, tato definice nestacˇ´ı. Mu˚zˇeme dostat nekonecˇneˇ mnoho vy´sledku˚ a tı´m by se ve jmenovateli objevilo ∞. Proto potrˇebujeme obecneˇjsˇ´ı koncept. Na´hodna´ velicˇina Na´hodna´ velicˇina je cˇ´ıselneˇ vyja´drˇeny´ vy´sledek na´hodne´ho pokusu. Je to teoreticky´ pojem. Snazˇ´ı se postihnout fakt, zˇe vy´sledek na´hodne´ho pokusu nezna´me, prˇesto vsˇak neˇco vı´me o tom, jaky´ch hodnot sledovany´ znak mu˚zˇe naby´t a s jakou pravdeˇpodobnostı´ je skutecˇneˇ zpozorujeme. Tomuto „seznamu“ nebo „popisu“ na´hodne´ velicˇiny se rˇ´ıka´ rozdeˇlenı´. Naprˇ. na´hodna´ velicˇina je dlouhodoba´ promeˇnlivost tepove´ frekvence u novorozencu˚ obecneˇ. Jejı´ realizacı´ je potom hodnota, kterou nameˇrˇ´ıme u konktre´tnı´ho dı´teˇte. Mu˚zˇeme rˇ´ıci, zˇe na´hodna´ velicˇina je model, neˇjaky´ prˇedpis, ktery´m se rˇ´ıdı´ jista´ populace. Tu nikdy nemu˚zˇeme pozorovat celou (nikdy nenameˇrˇ´ıme LTV u vsˇech deˇtı´ na sveˇteˇ), pozorujeme vsˇak na´hodny´ vy´beˇr z te´to populace (deˇti, ktere´ se narodily v nasˇ´ı porodnici v dobeˇ, kdy studie probı´hala) a z toho se snazˇ´ıme usoudit o cele´ populaci. Do teˇchto u´vah je nutne´ zapocˇ´ıtat na´hodu, tedy to, zˇe kdybychom studii opakovali na jiny´ch deˇtech, dostali bychom jina´ cˇ´ısla, prˇestozˇe bychom realizovali tu stejnou na´hodnou velicˇinu (se stejny´m rozdeˇlenı´m). Statistika se tedy snazˇ´ı odhadovat jiste´ parametry rozdeˇlenı´ na´hodne´ velicˇiny, prˇ´ıpadneˇ testovat hypote´zy o teˇchto parametrech. Rozdeˇlenı´ na´hodne´ velicˇiny Jsou dva za´kladnı´ typy rozdeˇlenı´ na´hodne´ velicˇiny. Diskre´tnı´ je modelem pro pocˇty prˇ´ıpadu˚, je to seznam pravdeˇpodobnostı´, se ktery´mi dany´ znak naby´va´ jednotlivy´ch hodnot. Naprˇ. rozdeˇlenı´ na´hodne´ velicˇiny „pohlavı´ noveˇ narozene´ho dı´teˇte“ je da´no pravdeˇpodobnostı´, zˇe to bude dı´vka (rˇekneˇme 0,48), a pravdeˇpodobnostı´, zˇe to bude chlapec (0,52). Druhou mozˇnostı´ je rozdeˇlenı´ spojite´. Nejzna´meˇjsˇ´ım rozdeˇlenı´m z te´to kategorie je opra´vneˇneˇ norma´lnı´ (Gaussovo). Tomu se budeme veˇnovat vı´ce. Zna´ma´ „Gaussova krˇivka“ (viz obr. 1a) je ve skutecˇnosti hustotou tohoto rozdeˇlenı´, ktera´ ma´ sve´ prˇesne´ matematicke´ vyja´drˇenı´. Urcˇuje, s jakou pravdeˇpodobnostı´ mu˚zˇe na´hodna´ velicˇina X naby´t hodnoty z dane´ho intervalu. To je da´no plochou pod touto krˇivkou. Obra´zek 1b ukazuje, jaka´ je pravdeˇpodobost, zˇe dostaneme pozorova´nı´ z intervalu (0, 1), ma´-li dana´ na´hodna´ velicˇina standardnı´ norma´lnı´ rozdeˇlenı´. Hustota na´m tak poma´ha´ vyja´drˇit, zˇe rozdeˇlenı´ dane´ na´hodne´ velicˇiny nenı´ rovnomeˇrne´, tj. zˇe naprˇ. nemu˚zˇeme naby´t hodnoty z intervalu (2.5, 3.5) se stejnou pravdeˇpodobnostı´ jako hodnoty z intervalu (0, 1). Z vlastnostı´ hustoty vyply´va´, zˇe plocha pod celou touto krˇivkou musı´ by´t 1.
5
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
Obra´zek 1: Hustota standardnı´ho norma´lnı´ho rozdeˇlenı´ (a) a zna´zorneˇnı´ pravdeˇpodobnosti P (X ∈ (0, 1)) (b)
Norma´lnı´ rozdeˇlenı´ je charakterizova´no dveˇma parametry: • Strˇednı´ hodnota µ urcˇuje bod, kolem ktere´ho je hustota symetricka´. • Rozptyl σ 2 urcˇuje, jak moc jsou hodnoty rozpy´lene´ kolem tohoto bodu. Skutecˇnost, zˇe na´hodna´ velicˇina ma´ norma´lnı´ rozdeˇlenı´ se strˇednı´ hodnotou µ a rozptyl σ 2 , zapisujeme X ∼ N (µ, σ 2 ). Obra´zek 2 zna´zornˇuje norma´lnı´ rozdeˇlenı´ s ru˚zny´mi parametry. Standardnı´m norma´lnı´m rozdeˇlenı´m se nazy´va´ rozdeˇlenı´ N (0, 1).
−2
0
2
4
0.4 0.1 0.0
0.0 −4
0.2
f(x)
0.3
0.3 0.1
0.2
f(x)
0.3 0.2 0.1 0.0
f(x)
N(0,2)
0.4
N(1,1)
0.4
N(0,1)
−4
−2
0
2
4
−4
−2
0
x
x
x
a)
b)
c)
2
4
Obra´zek 2: Hustota norma´lnı´ho rozdeˇlenı´; a) N(0,1), b) N(1,1), c) N(0,2)
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
6
Obra´zek 3: Hustoty rovnomeˇrne´ho (a), exponencia´lnı´ho (b), studentova (c) a χ2 rozdeˇlenı´ (d) s vyznacˇeny´mi strˇednı´mi hodnotami (µ).
Norma´lnı´ rozdeˇlenı´ vsˇak nenı´ zdaleka jedine´ spojite´ rozdeˇlenı´. Prˇ´ıklady hustot dalsˇ´ıch rozdeˇlenı´ jsou na obra´zku 3. Cˇasto naprˇ. koncentrace la´tek mı´vajı´ rozdeˇlenı´ vy´razneˇ zesˇikmene´. Veˇtsˇina vy´sledku˚ je vsˇak ve statistice odvozena pro norma´lnı´ rozdeˇlenı´, proto by´va´ cˇasty´m prˇedpokladem jejich platnosti pra´veˇ normalita dat. Pokud ta nenı´ splneˇna´, za´veˇry nemusı´ by´t spra´vne´. Jednı´m rˇesˇenı´m tohoto proble´mu mu˚zˇe by´t naprˇ. transformace dat, cˇ´ımzˇ pu˚vodnı´ rozdeˇlenı´ prˇiblı´zˇ´ıme norma´lnı´mu a dostaneme platne´ vy´sledky. Cˇasto se pouzˇ´ıva´ logaritmus nameˇrˇeny´ch hodnot.
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
7
Charakteristiky rozdeˇlenı´ Vrat’me se jesˇteˇ k charakteristika´m rozdeˇlenı´ na´hodne´ velicˇiny. Strˇednı´ hodnota je charakteristikou polohy rozdeˇlenı´. V prˇ´ıpadeˇ diskre´tnı´ho rozdeˇlenı´ je strˇednı´ hodnota µ va´zˇeny´m pru˚meˇrem mozˇny´ch hodnot. Va´hami jsou pravdeˇpodobnosti, s jaky´mi jich mu˚zˇeme naby´t µ = EX = x1 p1 + x2 p2 + · · · + xn pn . V prˇ´ıpadeˇ spojite´ho rozdeˇlenı´ ji definujeme podobneˇ, funkci vah plnı´ hustota Z ∞ xf (x)dx. EX = −∞
Hustota norma´lnı´ho rozdeˇlenı´ je symetricka´ kolem sve´ strˇednı´ honoty. U ostatnı´ch rozdeˇlenı´ to tak nemusı´ by´t (jak je videˇt na obra´zku 3). Rozptyl je charakteristikou variability dat. Lze rˇ´ıci, zˇe je to „pru˚meˇrna´“ druha´ mocnina odchylky hodnot od strˇednı´ hodnoty σ 2 = var (X) = E(X − EX)2 . Pro diskre´tnı´ rozdeˇlenı´ ji zapı´sˇeme σ 2 = var (X) = (x1 − µ)2 p1 + (x2 − µ)2 p2 + · · · + (xn − µ)2 pn . V publikacı´ch se cˇasto uva´dı´ smeˇrodatna´ odchylka (standard deviation, SD) σ, cozˇ je odmocnina rozptylu. Dalsˇ´ı charakteristiky Dalsˇ´ı charakteristikou, ktera´ pro na´s mu˚zˇe by´t zajı´mava´, jsou kvantily. Media´n x˜ je cˇ´ıslo, ktere´ oddeˇlı´ „polovinu“ mozˇny´ch hodnot: 1 P (X ≤ x˜) = . 2 Je ho take´ mozˇne´ cha´pat jako mı´ru polohy. Neˇkdy mu˚zˇe polohu dat charakterizovat le´pe nezˇ strˇednı´ hodnota. Kvartily x˜ jsou cˇ´ısla, ktera´ oddeˇlı´ „cˇtvrtiny“ mozˇny´ch hodnot: 1 Dolnı´ kvartil q1 . . . P (X ≤ q1 ) = 4 3 Hornı´ kvartil q3 . . . P (X ≤ q3 ) = . 4 Desetiny hodnot od sebe potom oddeˇlujı´ decily, setiny percentily.
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
2
8
Popisna´ statistika
Azˇ dosud byla rˇecˇ o vlastnostech na´hodne´ velicˇiny, tedy o teoreticke´m konceptu, ktery´ v praxi nikdy nepozorujeme. Prvnı´, ne vsˇak jediny´ krok k tomu, abychom mohli neˇco usoudit o dane´ na´hodne´ velicˇineˇ, je popisna´ statistika. Shrnuje to, co ma´me v datech. Mı´ry polohy Prˇedpokla´dejme, zˇe ma´me n pozorova´nı´. Mezi mı´ry polohy dat patrˇ´ı • Pru˚meˇr x¯ =
x1 + x2 + · · · + xn n
• (Vy´beˇrovy´) media´n . . . prostrˇednı´ hodnota dat, forma´lneˇ zapı´sˇeme x[ n+1 ] n liche´ 2 x˜ = 1 (x[ n2 ] + x[ n2 +1] ) n sude´, 2 kde x[n] znacˇ´ı n-tou nejmensˇ´ı hodnotu. • (Vy´beˇrove´) kvartily . . . analogicky Mı´ry variability Mı´rou variability je prˇedevsˇ´ım vy´beˇrovy´ rozptyl (x1 − x¯)2 + (x2 − x¯)2 + · · · + (xn − x¯)2 . s = n−1 Z neˇj potom mu˚zˇeme urcˇit vy´beˇrovou smeˇrodatnou odchylku s. 2
Graficke´ zna´zorneˇnı´ dat Krabicovy´ diagram zachycuje rozdeˇlenı´ spojite´ velicˇiny v podobeˇ obde´lnı´ku, kde je • Media´n zna´zorneˇn prˇ´ıcˇkou obde´lnı´ka • Hornı´ resp. dolnı´ kvartil zna´zorneˇn kratsˇ´ımi stranami obde´lnı´ka • Tykadla vykreslena od kvartilu k minimu resp. maximu, pokud nenı´ odllehle´ • Odlehle´ pozorova´nı´ zna´zorneˇno samostatneˇ. Za odlehle´ pozorova´nı´ se zpravidla povazˇuje takove´, ktere´ je da´l nezˇ 32 (q3 − q1 ), kde q3 a q1 je hornı´ a dolnı´ kvartil.
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
9
Obra´zek 4: Graficke´ zna´zorneˇnı´ nameˇrˇeny´ch hodnot LTV pro skupinu „te´meˇrˇ ztraceny´ch deˇtı´“; pomocı´ bodove´ho grafu (a) a krabicove´ho diagramu (b).
Prˇ´ıklad 3. Kdybychom chteˇli zna´zornit data, ktera´ ma´me o LTV pro skupinu „te´meˇrˇ ztraceny´ch deˇtı´“, nebudeme vykreslovat jednotliva´ pozorova´nı´ jako na obra´zku 4a), protozˇe to je zvla´sˇt’u objemneˇjsˇ´ıch dat velmi neprˇehledne´, ale pouzˇijeme krabicovy´ diagram, viz obra´zek 4b). Histogram zna´zornˇuje intervalove´ cˇetnosti spojite´ velicˇiny. Rozmezı´ vsˇech mozˇny´ch hodnot (osa x) rozdeˇlı´me na male´ intervaly, ke kazˇde´mu intervalu spocˇ´ıta´me, kolik pozorova´nı´ do neˇj padne, a to vyneseme na osu y. Druhou mozˇnostı´ je vyne´st na osu y relativnı´ cˇetnosti (pocˇet pozorova´nı´ v intervalu vydeˇleny´ celkovy´m pocˇtem pozorova´nı´). Histogram by meˇl prˇi dostatecˇne´m pocˇtu pozorova´nı´ aproximovat hustotu rozdeˇlenı´. Prˇ´ıklad 4. Data byla umeˇle vygenerova´na z rozdeˇlenı´ N (0, 1). Prˇ´ıslusˇny´ histogram je zobrazen na obra´zku 5. Je blı´zky´ hustoteˇ norma´lnı´ho rozdeˇlenı´. Sloupcovy´ graf zna´zornˇuje cˇetnosti (pocˇty hodnot) kvalitativnı´ho znaku. Prˇ´ıklad 5. Zjistili jsme krevnı´ skupinu ve vzorku 100 pacientu˚. Skupina Pocˇet Sloupcovy´ graf je na obr. 6.
0 28
A 36
B 27
AB 9
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
Histogram of x
0.3 0.1
0.2
Density
15 10 0
0.0
5
Frequency
20
0.4
Histogram of x
10
−2
−1
0
x
1
2
−2
−1
0
1
2
x
Obra´zek 5: Histogram pro data pocha´zejı´cı´ z rozdeˇlenı´ N (0, 1); zobrazenı´ pomocı´ absolutnı´ch cˇetnostı´ (a) a relativnı´ch cˇetnostı´ (b).
Obra´zek 6: Sloupcovy´ graf zastoupenı´ krevnı´ch skupin u 100 pacientu˚.
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
11
0.04 0.00
Density
0.08
Histogram of x1
5
10
15
20
25
30
35
40
30
35
40
30
35
40
x1
0.03 0.00
Density
Histogram of x2
5
10
15
20
25 x2
0.03 0.00
Density
Histogram of x3
5
10
15
20
25 x3
Obra´zek 7: Histogramy pro na´hodne´ vy´beˇry pocha´zejı´cı´ z norma´lnı´ho rozdeˇlenı´ N (23, 82 ) o velikosti 10(x1 ), 50(x2 ) a 1000(x3 ).
3
Induktivnı´ statistika
Jak uzˇ bylo rˇecˇeno, induktivnı´ statistika se snazˇ´ı zobecnit to, co pozorujeme na konkre´tnı´ch statisticky´ch jednotka´ch. Jednı´m z jejı´ch u´kolu˚ je odhadnout parametry (vlastnosti) rozdeˇlenı´ na´hodne´ velicˇiny. • Odhadem strˇednı´ hodnoty je zpravidla pru˚meˇr. • Odhadem rozptylu je zpravidla vy´beˇrovy´ rozptyl. Kdybychom dany´ pokus opakovali, dostaneme urcˇiteˇ jiny´ pru˚meˇr, tj. jiny´ odhad strˇednı´ hodnoty. Proto na´s zajı´ma´ prˇesnost nasˇeho bodove´ho odhadu, tj. prˇedstava, jak jsme nanejvy´sˇ daleko od skutecˇne´ strˇednı´ hodnoty.
3.1
Odhady
Odhad strˇednı´ hodnoty Prˇ´ıklad 6. Prˇedpokla´dejme, zˇe sledujeme na´hodnou velicˇinu, ktera´ ma´ v populaci rozdeˇlenı´ X ∼ N (23, 82 ). Provedeme 3 na´hodne´ vy´beˇry o rozsahu 10, 50 a 1000. Histogramy pro tyto trˇi vy´beˇry jsou na obra´zku 7. Pru˚meˇry vysˇly x¯1 = 20, 17,
x¯2 = 22, 69,
x¯3 = 23, 14.
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
12
Obra´zek 8: Kvantily norma´lnı´ho rozdeˇlenı´ z(0, 025) a z(0, 975).
¯ je tedy take´ vlastneˇ na´hodna´ velicˇina. Nasˇteˇstı´ zna´me jejı´ vlastnosti. Pru˚meˇr X Je-li X ∼ N (µ, σ 2 ) a ma´me-li vy´beˇr o velikosti n, 2
¯ ∼ N (µ, σ ). X n Pru˚meˇr tedy bude kolı´sat kolem skutecˇne´ strˇednı´ hodnoty µ, je jejı´m odhadem. Avsˇak pokud bychom znali jenom pru˚meˇr, moc na´m to nepomu˚zˇe, protozˇe nevı´me, jak daleko je tento na´sˇ odhad od skutecˇne´ strˇednı´ hodnoty. Interval spolehlivosti Proto je vhodne´ kromeˇ bodove´ho odhadu strˇednı´ hodnoty uva´deˇt i intervalovy´ odhad. Je to interval, ktery´ pokryje skutecˇnou strˇednı´ hodnotu s prˇedem stanovenou pravdeˇpodobnostı´, veˇtsˇinou se volı´ 90 nebo 95 %, prˇ´ıpadneˇ 99 %. Lze uka´zat, zˇe 95% interval spolehlivosti ma´ na´sledujı´cı´ podobu: σ σ (¯ x − 1, 96 √ , x¯ + 1, 96 √ ). n n Konstanta z(0, 025) = 1, 96 je 97, 5% kvantil standardizovane´ho norma´lnı´ho rozdeˇlenı´. Pro X ∼ N (0, 1) platı´, zˇe P (|X| > 1, 96) = 0, 05, viz obr. 8. Kdybychom chteˇli urcˇit jiny´ nezˇ 95% interval spolehlivosti, stacˇ´ı nahradit cˇ´ıslo 1, 96 prˇ´ıslusˇny´m kvantilem norma´lnı´ho rozdeˇlenı´.
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
13
Smeˇrodatnou odchylku veˇtsˇinou nezna´me, nahrazujeme ji proto odhadem s. Tı´m vsˇak prˇina´sˇ´ıme dalsˇ´ı nejistotu a musı´me pouzˇ´ıt upraveny´ vzorec pro 95% interval spolehlivosti s x¯ ± t(n−1) (0, 025) √ , n kde t(n−1) (0, 025) je 97, 5% kvantil (kriticka´ hodnota) studentova rozdeˇlenı´ o n−1 stupnı´ch volnosti. Studentovo rozdeˇlenı´ je velmi podobne´ norma´lnı´mu, prˇi veˇtsˇ´ım pocˇtu pozorova´nı´ (nad 100) je mozˇne´ pouzˇ´ıvat kvantily norma´lnı´ho rozdeˇlenı´. Tyto vzorecˇky pravdeˇpodobneˇ v beˇzˇne´ praxi pouzˇ´ıvat nebudeme, statisticky´ software na´m rovnou prozradı´ interval spolehlivosti. Je vsˇak dobre´ veˇdeˇt, jak k neˇmu dospeˇl. Prˇ´ıklad 7. Intervalove´ odhady v prˇ´ıkladeˇ 6 vysˇly na´sledovneˇ: 1.vy´beˇr: 2.vy´beˇr: 3.vy´beˇr:
(15,28 , 25,07) (20,55 , 24,82) (22,64 , 23,64)
Vsˇechny pokry´vajı´ skutecˇnou strˇednı´ hodnotu, ktera´ byla 23. Na za´veˇr uved’me neˇkolik tvrzenı´. • Cˇ´ım veˇtsˇ´ı pocˇet pozorova´nı´, tı´m uzˇsˇ´ı interval spolehlivosti (prˇesneˇjsˇ´ı odhad). • Cˇ´ım mensˇ´ı smeˇrodatna´ odchylka, tı´m uzˇsˇ´ı interval spolehlivosti (prˇesneˇjsˇ´ı odhad). • Cˇ´ım mensˇ´ı prˇesnost pozˇadujeme, tı´m uzˇsˇ´ı interval spolehlivosti obdrzˇ´ıme.
3.2
Testova´nı´ hypote´z
V testova´nı´ hypote´z je klı´cˇovou za´lezˇitostı´ jejich spra´vna´ formulace. To nemusı´ by´t jednoduchy´ krok, protozˇe statisticka´ hypote´za nenı´ tote´zˇ co hypote´za medicı´nska´. Tzv. nulova´ hypote´za (H0 ) je veˇtsˇinou tvrzenı´ o hodnoteˇ parametru (cˇasto pra´veˇ o strˇednı´ hodnoteˇ). Naprˇ. „Strˇednı´ hodnota LTV u zdravy´ch a te´meˇrˇ ztraceny´ch deˇtı´ je stejna´.“ Zpravidla je to opak toho, co chceme uka´zat. Alternativnı´ hypote´za (H1 ) je doplnˇkem nulove´. Tedy zˇa´dna´ jina´ hodnota parametru (nezˇ ta, ktera´ je obsazˇena v teˇchto dvou hypote´za´ch) nenı´ mozˇna´. K uvedene´mu prˇ´ıkladu by alternativnı´ hypote´za byla: „Strˇednı´ hodnota LTV u zdravy´ch a te´meˇrˇ ztraceny´ch deˇtı´ nenı´ stejna´.“
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
14
Logika testova´nı´ Hypote´zu chceme otestovat na datech. Avsˇak sta´le tu ma´me na´hodu. Tu se pokusı´me „ohlı´dat“. Prˇedem si stanovı´me hladinu testu α, tedy pravdeˇpodobnost, se kterou si dovolı´me udeˇlat chybny´ za´veˇr. Veˇtsˇinou se volı´ α = 0, 05. Prˇi testova´nı´ postupujeme na´sledovneˇ. • Prˇedpokla´da´me, zˇe platı´ H0 . • Z dat spocˇ´ıta´me testovou statistiku (naprˇ. pru˚meˇr). • Spocˇ´ıta´me pravdeˇpodobnost, zˇe bychom za H0 pozorovali nasˇe data nebo data stejneˇ cˇi vı´ce extre´mnı´. Tato pravdeˇpodobnost se je tzv. dosazˇena´ hladina vy´znamnosti, neboli p − hodnota. • Bude-li p−hodnota mensˇ´ı nebo rovna prˇedem zvolene´ hladineˇ testu α, H0 zamı´ta´me, bude-li velka´, H0 nezamı´ta´me. Mozˇna´ rozhodnutı´ Na´sledujı´cı´ tabulka uva´dı´ vsˇechny mozˇnosti, jak nasˇe rozhodnutı´ mu˚zˇe dopadnout.
Skutecˇnost H0 platı´ H0 neplatı´
Rozhodnutı´ H0 zamı´tneme H0 nezamı´tneme Chyba 1. druhu (α) Spra´vne´ rozhodnutı´ Spra´vne´ rozhodnutı´ Chyba 2. druhu (β)
Lze se dopustit dvou chyb. Chyba prvnı´ho druhu nastane, pokud zamı´tneme nulovou hypote´zu, prˇestozˇe ve skutecˇnosti platı´. Chyby druhe´ho druhu se dopustı´me v prˇ´ıpadeˇ, zˇe nezamı´tneme nulovou hypote´zu, prˇestozˇe neplatı´. Nenı´ mozˇne´ minimalizovat obeˇ chyby najednou, nebot’jdou „proti sobeˇ“. Cˇ´ım je mensˇ´ı chyba prvnı´ho druhu, tı´m je veˇtsˇ´ı chyba druhe´ho druhu a opacˇneˇ. Proto fixujeme chybu prvnı´ho druhu (α), tradicˇneˇ α = 5%, chyba druhe´ho druhu (β) uzˇ je tı´m dana´. Sı´lu testu (1 − β) mu˚zˇeme ovlivnit velikostı´ vy´beˇru. Prˇi male´m vy´beˇru se tedy mu˚zˇe sta´t, zˇe se kvu˚li male´ sı´le „nepodarˇ´ı“ zamı´tnout H0 , prˇestozˇe neplatı´. Jednovy´beˇrovy´ t-test Jednovy´beˇrovy´ t-test testuje hypote´zu o strˇednı´ hodnoteˇ rozdeˇlenı´, konkre´tneˇ to, zda je rovna neˇjake´ dane´ hodnoteˇ µ0 . H 0 : µ = µ0 H1 : µ 6= µ0
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
15
Protozˇe se strˇednı´ hodnota odhaduje pru˚meˇrem, je testova´ statistika na´sledujı´cı´ T =
¯ − µ0 X √s n
.
Vajadrˇuje rozdı´l mezi napozorovanou a prˇedpokla´danou strˇednı´ hodnotou, ktery´ vztahuje k variabiliteˇ dat. Je videˇt, zˇe velke´ hodnoty |T | vypovı´dajı´ proti H0 (rozdı´l mezi tı´m, co jsme ocˇeka´va´li a co jsme napozorovali, je prˇ´ılisˇ velky´). Dı´ky tomu, zˇe zna´me rozdeˇlenı´ testove´ statistiky T , mu˚zˇeme stanovit tzv. kritickou hodnotu. Za platnosti H0 by T meˇla kritickou hodnotu prˇekrocˇit s pravdeˇpodobnostı´ α. V tomto prˇ´ıpadeˇ je kritickou hodnotou kvantil studentova rozdeˇlenı´ o n − 1 stupnı´ch volnosti, znacˇ´ıme tn−1 ( α2 ). Hypote´zu H0 tedy zamı´ta´me, je-li |T | > tn−1 ( α2 ). Pro velke´ n nahrazujeme tn−1 ( α2 ) kvantilem norma´lnı´ho rozdeˇlenı´ z( α2 ). Abychom jednovy´beˇrovy´ t-test mohli pouzˇ´ıt, musı´ by´t splneˇny na´sledujı´cı´ prˇedpoklady: • Rozdeˇlenı´ sledovane´ velicˇiny je blı´zke´ norma´lnı´mu • Pozorova´nı´ jsou navza´jem neza´visla´ (tj. nejsou zde opakovana´ meˇrˇenı´ od jedne´ osoby apod.) Prˇ´ıklad 8. Nameˇrˇili jsme LTV pouze u „te´meˇrˇ ztraceny´ch“ deˇtı´. Prˇedpokla´dejme, zˇe vı´me, zˇe strˇednı´ hodnota LTV u zdravy´ch deˇtı´ je 23. Je mozˇne´ rˇ´ıci, zˇe se „te´meˇrˇ ztracene´“ deˇti z hlediska LTV lisˇ´ı od norma´lnı´ch? H0 : µ = 23 H1 : µ 6= 23 13, 7 − 23 = −8, 13. T = 5,82 √
26
T < t25 (0, 025) = −2, 06, tedy zamı´ta´me H0 . V softwaru a publikacı´ch cˇasto najdeme jako vy´sledek testu uvedenou phodnotu. V tomto prˇ´ıpadeˇ je p = 1, 7 ∗ 10−8 . Pokud je p-hodnota takto mala´, pı´sˇe se zpravidla p < 0, 001. Uve´st p-hodnotu je lepsˇ´ı nezˇ sdeˇlit pouze vy´sledek testu (H0 zamı´tnuta/nezamı´tnuta). Da´va´ to prˇedstavu, jak daleko jsme od kriticke´ hodnoty. Jednostranny´ t-test Prˇedpokla´dejme vsˇak, zˇe bychom uzˇ prˇedem veˇdeˇli, zˇe „te´meˇrˇ ztracene´“ deˇti rozhodneˇ nemohou mı´t LTV veˇtsˇ´ı nezˇ deˇti zdrave´. H 0 : µ = µ0 H1 : µ < µ0
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
16
Testova´ statistika je v tomto prˇ´ıpadeˇ stejna´ T =
¯ − µ0 X √s n
,
avsˇak sledujeme pouze, o kolik je pru˚meˇr mensˇ´ı nezˇ strˇednı´ hodnota. Male´ hodnoty T vypovı´dajı´ proti H0 , zamı´ta´me ji, je-li T < tn−1 (α). Pro velke´ n nahrazujeme kvantil studentova rozdeˇlenı´ tn−1 (α) kvantilem norma´lnı´ho rozdeˇlenı´ z(α). Prˇedpoklady zde jsou stejne´ jako u oboustranne´ho t-testu. Jednostranny´ test je silneˇjsˇ´ı, protozˇe reflektuje apriornı´ informaci. Tato informace ovsˇem musı´ by´t podlozˇena´. Nelze nejprve zjistit vy´sledek T statistiky, a potom volit typ t-testu. Dvouvy´beˇrovy´ t-test Jak na´zev napovı´da´, dvouvy´beˇrovy´ t-test porovna´va´ dveˇ skupiny A a B, konkre´tneˇ jejich strˇednı´ hodnoty. H 0 : µA = µB H1 : µA 6= µB Testova´ statistika porovna´va´ pru˚meˇry: ¯A − X ¯ B r nA nB ¯A − X ¯B X X . T = ¯A − X ¯B ) = s nA + nB se(X Velke´ hodnoty |T | vypovı´dajı´ proti H0 . Zamı´ta´me ji, pokud je |T | > tnA +nB −2 ( α2 ). Dvouvy´beˇrovy´ t-test smı´me pouzˇ´ıt, jsou-li splneˇny na´sledujı´cı´ prˇedpoklady • Rozdeˇlenı´ sledovane´ velicˇiny je v kazˇde´ skupineˇ blı´zke´ norma´lnı´mu. • Pozorova´nı´ jsou navza´jem neza´visla´ (mezi skupinami i uvnitrˇ skupin). • V obou skupina´ch je shodny´ rozptyl. Pokud splneˇny nejsou, je nutne´ pouzˇ´ıt jine´ na´stroje, naprˇ. existuje u´prava t-testu, ktera´ nevyzˇaduje shodnost rozptylu˚. Prˇ´ıklad 9. Nameˇrˇili jsme LTV u skupiny „te´meˇrˇ ztraceny´ch“ deˇtı´ a u skupiny „norma´lnı´ch“ deˇtı´. Je mozˇne´ rˇ´ıci, zˇe se LTV v teˇchto dvou skupina´ch v pru˚meˇru lisˇ´ı? H 0 : µz = µn H1 : µz 6= µn r 13, 70 − 23, 68 26 ∗ 15 T = = −4, 62 6, 66 26 + 15 T < t39 (0, 025) = −2, 02, p = 4, 09 ∗ 10−5 < 0, 001, tudı´zˇ zamı´ta´me H0 . Dvouvy´beˇrovy´ t-test ma´ take´ samozrˇejmeˇ jednostrannou a oboustrannou verzi.
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
17
Pa´rovy´ t-test Prˇ´ıklad 10. U kazˇde´ho z pacientu˚ byl zjisˇteˇn krevnı´ tlak prˇed poda´nı´m a dveˇ hodiny po poda´nı´ farmaka. Ovlivnˇuje poda´nı´ farmaka krevnı´ tlak? [2] Nameˇrˇene´ hodnoty prˇed: 206, 205, 205, 198, 191, 185,186, 172, 168, 165, 158 Nameˇrˇene´ hodnoty po: 187, 178, 202, 197, 173, 167, 184, 166, 155, 125, 162 Mozˇna´ by na´s napadlo pouzˇ´ıt jednostranny´ dvouvy´beˇrovy´ t-test: H0 : µpred = µpo H1 : µpred > µpo Dostali bychom p = 0, 07 a H0 bychom nezamı´tli, tj. neproka´zali bychom u´cˇinnnost le´ku. Chyba je zde v tom, zˇe pozorova´nı´ prˇed a po poda´nı´ le´ku jsou za´visla´ (ma´me zde dvojice meˇrˇenı´ provedene´ na jednom pacientovi). Nenı´ tedy splneˇn jeden z prˇedpokladu˚ dvouvy´beˇrove´ho t-testu. Vyply´va´ to uzˇ z designu studie musı´me to zohlednit. Definujeme rozdı´ly Di = P redi − P oi a pouzˇijeme (jednostranny´) jednovy´beˇrovy´ t-test. H0 : µd = µpred − µpo = 0 H1 : µd = µpred − µpo > 0 ¯d − 0 13 − 0 X = 13,09 = 3, 29, sd √
n
√
11
p-hodnota = 0, 004 → zamı´ta´me H0 , u´cˇinnnost le´ku jsme proka´zali. Pozn. Na posouzenı´ le´karˇe vsˇak zu˚sta´va´, jestli pru˚meˇrne´ snı´zˇenı´ tlaku o 13 mm Hg je vy´sledek vy´znamny´ nejen statisticky, ale i klinicky. ANOVA Prˇ´ıklad 11. Na´sledujı´cı´ studie je uvedena v [2]. 20 pacientu˚, kterˇ´ı podstoupili operaci srdce, bylo na´hodneˇ rozdeˇleno do trˇ´ı skupin. • Pacienti, kterˇ´ı dostali 50% oxidu dusne´ho a 50% kyslı´kove´ smeˇsi 24 hodin • Pacienti, kterˇ´ı dostali 50% oxidu dusne´ho a 50% kyslı´kove´ smeˇsi beˇhem operace • Pacienti, kterˇ´ı dostali 35 − 50% kyslı´ku 24 hodin Lisˇ´ı se strˇednı´ koncentrace soli kyseliny listove´ v cˇerveny´ch krvinka´ch v teˇchto skupina´ch? Data jsou zobrazena na obr. 9.
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
18
350
●
● ●
300
● ●
● ● ●
●
●
● ● ● ●
250
Koncentrace
●
●
● ●
200
● ● ●
1
2
3
skupina
Obra´zek 9: Koncentrace soli kyseliny listove´ v cˇerveny´ch krvinka´ch ve trˇech skupina´ch pacientu˚.
Prvnı´ na´pad, ktery´ bychom dostali, by byl porovnat vsˇechny dvojice dvouvy´beˇrovy´mi t-testy: Skupina 1 vs Skupina 2 Skupina 1 vs Skupina 3 Skupina 2 vs Skupina 3 Opeˇt bychom se vsˇak dopustili chyby. Ma´-li kazˇdy´ test pravdeˇpodobnost chybne´ho pozitivnı´ho vy´sledku 5%, vy´sledna´ pravdeˇpodobnost, zˇe dostaneme alesponˇ jeden chybny´ pozitivnı´ vy´sledek, je veˇtsˇ´ı nezˇ 5% (konkre´tneˇ v prˇ´ıpadeˇ trˇ´ı porovna´nı´ cca 14%). Pozna´mka Zde nara´zˇ´ıme na obecneˇjsˇ´ı proble´m tzv. mnohona´sobne´ho testova´nı´. To je cˇasta´ chyba mnoha odborny´ch publikacı´. Prˇedstavme si, zˇe bychom meˇli dveˇ skupiny pacientu˚ podle zjisˇteˇne´ alely v urcˇite´m geneticke´m lokusu. Na vsˇech pacientech bychom uskutecˇnili meˇrˇenı´ desı´tek parametru˚. Je te´meˇrˇ jiste´, zˇe by na´m vysˇel neˇjaky´ statisticky signifikantnı´ vy´sledek pouze na´hodnou. Tote´zˇ platı´ o podskupina´ch jedincu˚ zarˇazeny´ch do studie. Skoro urcˇiteˇ bychom nasˇli neˇjak definovanou podskupinu (naprˇ. pouze zˇeny, pouze lide´ strˇednı´ho veˇku, pouze lide´ s nı´zky´mi hodnotami celkove´ho cholesterolu, . . . ), ve ktere´ je vy´sledek signifikantnı´, i kdyzˇ pro celou skupinu signifikantnı´ nenı´.
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
19
Proble´m porovna´nı´ vı´ce skupin rˇesˇ´ıme metodou analy´zy rozptylu (ANOVA). Tu si zde pouze nastı´nı´me, nebot’nema´me dostatek prostoru si ji vysveˇtlit podrobneˇji. ANOVA testuje hypote´zu o rovnosti strˇednı´ch hodnot ve vsˇech k skupina´ch najednou. H 0 : µ 1 = µ 2 = · · · = µk H1 : Neplatı´ H0 (Alesponˇ jedna skupina se lisˇ´ı.) Testova´ statistika porovna´va´ variabilitu mezi skupinami a variabilitu uvnitrˇ skupin F =
variabilita mezi skupinami . variabilita uvnitrˇ skupin
Velke´ hodnoty F sveˇdcˇ´ı proti H0 . Opeˇt je potrˇeba, aby data splnˇovala na´sledujı´cı´ prˇedpoklady: • Rozdeˇlenı´ sledovane´ velicˇiny je v kazˇde´ skupineˇ blı´zke´ norma´lnı´mu. • Pozorova´nı´ jsou navza´jem neza´visla´ (mezi skupinami i uvnitrˇ skupin). • Ve vsˇech skupina´ch je shodny´ rozptyl. Prˇ´ıklad 12. Test rovnosti strˇednı´ch hodnot koncentrace soli kyseliny listove´ v popsany´ch skupina´ch pacientu˚ da´va´ p-hodnotu 0.015, H0 tedy zamı´ta´me. Ktera´ skupina se vsˇak lisˇ´ı od ktere´? Pro zodpoveˇzenı´ te´to ota´zky nynı´ provedeme porovna´nı´ vsˇech dvojic skupin dvouvy´beˇrovy´m t-testem. Proble´m mnohona´sobne´ho testova´nı´ osˇetrˇ´ıme tzv. Bonferroniho korekcı´ - za signifikantnı´ budeme povazˇovat vy´sledek, kdy je p-hodnota < αk . V nasˇem prˇ´ıkladeˇ tedy provedeme trˇi porovna´nı´: Skupina 1 vs Skupina 2: Skupina 1 vs Skupina 3: Skupina 2 vs Skupina 3:
p = 0.006 < 0.0167 p = 0.095 > 0.0167 p = 0.368 > 0.0167
Mu˚zˇeme tedy tvrdit, zˇe vy´znamny´ rozdı´l je mezi pru˚meˇry skupin 1 a 2, ale ne mezi ostatnı´mi. Wilcoxonu˚v test Wilcoxonu˚v test povazˇujeme za neparametrickou analogii t-testu. Mu˚zˇeme jej pouzˇ´ıt ve stejne´ situaci jako t-test, ma´ vsˇak tu vy´hodu, zˇe je platny´ i kdyzˇ je porusˇen prˇedpoklad o norma´lnı´m rozdeˇlenı´ dat (musı´ vsˇak by´t spojite´). Jeho nevy´hodou je to, zˇe ma´ mensˇ´ı sı´lu, to znamena´, zˇe za prˇedpokladu normality by meˇl mı´t t-test prˇednost. Tentokra´t testujeme hypote´zu o media´nu:
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
20
H0 : Media´n x˜ = 0 H1 : Media´n x˜ 6= 0 Na´sledujeme tyto kroky: • Urcˇ´ıme porˇadı´ Ri+ hodnot |Xi |. • Urcˇ´ıme soucˇet teˇch porˇadı´, kde bylo Xi > 0, oznacˇ´ıme jej W . • Polozˇ´ıme
W − n(n + 1)/4
Z=p
n(n + 1)(2n + 1)/24
Vysoke´ hodnoty Z vypovı´dajı´ proti H0 . Neparametricke´ analogie parametricky´ch testu˚ Pro u´plnost uved’me alesponˇ na´zvy neparametricky´ch alternativ k ostatnı´m testu˚m. rozdeˇlenı´ parametr jeden vy´beˇr vy´beˇr dvojic dva neza´visle´ vy´beˇry k neza´visly´ch vy´beˇru˚
norma´lnı´ strˇednı´ hodnota jednovy´beˇrovy´ t-test pa´rovy´ t-test dvouvy´beˇrovy´ t-test analy´za rozptylu (ANOVA)
spojite´ media´n jednovy´beˇrovy´ Wilcoxon Wilcoxon Mann-Whitney (Kolmogorov-Smirnov) Kruskal-Wallis
Analy´za kategoria´lnı´ch dat Azˇ dosud jsme se zaby´vali hodnocenı´m intervalove´ promeˇnne´. Zaby´vejme se nynı´ kategoricky´mi znaky. Prˇ´ıklad 13. Ve vysˇetrˇovane´ populaci jsou krevnı´ skupiny 0, A, B a AB v pomeˇru 35 %, 35 %, 20 % a 10 %. Ve vzorku pacientu˚ byly pocˇty osob s krevnı´mi skupinami po rˇadeˇ 28, 36, 27, 9. Lze povazˇovat tento vy´beˇr za reprezentativnı´ vzhledem k vy´skytu krevnı´ch skupin? [1] Zde chceme testovat hypote´zu o rozdeˇlenı´ kategoricke´ho znaku. H0 : Kategoricky´ znak ma´ prˇedpokla´dane´ rozdeˇlenı´. H1 : Kategoricky´ znak nema´ prˇedpokla´dane´ rozdeˇlenı´. Prˇedpokla´dejme, zˇe ma´ testovany´ znak k kategoriı´. Testova´ statistika porovna´va´ napozorovane´ cˇetnosti (N1 , N2 , . . . , Nk ) jednotlivy´ch kategoriı´ s teoreticky´mi.
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
21
Jsou-li teoreticke´ pravdeˇpodobnosti π1 , π2 , . . . , πk , teoreticke´ cˇetnosti pro n pozorova´nı´ musı´ by´t nπ1 , nπ2 , . . . , nπk . Urcˇ´ıme statistiku
χ2 =
(N1 − n ∗ π1 )2 (N2 − n ∗ π2 )2 (Nk − n ∗ πk )2 + + ··· + . n ∗ π1 n ∗ π2 n ∗ πk
Velke´ hodnoty χ2 vypovı´dajı´ proti H0 . Testovou statistiku porovna´va´me s kritickou hodnotou χ2k−1 (α). Prˇ´ıklad 14. V nasˇem prˇ´ıkladeˇ dosta´va´me χ2 =
(28 − 35)2 (36 − 35)2 (27 − 20)2 (9 − 10)2 + + + = 3, 98, 35 35 20 35
p-hodnota=0.24, nezamı´ta´me H0 , vy´beˇr mu˚zˇeme povazˇovat za reprezentativnı´. Neza´vislost dvou kategoricky´ch znaku˚ Umı´me take´ testovat hypote´zu o neza´vislosti dvou znaku˚. Prˇ´ıklad 15. V [2] je uveden na´sledujı´cı´ prˇ´ıklad. Ocˇkova´nı´ proti chrˇipce se u´cˇastnilo 460 dospeˇly´ch. Z nich 240 dostalo ocˇkovacı´ la´tku, 220 placebo. Chrˇipkou onemocneˇlo 20 z ocˇkovacı´ skupiny a 80 z kontrolnı´ skupiny. Je to dostatecˇny´ du˚kaz o tom, zˇe je ocˇkovacı´ la´tka u´cˇinna´? Sestavı´me tzv. kontingencˇnı´ tabulku. Chrˇipka Ano Ne Celkem
Ocˇkova´nı´ 20 220 240
Placebo 80 140 220
Celkem 100 360 460
V tomto prˇ´ıkladeˇ chceme otestovat nulovou hypote´zu, zˇe onemocneˇnı´ chrˇipkou je neza´visle´ na tom, zda byla osoba ocˇkovana´. Zamı´tnutı´m H0 uka´zˇeme, zˇe onemocneˇnı´ je ocˇkova´nı´m ovlivneˇno. Obecneˇ testujeme hypote´zy o dvou kategoricky´ch znacı´ch (mohou mı´t i vı´ce kategoriı´ nezˇ dveˇ.) H0 : Dva znaky jsou na sobeˇ neza´visle´. H1 : Dva znaky nejsou neza´visle´. Testova´ statistika porovna´va´ napozorovane´ cˇetnosti v kontingencˇnı´ tabulce (r × s) s ocˇeka´vany´mi: Ocˇeka´vana´ cˇetnost =
soucˇet v rˇa´dku × soucˇet ve sloupci celkovy´ pocˇet pozorova´nı´
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
χ2 =
22
X (pozorovana´ cˇetnost − ocˇeka´vana´ cˇetnost)2
. ocˇeka´vana´ cˇetnost Velke´ hodnoty χ2 mluvı´ proti H0 . Testovou statistiku porovna´va´me s kritickou hodnotou χ2(r−1)(s−1) (α). Prˇ´ıklad χ2 =
V uvedene´m prˇ´ıkladeˇ 15 to bude
(20 − 52, 17)2 (80 − 47, 83)2 (220 − 187, 83)2 (140 − 172, 17)2 + + + = 53, 0 52, 17 47, 83 187, 83 172, 17
p-hodnota= 7, 63 ∗ 10−13 < 0, 001, nezamı´ta´me H0 . Upozorneˇnı´: Tento test da´va´ spolehlive´ vy´sledky jen pokud jsou napozorovane´ cˇetnosti dostatecˇneˇ velke´, obvykle se uda´va´, zˇe by meˇly by´t veˇtsˇ´ı nebo rovno 5. Korelace Umı´me jizˇ posuzovat za´vislost spojite´ho znaku na kategoricke´m (porovna´va´nı´ strˇednı´ hodnoty dvou nebo vı´ce skupin), za´vislost dvou kategoricky´ch znaku˚, neumı´me vsˇak hodnotit za´vislost dvou spojity´ch znaku˚. Teoretickou mı´rou zachycujı´cı´ linea´rnı´ za´vislost dvou na´hodny´ch velicˇin je kovariance cov(X, Y ) = E(X − µX )(Y − µY ). Vidı´me, zˇe se jedna´ o jake´si zobecneˇnı´ rozptylu. Meˇla by vystihovat, „jak moc spolu se tyto dveˇ na´hodneˇ velicˇiny meˇnı´“. Protozˇe kovariance za´visı´ na zvolene´m meˇrˇ´ıtku, definujeme Pearsonu˚v korelacˇnı´ koeficient ρX,Y = cov
X − µ Y − µ cov(X, Y ) Y X , =√ . σX σY var Xvar Y
Je to kovariance „normovana´ rozptylem teˇchto dvou na´hodny´ch velicˇin“. Tı´m dostaneme bezrozmeˇrne´ cˇ´ıslo −1 ≤ ρX,Y ≤ 1. Na obra´zku 10 je videˇt, zˇe kladna´ korelace znamena´ prˇ´ımou, zatı´mco za´porna´ neprˇ´ımou za´vislost. Cˇ´ım je koeficient v absolutnı´ hodnoteˇ veˇtsˇ´ı, tı´m je za´vislost „uzˇsˇ´ı“. Vy´beˇrovy´ korelacˇnı´ koeficient, tedy odhad Pearsonova korelacˇnı´ho koeficientu je P ¯ i − Y¯ ) (Xi − X)(Y rXY = pP . ¯ 2 P(Yi − Y¯ )2 (Xi − X)
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
23
Obra´zek 10: Korelacˇnı´ koeficienty.
Co korelace je a co nenı´ Cˇasto se sta´va´, zˇe slovo korelovat se pouzˇ´ıva´ jako kdyby meˇlo pouze dveˇ kategorie: bud’ neˇco koreluje, nebo ne. V oblasti statistiky je vsˇak korelace mı´rou za´vislosti, tedy je to cˇ´ıslo z intervalu [−1, 1]. Korelacˇnı´ koeficient vyjarˇuje mı´ru linea´rnı´ za´vislosti dvou velicˇin. Je-li nulovy´, neznamena´ to, zˇe spolu velicˇiny nesouvisı´. Mu˚zˇe totizˇ by´t mezi nimi jiny´ nezˇ linea´rnı´ vztah. Korelacˇnı´ koeficient na´m linea´rnı´ za´vislost nepopı´sˇe (neda´ rovnici pro prˇ´ımku) a navı´c neumı´ zachytit slozˇiteˇjsˇ´ı formy za´vislosti. V literaturˇe se cˇasto ke korelacˇnı´mu koeficientu uva´dı´ p-hodnota. Ta se ty´ka´ hypote´zy o nulovosti korelacˇnı´ho koeficientu: H0 : ρXY = 0 H1 : ρXY 6= 0 Pouzˇ´ıva´ se test, ktery´ je platny´ pro norma´lneˇ rozdeˇlene´ na´hodne´ velicˇiny. Poznamenejme, zˇe vy´sledek tohoto testu rˇ´ıka´ pouze, zda je korelacˇnı´ koeficient roven nule cˇi nikoliv. Pro veˇtsˇ´ı vy´beˇry se tak i jeho mala´ hodnota bude signifikantneˇ lisˇit od nuly, cozˇ vsˇak prakticky nemusı´ nic znamenat. Neparametrickou analogiı´ Pearsonova korelacˇnı´ho koeficientu je Spearmanu˚v korelacˇnı´ koeficient (zalozˇen na porˇadı´). Regrese Le´pe na´m v meˇrˇenı´ za´vislosti dvou i vı´ce kvantitativnı´ch znaku˚ poslouzˇ´ı linea´rnı´ regrese. Protozˇe se jedna´ o rozsa´hle´ a pokrocˇilejsˇ´ı te´ma, nebudeme se jı´ zaby´vat
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
24
Obra´zek 11: Regresnı´ prˇ´ımka
podrobneˇ, pokusı´me se pouze zachytit jejı´ vy´znam. Nejprve zkoumejme vztah mezi dveˇma spojity´mi velicˇinami, kdy jedna z nich je tzv. „neza´visle“ promeˇnna´ x, ktera´ rˇ´ıdı´ (s neˇjaky´mi odchylkami) za´visle promeˇnnou Y . Umı´me odhadnout, zda je linea´rnı´ vztah mezi teˇmito dveˇma velicˇinami, a pokud ano, najdeme rovnici pro prˇ´ımku, tj. model te´to za´vislosti (viz obra´zek 11). Je podstatne´, zˇe tı´mto zpu˚sobem umı´me popsat i slozˇiteˇjsˇ´ı za´vislosti mezi vı´ce promeˇnny´mi. Prˇ´ıklad 16. U mlady´ch muzˇu˚ jsme vysˇetrˇovali za´vislost procenta tuku na vy´sˇce [1]. Avsˇak procento tuku za´visı´ zajiste´ i na hmotnosti. Bodove´ grafy vykreslujı´cı´ procento tuku proti hmotnosti a vy´sˇce a prˇ´ıslusˇne´ korelacˇnı´ koeficienty jsou na obra´zku 12. Povsˇimneˇme si prˇedevsˇ´ım, zˇe korelacˇnı´ koeficint mezi procentem tuku a vy´sˇkou je kladny´. Znamenalo by to, zˇe cˇ´ım je muzˇ vysˇsˇ´ı, tı´m ma´ i veˇtsˇ´ı procento tuku. To je vsˇak zpu˚sobeno tı´m, zˇe korelacˇnı´ koeficient v tomto prˇ´ıpadeˇ zcela ignoruje hmotnost, ktera´ vsˇak s vy´sˇkou zrˇejmeˇ souvisı´. Potom se informace o hmotnosti objevı´ i v informaci o vy´sˇce a dostaneme prˇekvapivy´ za´veˇr. Je videˇt, zˇe takovy´ prˇ´ıstup postra´da´ smysl (ve veˇtsˇineˇ prˇ´ıpadu˚). Prˇi vysˇetrˇova´nı´ za´vislosti procenta tuku na vy´sˇce tedy potrˇebujeme „adjustovat na hmotnost“, tj. popsat, jak prˇi dane´ hmotnosti za´visı´ procento tuku na vy´sˇce. V tomto kontextu je hmotnost tzv. matoucı´ (confounding) promeˇnna´. Hleda´me rovnici EY = β0 + β1 x1 + · · · + βp xp ,
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
25
Obra´zek 12: Procento tuku v za´vislosti na hmotnosti a vy´sˇce.
cozˇ je v nasˇem prˇ´ıkladeˇ E tuk = β0 + β1 vy´sˇka + β2 hmotnost. Pokousˇ´ıme se vysveˇtlit nameˇrˇene´ hodnoty tuku hodnotami vy´sˇky a hmotnosti. Toto vysveˇtlenı´ nikdy nebude u´plne´, ale neˇkdy mohou neza´visle´ (vysveˇtlujı´cı´) promeˇnne´ pomoci vysveˇtlit variabilitu za´visle´ promeˇnne´ z podstatne´ cˇa´sti. V uvedene´m prˇ´ıkladeˇ dostaneme na´sledujı´cı´ rovnici E tuk = 11, 327 − 0, 262 vy´sˇka + 0, 624 hmotnost, ktera´ (nynı´ jizˇ ve shodeˇ s intuicı´) rˇ´ıka´, zˇe prˇi dane´ hmotnosti s rostoucı´ vy´sˇkou klesa´ procento tuku (prˇesneˇji rˇecˇeno jeho strˇednı´ hodnota), konkre´tneˇ prˇi pevneˇ stanovene´ hmotnosti s kazˇdy´m centimetrem je procento tuku v pru˚meˇru o 0,262 mensˇ´ı.
4 Za´veˇrem Prˇi pla´nova´nı´ studie se cˇasto aspekt statisticke´ analy´zy podcenˇuje. Autorˇi se domnı´vajı´, zˇe je mozˇne´ nejprve „sesbı´rat“ data, a potom teprve hledat, jake´ metody analy´zy pouzˇ´ıt, v nouzi potom prˇijı´t za statistikem, „aby s tı´m neˇco udeˇlal“. Mu˚zˇe se vsˇak docela snadno sta´t, zˇe ani prˇi nejlepsˇ´ı vu˚li „uzˇ s tı´m nic udeˇlat nejde“ . Proto se doporucˇuje konzultace se statistikem uzˇ v prvnı´ch fa´zı´ch prˇ´ıpravy. Pomu˚zˇe naprˇ. formulovat na za´kladeˇ medicı´nske´ hypote´zy hypote´zu statistickou,
Principy medicı´ny zalozˇene´ na du˚kazech a za´klady veˇdecke´ prˇ´ıpravy
26
navrhnout efektivnı´ design studie, urcˇit optima´lnı´ velikost vy´beˇru, upozornit na mozˇna´ u´skalı´, ktera´ si nestatistik nemusı´ uveˇdomit, a hlavneˇ napla´novat vlastnı´ statistickou analy´zu. Ta ma´ by´t stanovena´ apriory, nemeˇla by by´t prˇizpu˚sobena vy´sedku˚m, ktere´ dosta´va´me. V neposlednı´ rˇadeˇ stojı´ za zva´zˇenı´ i ota´zka sbeˇru dat. Pokud se jedna´ o malou studii (rˇa´doveˇ desı´tky pozorova´nı´), je mozˇne´ k za´znamu pouzˇ´ıt obycˇejnou tabulku naprˇ. v Excelu. Pokud by meˇlo jı´t o rozsa´hlejsˇ´ı databa´zi, bude vhodne´ uvazˇovat o jine´m softwarove´m vybavenı´, neˇkdy specia´lneˇ „sˇite´m na mı´ru “. Vhodne´ na´stroje pro sbeˇr dat nejen ulehcˇ´ı pra´ci, ale pomohou se vyvarovat i mnoha technicky´m chyba´m, prˇepisu˚m apod. Podstatnou ota´zkou take´ je, jake´ hodnoty sledovat, „co vsˇechno meˇrˇit “. Vhodneˇjsˇ´ı je se zameˇrˇit na neˇkolik konkre´tnı´ch znaku˚, ktere´ opravdu potrˇebujeme zna´t, nezˇ prova´deˇt desı´tky meˇrˇenı´ „pro jistotu “. V druhe´m prˇ´ıpadeˇ je totizˇ odvedena pozornost od podstatne´ho a vznika´ neprˇimeˇrˇena´ za´teˇzˇ pro persona´l, cozˇ mu˚zˇe ve´st k tomu, zˇe mnoho meˇrˇenı´ chybı´. To do statisticke´ analy´zy prˇina´sˇ´ı velke´ proble´my, neˇkdy jsou takova´ „deˇrava´ data “ te´meˇrˇ nepouzˇitelna´. Je nutne´ dobrˇe promyslet, v jake´ formeˇ hodnoty zaznamena´vat (prˇi slovnı´ch vyja´drˇenı´ kategoricky´ch znaku˚ se naprˇ. vyplatı´ zave´st ko´dova´nı´ apod.), s jakou prˇesnostı´ a mnoho dalsˇ´ıho.
Literatura [1] Zva´ra, K.: Biostatistika. Karolinum, Praha, 2003 [2] Zva´rova´, J.: Za´klady statistiky pro biomedicı´nske´ obory. Karolinum, Praha, 2002