Operační program Vzdělávání pro konkurenceschopnost Masarykova univerzita Brno
Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.)
doc. RNDr. PhMr. Karel Volenec, CSc. doc. Ing. Josef Hanuš, CSc. Ing. Milan Lázníček
Hradec Králové 2011
Masarykova univerzita Brno ve spolupráci s výrobcem zdravotnické techniky ELLA-CS, s.r.o.
Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.)
Skripta pro projekt operačního programu Vzdělávání pro konkurenceschopnost, – Vzdělávání pracovníků VaV MU a VFU Brno v endoskopických vyšetřovacích technikách a endoskopicky asistované miniinvazivní chirurgii s využitím nových materiálů
© Karel Volenec
Obsah
Úvod................................................................................................................... 3 1
Popisná statistika........................................................................................ 4 1.1 Střední hodnoty .......................................................................................... 4 Aritmetický průměr .................................................................................... 4 Vážený aritmetický průměr ........................................................................ 5 Medián: ...................................................................................................... 6 Modus: ....................................................................................................... 7 1.2 Míry variability: ......................................................................................... 8 Rozptyl: ..................................................................................................... 8 Směrodatná odchylka souboru:................................................................... 9
2
Práce se statistickými soubory ...................................................................11 2.1 Gaussovo rozdělení .................................................................................. 11 2.2 T-test........................................................................................................ 13 Jednovýběrový t-test ................................................................................ 14 Párový t-test ............................................................................................. 14 Dvouvýběrový t-test ................................................................................. 14 2.3 Kaplan-Meierova metoda ......................................................................... 15 2.4 Parametrické testy: ................................................................................... 17 2.5 Neparametrické testy:............................................................................... 18 2.6 Stanovení velikosti souboru...................................................................... 18 2.7 Rozdělení chyb:........................................................................................ 20
Závěr .................................................................................................................22 Seznam doporučené literatury............................................................................23
2
Úvod
Před autory textu byl postaven na jedné straně jednoduchý úkol, neboť v oboru statistického zpracování dat v medicíně existuje řada fundovaných učebnic. Na druhé straně zde bylo očekávání, že se podaří transformovat některé obtížnější části do zcela srozumitelné podoby tak, aby i těm, kteří se s tímto oborem rozloučili na úrovní prvního semestru studie medicíny, tato problematika nebyla zcela cizí. Po zvážení všech alternativ byla zvolena metoda praktických ukázek při řešení jednoduchých případů a zvláště je ukazováno na chybné použití postupů, kde je statistiky využíváno a to zcela chybně. Bohužel, tímto nedostatkem oplývá i řada prestižních publikací a teprve postupně se daří alespoň některé nejhorší případy eliminovat na úrovni redakčních rad odborných časopisů tím, že jsou některé metody přímo jednoznačně vyžadovány. Za mnoho let praxe jsme se dokonce setkali i se záměrným zneužitím těchto postupů tak, aby byla poškozena z důvodu konkurence protistrana. Protože autorům není známa detailní úroveň znalostí potenciálních čtenářů, volí metodu krátkého zopakování výkladu jednotlivých pojmů tak, aby byly jednoznačně popsány, a hned jsou uvedeny praktické aplikace z praxe i s příklady naprosto nesprávného použití. Mezi velmi vhodné postupy by autoři textu doporučili vždy konzultovat odpovídající metodu statistického hodnocení výsledků s příslušnými odborníky a tak zabránit devalvaci jinak metodicky správně naměřených hodnot z hlediska interpretace při srovnání s kontrolními skupinami.
3
1
Popisná statistika
Mezi základní statistické charakteristiky patří: a) charakteristiky polohy (nazýváme je středními hodnotami), b) charakteristiky variability (rozptýlenosti) – informují nás o rozptýlení
jednotlivých měřených hodnot kolem jejich středních hodnot.
1.1
Střední hodnoty
Mezi nejpoužívanější střední hodnoty počítáme aritmetický průměr (vážený), modus, medián.
Aritmetický průměr
x
….. aritmetický průměr
N …… počet naměřených veličin xi ...…. naměřené hodnoty Použití aritmetického průměru patří mezi nejznámější prohřešky, které si jen můžeme představit. Tento parametr bychom měli použít skutečně jen tehdy, kdy jsme si jednoznačně jisti, že jej lze zvláště z hlediska četnosti měřených dat použít. Odstrašujícím příkladem budiž následující příklad: Student měl ověřit průměrnou hodnotu systolického a diastolického tlaku u skupiny studentů ve věku 18-23 let a seniorů ve věku 70-75 let. V prvé skupině byli dva hypertoničtí studenti a v druhé skupině byla většina respondentů léčena antihypertenzivy. Měření bylo provedeno u 10 respondentů. Závěr: Student zobecnil porovnáním průměrných hodnot tlaků měření na konstatování, že se obě skupiny neliší a v průběhu věku se tlak významně nemění.
4
I když měření tonometrem bylo provedeno technicky správně, závěry byly naprosto chybné. Nebyly srovnány odpovídající skupiny respondentů a nebyl zvolen dostatečný počet respondentů.
Vážený aritmetický průměr (z několika dílčích průměrů)
x
….. vážený aritmetický průměr (jako aritmetický průměr)
Vážený průměr zobecňuje aritmetický průměr a poskytuje charakteristiku statistického souboru v případě, že hodnoty v tomto souboru mají různou důležitost, různou váhu. Používá se zejména při počítání celkového aritmetického průměru souboru složeného z více podsouborů. Pro výpočet váženého průměru potřebujeme jednak hodnoty, jejichž průměr chceme spočítat, a zároveň jejich váhy. Máme-li soubor n hodnot
a k nim odpovídající váhy
je vážený průměr dán vzorcem
či
Zde si na příkladu popíšeme nevhodnost použití aritmetického průměru a větší vypovídací schopnost váženého průměru.
5
Řekněme, že škola má dvě třídy, jednu s 20 studenty a druhou s 32. Bodové ohodnocení v každé třídě při jednom testu bylo:
Třída A — 62, 67, 71, 74, 76, 77, 78, 79, 79, 80, 80, 81, 81, 82, 83, 84, 86, 89, 93, 98.
Třída B — 80, 81, 82, 83, 84, 85, 86, 87, 87, 88, 88, 89, 89, 89, 90, 90, 90, 90, 91, 91, 91, 92, 92, 93, 93, 94, 95, 96, 97, 98, 99, 100.
Aritmetický průměr bodů ve třídě A je 80, ve třídě B je 90. Když spočítáme aritmetický průměr 80 a 90, dostaneme 85. Toto ovšem není aritmetický průměr bodů všech studentů. K jeho určení potřebujeme spočítat součet všech bodů a vydělit počtem všech studentů, tedy:
Nebo si můžeme pomoci váženým průměrem a spočítat vážený průměr průměrů bodů obou tříd použitím počtu studentů jako vah:
Nyní jsme již nepotřebovali znát, k spočtení aritmetického průměru všech bodů, jednotlivé známky, stačily nám pouze aritmetické průměry a počty studentů v jednotlivých třídách.
Medián: Medián (označován Me nebo
) je hodnota, jež dělí řadu podle velikosti
seřazených výsledků na dvě stejně početné poloviny. Medián patří ve statistice mezi míry centrální tendence. Platí, že nejméně 50 % hodnot je menších nebo rovných a nejméně 50 % hodnot je větších nebo rovných mediánu. Pro nalezení mediánu daného souboru stačí hodnoty seřadit podle velikosti a vzít hodnotu, která se nalézá uprostřed seznamu. Pokud má soubor sudý počet prvků, obvykle se za medián označuje aritmetický průměr hodnot na místech n/2 a n/2+1. Obecně se za medián dá označit více čísel. V už zmíněném případě sudého počtu prvků neexistuje jedinečná střední hodnota. Platí však, že polovina hodnot je 6
menší nebo rovna a polovina prvků je větší nebo rovna, ať už se za medián zvolí libovolné z obou prostředních čísel. Totéž dokonce platí i pro libovolné číslo, jehož velikost leží mezi těmito dvěma čísly. Proto se jako medián takového souboru může vzít libovolné z obou prostředních čísel i libovolné z čísel mezi nimi. Základní výhodou mediánu jako statistického ukazatele je fakt, že není ovlivněn extrémními hodnotami. Proto se často používá v případě šikmých rozdělení, u kterých aritmetický průměr dává obvykle nevhodné výsledky. Např. u souboru { 1, 2, 2, 3, 9 } je medián (stejně jako modus) roven dvěma, což je zřetelně vhodnější ukazatel převažující tendence než aritmetický průměr, který je zde roven 3,4. Proto by bylo chybou zde aritmetický průměr použít.
Medián je také odhad střední hodnoty, který minimalizuje absolutní chybu. U předchozího příkladu je tato chyba při použití mediánu rovna 1 + 0 + 0 + 1 + 7 = 9, zatímco při použití aritmetického průměru by byla rovna 2,4 + 1,4 + 1,4 + 0,4 + 5,6 = 11,2. To znamená, že číslo m, které minimalizuje výraz E(|X − m|), je mediánem rozdělení náhodné veličiny X.
Modus: Modus náhodné veličiny X (označováno jako Mod(X), Mo, nebo ) je hodnota, která se v daném statistickém souboru vyskytuje nejčastěji (je to hodnota znaku s největší relativní četností). Představuje jakousi typickou hodnotu sledovaného souboru a jeho určení předpokládá roztřídění souboru podle obměn znaku. Definice: Modus diskrétní náhodné veličiny je taková hodnota
, která pro
všechny hodnoty xi náhodné veličiny X splňuje podmínku . Vlastnosti: Modus nemusí být rozdělením pravděpodobnosti určen jednoznačně (tzn., že se stejnou nejvyšší frekvencí se může vyskytovat více hodnot). Rozdělení pravděpodobnosti s jedním modem se nazývají jednovrcholová (unimodální).
7
Mezi aritmetickým průměrem, mediánem a modem unimodálních rozdělení četností existují určité vztahy, které charakterizují tvar rozdělení četností. U zcela symetrických jednovrcholových četností platí vztah: , tj. aritmetický průměr, medián a modus jsou si rovny. Čím bude rozdělení četností asymetričtější, tím více se budou tyto tři střední hodnoty od sebe odlišovat. Výhodou modu je, že ho lze snadno použít i pro nečíselná data, kde např. aritmetický průměr použít nelze. Např. modus souboru { jablko, pomeranč, hruška, pomeranč, jablko, jablko, hruška } je jablko.
1.2
Míry variability:
Mezi charakteristiky nebo míry variability řadíme: variační rozpětí, průměrnou odchylku, rozptyl, směrodatnou odchylku a variační koeficient. Pro účely těchto skript bude postačující definice rozptylu a směrodatné odchylky. Ostatní charakteristiky se dají nalézt v obecné statistické literatuře.
Rozptyl: Rozptyl (označován
,
též
střední
kvadratická
odchylka,
střední
kvadratická fluktuace, variance nebo také disperze) se používá v teorii pravděpodobnosti a statistice. Je to druhý centrální moment náhodné veličiny. Jedná se o charakteristiku variability rozdělení pravděpodobnosti náhodné veličiny, která vyjadřuje variabilitu rozdělení souboru náhodných hodnot kolem její střední hodnoty. Rozptyl náhodné veličiny X se označuje
σ2(X), S2(X), D(X) nebo var(X). Rozptyl je definován jako střední hodnota kvadrátů odchylek od střední hodnoty. Odchylku od střední hodnoty, která má rozměr stejný jako náhodná veličina, zachycuje směrodatná odchylka. Pro diskrétní náhodnou veličinu jej můžeme definovat vztahem
8
, kde xi jsou hodnoty, kterých může náhodná veličina X nabývat (s pravděpodobnostmi pi) a E(X) je střední hodnota veličiny X.
Směrodatná odchylka souboru: Směrodatná odchylka (označována σ) je v teorii pravděpodobnosti a statistice často používanou mírou statistické disperze (rozptylu). Jedná se o kvadratický průměr odchylek hodnot znaku od jejich aritmetického průměru. Zhruba řečeno, vypovídá o tom, jak moc se od sebe navzájem liší typické případy v souboru zkoumaných čísel. Je-li malá, jsou si prvky souboru většinou navzájem podobné, a naopak velká směrodatná odchylka signalizuje velké vzájemné odlišnosti. Pomocí pravidel 1σ a 2σ (viz níže) lze přibližně určit, jak daleko jsou čísla v souboru vzdálená od průměru, resp. hodnoty náhodné veličiny vzdálené od střední hodnoty. Směrodatná odchylka je nejužívanější míra variability. Směrodatná odchylka je značená řeckým písmenem σ, a obvykle se definuje jako odmocnina z rozptylu náhodné veličiny X, tzn.
.
Pravidlo 1σ a 2σ Jedná se o empirické pravidlo, jehož platnost závisí na konkrétním případu, proto je formulováno obecně. Lze je však velmi dobře použít pro základní orientaci v rozložení hodnot souboru nebo náhodné veličiny. Jde-li o náhodnou veličinu, pak pravděpodobnost, že se hodnota náhodné veličiny bude od střední hodnoty lišit nejvýše o jednu směrodatnou odchylku, je výrazně vyšší než 0,5 (za předpokladu normálního rozdělení je to 68%);
9
pravděpodobnost, že se hodnota bude lišit nejvýše o dvě směrodatné odchylky, je velmi vysoká (při normálním rozdělení cca 95%). Ve většině případů je nutné, aby byla zahrnuta směrodatná odchylka výběrového souboru do hodnocení. Někdy se jako popisná statistika použije pouze průměr a to pro vypovídací schopnost daného jevu většinou není dostačující. Je potřeba uvést velikost souboru a směrodatnou odchylku. Při hodnocení určitého jevu by se měla objevit informace (při uvedeném průměru), kolik pacientů je v souboru tzn. i celkovou velikost souboru a je potřeba uvést i směrodatnou odchylku. Tím si odvodíme, jaká je variabilita v daném souboru.
10
2
Práce se statistickými soubory
Ve statistických šetřeních pracujeme často s výběry. Výběr tvoří pouze určitou část základního souboru. Naším úkolem je, abychom na základě výsledků zjištěných výběrovým šetřením, usoudili na poměry v základním souboru. Metody, jimiž takové informace získáváme, označujeme souhrnně jako metody statistické indukce. Statistická indukce znamená zobecnění závěrů, získaných zpracováním a analýzou omezeného počtu pozorování (výběru) na celý základní soubor. Symboly užívané u základního souboru a u výběru: Pojem Rozsah Aritmetický průměr Rozptyl Směrodatná odchylka
Náhodný výběr (charakteristiky) n x s2 s
Základní soubor (parametry) N µ 2
Známe-li vlastnosti (charakteristiky) výběru, snažíme se vypočítat – odhadnout z těchto vlastností parametry základního souboru. Protože, zejména při malém rozsahu výběru, jsou příslušné charakteristiky, které jsme zjistili na základě výběru, zatíženy výběrovou náhodnou chybou, provádíme příslušný odhad pro základní soubor.
2.1
Gaussovo rozdělení
Též normální rozdělení, Gaussova distribuce nebo Laplace-Gaussovo rozdělení je jedno z nejdůležitějších rozdělení pravděpodobnosti spojité náhodné veličiny. Normální rozdělení pravděpodobnosti s parametry μ a σ2, pro a
σ2 > 0,
je pro definováno hustotou pravděpodobnosti ve tvaru Gaussovy funkce 11
Normální rozdělení se většinou značí
. Rozdělení
bývá označováno
jako normované (nebo standardizované) normální rozdělení. Normované normální rozdělení má tedy hustotu pravděpodobnosti
Grafy hustot normálního rozdělení s různými charakteristikami (µ, σ)
Řadu v přírodě i společnosti se vyskytujících náhodných dějů lze dobře modelovat právě normálním rozdělením, např. rozložení IQ nebo výšky v populaci, rozložení vitální kapacity nebo třeba velikost chyby měření. Některá další rozdělení se při dostatečně velkém vzorku ke Gaussově distribuci číselně blíží, takže lze využít tabelovaných hodnot Gaussova rozdělení např. k výpočtu problémů modelovatelných binomickým rozdělením. Jiná rozdělení lze na normální poměrně snadno transformovat, např. tzv. lognormální rozdělení popisující stáří bílých krvinek v periferní krvi.
12
V souvislosti s normálním rozdělením jsou často zmiňovány náhodné chyby, např. chyby měření, způsobené velkým počtem neznámých a vzájemně nezávislých příčin. Proto bývá normální distribuce také označována jako zákon chyb. Podle tohoto zákona se také řídí rozdělení některých fyzikálních a technických veličin.
2.2
T-test
Princip t-testu Pokud náhodný výběr pochází z normálního rozdělení, pak výběrový průměr má také normální rozdělení se stejnou střední hodnotou. Rozdíl výběrového průměru a střední hodnoty normovaný pomocí skutečného rozptylu by pak měl normální rozdělení s nulovou střední hodnotou a jednotkovým rozptylem. Skutečný rozptyl však neznáme. Pokud jej nahradíme odhadem pomocí výběrového rozptylu, dostaneme T rozdělení, které je podobné normálnímu rozdělení. T-test je metodou matematické statistiky, která umožňuje ověřit některou z následujících hypotéz: 1. zda normální rozdělení, z něhož pochází určitý náhodný výběr, má určitou konkrétní střední hodnotu, přičemž rozptyl je neznámý 2. zda dvě normální rozdělení mající stejný (byť neznámý) rozptyl, z nichž pocházejí dva nezávislé náhodné výběry, mají stejné střední hodnoty (resp. rozdíl těchto středních hodnot je roven určitému danému číslu). V prvním případě může být náhodný výběr tvořen buď jednotlivými hodnotami (pak se jedná o jednovýběrový t-test), anebo dvojicemi hodnot, u nichž se zkoumají jejich rozdíly (pak se jedná o párový t-test). Ve druhém případě jde o dvouvýběrový t-test. V praxi se t-test často používá k porovnání, zda se výsledky měření na jedné skupině významně liší od výsledků měření na druhé skupině.
13
Jednovýběrový t-test Označme jednotlivé hodnoty náhodného výběru jako x1,x2,...,xn, výběrový průměr jako
a výběrový rozptyl jako S2. Test testuje hypotézu, že střední
hodnota normálního rozdělení, z něhož výběr pochází, se rovná μ0. Platí-li hypotéza, má náhodná veličina
T rozdělení s (n-1) stupni volnosti. Hypotézu zamítáme, je-li T příliš velké nebo příliš malé (výběrový průměr se příliš liší od očekávané střední hodnoty). Konkrétně se T porovná s kritickou hodnotou T rozdělení pro předem stanovenou hladinu významnosti.
Párový t-test Párový t-test se od jednovýběrového liší pouze v tom, že náhodný výběr poskytuje dvojice hodnot (y1,z1),(y2,z2),...,(yn,zn), přičemž uvnitř každé dvojice nemusí jít o nezávislé veličiny. V párovém t-testu ověřujeme, zda rozdíl středních hodnot rozdělení pro veličiny y a rozdělení pro veličiny z je roven určitému číslu (často nule). Položíme-li xi = yi − zi a označíme-li μ0 jako číslo, kterému se má rovnat rozdíl středních hodnot, můžeme párový test zcela převést na případ jednovýběrového t-testu.
Dvouvýběrový t-test Označme jednotlivé hodnoty prvního náhodného výběru jako x1,x2,...,xn, výběrový průměr jako
a výběrový rozptyl jako
. Obdobně označme
jednotlivé hodnoty druhého náhodného výběru jako y1,y2,...,ym, výběrový průměr jako
a výběrový rozptyl jako
. Oba výběry musejí být vzájemně nezávislé.
Nakonec označme δ číslo, které se má rovnat rozdílu středních hodnot μ1 − μ2 (jak již bylo řečeno, často δ = 0).
14
Potom veličina
má za platnosti hypotézy, že se rozdíl středních hodnot rovná δ, T rozdělení o n+m-2 stupních volnosti. Hypotéza se tedy zamítá v případě, že veličina T překročí kritickou hodnotu T rozdělení o uvedeném počtu stupňů volnosti. Pozn. Předpoklad, že oba výběry pocházejí z normálního rozdělení, nemusí být za každou cenu dodržen. T-test totiž pracuje s průměry obou výběrů, a ty již při rozsahu výběru v řádu desítek mají přibližně normální rozdělení. Pokud je rozsah výběru (resp. obou výběrů) velký (v řádu stovek a víc), lze místo kritických hodnot T rozdělení použít kritické hodnoty normálního rozdělení.
2.3
Kaplan-Meierova metoda
V medicíně používáme běžně jako kritérium hodnocení léčebné metody dobu, po kterou jí navozený výsledek vydrží. V této souvislosti je zcela zásadní definovat přesně, co je to selhání léčby, což je jednoduché například v onkologii, kdy datum úmrtí společně s datem zahájení terapie vymezují jednoznačně časový interval výsledku, který označujeme jako dobu přežití ("survival time"). Protože není možné z pragmatických důvodů vyčkávat na selhání posledního pacienta ve sledovaném
souboru,
navrhli
Kaplan
s
Meierem
výpočet
odhadu
pravděpodobnosti přežití v kterémkoliv okamžiku v průběhu studie. Cílem je vytěžit maximum relevantních informací v době, kdy část sledovaných dat ještě není k dispozici. Kaplan-Meierův přístup byl však navržen k odhadu pravděpodobnosti výskytu jisté události, u níž se předpokládá, že se vyskytne při dostatečně dlouhé době sledování u všech pacientů ve studii. Typickým příkladem je právě úmrtí pacienta u malignit. Avšak někteří pacienti mohou být ze sledování ztraceni ještě před ukončením studie, a to proto, že se u nich vyskytla jiná než sledovaná událost, která svou přítomností vylučuje následný výskyt události sledované nebo významně mění následnou pravděpodobnost vzniku sledované události. Tyto jiné události než sledované se nazývají
15
alternativní události ("competing events"). Není třeba se přesvědčovat o tom, že jde o zcela běžnou situaci. V medicínské statistice typická aplikace může zahrnovat rozdělení pacientů do kategorií, např. na ty s profilem genotypu A a s profilem genotypu B. Na grafu jsou znázorněni pacienti genotypu B, kteří umírají mnohem rychleji, než pacienti s genotypem A. Po dvou letech téměř 80% pacientů genotypu A stále přežívá, ale naživu je již méně než polovina pacientů genotypu B. Dalším příkladem může být rozdělení pacientů na skupinu léčenou a neléčenou daným léčivem (obdobné jako v předchozím příkladu).
Příklad Kaplan-Meierova grafu pro dvě skupiny pacientů a jejich dobu přežití.
Nechť S(t) je pravděpodobnost že jedinec z populace bude mít délku přežití překračující dobu t. Nechť je doba dožití pro vzorek z populace o velikosti N:
Každému ti odpovídá ni, počet jedinců "s rizikem" právě před dobou ti, a di počet úmrtní v čase ti. Všimněte si, že intervaly mezi jednotlivými měřeními nejsou jednotné.
16
Kaplan–Meierův odhad je neparametrické maximum pravděpodobnosti odhadu S(t). Je to výsledek rovnice:
Kde ni je počet přeživších před časem ti. Jak vyplývá z Kaplan-Meierova grafu, hodnoty jsou uvedeny v procentech. Avšak v Kaplan-Mayer pravděpodobnosti procentní! Velkou chybou je srovnávat procenta a Kaplan-Meierovu pravděpodobnost v procentech – musí se uvést buď oboje
v prostých
procentech,
nebo
oba
výsledky
formou
procentní
pravděpodobnosti Kapalan-Meier. Je velkým prohřeškem, když se tyto výsledky vzájemně zaměňují a míchají.
2.4
Parametrické testy:
Mnohdy je nejlepším způsobem analýzy a zveřejnění výsledků použití intervalů spolehlivosti, protože v rámci takto zveřejněných výsledků je zdůrazněn vliv nejistoty a neurčitosti. Často používaný statistický přístup je však též statistické testování hypotéz. Většina statistických hypotéz zahrnuje porovnání různých způsobů léčby, metod či skupin, nebo případů. Statistické hypotézy jsou jednoduše a jednoznačně formulované domněnky o populaci, jejichž pravdivost lze ověřovat (testovat) pomocí výběrů. Typickou statistickou hypotézou je tvrzení, že průměr bílkovinného séra je stejný pro muže i ženy, nebo že dvě léčby bolesti hlavy jsou stejně efektivní.
Formulování nulové a alternativní hypotézy Pokud budeme tedy testovat hypotézy statistickými metodami, musíme na začátku práce formulovat 2 hypotézy: 1.
Nulová hypotéza H0 je tvrzení o populaci (parametru populace), o jehož platnosti chceme rozhodnout (není rozdíl, nezávisí, má dané rozdělení …);
17
Nulová hypotéza je obvykle opakem toho co chceme výzkumem dokázat (koresponduje s tvrzení, že efekt je nulový) 2.
Alternativní hypotéza H1 – vymezuje situaci, do jaké se dostaneme, když neplatí H0 (nepřipouštíme tedy situace, že by existovala daná možnost – buď platí H0 nebo neplatí H0, ale pak platí H1).
2.5
Neparametrické testy:
Při neparametrickém testu testujeme jinou hypotézu o rozdělení základního souboru, než je hypotéza o jeho parametru. Jejich řešení nezávisí na typu rozdělení základního souboru, takže na rozdíl od parametrických testů výsledky nejsou závislé na tom, zda jsme model rozdělení volili správně v souladu se skutečným rozdělením základního souboru. Můžeme je pak použít i pro silně nenormální rozdělení, kdy parametrické testy předpokládající normální rozdělení selhávají. Další výhodou je i to, že řada z nich je schopna testovat nejen rozdělení číselných hodnot znaků (stejně jako parametrické), ale i rozdělení hodnot slovních znaků, především ordinálních, tj. rozlišujících dle relací většímenší, lepší-horší, atp. (např. pořadové testy). Některé neparametrické testy jsou dokonce použitelné pro hodnoty nominálních znaků, tj. zařazujících jen do skupin (např. znaménkový test rozlišující řazení do dvou alternativních skupin). Neparametrické testy mají tedy širší použití než parametrické. Jejich nevýhodou je, že mají menší sílu než analogické testy parametrické (menší pravděpodobnost, že odhalí situaci, kdy neplatí nulová hypotéza). Pro dosažení stejné síly musíme pak použít větší počet naměřených hodnot, než by byl nutný při parametrickém testu.
2.6
Stanovení velikosti souboru
Je zásadní stanovit počet sledovaných prvků (velikost souboru) pro to, aby měl vyjádřený výsledek požadovanou míru vypovídací schopnosti/korektnosti.
18
Odhad potřebného rozsahu náhodného výběru a) pro průměr V praxi jsme často postaveni před úkol, jak velký má být náhodný výběr, abychom dostali hodnotu výběrového průměru s určitou, předem stanovenou přesností. Podle vztahu
vyčteme příslušnou hodnotu následovně: Požadovanou přesnost výběrového průměru označíme - D. Budeme ji definovat jako polovinu intervalu spolehlivosti, tedy
odkud určíme potřebné n: . Za D dosazujeme zvolenou hodnotu požadované přesnosti výběrového průměru. Za uα hodnotu 1,96 při 95% intervalu spolehlivosti, nebo hodnotu 2,58 při 99% intervalu spolehlivosti (někdy místo uα značíme tα a bereme hodnoty t pro α stupňů volnosti). Za
dosazujeme odhad směrodatné odchylky základního
souboru. Protože tento odhad není vždy znám, uchylujeme se v praxi k nahrazení tohoto
parametru
známým
rozptylem
z jiných
podobných
pokusů,
z předvýzkumů a podobně. Příklad: Na základě jiných šetření známe rozptyl 1,50. Pro výběrový průměr požadujeme přesnost D=0,1 (měrných jednotek) při 95% spolehlivosti výsledku. Dosazením dostaneme:
Výsledek: Abychom splnili uvedené požadavky, stačí, vybereme-li 864 jednotek.
19
b) pro relativní četnost: Chceme-li odhadnout potřebný rozsah náhodného výběru pro podíly, které mají binomické rozdělení četností a označíme-li opět požadovanou přesnost symbolem D, pak při 95% spolehlivosti výsledku platí:
Odkud určíme požadovanou hodnotu n:
Příklad: Pro výběrový podíl (procento) požadujeme přesnost D=0,1 při 95% spolehlivosti výsledku (p=q=0,5). Dostaneme n=96. Výsledek: Stačí tedy vybrat 96 jednotek, abychom splnily uvedené předpoklady.
U procentního vyjádření daného sledovaného znaku se musí počítat s tím (v praxi se ustálilo), že se nedá počítat s prvky méně než deseti. Aby mělo procentní vyjádření vypovídací schopnost alespoň do určité míry. Optimální počet prvků u procentního vyjádření je nejlépe více než 30 prvků. Studentovo rozdělení počítá se souborem minimálně šesti prvků. Dalším případem je stanovení velikosti 1 souboru a chci znát pravděpodobnost, že hodnota sledovaného znaku se bude pohybovat v rámci určitého intervalu například od 2σ od střední hodnoty. Zde mohu říci, že sledovaná veličina se v tomto intervalu bude pohybovat s pravděpodobností 95%, což je pro většinu vyjádření dostačují a nepotřebuji již pravděpodobnost např. 99%.
2.7
Rozdělení chyb:
Při všech měřeních (Statistické zpracování výsledků a naměřených dat) vznikají chyby, jimiž jsou výsledky zatíženy. Chyby se dělí: 1. náhodné - vyskytují se nepravidelně, lze je statisticky vyhodnotit 2. systematické - lze je předvídat a vypočítat, provést korekci výsledku Uvedení dalších chyb při statistickém vyjádření:
20
Aby bylo možné některé výsledné hodnoty srovnávat je potřeba vnímat rozdělení v rámci skupin, a četnosti ve skupině. Např. mám dvě skupiny každá o jiné velikosti a jiné četnosti hodnot ve skupině. I kdyby byl vypočítán aritmetický průměr v obou skupinách stejný, nemohu o těchto skupinách udělat závěr, že se obě skupiny neliší, právě díky jinak velkým skupinám s jinými četnostmi. Dalším „zločinem“ s nakládání se statistickými výsledky je neodhalení chyby. Je třeba rozumět, co to jsou chyby. Není možné seškrtnout nejvyšší a nejnižší hodnoty – (toto se může dělat např. při soutěži v krasobruslení), ale ve statistice v medicíně se to dělat nesmí, jelikož by to mohlo zakrýt chybu. Musíme se ujistit, zda jsou tyto krajní hodnoty jevem a potom musí být zahrnuty do výpočtu, nebo jestli je to chybový prvek a ten potom může být pro výpočet ze souboru odstraněn. Jinak se musí uvést všechny prvky výběru. Statistická významnost: v medicíně stačí nejčastěji statistická významnost na 95% hladině významnosti. Nemá smysl, vzhledem k biologické variabilitě, aby nabyla hodnota 99% hladiny významnosti, nebo aby byla vyšší.
21
Závěr
Z výše uvedeného vyplývá, že jakékoli shrnutí činnosti do sdělovaného výsledku je statistickým úkonem. Měli bychom proto vždy dbát na to, abychom jednotlivá data nezkreslili deklarovanou souhrnnou informací, která by ve svém důsledku mohla devalvovat naše i mnohaletá úsilí v prezentované oblasti. Proto je třeba k vytváření souhrnů přistupovat s náležitou opatrností a se snahou, vyvarovat se chyb, na které bylo poukázáno. Statistika je rozsáhlý soubor teoretických přístupů, který v těchto skriptech nebyl, a ani nemohl být, vůbec postihnut. Je proto na místě konstatovat, že v případě hlubších statistických rozborů získaných dat, bude vhodné seznámení se s příslušným teoretickým základem, k vyvarování se chyb z neznalosti.
22
Seznam doporučené literatury
1. DRDKOVÁ S. Základy statistiky ve zdravotnictví. 1. vyd. SPN, Praha 1988 2. ENGLER V. Stručné základy zdravotnické statistiky pro posluchače LFH UK. 1. vyd. SPN, Praha 1989 3. HINDLS R., HRONOVÁ S., SEGER J. Statistika pro ekonomy. 4. vyd. Professional publishing, Praha 2003. ISBN 80-86419-52-5.
Odkazy: 1. http://www.wikipedia.cz 2. http://users.prf.jcu.cz/sima/analyticka_chemie/statistika.htm 3. http://cs.wikipedia.org/wiki/ 4. http://vfu-www.vfu.cz/stat/FVL/Cviceni/Studentuv_t.htm 5. http://en.wikipedia.org/wiki/Kaplan%E2%80%93Meier_estimator
23
Název:
Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.)
V programu:
Vzdělávání pro konkurenceschopnost: Vzdělávání pracovníků VaV MU a VFU Brno v endoskopických vyšetřovacích technikách a endoskopicky asistované miniinvazivní chirurgii s využitím nových materiálů
První vydání Zpracoval :
doc. RNDr. PhMr. Karel Volenec, CSc.
Editor:
Ing. Jiří Tilhon
Počet listů :
25
Vydavatel :
Masarykova Univerzita Hradec Králové,
Počet výtisků : Tiskem :
Vlastním
Práce neprošla jazykovou ani grafickou úpravou.