Základy biostatistiky Veřejné zdravotnictví 3.LF UK Viktor Hynčica
Úvod •
se statistikou se setkáváme denně – ankety
•
proč se statistika začala používat ve zdravotnictví •
skupinový přístup k „léčení“ celé populace –převedení individuelní zdravotní péče na péči o zdraví celé společnosti
•
podpora a ochrana zdraví – preventivní funkce mediciny
•
nutno pracovat s jevy charakterizovanými hromadnou povahou – je potřeba metoda studia hromadných jevů - k tomu slouží statistika
Historie statistiky • starověk –soupis národního bohatství • statistika ve funkci výkaznictví sociálněekonomických ukazatelů • Český statistický úřad – ročenka • 17.stol. – pravděpodobnost – ovlivnila statistiku B.Pascal, Bernoulli, Laplace, Poisson • 1900 vzniká matematická statistika • první práce – Pearson , Yule, R.A.Fisher
Matematická statistika Věda zabývající se studiem hromadných náhodných jevů hromadná pozorování, výsledky opakovaných pokusů plánování , sběr, zpracování, analýza a využití pro předpovědi a rozhodování Užití v medicině, biologii - biostatistika Cílem matematické statistiky - popis populace jako celku, analýza obecných vztahů Hromadné náhodné jevy – onemocnění na chřipku, přežívání,…
Statistika umožňuje na základě výsledků pozorování formulovat obecné závěry oproštěné od subjektivních pohledů Spolehlivost či nespolehlivost se vyjadřuje pomocí pravděpodobnosti
Základní statistické pojmy Deskriptivní statistika • Uspořádání souboru pozorování • Popis a účelná sumarizace • Vyjádření výsledků pomocí tabulek a grafů • Výpočet charakteristik
Induktivní statistika • Poskytuje metody,které umožňují z empirických poznatků formulovat obecné závěry
Induktivní myšlení x deduktivní myšlení
Základní soubor x výběrový soubor • Úplné, vyčerpávající šetření – není potřeba indukce - sčítání lidu • Většinou úplné šetření není možné – ekonomické důvody, rozsáhlost zákl.souboru (nekonečný), praktické důvody….
výběrový soubor Musí být reprezentativní – každý prvek základního souboru má stejnou šanci dostat se do výběru Opak selektivní výběrový soubor
Náhodný výběr Reprezentativní výběr – byl pořízen metodou náhodného výběru Metody náhodného výběru • Náhodný výběr prostý • Systematický • Stratifikovaný Metodami induktivní statistiky lze získat správná tvrzení pouze tehdy, jestliže datový soubor pochází z náhodného výběru
Induktivní statistika Odhad průměru veličiny v populaci
Populace – základní soubor
µ x
výběr
Základní soubor - populace • Je tvořen objekty, prvky, jedinci – jednotky statistického šetření • Konečný nebo nekonečný rozsah • Musí být přesně vymezen – jednoznačná pravidla určující který objekt do základního souboru patří a který ne • Úspěch statistického šetření spočívá v přesném vymezení základního souboru
ZNAKY - vlastnosti sledované na objektech základního souboru • Znaky určující • Znaky zkoumané
Typy sledovaných znaků
• Kvalitativní – Alternativní – Nominální – Ordinální
ano-ne nelze uspořádat je možno uspořádat
• Kvantitativní – Spojité – Diskrétní
výška, váha, tlak počty
Nominální veličiny
svobodná vdaná rozvedená vdova
350 300 250 200
n. = ∑ ni = n1 + n2 + n3 + n4
150 100 50 0 svobodná
vdaná
rozvedená
vdova
Ordinální veličiny
vyšší
střední četnost vyučen
kumulativní četnost
základní
0
20
40
60 %
80
100
Spojité kvantitativní veličiny Míry, váhy, …
1500 1500
2000 2000
2500 2500
3000 3000
je možno porovnávat rozdíly velké množství různých hodnot teoreticky je možno měřit s libovolnou přesností
3500 3500
4000 4000
4500 4500
5000 5000
Celočíselné kvantitativní veličiny Počty, …nejmenší přesnost s kterou je možno měřit je 1 (½ jedince nemá smysl)
počty onemocnění horních cest dýchacích v prvých třech letech věku
Statistické šetření - použití statistiky v praxi Průběh - 4 etapy: 1. Cíl výzkumu-definice problému -
plán statistického šetření
2. Sběr dat 3. Zpracování dat 4. Analýza a formulace závěrů
Plánování statistických pokusů Etapa výzkumné činnosti, jejímž cílem je získat data, která lze zpracovat statistickými metodami • Vymezit znaky zkoumané, určující • Vymezení základního souboru, výběru - rozsah • Ujasnit povahu znaků, jednotná metodika měření, klasifikace kvalitativních znaků • Homogennost pozorování • Strukturní nehomogennost • Vyloučení subjektivních vlivů – slepé pokusy
Statistické srovnání Základní metoda statistického šetření Veličiny: zkoumané
100 nemocných
ovlivňující rušivé – známé neznámé stratifikace
50
50
randomizace
Lék B
Lék A ?
? Statistické srovnání
Zkoumáme efekt ovlivňujících veličin na zkoumané a eliminujeme efekt rušivých veličin
Zpracování dat – deskriptivní metody Popisné metody •
Přehledné uspořádání dat – statistické třídění
•
Grafické znázornění
•
Výpočet statistických ukazatelů
Statistické třídění • • • •
Rozdělení souboru dat do skupin-tříd podle určených třídících znaků Jednostupňové , vícestupňové (kombinační) Umožní poznat v hrubých rysech strukturu a rozložení znaků Znaky sloužící za podklad třídění musí vyjadřovat podstatu zkoumaného jevu
Třídění kvalitativního znaku jednostupňové
dvoustupňové
Třídění spojitého znaku Měření vitální kapacity plic u souboru 90-ti mužů ve věku 40-50 let
Vytřídění naměřených hodnot do tabulky Třídní intervaly, četnosti: absolutní, relativní
Grafické znázornění rozložení
Výpočet ukazatelů – relativní ukazatelé Pro časové, územní srovnání kvalitativních údajů • Strukturální – extenzitní ukazatelé charakterizují rozčlenění souboru podle určitého znaku • Frekvenční- intenzitní ukazatelé vyjadřují častost výskytu jevu
• Indexy - s pevným či pohyblivým základem k posouzení vývoje nějakého ukazatele v čase
Strukturální ukazatelé
abs.četnost _ jevu ×N rozsah _ souboru
N = 100 procento N = 1000 promile
Frekvenční ukazatelé Nemocnost, úmrtnost, porodnost, rozvodovost…..
poč .nemocných ×100.000 celk. poč .obyvatel
Použití indexů
Standardizace (nemocnosti) - Nutná v případě, že četnost výskytu jevu je závislá na dalším znaku, jehož rozložení v porovnávaných souborech značně rozdílné
> > > > >
<
Přímá standardizace • Známe relativní nemocnosti v porovnávaných souborech • Volíme určitou populaci - standardní populace • Přepočteme , kolik by ve standardu onemocnělo lidí za předpokladu nemocností v porovnávaných souborech
19.25
>
17.61
Nepřímá standardizace • Známe věkové rozložení v porovnávaných souborech • Známe celkové nemocnosti (nestandardizované) • Ze standardu známe nemocnosti ve věkových třídách a celkovou nemocnost
17.93 / 9.35 * 10.45 = 20.1
>
17.93 / 15.68 * 15.3 = 17.44
Ukazatelé polohy – střední hodnoty Data : x1 , x2 , x3 , x4 , x5 …………….. xn
Aritmetický průměr Medián
xmed
Modus
1 x= N
N
∑x
i
i =1
Prostřední pozorovaná hodnota Nejčastější hodnota
1 N = ∏ xi = exp i =1 N N
Geometrický průměr
Percentil
x 25 %
x geom
ln( xi ) ∑ i =1 N
Taková hodnota, že zvolené procento Je menší než tato hodnota Kvantil, decil, kvantil, kvartil, tercil
Ukazatelé rozptýlenosti µ
xi
x
xi −− µx N
N
(
2
11 xi −xiµ−) x Rozptyl s = ∑ (∑ N −i =11 i =1 2
Směrodatná odchylka Střední chyba průměru
)
2
S .D. = s = s S .D. S .E . = N
2
xi x
Další statistické charakteristiky S .D. x
Variační koeficient
Šikmost
Špičatost
1 N
1 N
∑ (x − x )
3
i
(S .D.)3
∑ (x − x )
4
i
(S .D.)
4
−3
Úvod do pravděpodobnosti • Prostředek k popisu „náhody“ – matematizování statistiky • Všechny statistické výroky mají pravděpodobnostní charakter • Hlavní pojmy v teorii pravděpodobnosti – náhodný pokus , náhodný jev • Pravděpodobnost – kvantitativní charakteristika – míra častosti výskytu jevu
Klasická pravděpodobnost • Náhodný pokus - n možných výsledku – elementární jevy • Náhodný jev A - jakákoliv množina elementárních jevů • Pravděpodobnost P(A) = m / n m – počet elementárních jevů „příznivých“ jevu A n - počet všech elementárních jevů
Vlastnosti pravděpodobnosti
0 ≤ P ( A) ≤ 1 P(A) = 1 ………. jev jistý P(A) = 0 ………. jev nemožný
Věta o sčítání
P ( A Υ B ) = P( A) + P ( B )
Disjunktní jevy
P ( A Υ B ) = P( A) + P ( B ) − P( A Ι B)