Základy biostatistiky

Základy biostatistiky Veřejné zdravotnictví 3.LF UK Viktor Hynčica

Úvod •

se statistikou se setkáváme denně – ankety

•

proč se statistika začala používat ve zdravotnictví •

skupinový přístup k „léčení“ celé populace –převedení individuelní zdravotní péče na péči o zdraví celé společnosti

•

podpora a ochrana zdraví – preventivní funkce mediciny

•

nutno pracovat s jevy charakterizovanými hromadnou povahou – je potřeba metoda studia hromadných jevů - k tomu slouží statistika

Historie statistiky • starověk –soupis národního bohatství • statistika ve funkci výkaznictví sociálněekonomických ukazatelů • Český statistický úřad – ročenka • 17.stol. – pravděpodobnost – ovlivnila statistiku B.Pascal, Bernoulli, Laplace, Poisson • 1900 vzniká matematická statistika • první práce – Pearson , Yule, R.A.Fisher

Matematická statistika Věda zabývající se studiem hromadných náhodných jevů hromadná pozorování, výsledky opakovaných pokusů plánování , sběr, zpracování, analýza a využití pro předpovědi a rozhodování Užití v medicině, biologii - biostatistika Cílem matematické statistiky - popis populace jako celku, analýza obecných vztahů Hromadné náhodné jevy – onemocnění na chřipku, přežívání,…

Statistika umožňuje na základě výsledků pozorování formulovat obecné závěry oproštěné od subjektivních pohledů Spolehlivost či nespolehlivost se vyjadřuje pomocí pravděpodobnosti

Základní statistické pojmy Deskriptivní statistika • Uspořádání souboru pozorování • Popis a účelná sumarizace • Vyjádření výsledků pomocí tabulek a grafů • Výpočet charakteristik

Induktivní statistika • Poskytuje metody,které umožňují z empirických poznatků formulovat obecné závěry

Induktivní myšlení x deduktivní myšlení

Základní soubor x výběrový soubor • Úplné, vyčerpávající šetření – není potřeba indukce - sčítání lidu • Většinou úplné šetření není možné – ekonomické důvody, rozsáhlost zákl.souboru (nekonečný), praktické důvody….

výběrový soubor Musí být reprezentativní – každý prvek základního souboru má stejnou šanci dostat se do výběru Opak selektivní výběrový soubor

Náhodný výběr Reprezentativní výběr – byl pořízen metodou náhodného výběru Metody náhodného výběru • Náhodný výběr prostý • Systematický • Stratifikovaný Metodami induktivní statistiky lze získat správná tvrzení pouze tehdy, jestliže datový soubor pochází z náhodného výběru

Induktivní statistika Odhad průměru veličiny v populaci

Populace – základní soubor

µ x

výběr

Základní soubor - populace • Je tvořen objekty, prvky, jedinci – jednotky statistického šetření • Konečný nebo nekonečný rozsah • Musí být přesně vymezen – jednoznačná pravidla určující který objekt do základního souboru patří a který ne • Úspěch statistického šetření spočívá v přesném vymezení základního souboru

ZNAKY - vlastnosti sledované na objektech základního souboru • Znaky určující • Znaky zkoumané

Typy sledovaných znaků

• Kvalitativní – Alternativní – Nominální – Ordinální

ano-ne nelze uspořádat je možno uspořádat

• Kvantitativní – Spojité – Diskrétní

výška, váha, tlak počty

Nominální veličiny

svobodná vdaná rozvedená vdova

350 300 250 200

n. = ∑ ni = n1 + n2 + n3 + n4

150 100 50 0 svobodná

vdaná

rozvedená

vdova

Ordinální veličiny

vyšší

střední četnost vyučen

kumulativní četnost

základní

0

20

40

60 %

80

100

Spojité kvantitativní veličiny Míry, váhy, …

1500 1500

2000 2000

2500 2500

3000 3000

je možno porovnávat rozdíly velké množství různých hodnot teoreticky je možno měřit s libovolnou přesností

3500 3500

4000 4000

4500 4500

5000 5000

Celočíselné kvantitativní veličiny Počty, …nejmenší přesnost s kterou je možno měřit je 1 (½ jedince nemá smysl)

počty onemocnění horních cest dýchacích v prvých třech letech věku

Statistické šetření - použití statistiky v praxi Průběh - 4 etapy: 1. Cíl výzkumu-definice problému -

plán statistického šetření

2. Sběr dat 3. Zpracování dat 4. Analýza a formulace závěrů

Plánování statistických pokusů Etapa výzkumné činnosti, jejímž cílem je získat data, která lze zpracovat statistickými metodami • Vymezit znaky zkoumané, určující • Vymezení základního souboru, výběru - rozsah • Ujasnit povahu znaků, jednotná metodika měření, klasifikace kvalitativních znaků • Homogennost pozorování • Strukturní nehomogennost • Vyloučení subjektivních vlivů – slepé pokusy

Statistické srovnání Základní metoda statistického šetření Veličiny: zkoumané

100 nemocných

ovlivňující rušivé – známé neznámé stratifikace

50

50

randomizace

Lék B

Lék A ?

? Statistické srovnání

Zkoumáme efekt ovlivňujících veličin na zkoumané a eliminujeme efekt rušivých veličin

Zpracování dat – deskriptivní metody Popisné metody •

Přehledné uspořádání dat – statistické třídění

•

Grafické znázornění

•

Výpočet statistických ukazatelů

Statistické třídění • • • •

Rozdělení souboru dat do skupin-tříd podle určených třídících znaků Jednostupňové , vícestupňové (kombinační) Umožní poznat v hrubých rysech strukturu a rozložení znaků Znaky sloužící za podklad třídění musí vyjadřovat podstatu zkoumaného jevu

Třídění kvalitativního znaku jednostupňové

dvoustupňové

Třídění spojitého znaku Měření vitální kapacity plic u souboru 90-ti mužů ve věku 40-50 let

Vytřídění naměřených hodnot do tabulky Třídní intervaly, četnosti: absolutní, relativní

Grafické znázornění rozložení

Výpočet ukazatelů – relativní ukazatelé Pro časové, územní srovnání kvalitativních údajů • Strukturální – extenzitní ukazatelé charakterizují rozčlenění souboru podle určitého znaku • Frekvenční- intenzitní ukazatelé vyjadřují častost výskytu jevu

• Indexy - s pevným či pohyblivým základem k posouzení vývoje nějakého ukazatele v čase

Strukturální ukazatelé

abs.četnost _ jevu ×N rozsah _ souboru

N = 100 procento N = 1000 promile

Frekvenční ukazatelé Nemocnost, úmrtnost, porodnost, rozvodovost…..

poč .nemocných ×100.000 celk. poč .obyvatel

Použití indexů

Standardizace (nemocnosti) - Nutná v případě, že četnost výskytu jevu je závislá na dalším znaku, jehož rozložení v porovnávaných souborech značně rozdílné

> > > > >

<

Přímá standardizace • Známe relativní nemocnosti v porovnávaných souborech • Volíme určitou populaci - standardní populace • Přepočteme , kolik by ve standardu onemocnělo lidí za předpokladu nemocností v porovnávaných souborech

19.25

>

17.61

Nepřímá standardizace • Známe věkové rozložení v porovnávaných souborech • Známe celkové nemocnosti (nestandardizované) • Ze standardu známe nemocnosti ve věkových třídách a celkovou nemocnost

17.93 / 9.35 * 10.45 = 20.1

>

17.93 / 15.68 * 15.3 = 17.44

Ukazatelé polohy – střední hodnoty Data : x1 , x2 , x3 , x4 , x5 …………….. xn

Aritmetický průměr Medián

xmed

Modus

1 x= N

N

∑x

i

i =1

Prostřední pozorovaná hodnota Nejčastější hodnota

1 N = ∏ xi = exp i =1 N N

Geometrický průměr

Percentil

x 25 %

x geom

 ln( xi )  ∑ i =1  N

Taková hodnota, že zvolené procento Je menší než tato hodnota Kvantil, decil, kvantil, kvartil, tercil

Ukazatelé rozptýlenosti µ

xi

x

xi −− µx N

N

(

2

11 xi −xiµ−) x Rozptyl s = ∑ (∑ N −i =11 i =1 2

Směrodatná odchylka Střední chyba průměru

)

2

S .D. = s = s S .D. S .E . = N

2

xi x

Další statistické charakteristiky S .D. x

Variační koeficient

Šikmost

Špičatost

1 N

1 N

∑ (x − x )

3

i

(S .D.)3

∑ (x − x )

4

i

(S .D.)

4

−3

Úvod do pravděpodobnosti • Prostředek k popisu „náhody“ – matematizování statistiky • Všechny statistické výroky mají pravděpodobnostní charakter • Hlavní pojmy v teorii pravděpodobnosti – náhodný pokus , náhodný jev • Pravděpodobnost – kvantitativní charakteristika – míra častosti výskytu jevu

Klasická pravděpodobnost • Náhodný pokus - n možných výsledku – elementární jevy • Náhodný jev A - jakákoliv množina elementárních jevů • Pravděpodobnost P(A) = m / n m – počet elementárních jevů „příznivých“ jevu A n - počet všech elementárních jevů

Vlastnosti pravděpodobnosti

0 ≤ P ( A) ≤ 1 P(A) = 1 ………. jev jistý P(A) = 0 ………. jev nemožný

Věta o sčítání

P ( A Υ B ) = P( A) + P ( B )

Disjunktní jevy

P ( A Υ B ) = P( A) + P ( B ) − P( A Ι B)

Základy biostatistiky

Recommend Documents