Pravděpodobnost a statistika absolutní minumum
Jaromír Šrámek 4108, 1.LF, UK
Obsah 1. Základy počtu pravděpodobnosti 1.1 Definice pravděpodobnosti 1.2 Náhodné veličiny a jejich popis 1.3 Číselné charakteristiky 1.3.1 Kvantily 1.3.2 Střední hodnota 1.3.3 Rozptyl a směrodatná odchylka 1.4. Některá důležitá rozdělení 1.4.1 Binomické rozdělení 1.4.2 Poissonovo rozdělení 1.4.3 Exponenciální rozdělení 1.4.4 Normální rozdělení 2. Základy statistiky 2.1 Základní pojmy, metody výběru 2.2 Typy dat 2.3 Prezentace dat 2.4 Sipmsonův paradox 3. Testování hypotéz 3.1 Základní pojmy 3.2 t-test 3.3 χ2 test dobré shody 4. Použitá literatura
1.Základy počtu pravděpodobnosti 1.1 Definice pravděpodobnosti Teorie pravděpodobnosti doprovází člověka snad od nepaměti. Vždyť její největší aplikací byly hazardní hry. Nicméně teorií pravděpodobnosti začse al významněji zabývat až Blais Pascal v 17. století. Shrnutí a formalizaci provedl Pierre Simon de Laplace v díle Essai Philosophique sur les Probabilités (1814). Říká se, že šlo o „zakázku“ jistého šlechtice toužícího zbohatnout na hazardu. Právě od Laplacea pochází tzv. klasiká definice pravděpodobnosti: Může-li nějaký jev vykázat n∈N vzájemně se vylučujících stejně možných výsledků a má-li m z těchto n výsledků za následek realizaci jevu A a n-m výsledků tento jev vylučuje, pak pravděpodobnost jevu A položíme: m P A= (1.1) n
Je jasné, že nejde o definici v pravém slova smyslu, ale pro řešení základních úloh zcela postačuje. Neřeěitelným problémem je z hlediska této definice asymetrická kostka. Určitým zobecněním je geometrická pravděpodobnost, kdy je v klasické definici nahražen počet nějakou geometrickou mírou – délkou, plochou, objemem. V situaci, kdy chceme pravděpodobnostní počet uchopit poněkud exaktněji, je nutné pravděpodobnost zavést jinak. Pro nematematika hůře uchopitelná, nicméně další úvahy podstatná, je axiomatická definice pravděpodobnosti (A.N.Kolgomorov, 1924): Pravděpodobnostním modelem nazveme trojici (Ω, , P), kde: 1. Ω je všech různých, vzájemně se vylučijících výsledků. Její prvky nazýváme elementární jevy. 2. je taková množina podmnožinΩ, pro niž platí: a) Ω∈ b) je-li A∈, potom i AC = Ω - A ∈ c) jsou-li A1, A2,...... ∈, potom je li ∪Ai∈ Prvky množiny nazveme jevy. 3. P je funkce z do <0,1> taková, že platí: a) P(Ω) = 1 b) P(AC) = 1 – P(A) pro všechna A∈ c) P(∪Ai) = ∑ P(Ai) pokud jsou všechna Ai disjunktní. Funkci P nazveme pravděpodobnostní mírou nebo krátce pravděpodobností.
1.2 Náhodné veličiny a jejich popis Náhodná veličina je de facto funkce zobrazující z Ω do R, která musí splňovat jisté podmínky. Klasickým příkladem je přiřazení čísel stranám kostky podle počtu teček. Jiným vhodným příkladem je pohyb ručky měřícího přístroje – náhodnému jevu "výchylka ručky" přiřadíme hodnotu "veličina odečtená na stupnici".I takto ne zcela korektně zavedená náhodná veličina je velmi důležitá a vlastně se jako červená nit bude vinout téměř celým textem. Distribuční funkce náhodné veličiny X je taková reálná funkce F(t) definovaná pro každé t∈R, pro kterou platí: (1.2) F t =P [ X ∈−∞ , t 〉 ]=P [ X ≤t ] Slovy vztah 1.2 říká, že distribuční funkce je taková funkce, která udává, s takou pravděpodobností nabývá náhodná veličina hodnoty nejvýše t. Každou distribuční funkci má některé důležité vlastnosti: 1. F t ∈〈0,1 〉 2. F je neklesající 3. lim F t =0 t −∞
F t =1 4. lim t ∞ pozn.:Jako synonymum k pojmu se distribuční funkce se používá pojem rozdělení náhodné veličiny. Diskrétní rozdělení je takové, že existuje konečná nebo nejvýše spočetná množina reálných čísel {t1, t2,...} taková, že pro každé ti je P[X = ti] = pi > 0. Distribuční funkce je pak dána součtem všech pi s ti meším nebo rovným danému t. Jde tedy o náhodný děj nabývající konečného (nebo spočetného) počtu hodnot. Příkladem může být házení kostkou, ruleta nebo losování Sportky. Funkci definovanou vztahem P(t) = P[X = t] (1.3) nazveme pravděpodobnostní funkcí náhodné veličiny X. Pravděpodobnostní funkce má některé zajímavé vlastnosti: 1. P[X = a] = P(a) 2. P[X < a] = F(a) - P(a) 3. P[X ≤ a] = F(a) 4. P[X > a] = 1 - F(a) 5. P[X ≥ a] = 1 – F(a) + P(a) Absolutně spojité rozdělení náhodné veličiny X je takové rozdělení, pro jehož distribuční funkci F(t) existuje nezáporná reálná funkce f(t) taková, že pro všechna x∈R platí: x
F x=∫−∞ f t dt
(1.4)
Funkci f(t) nazvemehustotou pravděpodobnosti nebo krátce jen hustotou. A jaká tedy je spojiná náhodná veličina? Obecně taková, jejíž hodnota může nabývat všech reálných čísel nebo všech hodnot z nějakého intervalu reálných čísel. Pro praktické užití se uvažuje i u hodnot, které jsou principiálně kvantované (laboratorní výsledky). Za předpokladu spojitosti F(t) platí: dF x f x= (1.5) dx
Pro určení pravděpodobnosti konkrétních jevů lze použít následující vztahy: 1. P[X = a] = 0 2. P[X < a] = P [X ≤ a] = F(a) 3. P[X > a] = P [X ≥ a] = 1 – F(a) 4. P[a < X < b] = P[a ≤ X ≤ b] = F(b) – F(a) Na závěr by bylo vhodné se zmínit o tom, že existují i smíšená rozdělení, tedy taková rozdělení, jejichž distribuční funkci lze vyjádřit jako součet spojité a diskrétní složky. Taková funkce by popisovala např. situaci, kdy je určitá část výrobků vadných ihned po vyrobení a zbytek výrobků má životnost určenou nějakým rozdělením. Obvykle se však takové případy uvažují odděleně.
1.3 Číselné charakteristiky Pro popis náhodného děje je nejpřesnější distribuční nebo pravděpodobnostní (resp. hustotní) funkce. Protože jde ale o rovnici, nemá pro většinu lidí valnou vypovídací hodnotu. Pro hrubou charakteristiku (a někdy i hrubou dezinformaci) jsou nejvhodbější číselné ukazatele.
1.3.1 Kvantily
Nejdříve definice: Nechť je α∈(0,1), pak hodnotu náhodné veličiny X nazveme α-kvantilem a označíme xα, jestliže splňuje obě následující podmínky: P[X < xα] ≤ α a současně P[X ≥ xα] ≥ 1 - α (1.6) Tato definice umožňuje určit jednoznačně α-kvantil u spojitého rozdělení, u diskrétního lze však určit pouze interval, ve kterém se daný kvantil nachází. Některé kvantily mají své speciální názvy: x0.5 medián x0.25 dolní kvartil x0.75 horní kvartil x0.1 dolní decil x0.9 horní decil (x0.75 – x0.25) mezikvartilové rozpětí Zvláštní pozornost si zasluhuje medián, x . Jde o jednu z často užívaných "průměrných hodnot".
1.3.2 Střední hodnota Pro náhodnou veličinu s diskrétním rozdělením je střední hodnotou zobecněný aritmetický průměr: EX =∑ x i⋅P [ X = x i ]=∑ x i pi (1.7) ∀i
∀i
Pro náhodnou veličinu se spojitým rozdělením platí obdobný vztah: ∞
EX =∫−∞ x⋅f x dx
(1.8)
1.3.3 Rozptyl a směrodatná odchylka Kromě "průměru" je vhodné určovat i "šíři" náhodné veličiny. K tomu se používá zejména rozptyl (σ2, var X) (1.9), který je vlastně průměrnou čtvercovou odchylkou od střední hodnoty a směrodatná odchylka(σ) (1.10), která je druhou odmocninou rozptylu. (1.9) var X =E X – EX 2 = var X
(1.10)
1.4 Některá důležitá rozdělení Značná část studovaných náhodných jevů má vlastnosti blízké některému ze základních rozdělení. Tím je velmi usnadněna práce, protože většinu případů lze řešit mechanicky pomocí "statistické kuchařky". Je ovšem třeba mít neustále na paměti, že počet všech možných rozdělení je omezen jen naší matematickou fantazií a příroda je v tomto směru lehce zlomyslná.
1.4.1 Binomické rozdělení Binomické rozdělení modeluje situaci, kdy probíhá n nezávislých dějů, z nichž každý má jen dvě možnosti výsledku – obvykle ano/ne, 1/0, atp. Pravděpodobnost, že se dílčí jev realizuje, je p, pravděpodobnost, že k realizaci nedojde, je 1 – p. Otázkou pak je, s jakou pravděpodobností nastane právě k jevů a n – k jevů nenastane. Pravděpodobnostní funkce binomického rozdělení je: n−k P [ X =k ]= n ⋅p k⋅ 1 – p (1.11) k
To, že náhodná veličina X má binomické rozdělení, značíme X~Bi(n,p). Základní číselné hodnoty rozdělení jsou: střední hodnota EX = np rozptyl var X = np(1-p)
1.4.2 Poissonovo rozdělení Poissonovo rozdělení je vlastně binomické rozdělení pro n rostoucí k nekonečnu a velmi vzácný výskyt příznivé události (tedy p se blíží k nule). V praxi se může použít všude tam, kde by byl výpočet binomického rozdělení díky vysokému n velmi obtížný. Jeho častějším použitím je však popis náhodných událostí, které nastanou za časovou jednotku. Příkladem takových událostí mohou být mutace, průchod exotické částice detektorem nebo počet telefonních hovorů spojených ústřednou. Časový rozměr ale není podmínkou – tímto rozdělením lze například modelovat počet baktérií v objektivu mikroskopu. Pravděpodobnostní funkce Poissonova rozdělení je: k − P [ X =k ]= ⋅e (1.12) k! To, že náhodná veličina X má Poissonovo rozdělení, značíme X~Po(λ). Koeficient λ označuje průměrný počet událostí ve sledovaném časovám nebo prostorovém intervalu (intenzitu). Základní číselné hodnoty rozdělení jsou: střední hodnota EX = λ rozptyl var X = λ
1.4.3 Exponenciální rozdělení Exponenciální rozdělení určuje dobu čekání na náhodnou událost. V praxi se může jednat například o čekání na pacienta nebo určení doby mezi vznikem dvou chyb. Hustota rozdělení je: 1 − f x= ⋅e
x–A
(1.13)
Celkem bez problémů lze spočítat i distribuční funkci: −
x− A
(1.14) F x=1 – e To, že náhodná veličina X má exponenciální rozdělení, značíme X~E(A,δ). Parametr A určuje posun v čase od začátku ("okamžik startu") a parametr δ je vlastně střední délka intevalu mezi událostmi. Základní číselné hodnoty rozdělení jsou: střední hodnota EX = A + δ rozptyl var X = δ2
1.4.4 Normální (Gaussovo) rozdělení Normální rozdělení je jedno z nejčastěji používaných rozdělení vůbec. Bohužel se stává, že jsou metody založené na předpokladu normálního rozdělení aplikovány na jinak rozdělený soubor a výsledky jsou zcela špatné. Normální rozdělení je určeno dvěma parametry - μ a σ2. Parametr μ je střední hodnota a parametr σ2 je rozptylem rozdělení. To, že náhodná veličina X má normální rozdělení, značíme X~N(μ ,σ2). Hustota normálního rozdělení je: x−
2
− 1 (1.15) f x= ⋅e 2 2 Poměrně známý je i graf hustoty. Protože se bude hodit při úvahách o testování hypotéz, uvádím jej: 2
V obrázku jsou vyznačeny (ne nejlépe, ale lepší jsem nenalezl) důležité hodnoty, například že zhruba 68% hodnot leží v intervalu ± . Z výpočetního hlediska je výhodná transformace náhodné veličiny X na náhodnou veličinu U~N(0 ,1) podle vztahu: X − U= (1.16) Náhodná veličina U má pak rozdělení x
2
− 1 x= ⋅e 2 2
(1.17)
a distribuční funkci t2
− x 1 x= ⋅∫−∞ e 2 dt 2
(1.18)
Vzhledem k tomu, že integrál v (1.18) nelze analyticky řešit, jsou funkce tabelovány. Důležité je, že pomocí nich lze vyjádřit i hustotu a distribuci náhodné veličiny s obecnými parametry:
x− 1 f x= ⋅
(1.19)
(1.20)
F x=
x−
Díky výše uvedené transformaci můžeme celkem jednoduše (s pomocí tabulek) počítat jakékoliv normální rozdělení prostě tak, že si svá data transformujeme.
2. Základy statistiky 2.1 Základní pojmy, metody výběru Nejdříve si definujme statistiku jako vědu: Statistika je obor zabývající se popisem existující variability dat a hodnocením hypotéz vysvětlujících tuto variabilitu.Její vývoj začíná někdy v 17. století, je motivován zejména dvěma vlivy – politicky a zájmem o teorii her. Statistický znak je prostorově a časově přesně definovaný pojem, jehož vlastnosti sledujeme. Může jím být například příjem domáctnosti v určitém měsíci, přítomnost choroby u jedince v daném období nebo fermentace cukrů určitou barkteriální kolonií.Hodnotu statistického znaku obvykle nazýváme statistická proměnná. Statistická jednotka je objekt statistického zkoumání, hodnotí se u něj statistické znaky. Například může jím o pacienty, domáctnosti nebo o kolonie mikrobů. Statistický soubor je sada statistických jednotek, na nichž je prováděno vlastní zkoumání. Příkladem mohou býl všichni lidé v dané populaci, všichni onkologičtí pacienti nebo myslivci na Vysočině. Statistické zjišťování je proces zjišťování statistických znaků u statistických jednotek v daném statistickém souboru. Může být vyčerpávající, kdy je zkoumán celý subor, nebo výběrové, kdy je zkoumána jen část souboru. V případě výběrového zjišťování existuje několik způsobů výběru statistických jednotek, které by měly reprezentovat celý soubor. Dlužno však poznamenat, že oprávněný je jen randomizovaný výběr, tedy takový výběr, kdy má každá jednotka v souboru stejnou pravděpodobnost, že bude vybrána, přičemž svým výběrem neovlivní pravděpodobnost výběru jiných jednotek. Jakákoliv forma nenáhodného výběru může hrubě zkreslit výsledek (což může být zneužito), ale alespoň ve společenských vědách jde o podstatně levnější záležitosti.
2.2 Typy dat Statistickým šetřením můžeme získat různá data. Podle jejich charakteru je můžeme dělit do několika skupin: 1. miktodata - údaje o jednotlivých statistických jednotkách (statistické proměnné) 2. makrodata – ageregovaná mikrodata, tedy ukazetele (průměry, různé indexy, atp.) 3. metadata – charakteristiky makrodat, tedy definice ukazatelů Statistické znaky můžeme dělit do několika skupin: • kvantitativní znak je vyjádřen číslem majícím význam rozměru. Dále se dělí na znak: • spojitý – libovolný neprázdný interval reálných číselné (výška, napětí, glykémie) • diskrétní - řada oddělených čísel (počet dětí v rodině, počet úmrtí) Kvantitativní znak můžeme vyjádřit na dvou stupnicích podle volby nuly: • intervalová stupnice – nula je libovolně volitelná, proto lze určit jen vzdálenost dvou bodů • poměrová stupnice – nula je pevně definované, lze určit i (smysluplný) poměr dvou hodnot • kvalitativní znak je znak, který charakterizuje přítomnost určité vlastnosti. Může být: • nominální, kdy se ptáme jen na přítomnost prvku určité množiny (barva, pohlaví) • ordinální, kdy má význam uvažovat i pořadí, např. spokojenost={ano, částečně, ne} Znaky nominální, ordinální a diskrétní můžeme označit jako kategoriální znaky a jejich možnosti jako kategorie nebo též třídy. Kategoriální znaky můžeme dále dělit: • vícekategoriální – mají více než dvě kategorie • dichotomické - mají právě dvě kategorie • symetrické – obě možnosti jsou stejně významné (muž×žena) • asymetrické – jedna z možností je významnější (přežil×zemřel)
2.3 Prezentace dat Primárním produktem statistického šetření je ovbykle netříděná tabulka údajů – matice dat. Deskriptivní statistika pak disponuje řadou metod, jak z této nepřehledné změti údajů získat přehlednou charakteristiku zkoumné populace. Důležitou informaci poskytují číselné charakteristiky souboru: • Kvantily jsou probrány výše • Modus x říká, které hodnoty je v souboru nejvíce. V případě spojitého rozdělení je výpočet (alespoň formálně) jednoduchý – stačí zjistit maxima hustotní funkce.V případě diskrétní distribuce se stanovuje tzv. modální interval a někdy stanovuje pomocí interpolace i modus. Pro kategoriální znaky je určení nejsnažší – prostě se vybere nejčetnější kategorie. • Aritmetický průměr x je často užívaný pro svůj jednoduchý výpočet. Je však velmi citlivý na extrémní hodnoty. n
1 x = ⋅∑ x i n i=1
(2.1)
• Geometrický průměr xG je méně často používanou charakteristikou. Lze použít jen tam, kde jsou všechny prvky souboru větší než nula. Je odolnější vůči vlivu extrémních hodnot. xG =
∏ n
n
i=1
xi
• Harmonický průměr xH je zřídka užívanou charakteristikou. n xH = n ∑ 1x i=1 i
(2.2)
(2.3)
Kromě měr polohy existují (a používají se) i míry variability výběru. • Výběrový rozptyl s2 je protějškem rozptylu rozdělení, z něhož výběr pochází. Lze ukázat, že střední hodnota výberových rozptylů je rovna rozptylu rozdělení populace. s 2=
n
2 1 ⋅∑ x i – x n – 1 i=1
(2.4)
• Výběrová směrodatná odchylka s je obdobou směrodatné odchylky. s=
n
1 ⋅∑ x – x n – 1 i=1 i
(2.5)
Většinou však jedno číslo nestačí a data je třeba prezentovat v tabulkách. Základem je prostá tabulka, která v podstatě odpovídá matici dat. Přehlednější je skupinová tabulka, ve ktré jsou data rozdělena podle tříd nebo třídních interval a a kombinační tabulka, ve které jsou data tříděna podle více kritérií.Každé políčko tabulky by mělo být vyplněno číslem nebo symbolem. Speciální význam mají znaky: 0,000 velmi nízký výskyt (počet des. míst odpovídá ostatním hodnotám) − nevyskytl se žádný případ ∙ hodnotu neznáme nebo nelze zjistit × zápis není možný z logických důvodů Data je třeba nejdříve rozdělit do tříd. U kategoriálních znaků je existence tříd celkem jasná, u spojitých veličin si pomáháme zavedením třídního intervalu. Pro odhad počtu třídních intervalů můžeme použít např. vzorec TI = 10*log n, kde n je počet prvků v souboru. Je vhodné, aby se počet kategorií pohyboval v rozmezí 5 až 20.
U každé kategorie je vhodné určit četnost. Ta může být: • absolutní, tedy počet prvků dané kategorie v souboru • relativní, tedy poměrné zastoupení dané kategorie v souboru • kumulativní četnost je součet četnosti dané kategorie s četnostmi všech nižších kategorií Velice názorný výstup, ale také nejsnáze manipulovatelný, je výstup v podobě grafů. • bodový graf znázorňuje naměřené hodnoty v podobě bodů. Vhodný je pro sledování závislosti dvou veličin. V případě vynášení více závislostí se body graficky rozlišují. • spojnicový graf je podobný bodovému, body jsou však spojeny úsečkami. Často se používá ke značení časových řad. • sloupcový graf je velmi často používaný. Jeden sloupec reprezentuje jednu třídu respektive třídní interval (pak bude šířka sloupce úměrná šířce intervalu), plocha sloupce je úměrná četnosti. • histogram je sloupcový graf charakterizovaný tím, že sloupce jsou vždy vertikáln, vodorovná osa má vždy měřítko a plocha sloupců odpovídá četnosti třídy. • kruhový (výsečový) graf zachycuje relativní zastoupení jednotlivých tříd celého souboru. • krabicový graf zachycuje poměrně komplexní údaje. Bohužel symbolika není jednotná. a – horní extrém, nejvýše však 1.5 násobek a mezikvartilového rozpětí b – horní kvartil b c – průměr c d – medián d e e – dolní kvartil f – dolní extrém, nejvýše však 1.5 násobek mezikvartilového rozpětí f
2.4 Simpsonův paradox V rámci statistického hodnocení dochází často ke spojování různých dat do jedné kategorie. Na nebezpečí neuváženého spojování různých dat, obdorně zvaného též sčítání jablek s hruškami, upozorňuje následující příklad. Uvažujme dvě nemocnice, napříhlad Horní Sádrovice a Stará Dlaha. Pro jednoduchost uvažujme jen dvě skupiny pacientů – lehce nemocní a těžce nemocní, a dva možné výssledky léčby – vyléčení a úmrtí pacienta.Násleující tabulka srovnává obě nemocnice: stav přijatých pacientů
dobrý
kritický
celkem
přijato
†
přijato
†
přijato
†
Horní Sádrovice
600
10 1.6%
400
190 47%
1000
200 20%
Stará Dlaha
900
30 3.2%
100
70 70%
1000
100 10%
nemocnice
Pokud je pacient v dobrém stavu, jistě si vybere nemocnici v Horních Sádrovicích, pobyt tam bude jistě méně rizikový. I pacient v kritickém stavu bude mít jistě větší naději, pokud bude dovezen (například trpělivými dědici) do nemocnice v Horních Sádrovicích. Když se však udělá průměrná hodnota všech úmrtí ze všech přijatých, tak vyjde lepší hodnocení nemocnici ve Staré Dlaze. Čím to je způsobeno? Odpověď spočívá ve spekru přijímaných pacientů. Zatímco v Horních Sádrovicích představují pacienti v kritickém stavu 40% případů, ve Staré Dlaze je jich jen 10%.
3. Testování hypotéz 3.1 Základní pojmy Induktivní statistika je obor, který se pokouší na základě znalostí souboru testovat platnost hypotéz o rozdělení výsledků a který umožňuje nejistotu závěrů kvantifikovat. Základní metodika testu je velmi jednoduchá. Nejdříve si formulujeme nulovou hypotézu, tedy teorii, jejíž platnost testujeme. Obecně se značí H0. Proti ní formulujeme alternativní hypotézu H1, která představuje opačné tvrzení k nulové hypotéze. Nulovou hypotézu obvykle formulujeme tak, že se nějaké dva parametry rovnají. Aletrnativní hypotéza může být nerovnost obou parametrů (oboustranná alternativní hypotéza), ale i poměr větší-menší, zejména pokud to neodporuje logice uspořádání (jednostranná alternativníhypotéza). Po formulaci hypotéz je třeba stanovit (určit si) hladinu významnosti α , tedy maximální povolenou pravděpodobnost, že nulová hypotéza neplatí, i když nelze podle výsledků testu zamítnout. Často se stanovuje na 5% (α = 0,05) nebo 1% (α = 0,01). Z dat si lze stanovit dostaženou hladinu významnosti p (p-value), tedy pravděpodobnost, že nulová hypotéza neplatí. Tedy pokud p vyjde menší než α, nelze nulovou hypotézu zamítnout. Pokud vyjde p větší než α, zamítáme nulovou hypotézu. Pro vlastní výpočet si stanovíme testovou statistiku: pozorovaná hodnota – očekávaná hodnota testová statistika= (3.1) směrodatná chyba pozorování Za předpokladu dostatečně velkého výběru (n > 60) a spojité náhodné veličiny lze předpokládat normální rozdělení hodnot změřených průměrů kolem střední hodnoty. Testová statistika se pak bude značit Z: – 0 X Z= (3.2) /n Za předpokladu, že platí H0, bude platit Z ~ N(0,1). Další postup je tedy v případě oboustranné alternativní hypotézy jednoduchý. V tabulkách si nalezneme z kvantil normálního rozdělení s 1−
2
parametry 0 a 1. Nalezený kvantil pak porovnáme s hodnotou Z. Je-li Z vyšší než tabulková hodnota příslušného kvantilu, zamítneme nulovou hypotézu. Je-li Z nižší než tabulková hodnota příslušného kvantilu prohlásíme, že nulovou hypotézu nelze zamítnout na hladině významnosti α. V případě jednostranné alternativní hypotézy hledáme v tabulkách kvantil z 1 − . Při testování hypotéz může dojít ke vzniku chyb, která jsou dvojího druhu.Chyba I. druhu (α) vznikne, jestliže nulová hypotéza platí, ovšem došlo k jejímu zamítnutí. Zcela ekvivalentně chyba II. druhu (β) nastane v situaci, jestliže nulová hypotéza neplatí, ovšem nedošlo k jejímu zamítnutí. Obvykle volíme riziko chyby I. druhu (hladina významnosti) a jsme si vědomi toho, že chyba II. druhu může být poměrně vysoká. Proto by měl být výsledek testu formulován buď "nulovou hypotézu zamítáme"(s chybou α) nebo "o hypotézách nelze udělat žádné rozhodnutí". V souvislosti s chybou II. druhu je vhodné se zmínit o síle testu definované jako 1 – β. Ta závisí (podobně jako β) na rozsahu výběru a vlastnostech souboru. Správnou volbou rozsahu výběru tak lze zvyšovat sílu testu, respektive snižovat β.
3.2 t-test V praxi obvykle neznáme směrodatnou odchylku testovaného znaku, která je třeba pro výpočet testové statistiky Z. Nahrazujeme jí tedy jejím odhadem výběrovou směrodatnou odchylkou, čímž ovšem zvyšujeme nejistotu. Počítáme statistiku T: −0 X T= (3.3) s/ n Tato charakteristika již nemá normální rozdělení, ale Studentovo t-rozdělení. Parametrem dohoto rozdělení je počet stupňů volnosti (df), přičemž df = 1 – n. Toto rozdělení je podobné normálnímu rozdělení a pro n > 100 lze již poměrně aproximovat normálním rozdělením. V tabulkách se vyhledá kvantil pro zvolené α a pro přislušný počet stupňů volnosti (n – 1) a celý postup je obdobný postupu uvedenému výše.
3.3 χ2-test dobré shody χ2-test slouží k testování kategoriálních dat. Testuje se hypotéza, zda rozložení kategorií naměřených dat odpovídá teoretickému rozdělení. Předpokládejme, že zjistíme k kategorií, každá bude mít četnost oi a budeme testovat, zda mají dané kategorie teoretické rozdělení četností πi. Hypotézu o shodě naměřených a předpokládaných četností zamítneme, jestliže bude platit: n
∑ i=1
2
o i – n i n i
2 1− k – 1
2 Přičemž 1− k −1 je (α – 1) kvantil rozdělení χ2. Velkými rizikem je, že zde uvedená statistika má rozdělení χ2 pouze pro n blížící se k nekonečnu. Proto se požaduje, aby teoretická četnost každé testované kategorie v soubou byla nejméně 5.
4. Použitá literatura [1] Zvárová J: Biomedicínská statistika I – Základy statistiky pro biomedicínské obory, Karolinum, Praha 2002 [2] Rogalewicz V: Pravděpodobnost a statistika pro inženýry, Vydavatelství ČVUT, Praha1998 [3] Řezanková H et al: Interaktivní učebnice statistiky, http://badame.vse.cz/iastat [4] Friesel M: Pravděpodobnost a statistika hypertextově, http://home.zcu.cz/~friesl/hpsb/tit.html [5] Houser P: Sipmsonův paradox a slučování dat, ScienceWorld, 20.9.2004, http://scienceworld.cz [6] Duchoslav M: Přednášky k předmětu Statistika pro biology, http://botany.upol.cz [7] Svršek J, Bartoš R: Z historie matematiky a fyziky 1, Natura 6, 2001
(3.4)