Lekce 1
Náhodný výběr, statistiky a bodový odhad Parametr rozdělení pravděpodobnosti je neznámá konstanta, jejíž přímé určení není možné. Nástrojem pro odhad neznámých parametrů je náhodný výběr a jeho charakteristiky — statistiky. Z konkrétního provedeného náhodného výběru není obtížné výběrové charakteristiky přímo vypočítat. Jsou to (s drobnými odchylkami) ty, kterými jsme se učili popisovat datový soubor. Určitým problémem, ale současně i východiskem, je to, že různých náhodných výběrů můžeme z rozdělení pravděpodobnosti pořídit nekonečné množství. Každý z nich je současně jedinečný a neopakovatelný, ale každý z nich v sobě současně obsahuje „kousek“ informace o neznámých parametrech rozdělení pravděpodobnosti náhodné veličiny. Výběrové charakteristiky jsou náhodné veličiny a smyslem této lekce je co nejlépe poznat jejich pravděpodobnostní chování. Při tom nevystačíme jen s normálním rozdělením, ale v zájmu věci musíme zavést ještě několik dalších zákonů rozdělení pravděpodobnosti.
bodový odhad; Fisherovo–Snedecorovo rozdělení; konzistence; kritéria výztižnosti; náhodný výběr; nejlepší nestranný odhad; nestrannost; parametr; Pearsonovo rozdělení; realizace statistiky; směrodatná chyba; statistika; Studentovo rozdělení; stupně volnosti; výběrová charakteristika; výběrová relativní četnost; výběrová směrodatná odchylka; výběrový protějšek; výběrový průměr; výběrový rozptyl; vydatnost
1.1 Náhodný výběr a statistiky Posloupnost nezávislých a stejně rozdělených náhodných veličin X 1 , X 2 ,..., X n je náhodným výběrem z rozdělení pravděpodobnosti náhodné veličiny X o (konečném) rozsahu výběru n. Při splnění podmínek výběru s opakováním jsou prvky náhodného výběru nezávislé náhodné veličiny. Náhodnost výběru je zajištěna pomocí některé z výběrových technik, kterým se podrobněji nebudeme zabývat. Jako výběrovou techniku, zajišťující náhodnost výběru, si můžeme představit např. losování. To, že veličiny X 1 , X 2 ,..., X n pocházejí z téhož rozdělení pravděpodobnosti, má za následek, že všechny mají stejnou střední hodnotu i rozptyl E ( X ), D 2 ( X ) (to se týká i dalších charakteristik, které nás však v tomto okamžiku nezajímají). Od charakteristik náhodné veličiny musíme striktně rozlišit charakteristiky náhodného výběru, kterým se souhrnně říká statistiky (další význam pojmu statistika!). Nejdůležitější výběrovou charakteristikou je pochopitelně výběrový průměr X n . Jde o náhodnou veličinu (proto označení velkým písmenem), jejíž vlastnosti závisí na rozsahu výběru n (proto index n). Od výběrového průměru jako náhodné veličiny musíme odlišit konkrétní číslo, hodnotu — realizaci, kterou tato veličina nabyla pro určitý konkrétní náhodný výběr, kterou označíme x (tj. jako konstantu malým písmenem a bez indexu n). Podobně jako s výběrovým průměrem zacházíme i s dalšími statistikami, např. výběrovým mediánem, výběrovým rozptylem apod. Pro účely zobecnění označujeme libovolnou statistiku, jejíž vlastnosti souvisí s rozsahem výběru, symbolem Tn . Ilustrativní příklad sčítání náhodných veličin n
Tento příklad uvádíme proto, že při výpočtu výběrového průměru operujeme se součtem
∑X i =1
i
.
Na obr. 1.1 je pravděpodobnostní chování součtu nezávislých náhodných veličin demonstrováno pomocí součtu rovnoměrně rozdělené spojité náhodné veličiny, podobný výsledek bychom ovšem obdrželi i při sčítáni jinak rozdělených náhodných veličin (dokonce i při různém rozdělení jednotlivých sčítanců, což však není pro náhodný výběr typické).
6
Obr. 1.1 Konvergence součtu nezávislých náhodných veličin k normálnímu rozdělení
f(x), pi
f(x), pi
x
x Jedna náhodná veličina má rovnoměrné rozdělení. Součet dvou nezávislých veličin má již tzv. trojúhelníkové rozdělení. Součet pouhých pěti veličin má již rozdělení, které je blízké normálnímu. Histogramy byly získány tříděním 500 realizací náhodných veličin a proloženy odpovídajícím rozdělením. Původní rovnoměrné rozdělení bylo vytvořeno počítačovou simulací.
f(x), pi
x
Zajímáme se o charakteristiky náhodné veličiny, vzniklé jako součet jiných náhodných veličin, přičemž budeme předpokládat, že výsledná veličina konverguje k normálnímu rozdělení. Mají-li všechny sčítance stejné střední hodnoty i rozptyly E ( X ), D 2 ( X ) (což je případ náhodného výběru), n
n
i =1
i =1
pak E ( ∑ X i ) = nE ( X ) , D 2 ( ∑ X i ) = nD 2 ( X ) . Při dostatečném počtu sčítanců můžeme psát také n
n
i =1
i =1
E ( ∑ X i ) = nE ( X ) = nµ a D 2 ( ∑ X i ) = nD 2 ( X ) = nσ 2 . n
∑X i =1
i
[
]
má tedy rozdělení N nµ ; nσ 2 .
Přemýšlejte o tom, jak se chová průměrný výsledek, který hodíme při hodu rostoucím počtem hracích kostek. Při tom víme, že při hodu jednou kostkou je výsledkem hodnota xi : 1, 2,..., 6 s konstantní pravděpodobnostní funkcí
P( x ) =
1 (tzv. diskrétní rovnoměrné rozdělení). 6
1.2 Rozdělení výběrových charakteristik n
Střední hodnota výběrového průměru (který je součtem
∑X i =1
i
, děleným rozsahem výběru n) je
1 n 1 X i = nE ( X ) = E ( X ) = µ . ∑ n i =1 n Střední hodnota výběrového průměru (bez ohledu na n) je tedy rovna střední hodnotě náhodné veli-
za těchto okolností E ( X n ) =
činy, z jejíhož rozdělení byl výběr pořízen. Variabilita výběrového průměru vyjádřená jeho rozptylem je
7
1 2 n 1 D2 ( X ) σ 2 2 = = = D ( X ) nD ( X ) ∑ i n2 n2 n n i =1 D( X ) σ a směrodatná odchylka je dána jako D ( X n ) = = . Směrodatná odchylka výběrové charakn n D2 ( X n ) =
teristiky se nazývá směrodatná chyba. S rostoucím rozsahem výběru klesá směrodatná chyba výběrového průměru, čímž se zvyšuje jeho stabilita.
Stanovte jak se musí změnit rozsah výběru pokud se má směrodatná odchylka výběrového průměru (a) zdvojnásobit, (b) snížit na polovinu, (c) snížit na desetinu původní hodnoty n. (1–1)
Obr. 1.2 Rozdělení výběrového průměru Tečkovanou čarou je znázorněna hustota pravděpodobnosti rozdělení, ze kterého byl výběr pořízen. Přesto, že toto rozdělení se od normálního rozdělení liší, výběrové průměry mají rozdělení, jehož hustota pravděpodobnosti je symetrická zvonovitá křivka. S rostoucím rozsahem výběru se poloha střední hodnoty výběrového průměru nemění, zatímco jeho variabilita klesá (rozdělení se stabilizuje). Jednotlivé křivky jsou znázorněny pro n rovno postupně 3, 5 a 10.
f(x) 0.75
n
0.5
0.25
0
1
2
3
4
5
x
Xn −µ σ Rozdělení výběrového průměru je tedy N µ ; ( ) 2 a normovaná veličina U = má σ n n normované normální rozdělení N [0;1] . Pro veličinu U můžeme např. napsat
Xn −µ P uα ≤ ≤ u α = 1 − α . Je-li α dostatečně blízké nule, je jev, že veličina padne do inσ 1− 2 2 n tervalu vymezeného oběma kvantily normovaného normálního rozdělení, jevem prakticky jistým. Vztah obsahuje jako neznámé µ , σ , všechny ostatní veličiny jsou známé: rozsah výběru n, výběrový průměr a dále kvantily, mezi nimiž platí u α = −u α , najdeme v tabulkách. Problémem, který 2
1−
2
budeme muset v následujících odstavcích vyřešit, jsou dvě neznámé v tomto výrazu a tudíž neexistence jednoznačného řešení.
[
]
X má N 1000; 52 . S jakou pravděpodobností (přibližně) vybočí z intervalu (990; 1010) ? S jakou pravděpodobností vybočí aritmetický průměr z 25 hodnot této veličiny z intervalu (998; 1002) ? (1–2) Náhodná veličina
2
X −µ Náhodná veličina U = , má-li U rozdělení N [0;1] (viz tečkovaná křivka na obr. 1.3), σ má U 2 ≥ 0 rozdělení pravděpodobnosti, jehož hustota je klesající funkce (rovněž na obr. 1.3). 2
8
2
Obr. 1.3 Rozdělení veličiny U a jejích součtů Při výpočtu rozptylu se setkáváme se součtem n čtverců odchylek, z nichž ale jen n – 1 je nezávislých. Poslední (n–tou) odchylku můžeme vždy vypočítat ze součtu zbývajících n – 1 odchylek při využití toho, že součet všech odchylek je roven nule. Na obr. 1.3 je tedy ještě znázorněna hustota pravděpodobnosti tohoto součtu n – 1 čtverců odchylek pro n = 6. Takovéto rozdělení, které nelze dobře aproximovat rozdělením normálním, se nazývá Pearsonovým rozdělením (rozdělením chí–kvadrát); značíme
χ 2 [1]
f(x) 0.75
χ 2 [5]
0.5
0.25
0
-3
-1
1
3
5
7
9
x
χ 2 [ν ] , kde ν = n − 1 (ný) je jediným parametrem to-
hoto rozdělení. Klesající hustota na obr. 1.3 je tedy Pearsonovým rozdělením χ 2 [1] . Kvantily Pearsonova rozdělení jsou rovněž tabelovány. n
∑ ( X i − X n )2
Náhodná veličina i =1
σ
2
=
(n − 1) S n2−1
σ
2
má rozdělení χ 2 [n − 1] .
n
1 ∑ ( X i − X n ) 2 je výběrový rozptyl. Ten se od popisné formy rozptylu liší tím, že pro n − 1 i =1 dělení součtu čtverců se používá místo rozsahu výběru n hodnota n – 1, která se nazývá počet stupňů ( n − 1) Sn2−1 2 volnosti. I pro výběrový rozptyl můžeme napsat P χ α2 ≤ ≤ χ α = 1 − α . Tento výraz 1− σ2 2 2 Sn2−1 =
obsahuje jedinou neznámou veličinu, kterou je rozptyl σ 2 . Vzhledem k asymetrii hustoty pravděpodobnosti jsou i kvantily umístěny asymetricky (navíc mohou nabýt pouze kladných hodnot, protože χ 2 ≥ 0 ) — viz obr. 1.3. Vzájemný přepočet popisné a výběrové formy rozptylu je snadný, neboť Sn2 = Sn2−1 zatímco např. Sn −1 = Sn
n −1 , n
n . n −1
Odhadněte, jak (např. o kolik %) se od sebe liší popisná a výběrová forma rozptylu (směrodatné odchylky) pro n = 5, 20, 30, 100, 1000 !
Neznámý parametr σ ve vztahu U =
Xn −µ
nahradíme výběrovou směrodatnou odchylkou, tj.
σ
n statistikou získanou z náhodného výběru (neznámou konstantu nahrazujeme náhodnou veličinou!). Pak náhodná veličina, popisující rozdělení výběrového průměru t =
Xn −µ (veličinu t i její S n−1 n
realizace je zvykem výjimečně značit malým písmenem), má rozdělení, které se nazývá Studentovo, s jediným parametrem, kterým je opět počet stupňů volnosti n – 1. Toto rozdělení budeme označovat
9
t [ν ] . Hustota pravděpodobnosti Studentova rozdělení je symetrická zvonovitá křivka, která se s rostoucí hodnotou parametru blíží ke Gaussově křivce pro normované normální rozdělení. Tou se běžně nahrazuje pro n > 30 . Pro nízké hodnoty parametru je při porovnání s Gaussovou křivkou patrná nižší
Obr. 1.4 Studentovo rozdělení
N [0;1]
0.5
t[20] 0.25
0
t [5] -3
-2
-1
0
1
2
3
výška vrcholu křivky v kombinaci s delšími konci rozdělení (pomalejším přibližováním obou větví křivky k ose náhodné veličiny). Hodnoty odpovídajících si kvantilů jsou proto u Studentova rozdělení vzdálenější od počátku, než je tomu u normovaného normálního rozdělení. Studentovo rozdělení umožňuje práci s výběry již od rozsahu n > 2 (aby bylo možno vypočítat rozptyl). Také pro Studentovu veličinu můžeme psát
Xn −µ P tα ≤ ≤ t α = 1 − α , kde 1 − α je pravSn −1 1− 2 2 n
děpodobnost prakticky jistého jevu. Tento výraz již obsahuje jedinou neznámou µ a může tedy být využit k jejímu stanovení. Kvantily, pro které vzhledem k symetrii platí t α = −t α , jsou tabelovány. 1−
2
Pro dva nezávislé výběry zavedeme normované veličiny U1 =
X 1 − µ1
σ1
2
,U 2 =
n1 rozdíl, obsahující rozdíl dvou výběrových průměrů, U1 − U 2 =
X 2 − µ2
σ2
. Jejich
n2
( X 1 − X 2 ) − ( µ1 − µ2 )
σ 12 n1
+
σ 22
má opět
n2
rozdělení N [0; 1] . Náhrada neznámých parametrů σ 12 , σ 22 výběrovými rozptyly S12 , S 22 (vypočtenými
postupně z n1 − 1, n 2 − 1 stupňů volnosti) nevede k nutnosti nahradit normované normální rozdělení
Studentovým rozdělením jen při extrémně velkých rozsazích výběrů n1,n2 . U menších rozsahů výběrů rozlišujeme dvě možnosti: (1) mají-li výběrové průměry sice neznámou, ale stejnou variabilitu, má jejich rozdíl Studentovo rozdělení t s n1 + n 2 − 2 stupni volnosti. (2) mají-li výběrové průměry neznámou a navíc nestejnou variabilitu, má jejich rozdíl rovněž Studentovo rozdělení t s vypočteným (tzv. redukovaným) počtem stupňů volnosti.
S12
Pro dva nezávislé výběry můžeme zkonstruovat náhodnou veličinu F =
σ 12 S 22
σ 22
, obsahující podíl dvou
rozptylů. Podíl ( F > 0 slouží jak pro označení náhodné veličiny, tak i jejích hodnot) je náhodnou veličinou s tzv. Fisherovým–Snedecorovým rozdělením. Toto rozdělení závisí na dvojici parametrů ν 1 = n1 − 1;ν 2 = n2 − 1 , což jsou postupně stupně volnosti pro rozptyl čitatele a jmenovatele zlomku, a vykazuje ve většině případů silně levostrannou asymetrii. Analogicky jako v předešlých případech
10
můžeme pomocí dvou asymetricky položených kvantilů Fα , F α vymezit interval, do kterého 2
1−
2
náhodná veličina padá s vysokou pravděpodobností, blízkou jedné. Obr. 1.5 Fisherovo–Snedecorovo rozdělení
f(F) Stručný výtah z tabulek kvantilů normovaného normálního rozdělení, Studentova rozdělení t, Pearsonova rozdělení χ 2 a Fisherova–Snedecorova rozdělení F viz příloha tohoto modulu.
F [10;5]
1
0.75
χ 2 [5]
0.5
χ 2 [10]
0.25
0
0
1
2
3
4
5
6
7
8
9
10
11
12
F
Výběrová relativní četnost p je náhodnou veličinou se střední hodnotou E ( p ) = θ a rozptylem D 2 ( p ) = θ (1 − θ ), kde θ je jediný parametr a současně charakteristika polohy alternativního rozdělení. Při splnění podmínky np (1 − p ) > 9 lze rozdělení výběrové relativní četnosti nahradit θ (1 − θ ) normálním rozdělením N θ ; , přičemž ve vzorci rozptylu nahradíme neznámý parametr θ n p −θ výběrovou relativní četností p. Veličina U = má rozdělení N [0;1] . p (1 − p ) n Další úvahy jsou pak zcela analogické jako u rozdělení výběrového průměru.
Určete, od jakého počtu mincí lze relativní četnost padlých líců přibližně vyjádřit pomocí normálního rozdělení! Tutéž úvahu proveďte v případě počtu směn, je-li pravděpodobnost vzniku poruchy během směny p = 0,2 .
1.3 Princip bodového odhadu Nejprve formalizujeme pojem statistiky jako náhodné veličiny, která je funkcí náhodného výběru Tn = g ( X 1 , X 2 ,..., X n ) . Realizaci statistiky Tn — její konkrétní hodnotu příslušející určitému konkrétnímu náhodnému výběru — označíme symbolem t. Statistika je náhodnou veličinou, má svůj zákon rozdělení pravděpodobnosti, který je charakterizován střední hodnotou E (Tn ) , rozptylem a směrodatnou odchylkou (směrodatnou chybou) D 2 (Tn ), D (Tn ) . Vlastnosti rozdělení statistiky Tn často souvisí s rozsahem výběru n. Směrodatná odchylka signalizuje, jak statistika výběr od výběru kolísá a označujeme ji proto jako její směrodatnou chybu. Směrodatná chyba měří velikost náhodné chyby, které se dopustíme, pokud statistikou vypočtenou z náhodného výběru nahradíme neznámý parametr rozdělení pravděpodobnosti náhodné veličiny (např. parametr σ statistikou S n −1 ). Nechť X 1 , X 2 ,..., X n je náhodným výběrem o rozsahu n z rozdělení pravděpodobnosti
náhodné veličiny, která má distribuční funkci F (Θ; x ) , kde Θ (velké theta) je neznámý parametr
11
tohoto rozdělení. Statistiku Tn nazveme bodovým odhadem neboli estimátorem neznámého parametru
Θ a píšeme Tn = estΘ . Požadujeme, aby statistika byla výstižným odhadem a přiměřeně splňovala tyto vlastnosti — kritéria výstižnosti bodového odhadu.
Statistika je konzistentním odhadem neznámého parametru, pokud s rostoucím rozsahem výběru klesá pravděpodobnost, že se při odhadu dopustíme velké chyby. Konzistentní odhad splňuje lim P( Tn − Θ > ε ) = 0 pro libovolné ε > 0 . Populárně lze říci, že konzistence odhadu znamen →∞
ná „zhodnocení“ většího rozsahu výběru tím, že pravděpodobnost hrubé chyby při odhadu klesá (říkáme, že konverguje podle pravděpodobnosti k nule).
Statistika je nestranným odhadem neznámého parametru, platí-li E (Tn ) = Θ . Populárně řečeno, nestranným odhadem se nedopustíme systematické chyby. U některých statistik můžeme ovšem pozorovat pouze tzv. asymptotickou nestrannost, kdy teprve lim E (Tn ) = Θ . Opakem n →∞
nestranného odhadu je zkreslený (vychýlený) odhad. E (Tn ) − Θ .
Měřítkem vychýlení odhadu je rozdíl
Nestranný odhad s nejmenším rozptylem nazýváme maximálně vydatný (nejvydatnější) odhad. Pro nejvydatnější odhad Tn∗ platí D 2 (Tn∗ ) ≤ D 2 (Tn ) , kde Tn je libovolný nestranný odhad. U některých statistik se hovoří o asymptoticky nejvydatnějším odhadu, což znamená, že vydatnost odhadu roste se zvyšujícím se rozsahem výběru. Opět populárně řečeno, nejvydatnější odhad je takový nestranný odhad, jehož použitím se při daném rozsahu výběru dopouštíme nejmenší náhodné chyby. Nejlepším nestranným odhadem je odhad, splňující výše uvedené vlastnosti nejdokonalejším možným způsobem (lepší odhad neexistuje). Základním problémem bodového odhadu ovšem je, že se při jeho použití dopouštíme chyby s pravděpodobností jedna (bezchybný bodový odhad neexistuje), přičemž velikost konkrétní chyby, které jsme se dopustili, neumíme stanovit. Obr. 1.6 Různé případy bodového odhadu 1. 2. 3. 4.
3
Nestranný odhad s malou vydatností. Nestranný odhad s velkou vydatnosti. Vychýlený odhad s velkou vydatností. Vychýlený odhad s malou vydatností.
2 1
4
Θ
1.4
Srovnání případů vyvolává otázky, co je vlastně lepší — zda např. vydatný a nepříliš vychýlený odhad 3 není lepší než sice nestranný, ale málo vydatný odhad 1. „Favoritem“ je samozřejmě odhad 2 a zcela zavrhneme zřejmě odhad 4. Naštěstí však takové problémy nebudeme muset řešit.
Bodové odhady parametrů rozdělení náhodných veličin
V rámci tohoto textu použijeme nejprimitivnější metodu konstrukce bodového odhadu pomocí tzv. výběrových protějšků. Některé nejlepší nestranné odhady:
X n = estµ ,
12
S n2−1 = estσ 2 a S n −1 = estσ , X 1 − X 2 = est ( µ1 − µ 2 ) , S12 σ 12 = est , S 22 σ 22 p = estθ , p1 − p2 = est (θ1 − θ 2 ) .
Všimněme si, že pomocí bodového odhadu řešíme nejen odhady samotných parametrů, ale i některých jejich funkcí, z nichž upozorňujeme na rozdíl středních hodnot normálního rozdělení
σ 12 µ1 − µ 2 a alternativního rozdělení θ1 − θ 2 a podíl rozptylů normálního rozdělení 2 . Spektrum σ2 µ možností ovšem není neomezené. Např. nelze bodově odhadnout ani podíl středních hodnot 1 ani µ2 2 2 rozdíl rozptylů σ 1 − σ 2 . Metoda výběrových protějšků obecně nevede k bodovým odhadům s dobrými vlastnostmi. Lze říci, že právě zde uvedené případy tvoří u této metody spíše výjimku.
Σ
1. Náhodný výběr z rozdělení pravděpodobnosti náhodné veličiny je základním nástrojem, jak poznat zákonitosti jejího pravděpodobnostního chování. 2. Z rozdělení pravděpodobnosti náhodné veličiny lze v principu pořídit nekonečně mnoho různých náhodných výběrů. 3. Charakteristiky těchto náhodných výběrů — statistiky — se případ od případu mění a jsou to tedy náhodné veličiny. 4. Nejběžnějšími charakteristikami rozdělení pravděpodobnosti statistik jsou jejich střední hodnoty a směrodatné chyby. 5. Existují vztahy mezi charakteristikami statistik a parametry rozdělení, z nichž byl příslušný výběr pořízen. Tyto vztahy umožňují provádět bodové odhady neznámých parametrů původního rozdělení. 6. Bodový odhad, který nejlépe splňuje kritéria konzistence, nestrannosti a vydatnosti odhadu se nazývá nejlepší nestranný odhad. 7. Uvedli jsme několik estimátorů, které mají při odhadu parametrů a jejich jednoduchých funkcí vlastnosti nejlepších nestranných odhadů. 8. Základními vlastnostmi bodového odhadu je neexistence bezchybného odhadu a nemožnost stanovit velikost chyby, které jsme se v konkrétním případě dopustili. 9. V této lekci bylo nevyhnutelné zavést několik spojitých náhodných veličin, jejichž rozdělení pravděpodobnosti je Studentovo t, Pearsonovo χ 2 nebo Fisherovo–Snedecorovo F. Tato rozdělení budeme systematicky využívat v dalších lekcích.
13
(1–1) (a)
0,25n , (b) 4n , (c) 100n.
(1–2) V obou případech jde (přibližně) o pravděpodobnost 0,05.
1.
Pravděpodobnost, že náhodná veličina s normovaným normálním rozdělením přesáhne hodnotu 0,5 je rovna 0,309. Pro aritmetický průměr náhodného výběru při neznámém rozsahu n je tato pravděpodobnost rovna 0,006. Určete rozsah výběru.
2.
Čemu je rovna pravděpodobnost překročení hodnoty 0,5 pro rozsah náhodného výběru n = 16 ?
3.
u0,975 = 1,96 . Pozorujte chování t0, 975 při rozsahu výběru, který je postupně n = 5, 10, 15, 20, 30, ∞ .
4.
Klasifikujte normované normální rozdělení, Studentovo rozdělení t, Pearsonovo rozdělení χ a Fisherovo–Snedecorovo rozdělení parametrů. 2
F (a) podle symetrie, (b) podle počtu
5.
Při zavedení rozdělení uvedených v úloze 4 jsme dvakrát použili bodový odhad k nahrazení neznámého parametru jeho výběrovým protějškem. Které dva případy to byly?
6.
Čemu je rovna střední hodnota a rozptyl náhodné veličiny
7.
E ( p1 − p2 ) = θ1 − θ 2 D 2 ( p1 − p2 ) = veličiny, která má rozdělení ce.
8.
θ1 (1 − θ1 ) n1
+
X1 − X2?
θ 2 (1 − θ 2 ) n2
. Napište vzorec
N [0; 1] , jsou-li splněny podmínky normální aproxima-
Ověřte si v tabulkách kvantilů, že
14
t 2 α [ν ] = F1−α [1;ν ] . 1−
2