Lekce 2
Intervalový odhad Intervalový odhad je jednou ze standardních statistických technik. Cílem je sestrojit interval (konfidenční interval, interval spolehlivosti), který s vysokou — a navíc předem danou — pravděpodobností pokryje neznámý parametr rozdělení pravděpodobnosti náhodné veličiny. Při konstrukci konfidenčních intervalů využíváme vedle dříve zavedeného normovaného normálního rozdělení především rozdělení z předešlé lekce: Studentovo, Peasonovo a Fisherovo–Snedecorovo. Pro jediný parametr konstruujeme konfidenční intervaly na podkladě jediného výběru. Pro rozdíl nebo podíl dvou parametrů vycházíme z dvojice náhodných výběrů. Vypovídací hodnota konfidenčního intervalu je nepřímo úměrná jeho šířce. Významný vliv na šířku konfidenčního intervalu má rozsah výběru. Proto se zabýváme i možností předběžného stanovení takového rozsahu výběru, aby přípustná chyba odhadu nepřesáhla požadovanou hodnotu.
dolní odhad; horní odhad; interval spolehlivosti; konfidenční interval; levostranný interval; minimální rozsah výběru; oboustranný interval; pravostranný interval; přípustná chyba; riziko odhadu; směrodatná chyba; spolehlivost odhadu
2.1
Princip intervalového odhadu
Statistiku Dα , pro kterou P[Dα ≤ Θ] = 1 − α , kde číslo α je blízké nule, nazveme dolním odha-
dem parametru Θ a interval Dα ;+ ∞ ) nazveme levostranným intervalem pro odhad parametru Θ .
Statistiku H 1−α , pro kterou P[Θ ≤ H 1−α ] = 1 − α , kde číslo α je blízké nule, nazveme horním
(
odhadem parametru Θ a interval − ∞; H 1−α
nazveme pravostranným intervalem pro odhad para-
metru Θ .
Dvojici statistik Dα , H 2
1−
α 2
pro které P Dα ≤ Θ ≤ H α = 1 − α , kde číslo α je blízké nule, 1−
2
2
nazveme oboustranným odhadem parametru Θ a interval
Dα ; H 2
1−
α
nazveme oboustranným inter-
2
valem pro odhad parametru Θ . Výše uvedené intervaly se nazývají také intervaly spolehlivosti nebo konfidenční intervaly. Předem zvolené číslo 1 − α , blízké jedné, se nazývá spolehlivostí odhadu, zatímco α je riziko odhadu. Spolehlivost odhadu se často volí např. na úrovni 0,95 nebo 0,99 (hovoří se také o 95% nebo 99% spolehlivosti). Výše uvedené vzorce vypovídají o tom, že očekáváme, že neznámý parametr Θ bude konfidenčním intervalem pokryt s vysokou (a předem zvolenou) pravděpodobností 1 − α blízkou jedné, zatímco jeho nepokrytí (kdy intervalový odhad „selže“) je možné s pravděpodobností α , blízkou nule (selhání odhadu je jevem prakticky nemožným).
Zvolíme-li např. pravděpodobnost α = 0,01 jako pravděpodobnost prakticky nemožného jevu, počítáme s tím, že sestrojíme-li jeden konfidenční interval, bude hodnota neznámého parametru intervalem pokryta. Vyjádřete se k situaci, kdy je formou „opakovaných pokusů“ sestrojeno několik stovek konfidenčních intervalů!
15
Nadále budeme konstruovat pouze oboustranné konfidenční intervaly. K jednostrannému intervalu přejdeme vynecháním jedné z obou hranic konfidenčního intervalu, přičemž ovšem zaměníme pravděpodobnosti
α
a 1−
2
α
2
za α , 1 − α .
2.2 Konfidenční intervaly (jeden výběr) Konfidenční interval pro parametr µ při známém σ nebo velkém rozsahu výběru
Xn −µ Při stanovení tohoto konfidenčního intervalu stačí použít P uα ≤ ≤ u α = 1 − α , jehož σ 1− 2 2 n
snadnou úpravou ( u α = −u α ) získáme P X n − u α 1− 1− 2
2
2
σ n
≤ µ ≤ Xn +u
1−
α
σ
2
= 1 − α . Tohon
to tvaru konfidenčního intervalu lze využít nejen pro známé σ , ale i v případě tzv. „velkého výběru“, je-li n > 30 . V tom případě bez dalších úprav použijeme bodového odhadu Sn −1 = estσ . Všimněte si, prosím, jak se mění zápis konfidenčního intervalu v okamžiku, kdy místo náhodných veličin začneme pracovat s jejich konkrétními hodnotami — realizacemi — z určitého náhodného výběru. Obecně můžeme pro realizaci intervalu psát x − u α 1−
2
σ
n
≤ µ ≤ x+u
1−
α 2
σ
n
(srovnej-
te s předchozím tvarem). Konfidenční interval pro parametr µ při neznámém σ a malém rozsahu výběru V případě malého výběru ( n < 30) při neznámém σ použijeme estimátor S n −1 = estσ čímž získáme
S S P X n − t α n −1 ≤ µ ≤ X n + t α n −1 = 1 − α . V konfidenčním intervalu jsou použity kvan1− 1− n n 2 2 tily Studentova rozdělení s n − 1 stupni volnosti. Příklad 2.1 Pro 25 náhodně vybraných žárovek jsme při kontrole životnosti zjistili x = 2022, sn = 417 (v hodinách). Se spolehlivostí 99 % určíme oboustranný konfidenční interval pro střední hodnotu životnosti celé výrobní série.
n 25 = 417 = 426 a vyhledáme n −1 24 426 426 ≤ µ ≤ 2022 + 2,797 , z čehož 1783 ≤ µ ≤ 2260 . t0,995 [24] = 2,797 . Takže 2022 − 2,797 25 25
Nejprve určíme výběrovou směrodatnou odchylku sn −1 = sn
S vysokou spolehlivostí tedy můžeme tvrdit, že střední hodnota životnosti žárovky této výrobní série se nachází v tomto rozmezí. Pozor — tento interval nevypovídá nic o individuální životnosti jednotlivých žárovek, která se jistě pohybuje v podstatně širším rozmezí a navíc, nevíme nic o jejím rozdělení pravděpodobnoti! Doplňme ještě tento příklad o to, co znamená (ve světle tohoto výsledku) tvrzení výrobce, který garantuje pro celou sérii střední hodnotu životnosti 2400 hodin? Vzhledem k tomu, že konfidenční interval hodnotu 2400 nepokrývá, je toto tvrzení s velkou pravděpodobností nesprávné (skutečná životnost je zřejmě nižší).
16
Sestrojte za stejných podmínek jako v příkladu 2.1 90% a 95% konferenční interval. Vyjádřete se ke vztahu mezi rizikem a vypovídací hodnotou konfidenčního intervalu.
Konfidenční intervaly pro parametry σ 2 , σ
2 2 ( 1 ) ( 1 ) n − S n − S n −1 ≤ σ 2 ≤ n −1 = 1 − α . Pozor — tentokrát S použitím rozdělení χ 2 [n − 1] je P 2 2 χα χ α 1− 2 2 nelze kalkulovat se symetrií, protože oba kvantily jsou různá kladná čísla! Hranice konfidenčního intervalu pro směrodatnou odchylku získáme odmocněním hranic konfidenčního intervalu pro rozptyl. Příklad 2.2 Vypočteme 95% konfidenční interval pro směrodatnou odchylku ze zadání příkladu o životnosti žárovek. Najdeme χ 02,025 [24] = 12,401, χ 02,975 [24] = 39,364
24 ⋅ 4262 24 ⋅ 4262 z čehož 332 ≤ σ ≤ 593 . Můžeme tedy tvrdit, že směrodatná odchylka ≤σ2 ≤ 39,364 12,401 životnosti výrobní série žárovek se prakticky jistě nachází ve vypočteném rozmezí. Stanovení minimálního rozsahu výběru při odhadu µ , σ 2 Vypovídací schopnost konfidenčního intervalu je nepřímo úměrná jeho šířce. Veličinou, která v podstatné míře ovlivňuje šířku dosud probraných konfidenčních intervalů (a nejen jejich), je rozsah výběru. Oba konfidenční intervaly pro střední hodnotu mají analogickou konstrukci, kterou můžeme vyjádřit jako P[Tn − ∆ ≤ Θ ≤ Tn + ∆ ] = 1 − α . Přitom (je-li použit kvantil veličiny U) ∆ = u α D (Tn ) . Za1−
2
tímco D (Tn ) jsme nazvali směrodatnou chybou, pak po jejím vynásobení příslušným kvantilem zís-
kanou veličinu ∆ (velká delta) nazveme přípustnou chybou. Přípustná chyba představuje při dané spolehlivosti právě polovinu šířky konfidenčního intervalu. Vyjádříme-li n ze vztahu ∆ ≤ u α 1−
u získáme n ≥
2
1−
ασ 2 2
∆
2
σ
n
,
2
, což je minimální rozsah výběru, který zabezpečí, aby poloviční šířka konfi-
denčního intervalu (přípustná chyba) nepřekročila zadanou hodnotu. Prakticky se vypočtené n zaokrouhluje na nejbližší celé číslo směrem nahoru. Očekáváme-li, že rozsah výběru vyjde větší než 30, můžeme hodnotu neznámého parametru σ 2 snadno nahradit výběrovým rozptylem.
V návaznosti na 2.1 určete, jaký minimální rozsah výběru vyžaduje (a) 95% konfidenční interval s přípustnou chybou nepřevyšující ± 100 , (b) 99% konfidenční interval s přípustnou chybou nepřevyšující ± 150 . (2–1)
Konfidenční interval pro rozptyl je svojí stavbou odlišný. Místo absolutního pojetí šířky intervalu ( H − D = 2 ∆ ) se využívá její relativní pojetí a κ =
χ 2 α [n − 1]
1− H = 22 . Úloha se řeší tak, že hledáme D χ α [n − 1] 2
17
oba kvantily pro takový počet stupňů volnosti n − 1 , pro který jejich podíl nepřesáhne zadanou hodnotu κ (kappa).
V návaznosti na 2.2 určete relativní šířku 95% konfidenčního intervalu pro směrodatnou odchylku pro n = 30 . (2–2)
Konfidenční interval pro parametr θ V souvislosti s bodovým odhadem parametru θ jsme uvedli podmínku normální aproximace, kdy np (1 − p ) > 9 . Při splnění tohoto předpokladu má výběrová relativní četnost p normální rozdělení s E ( p) = θ , D 2 ( p) =
θ (1 − θ ) n
. Veličina U =
p −θ má rozdělení N [0;1] . Bodovým odhadem θ (1 − θ ) n
p (1 − p ) (předpokládejme, že rozsah výběru bude vždy dosn
rozptylu veličiny p je výběrový rozptyl
tatečně velké číslo). Oboustranný konfidenční interval pro parametr θ je
P p − u α 1− 2
p(1 − p ) = 1 − α . I pro tento konfidenční interval je aden
p(1 − p ) ≤θ ≤ p+u α 1− n
2
kvátní obecná konstrukce zmíněná v souvislosti s minimálním rozsahem výběru. Analogicky jako u parametru µ můžeme označit ∆ ≤ u α 1−
2
p (1 − p ) , z čehož n ≥ n
u2
1−
α
p (1 − p )
2
∆2
.
Příklad 2.3 Z počtu 126 náhodně vybraných pneumatik mělo ve sledovaném období defekt 27 kusů. Se spolehlivostí 0,05 odhadněte parametr θ , kterým je pravděpodobnost výskytu defektu.
0,214(1 − 0,214) 0,214(1 − 0,214) 27 = 0,214 a 0,214 − 1,96 ≤ θ ≤ 0,214 + 1,96 , z če126 126 126 hož 0,142 ≤ θ ≤ 0,286 , takže defektem bude s vysokou pravděpodobností postiženo 14,2 až 28,6 % p=
pneumatik. Mimochodem — na tomto příkladě se můžeme poučit o obecném pravidle, že při zjišťování slovních odpovědí (např. ano/ne jako v tomto případě) je ve srovnání se zjišťováním číselných hodnot (měřením) nutný podstatně větší rozsah výběru, než bychom zřejmě čekali. To, co „ušetříme“ na zjišťování jednoho údaje, ztratíme na tom, že údajů je potřeba daleko více. Zkrátka — nic na světě „není zadarmo“.
V návaznosti na 2.3 určete kolik pneumatik by bylo třeba zařadit do sledování, aby s rizikem 0,05 byl parametr θ odhadnut s přípustnou chybou ± 0,05 . (2–3)
2.3 Konfidenční intervaly (dva výběry) Konfidenční interval pro rozdíl dvou středních hodnot S využitím poznatků o rozdělení rozdílu dvou výběrových průměrů můžeme pro konfidenční interval při známých σ 1 , σ 2 vyvodit
18
σ 12 σ 22 σ 12 σ 22 = 1 − α , zatímco při P ( X 1 − X 2 ) − u α + ≤ µ1 − µ2 ≤ ( X 1 − X 2 ) + u α + 1− 1− n1 n2 n1 n2 2 2 neznámých σ 1 , σ 2 použijeme bodové odhady (výběrové rozptyly) S12 , S 22 . Tuto operaci lze provést bez jakýchkoli důsledků, jen jsou-li rozsahy výběrů n1 , n2 dostatečně velké. Všimněme si, že i tento konfidenční interval vyhovuje obecné formuli, kterou jsme uvedli v souvislosti se stanovením minimálního rozsahu výběru při odhadu µ . Příklad 2.4 Pokusíme se odpovědět na otázku, zda dvě plnicí linky s deklarovanou přesností vyjádřenou směrodatnými odchylkami σ 1 = σ 2 = 2 jsou nastaveny na stejnou hmotnost plnění. O stejném nastavení linek vypovídá nulová hodnota rozdílu parametrů µ1 − µ 2 . K dispozici máme n1 = 25, n 2 = 21 naplněných obalů s průměrnou hmotností x 1 = 501, x 2 = 498 . Spolehlivost odhadu volíme 0,99.
3 − 2,576
22 22 22 22 + ≤ µ1 − µ 2 ≤ 3 + 2,576 + , z čehož 1,47 ≤ µ1 − µ 2 ≤ 4,53 . Vzhledem 25 21 25 21
k tomu, že konfidenční interval neobsahuje nulu, můžeme s velkou pravděpodobností tvrdit, že linky nejsou nastaveny na stejnou hmotnost. Konfidenční interval pro podíl dvou rozptylů S využitím poznatků o rozdělení podílu dvou rozptylů můžeme pro konfidenční interval pro podíl
S12 1 σ 12 S12 1 ≤ 2 ≤ 2 dvou rozptylů vyvodit P 2 = 1 − α , kde F jsou kvantily Fisherova–SnedeF F S S σ α α 2 2 2 1− 2 2 corova rozdělení pro n1 − 1; n2 − 1 stupňů volnosti. Tento interval je asymetrický (vzhledem k asymetrii Fisherova–Snedecorova rozdělení) a jeho konstrukce nesplňuje obecnou formuli z odstavce o stanovení minimálního rozsahu výběru. K usnadnění tabelace hodnot kvantilů využíváme Fp [ν 1 ;ν 2 ] =
1
F1− p [ν 2 ;ν 1 ]
.
Příklad 2.5 V návaznosti na příklad 2.4 vyřešíme problém, zda obě plnicí linky mají skutečně stejnou přesnost plnění. Zjištěné hodnoty výběrových směrodatných odchylek jsou s1 = 2,3; s2 = 1,5 . Přesnost plnění obou linek bude stejná, pokud konfidenční interval pro
σ 12 bude obsahovat hodnotu jedna. Riziko σ 22
odhadu zvolíme na úrovni 5 %. Hodnoty kvantilů F0,975 [24; 20] = 2,408; F0,025 [24; 20] =
1 = 0,430 (na rozdíl od prvníF0,975 [20; 24]
ho z obou kvantilů byla hodnota druhého určena jiným způsobem, než z tabulek).
Stanovíme
V tabulce 5e v příloze se přesvědčte to tom, že zatímco první z obou kvantilů snadno vyhledáme, tak vzhledem ke stručnosti tabulek nelze hodnotu druhého z kvantilů z tabulky přesně určit.
σ 12 2,32 1 σ 12 2,32 1 ≤ ≤ , z čehož 0 , 976 ≤ ≤ 5,468 . Vzhledem k tomu, že vy1,52 2,408 σ 22 1,52 0,430 σ 22
počtený interval obsahuje jedničku, nemůžeme tvrdit, že přesnost plnění u obou linek se liší.
19
Konfidenční interval pro rozdíl θ1 − θ 2
Zcela analogicky jako pro rozdíl µ1 − µ2 můžeme s využitím normálního rozdělení sestrojit konfi-
denční interval pro rozdíl θ1 − θ 2 . Tento interval je P[( p1 − p 2 ) − u
1−
α 2
p1 (1 − p1 ) p 2 (1 − p 2 ) + ≤ θ1 − θ 2 ≤ n1 n2
.
≤ ( p1 − p 2 ) + u
1−
α 2
p1 (1 − p1 ) p 2 (1 − p 2 ) + ] =1−α n1 n2
Rozhodněte, pro jaké výběrové relativní četnosti bude za jinak stejných podmínek mít konfidenční interval pro rozdíl θ1 − θ 2 nejmenší šířku. Můžete vybrat: relativní četnosti blízké 0,2; 0,5; 0,8.
Σ
1. Dolní odhad parametru je z výběru určenou statistikou D, pod kterou hodnota neznámého parametru neklesne s vysokou a předem danou pravděpodobností. 2. Horní odhad parametru je z výběru určenou statistikou H, kterou neznámý parametr nepřekročí s vysokou a předem danou pravděpodobností. 3. Oboustranným odhadem parametru je dvojice z výběru určených statistik D, H, z jejichž intervalu neznámý parametr nevybočí s vysokou a předem danou pravděpodobností. 4. Pravděpodobnosti v bodech 1 až 3 nazýváme spolehlivost odhadu. Pravděpodobnost opačného jevu (tj., že se intervalový odhad „nepodaří“) se nazývá riziko odhadu. 5. Sestrojené intervaly se nazývají intervaly spolehlivosti nebo konfidenční intervaly. Některé konfidenční intervaly jsou symetrické, jiné nikoli. 6. U symetrických konfidenčních intervalů jsou základními pojmy směrodatná chyba a přípustná chyba. 7. Šířka konfidenčního intervalu nepřímo souvisí s jeho vypovídací hodnotou. Šířku konfidenčního intervalu ovlivňuje kromě jiného rozsah výběru. Existují postupy, jak stanovit rozsah výběru tak, aby požadovaná šířka konfidenčního intervalu nebyla překročena. 8. Uvedli jsme konfidenční intervaly pro odhad jednoho parametru (jednovýběrové intervaly). 9. Uvedli jsme také konfidenční intervaly pro rozdíl nebo podíl dvou parametrů (dvouvýběrové konfidenční intervaly).
(2–1) (a) předpokládáme výsledek
n > 30 , proto využijeme u0,975 = 1,96 a stanovíme
n = 70 , (b) předpokládáme výsledek n > 30 , proto využijeme u0, 995 = 2,576 a stanovíme
n = 54 .
20
χ 02,975 [29] 45,7 = = 1,69 . 2 χ 0,025 [29] 16,00
(2–2) Relativní šířka konfidenčního intervalu
(2–3)
n = 259 .
1.
Navrhněte vhodný tvar intervalového odhadu pro tyto případy: odhad střední hodnoty proudu, při které vypne jistič, odhad podílu vadných výrobků v dodávce (z pohledu odběratele), odhad střední hodnoty pevnosti výtahového lana.
2.
Rozdělte všechny konfidenční intervaly z odst. 2.2 a 2.3 podle toho, zda jsou symetrické nebo nesymetrické.
3.
Co mají společného výrazy
σ n
a
θ (1 − θ ) n
? Jakých statistik se týkají? Jaké jsou
jejich estimátory? 4.
Stanovte, při jakém průměrném množství výrobku v obalu neklesne střední hodnota s pravděpodobností 0,995 pod na obalu uvedené množství 100 ml. Další zadané hodnoty n = 40, sn −1 = 2,5 ml. Vzhledem k podmínkám úlohy můžete použít kvantil u0,005 nebo
t0,005 [39].
5.
6.
Stanovte, při jaké přesnosti plnění postačí průměrné množství výrobku x = 102 při rozsahu výběru n = 25 , aby s pravděpodobností 0,995 neklesla střední hodnota pod na obalu uvedené množství 100 ml. Stanovte, při jakém rozsahu výběru postačí průměrné množství výrobku x = 101,5 , aby při přesnosti plnění vyjádřené směrodatnou odchylkou σ = 3 ml střední hodnota množství výrobku v obalu se spolehlivostí 0,995 přesáhla deklarované množství 100 ml.
σ
7.
Určete při jakém rozsahu výběru nepřekročí s pravděpodobností 0,99 parametr notu 1,58násobku výběrové směrodatné odchylky.
8.
Kolikanásobek výběrové směrodatné odchylky nepřekročí s pravděpodobností 0,99 parametr σ při rozsahu výběru n = 20 ?
9.
Při jaké spolehlivosti odhadu nepřekročí při rozsahu výběrové směrodatné odchylky?
hod-
n = 20 parametr σ 1,58násobek
10. Nakreslete graf, který by zachytil vztah mezi přípustnou chybou ∆ (volte postupně 0,01; 0,02; 0,03; 0,04; 0,05; 0,10 ) a rozsahem výběru n při odhadu parametru θ , je-li výběrová relativní četnost rovna 0,5. Předpokládejte oboustranný konfidenční interval při 1% riziku. 11. V návaznosti na úlohu 10 odhadněte z grafu, jakou přípustnou chybu očekáváme při n = 1000 . Ověřte si přesnou hodnotu výpočtem.
21