1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.
Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový odhad o Interval (interval spolehlivosti, konfidencí interval)
Bodové odhady Nahrazují hodnoty parametru základního souboru výběrovými charakteristikami.
Nechť máme: Základní soubor X Náhodný výběr (X1, X2, …, Xn) Potřebuji odhadnout parametr Θ. Bodový odhad
je funkce náhodného výběru
( Bodový odhad nabývá svých hodnot v závislosti na: o konkrétních hodnotách náhodného výběru, o rozsahu výběru, (čím větší, tím spolehlivější) 1
1.1 Bodové odhady
Požadavky na bodový odhad: Požadavek maximální koncentrace rozdělení pravděpodobností odhadu
okolo skutečné hodnoty parametru Θ
Aby funkce
byla dobrým odhadem parametru Θ, musí splňovat co
nejvíce z následujících podmínek: Konzistence bodového odhadu S rostoucím rozsahem výběru konverguje podle pravděpodobnosti k odhadovanému parametru.
Nevychýlenost (nestrannost) Střední hodnota parametru = odhadovanému parametru
Efektivnost Odhad
je efektivní, má-li ze všech odhadů nejmenší disperzi.
Podmínky nemusí platit zároveň. Mohou se také vzájemně vylučovat
2
1.1.1 Metoda momentů – výběrové momenty Všeobecný výběrový moment: Mk(a) =
Momenty základního souboru odhadujeme odpovídajícími výběrovými momenty.
První počáteční moment (EX)
První výběrový počáteční moment
Všeobecný výběrový moment Základní vzorec
Mk(a) =
mk(a)
Mk(a)
Pokud platí a =
dostáváme
počáteční výběrový moment Vk = 1/n ∑ xik
Pokud platí k = 1 První počáteční výběrový moment
=
3
aritmet. průměr
Druhý centrální moment (DX)
Druhý centrální výběrový moment (druhého řádu)
Všeobecný výběrový moment Základní vzorec
Mk(a) =
mk(a)
Mk(a)
Pokud platí a = ; k = 2
Mk(a) = M2 (
Dosazení
M2 ( = s2 = rozptyl
4
Příklad: metoda momentů Zkoušela se přesnost přístroje tak, že byla naměřena známá hodnota a zaznamenávaly se odchylky měření od této hodnoty. Odhadněte střední hodnotu a rozptyl těchto odchylek. Odchylky Xi ni = DX = s2 =
-2
-1
0
1
2
5
6
4
= -0,29 = 0,9134
5
1.1.1.1
Metoda maximální věrohodnosti (MMV)
Předpokládá se, že známe typ rozdělení pravděpodobnosti u základního souboru. Myšlenka MMV: Mám kuličky:
Pravděpodobnost vytáhnutí:
30 bílých
P (b) =
2 černé
P (b) =
1 zelená
P (b) =
Barva kuličky = statistický znak. Hodnota statistického znaku bílé barvy má vysokou pravděpodobnost. Ostatní mají malé pravděpodobnosti. Největší pravděpodobnost je, že si vytáhnu bílou kuličku.
Do náhodného výběru se dostanou hodnoty statistického znaku, které mají velkou pravděpodobnost.
6
2 Typy rozdělení pravděpodobností a odhady parametrů metodou maximální věrohodnosti Normální rozdělení pravděpodobností Je nejdůležitější a nejužívanější ze všech rozdělení. Často uváděno pod názvem Gaussovo – Laplaceovo rozdělení. Má dva základní parametry: μ (střední hodnota), μ = E(X) δ (směrodatná odchylka), δ = D(X) Křivka hustoty pravděpodobnosti: zvonovitý tvar, symetrická kolem parametru polohy μ, μ je zároveň mediánem i modem tohoto rozdělení, tvar závisí na parametru δ2, šikmost rozdělení = 0 Odhady parametrů: = δ2 = s2 =
- aritmetický průměr - rozptyl
7
3 Intervalové odhady Nevýhoda bodového odhadu: nevíme, do jaké míry se na tento odhad můžeme spolehnout, nedávají informaci o tom, kde leží skutečné hodnoty parametrů, nedávají informaci o chybách. Intervalové odhady: máme předem stanovenou pravděpodobnost (alfa, hladina významnosti), že tento interval bude obsahovat hodnotu odhadovaného parametru.
3.1 IS pro střední hodnotu EX známe δ; normální normované rozdělení pravděpodobností Oboustranný IS
Levostranný IS
Pravostranný IS
8
3.2 IS pro střední hodnotu EX neznáme δ; studentovo rozdělení pravděpodobností Oboustranný IS
Levostranný IS
Pravostranný IS
3.3 IS pro rozptyl DX
9
3.4 IS pro směrodatnou odchylku
10
4 Testování hypotéz Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo ne. Nulová hypotéza H0 Hypotéza, jejíž platnost ověřujeme. Značíme je H0. Alternativní hypotéza H1 Říká, co bude platit, když nebude platit nulová hypotéza H0. Říkáme, že testujeme H0 proti H1. Testy jednostranné a dvoustranné: záleží na formulaci alternativní hypotézy Když nulová hypotéza
H0 : A = B
potom
H1 :
…
je dvoustranná
H1 :
…
jsou jednostranné
H1 : Statistický test Jednoznačné pravidlo, které určuje podmínky, za kterých hypotézu H0 zamítneme nebo nezamítneme. Testovací kritérium (Z) Je funkce náhodného výběru, jejíž tvar je závislý na testované hypotéze a rozdělení pravděpodobností základního souboru. Kritická oblasti (KO) 11
Podmnožina množiny hodnot testovacího kritéria, které nepatří do kritické oblasti. Kritická hranice (KH) Odděluje kritickou oblast od oblasti přípustných hodnot.
Hladina významnosti testu Je pravděpodobnost kritické oblasti Postup testování hypotézy 1. získání údajů (například měřením), 2. stanovení statistického testu s příslušnou kritickou oblastí, 3. dosazení údajů do vzorce testovacího kritéria a výpočet hodnoty testovacího kritéria Z 4. zjistíme, kam padla hodnota testovacího kritéria: zda do kritické oblasti nebo do oblasti přípustných hodnot.
12
Hodnota testovacího kritéria padne do kritické oblasti H0 se zamítá.
Hodnota testovacího kritéria padne do oblasti přípustných hodnot
H0 se nezamítá, Neznamená to ale potvrzení H1, Říkáme, že není důvod k zamítnutí H0 Dělení testů hypotéz podle toho zda známe RP Parametrické testy Rozdělení pravděpodobností základního souboru je známé. Testování se týká pouze hodnot parametrů. Jsou spojovány s testováním parametrů normálního rozdělení pravděpodobností. Neparametrické testy Neznáme rozdělení pravděpodobností
Dělení testů hypotéz Testy významnosti Rozdělení pravděpodobností je známé. Testované hypotézy se týkají pouze parametrů základního souboru. Testy shody Týkají se typu rozdělení pravděpodobností základního souboru.
13
4.1 Testy významnosti 4.1.1 Test pro střední hodnotu pokud: známe δ, normální RP Testovací kritérium
n k δ
=
aritmetický průměr náhodného výběru
= = =
rozsah náhodného výběru střední hodnota (konstanta) směrodatná odchylka náhodného výběru
Kritická oblast a) dvoustranná alternativní hypotéza H0: EX= k proti H1: EX k W=
b) pravostranná alternativní hypotéza H0: EX= k proti H1: EX k W=
c) levostranná alternativní hypotéza k W= 14
H0: EX= k proti H1: EX
4.1.2 Test pro střední hodnotu pokud: neznáme δ, studentovo RP Testovací kritérium
n k s
=
aritmetický průměr náhodného výběru
= = =
rozsah náhodného výběru střední hodnota (konstanta) směrodatná odchylka náhodného výběru (musí se dopočítat)
Kritická oblast a) dvoustranná alternativní hypotéza H0: EX= k proti H1: EX k W=
b) pravostranná alternativní hypotéza H0: EX= k proti H1: EX k W=
c) levostranná alternativní hypotéza k W=
15
H0: EX= k proti H1: EX
4.1.3 Test pro rozptyl Testovací kritérium
=
rozptyl daný v zadání
=
výběrový rozptyl
Kritická oblast a) dvoustranná alternativní hypotéza H0: DX= k2 proti
H1: DX
k2 W=
b) pravostranná alternativní hypotéza H0: DX= k2 proti
H1: DX
k2 W=
c) levostranná alternativní hypotéza DX k2 W= 16
H0: DX= k2 proti
H1 :