Intervalové Odhady Parametrů II Testování Hypotéz Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze © Rudolf Blažek & Roman Kotecký, 2011
Pravděpodobnost a statistika BI-PST, LS 2010/11, Přednáška 10
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnos@
Intervalové Odhady
Odhad střední hodnoty
Intervalové Odhady Konfidenční Intervaly, Intervaly spolehlivosti (Confidence Intervals)
Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
2
Intervalové Odhady
Odhad střední hodnoty
Bodové odhady populačního průměru μ 2 a rozptylu σ Bodové odhady μ a σ2 Nechť X1, X2, X3, ..., Xn je náhodný výběr (i.i.d. náhodné veličiny) se střední hodnotou μ a rozptylem σ 2 (konečnými). Jako bodový odhad μ použijeme výběrový průměr Xn =
1 n
Pn
i=1
Xi
Jako bodový odhad σ 2 použijeme výběrový rozptyl sn2
=
1 n
1
Pn
(Xi i=1
X n )2
i.i.d. ...* independent and identically distributed * * * nezávislé a stejně rozdělené Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
3
Intervalové Odhady
Odhad střední hodnoty
Intervalový odhad popul. průměru μ Intervalový odhad střední hodnoty μ Nechť X1, X2, X3, ..., Xn je náhodný výběr (i.i.d. náhodné veličiny) se střední hodnotou μ a rozptylem σ 2 (konečnými). (1–α)100% Oboustranný konfidenční interval pro μ: Při známém σ:
X n ± z /2
/ n
Při neznámém σ: X n ± t /2,n 1 s/ n zα/2 * * ... kritická hodnota rozdělení N(0,1) tα/2,n-1* ... kritická hodnota Studentova t-rozdělení tn-1 Pozn.: Pro malé n rozdělení Xi musí být normální Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
4
Intervalové Odhady
Odhad střední hodnoty
Intervalový odhad popul. průměru μ Přibližné rozdělení je známo pomocí CLV Z =
Xn
µ
p ⇠ N(0, 1) / n
1–α α/2
-z-2 α/2 Rudolf Blažek, Roman Kotecký (ČVUT)
α/2
0 Pravděpodobnost a statistika
zα/2 2 BI-PST, LS2010/11, Přednáška 10
5
Intervalové Odhady
Odhad střední hodnoty
Intervalový odhad popul. průměru μ Pro malé n rozdělení Xi musí být normální Xn µ p ⇠ t(n T = s/ n
1)
1–α α/2
α/2
-t α/2,n-1 -2.2 Rudolf Blažek, Roman Kotecký (ČVUT)
0 Pravděpodobnost a statistika
tα/2,n-1 2.2 BI-PST, LS2010/11, Přednáška 10
6
Intervalové Odhady
Odhad střední hodnoty
Intervalový odhad popul. průměru μ
1–α α/2
-zα/2 -2.2 -2 -tα/2,n-1 Rudolf Blažek, Roman Kotecký (ČVUT)
α/2
0 Pravděpodobnost a statistika
zα/2 22.2 tα/2,n-1 BI-PST, LS2010/11, Přednáška 10
7
Intervalové Odhady
Odhad střední hodnoty
Intervalový odhad popul. průměru μ Intervalový odhad střední hodnoty μ Nechť X1, X2, X3, ..., Xn je náhodný výběr (i.i.d. náhodné veličiny) se střední hodnotou μ a rozptylem σ 2 (konečnými). (1–α)100% Jednostranný konfidenční interval pro μ: Při známém σ: Při neznámém σ:
p (X n z↵ / n, 1) p ( 1, X n + z↵ / n) p (X n t↵,n 1 s/ n, 1) p ( 1, X n + t↵,n 1 s/ n)
zα* * ... kritická hodnota rozdělení N(0,1) tα,n-1* ... kritická hodnota Studentova t-rozdělení tn-1 Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
8
Intervalové Odhady
Odhad střední hodnoty
Intervalový odhad popul. průměru μ Přibližné rozdělení je známo pomocí CLV Z =
Xn
µ
p ⇠ N(0, 1) / n
1–α α
0 Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
zα BI-PST, LS2010/11, Přednáška 10
9
Intervalové Odhady
Odhad střední hodnoty
Intervalový odhad popul. průměru μ Pro malé n rozdělení Xi musí být normální T =
Xn
µ
p ⇠ t(n s/ n
1)
1–α α
0 Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
tα,n-1 BI-PST, LS2010/11, Přednáška 10
10
Intervalové Odhady
Odhad střední hodnoty
Intervalový odhad popul. průměru μ
T =
Xn
µ
p ⇠ t(n s/ n
1)
1–α α
0 Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
zα tα,n-1 BI-PST, LS2010/11, Přednáška 10
11
Intervalové Odhady
Odhad střední hodnoty
Pravidla použití normálního a t-rozdělení Kritickou hodnotu zα/2 normálního rozdělení použijeme pokud
• •
známe přesně populační rozptyl σ 2 pravděpodobnost pokrytí přesně (1–α) když
• •
výběr je z normálního rozdělení (i pro malé n)
pravděpodobnost pokrytí přibližně (1–α) když
• • •
výběr je dostatečně velký (CLV pro velké n) obvykle stačí n = 30 či n = 50 ale pro šikmá či vícemodální rozdělení n musí být veliké
Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
12
Intervalové Odhady
Odhad střední hodnoty
Pravidla použití normálního a t-rozdělení Kritickou hodnotu tα/2 Studentova t-rozdělení použijeme když
• •
populační rozptyl σ 2 odhadujeme pomocí s2 pravděpodobnost pokrytí přesně (1–α) pokud
• •
výběr je z normálního rozdělení (i pro malé n)
pravděpodobnost pokrytí přibližně (1–α) pokud
•
výběr je ze symetrického unimodálního rozdělení, bez odlehlých pozorování a velikost výběru je n ≤ 15
•
výběr je ze mírně šikmého, unimodálního rozdělení, bez odlehlých pozorování a velikost výběru je 16 ≤ n ≤ 40
•
výběr je velký (n > 40) a bez odlehlých pozorování
Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
13
Intervalové Odhady
Odhad rozptylu
Intervalový odhad popul. rozptylu
2 σ
Intervalový odhad rozptylu σ 2 Nechť X1, X2, X3, ..., Xn je náhodný výběr (i.i.d. náhodné veličiny) z normálního rozdělení se střední hodnotou μ a rozptylem σ 2 (konečnými). (1–α)100% Oboustranný konfidenční interval pro σ 2 : (n 2 1 2
* /2,* n * 1 a*
2 *1
Rudolf Blažek, Roman Kotecký (ČVUT)
1)s
2
/2, n 1
2
(n 2
1)s
2
/2, n 1
* /2,* n * 1 ...* kvantily rozdělení chi-kvadrát Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
14
Intervalové Odhady
Odhad rozptylu
Intervalový odhad popul. rozptylu
2 σ
Rozdělení Xi musí být normální (n
1)s 2
2
⇠
2 n
1
1–α α/2
α/2
0
2
/2, n 1
Rudolf Blažek, Roman Kotecký (ČVUT)
2 1
/2, n 1
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
15
Intervalové Odhady
Odhad rozptylu
Intervalový odhad popul. rozptylu
2 σ
Rozdělení Xi musí být normální P
✓
2
/2, n 1
(n
1)s2 2
2 1
/2, n 1
◆
1–α α/2
α/2
0
2
/2, n 1
Rudolf Blažek, Roman Kotecký (ČVUT)
2 1
/2, n 1
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
16
Intervalové Odhady
Odhad rozptylu
Intervalový odhad popul. rozptylu
2 σ
Pravděpodobnost pokrytí parametru σ 2 1
1
1
↵=P
✓
↵=P
↵=P
Rudolf Blažek, Roman Kotecký (ČVUT)
2
/2, n 1
(n 2 1
/2, n 1
1)s
1)s2 2
2 1
/2, n 1
2
1 2 1
(n
2
/2, n 1
1)s2
(n 2
Pravděpodobnost a statistika
(n 2
1)s
◆
1 2
2
/2, n 1
/2, n 1
!
!
BI-PST, LS2010/11, Přednáška 10
17
Intervalové Odhady
Příklad: odhad střední hodnoty a rozptylu normálního rozdělení
Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad Uvažujme následující výběr (iid) z normálního rozdělení: i 1 2 3 4 5 6 7 8 9 10 Xi 1.72 1.88 1.84 1.81 1.75 1.92 1.80 1.68 1.80 1.81 Najděte intervalové odhady pro střední hodnotu a rozptyl rozdělení veličin Xi. P n 1 Bodové odhady: Xn = n X = 1.80 i=1 i 2 sn
=
= Rudolf Blažek, Roman Kotecký (ČVUT)
1
n
1
Pn
P 10 1 9
i=1
i=1
(Xi
(Xi
Pravděpodobnost a statistika
2
X n) 2
1.80) = 0.0051 BI-PST, LS2010/11, Přednáška 10
18
Intervalové Odhady
Příklad: odhad střední hodnoty a rozptylu normálního rozdělení
Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad 90% intervalový odhad pro střední hodnotu X n ± t /2,n
1
1.80 ± (1.833)
X n = 1.80
s/ n
p
2
0.0051/10
s = 0.0051 t /2,n
1
= t0.05,9 = 1.833
90% intervalový odhad pro střední hodnotu: [1.76, 1.84]
Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
19
Intervalové Odhady
Příklad: odhad střední hodnoty a rozptylu normálního rozdělení
Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad 90% intervalový odhad pro rozptyl (n 2 1
1)s
2
/2, n 1
(9)(0.0051) 16.9189
2
2
(n 2
1)s
2
/2, n 1
(9)(0.0051) 3.3251
90% intervalový odhad pro rozptyl [0.0027, 0.0138] Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
20
Testování Hypotéz
Testování Hypotéz (Hypotheses Testing)
Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
21
Testování Hypotéz
Úvod
Bodové a intervalové odhady Vyberu náhodně 30 kuliček (s vracením)
Vidím do dlaně: 20 z 30 je červených Kolik procent kuliček v krabičce je asi červených? Nevidím do krabičky Bodový odhad: cca 2/3 = 66.67% Intervalový odhad s 95% spolehlivostí: 48.76% – 84.57% Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
22
Testování Hypotéz
Úvod
Testování hypotéz Vyberu náhodně 30 kuliček (s vracením)
Vidím do dlaně: 20 z 30 je červených Nevidím do krabičky
Je v krabičce 40% červených kuliček? Závěr s 95% jistotou: NE Protože na 95% věřím: 48.76% – 84.57%
Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
23
Testování Hypotéz
Úvod
Testování hypotéz Dá se provádět s použitím intervalů spolehlivosti. V předchozím případě uvažovali následující hypotézy:
• • •
Nulová hypotéza* *
*
*
*
H0: μ = 0.4
Oboustranná alternativa* *
*
HA: μ ≠ 0.4
Všimněte si: μ = EX = 0.q + 1.p = p = P(červená kulička)
Závěr testu:
•
Založen na oboustranném 95% intervalovém odhadu pro střední hodnotu μ: [0.4876, 0.8457]
• •
0.4 ∉ [0.4876, 0.8457]
Zamítneme H0
P(chyby) = 0.05 ... podívejme se blíže co “chyba” znamená
Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
24
Testování Hypotéz
Chyby při testování hypotéz
Chyby při testování hypotéz Uvažované hypotézy:
• •
Nulová hypotéza* *
*
*
*
H0: μ = 0.4
Oboustranná alternativa* *
*
HA: μ ≠ 0.4
Závěr testu: Zamítneme H0
• •
P(chyby) = P(zamítnu chybně H0)
•
* = P( rozhodnu μ ≠ 0.4 | μ = 0.4 )
•
* = P( μ = 0.4 leží mimo 95% interval pro μ = 0.4
* = P( rozhodnu H0 neplatí | přestože H0 platí )
•
| μ = 0.4 )
≈ 0.05 ... protože histogram je centrován v 0.4
Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
25
Testování Hypotéz
Chyby při testování hypotéz
Chyby při testování hypotéz
T =
Xn
µ
p ⇠ t(n s/ n
1)
95% 2.5%
-2.045 -2.2 Rudolf Blažek, Roman Kotecký (ČVUT)
2.5%
0 Pravděpodobnost a statistika
2.045 2.2 BI-PST, LS2010/11, Přednáška 10
26
Testování Hypotéz
Chyby při testování hypotéz
Chyby při testování hypotéz
X n ⇠ N(µ,
2
/n)
95% 2.5%
2.5%
p
0 -2 s / n μ=0.4 μ– 2.045 Rudolf Blažek, Roman Kotecký (ČVUT)
p
2 s/ n μ+ 2.045
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
27
Testování Hypotéz
Chyby při testování hypotéz
Chyby při testování hypotéz
X n ⇠ N(µ,
2
/n) X n = 0.6667
95% 2.5%
μ– 0.179 -2 0.221 Rudolf Blažek, Roman Kotecký (ČVUT)
2.5%
μ=0.4 0 Pravděpodobnost a statistika
μ+0.179 2 0.579 BI-PST, LS2010/11, Přednáška 10
28
Testování Hypotéz
Chyby při testování hypotéz
Chyby při testování hypotéz Uvažované hypotézy:
• •
Nulová hypotéza* *
*
*
*
H0: μ = 0.4
Oboustranná alternativa* *
*
HA: μ ≠ 0.4
Opačný závěr testu: Nezamítneme H0
• •
P(chyby) = P(chybně nezamítnu H0)
•
* = P( rozhodnu μ = 0.4 | μ ≠ 0.4 )
•
* = P( 0.4 leží uvnitř 95% intervalu pro μ ≠ 0.4
* = P( rozhodnu H0 platí | přestože H0 neplatí )
•
| μ ≠ 0.4 )
= ? ... protože histogram je centrován v neznámém μ ≠ 0.4
Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
29
Testování Hypotéz
Chyby při testování hypotéz
Oboustranná alternativa Obecné hypotézy o střední hodnotě μ
• •
Nulová hypotéza* *
*
*
*
H0: μ = μ0
Oboustranná alternativa* *
*
HA: μ ≠ μ0
Test založen na oboustranném (1–α)100% intervalovém odhadu pro střední hodnotu μ
•
μ0 ∉ konfidenční interval
• •
P(chyby) = α ... Chyba prvního druhu malá, nastavená
μ0 ∈ konfidenční interval
•
Zamítneme H0 Nezamítneme H0
P(chyby) = ?? ... Chyba druhého druhu je neznámá
Zamítnutí H0 je silný výsledek! Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
30
Testování Hypotéz
Chyby při testování hypotéz
Jednostranné alternativy Obecné hypotézy o střední hodnotě μ
• •
Nulová hypotéza* *
*
*
*
H0: μ = μ0
Jednostranná alternativa**
*
HA: μ < μ0
Test založen na jedstranném (1–α)100% konf. intervalu pro μ
• • •
Typ intervalu: (−∞, A) μ0 ∉ konfidenční interval (A < μ0 )
Zamítneme H0
•
P(chyby) = α ... Chyba prvního druhu malá, nastavená μ0 ∈ konfidenční interval Nezamítneme H0
•
P(chyby) = ?? ... Chyba druhého druhu je neznámá
Zamítnutí H0 je silný výsledek! Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
31
Testování Hypotéz
Chyby při testování hypotéz
Jednostranné alternativy Konfidenční interval pro jednostrannou alternativu HA: μ < μ0
1
↵
)
Xn
↵
X n + t↵,n
1
p
s/ n
Věřím HA: μ < μ0 (a zamítnu H0) pokud výběrový průměr je “mnohem menší” než μ0
Xn
) A
P(chybné zamítnutí H0) = α
1
↵
Xn Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
) A
μ0
↵ μ0 BI-PST, LS2010/11, Přednáška 10
32
Testování Hypotéz
Chyby při testování hypotéz
Jednostranné alternativy Obecné hypotézy o střední hodnotě μ
• •
Nulová hypotéza* *
*
*
*
H0: μ = μ0
Jednostranná alternativa**
*
HA: μ > μ0
Test založen na jedstranném (1–α)100% konf. intervalu pro μ
• • •
Typ intervalu: (A, ∞) μ0 ∉ konfidenční interval (A < μ0 )
Zamítneme H0
•
P(chyby) = α ... Chyba prvního druhu malá, nastavená μ0 ∈ konfidenční interval Nezamítneme H0
•
P(chyby) = ?? ... Chyba druhého druhu je neznámá
Zamítnutí H0 je silný výsledek! Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
33
Testování Hypotéz
Chyby při testování hypotéz
Volba jednostranné alternativy Zamítnutí H0 je silný výsledek! Pokud potřebuji evidenci, že průměrná hodnota je veliká
• • •
Nulová hypotéza* *
*
*
*
H0: μ = μ0
Jednostranná alternativa**
*
HA: μ > μ0
Např. při dokazovnání, že továrna příliš zamořuje ovzduší
Pokud potřebuji evidenci, že průměrná hodnota je malá
• • •
Nulová hypotéza* *
*
*
*
H0: μ = μ0
Jednostranná alternativa**
*
HA: μ < μ0
Např. při dokazovnání, že továrna NEzamořuje ovzduší nad daný limit
Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
34
Testování Hypotéz
Chyby při testování hypotéz
Oboustranná a jednostranné alternativy Jednostranná alternativa* *
*
HA: μ < μ0 )
Xn Jednostranná alternativa* *
↵ Xn
t↵,n
HA: μ > μ0*
X n + t↵,n
1
p
s/ n
*
(se stejnými daty)
*
(se stejnými daty)
(
p 1 s/ n
Oboustranná alternativa* *
Xn
*
↵
↵ ( p t↵,n 1 s/ n
Rudolf Blažek, Roman Kotecký (ČVUT)
Xn *
HA: μ ≠ μ0*
1
2↵ Xn
Pravděpodobnost a statistika
)
↵
X n + t↵,n
1
p
s/ n
BI-PST, LS2010/11, Přednáška 10
35
Testování Hypotéz
Chyby při testování hypotéz
Oboustranná a jednostranné alternativy Oboustranná alternativa
• • •
Nulová hypotéza* *
*
*
*
*
*
H0: μ = μ0
Oboustranná alternativa* *
*
*
*
HA: μ ≠ μ0
Test založen na oboustranném (1–α)100% konf. intervalu
Jednostranná alternativa
• •
Nulová hypotéza* *
*
Jednostranná alternativa** !
• •
*
!
!
!
!
!
!
!
!
*
*
*
H0: μ = μ0
Buď * * HA: μ > μ0 Anebo * HA: μ > μ0)
Test založen na jednostranném (1–α)100% konf. intervalu Anebo na oboustranném (1–2α)100% konf. intervalu
Rudolf Blažek, Roman Kotecký (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11, Přednáška 10
36