ST2 - Cvi£ení 1 STATISTICKÁ INDUKCE P°íklad 1.1
Po£et závad jistého typu elektrospot°ebi£e b¥hem záru£ní doby má Poissonovo
rozd¥lení s parametrem
λ = 0,2. Jaká je pravd¥podobnost, ºe po prodeji 75 spot°ebi£· bude více
neº 15 reklamací b¥hem záru£ní doby ?
[P (X > 15) = 0,432] P°íklad 1.2
Plastová ta²ka ur£itého typu má nosnost s normálním rozd¥lení
N (5, 1).
1. Jaký podíl t¥chto ta²ek praskne p°i nákupu do 4,75 kg ? 2. Stanovte pravd¥podobnost, ºe p°i testování 16 náhodn¥ vybraných ta²ek bude pr·m¥rná nosnost men²í neº 4,5 kg.
[P (X ≤ 4, 75) = 0,401, P (X < 4, 5) = 0,023] P°íklad 1.3
Stanovte pravd¥podobnost, ºe pr·m¥rný v¥k ve skupin¥ 50 ºák· auto²koly bude
v intervalu od 20 do 23 let, pokládáme-li v¥k ºák· za náhodnou veli£inu se st°ední hodnotou 22 let a sm¥rodatnou odchylkou 6 let.
[P (20 ≤ X ≤ 23) = 0,8807-0,0092 = 0,8715]
1
ST2 - Cvi£ení 2 ODHADY PARAMETR P°íklad 2.1
Zváºením 11 náhodn¥ vybraných balí£k· mandarinek byly získány tyto odchylky
(v gramech) od normy udávané prodejcem (ta je 1 kg): -24, 16, -43, 58, -3, -38, -52, 62, -15, 40, 62.
Odchylku od normy povaºujeme na náhodnou veli£inu z normálního rozd¥lení. Stanovte oboustranný interval spolehlivosti pro:
1. její st°ední hodnotu, 2. její rozptyl.
[µ ∈[5,72727 +/- 29,5552 g] = [-23,828; 35,283 g], σ2 ∈[944,88; 5960,67 g ] 2
P°íklad 2.2
B¥hem dne byla u 60 náhodn¥ vybraných zákazník· supermarketu zaznamenána
cena nákupu. Výb¥rový pr·m¥r potom £inil:
X = 326
K£,
sX = 81
K£. V jakém intervalu
m·ºeme s 95% pravd¥podobností o£ekávat celkovou trºbu, kdyº do tohoto obchodu p°ijde za den 2400 zákazník· ? P°edpokládáme, ºe trºba jednoho zákazníka má normální rozd¥lení.
[X ∈[774 623, 790 177 K£]]
2
ST2 - Cvi£ení 3 TESTOVÁNÍ HYPOTÉZ - Jednovýb¥rové testy P°íklad 3
Výrobce nealko nápoje udává ob jem nápo je v láhvi 2 litry se sm¥rodatnou od-
chylkou 0,05 l. U 49 náhodn¥ vybraných láhví byl zji²t¥n výb¥rový pr·m¥r objemu nápoje 1,99 l. Lze °íci, ºe objem odpovídá norm¥ ? P°edpokládáme, ºe ob jem nápoje je NV
e²ení:
test hypotézy o st°ední hodnot¥ normálního rozd¥lení
n = 49, X = 1, 99
kde
µ = 2
σ = 0, 05
l,
l,
l. Testování hypotézy probíhá v 5 krocích :
1. FORMULOVAT TESTOVANOU HYPOTÉZU
H0 : µ = 2 H1 : µ 6= 2
µ,
X ∼ N (2; 0, 052 ).
H0
a ALTERNATIVNÍ HYPOTÉZU
H1 .
l l
2. VYBRAT VHODNÉ !! TESTOVÉ KRITÉRIUM (dále jako T.K.), TESTOVOU STATISTIKU Testujeme st°ední hodnotu normálního rozd¥lení
rozsahu výb¥ru.
µ
p°i
Testové kritérium je v tomto p°ípad¥ náhodná veli£ina
U=
V mých úlohách bude VDY
1
σ
a
α a STANOVIT α = 0, 05 !!
velkém
U:
X − µ√ n ∼ N (0, 1). σ
3. ZVOLIT HLADINU VÝZNAMNOSTI
Kritický obor
známém rozptylu
(1)
KRITICKÝ OBOR
W
W
U oboustranné alternativní hypotézy je kritický obor na hladin¥ významnosti takových hodnot T.K.
U,
α
mnoºina
pro které platí nerovnosti uvedené v závorkách
n o W = U : U ≤ u α2 ∨ U ≥ u1− α2 = {U : U ≤ u0,025 ∨ U ≥ u0,975 } . Konkrétn¥
W = {U : U ≤ −1, 96 ∨ U ≥ 1, 96} . 4. SPOÍTAT HODNOTU TESTOVÉHO KRITÉRIA
U=
1, 99 − 2, 00 √ 7 49 = − = −1, 40. 0, 05 5
5. VYSLOVIT ZÁV
R a NAPSAT ODPOV
. Pokud hodnota testového kritéria nosti
1
α
nulovou hypotézu
H0
U
nenáleºí
W (U ∈ / W ),
nezamítneme.
Pokud bychom rozptyl odhadovali z dat, je kritérium jiné !! Jaké?
3
potom na hladin¥ význam-
4
Pokud hodnota testového kritéria
nulovou hypotézu Zde platí, ºe
H0
U∈ / W,
U
W (U ∈ W ),
náleºí
potom na hladin¥ významnosti
zamítneme ve prosp¥ch alternativní hypotézy
takºe
H0
na hladin¥ významnosti
α
α
H1 .
nezamítneme.
ODPOV
: M·ºeme °íci, ºe objem nápoje v láhvích jsou dva litry.
2
P°íklad 4
Zástupci ekologického sdruºení vystupují proti výstavb¥ nové továrny v oblasti
poznamenané pr·myslovou £inností. Jedním z argument· je i nízká porodní váha novorozenc·. U 40 náhodn¥ vybraných novorozenc· nam¥°ili pr·m¥rnou porodní váhu 3010 g. Má smysl ar-
µ = 3300 g a sm¥r. X ∼ N (3300 g, 4762 g 2 ).
gumentovat tímto stylem, kdyº celostátní pr·m¥r je P°edpokládáme, ºe hmotnost novorozence je NV
1. FORMULOVAT TESTOVANOU HYPOTÉZU
H0
odchylka
σ = 476
a ALTERNATIVNÍ HYPOTÉZU
g ?
H1 .
2. VYBRAT VHODNÉ !! TESTOVÉ KRITÉRIUM
3. STANOVIT HLADINU VÝZNAMNOSTI a URIT KRITICKÝ OBOR
4. SPOÍTAT TESTOVÉ KRITÉRIUM
U = −3, 85 5. ZÁV
R a ODPOV
. Zde je
U ∈ W, H1 .
takºe
H0
na hladin¥ významnosti
α
zamítneme ve prosp¥ch alternativní
hypotézy
ODPOV
: M·ºeme °íci, ºe má smysl argumentovat proti výstavb¥ továrny niº²í porodní
statisticky významn¥
váhou novorozenc·. Pro£ ? Protoºe se zde
li²í od celostátního
pr·m¥ru.
P°íklad 5 (rozptyl normálního rozd¥lení)
Pevnost vlákna bavln¥né p°íze lze pokládat za
NV s normálním rozd¥lením. Je-li rozptyl pevnosti vlákna
σ 2 > 0, 36
2
kg , potom vznika jí potíºe
p°i tkaní. P°i zkou²ce 11 náhodn¥ vybraných vláken byly zji²t¥ny hodnoty jejich pevnosti, které jsou na listu
HypTest,
prom¥nná
3
P05_vlakno
.
Je t°eba zjistit, zda je p°íze vyhovující pro
tkaní.
[P°íze nevyhovuje, protoºe rozptyl pevnosti vlákna je vy²²í neº daná mez. K.O.:
P°íklad 6 - pokra£ování P°íkladu 5
W = {χ : χ ≥ 18, 31},
T.K.:
χ = 10 ·
0,92 0,36
= 25, 56]
M·ºeme °íci, ºe st°ední hodnota pevnosti vlákna
µ
je
men²í neº 4 kg ?
Nejprve vy°e²it z popisných statistik za pomoci statistických tabulek. Potom pomocí testování hypotéz v SGP.
W = {T : T ≤ tα (n − 1)} = {T : T ≤ −1, 812}, T = −0, 69.
[
M·ºeme °íct, ºe pevnost vlákna se rovná 4 kg, neboli není niº²í neº 4 kg.]
2
V p°íkladech na procvi£ení bude obvykle uvád¥na pro kontrolu pouze hodnota testového kritéria a záv¥r s
odpov¥dí.
3
Dále se takto budeme odkazovat na prom¥nné v souborech programu Statgraphics, které jsou ve°ej-
n¥ p°ístupné na webu http://eduro.webzdarma.cz/sta2.html v sekci
DATA KE CVIENÍM
http://multiedu.tul.cz/~jiri.rozkovec v adresá°i p°íslu²ného p°edm¥tu (ST2, ST2_P, STA, STA1).
nebo na adrese
ST2 - Cvi£ení 4 TESTOVÁNÍ HYPOTÉZ - Jednovýb¥rové testy P°íklad 7 (jednovýb¥rový t -test)
Automat plní krabice pracím prá²kem. Hmotnost prá²ku
v krabici má být p°esn¥ 2 kg. Náhodn¥ bylo vybráno 6 krabic, obsah prá²ku v nich byl p°esn¥ zváºen a byly zaznamenány odchylky hmotnosti prá²ku od normy (v dkg): -5 viz prom¥nná
P07_Praci_prasek,
-8
list
1
7
HypTest.
-6
-1
Ov¥°te, zdali nedo²lo k systematické chyb¥
se°ízení automatu. [
T = −0, 889.
5
M·ºeme °íct, ºe automat pracuje p°esn¥.]
6
P°íklad 9
Podle p°edb¥ºných výsledk· s£ítání obyvatelstva ze dne 3.3.1991 se v £eských
zemích hlásilo k °ímskokatolickému náboºenskému vyznání 39,2% obyvatelstva. Ze 62 náhodn¥ vybraných vysoko²kolských u£itel· se k tomuto vyznání hlásilo 30. Máme zjistit, zdali tento podíl V u£itel· hlásících se k °ímskokatolickému vyznání odpovídá podílu v²eho obyvatelstva £eských zemí.
[TK=1,483; pValue=0,1784. Podíl odpovídá hodnot¥ v £eských zemích.]
7
P°íklad 10 (test parametru
λ
Poissonova rozd¥lení)
Výstupní kontrola v podniku, který
vyrábí koberce, eviduje u ur£itého typu koberce statistiku po£tu závad u kaºdého vyrobeného koberce - viz prom¥nné
P10_pocet_zavad P10_cetnost_zavad ,
, list
HypTest.
povaºován za náhodnou veli£inu z Poissonova rozd¥lení s parametrem
λ.
Po£et závad je
Otestujte hypotézu, ºe
tento parametr je roven £ty°em !
Nápov¥da:
Víme, ºe v Poissonov¥ rozd¥lení je
EX = λ,
takºe je to hra£ka :-) V tomto p°ípad¥
vyjíme£n¥ pouze formulujte hypotézy a potom pouºijte formulá° Hypothesis tests. Vynechte testové kritérium i kritický obor.
[pValue = 0,955. Ano, parametr je roven £ty°em.]
ST2 - Cvi£ení 5 TESTOVÁNÍ HYPOTÉZ - Dvouvýb¥rové testy P°íklad 12
U dvou stro j· vyráb¥jících ²rouby byla sledována odchylka skute£né délky ²roubu
od normy v mm (prom¥nné
P14_stroj1 P14_stroj2 ,
). Otestujte, zdali rozptyl odchylky ²roub· od
normy u prvního stroje je 1,2-krát v¥t²í neº u druhého stroje. Odchylky povaºujeme za normáln¥ rozd¥lené veli£iny.
P°íklad 14.1
Na tomtéº automobilovém okruhu byla stejným °idi£em testována dv¥ závodní
auta (dosaºené £asy p°i jednotlivých jízdách - viz prom¥nné zdali první auto (
Auto2
(
Auto1
P13_Auto1 P13_Auto2 ,
). Otestujte,
) je na jednotlivé jízd¥ alespo¬ o 0,2 sekundy rychlej²í neº druhé auto
). asy povaºujeme za normáln¥ rozd¥lené veli£iny.
8
9
P°íklad 14
U dvou stro j· vyráb¥jících ²rouby byla sledována odchylka skute£né délky ²roubu
od normy v mm (prom¥nné
P14_stroj1 P14_stroj2 ,
). Otestujte:
1. zdali kaºdý stroj pracuje s nulovou odchylkou od normy, 2. zdali oba stroje pracují se stejnou odchylkou od normy.
ST2 - Cvi£ení 6 TESTOVÁNÍ HYPOTÉZ - Testy dobré shody -
Goodness-of-Fit
Tests P°íklad 15
P15_cetnost
Je homogenní kostka, výsledky jejíchº 60 hod· jsou ve sloupcích
, list
HypTest
P15_vysledek
a
?
[K.O.
W = χ : χ ≥ χ20,95 (5) = 11, 07 ,
T.K.
χ = 10, 2.
Ano, kostku lze pokládat za homogenní.]
P°íklad 16
Na kostce z P°íkladu 15 otestujte, zdali je homogenní z hlediska výskytu sudých a
lichých £ísel. Dále zkuste zjistit, p°i jaké proporci výskytu sudých a lichých £ísel ze 60 hod· uº hypotézu homogenity zamítneme.
[K.O.
W = χ : χ ≥ χ20,95 (1) = 3, 84 ,
T.K.
χ = 1, 67.
Ano, kostku lze pokládat za homogenní.]
10
11
P°íklad 16a - lehce bonusový :-) - viz prom¥nné
Bi(12, 16 ).
P17_
Byla sledována £etnost ²estek p°i 4096 hodech 12 kostkami
... Po£et ²estek v jednom hodu lze povaºovat za NV s binomickým rozd¥lením
Otestujte hypotézu, ºe kostky jsou pravidelné.
r P (X = r) = πi,0 Empir. po£et ni Empir. £etnost pi Po£et ²estek
P°íklad 20
0
1
2
3
4
5
6
7 a více
Na datech z P°íkladu 9 otestujte, zdali daná náhodná veli£ina (t.j. zdali se náhodn¥
vybraný V u£itel hlásí k °ímskokatolickému vyznání) je náhodnou veli£inou z binomického rozd¥lení s parametrem
π=
0,60.
ST2 - Cvi£ení 7 Analýza rozptylu P°íklad 22
Analysis of Variance (ANOVA)
Ov¥°te hypotézu, ºe st°ední hodnota prodejní ceny bytu je stejná bez ohledu na
po£et místností, které byt má - prom¥nné P22_..., list Anova.
[T.K.
F = 399, 26,
K.H.
F0,95 (4, 19) = 2, 895.
Není pravda, ºe cena bytu nezávisí na po£tu jeho místností.]
12
13
P°íklad 25a
Ov¥°te hypotézu, ºe uvedení pracovníci pracují v²ichni stejn¥ rychle - prom¥nné
P25_obsluha, P25_VYROBENO_2, list Anova.
[T.K.
F = 1, 18,
K.H.
F0,95 (4, 10) = 3, 478.
Pracovníci jsou stejn¥ rychlí.]
ST2 - Cvi£ení 8 Kontingen£ní a korela£ní tabulky P°íklad 8.1
V prom¥nných
Contingency tables
ZU_vzdelani ZU_lepsi ZU_stejna ZU_horsi ,
,
,
jsou výsledky pr·zkumu,
kde byly respondenti dotazováni, jak hodnotí svoji ºivotní úrove¬ za poslední rok. Sou£asn¥ bylo zaznamenáno, jaké ma jí nejvy²²í dosaºené vzd¥lání. Jsou tyto dva znaky nezávislé?
[T.K.
G = 20, 430,
K.H.
χ20,95 (6) = 12, 59.
Není pravda, ºe hodnocení ºivotní úrovn¥ nezávisí na vzd¥lání dotázaných.]
14
ST2 - Cvi£ení 9 Regresní analýza P°íklad 30
V prom¥nných
P30_vloni P30_letos ,
jsou ob jemy poptávky po ur£itém zboºí u
²esti obchodník·. Odhadn¥te parametry regresní p°ímky, která bude vyjad°ovat závislost leto²ní poptávky na lo¬ské.
[P30_Letos = 0,6868 + 1,2665*P30_vloni. Testy parametr·: kvocient není statisticky významný, sm¥rnice je.]
P°íklad 31
V prom¥nných
P31_stari P31_naklady ,
jsou uvedeny náklady na opravy ur£itých
stroj· a jejich stá°í. Odhadn¥te parametry regresní funkce
Y = α + β lnX, která bude vyjad°ovat
závislost náklad· na opravu na stá°í stroje.
[P31_naklady = 44,6457 + 40,4913*ln(P31_stari). Testy parametr·: oba jsou statisticky významné.]
15
16
P°íklad 33
V prom¥nných
P33_spotreba P33_rychlost ,
jsou uvedeny: spot°eba paliva osob-
ního automobilu na dané trase a jeho pr·m¥rná rychlost p°i pr·jezdu touto trasou. Odhadn¥te parametry t¥chto regresních funkcí:
1.
2.
Y = α + γX 2 Y = 4, 52576 + 0, 00026X 2 2 = 73% IA
Y = α + βX + γX 2 Y = 9, 7518 − 0, 1505X + 0, 0012X 2 2 = 95% IA
které vyjad°ují závislost spot°eby na rychlosti, a rozhodn¥te, která je v tomto p°ípad¥ vhodn¥j²í pro popis závislosti.
[Lep²í je druhý model.]
P°íklad 32.2
V prom¥nných
P32_cena P32_poptavka ,
je uvedena cena a poptávka po ur£itém
druhu zboºí. Odhadn¥te parametry t¥chto regresních funkcí:
1.
Y = β/X 2 = 91% Y = 5530, 55/X , IA
2.
Y = exp (α + βX) 2 = 93% Y = exp (5, 384 + 0, 007X), IA
které vyjad°ují závislost poptávky po zboºí na jeho cen¥. Rozhodn¥te, která je v tomto p°ípad¥ vhodn¥j²í pro popis závislosti.
[Lep²í je druhý model.]
ST2 - Cvi£ení 10 Korela£ní analýza P°íklad 10.1
V prom¥nných
Objem2009 Objem2010 ,
jsou objemy hypoték v R v uvedených
letech od ledna do °íjna v mld. K£. Jsou tyto veli£iny nezávislé?
rXY = 0, 5355,
[
P°íklad 34
pValue = 0,11. Objemy hypoték v roce 2009 a v roce 2010 jsou nezávislé.]
V prom¥nných
P34_...
jsou úda je deseti d¥lník·: v¥k, praxe v oboru a výkon.
Které dvojice t¥chto veli£in jsou nezávislé?
rXY = 0, 43, pValue = 0,21 ) PRAXE-VÝKON (rXY = 0, 62, pValue = 0,056 ). nejsou nezávislé (rXY = 0, 847, pValue = 0,002 ).]
[Nezávislé jsou dvojice veli£in V
K-VÝKON ( a Veli£iny PRAXE-V
K
17