13 Regrese 13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách znaku X. Přitom je třeba vyřešit jednak volbu funkcí k vystižení dané závislosti a dále stanovení konkrétních hodnot parametrů těchto zvolených funkcí. V dalších sekcích se zaměříme na funkce tvaru k X y= βj φj (x) j=0
kde funkce φj (x) jsou známé funkce neobsahující neznámé parametry a φ0 (x) = 1. Častou volbou je φj (x) = xj , j = 0, 1, . . . , k. 13.2. Přímka procházející počátkem Nejprve se zaměříme na φ0 (x) = 0 a φ1 (x) = x. Nechť platí Yi = βxi + ei , i = 1 . . . , n. P V tomto případě X = (x1 , . . . , xn )0 , takže X0 X = ( ni=1 x2i ) . Odhad n n X X ˆ β= xi Y i / x2 . i
i=1
i=1
Odhad pro σ 2 je s2 =
n X i=1
Yi2 − βˆ
n X
! xi Y i
/(n − 1) .
i=1
Příklad 13.1 Mějme měděnou trubku o délce L0 = 1000 mm při teplotě t0 = 20◦ C. Bylo naměřeno, o kolik milimetrů se tato trubka prodlouží, stoupne-li její teplota o 4◦ C. Je známo, že pro délkovou roztažnost platí vzorec 4L = αL0 4t, kde α je tzv. koeficient tepelné roztažnosti. Změna teploty 4t: 10 20 30 40 50 60 Prodloužení trubky 4L: 0,18 0,35 0,48 0,65 0,84 0,97 129
Je třeba odhadnout koeficient α. Proto provedeme úpravu dat z tabulky s cílem přejít na model Yi = βxi + ei , i = 1 . . . , n, kde xi je hodnota výrazu L0 4t v i-tém měření, Yi je prodloužení trubky, β píšeme místo α a ei jsou chyby měření.
xi : 10000 20000 30000 40000 50000 60000 Yi : 0,18 0,35 0,48 0,65 0,84 0,97
Vyjde n = 6, βˆ = 1,64 × 10−5 , s2 = 3,0264 × 10−4 .
Příklad 13.2 (mravenec průzkumník) Mravenec průzkumník se probouzí při teplotě okolo 5◦ C, při teplotě 10◦ C už může dosáhnout rychlosti 18 m/hod., při teplotě 15◦ C vyvine rychlost 54 m/hod., při teplotě 20◦ C běží rychlostí 126 m/hod., při teplotě 25◦ C uhání rychlostí 210 m/hod., při teplotě 28◦ C jeho rychlost klesá na 190 m/hod. Bernard Werber: Mravenci, KK, 2005 Najděte regresní přímku βˆ0 + βˆ1 x pro závislost rychlosti y mravence průzkumníka na teplotě okolí x. Určete index determinace. Zkonstruujte pás spolehlivosti pro regresní přímku a okolo regresní přímky. Marek, J.: Pravděpodobnost a matematická statistika
130
XIII.3 Věta. V modelu lineární regrese jsou odhadem parametrů regresní funkce β0 + β1 x odhady Pn Pn 2 Pn Pn i=1 xi Yi i=1 xi i=1 Yi Pi=1 xi − P ˆ , (1) β0 = n n 2 2 n i=1 xi − ( i=1 xi ) P P P n ni=1 xi Yi − ni=1 xi ni=1 Yi ˆ P P β1 = , (2) n ni=1 x2i − ( ni=1 xi )2 S(βˆ0 , βˆ1 ) =
n X
Yi2
i=1
− βˆ0
n X
Yi − βˆ1
i=1
n X
xi Yi .
(3)
i=1
Data lze také vztáhnout k těžišti a pro výpočet odhadů regresních parametrů lze použít tyto vztahy Pn (xi − x)Yi ˆ , βˆ0 = Y − βˆ1 x, β1 = Pi=1 n 2 (x − x) i=1 i Yˆ = βˆ0 + βˆ1 x = Y + βˆ1 (x − x). Odchylky ei = Yi − Yˆi = Yi − βˆ0 − βˆ1 xi = Yi − Y − βˆ1 (xi − x), i = 1, . . . , n, se nazývají rezidua Statistika Se = S(βˆ0 , βˆ1 ) =
n X i=1
e2i =
n n X X (Yi − Yˆi )2 = [Yi − Y − βˆ1 (xi − x)]2 , i=1
i=1
se nazývá reziduální součet čtverců resp. součet čtverců reziduí. XIII Regrese
131
Výsledky uvádí tabulka i 1 2 3 4 5 P
xi 10 15 20 25 28 98
Yi 18 54 126 210 190 598
x2i 100 225 400 625 784 2134
xi · Yi 180 810 2520 5250 5320 14080
Yˆi Yi2 ei e2i 324 13.37 4.630 21.441 2916 68.70 −14.698 216.030 15876 124.03 1.974 3.896 44100 179.35 30.645 939.140 36100 212.55 −22.552 508.570 99316 598 0 1689.1
P P P Yi ni=1 x2i − ni=1 xi ni=1 xi Yi P P = n ni=1 x2i − ( ni=1 xi )2 598 · 2134 − 98 · 14080 −103708 = = = −97.287 2 5 · 2134 − 98 1066 βˆ0 =
Pn
i=1
n βˆ1 =
Pn
P P xi Yi − ni=1 xi ni=1 i=1 P P n ni=1 x2i − ( ni=1 xi )2
Yi
=
11796 5 · 14080 − 98 · 598 = = 11.066 2 5 · 2134 − 98 1066 n n n X X X 2 ˆ ˆ ˆ ˆ S(β0 , β1 ) = Y i − β0 Yi − β1 xi Y i = =
i=1
i=1
i=1
99316 + 97.287 · 598 − 11.066 · 14080 = 1689.10 βˆ0 + βˆ1 x = −97.287 + 11.066x Marek, J.: Pravděpodobnost a matematická statistika
132
Se 1689.10 = = 563.03, S = 23.728 n−2 5−2 Výpočet lze realizovat pomocí těžiště x = 19.6, Y = 119.6: S2 =
Se = 1689.1,
i 1 2 3 4 5 P
xi 10 15 20 25 28 98
Yi xi − x (xi − x) · Yi (xi − x)2 Yˆi ei e2i 18 −9.6 −172.8 92.16 13.37 4.630 21.441 54 −4.6 −248.4 21.16 68.70 −14.698 216.030 126 0.4 50.4 0.16 124.03 1.974 3.896 210 5.4 1134.0 29.16 179.35 30.645 939.140 190 8.4 1596.0 70.56 212.55 −22.552 508.570 598 0 2359.2 213.20 598.00 0 1689.1
Pn (xi − x)Yi 2359.2 βˆ1 = Pi=1 = = 11.066 n 2 213.2 i=1 (xi − x) βˆ0 = Y − βˆ1 x = 119.6 − 11.066 · 19.6 = −97.287 βˆ0 + βˆ1 x = −97.287 + 11.066x Se 1689.10 Se = 1689.1, S2 = = = 563.03, S = 23.728 n−2 5−2 Kvalitu s jakou jsou data popsána regresní přímkou, udává index determinace. sP r n ˆi − Y )2 ( Y 26105.0 I = Pi=1 = = 0.969 n 2 27795.2 i=1 (Yi − Y ) i 1 2 3 4 5 P
xi 10 15 20 25 28 98
Yi Yi − Y (Yi − Y )2 Yˆi − Y (Yˆi − Y )2 18 −101.6 10322.56 −106.23 11284.81 54 −65.6 4303.36 −50.90 2590.81 126 6.4 40.96 4.43 19.62 210 90.4 8172.16 59.75 3570.06 190 70.4 4956.16 92.95 8639.70 598 0 27795.2 0 26105.00
Výpočtem zjistíme, že Pn xi i=1 P XX= , n 2 i=1 xi i=1 xi Pn 2 Pn 1 x − x i 0 −1 i=1 i i=1 P P (X X) = Pn 2 . n n n i=1 xi − ( ni=1 xi )2 − i=1 xi V našem případě 5 98 0 XX= , 98 2134 0
Pnn
XIII Regrese
133
0
(X X)
−1
1 = 5 · 2134 − 982
2134 −98 −98 5
=
2.0019 −0.0919 −0.0919 0.0047
.
ˆ = var[(X0 X)−1 X0 Y] = (X0 X)−1 X0 [var(Y)]X(X0 X)−1 var(β) = (X0 X)−1 X0 (σ 2 I))X(X0 X)−1 = σ 2 (X0 X)−1 . Proto var(βˆ0 ) = σβ2ˆ0 =
P σ 2 ni=1 x2i (x)2 2 1 P P + Pn = =σ 2 n ni=1 x2i − ( ni=1 xi )2 n i=1 (xi − x) = 563.03 · 2.0019 = 1127.1298
var(βˆ1 ) = σβ2ˆ1 =
σ2 nσ 2 P P = = n n 2 n i=1 x2i − ( i=1 xi )2 i=1 (xi − x) = 563.03 · 0.0047 = 2.6409 Pn
Při aplikacích se mnohdy také zajímáme o hodnotu β0 + β1 x, kde x je nějaké dané číslo, x ∈ hmin xi , max xi i. Lze ukázat, že P(Td ≤ β0 + β1 x ≤ Th ) = 1 − α, kde
s Td = βˆ0 + βˆ1 x − tn−2,1− α2 S
1 (x − x)2 +P , n (xi − x)2
(4)
s
1 (x − x)2 +P . (5) (xi − x)2 n Oboustranný intervalový odhad hodnoty parametrické funkce β0 +β1 x pro dané x tvoří uspořádana dvojice statistik (Td , Th ). Dosazujeme-li do Td , Th různé hodnoty x ∈ hmin xi , max xi i, dostaneme při spojitě se měnícím x tzv.pás spolehlivosti kolem regresní přímky. Tento pás má nejmenší šířku pro x = x, vzdaluje-li se x od x, šířka pásu roste. Určeme interval spolehlivosti pro x = 20. Th = βˆ0 + βˆ1 x + tn−2,1− α2 S
s Td = βˆ0 + βˆ1 x − tn−2,1− α2 S
1 (x − x)2 +P = n (xi − x)2
r
1 (20 − 19.6)2 + = 90.20 5 213.20 s 1 (x − x)2 Th = βˆ0 + βˆ1 x + tn−2,1− α2 S +P = n (xi − x)2
−97.287 + 11.066 · 20 − 3.182 ·
Marek, J.: Pravděpodobnost a matematická statistika
134
r −97.287 + 11.066 · 20 + 3.182 ·
1 (20 − 19.6)2 + = 157.86 5 213.20
Dosazujeme-li do Td , Th různé hodnoty x ∈ hmin xi , max xi i, dostaneme při spojitě se měnícím x tzv.pás spolehlivosti kolem regresní přímky.
Příklad 13.4 (mravenec průzkumník a vyšší teplota) Přepočtěte předchozí úlohu, když navíc uvažujte šesté měření při teplotě 30◦ C s naměřenou rychlostí mravence průzkumníka 140 m/hod. Najděte regresní přímku βˆ0 + βˆ1 x pro závislost rychlosti y mravence průzkumníka na teplotě okolí x. Určete index determinace. Zkonstruujte pás spolehlivosti pro regresní přímku a okolo regresní přímky. Při výpočtu užijte tabulek z předchozího příkladu. XIII Regrese
135
Příklad 13.5 (měření délky jednoho stupně zeměpisné délky) Okolo roku 1750 byla zorganizována měření délky oblouku poledníku s cílem potvrdit či vyvrátit hypotézy o tvaru Země jako rotačního elipsoidu. (Na měření v Římě se podílí Roger Joseph Boškovič na objednávku papeže Benedikta XIV.) Výsledky uvádí tabulka (délky oblouku jsou uváděny v toisích):
i 1 2 3 4 5
zem. poloha zem. šířka L x = sin2 L délka oblouku y Quito 0◦ 00 0,0000 56751 Mys Dobré Naděje 33◦ 180 0,2987 57037 ◦ 0 Řím 42 59 0,4648 56979 Paříž 49◦ 230 0,5762 57074 ◦ 0 Laponsko 66 19 0,8386 57422
Marek, J.: Pravděpodobnost a matematická statistika
136
Výsledky uvádí tabulka i 1 2 3 4 5 P
xi 0 0.29870 0.46480 0.57620 0.83860 2.1783
x2i 0 0.08922 0.21604 0.33201 0.70325 1.3405
Yi 56751 57037 56979 57074 57422 285263
xi · Yi 0 17037 26484 32886 48154 124561
Yi2 3.2207e + 9 3.2532e + 9 3.2466e + 9 3.2574e + 9 3.2973e + 9 1.6275e + 10
Yˆi ei e2i 56737 13.574 184.3 56954 83.482 6969.3 57074 −94.681 8964.5 57154 −80.272 6443.6 57344 77.897 6067.9 0 1.6e − 10 28630
Pn Pn 2 Pn x x − Y i i i i=1 xi Yi i=1 i=1 Pn Pn 2 = βˆ0 = 2 n i=1 xi − ( i=1 xi ) 285263 · 1.3405 − 2.1783 · 124561 = = 56737.426 5 · 1.3405 − 2.17832 Pn
i=1
βˆ1 =
n
Pn
P P xi Yi − ni=1 xi ni=1 i=1 P P n ni=1 x2i − ( ni=1 xi )2
Yi
=
5 · 124561 − 2.1783 · 285263 == 723.440 5 · 1.3405 − 2.17832 n n n X X X 2 ˆ ˆ ˆ ˆ S(β0 , β1 ) = Yi − β0 Yi − β1 xi Y i = =
i=1
i=1
i=1
28630 βˆ0 + βˆ1 x = 56737.426 + 723.440x Se 2.8630e + 004 Se = 2.8630e+004, S2 = = = 9.5432e+003, n−2 5−2 XIII Regrese
137
S = 97.689
Příklad: měření poledníku β1 6= 0 je založen na statistice T1 = pTest √ Pn H02 : β1 =2 0 proti Ha : √ 2 b1 i=1 xi − nx /s = 723.4401 1.3405 − 5 · 0.4357 / 9543.2 = 11.8353 Statistika |T1 | > tn−3,1−α/2 = t5−3,1−0.05/2 = 4.3027. Nulovou hypotézu zamítáme. Příklad 13.6 (mravenec průzkumník a vyšší teplota) Přepočtěte předchozí úlohu, když navíc uvažujte šesté měření při teplotě 30◦ C s naměřenou rychlostí mravence průzkumníka 140 m/hod. Najděte regresní přímku βˆ0 + βˆ1 x pro závislost rychlosti y mravence průzkumníka na teplotě okolí x. Určete index determinace. Zkonstruujte pás spolehlivosti pro regresní přímku a okolo regresní přímky. Při výpočtu užijte tabulek z předchozího příkladu. Výsledky uvádí tabulka i 1 2 3 4 5 6 P
xi 10 15 20 25 28 30 128
Yi 18 54 126 210 190 140 758
x2i 100 225 400 625 784 900 3034
xi · Yi 180 810 2520 5250 5320 4800 18880
Yi2 324 2916 15876 44100 36100 19600 124916
Yˆi ei e2i 25.11 −7.105 50.488 69.76 −15.765 248.530 114.42 11.576 134.000 159.08 50.916 2592.488 185.88 4.121 16.982 203.74 −43.743 1913.438 598 0 4955.9
Pn Pn 2 Pn x − x Y i i i i=1 xi Yi i=1 P = βˆ0 = i=1 Pi=1 n n 2 2 n i=1 xi − ( i=1 xi ) 758 · 3034 − 128 · 18880 −116868 = = = −64.2132 2 6 · 3034 − 128 1838 Pn
βˆ1 =
n
Pn
P P xi Yi − ni=1 xi ni=1 i=1 P P n ni=1 x2i − ( ni=1 xi )2
Yi
=
6 · 124916 − 128 · 758 16256 = = 8.9319 2 6 · 3034 − 128 1838 n n n X X X 2 ˆ ˆ ˆ ˆ S(β0 , β1 ) = Y i − β0 Yi − β1 xi Y i = i=1
i=1
i=1
124916 + 64.2132 · 758 − 8.9319 · 18880 = 4955.9 βˆ0 + βˆ1 x = −64.2132 + 8.9319x Marek, J.: Pravděpodobnost a matematická statistika
138
S2 =
Se = 4955.9,
Se 4955.9 = = 1238.98, n−2 6−2
S = 35.199
13.3. Kvadratická regrese XIII.7 Věta. V modelu kvadratické regrese Yi = β0 +β1 +β2 x21 +i lze ˆ získat opět z maticového vztahu odhad β ˆ = (X0 X)−1 X0 Y, β
1 1 X= 1
(6)
P P 2 x1 x21 n 2 P P x2i P xi3 x2 x2 0 xi , X X = P 2 P xi3 P xi4 , ... xi xi xi xn x2n
(7)
P Yi P X 0 Y = P xi Y i . x2i Yi Příklad 13.8 Uvažujme příklad mravenec průzkumník a vyšší teplota. Najděme kvadratickou aproximaci. XIII Regrese
139
V našem případě dostáváme 1 10 100 1 15 225 6 128 3034 1 20 400 (8) X= , X0 X = 128 3034 76952 , 1 25 625 3034 76952 2035906 1 28 787 1 30 900 738 −248,4195 ˆ = 30,3290 . X0 Y = 18280 β 470560 −0,5450 Pro reziduální součet čtverců platí n n n n n X X X X X 2 2 Se = S(b0 , b1 , b3 ) = ei = Yi −b0 Yi −b1 xi Yi −b2 x2i Yi . i=1
i=1
i=1
i=1
i=1
Se Pro odhad disperze pak platí s2 = n−3 . V našem případě dostáváme 0.3684 83.8857 Se 140.1519 ˆ Y= = 86.0947 . , Se = 4300.8 , s2 = 169.1671 6−3 173.4957 170.9312
Proveďte také testy: a) H0 : β1 = 0 proti Ha : β1 6= 0 b) H0 : β2 = 0 proti Ha : β2 6= 0, c) H0 : (β1 , β2 )0 = 0 proti Ha : (β1 , β2 )0 6= 0. Test H0 : β2 = 0 proti Ha : β2 6= 0 (test linearity regrese proti alternativě kvadratické regrese) je založen na statistice T2 = √ b22 = s v22
30.3290 86.0947·1.1255·10−4
= −5.5366 Statistika |T2 | > tn−3,1−α/2 = t6−3,1−0.05/2 = 3.1824. Nulovou hypotézu zamítáme. √
Test H0 : (β1 , β2 )0 = 0 proti Ha : (β1 , β2 )0 6= 0 je založen na statistice −1 1 v11 v12 b1 , Z = 2 (b1 , b2 ) . v v b2 2s 21 22 Statistika |Z| = 138.4594 > F2,n−3,1−α = F2,3,1−0.05 = 9.5521. Nulovou hypotézu zamítáme. Závěr: zamítáme hypotézu H0 : (β1 , β2 )0 = 0. Marek, J.: Pravděpodobnost a matematická statistika
140
13.4. Regrese se dvěma nezávislými proměnnými Najděte odhady parametry β0 , β1 a β2 tak, aby platilo Yi = βˆ0 + βˆ1 xi + βˆ2 zi + εi . XIII.9 Věta. V uvedeném modelu regrese se dvěma nezávisle proˆ získat opět z maticového vztahu měnnými lze odhad β ˆ = (X0 X)−1 X0 Y, β
1 1 X= 1
(9)
P P x1 z1 n x i P P 2 P zi x2 z2 , X0 X = xi P P xi Pxi z2 i , ... zi xi zi zi xn zn
(10)
P Y i P X0 Y = P x i Y i . zi Yi
Příklad 13.10 (savci) XIII Regrese
141
Pokusíme se u savců popsat závislost podílu tělesné vahy potomků po narození a váhy matky (ozn. Y , v %) na délce těla matky (ozn. x, v metrech) a době březosti (ozn. z, v měsících) . i 1. 2. 3. 4. 5.
savec hraboš malý pes antilopa šimpanz plejtvák
Yi 53,00% 30,00% 10,00% 4,25% 1,00%
xi 0,14 0,50 1,90 1,30 25,00
zi 0,66 2,07 10,50 8,30 12,00
V našem případě dostáváme
1 1 X= 1 1 1
0,14 0,50 1,90 1,30 25,00
0,66 5,00 28,84 33,53 2,07 0 10,50 , X X = 28,84 630,57 331,87 , 33,53 331,87 327,87 8,30 12,00
49,9601 98,25 ˆ = 0,2003 . X0 Y = 71,95 β −4,2448 249,36
(11)
prvky matice(X0 X)−1 ozn.vij
Pro reziduální součet čtverců platí Se = S(βˆ0 , βˆ1 ) =
n X i=1
e2i
=
n X
Yi2
− β1
i=1
n X
xi Yi2
− β2
i=1
n X
zi Yi2 .
i=1
Pro odhad disperze pak platí s2 =
Se . n−3
V našem případě dostáváme
44.1865 38.2735 ˆ = 2.7703 , Y 11.9887 1.0309
Se = 258.2841 ,
s2 =
Se = 129.1421 . 5−3
Marek, J.: Pravděpodobnost a matematická statistika
142
Y = βˆ0 + βˆ1 x + βˆ2 z = 49,9601 + 0,2003x − 4,2448z . U ženy s výškou 165 cm, dostáváme odhad Yˆ = 49,9601+0,2003·1.65− 4,2448·9 = 12.08%, což je velký podíl tělesné váhy matky a dítěte — odhad nasvědčuje na dvojčata.
Pozn.: Při hledání odhadů neznámých parametrů regresni přímky je třeba vždy posoudit, zda lze opravdu závislost zvoleným modelem aproximovat. Realita může být mnohem složitější, závislá proměnná může být závislá na dalších faktorech. Snaha vše popsat vzorcem může vést k tragikomickým závěrům. Vhodnost modelu je možné ověřit pomocí vhodných testů. a) Test H0 : β1 = 0 proti Ha : β1 6= 0 je založen na statistice 0.2003 T1 = √ β21 = √129.1421·0.0036 = 0.2940 s v11
Statistika |T1 | < tn−3,1−α/2 = t5−3,1−0.05/2 = 4.3027. Nulovou hypotézu nezamítáme. b) Test H0 : β2 = 0 proti Ha : β2 6= 0 je založen na statistice −4,2448 T2 = √ β22 = √129.1421·0.0162 = −2.3942 s v22
Statistika |T2 | < tn−3,1−α/2 = t5−3,1−0.05/2 = 4.3027. Nulovou hypotézu nezamítáme. c) Test H0 : (β1 , β2 )0 = 0 proti Ha : (β1 , β2 )0 6= 0 je založen na statistice −1 1 ˆ ˆ v11 v12 βˆ1 , Z = 2 (β1 , β2 ) . v21 v22 2s βˆ2 Statistika |Z| = 6.3464 < F2,n−3,1−α = F2,2,1−0.05 = 19. Nulovou hypotézu nezamítáme. Závěr: nelze zamítnout hypotézu H0 : (β1 , β2 )0 = 0. XIII Regrese
143
13.5. Regrese – periodická funkce Příklad 13.11 V tabulce jsou uvedeny průměrné měsíční teploty Y v Dunaji v Bratislavě. 5 6 7 8 9 10 11 12 Xi 1 2 3 4 Yi 1.3 1.9 6.0 9.7 14.6 17.6 19.9 18.4 14.9 10.2 6.0 3.5 Najděte aproximaci trigonometrickým polynomem prvního stupně ve tvaru π π Yi = β0 + β1 sin( xi ) + β2 cos( xi ) + i i = 1, . . . , 12 6 6 Úlohu převedeme ne regresi se dvěma nezávislými proměnnými. Zavedeme substituci ti = sin( π6 xi ) a zi = cos( π6 xi ). V uvedeném modelu regrese se dvěma nezávisle proměnnými lze ˆ získat opět z maticového vztahu odhad β ˆ = (X0 X)−1 X0 Y, β
1 1 X= 1
(12)
t1 z1 1 sin( π6 ) cos( π6 ) π π t2 z2 = 1 sin( 3 ) cos( 3 ) . ... ... tn zn 1 sin(2π) cos(2π)
V našem případě
12 0 0 124 X0 X = 0 6 0 , X0 Y = −28.6224 . 0 06 −45.6559 0.0833 0 0 (X0 X)−1 = 0 0.1667 0 , 0 0 0.1667 124 X0 Y = −28.6224 . −45.6559
Odtud po dosazení dostáváme 10,3333 ˆ = −4,7704 β −7,6093 Pn Pn Pn Pn 2 Se 2 i=1 Yi − b0 i=1 Yi − b1 i=1 ti Yi − b2 i=1 zi Yi s = = = 0.2107 n−3 n−3 Marek, J.: Pravděpodobnost a matematická statistika
144
Regresní funkce je π π Y = 10.3333 − 4.7704 sin( x) − 7.6093 cos( x) . 6 6
a) Test H0 : β1 = 0 proti Ha : β1 6= 0 je založen na statistice T1 = √ β21 = −25.458 s v11
Statistika |T1 | > tn−3,1−α/2 = t12−3,1−0.05/2 = 2.2622. Nulovou hypotézu zamítáme. b) Test H0 : β2 = 0 proti Ha : β2 6= 0 je založen na statistice T2 = √ β22 = −40.609 s v22
Statistika |T2 | > tn−3,1−α/2 = t12−3,1−0.05/2 = 2.2622. Nulovou hypotézu zamítáme. c) Test H0 : (β1 , β2 )0 = 0 proti Ha : (β1 , β2 )0 6= 0 je založen na statistice −1 1 ˆ ˆ v11 v12 βˆ1 , Z = 2 (β1 , β2 ) . v21 v22 2s βˆ2 Statistika |Z| = 1148.6 > F2,n−3,1−α = F2,9,1−0.05 = 4.2565. Nulovou hypotézu zamítáme. Závěr: nelze zamítnout hypotézu H0 : (β1 , β2 )0 = 0.
XIII Regrese
145