4 Lineární regrese
4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjistit nejen, jestli jsou dvě nebo i více proměnných na sobě závislé, ale také jakým vztahem se tato závislost dá popsat. Většinou se zavádí popis y=f(x), kde proměnné y ( y1 , y 2 , y n ) kterou popisujeme, se říká vysvětlovaná nebo závislá proměnná, zatímco x ( x1 , x2 , xn ) nazýváme vysvětlující nebo nezávislá proměnná. Teoretické (ideální) hodnoty závislé proměnné se značí malým písmenem y ( y1 , y 2 , y n ) , zatímco odhady se značí velkým písmenem Y (Y1 , Y2 , Yn ) . Vztah y f (x) se nazývá regresní rovnice nebo regresní model. Regresní modely se dají rozdělit
podle počtu závislých proměnných na jednorovnicové nebo vícerovnicové modely
podle počtu nezávislých proměnných na jednoduchou regresi (s jednou nezávislou proměnnou x) nebo na vícenásobnou regresi (s minimálně 2 nezávislými proměnnými
podle typu regresní funkce na lineární nebo nelineární model
4.1 JEDNODUCHÁ LINEÁRNÍ REGRESE Jednoduchá lineární regrese se dá vyjádřit vztahem y 0 1 .y1 , kde 0 a 1 jsou parametry regresní rovnice a se nazývá reziduální odchylka nebo chyba. Teoretické hodnoty parametrů se obecně značí řeckým písmem, například 0 a 1 , zatímco odhadnuté hodnoty se značí latinkou: b0 a b1 . Hledaná regresní přímka bude mít tvar y b0 b1 .y1 Odhady regresních parametrů můžeme získat metodou největších čtverců v případě, že jsou splněny předpoklady:
Chyby mají nulovou střední hodnotu: E(εi)=0 Rozptyl chyb je konstantní, nezávislý na i: var(εi)=σ2=konstanta Chyby jsou vzájemně nezávislé: cov(εi,εj)=0 Chyby mají normální rozdělení N(0, σ2)
V případě jednoduché lineární regrese y=β0+β1.x jsou vztahy pro výpočet hodnot b0 a b1 vyjádřeny takto: xy x. y b1 2 ; x x2 b0 y b1 x Pro ohodnocení vhodnosti modelu se používá takzvaný koeficient determinace. Koeficient determinace se značí R 2 a určuje, kolik procent celkové variability dat je vysvětlitelných regresním modelem. Koeficient determinace nabývá hodnot z intervalu 0,1 , čím větší R2 tím lépe model popisuje daná data. Vyjadřuje se vztahem: S R2 T Sy n
kde S y se nazývá celkový součet čtverců: S y ( yi y ) 2 i 1
- 50 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
n
S T je teoretický součet čtverců: ST (Yi y ) 2 , a i 1 n
S R je reziduální součet čtverců: S R (Yi yi ) 2 pro teoretické hodnoty Yi . i 1
Mezi jednotlivými součty čtverců platí vztah: S y S R ST . Pro malé rozsahy výběru se místo koeficientu determinace používá upravený koeficient 2 determinace, značí se Radj (z anglického „adjusted“):
n 1 n2 Druhá odmocnina koeficientu determinace se nazývá index korelace a značí se R , druhá odmocnina upraveného koeficientu determinace se nazývá upravený index korelace a značí se Radj . Oba indexy nabývají hodnot z intervalu 0,1 ; když je jejich hodnota 1 jedná se o lineární závislost mezi y a x. Platí: ST R Sy 2 Radj 1 (1 R 2 )
n 1 n2 Bodový odhad rozptylu reziduální složky (chyby) se nazývá reziduální rozptyl: S sR2 R nk kde k je počet regresních koeficientů (u vícenásobné regrese). Druhá odmocnina reziduálního rozptylu se nazývá směrodatná chyba odhadu a platí: SR sR nk V programu Excel můžete využít více různých možností pro výpočet hodnot regresních parametrů, a koeficientu determinace; dvě možnosti si ukážeme. První možností jak získat odhady regresních koeficientů jednoduché lineární regrese je vložení trendu do grafu. Postup je ukázán v následujícím příkladu. Radj 1 (1 R 2 )
ŘEŠENÝ PŘÍKLAD 4.1 Společnost prodávající bílou techniku zkoumala, jak závisí zisk z prodeje na výdajích na reklamu. Tabulka uvádí údaje obdržené v deseti náhodně vybraných prodejnách: Výdaje na reklamu (tis Kč)
6
8
9
10
12
14
17
20
22
24
Zisk z prodeje (10 tis. Kč)
6
7
10
13
20
25
31
37
50
58
Nalezněte rovnici regrese a hodnotu koeficienty determinace pomocí vložení trendu do grafu. Řešení: Vložíme data z příkladu do programu Excel. Datovou řadu „Výdaje na reklamu“ označíme x, datovou řadu „Zisk z prodeje“ pak y. Sestrojíme bodový graf závislosti y na x, kde hodnoty x budou odpovídat vodorovné ose a hodnoty y svislé ose. Data připravená na další výpočty budou vypadat následovně (Obr. 4.1): - 51 -
4 Lineární regrese Obrázek 4.1
Zdroj: Vlastní zpracování.
Jednou z možností, jak získat odhady regresních koeficientů, je vložení trendu do grafu. Postup: Klikneme v grafu na datovou řadu (jeden z bodů) pravým tlačítkem myši a z nabídky zvolíme „Přidat spojnici trendu…“ Otevře se průvodce „Formát spojnice trendu“. Ve složce „Možnosti spojnice trendu“ vyznačíme, že se jedná o lineární trend a chceme „Zobrazit rovnici regrese“ a „Zobrazit hodnotu spolehlivosti R“ (Obr. 4.2). Obrázek 4.2
Zdroj: Vlastní zpracování.
- 52 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Výsledkem bude vložení přímky do obrázku a současně zobrazení regresní rovnice a koeficientu determinace R2.(Obr. 4.3). Obrázek 4.3
Zdroj: Vlastní zpracování.
Postupem, uvedeným v předchozím příkladu pomocí vkládaní trendu do grafu. umožňuje Excel odhad čtyř nelineárních modelů, založených na metodě nejmenších čtverců:
Polynomický trend: y 0 1.x 2 x 2 k x k Logaritmický trend: y 0 1. ln( x)
Mocninný trend: y 0 .x 1 Jednoduchý exponenciální trend (speciální případ exponenciálního trendu): y 0 .1x
Druhou možností jak získat hodnoty regresních koeficientů pomocí programu Excel je využít analytický nástroj Regrese. Tento analytický nástroj vypočítá nejen hodnoty regresních koeficientů a koeficientu determinace, ale i test statistické významnosti regresního modelu, regresních koeficientů, intervaly spolehlivosti a další. Použití nástroje Regrese je uvedeno v následujícím příkladu. ŘEŠENÝ PŘÍKLAD 4.2 Společnost prodávající bílou techniku zkoumala, jak závisí zisk z prodeje na výdajích na reklamu. Tabulka uvádí údaje obdržené v deseti náhodně vybraných prodejnách: Výdaje na reklamu (tis Kč)
6
8
9
10
12
14
17
20
22
24
Zisk z prodeje (10 tis. Kč)
6
7
10
13
20
25
31
37
50
58
Pomocí analytického nástroje Regrese vypočítejte hodnoty regresních koeficientů a hodnotu koeficientu determinace, na hladině spolehlivosti 0,05 určete, zda je regresní koeficient b1 statisticky významný, a určete jeho 99% interval spolehlivosti.
- 53 -
4 Lineární regrese
Řešení: Po otevření dialogového okna (Data Analýza dat Regrese) lze zadat vstupní oblast dat x a y s popiskami, vyznačit, že vstupní oblast obsahuje popisky a zadat hladinu spolehlivosti pro intervaly spolehlivosti. (Obr. 4.4). Obrázek 4.4
Zdroj: Vlastní zpracování.
Výsledkem jsou tři tabulky (Obr. 4.5); v první tabulce nazvané „Regresní statistika“ jsou postupně zadány hodnoty indexu korelace, koeficientu determinace, upraveného koeficientu determinace, směrodatné chyby odhadu a počet pozorování. Druhá tabulka se nazývá ANOVA, která má stejnou strukturu jako tabulka ANOVA popsaná v předchozí kapitole. Analýza rozptylu u lineární regrese se využívá u testu vhodnosti modelu. Vhodnost modelu posuzujeme pomocí testové statistiky, která má F rozdělení. Struktura testu je následovní: 1. Hypotéza: H 0 : 0 1 0 (což značí, že model není vhodný) proti hypotéze H1 : i; i 0 2. Testové kritérium (kde n je počet pozorování, k je počet regresních koeficientů: ST F k 1 SR nk 3. Kritická hodnota: Fk 1,nk ( ) 4. Výsledek: Je-li F Fk 1,nk ( ) zamítá se H0 a model se považuje za vyhovující. Poslední tabulkou, která je výstupem analytického nástroje Regrese, je tabulka obsahující regresní koeficienty, testové kritérium pro test spolehlivosti regresních koeficientů - 54 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
a hranice intervalů spolehlivosti regresních koeficientů. Test statistické významnosti regresních koeficientů má tvar: 1. Hypotéza: H 0 : i 0 , H1 : i 0 2. Testové kritérium: T
bi s(bi )
3. Kritická hodnota: tnk ( ) 4. Výsledek: Je-li T t nk ( ) , zamítá se H0 a přijímá H1; regresní koeficient je různý od nuly. Jiný způsob určení výsledku: Hodnota pravděpodobnosti p odpovídající testovému kritériu T se pak porovnává s hladinou významnosti α. Je-li p < α zamítá se H0 a model se považuje za vyhovující. Obrázek 4.5
Zdroj: Vlastní zpracování.
Výsledky: Z poslední tabulky ve sloupci „Koeficienty“ vyhledáte hodnoty regresních koeficientů. V tomto případě b0 14,92 a b1 2,86 . Hodnotu koeficientu determinace určíte z první tabulky („hodnota spolehlivosti R“ – nepeřesný překlad z angličtiny) R 2 0,975 . Koeficient b1 je na hladině spolehlivosti 0,05 statisticky významný (p-hodnota je menší než 0,05), a 99% interval spolehlivosti pro koeficient b1 je 2,318; 3,404 . ___________________________________________________________________________
4.2 VÍCENÁSOBNÁ LINEÁRNÍ REGRESE Vícenásobnou lineární regresi lze vyjádřit vztahem: y 0 1 .x1 2 .x2 k .xk , kde 0 , 1 ., 2 ., , k jsou parametry regresní rovnice a se nazývá reziduální odchylka nebo chyba. Teoretické hodnoty parametrů se obecně značí řeckým písmenem, například 0 , 1 ., 2 ., , k , zatímco odhadnuté hodnoty se značí latinkou b0 , b1.,b2 ,, bk .
Hledaná regresní přímka bude mít tvar: y b0 b1 .x1 b2 .x2 bk .xk . - 55 -
4 Lineární regrese
Odhady regresních parametrů můžeme získat metodou nejmenších čtverců v případě, že jsou splněny předpoklady:
Chyby mají nulovou střední hodnotu: E ( ) 0 Rozptyl chyb je konstantní, nezávislý na i: var( i ) 2 konst. Chyby jsou vzájemně nezávislé: cov( i , j ) 0
Chyby mají normální rozdělení N (0, 2 ) Vysvětlující proměnné nejsou lineárně závislé Počet pozorování je větší než počet regresních koeficientů
Hodnoty bývají zadávány jako výsledky průzkumu, měření nebo pozorování v tabulce:
Hodnoty nezávisle proměnných
Hodnoty závisle proměnné Y y1 y2 yn
x1 x1,1 x2,1 xn,1
x2 x1,2 x2,2 xn,2
… … … …
xk x1,k x2,k xn,k
Kde k je počet nezávislých proměnných a n je počet pozorování. V Excelu se pro vícenásobnou regresi používá analytický nástroj Regrese. Interpretace výsledků pro vícenásobnou lineární regresi je stejná jako v případě jednoduché lineární regrese, použití tohoto nástroje demonstruje následující řešený příklad. ŘEŠENÝ PŘÍKLAD 4.3 Níže uvedená tabulka obsahuje údaje o objemu prodeje, velikosti reklamních výdajů a ročních nákladů na školení obchodních zástupců u 8 vybraných firem: Objem prodeje (mil. Kč) Y 260 310 280 300 340 380 410 440
Reklamní výdaje (tis. Kč) x1 180 230 260 240 280 300 340 320
Náklady na školení (tis. Kč) x2 35 38 33 40 44 46 45 49
Popište závislost objemu produkce na reklamních výdajích a nákladech na školení pomocí modelu y=b0+b1x1+b2x2. - 56 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Řešení: Po otevření dialogového okna (Data Analýza dat Regrese) lze zadat vstupní oblast dat x a y s popiskami, vyznačit, že vstupní oblast obsahuje popisky a zadat hladinu spolehlivosti pro intervaly spolehlivosti (Obr. 4.6). Výsledné tabulky jsou podobné jako u jednoduché lineární regrese (Obr. 4.7). Obrázek 4.6
Zdroj: Vlastní zpracování. Obrázek 4.7
Zdroj: Vlastní zpracování.
Odhadovaná regresní rovnice má tvar y 79,29 0,56.x1 6,54.x2 ___________________________________________________________________________
- 57 -
4 Lineární regrese
4.3 VYROVNÁVÁNÍ ČASOVÝCH ŘAD Časové řady jsou jedním ze speciálních druhů statistických dat, kde nezávislou proměnnou je čas. Časové intervaly, ve kterých byla závisle proměnná měřena, jsou stejně dlouhé a mohou to být například sekundy, minuty, dny, roky, ale také trojminutové intervaly nebo 10 a půldenní intervaly. Časové řady se hodně využívají v ekonomii, kde popisují časový vývoj různých ekonomických ukazatelů. V Excelu máme k dispozici pouze jenoduché nástroje analýzy časových řad. Komplexnější nástroje analýzy poskytuje program SPSS, viz kapitly 7 a 8. Časovou řadu lze rozložit na 4 složky: trendovou, sezónní, cyklickou a náhodnou. Trendovou složku lze popsat regresním modelem, kdy za nezávisle proměnnou dosazujeme čas. V případě, že čas je zadaný nečíselně – například datem nebo slovně (pondělí, úterý, atp.), je možné zavést náhradní časovou proměnnou (například přirozená čísla 1, 2, 3, …) a pak postupovat podle regresních modelů. Ekonomické časové řady jsou obvykle dost „nevyrovnané“, obsahují „šumy“. Aby se zčásti eliminoval vliv šumů na trendovou složku, časové řady se vyrovnávají. Program Excel nabízí dvě možnosti vyrovnávání časových řad, a to buď pomocí klouzavých průměrů, nebo pomocí exponenciálního vyrovnání. Podstata vyrovnání časové řady pomocí klouzavých průměrů spočívá v tom, že posloupnost hodnot časové řady se nahradí novou řadou průměrů vypočítaných z kratších úseků časové řady. V praxi jsou rozsahy kratších částí voleny buď podle přirozené periodicity souboru (například 7, když se jedná o dny v týdnu, 4 když jde o kvartální data nebo 12 když jde o měsíční data) nebo se používají menší liché délky 3, 5 nebo 7 časových jednotek. V programu Excel lze pro výpočet klouzavých průměrů využít analytický nastroj Klouzavý průměr. Náhled na průvodce nástrojem (Obr. 4.8): Obrázek 4.8
Zdroj: Vlastní zpracování.
Jako „Vstupní oblast“ se vkládá sloupec vyrovnávaných hodnot; „Interval“ označuje délku kratší časové řady, ze které se počítají klouzavé průměry. Standardně je zvolená délka m=3. Výsledkem je nová časová řada, ve které se prvním m-1 členům nepřiradí žádná hodnota (#N/A), členům od pořadí m až do konce se přiradí hodnota: 1 i yˆ i . yl . m l im
- 58 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
Když je zakliknuta volba „Vytvořit graf“, výstupem nástroje bude také graf původních a vyrovnaných hodnot. Po volbě „Standardní chyby“ se zobrazí ještě hodnoty m členných klouzavých standardních chyb, a to tak, že prvních (2m 2) členům se nepřiradí žádná hodnota a dalším členům se přiřadí hodnoty: i
si ( yˆ )
(y
l i m
l
yˆ l ) 2
m Pro další analýzu metodou časových řad je vhodné hodnoty vypočítaných klouzavých průměrů posunout k časovým proměnným tak jak si to analýza vyžaduje. V případě, že si nejste jistí, jak velký interval klouzavých průměrů chcete použít, je nejlepší podívat se na body i na klouzavé průměry v grafické podobě. To můžete udělat tak, že do bodového grafu závislosti proměnné x na čase přidáte klouzavé průměry různých stupňů pomocí „Přidat spojnici trendu“ stejně, jak u lineární regrese. Pro výpočet exponenciálního vyrovnání je v procesoru Excel určený analytický nástroj Exponenciální vyrovnání. Náhled na průvodce nástrojem (Obr. 4.9): Obrázek 4.9
Zdroj: Vlastní zpracování.
U exponenciálního vyrovnání se nová vyrovnaná hodnota stanoví na základě exponenciálně váženého průměru současné hodnoty a všech předchozích hodnot časové řady tak, že první vyrovnanou hodnotu postavíme rovnu první naměřené hodnotě a pro další hodnoty použijeme rekurentní vztah: yˆ1 y1 a dále yˆi w. yi (1 w). yˆi1 kde w je koeficient exponenciálního zapomínání a (1 w) se nazývá koeficient útlumu;
w nabývá hodnot z intervalu 1,1 .Vyplnění vstupních hodnot analytického nástroje Exponenciální vyrovnání je podobné jako u nástroje Klouzavý průměr. Výsledek je sloupec dat, který neodpovídá přesně očekávaným hodnotám: první řádek je bez hodnoty a samotné hodnoty začínají až od druhého časového bodu, poslední hodnota chybí. Pro potřeby další analýzy musíte hodnoty posunout k odpovídajícím časovým bodům a poslední člen dopočítat (protože buňky vyrovnaných hodnot obsahují vzorce lze chybějící hodnotu získat zkopírováním vzorce).
- 59 -
4 Lineární regrese
ŘEŠENÝ PŘÍKLAD 4.4 Následující obrázek obsahuje hodnoty zadání i výsledky. Úkolem bylo danou časovou řadu vyrovnat pomocí klouzavých průměrů s délkou 3 a správně přiřadit vyrovnané hodnoty. Dalším úkolem bylo danou časovou řadu vyrovnat exponenciálním vyrovnáním s koeficientem zapomínání 0,3; dopočítat poslední hodnotu a správně umístit vyrovnané hodnoty (Obr. 4.10). Obrázek 4.10
Zdroj: Vlastní zpracování. ______________________________________________________________________________________________
4.4 PŘÍKLADY K PROCVIČENÍ PŘÍKLAD 4.1 Následující tabulka obsahuje počty vyrobených televizí v tis. Kč v devíti po sobě jdoucích letech. Rok 2004 2005 2006 2007 2008 2009 2010 2011 2012 Počet 300 400 350 450 480 500 560 600 550 a) Danou časovou řadu vyrovnejte pomocí klouzavých průměrů s délkou 3. b) Časovou řadu vyrovnejte exponenciálním vyrovnáním s koeficientem zapomínání 0,2. c) Sestrojte bodový graf a přidejte znázornění klouzavých průměrů stupně 3 do grafu. ___________________________________________________________________________ - 60 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
PŘÍKLAD 4.2 Banka zkoumala velikost měsíčního zůstatku na běžných účtech a jeho závislost na příjmové položce účtu. Hodnoty měsíčních zůstatků a příjmů za měsíc leden pro 11 klientů jsou v následující tabulce: Zůstatek Příjem
12 21
46 46
57 17
158 36
25 18
21 12
103 28
79 41
125 23
120 24
180 78
a) Vypočítejte regresní koeficienty, napište rovnici modelu a vypočítejte koeficient determinace, když předpokládáte logaritmický trend. b) Vypočítejte stejné proměnné jako v a), ale předpokládejte mocninný trend. ___________________________________________________________________________ PŘÍKLAD 4.3 Banka zkoumala velikost měsíčního zůstatku na běžných účtech a jeho závislost na příjmové položce účtu a na výdajové položce účtu. Hodnoty měsíčních zůstatků, příjmů a výdajů za měsíc leden pro 11 klientů (v tis. Kč) jsou v následující tabulce: Zůstatek Příjem Výdej
12 21 18
46 46 43
57 17 22
158 36 40
25 18 20
21 12 14
103 28 30
79 41 44
125 23 26
120 24 20
180 78 71
a) Vypočítejte regresní koeficienty a napište rovnici modelu s konstantním členem. b) Vypočítejte koeficient determinace. c) Na hladině významnosti α=0,01 testujte statistickou významnost koeficientů b1 a b2. __________________________________________________________________________
4.5 ŘEŠENÍ PŘÍKLADŮ ŘEŠENÍ PŘÍKLADU 4.1 Obrázek 4.11
Zdroj: Vlastní zpracování.
___________________________________________________________________________
- 61 -
4 Lineární regrese
ŘEŠENÍ PŘÍKLADU 4.2 Výsledek: a) zůstatek=-147,2+69,96.ln(příjem), R2=0,4178. b) zůstatek=2,1293.příjem1,022, R2=0,388. ___________________________________________________________________________ ŘEŠENÍ PŘÍKLADU 4.3 Výsledek: a) Zůstatek=7,69-1,60.příjem+4,00.výdej. b) R2=0,437. c) Na zvolené hladině významnosti není b1 ani b2 statisticky významný. __________________________________________________________________________
4.6 PŘÍPADOVÉ STUDIE PŘÍPADOVÁ STUDIE 4.1 Společnost prodávající počítače zkoumala zisk z prodeje a výdaje na reklamu. Tabulka uvádí údaje obdržené v dvaceti za sebou jdoucích letech: Rok 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Výdaje na reklamu 23 23 25 25 26 28 30 30 34 35 38 38 39 41 42 44 47 49 50 50
Zisk z prodeje 332 356 478 499 489 567 555 678 668 600 789 790 780 820 841 876 905 990 987 800
a) Popište zisk z prodeje na reklamních výdajích pomocí modelu y=b0+b1x1. Pro model vypočítejte hodnoty regresních koeficientů a hodnotu koeficientu determinace, pomocí analýzy rozptylu testujte vhodnost modelu. Na hladině spolehlivosti 0,01 určete, zda je regresní koeficient b1 statisticky významný, a určete jeho 99% interval spolehlivosti.
- 62 -
Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy
b) Zkoumejte řady z hlediska toho, že se jedná o časové řady. Obě řady vyrovnejte exponenciálním vyrovnáním s koeficientem zapomínání 0,3; pro každou řadu odhadněte model trendové složky časové řady y=b0+b1t, kde za t dosadíte rok určení hodnot. Na hladině významnosti 0,01 stanovte, zda jsou regresní koeficienty statisticky významné. PŘÍPADOVÁ STUDIE 4.2 Společnost prodávající počítače zkoumala zisk z prodeje a výdaje na reklamu. Tabulka uvádí údaje obdržené v dvaceti za sebou jdoucích letech: Rok 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Zisk z prodeje 4332 3556 4178 4399 4289 5467 5655 6778 6868 6800 7089 7090 7380 8200 8410 8760 9105 990 987 800
Výdaje na reklamu 123 133 125 165 186 228 230 230 234 265 278 298 339 341 342 344 377 399 420 450
a) Popište zisk z prodeje na reklamních výdajích pomocí modelu y=b0+b1x1. Pro model vypočítejte hodnoty regresních koeficientů a hodnotu koeficientu determinace, pomocí analýzy rozptylu testujte vhodnost modelu. Na hladině významnosti 0,01 určete, zda je regresní koeficient b1 statisticky významný, určete jeho 99% interval spolehlivosti. b) Zkoumejte následující řady z hlediska toho, že se jedná o časové řady. Obě řady vyrovnejte exponenciálním vyrovnáním s koeficientem zapomínání 0,3; a pro každou řadu odhadněte model trendové složky časové řady y=b0+b1t, kde za t dosadíte rok určení hodnot. Na hladině významnosti 0,01 určete, zda jsou regresní koeficienty statisticky významné.
- 63 -