4EK211 Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3
Zuzana Dlouhá
Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR1.xls Data:
y = maloobchodní obrat potřeb pro domácnost v mld. CZK x1 = disponibilní příjem v mld. CZK x2 = cenový index v %
Zadání: Odhadněte závislost maloobchodního obratu (y) na disponibilním příjmu (x1) a cenovém indexu (x2). Proveďte specifikaci, kvantifikaci, verifikaci a aplikaci EM. yi = β0 + β1x1i + β2x2i + ui, i = 1, 2,...,8 • pozor – jenom cvičný příklad, v BP/DP je potřebný velký počet pozorování (alespoň 25-30!)
2
Klasický lineární regresní model - specifikace Specifikace EM • určení proměnných y = endogenní (vysvětlovaná) proměnná x1 = exogenní (vysvětlující) proměnná x2 = exogenní (vysvětlující) proměnná • určení vzájemných vazeb mezi proměnnými (forma závislosti) + formulace hypotéz yi = β0 + β1x1i + β2x2i + ui, i = 1, 2,...,8 • předpokládané znaménka, očekávané hodnoty odhadnutých parametrů β1 = v intervalu (0,1) pokud nepracujeme s úsporami nebo > 0 s úsporami β2 = by mělo být < 0 3
Klasický lineární regresní model - kvantifikace Kvantifikace EM • odhad modelu MNČ, MS Excel nebo EViews Dependent Variable: Y Method: Least Squares Date: 10/07/13 Time: 19:46 Sample: 1966 1973 Included observations: 8 Y=C(1)+C(2)*X1+C(3)*X2
C(1) C(2) C(3) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient
Std. Error
t-Statistic
Prob.
3.016198 0.10355 -0.097964
1.031888 0.00455 0.015828
2.922991 22.75901 -6.189178
0.0329 0 0.0016
0.997094 0.995932 0.120682 0.07282 7.445305 857.8381 0
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
10.5 1.892089 -1.111326 -1.081536 -1.312252 1.949445 4
Klasický lineární regresní model - kvantifikace Kvantifikace EM • zápis odhadnutého regresního modelu (regresní nadroviny)
C(1) C(2) C(3)
Coefficient
Std. Error
t-Statistic
Prob.
3.016198 0.10355 -0.09796
1.03189 0.00455 0.01583
2.922991 22.75901 -6.189178
0.0329 0 0.0016
– napozorované hodnoty:
y = 3,016 + 0,104x1 – 0,098x2 + e – vyrovnané hodnoty:
yˆ = 3,016 + 0,104x1 – 0,098x2 • je to tzv. bodový odhad
5
Klasický lineární regresní model - verifikace Verifikace ekonomická •
předpokládané znaménka, očekávané hodnoty odhadnutých parametrů β1 = v intervalu (0,1) pokud nepracujeme s úsporami nebo > 0 s úsporami → b1 splňuje předpoklad β2 = by mělo být < 0 → b2 splňuje předpoklad
•
ekonomická interpretace b0 – bez interpretace b1 – absolutní (příjmová) pružnost b1
y x1
b1 = 0,104 → vzroste-li disponibilní příjem (x1) o 1 mld. CZK (tj. o 1 jednotku) a cenový index (x2) se nezmění, vzroste maloobchodní obrat potřeb pro domácnost v průměru o 0,104 mld. CZK
6
Klasický lineární regresní model - verifikace Verifikace ekonomická b2 – absolutní (cenová) pružnost b2
y x 2
b2 = -0,098 → vzroste-li cenový index (x2) o jeden procentní bod a disponibilní příjem (x1) se nezmění, klesne maloobchodní obrat potřeb pro domácnost v průměru o 0,098 mld. CZK • •
b1 i b2 jsou definovány v daných jednotkách!!! každou absolutní pružnost lze převést na pružnost relativní
• •
definuje se koeficient relativní pružnosti – q počítá se vždy vzhledem k nějakému datu, v %!
•
koeficient příjmové pružnosti
•
y x1 x b1 1 x1 y y y x2 x koeficient cenové pružnosti qx2 b2 2 x2 y y qx1
7
Klasický lineární regresní model - verifikace Verifikace ekonomická •
relativní pružnost pro rok 1973 y(73) = 13,6 x1(73) = 209 x2(73) = 113
•
koeficient příjmové pružnosti qx (73) b1 1
x1 209 0,104 1,60 y 13,6
– zvýší-li se v roce 1973 disponibilní příjem (x1) o 1 % a cenový index (x2) se nezmění, vzroste maloobchodní obrat potřeb pro domácnost o 1,60 % •
koeficient cenové pružnosti qx (73) b2 2
x2 113 0,098 0,81 y 13,6
– zvýši-li se v roce 1973 cenový index (x2) o 1 % a disponibilní příjem (x1) se nezmění, klesne maloobchodní obrat potřeb pro domácnost o 0,81 %
8
Klasický lineární regresní model - verifikace Verifikace statistická
C(1) C(2) C(3)
Coefficient
Std. Error
t-Statistic
Prob.
3.016198 0.10355 -0.09796
1.03189 0.00455 0.01583
2.922991 22.75901 -6.189178
0.0329 0 0.0016
Standard error • standardní chyba regresního koeficientu • slouží k určení významnosti parametrů, k intervalovým odhadům
sbi s ( X T X )ii1 kde s
1 eTe nebo S.E. of regresion ve výstupu (n (k 1))
ii – prvek z diagonály momentové matice, pro náš příklad: 73,111 0,234 1,061 1 ( X T X )1 0,234 0,001 0,004 sb0 0,073 73,111 1,032 ( 8 3 ) 1,061 0,004 0,017 9
Klasický lineární regresní model - verifikace Verifikace statistická
C(1) C(2) C(3)
Coefficient
Std. Error
t-Statistic
Prob.
3.016198 0.10355 -0.09796
1.03189 0.00455 0.01583
2.922991 22.75901 -6.189178
0.0329 0 0.0016
t-Statistic • t-statistika slouží k určení významnosti jednotlivých parametrů v modelu • testuje se hypotéza: H0: βj = 0 bj βj H1: βj ≠ 0 t j s bj
•
obecně pro t-statistiku platí
•
t j t1*α/ 2 (nk 1) → nezamítám hypotézu H o významnosti proměnné 1
•
v modelu, proměnná je tedy statisticky významná na α t j t1*α/ 2 (nk 1) → nezamítám hypotézu H0 o nevýznamnosti proměnné v modelu, proměnná je tedy statisticky nevýznamná na α
tj
bj Coefficient sb j Std. error
10
Klasický lineární regresní model - verifikace Verifikace statistická
C(1) C(2) C(3)
Coefficient
Std. Error
t-Statistic
Prob.
3.016198 0.10355 -0.09796
1.03189 0.00455 0.01583
2.922991 22.75901 -6.189178
0.0329 0 0.0016
Prob. • pravděpodobnost, že nulová hypotéza je pravdivá (tj. daná vysvětlující proměnná je v modelu nevýznamná) • Prob. < 0,05 – proměnná je statisticky významná na 5% hladině • Prob. < 0,01 – proměnná je statisticky významná na 1% hladině • pokud nemáme tabulkovou hodnotu t-statistiky pro srovnání, postupujeme podle Prob.
11
Klasický lineární regresní model - verifikace Verifikace statistická R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.997094 0.995932 0.120682 0.07282 7.445305 857.8381 0
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
10.5 1.89209 -1.11133 -1.08154 -1.31225 1.94945
S.E. of regression • standardní chyba regrese [u~N(0,σ2)] • charakteristika výběrového rozptylu, který dostaneme po kvantifikaci abstraktního modelu • vzorec 1 1 T
s
•
(n (k 1))
e e
(8 3)
0,073 0,1206
užívá se při výpočtu standardní chyby regresního koeficientu
Sum squared resid • součet čtverců reziduí ∑ei2 = ∑eTe → min 12
Klasický lineární regresní model - verifikace Verifikace statistická R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.997094 0.995932 0.120682 0.07282 7.445305 857.8381 0
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
10.5 1.89209 -1.11133 -1.08154 -1.31225 1.94945
R-squared R2 – koeficient vícenásobné determinace • hodnotí celkovou kvalitu modelu, určuje, jak se model shoduje s daty
VSČ NSČ 1 R 2 0,1 CSČ CSČ 1 1 1 2 2 2 CSČ (y i y ) VSČ (yˆ i y ) NSČ (y i yˆ i ) n n n R2
13
Klasický lineární regresní model - verifikace Verifikace statistická R2 – koeficient vícenásobné determinace • je-li NSČ = 0, pak R2 = 1 → dokonalý model • v případě, že koeficient R2 není statisticky významný (viz F-poměr), doporučují se úpravy: – přidání další vysvětlující proměnné – zvýšení počtu pozorování – změna funkčního tvaru regresní rovnice • nezohledňuje počet vysvětlujících proměnných – hodnota R2 nikdy neklesne přidáním dalších vysvětlujících proměnných do modelu • řeší to tzv. korigovaný koeficient determinace (tj. R2adj nebo R 2 ) • v EViews – Adjusted R-squared
R 2 1 (1 R2 ) • • •
n 1 n (k 1)
R 2 < R2 – zvyšováním počtu proměnných roste R2, ale ne R 2 rovnost jen pokud R2 = 1 nebo k = 1 stejná závislá proměnná a stejný počet pozorování!!! 14
Klasický lineární regresní model - verifikace Verifikace statistická R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.997094 0.995932 0.120682 0.07282 7.445305 857.8381 0
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
10.5 1.89209 -1.11133 -1.08154 -1.31225 1.94945
Log likelihood • hodnota věrohodnostní funkce • při odhadové metodě – metoda maximální věrohodnosti (MMV) • oba odhady (pomocí MNČ i MMV) dávají stejné výsledky, pokud se pracuje s normálním regresním modelem
15
Klasický lineární regresní model - verifikace Verifikace statistická R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.997094 0.995932 0.120682 0.07282 7.445305 857.8381 0
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
10.5 1.89209 -1.11133 -1.08154 -1.31225 1.94945
F-statistic
•
F-poměr – testuje statistickou významnost modelu (využívá se Fischerovo rozdělení) H0: R2 statisticky nevýznamné, β0 = β1 =... βj = 0 H1: R2 statisticky významné, βj ≠ 0
R2 n (k 1) F 1 R2 k
16
Klasický lineární regresní model - verifikace Verifikace statistická •
F > F*(k,n-k-1) … zamítáme H0 ve prospěch H1
•
F ≤ F*(k,n-k-1) … nezamítáme H0 ve prospěch H1
Prob(F-statistic) •
počítá nám p-value
•
Prob(F-statistic) ≤ α → nezamítám hypotézu H1, model je tedy statisticky významný na α
•
Prob(F-statistic) > α → nezamítám hypotézu H0, model je tedy statisticky nevýznamný na α
17
Klasický lineární regresní model - verifikace Verifikace statistická R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.997094 0.995932 0.120682 0.07282 7.445305 857.8381 0
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
10.5 1.89209 -1.11133 -1.08154 -1.31225 1.94945
Mean dependent var • průměr vysvětlované (tj. endogenní) proměnné S.D. dependent var • standardní odchylka vysvětlované (tj. endogenní) proměnné Akaike, Schwarz, Hannan-Quinn criterion • informační kritéria – výběr správného modelu • vybírám minimální hodnotu • neuvádět interpretaci v testu u prof. Pánkové!!! 18
Klasický lineární regresní model - verifikace Verifikace statistická R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.997094 0.995932 0.120682 0.07282 7.445305 857.8381 0
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
10.5 1.89209 -1.11133 -1.08154 -1.31225 1.94945
Durbin-Watson stat • Durbinova-Watsonova (DW) statistika d • užívá se pro testování vlastností náhodných složek • test autokorelace prvního řádu
19
Klasický lineární regresní model - verifikace Verifikace ekonometrická • • •
ověřuje splnění podmínek pro použití MNČ testuje se heteroskedasticita, autokorelace, multikolinearita DW – Durbin-Watson – testuje autokorelaci prvního řádu, budeme řešit později!!!
20
Klasický lineární regresní model - aplikace Aplikace • • •
predikce apod., ukládání vyrovnaných hodnot, reziduí... predikce – dosazení konkrétních hodnot do regresní funkce podrobně na cvičení 4
21
Klasický lineární regresní model - kvantifikace Kvantifikace EM • intervalový odhad
P bi sbi t1*α / 2(nk 1) βi bi sbi t1*α / 2(nk 1)
t1*α / 2(nk 1) t1*0,05 / 2(821) 2,571 sb1 0,0046 b1 sb1t1*0,05 / 2(821) 0,104 0,0046* 2,571 β1 0,0922;0,1158 n = počet pozorování k = počet vysvětlujících proměnných α = hladina významnosti, předpokládejme pro náš příklad = 5 % EViews – Equation (objekt) – View – Coefficient Diagnostics – Confidence Intervals… 22
Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR2.xls Data:
pocet_clenu = počet členů v domácnosti prijem = disponibilní příjem v tis. CZK vydaje = výdaje domácnosti na určité zboží v CZK
23