4EK211 Základy ekonometrie Odhad klasického lineárního regresního modelu I Cvičení 2
Zuzana Dlouhá
Metodologický postup tvorby EM 1. • • •
Specifikace modelu určení proměnných určení vzájemných vazeb mezi proměnnými formulace hypotéz – v podobě algebraických vztahů (tj. jedné či více rovnic) • specifikace náhodných vlivů 2. Odhad parametrů (tj. kvantifikace) • využití disponibilní (tj. výběrové) informace z dat • použití vhodné odhadové techniky 3. Verifikace • jak se odhadnutý model shoduje s teorií a napozorovanými daty – ekonomická (jestli proměnné modelu mají správný směr a intenzitu) – statistická (ověření přesnosti a významnosti výsledků) – ekonometrická (zda byly dodrženy podmínky pro použití dané odhadové techniky a statistických testů) 2
Metodologický postup tvorby EM Využití kvalitativní a kvantitativní analýza minulého vývoje předpovědi (predikce, prognózy) volba hospodářské politiky – analýza různých scénářů – simulační experimenty • aplikace na mikroúrovni – banky (nesplácení úvěru, odhad ztráty dané nesplácením úvěru, odhad pravděpodobnosti podvodu) – marketing (odchod zákazníka, pořízení produktu – crosssell) – cena komodity ve vztahu k poptávanému množství – příjem spotřebitele versus cena komodity – velikost prodeje versus prostředky na reklamu 4. • • •
3
Klasický lineární regresní model (KLRM) Obecný model (maticový zápis) y = Xβ + u X= y= β= u= k= k+1 = n=
matice (n x (k+1)) pozorování exogenních proměnných, včetně úrovňové konstanty sloupcový vektor (n x 1) endogenních proměnných sloupcový vektor ((k+1) x 1) parametrů sloupcový vektor náhodné složky, u ~ N (0, δ2) počet vysvětlujících proměnných počet odhadovaných parametrů počet pozorování
Zápis KLRM po složkách y = β0 + β1x1 + β2x2 +…+βkxk + u • za předpokladu: n > k ˆ - odhady β) • odhadnout koeficienty β – tj. určit b (resp. β 4
Klasický lineární regresní model (KLRM) Abstraktní vs. konkrétní model y = Xβ → y = Xβ + u • model „naplníme“ daty (tj. provedeme kvantifikaci modelu) → y = Xb + e kde y jsou napozorované hodnoty, e jsou rezidua → yˆ Xb kde yˆ jsou vyrovnané hodnoty, rezidua jsou 0 Rezidua vs. náhodná složka rezidua = rozdíl mezi napozorovanými a vyrovnanými hodnotami:
e y yˆ náhodná složka = rozdíl mezi napozorovanými hodnotami a jejich střední hodnotou: u = y – E(y) 5
Klasický lineární regresní model (KLRM) Bodová odhadová funkce „b“ • vzniká z podmínky, aby součet čtverců reziduí byl minimální • součet čtverců reziduí: eTe b … ∑ eTe → min • kdy je funkce minimální: – první derivace funkce je nulová – druhá derivace funkce je kladná • metoda nejmenších čtverců (MNČ / OLS) – nejznámější technika • funkční předpis odhadové funkce: b = (XTX)-1XTy - poskytuje odhady: - nestranné (resp. nevychýlené) - vydatné bT = (b0, b1, b2,…,bk) 6
Klasický lineární regresní model (KLRM) Odvození bodové odhadové funkce „b“ b … ∑ eTe → min
e Te ( y Xb )T( y Xb ) y T y b T X T y y T Xb b T X T Xb y T y 2b T X T y b T X T Xb, kde platí, že y T Xb ( y T Xb )T b T X T y e Te ( y T y 2b T X T y b T X T Xb ) 0 2X T y 2X T Xb b b 2X T y 2X T Xb ( X T X )b X T y ( X T X )(1 X T X )b ( X T X )1 X T y
b ( X T X )1 X T y 7
Klasický lineární regresní model (KLRM) - příklad Příklad 1: yi = (1, 4, 7, 9) xi = (4, 3, 1, 1) yi = β0 + β1xi + ui, i = 1, 2,...,4 • • • • • • •
stanovte odhad parametrů β0 a β1, aby součet čtverců odchylek vyrovnaných hodnot od hodnot napozorovaných byl minimální napište odhadnutou regresní nadrovinu vypočítejte vyrovnané hodnoty ŷi vypočítejte rezidua ei proveďte výpočty v programu MS Excel (využijte maticové počty) proveďte výpočty v programu EViews řešení: b0 = 31/3 = 10,33 b1 = -61/27 = -2,26 8
Klasický lineární regresní model (KLRM) - příklad Příklad 2: yi = (5, 4, 6, 4, 3) xi = (3, 2, 3, 2, 3) yi = β0 + β1xi + ui, i = 1, 2,...,5 • • • • • • •
stanovte odhad parametrů β0 a β1, aby součet čtverců odchylek vyrovnaných hodnot od hodnot napozorovaných byl minimální napište odhadnutou regresní nadrovinu vypočítejte vyrovnané hodnoty ŷi vypočítejte rezidua ei proveďte výpočty v programu MS Excel (využijte maticové počty) proveďte výpočty v programu EViews řešení: b0 = 2,67 b1 = 0,67 9
Klasický lineární regresní model (KLRM) Náhodná složka: Gauss-Markovy předpoklady 1.
E(u) = 0 – náhodné vlivy se vzájemně vynulují
2.
E(u uT) = σ2 In – konečný a konstantní rozptyl = homoskedasticita → porušení: heteroskedasticita – náhodné složky jsou sériově nezávislé → porušení: autokorelace
3.
X je nestochastická matice – E(XTu) = 0 – veškerá náhodnost je obsažena v náhodné složce
4.
X má plnou hodnost k – matice X neobsahuje žádné perfektně lineárně závislé sloupce pozorování vysvětlujících proměnných → porušení: multikolinearita 10
Klasický lineární regresní model (KLRM) Vlastnosti bodového odhadu, n < 30 • nestrannost (nevychýlenost / nezkreslenost) odhadu: E(b) = β b – získáme z více výběrových vzorků pokud E(b) > β – odhady jsou nadhodnoceny, E(b) < β – odhady jsou podhodnoceny
f(b)
Nestrannost
ß
b 11
Klasický lineární regresní model (KLRM) Vlastnosti bodového odhadu, n < 30 • vydatnost odhadu: standardní chyba regresního koeficientu sb musí být minimální ze všech jiných postupů – to způsobuje, že intervalové odhady jsou nejmenší – jako nevychýlený odhad může sloužit více statistik, z nichž nejvhodnější je ta, která má minimální rozptyl
f(b)
Vydatnost
ß
b 12
Klasický lineární regresní model (KLRM) Vlastnosti bodového odhadu, n ≥ 30 • konzistentní – bodový odhad b je konzistentním odhadem, jestliže jeho hodnota s rostoucím počtem pozorování n konverguje ke skutečnému = populačnímu parametru
p lim b β n
Konzistence
n=1000 n=500
f(b)
n=200
β
b
13
Klasický lineární regresní model (KLRM) Vlastnosti bodového odhadu, n ≥ 30 • asymptoticky nestranný – je to slabší vlastnost, (pokud je odhad asymptoticky nestranný tak je i konzistentní)
p lim E(b) β n
Asymptotická nestrannost n=500
f(b)
n=200
ß
E(b)
14
Klasický lineární regresní model (KLRM) Vlastnosti bodového odhadu, n ≥ 30 • asymptotická vydatnost – rozptyl konverguje k nule rychleji než s použitím jiné odhadové funkce
Asymptotická vydatnost
f(b)
n=500
n=200
ß
b
15