Veškeré postupy na souboru data.in7 Studentská limitovaná verze je ke stažení na stránkách http://www.timberlake.co.uk/
Načtení databáze Databázi načítáme přes hlavní nabídku : File • Open Data File. GiveWin – otevření datového souboru
Kromě otevírání databáze nám tato nabídka slouží také k ukládání změn v datových souborech, ukládání výsledků, ukončování programu apod. GiveWin vytváří vlastní formát datových souborů, který se vyznačuje koncovku in7. Program je kompatibilní s programem MS Eexcel, ale jen do verze MS Excel 2003. S programem MS Excel 2007 GiveWin nespolupracuje. Databázi je tedy možné vytvořit v Excelu a načíst ji do GiveWinu. Je třeba, aby takový soubor byl databází (tj. sloupce s daty a jeden řádek s názvy sloupců – názvy musejí být jednoslovné a bez diakritiky). Databáze musí být souvislá a pouze na jednom listu. Dále je třeba v Excelu změnit nastavení desetinné čárky – GiveWin pracuje s desetinnou tečkou, nikoliv s desetinnou čárkou. Pokud není toto nastavení změněno, databázi se nám nepodaří do GiveWinu načíst. Kromě načítání databáze je možné v GiveWinu databázi přímo vytvořit. K tomu využijeme nabídky File • New • Database. Navolíme charakteristiku databáze (tj. charakteristika časových řad, prostorová data atp.), otevře se prázdný datový soubor. Necháme na čtenáři, aby okusil vytváření databáze v GiveWinu. Očekáváme, že dospěje stejně jako my k závěru, že je efektivnější vytvářet databázi v externím programu.
Sestavení modelu Databázi načítáme přes hlavní nabídku: File • Open Data File.
GiveWin – Moduly
Model sestavuje v modulu PcGive. Ten spustíme buď v nabídce vlevo (viz obr. 11.2) nebo v hlavním menu Modules • PcGive. Hlavní dialogové okno modulu PcGive je následující. GiveWin – modul PcGive
Z tohoto modulu nás budou zajímat nabídky Package, Model a Test. Před každým odhadem modelu je třeba v nabídce Package nastavit ekonometrické modelování, jinak bychom nevědomky mohli pracovat s jiným modulem. Package • Econometric Modelling GiveWin – modul PcGive, volba Package
Samotný model se sestavuje v nabídce Model. Obr. 11.5: GiveWin – modul PcGive, volba Model
V této nabídce si volíme typ modelu. GiveWin - nabidka menu Model
nabídka 1: Cross-section Regression 2: Single-equation Dynamic Modelling 3: Non-linear Modelling 4: Multiple-equation Dynamic Modelling 5: Descriptive Statistics
model Regrese na průřezových datech Regrese na časových řadách Nelineární modelování Modely simultánních rovnic Popisná statistika
Nás bude zajímat zejména nabídka (1) a (2). Protože se v základním kurzu ekonometrie setkáváme častěji s časovými řadami než s průřezovými daty, budeme si postupy ukazovat na časových řadách, práce s průřezovými daty je podobná, jen se místo nabídky (2) volí nabídka (1). Zvolíme tedy 2: Single-equation Dynamic Modelling a pokusíme se odhadnout model na datech ze zkušebního souboru. K dispozici máme časové řady – Output, Inc, Cons, Inflat. Naším cílem je nyní odhadnout model OUTPUTt = β0 + β1 CONSt + β2 INCt + β3 INFLATt + ut. Po volbě (2) se nám otevře následující dialogové okno.
GiveWin – dialogové okno pro sestavení modelu
seznam proměnných v databázi prostor pro zadání modelu
speciální proměnné – trend, konstanta, sezónnost
nastavení délky zpoždění v modelu
aktuální databáze, se kterou se pracuje
Nyní se již vyznáme v dialogovém okně a můžeme přistoupit k samotné konstrukci modelu. Nejdříve je třeba zadat do modelu endogenní proměnnou! V našem příkladu je to proměnná OUTPUT. Proměnné do modelu zadáváme dvojklikem na konkrétní proměnnou. Druhou možností je označit proměnnou a v pravé části kliknout na ADD. Dialogové okno je po zadání proměnné následující. GiveWin –sestavení modelu
Spolu s endogenní proměnnou se nám do modelu automaticky připojí konstanta. Konstantu je možné z modelu odstranit, my to ale dělat nebudeme, protože víme, že když odstraníme konstantu z modelu, tak již nepracujeme s klasickým lineárním regresním modelem.
Po zadání endogenní proměnné můžeme do modelu zadat exogenní, příp. různým způsobem zpožděné hodnoty exogenní, ev. endogenní proměnné. V našem příkladu nemáme žádnou zpožděnou proměnnou, proto zadáme pouze hodnoty bez zpoždění. GiveWin – zadaný model
V dialogovém okně se nyní nachází model, který odpovídá našemu zadání. Pokud nechceme do modelu přidávat žádnou ze speciálních proměnných (trend či sezónnost), můžeme model potvrdit – OK. V následujícím dialogovém okně jsme vyzváni k volbě metody odhadu modelu. GiveWin – volba odhadové techniky
Ordinary least squares = metoda nejmenších čtverců – budeme volit nejčastěji. Instrumental variables = metoda instrumentálních (pomocných) proměnných, s touto metodou se v základním kurzu ekonometrie nesetkáme. Autoregressive least squares = metoda zobecněných nejmenších čtverců – tuto metodu použijeme při odstraňování autokorelace z modelu. Nyní tedy zvolíme první nabídku a odhadneme model metodou nejmenších čtverců. V dalším dialogovém okně máme možnost korigovat, na kterých pozorováních se má model odhadnout. V tomto okně je shrnuta metoda odhadu a je zde možné odstranit počáteční nebo koncová pozorování, a ta pak nebudou brána v potaz při odhadu modelu. GiveWin – upřesnění modelu
v této části odebíráme pozorování z konce databáze – stanovuje se zde poslední pozorování, po které se bude model odhadovat
v této části odebíráme pozorování ze začátku databáze – stanovuje se zde počáteční pozorování, od kterého se bude model odhadovat
počet pozorování, na kterých se model odhaduje
Pokud jsme s tímto nastavením spokojení, opět potvrdíme – OK. V dalším okně se již objeví standardní výstup s odhadnutým modelem. EQ( 1) Modelling OUTPUT by OLS (using data.in7) The estimation sample is: 1968 (1) to 2007 (3)
Constant CONS INC INFLAT
Coefficient 518.739 0.763810 0.00155574 1.08851
sigma R^2 log-likelihood no. of observations mean(OUTPUT)
4.70951 0.820459 -469.969 159 1191.14
Std.Error 35.64 0.1154 0.1376 0.4086
t-value 14.6 6.62 0.0113 2.66
t-prob Part.R^2 0.000 0.5775 0.000 0.2203 0.991 0.0000 0.009 0.0438
RSS 3437.82086 F(3,155) = 236.1 [0.000]** DW 0.531 no. of parameters 4 var(OUTPUT) 120.427
Výstup z programu GiveWin
Naším úkolem je seznámit se v této části s ovládáním softwaru, proto se nyní nebudeme vyhodnocování výstupu věnovat a tuto záležitost přenecháme jiným kapitolám.
Práce s modelem Po odhadu modelu můžeme přistoupit k vyhodnocování dodatečných testů, příp. ke grafické analýze atp. V modelu PcGive k tomu slouží menu Test. GiveWin – dodatečné testy
První v nabídce je grafická analýza. Zde si můžeme nechat zobrazit různé typy grafů. Grafy však nelze příliš upravovat, pro nás budou mít pouze informativní charakter. GiveWin – grafická analýza
Nejčastěji nás bude zajímat nabídka graf Actual and fitted values, který zachycuje skutečné a modelem vyrovnané hodnoty endogenní proměnné, a dále graf Residuals (scaled), který zobrazuje rezidua modelu.
GiveWin – graf skutečných a vyrovnaných hodnot, graf reziduí
V této nabídce si můžeme nechat zobrazit také funkce ACF a PACF, ale to jsou již záležitosti týkající se pokročilejších kurzů. V menu Test nás budou dále zajímat předpovědi – tj. nabídka Forecast... Abychom mohli předpovídat, musíme mít v databázi pozorování, která jsme nepoužili k odhadu modelu. Dialogové okno je stejné pro předpovědi ex-post i ex-ante. GiveWin – předpovědi
počet požadovaných predikcí
zde se nastavuje, jaká směrodatná chyba se má u predikování užít – zda směrodatná chyba modelu nebo tato chyba upravená o parametr nejistoty; pokud nás směrodatná chyba nezajímá, zvolíme Do not compute
zde je třeba zatrhnout, aby software předpovědi vypsal namísto vykreslení grafu
Vedle grafů a předpovědí si můžeme v tomto menu vyvolat dodatečné testy, které potřebujeme k vyhodnocování vlastností modelu. V menu Test volíme nabídku Test...
Dialogové okno má tuto podobu. GiveWin – testy heteroskedasticity
Z této nabídky nás budou zajímat pouze testy na heteroskedasticitu
V menu Test lze také ukládat vyrovnané hodnoty nebo rezidua přímo do databáze. Děje se tak přes nabídku Store Residuals etc. in Database. GiveWin – uložení reziduí
Zde uložíme rezidua modelu a vyrovnané hodnoty endogenní proměnné do databáze
K vyhodnocení předpokladů modelu musíme umět vyvolat korelační matici. K tomu nám neslouží ekonometrické modelování, ale popisná (deskriptivní) statistika. Je třeba změnit nastavení programu. Nastavení změníme. Package • Descriptive statistics
GiveWin – popisná (deskriptivní) statistika
Nabídka Model se nyní změnila. GiveWin – nabídka model v popisné (deskriptivní) statistice
K tomu abychom získali matici korelačních koeficientů, musíme nyní zvolit Formulate... a nadefinovat, mezi kterými proměnnými tuto matici chceme vytvářet. Dialogové okno, kde se zadávají proměnné, je podobné jako při sestavování modelu v ekonometrickém modelování. GiveWin – sestavení modelu v deskriptivní statistice
Proměnné navolíme a přes OK se přepneme do dalšího okna. GiveWin – základní statistické charakteristiky
Zde nás bude zajímat pouze první nabídka, kterou spočítáme průměry, střední hodnoty a matici korelačních koeficientů mezi zvolenými proměnnými. Tuto část je možné využít také na testování jednotkových kořenů atp., ale to je již součástí pokročilých kurzů.
Další zajímavá menu Kromě ekonometrického modelování disponuje GiveWin také funkcemi, které známe například z Excelu. Tyto funkce najdeme v hlavním menu programu v nabídce Tools. GiveWin – nabídka Tools
Z této nabídky nás bude zajímat především Calculator a Algebra Editor. Tyto součásti programu slouží k pomocným výpočtům. Obě tyto aplikace, stejně jako celý GiveWin, jsou
citlivé na malá a velká písmena – a tedy pro software je proměnná CONS odlišná od proměnné cons. Názvy nově napočítaných proměnných je třeba zadávat bez diakritiky. GiveWin – nabídka Calculator
proměnné z databáze
aktuální databáze
seznam matematických funkcí, které lze v kalkulátoru použít, VAR se nahrazuje proměnnou, se kterou chceme úpravy provádět
Kliknutím na „=“ potvrdíme zadání funkce a poté jsme vyzváni ke vložení názvu nové proměnné. Tato proměnná se objeví jako další sloupec v aktuální databázi. Na podobném systému jako Calculator pracuje také Algebra Editor. GiveWin – nabídka Algebra Editor
proměnné z databáze
aktuální databáze a rozsah dat
nabídka funkcí prostor pro zadání funkcí, eventuelně vzorců; jednotlivé vzorce/funkce jsou odděleny středníkem, nejdříve se definuje název nové proměnné (odlišné od Calculator), poté se definuje způsob výpočtu této proměnné nově definované proměnné se objevují jako další sloupec v aktuální databázi
Příklad – ruční výpočet DW statistiky Nyní si ukážeme, jak je možné DW statistiku spočítat pomocí nástroje Algebra Editor. Statistiku budeme počítat pro model, který jsme odhadovali v předchozí části.
Nejdříve musíme odhadnout model modul PcGive • Package • Econometric Modelling modul PcGive • Model • 2: Single-equation Dynamic Modelling EQ( 1) Modelling OUTPUT by OLS (using data.in7) The estimation sample is: 1953 (1) to 1992 (3)
Constant CONS INC INFLAT
Coefficient 518.739 0.763810 0.00155574 1.08851
sigma R^2 log-likelihood no. of observations mean(OUTPUT)
4.70951 0.820459 -469.969 159 1191.14
Std.Error 35.64 0.1154 0.1376 0.4086
t-value 14.6 6.62 0.0113 2.66
t-prob Part.R^2 0.000 0.5775 0.000 0.2203 0.991 0.0000 0.009 0.0438
RSS 3437.82086 F(3,155) = 236.1 [0.000]** DW 0.531 no. of parameters 4 var(OUTPUT) 120.427
Výstup z programu GiveWin
DW statistika se počítá dle vzorce T
∑ (e − e
t −1
t
d=
t =2
)2 .
T
∑e
2 t
t =1
Ve vzorci se vyskytují rezidua, ta si tedy musíme uložit do databáze, abychom s nimi mohli dále pracovat. Pro naše potřeby je pojmenujeme e. modul PcGive • Test • Store residuals etc. in Database Nyní již můžeme přistoupit k zadání vzorce do Algebra Editoru. Vzorec musíme zadat po částech. Nejprve napočítáme rozdíl reziduí, který pojmenujeme jako dif1. K výpočtu rozdílů, resp. diferencí, slouží funkce diff(VAR,LAG), kde LAG je délka zpoždění (v našem příkladu 1) dif1 = diff(e,1); Poté potřebujeme mocniny tohoto rozdílu – pojmenujeme jako dif2 dif2=dif1*dif1; Tyto mocniny potřebujeme sečíst – součet pojmenujeme jako dif3. K sečtení použijeme funkci kumulovaný součet – tj. cum(VAR) dif3 = cum(dif2); Nyní jsme spočítali hodnotu, která se ve vzorci vyskytuje v čitateli. Podobně bychom mohli spočítat hodnotu ve jmenovateli. Tady nám ale stačí si uvědomit, že výraz ve jmenovateli představuje součet čtverců reziduí, tj. RSS, které máme ve výstupu.
Takže nám zbývá vyjádřit podíl čitatele a jmenovatele. Zavedeme novou proměnnou DW, která nám tento podíl zachytí. DW = dif3/3437.82; Hodnota 3437.82 se rovná RSS z výstupu, opět musíme místo desetinné čárky použít desetinnou tečku. Zadání v Algebra Editoru je následující. GiveWin – sestavení kódu v Algebra Editoru
Hodnotu DW statistiky nalezneme v posledním řádku sloupce DW. Je na čtenáři, aby si ověřil, že tato hodnota je stejná jako hodnota vypočtená softwarem. Hlavní rozdíl mezi aplikací Calculator a Algebra Editor tedy spočívá v tom, že v Algebra Editoru můžeme zadávat více příkazů současně, zatímco Calculator funguje na principu kalkulačky. Pokud provádíme dodatečné testy k výstupu, často se dostaneme do situace, kdy nám software vyjádří vypočtenou hodnotu námi testovaného kritéria, ale již nám nezobrazí kritickou hodnotu pro tuto statistiku. V takovém případě můžeme začít listovat statistickými tabulkami nebo využít v GiveWinu menu Tools • Tail Probability. GiveWin v sobě nemá integrované statistické tabulky, proto nám nezobrazuje kritické hodnoty, ale dokáže posoudit, zda hodnota, kterou mu zadáme, je větší nebo menší než hodnota kritická a na jaké hladině významnosti.
GiveWin – nabídka Tail probability
zvolíme rozdělení, ke kterému vyhledáváme kritickou hodnotu a navolíme, zda chceme oboustranný nebo jednostranný interval
zadáme hodnotu, ke které hledáme kritickou hodnotu
zadáme stupně volnosti požadovaného rozdělení