Masarykova univerzita Ekonomicko-správní fakulta Studijní obor: Matematické a statistické metody v ekonomii
REGRESNÍ ANALÝZA TRANSAKCÍ S BYTOVÝM FONDEM Regression Analysis of the Housing Transactions Diplomová práce
Vedoucí diplomové práce: RNDr. Dalibor Moravanský, CSc.
Autor: Mgr. Michaela Bartuňková
Brno, duben 2010
Masarykova univerzita Ekonomicko-správní fakulta Katedra ekonomie Akademický rok 2008/2009
ZÁDANÍ DIPLOMOVÉ PRÁCE Pro:
BARTUŇKOVÁ Michaela
Obor:
Matematické a statistické metody v ekonomii
Název tématu:
REGRESNÍ ANALÝZA TRANSAKCÍ S BYTOVÝM FONDEM Regression Analysis of the Housing Transactions
Zásady pro vypracování Cíl práce, problémová oblast, postup a použité metody: Postup práce a použité metody: • Seznámení se s tématem prostřednictvím doporučené podpůrné literatury. • Vyšetření základních vlastností SUR-modelu (soustavy zdánlivě nezávislých regresních rovnic) v oblasti trhu s byty. • Sestavení 3-4 rovnicového ekonometrického modelu představujícího analýzu poptávky po nájmech a koupích bytů a vícebytových objektů se zahrnutím vysvětlujících proměnných dostupných v získaných databázích realitních kanceláří (s případným doplněním informací z nabídkových periodik realitních kanceláří). • Kvantitativní analýza vytvořeného vícerovnicového modelu pomocí analytických prostředků dostupných v programovém produktu GRETL včetně alternativních (vůči OLS, WLS) kvantifikačních technik. • Interpretace získaných výsledků, vyvození závěrů o chování segmentu bytovéh trhu v současné době, úvahu o případném dalším vývoji v závislosti na očekávaném vývoji vysvětlujících proměnných (měřitelných i kategoriálních).
• Zhodnocení možnosti racionálního uplatnění zvolené metodologie na získaných datech ČR. Porovnání výsledků se známými obdobným zahraničními výzkumy. Rozsah grafických prací:
předpoklad cca 10 tabulek a grafů
Rozsah práce bez příloh:
60 – 70 stran
Seznam odborné literatury: • Greene, William H.: Econometric Analysis. 4ed Prentice Hall 1993, 1997, 2000. 1004 s. • Deaton, A., Muellbauer, J.: Economics and Consumer Behaviour. Cambridge U.P. 1986. 450s. • Barten A, Böhm, V.: Consumer Theory. kap.7 in: Handbook of Mathematical Economics. North-Holland 1984. • Moravanský, D.: Expenditure systems and their applicability in the COICOP- classification Framework. Příspěvek na konferenci MME – Ostrava 2006. • Gujarati, N. Damodar: Basic Econometrics. 2ed McGraw-Hill Inc. 1988. 704 s. • Hayashi, Fumio: Econometrics. 2ed Princeton University Press. 2000. 683 s.
Vedoucí diplomové práce:
RNDr. Dalibor Moravanský, CSc.
Datum zadání diplomové práce:
6. 3. 2009
Termín odevzdání diplomové práce a vložení do IS je uveden v platném harmonogramu akademického roku.
vedoucí katedry
V Brně dne 6. 3. 2009
děkan
Jméno a příjmení autora: Název diplomové práce: Název práce v angličtině: Katedra: Vedoucí diplomové práce: Rok obhajoby:
Mgr. Michaela Bartuňková Regresní analýza transakcí s bytovým fondem Regression Analysis of the Housing Transactions Ekonomie RNDr. Dalibor Moravanského, CSc. 2010
Anotace Tato diplomová práce zkoumá vztahy mezi proměnnými relevantními pro odhad ceny bytu, resp. jeho pronájmu. Za tímto účelem je v práci provedena regresní analýza. Při analýze jsou použity různé odhadové metody. Annotation This thesis deals with relations among variables relevant for appraisement of flat or apartment rentals. For this purpose is carried out the regression analysis. In analysis are used different methods of estimation.
Klíčová slova regresní analýza, OLS, WLS, 2SLS, LIML, Logit model, Probit model, bytový fond
Keywords regression analysis, OLS, WLS, 2SLS, LIML, Logit model, Probit model, housing fund
Prohlášení Prohlašuji, že jsem diplomovou práci Regresní analýza transakcí s bytovým fondem vypracovala samostatně pod vedením RNDr. Dalibora Moravanského, CSc. a uvedla v ní všechny použité literární a jiné odborné zdroje v souladu s právními předpisy, vnitřními předpisy Masarykovy univerzity a vnitřními akty řízení Masarykovy univerzity a Ekonomicko-správní fakulty Masarykovy univerzity. V Brně dne 2. 5. 2010
Michaela Bartuňková
Poděkování Chtěla bych poděkovat RNDr. Daliboru Moravanskému, CSc. za vedení diplomové práce, cenné rady a připomínky při zpracování daného tématu. Zároveň bych chtěla poděkovat společnosti Gaute, a. s., která poskytla data k této analýze.
OBSAH
Obsah Úvod
11
1 Metodika práce 1.1 Realitní společnost Gaute, a. s. . 1.2 Zpracování dat . . . . . . . . . . 1.2.1 Aplikace Intrapoint . . . . 1.2.2 Úprava dat . . . . . . . . 1.2.3 Výpočtový program Gretl
. . . . .
15 15 16 16 17 22
. . . . . . . . . . . . . . . .
23 23 23 24 25 25 25 26 27 28 30 32 35 36 37 38 41
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
2 Metoda nejmenších čtverců 2.1 Teoretická část . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Lineární regresní model . . . . . . . . . . . . . . . . . . . . 2.1.2 Odhad parametrů β metodou nejmenších čtverců . . . . . 2.1.3 Kontingenční tabulky . . . . . . . . . . . . . . . . . . . . . 2.1.4 Korelační matice . . . . . . . . . . . . . . . . . . . . . . . 2.1.5 Koeficient determinace . . . . . . . . . . . . . . . . . . . . 2.1.6 RESET test . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.7 Testy heteroskedasticity . . . . . . . . . . . . . . . . . . . 2.2 Prodej bytů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Odhad parametrů β metodou nejmenších čtverců . . . . . 2.2.2 Odhad parametrů β váženou metodou nejmenších čtverců 2.2.3 Zúžený regresní model . . . . . . . . . . . . . . . . . . . . 2.3 Pronájem bytů . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Odhad parametrů β metodou nejmenších čtverců . . . . . 2.3.2 Odhad paramatru β váženou metodou nejmenších čtverců 2.3.3 Zúžený regresní model . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . . . . . . . . . . . . .
. . . . .
. . . . . . . . . . . . . . . .
. . . . .
. . . . . . . . . . . . . . . .
. . . . .
. . . . . . . . . . . . . . . .
3 Instrumentální proměnné 43 3.1 Teoretická část . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 9
OBSAH 3.1.1 Odhad parametrů β pomocí instrumentálních proměnných 3.1.2 Určení instrumentálních proměnných . . . . . . . . . . . . 3.1.3 Hausmanův test . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Prodej bytů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Odhad parametrů β pomocí instrumentálních proměnných 3.3 Pronájem bytů . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Odhad parametrů β pomocí instrumentálních proměnných 4 Modely binární volby 4.1 Teoretická část . . . . . . . . . . . . . . . . . . . . . 4.1.1 Modely binární volby . . . . . . . . . . . . . . 4.1.2 Odhad parametrů β v modelech binární volby 4.2 Prodej bytů . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Modely pro závisle proměnnou Balkon . . . . 4.2.2 Modely pro závisle proměnnou Terasa . . . . . 4.2.3 Modely pro závisle proměnnou Lodžie . . . . . 4.2.4 Modely pro závisle proměnnou Sklep . . . . . 4.3 Pronájem bytů . . . . . . . . . . . . . . . . . . . . . 4.3.1 Modely pro závisle proměnnou Balkon . . . . 4.3.2 Modely pro závisle proměnnou Terasa . . . . . 4.3.3 Modely pro závisle proměnnou Lodžie . . . . . 4.3.4 Modely pro závisle proměnnou Sklep . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . .
. . . . . . . . . . . . .
. . . . . . .
. . . . . . . . . . . . .
. . . . . . .
. . . . . . . . . . . . .
. . . . . . .
. . . . . . . . . . . . .
. . . . . . .
44 44 45 46 46 49 49
. . . . . . . . . . . . .
53 53 53 55 56 56 58 59 60 61 61 62 62 63
Závěr
65
Literatura
68
Seznam obrázků
71
Seznam tabulek
74
Přílohy
i
10
ÚVOD
Úvod V našem životě existuje série událostí, které dříve či později potkají prakticky každého. Hledání práce, založení rodiny, hledání vhodného bydlení, zabezpečení budoucnosti. A bez nejmenších pochyb můžeme říct, že jsou tyto události spojeny s ekonomickou stránkou našeho života, ať už s náklady či příjmy, a to ne zrovna malou měrou. Trhu práce či penzijnímu připojištění a jiným formám zabezpečení naší budoucnosti je obecně věnována velká pozornost. Jsou to problémy, které s námi souvisí tak říkajíc přímo. Hledání vhodného místa k životu je problém s poněkud širším záběrem. Je nutné se rozhodnout, zda bydlet v pronájmu nebo si koupit vlastní byt či rodinný dům, jak bydlení financovat, kolik pokojů z dlouhodobého hlediska budeme využívat, zda nám vyhovuje spíše kuchyně nebo kuchyňský kout, zda chceme garáž nebo sklep, . . . Dříve či později najdeme odpovědi na všechny tyto otázky. Poté nás čeká další úkol, a to hledání vhodné realitní kanceláře, která nám zprostředkuje pronájem či koupi našeho vysněného bydlení. Pro běžného občana tu ale vyvstávají zcela nové a zásadní otázky. Není daná cena bytu nadhodnocená? Jaká by měla být skutečná cena bytu? Jak se naše požadavky promítají do výsledné ceny bytu? V této diplomové práci se zaměříme na bytový fond, konkrétně tedy na nekomerční prostory, byty. Snahou je vytvořit regresní model bytového fondu, který bude schopen na základě dat získaných z jedné z realitních kanceláří za roky 2007 až 2009 určit cenu bytu, popř. cenu pronájmu bytu v daném období. Podobné analýzy se v České republice nevyskytují v takové míře, v jaké bychom při důležitosti daného tématu čekali. Tento nedostatek má hned několik důvodů. Za nejdůležitější můžeme považovat vysokou proměnlivost trhu s nemovitostmi, která způsobuje menší míru využití pro daný model v delším časovém úseku. Trh s nemovitostmi v České republice představuje vysoce konkurenční prostředí. Provozování realitní kanceláře není vázaná živnost, proto na trhu působí vysoký počet kanceláří. Sběr dat v takto vysoce konkurenčním prostředí je poněkud problematický. Můžeme sledovat ceny v inzertním tisku a na webu, ale skutečná cena se oproti nabízené může velmi lišit. Přesně můžeme postihnout pouze developerské projekty, a to pouze z hlediska výstavby, nikoli prodeje bytů. V době psaní této diplomové práce se svět stále vyrovnává s důsledky finanční krize. 11
ÚVOD Krize trh s nemovistostmi těžce zasáhla, globálně i lokálně můžeme sledovat trend poklesu cen. Důsledky můžeme pozorovat i přímo na bytové výstavbě. Pokud se podíváme na analýzy vytvářené Českým statistickým úřadem [11], zjistíme, že v roce 2007 byla výstavba bytových domů na vrcholu1 , v dalším roce už byl ale zaznamenán mírný pokles. V roce 2009 došlo k razantnímu poklesu zahájené výstavby bytů o 20%. Z tohoto důvodu jsou data využívaná v této diplomové práci odrazem značných proměn trhu s nemovitostmi. Kromě poklesu výstavby nových bytových domů došlo k poklesu objemu prodeje bytů. Negativní vliv na tyto události má i trend v poskytování služeb finančních institucí, které v obavě z dopadů finanční krize zpřísnily pravidla pro poskytování hypoték, čímž došlo k omezení jejich poskytování a tím i k omezení finančních zdrojů pro potenciální kupce. Všechny tyto faktory ovlivní i vytvořený regresní model. Pro tuto práci byla data o prodeji a pronájmu bytů poskytnuta realitní společností Gaute, a. s. Společnost existuje již od roku 1996 a je jednou z předních realitních kanceláří na trhu s nemovitostmi v České republice. Společnost Gaute, a. s., mi umožnila přístup do aplikace Intrapoint2 shormažďující informace o zrealizovaných zakázkách i právě nabízených nemovitostech. Ze zrealizovaných zakázek bylo vybráno 318 prodejů a 97 pronájmů bytů v Jihomoravském kraji, na kterých bude tato analýza založena. První kapitola této diplomové práce se věnuje stručné historii společnosti Gaute, a. s., a jejím obchodním aktivitám. Dále je popsána funkce aplikace Intrapoint, její možnosti využití a úskalí této aplikace. Zároveň se čtenář seznámí s provedenou úpravou dat nutnou pro zařazení jednotlivých proměnných do regresního modelu. Krátce je představen i program Gretl, ve kterém byly provedeny výpočty nutné pro tuto analýzu. Druhá kapitola této diplomové práce se věnuje nejjednodušší formě regresního modelu, tj. lineárnímu regresnímu modelu, a jeho odhadu za pomoci metody nejmenších čtverců. Tato kapitola je rozdělena na dvě části. První část se věnuje prodeji bytů, druhá pak pronájmu bytů. Obě části mají stejnou strukturu, věnujeme se tedy odhadu parametrů modelu, korelacím, testům heteroskedasticity, atd. Třetí kapitola se věnuje odhadu parametrů zkoumaného modelu pomocí instrumentálních proměnných. Zde využijeme dvoustupňovou metodu nejmenších čtverců a metodu maximální věrohodnosti s omezenou informací. Opět je kapitola rozdělena na dvě části, první část je věnována prodeji bytů, druhá pronájmu bytů. V další, v pořadí čtvrté, kapitole se blíže seznámíme s Logit modelem a Probit modelem a s jejich možným využitím při analýze bytového fondu. Na rozdíl od předchozích kapitol zde nebudeme zkoumat cenu a její případné změny závislé na ostatních proměnných, ale budeme hledat pravděpodobnost toho, zda se v bytě určité typy vybavení nacházejí či 1 2
V tomto roce se postavilo nejvíce bytů od roku 1993. Aplikace Intrapoint bude popsána blíže v Kapitole 1.
12
ÚVOD nikoli. V Závěru jsou shrnuty dílčí výsledky jednotlivých kapitol. Prostor je dále věnován srovnání jednotlivých metod a návrhům na možné rozšíření. Pro bližší seznámení s problematikou jsou k této diplomové práci přiloženy přílohy obsahující tabulky s výsledky jednotlivých odhadů.
13
ÚVOD
14
KAPITOLA 1. METODIKA PRÁCE
Kapitola 1 Metodika práce Při analýze bytového fondu je vždy nutné začít u samotných dat. Ta byla poskytnuta realitní společností Gaute, a. s.
1.1
Realitní společnost Gaute, a. s.
Společnost Gaute, a. s., vznikla v Brně v roce 1996 jako realitní společnost. V roce 1998 byla zapsána v obchodním rejstříku jako akciová společnost. Následně se Gaute, a. s., stala v roce 2004 franšízovým partnerem Realitní společnosti České spořitelny pro Jižní Moravu. Společnost se zabývá zprostředkováním prodeje, nákupu či pronájmu v oblasti nemovitostí. V tomto okamžiku nabízí služby i v oblasti dražeb a výběrových řízení. Kromě klasických objektů, jako jsou rodinné domy, byty nebo bytové domy, věnuje společnost Gaute, a. s., pozornost i nebytovým prostorům (tj. kaceláře, obchodní prostory, garáže), dále pak pozemkům, zemědělským objektům, historickým budovám a rekreačním zařízením. Mezi další, okrajové aktivity společnosti patří obchod s pohledávkami, dluhopisy a cennými papíry. Právě kvůli širokému záběru činností realitní kanceláře Gaute, a. s., bylo založeno několik samostatných společností, které se nyní specializují na jednotlivé segmenty trhu. Patří mezi ně Gaute Corp. věnující se průmyslovým objektům ve vlastní správě, Gaute Investment zaměřená na developerské projekty, Gaute Centrum, obchodní a administrativní centrum, RealitkaCS zdůrazňující partnerství Gaute, a. s., a Realitní společnosti České spořitelny a Naxos Brno Aukční síň, která provádí dražby a výběrová řízení v rámci celé České republiky. V rámci spolupráce s Realitní společností České spořitelny přešla společnost Gaute, a. s., k využívání internetové aplikace Intrapoint, která umožňuje jednoduché vkládání dat a jejich úpravu. Nespornou výhodou daného systému je právě fakt, že k aplikaci je možný přístup odkudkoli, kde je k dispozici připojení k internetu. Jde tedy o krok zkvalitňující, 15
KAPITOLA 1. METODIKA PRÁCE resp. zrychlující práci realitních makléřů. Další výhodou je pak jednotnost dat.
1.2 1.2.1
Zpracování dat Aplikace Intrapoint
Intrapoint je internetová aplikace umožňující přístup k datům o nákupu či prodeji. Jedná se o aplikaci Realitní společnosti České spořitelny, danou aplikaci tedy využívají i franšízové společnosti (Gaute, a. s., Relia s. r. o., . . . ). Data jsou jednotná a lze se v nich snadno orientovat. Náhled na aplikaci Intrapoint je zobrazen na obrázku 1.1 a 1.2.
Obrázek 1.1: Aplikace Intrapoint, stručný náhled na nabídku bytu
Obrázek 1.2: Aplikace Intrapoint, podrobný náhled na nabídku bytu Aplikace samotná má mnoho skupin a podskupin, co se týče vybavení, dostupnosti služeb, podlahové plochy a jiných. U každé zakázky můžeme zjistit typ nemovistosti, její stav, umístění, počet podlaží, podlahovou plochu, způsob vytápění, vybavení, celé znění inzerátu, atd. Intrapoint tak umožňuje získat komplexní přehled o nabízených nemovitostech. 16
KAPITOLA 1. METODIKA PRÁCE Aplikace je informačně velmi obsažná, má však dvě slabá místa. Prvním je neexistence možnosti exportu dat, data nelze z aplikace hromadně převést do běžně využívaných datových formátů (např. tabulkový program MS Excel). Tím druhým je pak lidský faktor, tedy samotný realitní makléř, který může nedopatřením snadno udělat chybu. Např. nemusí do této aplikace zapsat všechna relevantní data. Některé byty tak mohou mít neúplné údaje, ať už se jedná o maličkosti, např. velikost balkonu, nebo podstatné faktory jako je způsob vytápění.
1.2.2
Úprava dat
Na základě dostupných údajů realitní společnosti Gaute, a. s., byla použita data o prodeji a pronájmu bytů na území Jihomoravského kraje za roky 2007 až 2009 včetně. Pro prodej bytů bylo poskytnuto 318 zrealizovaných zakázek, pro pronájem bytů pak 97 zrealizovaných zakázek pro dané období. Výsledky této analýzy budou značně záviset na samotném složení dat. Přesněji řečeno, velká část dat týkajících se prodeje bytů vychází z developerských projektů nacházejících se spíše v okrajových částech Brna, popř. v okrese Brno-venkov. Stejně tak úzký časový rámec, který je v této diplomové práci analyzován, podporuje teorii, že data o pronájmech bytů jsou zkreslená v tom smyslu, že spíše nepostihují dlouhodobé pronájmy. Předpokládáme tedy, že u pronájmů bytů se ve většině případů jedná o krátkodobý pronájem, kdy nájemníky jsou např. studenti, přátelé, atd. Pro regresní analýzu bytového fondu byla zvolena kritéria cena bytu, Podlahová plocha bytu, Počet pokojů v bytě, Typ vlastnictví, Typ zdiva, Celkový stav bytu, přítomnost Balkonu, Terasy, Lodžie nebo Sklepu, možnost parkování v garáži či před domem, Umístění bytu v domě (tj. podlaží), Dostupnost městské hromadné dopravy a celkové Vybavení bytu, přičemž většina z nich bude v modelu figurovat jako umělá proměnná. Tato kritéria byla zvolena kvůli jejich relevanci vůči této analýze. Mohli bychom je doplnit o způsob vytápění bytu nebo dispozice koupelny (tj. zda je společná s WC nebo je zvlášť), ale tato data nejsou v aplikaci Intrapoint dostupná v dostatečné míře pro tuto analýzu. Vzhledem k tomu, že tato diplomová práce se věnuje pouze prodeji a pronájmu bytů, můžeme zanedbat velikost pozemku (resp. zahrady), počet podlaží apod. Navíc omezením analýzy pouze na byty je možné použít stejná kritéria, byť se jejich hodnoty budou drobně lišit. Cena bytu Cena bytu je v dalších dvou kapitolách zvolena jako závisle proměnná. Její hodnota je objektivní, jelikož je to cena, za kterou byl daný byt ve skutečnosti prodán nebo pronajat. 17
KAPITOLA 1. METODIKA PRÁCE V mnoha případech se tedy nejedná o cenu, za kterou byl daný byt nabízen, ale o cenu nižší, která vznikla postupným vyjednáváním s realitní kanceláří. Podlahová plocha bytu Narozdíl od ceny Podlahová plocha bytu není jednoznačně vymezená veličina. Opět narážíme na problém zmíněný výše. Při zadávání dat do aplikace Intrapoint se zadává podlahová plocha a dále velikost balkonu, terasy, lodžie a sklepu. Někteří realitní makléři však zadávají jen celkovou plochu a je proto obtížné určit, jaká je ve skutečnosti velikost bytu samotného. Proto využíváme velikost bytu, kterou aplikace Intrapoint považuje za skutečnou. Počet pokojů v bytě Je zbytečné do modelu zahrnovat kuchyň či kuchyňský kout, neboť ty se nachází v každém bytě. Proto počítáme pouze počet pokojů. Můžeme narazit na problém, jak vyčíslit počet pokojů v bytech, kde je místo kuchyně kuchyňský kout. Ten je samozřejmě v každém bytě jiný, resp. má jinou velikost. Proto byl zvolen společný koeficient 0, 5, který od počtu pokojů v bytě odečítáme. Hodnoty kritéria Počet pokojů v bytě tedy vypadají následovně: Podtyp bytu 1+kk 1+1 2+kk 2+1 3+kk 3+1 4+kk 4+1 5+kk 5+1
Hodnota 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
Tabulka 1.1: Počet pokojů v bytě
Typ vlastnictví Vlastnictví bytu se dá rozdělit do tří kategorií. Jedná se buď o osobní vlastnictví, družstevní vlastnictví nebo o nájemní byt. Druh vlastnictví ohodnotíme stupni 1, 2 a 3 tak, že 18
KAPITOLA 1. METODIKA PRÁCE pro kupce nejlepší možnost bude ohodnocena nejvyšším stupněm. Tento postup využijeme i u dalších kritérií. Hodnoty kritéria Typ vlastnictví vypadají takto: Typ vlastnictví nájemní družstevní osobní
Hodnota 1 2 3
Tabulka 1.2: Typ vlastnictví
Typ zdiva Každý dům je postaven buď z cihel nebo z panelu. Toto kritérium ohodnotíme stupni 1 nebo 2 následujícím způsobem: Typ zdiva panel cihla
Hodnota 1 2
Tabulka 1.3: Typ zdiva
Celkový stav bytu Tento parametr mohou realitní makléři ohodnotit hned čtyřmi stupni, a to dobrý, po rekonstrukci, velmi dobrý a novostavba. Toto kritérium ale není zcela objektivní, neboť záleží na profesionálním úsudku makléře, jak daný byt ohodnotí. Hodnocení tohoto kritéria vypadá následovně: Celkový stav dobrý po rekonstrukci velmi dobrý novostavba
Hodnota 1 2 3 4
Tabulka 1.4: Celkový stav bytu
19
KAPITOLA 1. METODIKA PRÁCE Balkon, Terasa, Lodžie, Sklep Kritéria Balkon, Terasa, Lodžie a Sklep jsou ohodnocena buď 0 nebo 1 podle toho, zda k bytu náleží či ne. Toto zjednodušení je způsobené opět nedostatkem dat. Vzhledem k tomu, že u většiny prodejů či nájmů není velikost těchto kritérií určena, musíme se omezit na existenci a neexistenci balkonů atd. Hodnocení tedy vypadá takto: Balkon, Terasa, Lodžie, Sklep nenáleží k bytu náleží k bytu
Hodnota 0 1
Tabulka 1.5: Balkon, Terasa, Lodžie, Sklep
Parkování Parkovat lze buď v garáži nebo na parkovacím místě před bytovým domem. Opět tato skutečnost není v datech vždy jednoznačně uvedena, proto předpokládáme, že pokud není uvedeno jinak, garáž, resp. parkovací místo není majiteli/nájemci bytu k dispozici. Hodnocení parkování vypadá stejně jako v předchozím případě, tedy: Garáž, Parkovací místo nenáleží k bytu náleží k bytu
Hodnota 0 1
Tabulka 1.6: Parkování
Umístění bytu v domě Umístěním bytu v domě se rozumí patro, ve kterém se byt nachází. Zde jsou hodnoty tohoto kritéria zcela zřejmé. Upřesníme jen, že přízemí je dáno hodnotou 0, zvýšené přízemí hodnotou 0,5 a snížené přízemí hodnotou −0,5. Dostupnost městské hromadné dopravy Jedním z obvyklých kritérií při hledání bytu je i dostupnost městské hromadné dopravy. V tomto případě tomu nebude jinak. 20
KAPITOLA 1. METODIKA PRÁCE Vzhledem k ochraně osobních údajů lze v aplikaci Intrapoint vyčíst město a ulici, kde se daný byt nachází, přesnější umístění tam však najít nelze. Z tohoto důvodu bylo toto kritérium určeno následujícím způsobem: a) každé ulici byla přiřazena průměrná vzdálenost od nejbližší zastávky městské hromadné dopravy, ať už od tramvaje, autobusu či trolejbusu, v případě mimobrněnských bytů pak vzdálenost od vlakového nádraží, b) daná vzdálenost byla přepočítána na čas nutný pro její zdolání; pro výpočet posloužila průměrná rychlost chůze 4 km/h, c) tento čas byl opět ohodnocen dle následující tabulky:
Dostupnost městské hromadné dopravy 20 a více minut 10 − 20 minut 5 − 10 minut 0 − 5 minut
Hodnota 1 2 3 4
Tabulka 1.7: Dostupnost městské hromadné dopravy
Vybavení bytu Vybavení bytu je všeobecné označení pro vše, co k bytu náleží. Tím je myšleno např. zateplení, plastová okna, kuchyňská linka, spotřebiče, . . . Každý takový ”bonus” náležející k bytu má hodnotu 1. Nerozlišujeme tedy, zda je v bytě jeden spotřebič nebo spotřebičů více apod., jelikož dané informace k dispozici nejsou. Hodnota tohoto kritéria je pak tvořena součtem všech bonusů. Je nutné doplnit, že u starších bytů je zdůrazňována výměna oken za plastová nebo zateplení, což je u novostaveb samozřejmostí. Proto každá novostavba automaticky získává 2 bonusy k hodnotě Vybavení bytu. Dále předpoládáme, že když jsou v bytě spotřebiče, musí zde být i kuchyňská linka (nikoli opačně). Toto je jediné kritérium, které se u prodeje a nájmu bytů liší. Je to právě kvůli kuchyňským linkám. Při nájmu bytu není uvedeno, zda se jedná o novou či starší kuchyňskou linku, proto je ohodnocena v obou případech 1. U prodeje bytu tato skutečnost uvedena je, proto rozlišujeme novou kuchyňskou linku (resp. nové spotřebiče) hodnotou 1 a starší kuchyňskou linku (resp. starší spotřebiče) hodnotou 0,5. 21
KAPITOLA 1. METODIKA PRÁCE Dalším rozdílem je zařízení bytu, tj. nábytek, který náleží k bytu. U prodeje bytu je to velmi neobvyklé, zatímco u nájmu bytu běžné. Zařízení bytu je opět ohodnoceno hodnotou 1.
1.2.3
Výpočtový program Gretl
Veškeré výpočty pro tuto diplomovou práci byly provedeny pomocí programu Gretl.
Obrázek 1.3: Gretl, náhled na nabídku odhadových metod Gretl je software určený pro ekonometrickou analýzu. Možnosti jeho využití jsou velmi široké. Nabízí totiž mnoho odhadových metod - metoda nejmenších čtverců, vážená metoda nejmenších čtverců, metoda maximální věrohodnosti s omezenou nebo úplnou informací a další. Samozřejmostí jsou také testy heteroskedasticity, multikolinearity, normality reziduí, atd. Nabízí také široké možnosti grafického zpracování výsledků. Kromě těchto výpočetních záležitostí má Gretl jednu nepopiratelnou výhodu, a tou je přímé zpracování dat do jazyka LATEX.
22
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ
Kapitola 2 Metoda nejmenších čtverců V této kapitole vytvoříme jednoduchý model, který budeme odhadovat pomocí metody nejmenších čtverců3 .
2.1 2.1.1
Teoretická část Lineární regresní model
Mějme lineární regresní model ve tvaru y = Xβ + ε, resp. yt =
k X
Xtj βj + εt ,
j=1
kde y je vektor pozorování závisle proměnné o rozměrech [T × 1], v našem případě tedy prodejní cena bytu, X je matice pozorování k nezávisle proměnných neboli matice plánu o rozměrech [T × k], β je vektor regresních koeficientů o rozměrech [k × 1] a ε je vektor náhodných složek modelu o rozměrech [T ×1], přičemž t ∈ {1, 2, . . . , T }. Předpokládáme, že model splňuje podmínku k < T . Proměnné lineárního regresního modelu splňují následující vlastnosti: a) náhodné složky musí být centrované, platí tedy, že E(ε) = 0, 3
Teorie k lineárnímu regresnímu modelu patří k základům ekonometrie a pokrývá ji veškerá literatura vztahující se k této problematice.
23
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ b) kovarianční matice náhodných složek je diagonální, tj. D(ε) = σ 2 IT , náhodné složky jsou tedy homoskedastické a nekorelované, c) náhodné složky nekorelují s nezávisle proměnnými, tedy E(X ′ ε) = 0, d) matice plánu musí mít plnou hodnost, tzn. h(X) = k.
2.1.2
Odhad parametrů β metodou nejmenších čtverců
Při splnění předchozích předpokladů lineárního regresního modelu můžeme parametry tohoto modelu odhadnout pomocí metody nejmenších čtverců. Obecně pro odhady parametrů v lineárním regresním modelu platí následující vztahy: ˆ X), a) b = β(y, b) yˆ = Xb, c) e = εˆ = y − yˆ. Jednou z odhadových metod v lineárním regresním modelu je metoda nejmenších čtverců. Minimalizačním kritériem u této metody je součet čtverců reziduí, min(e′ e) = min(y − Xb)′ (y − Xb). Samotný odhad parametrů β má pak tvar βˆOLS = (X ′ X)−1 X ′ y a platí pro něj, že βˆOLS je nestranný, konzistentní, lineární a nejlepší ve smyslu nejmenší kovarianční matice. Tyto vlastnosti shrnuje následující věta. Věta 2.1 (Gauss-Markovova). Odhad regresních koeficientů βˆOLS pořízený metodou nejmenších čtverců je nejlepším nestranným lineárním odhadem vektoru parametrů β. Důkaz. viz Dhrymes [4], s. 204 24
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ
2.1.3
Kontingenční tabulky
Kontingenční tabulky jsou tabulky o rozměrech m × n, kde m, n ∈ {1, 2, . . . } a m je počet realizací první proměnné a n je počet realizací druhé proměnné, vyjadřují absolutní (resp. relativní) četnosti daného jevu mezi dvěma nezávisle proměnnými. Přesněji řečeno, ukazují vzájemný vztah dvou nezávisle proměnných skrze absolutní (resp. relativní) četnost realizací těchto nezávisle proměnných. V případě, že některá z hodnot nezávisle proměnné je vzácná, pak je možné některé hodnoty sloučit do jedné.
2.1.4
Korelační matice
Korelační matice nám udává korelace mezi jednotlivými nezávisle proměnnými. Tato matice má následující vlastnosti: a) Na diagonále korelační matice jsou samé jedničky. To je dáno definicí, na diagonále se ukazuje korelace nezávisle proměnné samé se sebou. b) Korelační matice je symetrická, tj. korelace mezi nezávisle proměnnými x1 a x2 je stejná jako korelace mezi x2 a x1 atd. Pokud se tedy podíváme např. na první řádek korelační matice, uvidíme párové korelační koeficienty mezi nezávisle proměnnou x1 a ostatními nezávisle proměnnými. Ke korelační matici se váže problém multikolinearity. Multikolinearita nastává, pokud jsou některé nezávisle proměnné na sobě silně závislé. Tím by nebyl splněn požadavek na maximální hodnost matice plánu v lineárním regresním modelu.
2.1.5
Koeficient determinace
Koeficient determinace, označovaný R2 , se používá k vyjádření míry shody testovaného modelu s analyzovanými daty. Můžeme jej vyjádřit pomocí vztahu R2 = 1 −
yˆ′yˆ e′ e . = y ′y y ′ y − nY¯ 2
Hodnota koeficientu determinace se pohybuje v intervalu < 0, 1 >, přičemž nulové hodnoty koeficient nabývá v případě, kdy vybrané nezávisle proměnné nevystihují nic z variability závisle proměnné. Druhým extrémem je pak úplné vysvětlení celkového součtu čtverců. Nicméně samotný koeficient determinace je ovlivněn počtem nezávisle proměnných, proto by nám přidání další vysvětlující proměnné zkreslilo srovnání jednotlivých modelů. 25
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Z toho důvodu se spíše používá korigovaný koeficient determinace, ve kterém je tento problém zohledněn. Ten má tvar ¯ 2 = R2 − k − 1 (1 − R2 ) = 1 − (1 − R2 ) n − 1 . R n−k n−k
2.1.6
RESET test
Ramseyho specifikační RESET test4 je obecným testem správnosti specifikace modelové rovnice. Mějme výchozí lineární regresní rovnici ve tvaru y t = λ 1 + λ 2 Xt + ε t , kde X je matice plánu o rozměrech [T × k] . P P I když jsou výrazy Tt=1 et a Tt=1 et yˆt nulové, střední hodnota se systematicky zvyšováním yˆt mění. Tento úkaz by dával podnět k tomu, že pokud zavedeme yˆt do regresní rovnice jako nezávisle proměnnou, mělo by dojít ke zvýšení koeficientu determinace R2 . Kdyby toto zvýšení koeficientu determinace bylo statisticky významné, vedlo by nás to k tezi, že lineární funkce je chybně specifikovaná. RESET test sestává z následujících kroků: a) Kvantifikování výchozí regresní rovnice, ze které získáme vektor vyrovnaných hodnot závisle proměnné yˆt . b) Výpočet původní regresní rovnice, do které je vložena nová nezávisle proměnná yˆt . Samozřejmě, že yˆt do regresní rovnice s ohledem na přesnou multikolinearitu vložit nelze, nicméně můžeme využít různých mocnin yˆt (v Gretlu využíváme možnost druhých a třetích mocnin). Upravená regresní rovnice má tvar yt = β1 + β2 Xt + β3 yˆt 2 + β4 yˆt 3 + νt . 2 c) Koeficient determinace z této upravené regrese označíme Rnew . Poté vypočteme hodnotu F -statistiky vyjádřené jako 2 (Rnew − R2 )/qr , 2 )(T − k (1 − Rnew new )
kde qr je počet nově přidaných nezávisle proměnných, T je délka datového vzorku a knew je celkový počet parametrů v rozšířeném modelu. F -statistika nám určí, zda je přírůstek koeficientu determinace statisticky významný. 4
Ramsey, J. B.: Tests for specification errors in classical linear least squares regression analysis. Journal of the Royal Statistical Society, series B, Vol. 31/1969, s. 350-371.
26
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ d) V případě, že je F -statistika statisticky významná, pak můžeme říct, že výchozí model je na dané hladině významnosti chybně specifikovaný.
2.1.7
Testy heteroskedasticity
Heteroskedasticita je problém týkající se kovarianční matice vektoru náhodných složek εt v jednorovnicovém ekonometrickém modelu. Konkrétně se tento problém týká prvků kovarianční matice na její diagonále. Existuje tu rozpor s homoskedasticitou požadovanou v předpokladech lineárního regresního modelu, kdy rozptyl náhodných složek má být konečný a konstantní. K tomu dochází často u tzv. průřezových dat, kdy se hodnoty vysvětlujících proměnných mění ve velké míře. Tento jev má důsledky na vlastnosti odhadu metodou nejmenších čtverců. Odhad je sice stále nestranný, ale ztrácí jinou vlastnost, a to vydatnost odhadu. V našem případě budeme heteroskedasticitu zkoumat pomocí Whiteova a BreuschPaganova testu. Whiteův test Whiteův test je obecným testem heteroskedasticity založený na principu Lagrangeových multiplikátorů, u kterého nemusíme pracovat s žádnými speciálními předpoklady o tvaru heteroskedasticity. Lze jej použít tam, kde nelze předem určit, která z nezávisle proměnných ovlivňuje změny rozptylu náhodné složky modelu5 . Mějme tradiční odhad !−1 T X σˆ2 = (T − k)−1 e2t . t=1
Pokud v modelu není heteroskedasticita, tento vzorec nám dá σ 2 . V opačném případě se odhad bude lišit. Whiteův test je založen na počtu pozorování, pro správnou indikaci heteroskedasticity je nutné, aby počet pozorování byl vyšší než 30. Použití testu je možné i přes drobné odchylky od normálního rozdělení. Jednoduchá verze tohoto testu se provádí regresí e2i na konstantu a všechny první momenty, druhé momenty a křížové součiny původních nezávislých proměnných. Test má asymptotické χ2 -rozdělení s q stupni volnosti, kde q je počet nezávisle proměnných v pomocné regresi, tedy k(k + 1) − 1. q= 2 5
Obecně je v takovém případě vhodné použít testy založené na Lagrangeově multiplikátoru jako jsou Whiteův test a Breusch-Paganův test.
27
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Vlastní testování pak probíhá na hladině významnosti α = 0, 05, kdy porovnáváme kritickou hodnotu χ2crit (q) a spočtenou testovací statistiku nRe2 , přičemž pro χ2crit (q) > nRe2 platí nulová hypotéza o homoskedasticitě. Whiteův test je obdobou Breusch-Paganova testu (viz dále), který taktéž zahrnuje pomocnou regresi čtverců reziduí vyjma jakýchkoli vyšších řádů. Následkem toho může Whiteův test nalézt více obecných forem heteroskedasticity než Breusch-Paganův test. Ve skutečnosti je Whiteův test velmi obecný, což je i jeho nedostatek. Whiteův test může odhalit heteroskedasticitu, ale stejně tak může identifikovat nějaké další chyby specifikace (např. nesprávný tvar funkce) nebo korelaci mezi X a e. Breusch-Paganův test Breusch-Paganův test je méně specifický a taktéž méně obecný test založený na principu Lagrangeových multiplikátorů. Jeho předností oproti Whiteovu testu je značná jednoduchost, na druhou stranu ale vyžaduje normalitu náhodných složek lineárního regresního modelu. Předpokládejme heteroskedasticitu v podobě σi2 = h(zi′ α), kde zi′ je vektor pozorování p proměnných obsahujících některé z nezávislých proměnných testovaného modelu nebo jejich funkce, α je vektor neznámých koeficientů a h je neznámá, spojitě diferencovatelná funkce, která nezávisí na i, taková, že h(.) > 0 a h(0) = 1. Testujeme hypotézu H0 : α = 0 H1 : α 6= 0, přičemž nulová hypotéza potvrdí homoskedasticitu. Breusch-Paganův test spočívá v odhadu lineárního regresního modelu metodou nejmenších čtverců a spočtením reziduí ei , následným odhadem pomocné regrese čtverců reziduí e2i na zi metodou nejmenších čtverců a vyčíslením testovací statistiky nRe2 . Testová statistika nRe2 má pro nulovou hypotézu asymptotické χ2 -rozdělení s (p − 1) stupni volnosti. Pro zamítnutí nulové hypotézy tedy opět platí χ2crit (p − 1) < nRe2 .
2.2
Prodej bytů
Zkoumání vztahů mezi jednotlivými nezávisle proměnnými začneme u kontingenčních tabulek a korelační matice. Výsledné vztahy odvozené z kontingenčních tabulek a korelační 28
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ matice jsou společné všem odhadům, proto se tato část v dalších kapitolách nebude opakovat. Poté bude následovat samotný odhad parametrů β metodou nejmenších čtverců. Kontingenční tabulky V Příloze A, tabulka A.1, se nacházejí kontingenční tabulky příslušné datovému souboru. Opět se podíváme, které nezávisle proměnné spolu nějakým způsobem souvisí, popř. zda nám kontingenční tabulky odhalí nějaký vztah přímo mezi danými hodnotami nezávisle proměnných. Začněme Počtem pokojů v bytě. V první tabulce vidíme Počet pokojů v bytě v závislosti na Typu vlastnictví. Lze vyčíst, že většina čtyřpokojových bytů je v družstevním vlastnictví, což jsou převážně panelové bytové domy. Dále si můžeme všimnout, že byty s kuchyňským koutem jsou doménou osobního vlastnictví, což je odrazem současného trendu. Po prolistování realitních novin narazíte na mnoho bytů v osobním vlastnictví (speciálně pak u novostaveb), kde je tato varianta kuchyně zvolena pro větší prostornost a propojenost kuchyně se zbylou částí bytu. U srovnání Počtu pokojů v bytě a Typu zdiva narazíme na stejný trend. Byty s kuchyňským koutem jsou téměř výhradně u osobního vlastnictví, potažmo novostaveb, budou tedy spíše v cihlových bytových domech. Tento fakt nám shrnuje další tabulka, která poukazuje na souvislost mezi Typem vlastnictvím a Typem zdiva. Nepřekvapí nás zřejmě ani výsledek tabulky zkoumající vztah mezi Typem vlastnictví a Celkovým stavem bytu. Z tabulky totiž vyplývá, že přes 80% bytů v osobním vlastnictví jsou novostavby. Zároveň tabulka naznačuje, že většina družstevních bytů je ve velmi dobrém stavu. Na to zde poukazujeme kvůli další tabulce zobrazující vztah mezi Typem zdiva a Celkovým stavem bytu, která byty ve velmi dobrém stavu dává do vztahu s panelovým zdivem a novostavby pak s cihlou. Stav bytů v panelových domech je pokládán převážně za velmi dobrý. Několik dalších tabulek sledujících souvislosti spojené s Balkonem naznačuje, že balkony se nacházejí ve větší míře v cihlových domech, tedy i v osobním vlastnictví. Podobný výsledek, jen v menším zastoupení v datovém souboru, naznačují další tabulky spojené s Terasou. Oproti tomu tabulky věnující se Lodžii ukazují, že Lodžie se téměř výhradně vyskytují u bytů v panelových domech. Další tabulky se věnují Sklepu. Pokud se podíváme na souvislost mezi Sklepem a Lodžií, zjístíme, že velmi pravděpodobně se obě položky vyskytují pohromadě nebo k bytu nenáleží ani jedna z nich. Další tabulky přejdeme bez komentáře. Nenaznačují žádné přímé vztahy, příp. kvůli četnosti dané proměnné je sporné o nějakém vztahu mezi proměnnými mluvit. 29
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Korelační matice Pokusme se nyní odhalit vzájemný vztah, ať už pozitivní či negativní, jednotlivých nezávisle proměnných. Náhlednutím do korelační matice regresního modelu (viz Příloha A, tabulka A.2) uvidíme hned v druhém sloupci pozitivní souvislost mezi Počtem pokojů v bytě a Podlahovou plochou bytu. Tento fakt vychází opět z logiky věci, neboť větší množství pokojů znamená větší počet metrů čtverečních. Další proměnné, které spolu souvisí, ale jejichž souvislost se neprojevuje tak markantním způsobem, jsou Typ zdiva a Celkový stav bytu a dále Podlahová plocha bytu a Terasa. Spojitost mezi Typem zdiva a Celkovým stavem bytu je více méně zřejmá. Pokud vezmeme v úvahu např. novostavby, pak právě ty se staví již převážně z cihel. Oproti tomu starší bytové domy se stavěly převážně z panelu. Pokud půjdeme ještě dál do historie, dostaneme se zpět k cihlám. Vztah Podlahové plochy bytu a Terasy může být spojena i s faktem, že data jsou zadávána nejednotně. Z některých záznamů tedy nelze poznat, zda je terasa započítána do plochy bytu či ne.
2.2.1
Odhad parametrů β metodou nejmenších čtverců
Začneme odhadem parametrů β metodou nejmenších čtverců (viz tabulka 2.1). Kvalitu modelu a shodu se zkoumanými daty posoudíme dle korigovaného koeficientu determinace ¯ 2 . Dále provedeme několik testů, zda je tento lineární regresní model odhadnut korektně, R tzn. provedeme testy indikující heteroskedasticitu v lineárním regresním modelu, dále prozkoumáme, zda je v modelu multikolinearita. Pokud je model odhadnut korektně, budeme se věnovat samotným parametrům β. Je na místě upozornit, že nulové hodnoty ve sloupci p-value nejsou reálně nulové, nicméně jsou tak malé, že jejich skutečnou velikost tabulka nepostihuje. Koeficient determinace ¯ 2 = 0, 712 (viz Příloha A, tabulka Pro tento model má koeficient determinace hodnotu R A.3). RESET test Spočtená F -statistika pro lineární regresní model (viz Příloha A, tabulka A.4) nabývá hodnoty F = 8, 538, je tedy statisticky významná a daný model je chybně specifikovaný. 30
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ
const m2 Pokoj Vlastnictvi Zdivo Stav Balkon Terasa Lodzie Sklep Garaz Parking Vybaveni Patro MHD
Coefficient
Std. Error
t-ratio
p-value
−2.58197e+006 27676.4 −10187.5 679306. 81851.9 143641. 16853.9 −150141. −89600.9 594300. −162045. −27642.6 105155. 103868. −105554.
391582. 2806.81 78301.7 101901. 124621. 55338.3 80087.0 99356.4 121139. 79248.4 161752. 129075. 35612.3 19989.4 53178.7
−6.5937 9.8605 −0.1301 6.6663 0.6568 2.5957 0.2104 −1.5111 −0.7397 7.4992 −1.0018 −0.2142 2.9528 5.1961 −1.9849
0.0000 0.0000 0.8966 0.0000 0.5118 0.0099 0.8335 0.1318 0.4601 0.0000 0.3172 0.8306 0.0034 0.0000 0.0481
Tabulka 2.1: Odhad metodou OLS pro prodej bytů
Multikolinearita Jelikož pouze hodnoty vyšší než 10 (viz Příloha A, tabulka A.5) by ukazovaly na problém v tomto modelu, test multikolinearitu neprokázal.
Whiteův test Výsledky Whiteova testu (viz Příloha A, tabulka A.6) nás vedou k závěru, že nulovou hypotézu o homoskedasticitě musíme zamítnout. Whiteův test tedy poukazuje na heteroskedasticitu v modelu.
Breusch-Paganův test Stejně tak Breusch-Paganův (viz Příloha A, tabulka A.7) test vede k zamítnutí nulové hypotézy o homoskedasticitě. Nedostatkem tohoto modelu, který identifikovaly oba předchozí testy, je heteroskedasticita. Je tedy nutné aplikovat na tento model jinou metodu odhadu parametrů. Touto metodou bude vážená metoda nejmenších čtverců. 31
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ
2.2.2
Odhad parametrů β váženou metodou nejmenších čtverců
Model postižený heteroskedasticitou můžeme odhadnout váženou metodou nejmenších čtverců, která nám dává nestranné a vydatné odhady parametrů. Odhadová funkce bude mít narozdíl od klasické metody nejmenších čtverců tvar βˆW LS = (X ′ Σ−1 X)−1 X ′ Σ−1 y, kde Σ je diagonální matice, jejíž prvky jsou převrácené hodnoty původních rozptylů. Pokud neznáme rozptyly σt2 , můžeme zvolit váhy subjektivně. Na jejich volbě však závisí kvalita získaných odhadů. V tomto případě byly jako váhy zvoleny převrácené hodnoty reziduí6 v absolutní hodnotě. Odhad parametrů β váženou metodou nejmenších čtverců zobrazuje tabulka 2.2. Coefficient const m2 Pokoj Vlastnictvi Zdivo Stav Balkon Terasa Lodzie Sklep Garaz Parking Vybaveni Patro MHD
Std. Error
−2.55083e+006 158702. 26092.5 1400.69 17573.1 33553.9 680975. 44992.3 103178. 50759.7 145789. 30528.5 33781.3 35782.6 −118324. 34684.3 −62131.1 53695.6 619951. 32750.3 −228096. 99244.0 −28349.6 39576.0 94585.9 16465.4 99387.6 9807.78 −119063. 25726.5
t-ratio
p-value
−16.0731 18.6284 0.5237 15.1354 2.0327 4.7755 0.9441 −3.4114 −1.1571 18.9296 −2.2983 −0.7163 5.7445 10.1336 −4.6280
0.0000 0.0000 0.6009 0.0000 0.0430 0.0000 0.3459 0.0007 0.2481 0.0000 0.0222 0.4743 0.0000 0.0000 0.0000
Tabulka 2.2: Odhad metodou WLS pro prodej bytů Odhadem, který byl proveden pomocí vážené metody nejmenších čtverců, jsme vy¯ 2 = 0, 953, má řešili problém heteroskedasticity. Korigovaný koeficient determinace je R tedy hodnotu velmi blízkou jedné. Můžeme přistoupit k hodnocení samotného odhadu lineárního regresního modelu. 6
Rezidua byla získána z odhadu paramatru β zkoumaného modelu metodou nejmenších čtverců.
32
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Pro začátek se zaměřme na t-statistiku. Ta nám určí, která a zda vůbec nějaká z nezávisle proměnných je pro daný model statisticky významná. Jako statisticky významné7 se v modelu jeví nezávisle proměnné Podlahová plocha bytu, Typ vlastnictví, Typ zdiva, Celkový stav bytu, přítomnost Terasy, Sklepa, Garáže, stejně jako Vybavení bytu, Umístění bytu v domě a Dostupnost městské hromadné dopravy. Z těchto nezávisle proměnných budeme vycházet při vytváření druhého, zúženého modelu. Pokud se podíváme blíže, nejvíce signifikantní jsou nezávisle proměnné Podlahová plocha bytu, Typ vlastnictví, Sklep a Umístění bytu v domě. Už teď tedy můžeme odhadnout podobu zúženého modelu, kterému se ale budeme věnovat později. Nyní se zaměřme na odhad parametrů β. Začněme skupinou základních vlastností bytu. Je zřejmé, že Podlahová plocha bytu bude mít kladný vliv na cenu bytu. Jeden m2 obytné plochy je takto modelem oceněn hodnotou 26 092 Kč. Následující obrázek 2.1 ilustruje vztah mezi Podlahovou plochou bytu a cenou bytu, resp. skutečnou a predikovanou cenou bytu dle daného lineárního regresního modelu. Actual and fitted Cena versus m2 8e+006
fitted actual
7e+006 6e+006
Cena
5e+006 4e+006 3e+006 2e+006 1e+006 0 20
40
60
80
100
120
140
160
180
200
m2
Obrázek 2.1: Skutečná vs. predikovaná cena bytu ve vztahu k Podlahové ploše bytu 7
t-statistika těchto proměnných při zvolené hladině významnosti α = 0, 05 je v absolutní hodnotě větší než kritická hodnota, tedy |t| > |tcrit |.
33
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Kladný vliv na cenu8 se projevuje i u Počtu pokojů v bytě. Statistickou nevýznamnost této proměnné lze vysvětlit tak, že v dnešní době se dle nabídky na trhu bytů více staví a prodávají byty s nižším počtem pokojů, jedná se především o tzv. startovací byty vyhledávané mladými páry a rodinami. Vícepokojové byty mají spíše podobu luxusních bytů, proto je jejich počet na trhu značně omezen. Tento efekt je kompenzován výstavbou rodinných domů, u kterých je přítomnost 3 a více pokojů běžnou záležitostí. Zároveň u prostorných bytů s menším počtem pokojů jsou možné dodatečné stavební úpravy. Stejně jako Podlahová plocha bytu má kladný vliv na cenu i Umístění bytu v domě, tj. patro, ve kterém se byt nachází. Tento faktor se do ceny promítá částkou 99 387 Kč. Tato skutečnost je snadno zdůvodnitelná, neboť málo kdo je spokojen s bydlením v přízemí. Kromě hluku a většího provozu za okny je totiž nutné počítat i s bezpečnostní stránkou polohy bytu. U bytů situovaných do nižších pater je nutné počítat s větší mírou rizika než je tomu u bytů ve vyšších patrech. Jde např. o možnou hrozbu vloupání do bytu či možnost vytopení. Rovněž je nutné počítat s nepohodlím, jehož zdrojem může být např. hluk způsobený sousedy obývajícími byt o patro výše. Nyní se podívejme na další trojici nezávislých proměnných, a to na Typ vlastnictví bytu, Typ zdiva a Celkový stav bytu. Jak je uvedeno výše, vlastnictví existuje osobní, družstevní nebo nájemní. Pokud bereme v úvahu předem definovanou škálu Typu vlastnictví, pak každý posun na vyšší úroveň vlastnictví zvyšuje cenu bytu velmi výrazně, konkrétně o 680 975 Kč. Překvapivě mohou na druhou stranu působit výsledky ohledně Typu zdiva. Tento faktor se ukázal statisticky nevýznamný. Každá úroveň (tj. panel, cihla) cenu zvyšuje o 103 178 Kč. Tento výsledek je zajímavý především z toho důvodu, že bydlení v panelovém domě přináší mnohem více záporů než bydlení v cihlovém domě. Celkový stav bytu je statisticky významná nezávisle proměnná, jejíž každá úroveň navyšuje cenu o 145 789 Kč. Tento ukazatel je ale jednoznačný pouze u novostaveb, kde je snadné stav bytu posoudit. U dalších bytů je tato proměnná závislá na profesionálním odhadu makléře. Další skupinou nezávisle proměnných jsou náležitosti bytu, tedy Balkon, Terasa, Lodžie, Sklep, Garáž, Parkovací místo a Vybavení bytu. Všechny tyto proměnné (kromě Vybavení bytu) nabývají pouze hodnot 0 a 1. Pouze jejich přítomnost tedy ovlivňuje cenu. Začněme s Balkonem. Ten nepatří mezi statisticky významné ukazatele, jeho existence navýší cenu pouze o 33 781 Kč. Terasa cenu snižuje o 118 324 Kč, přítomnost Lodžie cenu opět snižuje, tentokrát o hodnotu 62 131 Kč. Sklep je statisticky významná nezávisle proměnná, která cenu bytu zvyšuje o nezane8
Tento ukazatel se neprojevuje jako statisticky významný a je tomu tak i u dopadu na cenu. Každý další pokoj zvýší cenu bytu jen 17 573 Kč.
34
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ dbatelných 619 951 Kč. Sklep je překvapivě žádaná složka bytu, pokud tak můžeme soudit z t-statistiky a přírůstku ceny. Mezi další nezávisle proměnné patří Garáž a Parkovací místo. Obě proměnné ovlivňují cenu negativně. Garáž snižuje cenu bytu o 228 096 Kč, Parkovací místo o 28 349 Kč. Parkovací místo postihuje cenu méně, můžeme tedy říct, že Parkovací místo je žádanější. Garáže jsou však spíše součástí novějších bytových domů nebo jsou umístěny zvlášť, mimo dům. Význam této proměnné je tedy sporný. Odpovídá tomu i hodnota t-statistiky. Poslední proměnnou ze skupiny náležitostí bytu je Vybavení bytu. Hodnocení této proměnné je uvedeno výše. Tato statisticky významná nezávisle proměnná zvyšuje při každém navýšení hodnoty o jeden bod cenu bytu o 94 585 Kč. To je pochopitelné, neboť v této proměnné jsou zahrnuta plastová okna, zateplení bytového domu, nová kuchyňská linka apod. Poslední nezávisle proměnnou v tomto modelu je Dostupnost městské hromadné dopravy. Tato proměnná se projevila jako statisticky významná, ale s negativním dopadem na cenu bytu, a to hodnotou 119 063 Kč. Negativní vliv na cenu bytu může být způsoben především současným trendem v bydlení. Lidé se stěhují za prací do větších měst, žádané je však bydlení v okrajových částech měst, které poskytuje dostatečný komfort, především klid a pohodlí. V těchto podmínkách převládá doprava osobními automobily. Cena bytu tak s větší dostupností městské hromadné dopravy klesá.
2.2.3
Zúžený regresní model
Vyjděme z tabulky 2.2 a vytvořme zúžený lineární regresní model ceny bytu pro prodej. Jak je napsáno výše, závisle proměnná je stále cena bytu, nezávisle proměnnými jsou Podlahová plocha bytu, Typ vlastnictví, Typ zdiva, Celkový stav bytu, Terasa, Sklep, Garáž, Vybavení bytu, Umístění bytu v domě a Dostupnost městské hromadné dopravy. Odhad parametrů β vytvoříme opět váženou metodou nejmenších čtverců, abychom se tak vyhnuli heteroskedasticitě. Při výběru vah budeme postupovat obdobně jako u lineárního regresního modelu, z nějž vycházíme. Výsledky jsou uvedeny v následující tabulce. V tomto zúženém modelu jsou již všechny nezávisle proměnné statisticky významné. Zároveň, pokud se podíváme na jednotlivé hodnoty koeficientů daných příslušným nezávisle proměnným a srovnáme je s jejich předchozími ekvivalenty, zjistíme, že šlo spíše o ”kosmetické úpravy”. 35
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Coefficient const m2 Vlastnictvi Zdivo Stav Terasa Sklep Garaz Vybaveni Patro MHD
Std. Error
t-ratio
p-value
−2.60023e+006 182937. −14.2138 0.0000 26824.9 548.349 48.9194 0.0000 689017. 52429.3 13.1418 0.0000 115218. 49549.9 2.3253 0.0207 146996. 31146.3 4.7196 0.0000 −124365. 31329.7 −3.9696 0.0001 616922. 36941.8 16.6998 0.0000 −222331. 96559.1 −2.3025 0.0220 89643.6 17964.0 4.9902 0.0000 94493.1 9391.73 10.0613 0.0000 −113704. 24727.3 −4.5983 0.0000
Tabulka 2.3: Odhad metodou WLS pro prodej bytů, zúžený model
2.3
Pronájem bytů
Nejdříve si projdeme kontingenční tabulky a korelační matici popisující vztahy mezi jednotlivými nezávisle proměnnými. Tyto výsledky budou opět společné pro všechny kapitoly. Kontingenční tabulky Příloha B, tabulka B.1, obsahuje kontingenční tabulky daného regresního modelu. První tabulka vyjadřující vztah mezi Počtem pokojů v bytě a Typem vlastnictví nám opět potvrdí, že byty s kuchyňským koutem jsou spíše doménou osobního vlastnictví. Tyto byty jsou zároveň v cihlových bytových domech. Několik následujících tabulek zcela jasně naznačuje vztah Typu zdiva a Typu vlastnictví. Další zřejmou slutečnost odhalí tabulka věnující se vztahu mezi Typem vlastnictví a Garáží. Tabulka ukazuje, že v daném datovém souboru garáž není obvyklý doplněk bytu. Stejný výsledek opět nabízí srovnání Typu zdiva a Garáže. Pokud půjdeme ještě dál, pak zjistíme, že v případě pronájmu bytů se garáže nacházejí spíše u novostaveb. Následující tabulky se věnují Dostupnosti městské hromadné dopravy. Je patrné, že dostupnost je většinou větší u bytů v osobním vlastnictví, tedy u cihlových bytových domů. V souvislosti s dostupností městské hromadné dopravy není nijak překvapující fakt, že se u bytů, které se nacházejí nejblíže městské hromadné dopravě, nevyskytuje mnoho míst k parkování. S tímto problémem ostatně bojuje každé větší město v České republice. Další tabulky přejdeme bez komentáře, neboť nenaznačují žádné přímé vztahy, pří36
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ padně kvůli četnosti dané nezávislé proměnné je sporné o nějakém vztahu mezi proměnnými mluvit. Korelační matice Korelační matice příslušející danému regresnímu modelu, kterou nalezneme v Příloze B, tabulka B.2, nám ukáže, zda některé nezávisle proměnné mezi sebou nějakým způsobem korelují. Opět, stejně jako u lineárního regresního modelu pro prodej bytů, vidíme pozitivní závislost mezi Podlahovou plochou bytu a Počtem pokojů v bytě. Můžeme konstatovat, že tento fakt je očekávatelný, neboť větší počet pokojů pravděpodobně znamená větší podlahovou plochu a naopak. Další korelace je zřejmá mezi Podlahovou plochou bytu a Terasou. I tady se může jednat pouze o chybu způsobenou nejednotným stylem zadávání Podlahové plochy bytu do systému Intrapoint.
2.3.1
Odhad parametrů β metodou nejmenších čtverců
Lineární regresní model pro cenu pronájmu bytů odhadneme metodou nejmenších čtverců. Následně spočítáme korigovaný koeficient determinace, provedeme RESET test a test multikolinearity, Whiteův a Breusch-Paganův test heteroskedasticity, které nám řeknou, zda je v modelu přítomná heteroskedasticita. Pokud tyto testy ukáží, že byl daný model odhadnut správným způsobem, přejdeme k analýze získaných výsledků. Koeficient determinace ¯ 2 = 0, 556 (viz Příloha Pro tento model má korigovaný koeficient determinace hodnotu R B, tabulka B.3). RESET test Pro lineární regresní model zkoumající závislost ceny pronájmu bytu na nezávisle proměnných má F -statistika hodnotu F = 80, 803 (viz Příloha B, tabulka B.4). Lze tedy přijmout hypotézu, že výchozí model je chybně specifikovaný. Multikolinearita Test v případě lineárního regresního modelu pro cenu pronájmu bytu multikolinearitu neukázal (viz Příloha B, tabulka B.5). 37
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ
const m2 Pokoj Vlastnictvi Zdivo Stav Balkon Terasa Lodzie Sklep Garaz Parking Vybaveni Patro MHD
Coefficient
Std. Error
t-ratio
p-value
−6906.74 47.0334 1622.05 1637.29 −350.927 −931.826 1982.46 1758.17 2018.95 −881.699 2490.00 409.902 409.509 105.402 2087.84
4268.91 24.0632 637.328 1095.72 1313.50 413.871 869.563 1022.82 1158.23 823.264 1153.15 862.399 260.016 175.288 681.598
−1.6179 1.9546 2.5451 1.4943 −0.2672 −2.2515 2.2798 1.7189 1.7431 −1.0710 2.1593 0.4753 1.5749 0.6013 3.0632
0.1095 0.0540 0.0128 0.1389 0.7900 0.0270 0.0252 0.0894 0.0851 0.2873 0.0337 0.6358 0.1191 0.5493 0.0030
Tabulka 2.4: Odhad metodou OLS pro pronájem bytů
Whiteův test Whiteův test (viz Příloha B, tabulka B.6), podobně jako tomu bylo u prodeje bytů, vede k zamítnutí nulové hypotézy o homoskedasticitě. Breusch-Paganův test Breusch-Paganův test potvrzuje výsledky Whiteova testu a taktéž zamítá nulovou hypotézu o homoskedasticitě (viz Příloha B, tabulka B.7). V modelu je tedy identifikována heteroskedasticita. Opět jsme v modelu identifikovali problém heteroskedasticity, je nutné model odhadnout za pomoci jiné odhadové metody.
2.3.2
Odhad paramatru β váženou metodou nejmenších čtverců
Stejně jako v případě prodeje bytů i zde využijeme váženou metodu nejmenších čtverců, přičemž i výběr vah proběhne stejným způsobem9 . 9
Blíže k vážené metodě nejmenších čtverců a k výběru vah pro danou metodu viz subkapitola 2.2.2.
38
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Coefficient const m2 Pokoj Vlastnictvi Zdivo Stav Balkon Terasa Lodzie Sklep Garaz Parking Vybaveni Patro MHD
Std. Error
−4445.76 1978.15 23.6140 12.4366 2066.87 334.934 1167.72 416.489 433.750 496.740 −583.356 207.783 953.559 420.328 832.797 510.941 1881.05 409.613 −218.163 379.492 2629.15 386.013 388.270 345.118 320.837 100.586 143.220 86.8019 1345.51 350.678
t-ratio
p-value
−2.2474 1.8987 6.1710 2.8037 0.8732 −2.8075 2.2686 1.6299 4.5923 −0.5749 6.8110 1.1250 3.1897 1.6500 3.8369
0.0273 0.0611 0.0000 0.0063 0.3851 0.0062 0.0259 0.1070 0.0000 0.5669 0.0000 0.2639 0.0020 0.1028 0.0002
Tabulka 2.5: Odhad metodou WLS pro pronájem bytu
Přejděme k analýze získaných výsledků. Korigovaný koeficient determinace má hod¯ 2 = 0, 961. Model odhadnutý tímto způsobem má vysokou vypovídací schopnost. notu R Podívejme se na statisticky významné nezávisle proměnné (viz Příloha B, tabulka B.8). U pronájmu bytů jimi jsou podle t-statistiky Počet pokojů v bytě, Typ vlastnictví, Celkový stav bytu, Balkon, Lodžie, Garáž, Vybavení bytu a Dostupnost městské hromadné dopravy10 . Tyto nezávisle proměnné budou opět figurovat v dalším, zúženém regresním modelu. Nejdříve se budeme věnovat Podlahové ploše bytu a Počtu pokojů v bytě. Podlahová plocha bytu má kladný vliv na cenu pronájmu, což se na ní odráží 23 Kč nájemného za každý m2 . Vztah mezi Podlahovou plochou bytu a skutečnou, resp. predikovanou cenou pronájmu bytu je zobrazen na obrázku 2.2. Počet pokojů v bytě se jako statisticky významná nezávisle proměnná projeví na ceně pozitivně, hodnotou 2 066 Kč za každý pokoj v bytě. Tento rozdíl oproti výsledkům získaným u prodeje bytů může být způsoben jinou skladbou nájemníků než tomu bylo v dřívějších letech. V dnešní době, zvlášť, pokud bereme v úvahu pouze tříletý rozsah dat, je velká část bytů pronajímána studentům, známým apod. Byty s větším počtem pokojů jsou tedy 10
Nejvyšší hodnoty má t-statistika proměnných Počtu pokojů v bytě, Lodžie a Garáž.
39
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ
Actual and fitted Cena versus m2 45000
fitted actual
40000 35000
Cena
30000 25000 20000 15000 10000 5000 20
40
60
80
100
120
140
160
m2
Obrázek 2.2: Skutečná vs. predikovaná cena pronájmu bytu ve vztahu k Podlahové ploše bytu žádanější kvůli větší míře soukromí a zároveň snížení nákladů na bydlení pro jednotlivce. Kladný vliv na cenu má i nezávisle proměnná Umístění bytu. U pronájmu bytu ale není statisticky významnou. Každé další patro se na ceně pronájmu bytu odrazí hodnotou 143 Kč. Vysvětlení je zde pravděpodobně stejné jako u Prodeje bytů, nicméně u Pronájmu tento požadavek není prioritou. Další skupinu tvoří Typ vlastnictví, Typ zdiva a Celkový stav bytu. Z těchto tří nezávisle proměnných je statisticky nevýznamná pouze jedna, a to Typ zdiva. Typ vlastnictví má kladný dopad na cenu bytu. Každá úroveň této proměnné navyšuje cenu pronájmu o 1 167 Kč. Typ zdiva má také kladný vliv na cenu pronájmu, a to v hodnotě 433 Kč za každou úroveň této proměnné. Oproti tomu Celkový stav bytu ovlivňuje cenu negativně o 583 Kč při každé další úrovni zkoumané nezávisle proměnné. Přejděme k náležitostem bytu. Hned první nezávisle proměnná z této skupiny, Balkon, je statisticky významná. Cenu ovlivňuje přítomnost balkonu kladně (ale nepodstatnou výší), částkou 953 Kč. Terasa a Lodžie ovlivňují cenu také kladně11 . Sklep, narozdíl od modelu prodeje bytů, má u pronájmu bytů negativní vliv na cenu, 11
Terasa je ohodnocena částkou 832 Kč a přítomnost Lodžie je ceněna na 1 881 Kč.
40
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ hodnota Sklepa je −218 Kč. Tato skutečnost se dá také vysvětlit poptávkou po pronájmu bytů, neboť nájemníci sklep většinou nevyužívají, není tedy žádaný v takové míře jako při koupi bytu. Garáž se v modelu projevila jako statisticky významná. Její kladný vliv se na ceně projeví částkou 2 629 Kč. Parkovací místo tak vysoce ceněné není, jeho pozitivní dopad na cenu je 388 Kč. Četnost Garáže je však tak nízká, že hodnota tohoto kritéria není relevantní. Částkou 320 Kč k ceně bytu přispívá každé navýšení nezávisle proměnné Vybavení bytu. Poslední nezávisle proměnnou v tomto modelu je Dostupnost městské hromadné dopravy. Tato nezávisle proměnná se zároveň projevila jako statisticky významná. Každá úroveň Dostupnosti městské hromadné dopravy zvýší cenu pronájmu o 1 345 Kč. Statistická významnost proměnné může být dána poptávkou po pronájmu. Jak bylo zmíněno výše, v dnešní době tvoří velkou část nájemníků studenti, zaměstnanci v oborech s vysokou mírou mobility pracovní síly apod. Pro tuto skupinu lidí se většinou jedná pouze o překlenovací období, než budou schopni opatřit si vlastní byt či dům. S tím samozřejmě souvisí i dostupnost městské hromadné dopravy, neboť automobil také představuje dlouhodobější investici.
2.3.3
Zúžený regresní model
Přejděme ke zúženému lineárnímu regresnímu modelu ceny pronájmu bytu, jehož výsledky jsou shrnuty v následující tabulce.
const Pokoj Vlastnictvi Stav Balkon Lodzie Garaz Vybaveni MHD
Coefficient
Std. Error
t-ratio
p-value
−2511.32 2896.44 1317.88 −510.735 749.050 1816.25 2300.82 432.752 956.719
1517.06 134.865 417.763 150.001 283.419 442.912 509.070 82.3677 228.747
−1.6554 21.4766 3.1546 −3.4049 2.6429 4.1007 4.5197 5.2539 4.1824
0.1014 0.0000 0.0022 0.0010 0.0097 0.0001 0.0000 0.0000 0.0001
Tabulka 2.6: Odhad metodou WLS pro pronájem bytu, zúžený model
Opět vycházíme ze základního modelu. Závisle proměnnou tedy zůstává cena pro41
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ nájmu bytu. Nezávisle proměnnými jsou pouze statisticky významné proměnné figurující v základním modelu, v tomto případě Počet pokojů v bytě, Typ vlastnictví, Celkový stav bytu, Balkon, Lodžie, Garáž, Vybavení bytu a Dostupnost městské hromadné dopravy. Ve zúženém lineárním regresním modelu jsou již všechny nezávisle proměnné statisticky významné. Výraznou odchylku vidíme v případě t-statistiky Počtu pokojů v bytě, která dosáhla dokonce hodnoty 21, 47. ¯ 2 = 0, 928. Tento Korigovaný koeficient determinace pro zúžený model má hodnotu R koeficient má sice nižší hodnotu, než korigovaný koeficient determinace v základním modelu pro pronájem bytů, na druhou stranu pracujeme s menším počtem proměnných. Pokud srovnáme zúžený lineární regresní model pro pronájem bytů s původním lineárním regresním modelem, vidíme, že koeficienty parametrů β se liší v některých případech až o 800 Kč, což může být v důsledku i 10% z celkové ceny pronájmu bytu. Oproti rozdílům v subkapitole Prodej bytů je tady změna opravdu znatelná.
42
KAPITOLA 3. INSTRUMENTÁLNÍ PROMĚNNÉ
Kapitola 3 Instrumentální proměnné V této kapitole připojíme k metodě nejmenších čtverců a vážené metodě nejmenších čtverců navíc metodu instrumentálních proměnných (označované IV12 ) k hlubší analýze vztahů mezi některými zkoumanými veličinami. Uplatníme ji přitom ve dvou verzích, ve dvoustupňové metodě nejmenších čtverců a metodě maximální věrohodnosti s omezenou informací, jejichž nasazení nám umožňuje programový produkt Gretl.
3.1
Teoretická část
Tato subkapitola se věnuje obecnému postupu v případě odhadu regresního modelu pomocí instrumentálních proměnných. Bližší seznámení s konkrétními metodami založenými na tomto principu lze dohledat v příslušné literatuře13 . Připusťme, že náhodné složky korelují s nezávislými proměnnými, tzn. E(X ′ ε) 6= 0. V tom případě nám metoda nejmenších čtverců dává zkreslené, nekonzistentní odhady. Je tedy nutné použít alternativní metodu odhadu parametrů. Metoda instrumentálních proměnných je velmi podobná dvoustupňové metodě nejmenších čtverců. Jejím základem je nalezení pomocné, tzv. instrumentální proměnné, která následně slouží jako transformace pro tento model. Hledáme tedy takové proměnné, pro které bude platit: a) Pi′yi = Pi′ Wi β.i + Pi′εi , kde Pi je matice matice instrumentálních proměnných pro itou rovnici, Wi = (Yi , Xi ) a β.i = (β.i′ , γ.i′ )′ , 12
Autorem této metody je J. D. Sargan. V této diplomové práci využijeme dvoustupňovou metodu nejmenších čtverců označovanou 2SLS a metodu maximální věrohodnosti s omezenou informací, zkráceně LIM L. Teoretický základ obou metod popsal Dhrymes [3]. Konkrétní popis těchto odhadových metod popsal např. Greene [5]. 13
43
KAPITOLA 3. INSTRUMENTÁLNÍ PROMĚNNÉ b) instrumentální proměnné jsou nekorelované s náhodnými složkami i-té strukturní rovnice, c) instrumentální proměnné jsou co nejvíce korelované s nezávisle proměnnými i-té rovnice. Těmito podmínkami docílíme toho, že odhad pomocí instrumentálních proměnných bude konzistentní. Zároveň z nich vyplývá, že instrumentální proměnné lze vybírat pouze z takových nezávisle proměnných, které jsou prokazatelně nekorelované s náhodnou složkou rovnice v témže čase (to jsou např. všechny nestochastické veličiny). Nyní k samotnému výběru instrumentálních proměnných. Ty budou definované vztahem Pi = XAi , kde Ai je určující matice definující instrumentální proměnné, Pi je matice instrumentálních proměnných pro i-tou rovnici a X je matice predeterminovaných proměnných.
3.1.1
Odhad parametrů β pomocí instrumentálních proměnných
Odhad parametrů modelu má pak tvar βˆ.i = (Pi′ Wi )−1 Pi′ y.i = (Pi′ Wi )−1 Pi′(Wi β.i + εi) = β.i + (Pi′ Wi )−1 Pi′εi . Podmínkou existence odhadu metodou instrumentálních proměnných je existence inverzní matice k matici Pi′ Wi . Pro odhady metodou instrumentálních proměnných platí: a) odhady parametrů β.i jsou konzistentní, b) odhady parametrů β.i jsou nestranné, c) odhady parametrů β.i jsou obecně vydatné, d) za určitých podmínek jsou odhady parametrů β.i asymptoticky normální.
3.1.2
Určení instrumentálních proměnných
Jestliže chceme nalézt určující matici definující instrumentální proměnné, hledáme takovou matici A, u níž dochází k maximální korelovanosti s množinou všech predeterminovaných proměnných. To nastane právě tehdy, když A = (X ′ X)−1 X ′ Wi . 44
KAPITOLA 3. INSTRUMENTÁLNÍ PROMĚNNÉ V tom případě má odhadová funkce tvar βˆi = (Pi′Wi )−1 P ′y.i =
Yi′ X(X ′ X)−1 X ′ Yi Yi′ X(X ′X)−1 X ′ Yi Xi′ X(X ′ X)−1 X ′ Yi Xi′ X(X ′ X)−1 X ′ Yi
!
Yi′ X(X ′ X)−1 X ′ yi Xi′ X(X ′ X)−1 X ′ yi
!
= βˆ2SLS . Z toho je zřejmé, že dvoustupňová metoda nejmenších čtverců je speciálním případem metody instrumentálních proměnných, a to právě při volbě určující matice ve tvaru A = (X ′ X)−1 X ′ Wi . Zároveň je při této volbě matice A odhad pomocí instrumentálních proměnných, resp. dvoustupňovou metodou nejmenších čtverců, nejvydatnější. Jak ale píše Hušek [7, s. 67], ”Výběr adekvátních pomocných proměnných není v praxi jednoznačný, takže lze dospět k několika různým odhadům parametrů modelu v závislosti na tom, která z proměnných, přicházejících v úvahu, byla použita. Zároveň je prakticky nemožné ověřit předpoklad nezávislosti zvolené pomocné proměnné na náhodné složce modelu i na chybách měření. Proto nalézt takovou proměnnou, která je silně zkorelována s vysvětlovanou proměnnou i s vysvětlujícími proměnnými, není někdy snadné.”
3.1.3
Hausmanův test
Hausmanův test14 Hausmanův test je jedním ze základních specifikačních testů. Lze jej použít k testování toho, zda jsou jednotlivé nezávisle proměnné regresní rovnice nekorelované s náhodnými složkami. Jedná se tedy o jeden ze základních předpokladů lineárního regresního modelu, jehož případné nesplnění může vést k nekonzistentním odhadům výsledných regresních koeficientů. Pokud skutečně platí, že nezávisle proměnné jsou s náhodnou složkou modelu nekorelované, pak je efektivnější využít k odhadu metodu nejmenších čtverců. Jestliže je tomu naopak, metoda nejmenších čtverců dává nekonzistentní odhady a je na místě použít odhad pomocí instrumentálních proměnných. Testujeme hypotézu H0 : E(Xj , ε) = 0 H1 : E(Xj , ε) 6= 0, přičemž pro nulovou hypotézu platí, že odhad parametrů β metodou nejmenších čtverců, βˆOLS , je současně konzistentní i vydatný a odhad parametrů β pomocí instrumentálních proměnných, βˆIV , je pouze konzistentní, zatímco pro alternativní hypotézu platí, že odhad 14
Tento test navrhl J. A. Hausman.
45
KAPITOLA 3. INSTRUMENTÁLNÍ PROMĚNNÉ parametrů β metodou nejmenších čtverců, βˆOLS , není konzistentní (i když může být vydatný) a odhad parametrů β pomocí instrumentálních proměnných, βˆIV , je konzistentní, ale není vydatný. Postup Hausmanova testu15 je následující: a) Pomocí metody nejmenších čtverců odhadneme regresní model xi = γ1 + θ1 zi1 + θ2 zi2 + νi , ze kterého získáme rezidua νˆi . b) Získaná rezidua νˆi vložíme do původního modelu, tedy yi = β1 + β2 xi + δˆ νi + ei . Tuto rovnici odhadneme pomocí metody nejmenších čtverců. c) Pokud se t-statistika koeficientu δ příliš vzdaluje od nuly, pak je nutné k odhadu parametrů β využít instrumentální proměnné. Jinak využijeme efektivnější odhad pomocí metody nejmenších čtverců.
3.2
Prodej bytů
Pro následující model byla zvolena jako instrumentovaná proměnná Podlahová plocha bytu. Soubor instrumentálních proměnných je tvořen okruhem indikátorů, které mají nebo mohou mít těsný vztah k proměnné Podlahová plocha bytu (včetně zahrnutí veličin kvalitativní povahy). Zvoleny byly Počet pokojů v bytě, přítomnost Balkonu, Terasy, Lodžie a Sklepa.
3.2.1
Odhad parametrů β pomocí instrumentálních proměnných
Jestliže odhadneme pomocný model metodou nejmenších čtverců (viz tabulka 3.1), kde jako závisle proměnná bude nyní figurovat Podlahová plocha bytu, zjistíme, že všechny instrumentální proměnné (kromě Lodžie) jsou pro daný model statisticky významné. ¯ 2 = 0, 821. Výběr výše zmíněných Korigovaný koeficient korelace pro tento model je R instrumentálních proměnných je tedy pravděpodobně vhodný. Nyní přejděme k samotnému odhadu regresního modelu pomocí instrumentálních proměnných. Regresní model odhadneme jak dvoustupňovou metodou nejmenších čtverců, tak metodou maximální věrohodnosti s omezenou informací. 15
S touto zjednodušenou formou Hausmanova testu pracuje výpočtový program Gretl.
46
KAPITOLA 3. INSTRUMENTÁLNÍ PROMĚNNÉ
const Pokoj Terasa Sklep Balkon Lodzie
Coefficient
Std. Error
19.5547 23.2431 20.2691 −5.12603 5.97209 −4.31710
2.05470 0.821742 1.78076 1.58439 1.66068 2.50783
t-ratio
p-value
9.5171 28.2852 11.3823 −3.2353 3.5962 −1.7214
0.0000 0.0000 0.0000 0.0013 0.0004 0.0862
Tabulka 3.1: Odhad metodou OLS pro Podlahovou plochu bytu pro prodej bytů
Regresní model budeme odhadovat oběma výše zmíněnými metodami kvůli srovnání výsledků odhadu parametrů β2SLS a βLIM L , abychom tak zjistili, nakolik je výběr instrumentálních proměnných přesný. U dvoustupňové metody nejmenších čtverců si navíc uvedeme výsledek Hausmanova testu.
const m2 Vlastnictvi Zdivo Stav Garaz Parking Vybaveni Patro MHD
Coefficient
Std. Error
t-ratio
p-value
−2.11732e+006 24263.1 606345. 126697. 63355.7 103214. −10130.3 165040. 109096. −47032.3
379111. 1431.55 111266. 128408. 59234.8 175785. 141895. 38401.0 21787.2 55064.0
−5.5850 16.9488 5.4495 0.9867 1.0696 0.5872 −0.0714 4.2978 5.0073 −0.8541
0.0000 0.0000 0.0000 0.3238 0.2848 0.5571 0.9431 0.0000 0.0000 0.3930
Tabulka 3.2: Odhad metodou 2SLS pro prodej bytů
Hausmanův test Hausmanův test v případě dvoustupňové metody nejmenších čtverců nezamítl nulovou hypotézu, tedy že odhady metodu nejmenších čtverců jsou konzistentní.
Stačí letmý pohled do tabulky 3.2 a 3.3 a je zřejmé, že odhady jsou velmi podobné, ne-li téměř shodné. To nám opět potvrzuje, že zvolené instrumentální proměnné jsou 47
KAPITOLA 3. INSTRUMENTÁLNÍ PROMĚNNÉ vybrány vhodným způsobem. Další analýza bude vycházet pouze z metody maximální věrohodnosti s omezenou informací.
const m2 Vlastnictvi Zdivo Stav Garaz Parking Vybaveni Patro MHD
Coefficient
Std. Error
t-ratio
p-value
−2.11733e+006 24072.1 605171. 130276. 64798.4 108430. −8734.20 164248. 109354. −45217.2
379206. 1471.45 111313. 128597. 59304.9 176073. 141953. 38436.4 21797.5 55171.8
−5.5836 16.3594 5.4367 1.0131 1.0926 0.6158 −0.0615 4.2732 5.0168 −0.8196
0.0000 0.0000 0.0000 0.3110 0.2746 0.5380 0.9509 0.0000 0.0000 0.4125
Tabulka 3.3: Odhad metodou LIML pro prodej bytů
Z tabulky 3.3 můžeme pro začátek vyčíst statisticky významné nezávisle proměnné. Zřejmě nás nepřekvapí, že mezi nimi bude figurovat i instrumentovaná proměnná Podlahová plocha bytu. Dále pak Typ vlastnictví, Vybavení bytu a Umístění bytu v domě. Nyní si proberme každou ze sledovaných nezávisle proměnných. Instrumentovaná proměnná Podlahová plocha bytu je pro daný model statisticky významná. Každé její navýšení o jeden metr čtvereční znamená pro cenu bytu navýšení o 24 072 Kč. Zároveň v sobě skrývá všechny nezávisle proměnné spojené s plošnou výměrou, což naznačuje i u nich statistickou významnost. Do další skupiny nezávisle proměnných patří Typ Vlastnictví, Typ zdiva a Celkový stav bytu. Překvapivě je z této trojice statisticky významná pouze nezávisle proměnná Typ vlastnictví. Každé navýšení hodnoty této proměnné navyšuje cenu bytu o 605 171 Kč. Další dvě nezávisle proměnné se na ceně v obdobné míře neodráží. Typ zdiva pouze 130 276 Kč a Celkový stav bytu hodnotou 64 798 Kč za každé navýšení její hodnoty. Statistická významnost je zajímavá i z toho hlediska, že proměnné Typ vlastnictví, Typ zdiva a Celkový stav bytu spolu velmi úzce souvisí. Zvláště když t-statistika u Typu vlastnictví je oproti zbývajícím dvěma tak vysoká. Statistická nevýznamnost nezávisle proměnných Garáž a Parkovací místo je očekávatelná. Ať už z důvodu malého zastoupení těchto proměnných v datovém vzorku nebo z důvodu nedůležitosti tohoto parametru při výběru bytu obecně. Garáž navyšuje cenu bytu o 108 430 Kč, oproti tomu Parkovací místo celkovou cenu snižuje o 8 734 Kč. 48
KAPITOLA 3. INSTRUMENTÁLNÍ PROMĚNNÉ Vybavení bytu a Umístění bytu v domě jsou při daném odhadu parametrů β statisticky významné nezávisle proměnné. Vybavení bytu zvyšuje hodnotu bytu o 164 248 Kč za každý bonus. Tento fakt je očekávatelný, neboť zateplení, plastová okna nebo nová kuchyňská linka jsou předností každého bytu. U Umístění bytu v domě každé patro pozitivně ovlivní cenu hodnotou 109 354 Kč. Tento fakt se dá jednoduše vysledovat např. u developerských projektů, kde máme k dispozici naprosto totožné bytové jednotky lišící se pouze patrem, ve kterém se nacházejí. Dostupnost městské hromadné dopravy je jednou ze statisticky nevýznamných proměnných v tomto modelu odhadnutém metodou maximální věrohodnosti s omezenou informací. Kromě této skutečnosti zbývá konstatovat, že ovlivňuje výslednou cenu bytu záporně, částkou 45 217 Kč za každé navýšení hodnoty této nezávislé proměnné.
3.3
Pronájem bytů
Stejně jako tomu bylo u prodeje bytů, začneme s pomocnou regresí, kde bude jako závisle proměnná, a tedy instrumentovaná proměnná, figurovat Podlahová plocha bytu. Nezávisle proměnné jsou opět vybrány tak, aby korespondovaly s metry čtverečními, tj. Počet pokojů v bytě a přítomnost Balkonu, Terasy, Lodžie a Sklepa.
3.3.1
Odhad parametrů β pomocí instrumentálních proměnných
Odhad parametrů β pomocného lineárního regresního modelu metodou nejmenších čtverců pro instrumentovanou proměnnou Podlahová plocha bytu (viz Příloha D, tabulka D.1) ukazuje, že mezi statisticky významné nezávisle proměnné tohoto modelu patří Počet pokojů v bytě a Terasa. Tato regrese nám tedy dává slabší výsledky než obdobná regrese pro prodej bytů ve smyslu menšího počtu statisticky významných parametrů. I korigovaný ¯ 2 = 0, 699. koeficient determinace je zde nižší, konkrétně R
const Pokoj Balkon Terasa Lodzie Sklep
Coefficient
Std. Error
20.9066 21.6089 −2.55600 21.4916 0.192574 −0.849753
3.74311 1.82367 4.32302 4.73496 5.75032 3.85123
t-ratio
p-value
5.5854 11.8491 −0.5913 4.5389 0.0335 −0.2206
0.0000 0.0000 0.5558 0.0000 0.9734 0.8259
Tabulka 3.4: Odhad metodou OLS pro Podlahovou plochu bytu pro pronájem bytů
49
KAPITOLA 3. INSTRUMENTÁLNÍ PROMĚNNÉ Vytvoříme zúžený lineární regresní model, ve kterém budou figurovat pouze statisticky významné nezávislé proměnné, Počet pokojů v bytě a Terasa. Koeficient determi-
const Pokoj Terasa
Coefficient
Std. Error
t-ratio
p-value
20.1808 21.4520 22.1026
3.32112 1.76545 4.38962
6.0765 0.0000 12.1510 0.0000 5.0352 0.0000
Tabulka 3.5: Odhad metodou OLS pro Podlahovou plochu bytu pro pronájem bytů, zúžený model ¯ 2 = 0, 707. Zároveň podoba zúženého modelu koresponduje nace pro tento model je R s výsledky korelační matice z předchozí kapitoly, tj. Podlahová plocha bytu je silně korelovaná s Počtem pokojů a korelovaná s Terasou. Tento model využijeme u následujících odhadů. Podlahová plocha opět slouží jako instrumentovaná proměnná, která je nahrazena výše zmíněnými instrumentálními proměnnými, tedy Počtem pokojů v bytě a Terasou. Regresní model odhadneme dvoustupňovou metodou nejmenších čtverců a metodou maximální věrohodnosti s omezenou informací. Srovnáním získaných výsledků posoudíme volbu instrumentálních proměnných.
const m2 Vlastnictvi Zdivo Stav Balkon Lodzie Sklep Garaz Parking Vybaveni Patro MHD
Coefficient
Std. Error
t-ratio
p-value
−9549.79 128.134 1444.48 −995.611 −1183.77 2333.20 2041.04 −686.497 1421.64 661.647 497.341 19.6607 2945.90
4603.40 16.4334 1153.31 1375.72 415.534 861.277 1223.57 850.005 1218.86 903.569 269.852 183.786 707.145
−2.0745 7.7972 1.2525 −0.7237 −2.8488 2.7090 1.6681 −0.8076 1.1664 0.7323 1.8430 0.1070 4.1659
0.0380 0.0000 0.2104 0.4692 0.0044 0.0067 0.0953 0.4193 0.2435 0.4640 0.0653 0.9148 0.0000
Tabulka 3.6: Odhad metodou 2SLS pro pronájem bytů
50
KAPITOLA 3. INSTRUMENTÁLNÍ PROMĚNNÉ Hausmanův test Hausmanův test v tomto případě zamítá nulovou hypotézu. Odhady metodou nejmenších čtverců nejsou konzistentní.
Pokud srovnáme oba odhady z tabulek 3.6 a 3.7, zjistíme, že nám dávají velmi podobné výsledky. Tento výsledek mj. naznačuje, že výběr instrumentálních proměnných v tomto modelu je zřejmě vhodný. Následující analýza odhadu parametrů β bude vycházet již pouze z odhadu metodou maximální věrohodnosti s omezenou informací.
const m2 Vlastnictvi Zdivo Stav Balkon Lodzie Sklep Garaz Parking Vybaveni Patro MHD
Coefficient
Std. Error
t-ratio
p-value
−9570.86 128.340 1445.00 −999.721 −1182.90 2335.30 2042.93 −686.314 1415.86 660.770 496.726 19.5150 2949.76
4605.60 16.4593 1153.66 1376.24 415.677 861.584 1223.98 850.267 1219.46 903.854 269.947 183.844 707.533
−2.0781 7.7974 1.2525 −0.7264 −2.8457 2.7105 1.6691 −0.8072 1.1611 0.7311 1.8401 0.1061 4.1691
0.0377 0.0000 0.2104 0.4676 0.0044 0.0067 0.0951 0.4196 0.2456 0.4647 0.0658 0.9155 0.0000
Tabulka 3.7: Odhad metodou LIML pro pronájem bytů
Začněme výčtem statisticky významných nezávisle proměnných v tomto modelu. Dle srovnání s kritickou hodnotou t-statistiky jsou to Podlahová plocha bytu, Celkový stav bytu, přítomnost Balkonu a Dostupnost městské hromadné dopravy. Skrze Podlahovou plochu bytu se pak do modelu jako statisticky významné taktéž promítají proměnné Počet pokojů v bytě a Terasa. Projděme si nyní vliv všech nezávisle proměnných na celkovou cenu pronájmu bytu. Pozitivní vliv Podlahové plochy bytu na cenu je zřejmý, každý metr čtvereční zvyšuje cenu pronájmu bytu o 128 Kč. S dispozicemi bytu přímo souvisí i Umístění bytu v domě. Oproti ceně bytu při jeho koupi se patro, ve kterém se byt nachází, neukázalo být 51
KAPITOLA 3. INSTRUMENTÁLNÍ PROMĚNNÉ statisticky významné. U pronájmu musíme počítat s krátkodobým horizontem16 , proto opomíjíme faktory, které by při koupi bytu byly rozhodující pro nás, a tedy i pro realitní kancelář. Z následující skupiny má kladný vliv na cenu pouze nezávisle proměnná Typ vlastnictví, podílí se na celkové ceně částkou 1 445 Kč při přechodu k soukromější formě vlastnictví. Proměnná Typ zdiva naopak cenu ovlivňuje negativně, a to jejím snížením o 999 Kč. Příčinou tohoto negativního vlivu je skutečnost, že cihlové byty, které jsou nabízeny k pronájmu, se nacházejí spíše ve starších bytových domech. Celkový stav bytu jako jediná statisticky významná proměnná této skupiny ovlivňuje cenu také záporně, a to částkou 1 182 Kč za každé navýšení její hodnoty. Relativně nejdražší jsou tedy byty v dobrém stavu. Z náležitostí bytu se jako statisticky významný projevil pouze Balkon, který ovlivňuje cenu pronájmu kladně o 2 335 Kč. Ostatní nezávisle proměnné cenu taktéž navyšují, i když v menší míře. Jedinou proměnnou, která cenu ovlivňuje negativně, je přítomnost Sklepa. Cena se v tomto případě snižuje o 686 Kč. Poslední nezávisle proměnnou je Dostupnost městské hromadné dopravy. Tato statisticky významná proměnná navyšuje cenu pronájmu bytu o 2 949 Kč za každou její úroveň.
16
Jak již bylo řečeno, v analýze se projevují pouze nově uzavřené pronájmy za období 2007 − 2009.
52
KAPITOLA 4. MODELY BINÁRNÍ VOLBY
Kapitola 4 Modely binární volby Kapitola Modely binární volby17 se bude problematice bytů věnovat z jiného úhlu. Tentokrát nebudeme odhadovat, jakým způsobem se nezávisle proměnné podílejí na ceně, ale budeme zkoumat pravděpodobnost, že se daná proměnná v bytě nachází.
4.1 4.1.1
Teoretická část Modely binární volby
Mějme lineární model ve tvaru yi = β1 + β2 xi2 + εi = x′i β + εi , kde xi = (xi1 , xi2 )′ . Předpokládejme základní podmínky lineárního modelu, tj. E(εi |xi ) = 0,
E(yi |xi ) = x′i β. Vycházejme z toho, že E(yi |xi ) = 1.P (yi = 1|xi ) + 0.P (yi = 0|xi ) = P (yi = 1|xi ) = x′i β.
Tedy x′i β představuje pravděpodobnost a její výsledek leží v intervalu < 0, 1 >. To je ale možné jen v tom případě, že hodnota xi je ohraničena a že jsou splněna jistá omezení na parametry β. Toho je těžké v praxi dosáhnout. Navíc, náhodná složka modelu má jiné než normální rozdělení a v modelu se objeví heteroskedasticita. 17
Blíže nás s touto problematikou může seznámit Verbeek [10] nebo Koop [8].
53
KAPITOLA 4. MODELY BINÁRNÍ VOLBY Jelikož yi má jen dvě možné hodnoty, tj. 0 nebo 1, chybový člen pro danou hodnotu xi má také jen dvě možné realizace. Rozdělení náhodné složky můžeme popsat jako P (εi = −x′i β|xi ) = P (yi = 0|xi ) = 1 − x′i β
P (εi = 1 − x′i β|xi ) = P (yi = 1|xi ) = x′i β.
To znamená, že rozptyl náhodné složky není konstantní, nýbrž závislý na nezávisle proměnných vzhledem k D(εi |xi ) = x′i β(1 − x′i β). Ze vzorce je patrné, že rozptyl náhodné složky je závislý i na parametrech β. Řešením tohoto problému jsou modely binární volby. Tyto modely popisují pravděpodobnost, že yi = 1, přímo, i když jsou často odvozeny ze základního variabilního modelu. Obecně máme P (yi = 1|xi ) = G(xi , β) pro nějakou funkci G(.), přičemž funkce G(.) by měla dávat jen hodnoty ležící v intervalu < 0, 1 >. Obvykle je nutné tuto funkci konkretizovat vztahem G(xi , β) = F (x′i β). Funkce F nabývá také pouze hodnot mezi 0 a 1, takže je nasnadě zvolit funkci F jako distribuční funkci. Obvyklým výběrem pak bývá standardní distribuční funkce normálního rozdělení Z w 1 2 1 √ e{− 2 t } dt, F (w) = Φ(w) = 2π −∞ která vede k Probit modelu, popř. standardní distribuční funkce logistického rozdělení F (w) = L(w) =
ew , 1 + ew
což vede k Logit modelu. Nyní k samotnému odhadu parametrů. Interpretace parametrů při použití Logit modelu nebo Probit modelu není tak zřejmá, jak jsme zvyklí např. z odhadu parametrů za pomoci metody nejmenších čtverců. Jednou z možností je zvážit částečné odvození pravděpodobnosti, že yi je rovno jedné s ohledem na spojitou vysvětlující proměnnou xik . Pak dostaneme Φ(x′i β) = φ(x′i β)βk xik ′ L(x′i β) exi β = ′ βk xik 1 + exi β x′i β = βk , xik kde φ(.) je hustota normovaného normálního rozdělení a poslední výraz může nabývat i hodnoty 0. 54
KAPITOLA 4. MODELY BINÁRNÍ VOLBY Samotný odhad parametrů β nám dává jen obecný výsledek. Ve všech případech znaménko vlivu změny v xik koresponduje se znaménkem jeho vlastního koeficientu βk , můžeme tedy určit, zda bude mít daná nezávisle proměnná kladný či záporný vliv. Pokud pak zafixujeme všechny vysvětlující proměnné kromě jedné, pak pro diskrétní nezávisle proměnnou může být vliv změny určen z výpočtu odvozených pravděpodobností pro dvě různé realizace.
4.1.2
Odhad parametrů β v modelech binární volby
K odhadu parametrů β Logit modelu bude nutné využít pravděpodobnostní funkci. Pro pozorování i s yi = 1 je dána pravděpodobnost P (yi = 1|xi ) jako funkce neznámého parametrického vektoru β, podobně je tomu pro případ yi = 0. Pravděpodobnostní funkce pro celý vzorek je pak dána jako yi 1−yi L(β) = ΠN , i=1 P (yi = 1|xi ; β) P (yi = 0|xi ; β)
kde zahrneme β do vyjádření pravděpodobnosti, abychom zvýraznili, že pravděpodobnostní funkce je funkcí β. Po substituci P (yi = 1|xi ; β) = F (x′i β) dostaneme log L(β) =
N X i=1
yi log
F (x′i β)
+
N X i=1
(1 − yi )log (1 − F (x′i β)).
Po této substituci dostáváme tvar funkce, která může být maximalizována pro β. Jak již bylo zmíněno, hodnoty parametrů β a jejich následná interpretace je závislá na vybrané distribuční funkci. Další komplikací u těchto modelů je určení míry významnosti modelu, která byla v předešlých kapitolách vyhodnocována za pomoci korigovaného koeficientu determinace ¯ 2 . Ten již použít nelze, neboť i v případech shody modelu s daty je R ¯ 2 podstatně nižší R než 1. Řešení tohoto problému navrhl v roce 1974 D. McFadden, který definoval statistiku 2 RM F = 1−
ln LM , ln L0
kde LM je maximum funkce věrohodnosti L pro klasický lineární regresní model obsahující úrovňovou konstantu a normálně rozdělenou náhodnou složku, a L0 je maximum věrohodnostní funkce, kdy všechny parametry (s výjimkou úrovňové konstanty) položíme 2 rovny nule. Statistika RM F je označována jako index podílu věrohodnosti. Její minimální hodnotou je 0. Její maximální hodnota ale 1 nedosahuje. S přidáním 2 nezávisle proměnných hodnota RM F opět roste. 55
KAPITOLA 4. MODELY BINÁRNÍ VOLBY
4.2
Prodej bytů
Jak bylo zmíněno v teoretické části této kapitoly, jako závisle proměnnou lze zvolit pouze takovou proměnnou, která nabývá hodnot 0 a 1. V našem případě se jedná o Balkon, Terasu, Lodžii a Sklep. Garáž a Parkovací místo z důvodů malého zastoupení v datovém vzorku pomineme. Následující řádky nám odhalí, jakým způsobem je ovlivněna pravděpodobnost přítomnosti, popř. nepřítomnosti zmíněných proměnných v bytě. Statisticky významné nezávisle proměnné získáme z odhadu modelu metodou nejmenších čtverců, kam zahrneme všechny proměnné kromě zvolené (tj. závisle) proměnné a kromě ceny bytu. Proměnné relevantní pro zkoumané kritérium lze zvolit i subjektivně. Po srovnání takto vytvořených modelů s modely odvozenými z odhadu metodou nejmenších čtverců a porovnání indexu podílu věrohodnosti bylo přednostně zvoleno právě odvození pomocí metody nejmenších čtverců. V dalším textu již uvedeme pouze výchozí Logit a Probit modely pro zvolené závisle proměnné.
4.2.1
Modely pro závisle proměnnou Balkon
Při odhadu lineárního regresního modelu metodou nejmenších čtverců (viz Příloha E, tabulka E.1) pro závisle proměnnou Balkon jsme získali statisticky významné proměnné Podlahová plocha bytu, Celkový stav bytu, Terasa, Lodžie, Vybavení bytu, Umístění bytu v domě a Dostupnost městské hromadné dopravy. Tyto nezávisle proměné budou figurovat v následujím Logit a Probit modelu. Výsledky Logit modelu vidíme v tabulce 4.1. V Příloze E, tabulka E.2, jsou uvedeny 2 bližší charakteristiky Logit modelu. Index podílu věrohodnosti je RM F = 0, 293. Správně předpovězených bylo v tomto modelu celkem 79, 6% případů. Jak je napsáno v předchozí subkapitole, v případě modelů binární volby vedou parametry β spíše k obecným výsledkům. Nelze tedy říci, že by např. každý metr čtvereční přispěl k celkovému výsledku hodnotou 0, 022. Můžeme se orientovat jen podle znaménka dílčího parametru. Nejvyšší hodnotu má t-statistika proměnné Terasa a Lodžie. Tyto mají navíc záporný vliv na pravděpodobnost výskytu Balkonu. Obě tato fakta mají svůj důvod, neboť jen zřídka se všechny tyto proměnné vyskytují v jednom bytě. Z dalších proměnných majících záporný vliv na Balkon je to Vybavení bytu a Umístění bytu v domě. Kladný vliv pak mají podlahová plocha bytu, Celkový stav bytu a Dostupnost městské hromadné dopravy. 56
KAPITOLA 4. MODELY BINÁRNÍ VOLBY
const m2 Stav Terasa Lodzie Vybaveni Patro MHD
Coefficient
Std. Error
t-stat
p-value
−2.80677 0.0221928 0.585365 −2.09773 −4.43434 −0.363777 −0.232828 0.637441
1.11634 0.00627349 0.198818 0.407709 0.855996 0.155588 0.0927264 0.235624
−2.5143 3.5376 2.9442 −5.1452 −5.1803 −2.3381 −2.5109 2.7053
0.0119 0.0004 0.0032 0.0000 0.0000 0.0194 0.0120 0.0068
Tabulka 4.1: Logit model pro Balkon pro prodej bytů
Pro srovnání se v tabulce 4.2 podívejme na Probit model pro závisle proměnnou Balkon.
const m2 Stav Terasa Lodzie Vybaveni Patro MHD
Coefficient
Std. Error
t-stat
p-value
−1.57780 0.0132116 0.339577 −1.21662 −2.50397 −0.188700 −0.135097 0.341232
0.636060 0.00357606 0.111839 0.238178 0.418592 0.0869006 0.0520131 0.133268
−2.4806 3.6945 3.0363 −5.1080 −5.9819 −2.1714 −2.5974 2.5605
0.0131 0.0002 0.0024 0.0000 0.0000 0.0299 0.0094 0.0105
Tabulka 4.2: Probit model pro Balkon pro prodej bytů
2 Index podílu věrohodnosti (viz Příloha E, tabulka E.3) je RM F = 0, 292. Korektně předpovězených případů v tomto modelu je 78%.
Opět vidíme, že Terasa a Lodžie, co se týče t-statistiky, vybočují od ostatních proměnných a opět mají záporný vliv na výslednou pravděpodobnost přítomnosti Balkonu v bytě. Ostatní nezávisle proměnné mají na Balkon stejný vliv jako v předchozím případě, tedy jako u Logit modelu. 57
KAPITOLA 4. MODELY BINÁRNÍ VOLBY
4.2.2
Modely pro závisle proměnnou Terasa
Po provedení odhadu lineárního regresního modelu pro závisle proměnnou Terasa metodou nejmenších čtverců (viz Příloha E, tabulka E.4) jsme získali statisticky významné proměnné Podlahová plocha bytu, Počet pokojů v bytě, Celkový stav bytu, Balkon, Lodžie, Sklep, Parkovací místo a Dostupnost městské hromadné dopravy. Odhad parametrů β Logit modelu je zobrazen v tabulce 4.3, výsledky Probit modelu pro závisle proměnnou Terasa ukazuje tabulka 4.4.
const m2 Pokoj Stav Balkon Lodzie Sklep Parking MHD
Coefficient
Std. Error
t-stat
p-value
−26.1525 0.133887 −1.72293 3.95551 −2.59838 −5.69717 −2.10366 3.86457 1.52834
4.99243 0.0248116 0.657648 0.998962 0.511329 1.58149 0.578471 1.35226 0.377607
−5.2384 5.3961 −2.6198 3.9596 −5.0816 −3.6024 −3.6366 2.8579 4.0474
0.0000 0.0000 0.0088 0.0001 0.0000 0.0003 0.0003 0.0043 0.0001
Tabulka 4.3: Logit model pro Terasu pro prodej bytů
const m2 Pokoj Stav Balkon Lodzie Sklep Parking MHD
Coefficient
Std. Error
t-stat
p-value
−14.2776 0.0765102 −1.06423 2.17705 −1.56170 −3.14383 −1.09374 2.18124 0.817139
2.59221 0.0133320 0.369219 0.547445 0.288451 0.860313 0.301692 0.766315 0.190317
−5.5079 5.7388 −2.8824 3.9768 −5.4141 −3.6543 −3.6254 2.8464 4.2936
0.0000 0.0000 0.0039 0.0001 0.0000 0.0003 0.0003 0.0044 0.0000
Tabulka 4.4: Probit model pro Terasu pro prodej bytů
Index podílu věrohodnosti pro Logit model (viz Příloha E, tabulka E.5) je roven = 0, 632. Model korektně odhadl celkem 84% případů.
2 RM F
58
KAPITOLA 4. MODELY BINÁRNÍ VOLBY V tomto případě je t-statistika nejvyšší u Podlahové plochy bytu a u Balkonu. Souvislost s Podlahovou plochou bytu jsme akcentovali již dříve. Navíc je pochopitelné, že tato proměnná bude mít na závisle proměnnou kladný vliv. Opačně je tomu u Balkonu. Pozitivní vliv na pravděpodobnost přítomnosti Terasy v bytě má dále Celkový stav bytu, Parkovací místo a Dostupnost městské hromadné dopravy. Probit model nás vede k podobným výsledkům. Index podílu věrohodnosti (viz Příloha 2 E, tabulka E.6) je zde RM F = 0, 636, korektně předpovězených bylo 84% případů.
4.2.3
Modely pro závisle proměnnou Lodžie
V případě závisle proměnné Lodžie jsme jako nezávisle proměnné (viz Příloha E, tabulka E.7) zvolili Typ zdiva, Balkon a Terasu.
const Zdivo Balkon Terasa
Coefficient
Std. Error
2.84384 −1.85241 −3.90044 −2.73052
0.803095 0.477270 0.758219 1.05870
t-stat
p-value
3.5411 −3.8813 −5.1442 −2.5791
0.0004 0.0001 0.0000 0.0099
Tabulka 4.5: Logit model pro Lodžii pro prodej bytů
Index podílu věrohodnosti (viz Příloha E, tabulka E.8) je v případě Logit modelu = 0, 490 a počet správně předpovězených případů je v tomto případě 91, 8%. Stejně je tomu je u Probit modelu (viz Příloha E, tabulka E.9).
2 RM F
const Zdivo Balkon Terasa
Coefficient
Std. Error
1.63455 −1.06901 −2.00361 −1.41313
0.453770 0.269175 0.332752 0.465396
t-stat
p-value
3.6022 −3.9714 −6.0213 −3.0364
0.0003 0.0001 0.0000 0.0024
Tabulka 4.6: Probit model pro Lodžii pro prodej bytů
I vliv nezávislých proměnných je v obou modelech stejný. Konkrétně všechny nezávislé proměnné mají na výsledek negativní vliv. Výskyt balkonu nebo terasy v bytě tedy podstatně snižuje pravděpodobnost, že v tomto bytě bude lodžie. Negativní vliv Typu zdiva je také očekávatelný, neboť z kontingenčních tabulek je zřejmé, že lodžie se nacházejí spíše v panelových bytových domech. 59
KAPITOLA 4. MODELY BINÁRNÍ VOLBY
4.2.4
Modely pro závisle proměnnou Sklep
Pro modely binární volby pro závisle proměnnou Sklep byly vybrány nezávisle proměnné Podlahová plocha bytu, Počet pokojů v bytě, Terasa, Vybavení bytu a Dostupnost městské hromadné dopravy (viz Příloha E, tabulka E.10). Výledky odhadu jsou zobrazeny v tabulkách 4.7 a 4.8.
const m2 Pokoj Terasa Vybaveni MHD
Coefficient
Std. Error
t-stat
p-value
−4.98928 −0.0505651 1.82888 −1.74487 0.501639 1.09369
0.985355 0.0120519 0.324197 0.460577 0.151765 0.257747
−5.0634 −4.1956 5.6413 −3.7885 3.3054 4.2433
0.0000 0.0000 0.0000 0.0002 0.0009 0.0000
Tabulka 4.7: Logit model pro Sklep pro prodej bytů
Na základě tabulek E.11 a E.12 (viz Příloha E) lze říct, že oba modely mají opět velmi podobné výsledky jak u indexu podílu věrohodnosti, tak co se týče predikce vý2 sledku. Pro Logit model je to RM F = 0, 281 a počet korektně předpovězených případů 2 je 78, 6%, pro Probit model je index podílu věrohodnosti RM F = 0, 280 a podíl správně predikovaných případů 78, 9%. Kladný vliv na pravděpodobnost Sklepa náležejícího k bytu má Počet pokojů v bytě, Vybavení bytu a Dostupnost městské hromadné dopravy. Zajímavý je z našeho hlediska opačný vliv Podlahové plochy bytu a Počtu pokojů v bytě.
const m2 Pokoj Terasa Vybaveni MHD
Coefficient
Std. Error
−2.76576 −0.0299222 1.08152 −0.995875 0.299139 0.589293
0.513470 −5.3864 0.0000 0.00672448 −4.4497 0.0000 0.182778 5.9171 0.0000 0.251718 −3.9563 0.0001 0.0815447 3.6684 0.0002 0.132032 4.4633 0.0000
t-stat
p-value
Tabulka 4.8: Probit model pro Sklep pro prodej bytů
60
KAPITOLA 4. MODELY BINÁRNÍ VOLBY
4.3
Pronájem bytů
V této subkapitole si projdeme Logit a Probit modely pro v tomto případě závisle proměnné Balkon, Terasa, Lodžie a Sklep. Opět se nebudeme věnovat Garáži ani Parkovacímu místu, neboť ty jsou v případě pronájmu bytů a menšího datového vzorku ještě méně zastoupeny, než tomu bylo v případě prodeje bytů.
4.3.1
Modely pro závisle proměnnou Balkon
Nezávisle proměnné zvolené pro tento model, které jsme získali z odhadnu regresního modelu metodou nejmenších čtverců (viz Příloha F , tabulka F.1), jsou Počet pokojů v bytě, Terasa, Lodžie a Sklep. Lodžii bylo ale nutné v tomto případě vynechat, neboť by daný model selhal.
const Pokoj Terasa Sklep
Coefficient
Std. Error
−1.88439 0.408337 −2.87285 1.63558
0.627879 0.295073 1.15668 0.571482
t-stat
p-value
−3.0012 1.3838 −2.4837 2.8620
0.0027 0.1664 0.0130 0.0042
Tabulka 4.9: Logit model pro Balkon pro pronájem bytů
Logit model predikoval správným způsobem stejné množství případů jako Probit model (viz Příloha F , tabulky F.2 a F.3), tj. 78, 2%. Liší se ale jeho index podílu věrohod2 2 nosti. Ten má hodnotu RM F = 0, 166 oproti RM F = 0, 163 Probit modelu.
const Pokoj Terasa Sklep
Coefficient
Std. Error
−1.14239 0.257156 −1.56661 0.949327
0.351987 0.169263 0.573287 0.337451
t-stat
p-value
−3.2455 1.5193 −2.7327 2.8132
0.0012 0.1287 0.0063 0.0049
Tabulka 4.10: Probit model pro Balkon pro pronájem bytů
Negativní vliv má v tomto případě pouze Terasa. Pokud se tedy v bytě nachází Terasa, snižuje to pravděpodobnost, že bude v bytě i Balkon. Opačně je tomu u nezávisle proměnné Sklep. Ta má na pravděpodobnost přítomnosti Balkonu v bytě pozitivní vliv. Sklep náležející k bytu tuto pravděpodobnsot zvyšuje. 61
KAPITOLA 4. MODELY BINÁRNÍ VOLBY
4.3.2
Modely pro závisle proměnnou Terasa
Pro závisle proměnnou Terasa byly v případě pronájmu bytů zvoleny nezávisle proměnné Podlahová plocha bytu a Balkon (viz Příloha F , tabulka F.4). Coefficient const m2 Balkon
Std. Error
−4.37078 0.909263 0.0471435 0.0117683 −2.36952 1.21860
t-stat
p-value
−4.8069 0.0000 4.0060 0.0001 −1.9445 0.0518
Tabulka 4.11: Logit model pro Terasu pro pronájem bytů
2 Hodnota indexu podílu věrohodnosti je v případě Logit modelu RM F = 0, 314 (viz Příloha F , tabulka F.5). Množství správně predikovaných případů je 83, 5%.
Coefficient const m2 Balkon
Std. Error
t-stat
p-value
−2.47274 0.462119 −5.3509 0.0000 0.0265688 0.00624903 4.2517 0.0000 −1.39788 0.681550 −2.0510 0.0403
Tabulka 4.12: Probit model pro Terasu pro pronájem bytů
2 U Probit modelu je index podílu věrohodnosti roven RM F = 0, 315 a počet korektně předpovězených případů dosahuje taktéž 83, 5% (viz Příloha F , tabulka F.6). Opět vidíme spojitost mezi Terasou a Podlahovou plochou bytu (její t-statistika má hodnotu větší než 4 v obou modelech). Navíc, stejně jako v případě Balkonu jako závisle proměnné ve vztahu k Terase, i zde vidíme negativní vliv Balkonu na pravděpodobnost přítomnosti Terasy v bytě.
4.3.3
Modely pro závisle proměnnou Lodžie
Jedinou nezávisle proměnnou zvolenou pro tento Logit a Probit model dle odhadu lineráního regresního modelu metodou nejmenších čtverců je Balkon (viz Příloha F , tabulka F.7). I zde však nastal problém s odhadem modelu. Tentokrát byla na vině právě proměnná Balkon. Jak lze vidět v tabulkách 4.13 a 4.14, jak v případě Logit modelu, tak v případě Probit modelu Gretl nezávisle proměnnou Balkon zcela vynechal. V obou modelech tak zůstaly jen konstanty. 62
KAPITOLA 4. MODELY BINÁRNÍ VOLBY
const
Coefficient
Std. Error
−1.84055
0.340401
t-stat
p-value
−5.4070 0.0000
Tabulka 4.13: Logit model pro Lodžii pro pronájem bytů
const
Coefficient
Std. Error
−1.09396
0.183504
t-stat
p-value
−5.9615 0.0000
Tabulka 4.14: Probit model pro Lodžii pro pronájem bytů
4.3.4
Modely pro závisle proměnnou Sklep
Pro závisle proměnnou Sklep byly vybrány nezávisle proměnné Typ zdiva a Balkon (viz Příloha F , tabulka F.10).
const Zdivo Balkon
Coefficient
Std. Error
2.78074 −2.14233 1.21062
1.23872 0.666550 0.526731
t-stat
p-value
2.2448 0.0248 −3.2141 0.0013 2.2984 0.0215
Tabulka 4.15: Logit model pro Sklep pro pronájem bytů
const Zdivo Balkon
Coefficient
Std. Error
1.72489 −1.31645 0.731137
0.750827 0.400012 0.317735
t-stat
p-value
2.2973 0.0216 −3.2910 0.0010 2.3011 0.0214
Tabulka 4.16: Probit model pro Sklep pro pronájem bytů
Oba modely správným způsobem predikovaly celkem 75, 3% případů (viz Příloha F , tabulky F.11 a F.12). Mírně se ale liší jejich index podílu věrohodnosti. U Logit modelu 2 je roven hodnotě RM F = 0, 140, zatímco u Probit modelu je index podílu věrohodnosti 2 roven RM F = 0, 141. Kladný vliv má pro dané modely proměnná Balkon. Pokud se tedy v bytě balkon nachází, zvyšuje tato skutečnost pravděpodobnost, že se v bytě nachází i sklep.
63
KAPITOLA 4. MODELY BINÁRNÍ VOLBY
64
ZÁVĚR
Závěr Bydlení je jednou ze základních životních potřeb. Výběr bytu či rodinného domu, ať už se jedná o jeho koupi nebo pronájem, čeká dříve či později každého z nás. Právě z tohoto důvodu je nutné věnovat této problematice patřičnou pozornost. Tato diplomová práce, věnující se bytovému fondu, si kladla za cíl na základě získaných dat zrealizovaných prodejů a pronájmů bytů na území Jihomoravského kraje za roky 2007 až 2009 z realitní kanceláře Gaute, a. s., zjistit, jak se jednotlivé proměnné promítají do ceny bytu (resp. ceny pronájmu). Je zřejmé, že tato problematika není jen záležitostí matematiky. Zasahuje do ní mnoho jiných oborů, ať už se jedná o ekonomii, sociologii či demografii. Získané výsledky jsou tedy jen částí řešení, které by zcela osvětlilo chování ceny na trhu s byty. Samotné zpracování z hlediska matematiky závisí ve velké míře na zvoleném ekonometrickém aparátu a samozřejmě na dostupných datech. Ta byla z aplikace Intrapoint (aplikace využívaná franšízovými realitními společnostmi České spořitelny) přepsána a upravena do snadno využitelné podoby pro další výpočty. Co se týče regresních modelů a jejich odhadů, program Gretl používaný v této diplomové práci nabízí širokou škálu odhadových metod. Pro popsání vztahů mezi jednotlivými proměnnými využitými v této práci bylo využito několik z těchto nabízených metod odhadu regresního modelu. Konkrétně to byla metoda nejmenších čtverců, dále vážená metoda nejmenších čtverců, dvoustupňová metoda nejmenších čtverců, metoda maximální věrohodnosti s omezenou informací, Logit model a nakonec Probit model. Nyní si krátce shrneme výsledky získané těmito metodami. Analýza byla rozdělena do tří kapitol, přičemž každá kapitola je rozdělena na část věnující se prodeji bytů a část o pronájmu bytů. V kapitole Metoda nejmenších čtverců jsme nejdříve zkoumali vztahy mezi proměnnými pomocí kontingenčních tabulek a korelačních maticí. Výsledkem byly běžné závěry ohledně proměnných Typ zdiva, Typ vlastnictví a Celkový stav bytu. Stejné výsledky nám pro prodej a pronájem bytů dávají i korelační matice příslušející zkoumaným regresním modelům, tj. silně korelované jsou proměnné Podlahová plocha bytu a Počet pokojů v bytě, dále byla korelace zaznamenána u Podlahové plochy bytu a u Terasy, kde může být tento fakt způsobem nejednotným zadáváním dat do aplikace Intrapoint. 65
ZÁVĚR Jádrem této kapitoly je odhad lineárního regresního modelu pomocí zmíněné metody nejmenších čtverců. V důsledku průřezových dat byla v modelu identifikována heteroskedasticita (a to jak v případě prodeje, tak při pronájmu bytů), kterou bylo nutné odstranit. Použita proto byla vážená metoda nejmenších čtverců, která daný problém odstranila. Získali jsme tak soubor proměnných, které ovlivňují výslednou cenu bytu, ať už se jedná o pronájem nebo prodej bytu. Není překvapením, že v obou případech bude hrát svou roli Typ vlastnictví a Celkový stav bytu. Významnou proměnnou se ale v případě prodeje bytu stal Sklep. Stejně tak je na rozdíl od pronájmu bytu žádoucí bydlení ve vyšším patře bytového domu. Oproti tomu u pronájmu bytů je důležitým faktorem Dostupnost městské hromadné dopravy. Kromě těchto skutečností modely odhalily jednu zásadní odlišnost. Zatímco u prodeje bytu je důležitá především Podlahová plocha bytu, u pronájmu bytu je stěžejní proměnnou Počet pokojů v bytě. Další kapitola se věnovala jinému způsobu odhadu parametrů, a to pomocí instrumentálních proměnných. Využili jsme metodu maximální věrohodnosti s omezenou informací a pro srovnání pak dvoustupňovou metodu nejmenších čtverců. Jako instrumentovaná proměnná byla zvolena Podlahová plocha bytu. Instrumentální proměnné pak byly zvoleny subjektivně, dle vztahu k instrumentované proměnné. Vzhledem k volbě instrumentované proměnné je zřejmé, že se v obou případech projevila jako statisticky významná proměnná. Zároveň je to jediná statisticky významná proměnná, u níž došlo v obou subkapitolách ke shodě. Zatímco u pronájmu byla shledána důležitým parametrem Dostupnost městské hromadné dopravy, u prodeje bytu to bylo Typ vlastnictví, Vybavení bytu nebo Umístění bytu v domě. V poslední kapitole jsme nezkoumali závislost ceny na ostatních parametrech, ale pravděpodobnost, že se daná proměnná v bytě nachází. Jako výchozí modely jsme zvolili Logit a Probit model, jako závisle proměnné byly tentokrát zvoleny Balkon, Terasa, Lodžie a Sklep. Ve všech případech (až na vztah proměnných Balkon a Sklep) se ukázalo, že pokud některá ze zbývajících tří proměnných v analyzovaném modelu figuruje, pak se se závisle proměnnou navzájem vylučují. Pokud nyní srovnáme výsledky použitých odhadových metod, pak obdobné výsledky získané různými metodami odhadu povedou k závěru, že jsme identifikovali významné proměnné ve vztahu k ceně bytu či jeho pronájmu. V případě prodeje bytu jsou těmito proměnnými jednoznačně Podlahová plocha bytu, Typ vlastnictví, Umístění bytu v domě a v neposlední řadě Vybavení bytu, přičemž všechny tyto proměnné mají na výslednou cenu kladný vliv. V případě pronájmu bytu jsou těmito společnými ukazateli ovlivňujícími cenu pro66
ZÁVĚR nájmu Počet pokojů v bytě, Celkový stav bytu, Balkon a Dostupnost městské hromadné dopravy. Kromě Celkového stavu bytu mají všechny proměnné také kladný vliv na cenu. Tato práce může být dále rozvinuta, a to dvěma směry. První možností je rozšíření o analýzu z hlediska výše zmíněných oborů. Zařazení dodatečných parametrů jako je nezaměstnanost, mobilita pracovní síly, analýza příjmů domácností nebo dostupnost zeleně, vytvoří komplexnější obraz cen bytů na trhu nemovitostí. Druhou možností je úprava datového vzorku. Za cenu vyššího počtu proměnných by bylo možné vytvořit model, v němž bychom mohli sledovat nejen např. vliv Dostupnosti městské hromadné dopravy, ale i vliv jednotlivých úrovní této proměnné. Samozřejmostí je i početnější datový vzorek, který by výsledky analýzy zpřesnil. Využití ekonometrických modelů v běžné praxi by v budoucnosti mohlo vést ke zkvalitnění služeb realitních kanceláří. Pokud bychom vybírali, který ze způsobů odhadu zavést do praxe, pak by bylo vhodné využít některý z modelů, který ošetří problém heteroskedasticity. Tyto odhady jsou však výpočtově náročnější. Pro běžné užívání je vhodnější jednodušší model, tedy metoda nejmenších čtverců. Její použití bez problému zvládne i laik a její výsledky jsou blízké výsledkům jiných odhadových metod.
67
ZÁVĚR
68
LITERATURA
Literatura [1] Adkins, L. C.: Using gretl for Principles of Econometrics, 3rd Edition. Free Software License 2007 [2] Cottreli, A.: Gretl User’s Guide. Free Software License 2010 [3] Dhrymes, P. J.: Introductory Econometrics, 2nd Edition. Springer - Verlag, New York 1984 [4] Dhrymes, P. J.: Mathematics for Econometrics. Springer - Verlag, New York 2000 [5] Greene, W. H.: Econometric Analysis. Prentice-Hall, New Jersey 2000 [6] Gujarati, D. N. & Porter, D. C.: Basic Econometrics. McGraw-Hill, Singapore 2009 [7] Hušek, R.: Ekonometrická analýza. Nakladatelství Oeconomica, Praha 2007 [8] Koop, G.: Introduction to Econometrics. John Wiley & Sons, West Sussex 2008 [9] Rybička, J.: LATEX pro začátečníky. Konvoj, Brno 2003 [10] Verbeek, M.: A Guide to Modern Econometrics. John Wiley & Sons, West Sussex 2004 [11] Stavebnictví | ČSÚ [online]. Poslední revize 27. 4. 2010 [cit. 2010-04-10]. Dostupné z:
[12] GAUTE, a. s. - realitní kancelář, člen obchodní sítě Realitní společnosti České spořitelny, a. s. [online]. Poslední revize 20. 4. 2010 [cit. 2010-03-14]. Dostupné z: [13] gretl [online]. Poslední revize 24. stupné z:
2010-03-16].
Do-
[14] Trh s nemovitostmi je v krizi Komentáře (Český hlas) [online]. Poslední revize 23. 2. 2009 [cit. 2010-03-16]. stupné z:
rozDo-
69
1.
2010
[cit.
LITERATURA
70
SEZNAM OBRÁZKŮ
Seznam obrázků 1.1 Aplikace Intrapoint, stručný náhled na nabídku bytu . . . . . . . . . . . . 16 1.2 Aplikace Intrapoint, podrobný náhled na nabídku bytu . . . . . . . . . . . 16 1.3 Gretl, náhled na nabídku odhadových metod . . . . . . . . . . . . . . . . . 22 2.1 Skutečná vs. predikovaná cena bytu ve vztahu k Podlahové ploše bytu . . . 33 2.2 Skutečná vs. predikovaná cena pronájmu bytu ve vztahu k Podlahové ploše bytu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
71
SEZNAM OBRÁZKŮ
72
SEZNAM TABULEK
Seznam tabulek 1.1 1.2 1.3 1.4 1.5 1.6 1.7
Počet pokojů v bytě . . . . . Typ vlastnictví . . . . . . . . Typ zdiva . . . . . . . . . . . Celkový stav bytu . . . . . . . Balkon, Terasa, Lodžie, Sklep Parkování . . . . . . . . . . . Dostupnost městské hromadné
2.1 2.2 2.3 2.4 2.5 2.6
Odhad Odhad Odhad Odhad Odhad Odhad
3.1 3.2 3.3 3.4 3.5
Odhad Odhad Odhad Odhad Odhad zúžený 3.6 Odhad 3.7 Odhad 4.1 4.2 4.3 4.4 4.5 4.6
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
18 19 19 19 20 20 21
OLS pro prodej bytů . . . . . . . . . . . WLS pro prodej bytů . . . . . . . . . . WLS pro prodej bytů, zúžený model . . OLS pro pronájem bytů . . . . . . . . . WLS pro pronájem bytu . . . . . . . . . WLS pro pronájem bytu, zúžený model
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
31 32 36 38 39 41
metodou OLS pro Podlahovou plochu bytu pro prodej bytů . . . metodou 2SLS pro prodej bytů . . . . . . . . . . . . . . . . . . . metodou LIML pro prodej bytů . . . . . . . . . . . . . . . . . . . metodou OLS pro Podlahovou plochu bytu pro pronájem bytů . . metodou OLS pro Podlahovou plochu bytu pro pronájem bytů, model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . metodou 2SLS pro pronájem bytů . . . . . . . . . . . . . . . . . . metodou LIML pro pronájem bytů . . . . . . . . . . . . . . . . .
. . . .
47 47 48 49
metodou metodou metodou metodou metodou metodou
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . dopravy
. . . . . . .
Logit model pro Balkon pro prodej bytů Probit model pro Balkon pro prodej bytů Logit model pro Terasu pro prodej bytů Probit model pro Terasu pro prodej bytů Logit model pro Lodžii pro prodej bytů . Probit model pro Lodžii pro prodej bytů 73
. . . . . . .
. . . . . .
. . . . . . .
. . . . . .
. . . . . . .
. . . . . .
. . . . . . .
. . . . . .
. . . . . . .
. . . . . .
. . . . . . .
. . . . . .
. . . . . . .
. . . . . .
. . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. 50 . 50 . 51 . . . . . .
57 57 58 58 59 59
SEZNAM TABULEK 4.7 4.8 4.9 4.10 4.11 4.12 4.13 4.14 4.15 4.16
Logit model pro Sklep pro prodej bytů . . . Probit model pro Sklep pro prodej bytů . . . Logit model pro Balkon pro pronájem bytů . Probit model pro Balkon pro pronájem bytů Logit model pro Terasu pro pronájem bytů . Probit model pro Terasu pro pronájem bytů Logit model pro Lodžii pro pronájem bytů . Probit model pro Lodžii pro pronájem bytů Logit model pro Sklep pro pronájem bytů . Probit model pro Sklep pro pronájem bytů .
74
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
60 60 61 61 62 62 63 63 63 63
PŘÍLOHY
Přílohy
i