GAZDASÁGSTATISZTIKA
GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi Intézet, és a Balassi Kiadó közreműködésével.
ELTE TáTK Közgazdaságtudományi Tanszék
GAZDASÁGSTATISZTIKA Készítette: Bíró Anikó Szakmai felelős: Bíró Anikó
2010. június
GAZDASÁGSTATISZTIKA
2. hét Adattípusok, leíró statisztikák, indexszámok Bíró Anikó
Adattípusok I. Idősoros Időben rendezett változók Megfigyelési gyakoriság (pl. havi, évi) Jelölés: Yt Példák (makro, pénzügyi – egyéni?)
Keresztmetszeti Egy adott időpontban gazdaság szereplőiről minta Példák (egyének, vállalatok, országok) Jelölés: Yi Véletlen minta
Adattípusok II. Panel Idősoros + keresztmetszeti együttesen Keresztmetszeti mintáról megfigyelés több időpontban Jelölés: Yit
Példák (GDP európai országokban, egyéni keresetek alakulása)
Adattípusok III. Mennyiségi és minőségi Kvantitatív: pl. infláció, jövedelem Kvalitatív: pl. férfi/nő, iskolai végzettség – számokká alakítjuk
Szint és növekedés Pl. foglalkoztatottak száma vs. változása
%változás
(Yt
1
Yt
Yt )
100
2009.
2008.
2007.
2006.
2005/
2004/
2003/
2002/
2001/
2000/
1999/
1998/
1997/
1996/
1995/
1994/
Idősorok ábrázolása HUF/USD havi középárfolyam
350
300
250
200
150
100
50
Idősorok ábrázolása Millions
EU27 népesség 500
490
480
470
460
450
440 1970
1975
1980
1985
1990
1995
2000
2005
2010
Hisztogramok Keresztmetszeti adatok ábrázolása Példa: egy főre jutó jövedelem megoszlása
Egyenlő osztályközök (rekesznagyság) – Excelben célszerű megadni adatoktól függően Gyakoriság egyes osztályközökben
Hisztogram, példa Penn World: országok megoszlása lakosság száma szerint (rekesznagyság: 5000) Lakosság (ezer fő) hisztogram 90 80 60 50 40 30 20 10
135000
120000
105000
90000
75000
60000
45000
30000
15000
0
0
Gyakoriság
70
Hisztogram, példa SHARE: keresztmetszeti minta 50+ lakosság körében Autó értéke, osztrák részminta (rekesznagyság: 1000) Autó értéke hisztogram - Ausztria, 50+ 1400
1000 800 600 400 200
Euró
20000
18000
16000
14000
12000
10000
8000
6000
4000
2000
0
0
Gyakoriság
1200
Pontdiagram Két változó közti összefüggés KSH: megyei adatok Munkanélküliségi ráta (%)
20 18 16 14 12 10 8 6 4 2 0 0
1000
2000
3000 GDP/fő (ezer Ft)
4000
5000
6000
Pontdiagram Eurostat: tanulók létszáma országonként, 2007 3500 3000
# óvodás gyermek
2500 2000 1500 1000
500 0 0
500
1000
1500
2000
2500
# felsőoktatási tanuló
3000
3500
4000
4500
Leíró statisztikák Eddig: grafikus módszerek
Leíró statisztika: számszerűen összefoglalni változó jellemzőit Szintje? – átlag, medián, módusz Változékonysága? – szórás, terjedelem
Átlag N
Yi Y
i 1
N
N: minta elemszáma Példa: országok átlagos lakossága (Penn World Table) – kb. 34 millió
Módusz Módusz: leggyakoribb érték Probléma: nem mindig létezik (pl. minden értékből egy), több módusz is lehet Megoldás lehet: hisztogram legmagasabb pontja (függ osztályközöktől) – osztályköz közepe
Medián, percentilisek Medián: középső érték – megfigyelések fele alatta X-edik percentilis: megfigyelések X%-a kisebb értéket vesz fel Kvartilis: negyedeli az adatokat 1. kvartilis: 25% alatta, 2. kvartilis = medián
Ferdeség (skewness) Példánkban: átlag > medián
„Balra ferde”
90 80 70
Gyakoriság
Néhány nagy érték – átlag nagy
Lakosság (ezer fő) hisztogram
60 50 40 30 20 10
135000
120000
105000
90000
75000
60000
45000
30000
15000
0
0
„Jobbra elnyújtott”
Szóródás Terjedelem: maximum és minimum közti eltérés Nem megbízható (kiugró értékek)
Variancia: átlagos négyzetes eltérés Szórás: N
(Yi Y ) 2 s
Var
i 1
N 1
Önmagában nehezen értelmezhető
Indexek Árindex Árszínvonal, átlagos ár nehezen értelmezhető Árindex: bázisidőszak %-ában kifejezett árszínvonal Éves infláció: évenként változó bázis
Éves árindex, példa 25 20
10 5 0
Busz menetjegy
Fehér kenyér, kg
2008
2007
2006
2005
2004
2003
2002
2001
2000
1999
1998
1997
-5
1996
%
15
Népesség változása Bázis: előző év
Népesség változása, EU27
1.006
1.005
1.004
1.003
1.002
1.001
1 1976
1980
1984
1988
1992
1996
2000
2004
2008
Összefoglalás Adattípusok: Idősoros, keresztmetszeti, panel Kvantitatív, kvalitatív
Grafikus módszerek: idősorok, hisztogram, pontdiagram Leíró statisztikák: Átlag, módusz, medián Ferdeség Szóródás
Gyakorlat Grafikus módszerek, leíró statisztikák, indexek
Idősorok ábrázolása HUF/USD havi középárfolyam 350 300 250 200 150 100
HUF/EUR árfolyam? – Idősor grafikon, elemzés
2009.
2008.
2007.
2006.
2005.
2004.
2003.
2002.
2001.
2000.
1999.
1998.
1997.
1996.
1995.
1994.
50
Hisztogramok Keresztmetszeti adatok ábrázolása
Excel: Analysis ToolPak bővítmény Egyenlő osztályközök (rekesznagyság) – Excelben célszerű megadni adatoktól függően Gyakoriság egyes osztályközökben
Excel: hiányzó adatok problémája – sorbarendezéssel kiküszöbölhető
Hisztogram, példa Penn World: országok megoszlása lakosság száma szerint Lakosság (ezer fő) hisztogram 90 80
Gyakoriság
70 60 50 40 30 20 10
GDP/fő megoszlása? Tipp: rekesznagyság 2000
135000
120000
105000
90000
75000
60000
45000
30000
15000
0
0
Pontdiagram Két változó közti összefüggés KSH: megyei adatok
Munkanélküliségi ráta (%)
20 18 16 14 12 10 8 6 4 2 0 0
1000
2000
3000
4000
5000
GDP/fő (ezer Ft)
GDP/fő és regisztrált gazdasági szervezetek száma? – Mi várható, mi látszik?
6000
Átlag N
Yi Y
i 1
N
N: minta elemszáma
Példa: országok átlagos lakossága, átlagos jövedelem/fő (Penn World Table)
Módusz Módusz: leggyakoribb érték
Példák: Országok népessége Egy főre jutó GDP
Hisztogram alapján!
Medián, percentilisek Medián: középső érték – megfigyelések fele alatta X-edik percentilis: megfigyelések X%-a kisebb értéket vesz fel Excel: leíró statisztikák (medián) + percentilis függvény Példa: medián, 3. kvartilis népesség és GDP/fő adatokon? Pl. Medián=PERCENTILIS(B3:B189;0.5)
Szóródás
Terjedelem: maximum és minimum közti eltérés MIN(), MAX() függvények Nem megbízható (kiugró értékek)
Variancia: átlagos négyzetes eltérés Szórás: N
(Yi Y ) 2 s
Var
i 1
N 1
Szóródás mértékei GDP/fő Penn World adatokon (leíró statisztika tábla + függvények)
Indexek KSH adatok alapján Kenyér, buszjegy árindexe Fix bázis Évenként változó bázis Grafikus vizsgálat
Házi feladat (csoportos) 1.: egy tetszőlegesen választott idősoros változó grafikus elemzése 2.: egy keresztmetszeti minta közgazdasági indikátorának vizsgálata hisztogrammal 3.: egy keresztmetszeti minta két indikátora közti összefüggés vizsgálata pontdiagrammal Mindhárom kérdéshez ábra + egy bekezdésnyi elemzés!