Budapesti Műszaki és Gazdaságtudományi Egyetem Gazdaság- és Társadalomtudományi Kar
Dr. Kövesi János – Erdei János – Dr. Tóth Zsuzsanna Eszter – Dr. Jónás Tamás
Gazdaságstatisztika Oktatási segédanyag a Gazdaságstatisztika című tárgyhoz a Gazdálkodási és menedzsment (BA), Műszaki menedzser (BSc), Nemzetközi gazdálkodás (BA), valamint az Alkalmazott közgazdaságtan (BA) alapszakok részére
Budapest 2013
Tartalomjegyzék I. BEVEZETÉS ..................................................................................................................................................... 4 I.1 A MATEMATIKAI STATISZTIKA TÁRGYA ......................................................................................................... 5 I.2 MINTAVÉTEL, MINTAVÉTELI HIBA.................................................................................................................. 6 I.3 SOKASÁGOK CSOPORTOSÍTÁSA ...................................................................................................................... 7 I.4 ISMÉRVEK ...................................................................................................................................................... 8 I.5 MÉRÉSI SKÁLÁK............................................................................................................................................. 9 I.5.a Névleges (nominális) skála .................................................................................................................... 9 I.5.b Sorrendi (ordinális) skála ................................................................................................................... 10 I.5.c Intervallumskála (különbségskála) ...................................................................................................... 10 I.5.d Arányskála (abszolút skála) ................................................................................................................ 11 II. LEÍRÓ STATISZTIKA ................................................................................................................................. 12 II.1 A LEÍRÓ STATISZTIKA TÁRGYA ................................................................................................................... 13 II.2 A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI ................................................................................................ 13 II.2.a Adatgyűjtés......................................................................................................................................... 14 II.2.b Az adatok ábrázolása ......................................................................................................................... 14 II.3 TAPASZTALATI ELOSZLÁSOK ...................................................................................................................... 16 II.3.a Egy mennyiségi ismérv szerinti rendezés és osztályozás .................................................................... 16 II.3.b Mennyiségi sorok grafikus ábrázolása ............................................................................................... 18 II.4 TAPASZTALATI ELOSZLÁSOK JELLEGZETESSÉGEI ....................................................................................... 24 II.4.a Középértékek (helyzetmutatók)........................................................................................................... 24 II.4.b Kvantilisek ......................................................................................................................................... 31 II.4.c Szóródási mutatók .............................................................................................................................. 33 II.5 AZ ELOSZLÁS ALAKJÁT JELLEMZŐ EGYÉB MUTATÓSZÁMOK ....................................................................... 38 II.6 ESETTANULMÁNY – LEÍRÓ STATISZTIKAI ELEMZÉS..................................................................................... 40 III. RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA, STANDARDIZÁLÁS, INDEXSZÁMÍTÁS .... 47 III.1 RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA ............................................................................................. 48 III.1.a Rész- és főátlagok ............................................................................................................................. 48 III.1.b Rész- és fősokaságok varianciája és szórása .................................................................................... 50 III.1.c Ismérvek közötti kapcsolat ................................................................................................................ 53 III.2 VISZONYSZÁMOK ...................................................................................................................................... 54 III.2.a Rész- és összetett viszonyszámok ...................................................................................................... 55 III.3 STANDARDIZÁLÁS ..................................................................................................................................... 56 III.3.a Különbségfelbontás .......................................................................................................................... 58 III.3.b Hányadosfelbontás ........................................................................................................................... 61 III.4 INDEXSZÁMÍTÁS ........................................................................................................................................ 63 III.4.a Elemzés dinamikus viszonyszámokkal .............................................................................................. 63 III.4.b Indexszámítás alapjai: aggregált sokaság ........................................................................................ 63 III.4.c Két időszakra vonatkozó indexszámítás ............................................................................................ 64 III.4.d A legfontosabb volumen- és árindex formulák.................................................................................. 66 III.4.e Az indexek átlagformái ..................................................................................................................... 68 III.4.f Néhány fontos indexösszefüggés ........................................................................................................ 69 III.4.g Aggregátumok különbsége ................................................................................................................ 70 IV. VALÓSZÍNŰSÉGI VÁLTOZÓ, ELMÉLETI ELOSZLÁSOK ............................................................... 74 IV.1 VALÓSZÍNŰSÉGSZÁMÍTÁSI ALAPOK .......................................................................................................... 75 IV.1.a A valószínűség fogalma..................................................................................................................... 76 IV.1.b Műveletek eseményekkel ................................................................................................................... 77 IV.1.c A valószínűségszámítás axiómarendszere ......................................................................................... 80 IV.1.d Valószínűség meghatározásának módszerei ..................................................................................... 81 IV.2 VALÓSZÍNŰSÉGI VÁLTOZÓ JELLEMZŐI ...................................................................................................... 83 IV.3 DISZKRÉT ELMÉLETI ELOSZLÁSOK ............................................................................................................ 86 IV.3.a Diszkrét egyenletes eloszlás .............................................................................................................. 86 IV.3.b Binomiális eloszlás ........................................................................................................................... 86 IV.3.c Hipergeometrikus eloszlás ................................................................................................................ 87 IV.3.d Poisson-eloszlás ................................................................................................................................ 88 IV.4 FOLYTONOS ELMÉLETI ELOSZLÁSOKHIBA! A KÖNYVJELZŐ NEM LÉTEZIK. ............................................... 89
2
IV.4.a Folytonos egyenletes eloszlás ........................................................................................................... 89 IV.4.b Exponenciális eloszlás ...................................................................................................................... 89 IV.4.c Normális (Gauss-) eloszlás ............................................................................................................... 90 IV.5 KÖZPONTI HATÁRELOSZLÁS TÉTELE ......................................................................................................... 93 V. BECSLÉS ........................................................................................................................................................ 94 V.1 A BECSLÉS TULAJDONSÁGAI ....................................................................................................................... 95 V.1.a Torzítatlan becslés ............................................................................................................................. 95 V.1.b Konzisztens becslés ............................................................................................................................ 96 V.1.c Hatásos becslés .................................................................................................................................. 98 V.1.d Elégséges becslés ............................................................................................................................... 98 V.2 A PONTBECSLÉS MÓDSZEREI....................................................................................................................... 99 V.2.a Exponenciális eloszlás paraméterének grafikus becslése .................................................................. 99 V.2.b Normális eloszlás paramétereinek grafikus becslése ....................................................................... 100 V.3 INTERVALLUMBECSLÉS ............................................................................................................................ 101 V.3.a Konfidenciaintervallum a normális eloszlás várható értékére ......................................................... 101 V.3.b Konfidenciaintervallum a normális eloszlás várható értékére, ha az elméleti szórás ismeretlen .... 104 V.3.c Sokasági arány becslése ................................................................................................................... 105 V.3.d Sokasági variancia becslése, ............................................................................................................ 105 VI. HIPOTÉZISVIZSGÁLATOK: NEMPARAMÉTERES PRÓBÁK ....................................................... 108 VI.1 A HIPOTÉZISVIZSGÁLAT ÁLTALÁNOS MENETE ......................................................................................... 109 VI.2 ILLESZKEDÉSVIZSGÁLAT 2-PRÓBÁVAL .................................................................................................. 113 VI.3 2-PRÓBA ALKALMAZÁSA HOMOGENITÁSVIZSGÁLATRA ......................................................................... 115 VI.4 2-PRÓBA ALKALMAZÁSA FÜGGETLENSÉGVIZSGÁLATRA ........................................................................ 117 VI.4.a Minőségi ismérvek asszociációja .................................................................................................... 119 VII. HIPOTÉZISVIZSGÁLATOK: PARAMÉTERES PRÓBÁK .............................................................. 120 VII.1 EGYMINTÁS PRÓBÁK.............................................................................................................................. 121 VII.1.a Várható értékre irányuló próbák ................................................................................................... 121 VII.1.b Szórásnégyzetre vonatkozó próba.................................................................................................. 123 VII.2 KÉT- ÉS TÖBBMINTÁS PRÓBÁK ............................................................................................................... 124 VII.2.a Két független minta várható értékének összehasonlítása .............................................................. 124 VII.2.b Páros minták várható értékének összehasonlítása ........................................................................ 126 VII.2.c Két szórásnégyzet (szórás) összehasonlítása ................................................................................. 128 VII.2.d Több szórás összehasonlítására vonatkozó próbák ....................................................................... 129 VII.2.e Varianciaanalízis ........................................................................................................................... 131 VIII. KORRELÁCIÓ- ÉS REGRESZIÓELEMZÉS, IDŐSORELEMZÉS................................................ 134 VIII.1 DETERMINISZTIKUS ÉS SZTOCHASZTIKUS KAPCSOLATOK ..................................................................... 135 VIII.2 A KAPCSOLAT SZEMLÉLTETÉSE ............................................................................................................ 135 VIII.3 AZ ELŐJEL–KORRELÁCIÓS EGYÜTTHATÓ .............................................................................................. 136 VIII.4 A LINEÁRIS REGRESSZIÓ ÉS A KORRELÁCIÓ .......................................................................................... 138 VIII.4.a Az elméleti korrelációs együttható ............................................................................................... 143 VIII.5 AZ R(X,Y) ÉS A REGRESSZIÓS EGYENES ÖSSZEFÜGGÉSE ........................................................................ 145 VIII.5.a A regressziós becslés pontossága ................................................................................................. 145 VIII.6 IDŐSOROK ELEMZÉSE, ........................................................................................................................... 148 VIII.7 IDŐSOROK ÖSSZETEVŐINEK VIZSGÁLATA ............................................................................................. 150 VIII.7.a Trend becslése mozgóátlagok segítségével .................................................................................. 151 VIII.7.b Szezonalitás vizsgálata ................................................................................................................. 153 VIII.7.c Auto- és keresztkorreláció idősorok elemzésénél ......................................................................... 154 IX. FELHASZNÁLT IRODALOM ................................................................................................................. 155
3
I. Bevezetés Valószínűségszámítás Matematikai statisztika
Valószínűségelmélet Axiómák, alaptételek
Mintavétel
Kombinatorika
Leíró statisztika
Geometriai val.sz.
Becslés
Val.szám. tételek
Hipotézisvizsgálat
Elméleti eloszlások
Összefüggésvizsgálat
4
I.1 A matematikai statisztika tárgya1 A matematikai statisztika a valószínűségszámítás önálló fejezete, amely a gyakorlat számára igen nagy jelentőségű. Eredeti motivációját az olyan véletlen tömegjelenségek, röviden kísérletek mennyiségi, gyakorisági viszonyainak vizsgálata adta, melyek egyrészt tetszőlegesen sokszor ismétlődhetnek (ezért tömegjelenségek), és minden megismétlődésük többféle eredménnyel – kimenetellel járhat. Mindemellett nem tudjuk (esetleg nem akarjuk, mert nem éri meg utánajárni) pontosan megmondani, kiszámítani, melyik ismétlődés alkalmával melyik kimenetel következik be (ettől indeterminisztikus a tömegjelenség). Példa ilyen kísérletre egy pénzérme feldobása: tetszőlegesen sokszor feldobhatjuk, de nem tudjuk határozottan megjósolni, hogy éppen melyik oldalára esik. Nagy számban végbemenő tömegjelenség pl. az atomi bomlás, sokszor megismételhető tömegjelenség pl. a szerencsejáték. A levonható törvényszerűségek statisztikai jellegűek, azaz nagyszámú végrehajtás során átlagosan érvényes törvények. A fenti fogalmakkal a tárgy második részében részletesen fogunk foglalkozni. A matematikai statisztika lényegét foglalja össze az 1. ábra. Sohasem a teljes sokaságot, hanem az abból alkalmas módon kivett mintát vizsgáljuk, és a minta jellemzői alapján kívánunk következtetést levonni a teljes sokaságra vonatkozóan. Hangsúlyozzuk, hogy nem a minta, hanem a teljes sokaság tulajdonságaira vagyunk kíváncsiak, és következtetéseinket e részleges megfigyelések eredményeire alapozzuk.
Következtetés
Sokaság
Minta Mintavétel 1. ábra: Mintavételi alapelvek
1
A fejezet Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985 felhasználásával készült.
5
I.2 Mintavétel, mintavételi hiba2 A vizsgálat tárgyát képező egységek összességét, halmazát statisztikai sokaságnak, vagy röviden sokaságnak nevezzük. A statisztikai minta valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés (mérés) eredménye: véges sok, azonos eloszlású független valószínűségi változó együttese3. Az egyes megfigyelési eredményeket a minta elemeinek, a megfigyelések számát a minta nagyságának vagy elemszámának nevezzük. Mint a felvezetésben láttuk, a matematikai statisztika lényege, hogy a sokaságnak csak egy részét (a mintát) vizsgáljuk, ezért a statisztikai módszerek alkalmazásakor sohasem (kivéve természetesen a 100%-os mintavételt, de az már nem matematikai statisztika) lehetünk biztosak a döntésünkben. Következtetésünk természetesen alapvetően a mintán, a mintából meghatározott jellemzőkön alapul. Ugyanakkor mi nem a minta, hanem az egész sokaság tulajdonságaira vagyunk kíváncsiak, azaz a részleges megfigyelések eredményeiből következtetünk a teljes sokaságra. A statisztikai mintavételek és az ebből származó adatokat felhasználó elemzések, következtetések tehát mindig tartalmaznak hibákat. A hiba szó jelentése ebben az esetben kissé eltér a hétköznapi szóhasználatban megszokottól. A statisztikai hiba nem jelent szükségképpen valamilyen tévedést, nem megfelelő munkavégzést, figyelmetlenséget stb., hiszen a leggondosabban elvégzett mintavétel és elemzés is tartalmaz hibákat, melyek egy része elkerülhetetlen. A statisztikai hiba, amelynek egy része a módszertan sajátosságaiból (mintavétel, tömörítés, közelítés, becslés stb.) adódik, a statisztika szükségszerű velejárója. A mintavétellel kapcsolatos hibák alapvetően két nagy csoportba sorolhatók. A statisztikai hibák közül a mintával kapcsolatos teendőkhöz, az adatgyűjtéshez kapcsolódó hibát nem mintavételi hibának nevezzük. A nem mintavételi hiba független attól, hogy teljes körű vagy részleges-e az adatgyűjtés. Ilyen hibák adódhatnak abból, hogy a vizsgálni kívánt sokaságot nem tudjuk teljesen vagy helyesen áttekinteni, pontatlan az adatgyűjtés (kérdőív, a mérés stb.), hibásan rögzítik az adatokat stb. Ezek nagy része elsősorban emberi figyelmetlenségből, nem kellő körültekintésből, hibából (a szó hétköznapi értelmében), félreértésből stb. származik. Az ilyen hibák tehát függetlenek attól, hogy a teljes sokaságot vizsgáljuk-e, vagy mintavételt alkalmazunk, ezért ezeket nem mintavételi hibának nevezzük.
2
A fejezet Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996 felhasználásával készült. 3 A valószínűségi változó pontos fogalmát jegyzetünk valószínűségszámítási alapokkal foglalkozó részében ismerjük meg. Itt most tekintsük úgy, hogy egy valószínűségi változó nem más, mint egy véletlen mennyiség jellemzésére alkalmas mutatószám.
6
A mintavételi hiba a statisztikai hiba azon része, amely részleges vizsgálatok (mintavétel) esetén abból adódik, hogy nem a teljes sokaságot figyeljük meg. A sokaság teljes megfigyeléséről való lemondás ára. A mintavétel tervezésekor – nem lebecsülve a nem mintavételi hiba jelentőségét – elsősorban a jól mérhető, számszerűsíthető mintavételi hibából indulunk ki, és olyan eljárásokat keresünk, amelyek mellett a mintavételi hiba a lehető legkisebb. A mintavételi hiba a sokaság jellegén, az alkalmazott mintavételi eljáráson és a szóban forgó mutatószám milyenségén túlmenően alapvetően a mintanagyságtól függ, ahogy azt a 2. ábra is mutatja: mintavételi hiba
mintanagyság 2. ábra: A mintanagyság és a mintavételi hiba kapcsolata
Az ábrából látható, hogy a pontosság és az olcsóság (kicsi mintaszám) egymásnak ellentmondó követelmények. A mintavételek tervezésének éppen ez a kiindulópontja.
I.3 Sokaságok csoportosítása A statisztikai sokaságoknak többféle típusát különböztethetjük meg. Egyrészt léteznek álló és mozgó sokaságok, másrészt diszkrét és folytonos sokaságok. Az álló sokaság állapotot fejez ki, adatai időpontra értelmezhetőek. Álló sokaságnak tekinthető például a Budapesti Műszaki és Gazdaságtudományi Egyetem foglalkoztatottjainak vagy hallgatóinak létszáma 2013. január 1-jén. A mozgó sokaság folyamatot fejez ki, időtartamra értelmezhető. Mozgó sokaság például a BME-nél történő munkaerő-felvétel vagy az új hallgatók száma 2013 folyamán, vagy például a lakossági gázfogyasztás 2012 decemberében. A diszkrét sokaság elkülönülő egységekből áll. Az elkülönülő egységek lehetnek például vállalatok, hallgatók, foglalkoztatottak stb. A folytonos sokaság olyan tömegből áll, amelynek egységeit önkényesen határozzuk meg. Folytonos sokaság pl. a gázfogyasztás, kőolajtermelés, búza vetésterülete stb. A statisztikai sokaság tartalmazhat véges vagy végtelen számosságú egyedet. A társadalmigazdasági jelenségek vizsgálatakor általában véges sokaságokkal van dolgunk, e megfigyelések ugyanis térben és időben pontosan lehatárolt egyedek összességére
7
vonatkoznak. Végtelen sokaságokkal a kísérletek tervezése és elemzése során, illetve különböző folyamatok modellezésénél találkozunk.
I.4 Ismérvek A sokasággal összefüggő fogalom az ismérv. Olyan szempont(ok), amely(ek) alapján a sokaságot megfigyeljük, a sokaság egységeinek jellemzője. Így ismérv pl. a foglalkoztatottaknál a jövedelem nagysága, a nem, a betöltött munkakör, részvényeknél a hozam vagy az árfolyam. A sokaság egységei bizonyos jellemzők szerint egyformák, ezek a közös ismérvek. Más jellemzők tekintetében különböznek, ezek a megkülönböztető ismérvek. Így például, ha Magyarország területén működő felsőoktatási intézmények képezik a megfigyelt sokaságot (2013. január 1-jén), a közös ismérvek például a területi megjelölés (Magyarország), a tevékenység jellege (felsőoktatás), és az időponti megjelölés (2013.01.01.). Megkülönböztető ismérvek például a foglalkoztatottak száma, a szakok száma, a hallgatók száma, a tőkeállomány nagysága, az intézmény létesítésének éve stb. Az ismérv lehetséges kimeneteleit ismérv változatnak (tulajdonságnak) nevezzük. A két változattal rendelkező ismérvet alternatív ismérvnek nevezzük. Például népesség vizsgálata esetén a nemhez való tartozás: férfi, nő, vagy legyártott termékek vizsgálata esetén: selejtes, nem selejtes. Az ismérv lehet mennyiségi és nem mennyiségi ismérv. A mennyiségi ismérv méréses jellemző, kvantitatív változó. A sokaság egységeire vonatkozó számszerű megjelölést jelent, egy számmal írható le, amellyel matematikai műveletek végezhetők. Mennyiségi ismérv például foglalkoztatottak esetében a kereset nagysága, vagy az életkor, gazdálkodó szervezetek esetében például a tőkeállomány. A nem mennyiségi ismérv a sokaság egységeire vonatkozóan valamilyen kategóriát rögzít, típusa szerint lehet időbeli, területi és minőségi ismérv. Az időbeli ismérv a sokaság egységeire vonatkozó időponti vagy időtartam megjelölést jelent: pl. egy vállalat létesítésének éve vagy működésének időtartama. A területi ismérv a sokaság egységeire nézve földrajzi elhatárolást fejez ki (így pl. az egyes felsőoktatási intézményeket megkülönböztető területi ismérv, hogy melyik megyében találhatók). A minőségi ismérv (minősítéses jellemző) a sokaság egységeinek valamilyen minőségi tulajdonság szerinti megjelölése (pl. a foglalkoztatottak nem, vagy munkakör szerinti hovatartozása). Az ismérvek különböző típusaival összefüggésben foglalkozni kell azok méréselméleti kérdéseivel. E szempontok figyelmen kívül hagyásával előfordulhat, hogy nem megfelelően választjuk meg az alkalmazható módszereket, illetve műveleteket.