Általános statisztika I Havasy, György Molnár, Máténé Szunyogh, Zsuzsanna Tóth, Mártonné Korpás, Attiláné Csernyák, László
Általános statisztika I Havasy, György Molnár, Máténé Szunyogh, Zsuzsanna Tóth, Mártonné Korpás, Attiláné Csernyák, László
Publication date 1996 Szerzői jog © 1996 Havasy György, Korpás Attiláné, Molnár Máténé, Szunyogh Zsuzsanna, Tóth Mártonné, Nemzeti Tankönyvkiadó Rt. Szerkesztette: Dr. Korpás Attiláné- főiskolai docens Szerzők: Dr. Havasy György - főiskolai docens (4. fejezet) Dr. Molnár Máténé - főiskolai docens (3. fejezet) Dr. Szunyogh Zsuzsanna - főiskolai docens (5. fejezet) Dr. Tóth Mártonné - főiskolai adjunktus (1. és 2. fejezet) A gyakorlófeladatokat: Dr. Korpás Attiláné állította össze. Szakmai lektor: Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása, illetve utánközlése a kiadó engedélye nélkül tilos!
Tartalom 1. A statisztika alapfogalmai .......................................................................................................................................................................... 1 1.1. A statisztika tárgya és szerepe ....................................................................................................................................................... 1 1.2. A statisztikai sokaság és ismérv ...................................................................................................................................................... 2 1.3. Statisztikai adat .............................................................................................................................................................................. 6 1.4. Statisztikai csoportosítás és összehasonlítás ................................................................................................................................. 10 1.5. Viszonyszámok ............................................................................................................................................................................. 15 1.6. Átlagok ......................................................................................................................................................................................... 18 1.7. Gyakorlófeladatok ......................................................................................................................................................................... 25 2. Egy ismérv szerinti elemzés .................................................................................................................................................................... 30 2.1. A mennyiségi ismérv szerinti elemzés ........................................................................................................................................... 30 2.1.1. A mennyiségi ismérv .......................................................................................................................................................... 30 2.1.2. Gyakorisági sorok .............................................................................................................................................................. 32 2.1.3. Értékösszegsor .................................................................................................................................................................. 41 2.1.4. A gyakorisági sorok grafikus ábrázolása ............................................................................................................................. 47 2.1.5. Helyzetmutatók .................................................................................................................................................................. 54 2.1.6. Szóródási mutatók ............................................................................................................................................................. 71 2.1.7. Az aszimmetria mérőszámai .............................................................................................................................................. 81 2.1.8. A koncentráció elemzése ................................................................................................................................................... 83 2.2. Az időbeli ismérv szerinti elemzés ................................................................................................................................................ 87 2.2.1. Idősorok ............................................................................................................................................................................ 87 2.2.2. Dinamikus viszonyszámok .................................................................................................................................................. 89 2.2.3. Az idősorok grafikus ábrázolása ......................................................................................................................................... 93 2.2.4. Az idősorok elemzése átlagokkal ........................................................................................................................................ 94 2.3. Gyakorlófeladatok ....................................................................................................................................................................... 100 3. A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése .............................................................................................. 107 3.1. A statisztikai táblákról általában ................................................................................................................................................... 107 3.2. Az egyszerű táblák elemzése ...................................................................................................................................................... 110 3.2.1. Intenzitási viszonyszámok és dinamikus viszonyszámok együttes alkalmazása ................................................................... 111 3.2.2. A fejlődési tendenciák kimutatása, összehasonlítása ......................................................................................................... 117 3.3. A csoportosító táblák elemzése ................................................................................................................................................... 123 3.3.1. Rész- és összetett viszonyszámok ................................................................................................................................... 124 3.3.2. Szerkezet- és dinamikai változás vizsgálata ...................................................................................................................... 127 3.4. A kombinációs táblák (a sztochasztikus kapcsolatok) elemzése .................................................................................................... 133 3.4.1. Függvényszerű kapcsolat. Függetlenség ........................................................................................................................... 139 3.4.2. Az asszociáció szorosságának mérése ............................................................................................................................. 141 iii
Általános statisztika I 3.4.3. A vegyes kapcsolat elemzése ........................................................................................................................................... 149 3.4.4. A korreláció elemzése csoportosított adatokból kiindulva ................................................................................................... 165 3.5. Gyakorlófeladatok ....................................................................................................................................................................... 172 4. Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása ........................................................................................................... 180 4.1. A standardizálás módszere ......................................................................................................................................................... 180 4.2. Az összetett intenzitási viszonyszámok (főátlagok) különbségének felbontása összetevőire ............................................................ 184 4.2.1. A részviszonyszámok (részátlagok) különbözőségének hatása ........................................................................................... 186 4.2.2. Az összetétel különbözőségének hatása ........................................................................................................................... 188 4.3. Indexszámítás standardizálás alapján (hányadosfelbontás) ........................................................................................................... 189 4.3.1. A főátlagindex .................................................................................................................................................................. 190 4.3.2. A részátlagindex .............................................................................................................................................................. 192 4.3.3. Az összetételhatás indexe ................................................................................................................................................ 194 4.4. Alkalmazási területek .................................................................................................................................................................. 195 4.4.1. Az átlagbérek időbeli változásának vizsgálata ................................................................................................................... 196 4.4.2. Az átlagárak időbeli változásának vizsgálata ..................................................................................................................... 198 4.5. Gyakorlófeladatok ....................................................................................................................................................................... 202 5. Érték-, ár- és volumenindexek ............................................................................................................................................................... 209 5.1. Az indexszám fogalma ................................................................................................................................................................ 209 5.2. Érték-, ár- és volumenindex-számítás .......................................................................................................................................... 209 5.2.1. Indexszám számítása aggregát formában ......................................................................................................................... 211 5.2.2. Az indexek átlagformái ..................................................................................................................................................... 213 5.3. Az indexek súlyozása ................................................................................................................................................................. 218 5.4. Összefüggések az indexszámításban .......................................................................................................................................... 221 5.4.1. Az indexszámok közötti összefüggések ............................................................................................................................ 221 5.4.2. Az aggregátumok közötti összefüggések .......................................................................................................................... 222 5.4.3. Csoportosított sokaságra számított indexek ...................................................................................................................... 224 5.5. Az indexszámok gyakorlati alkalmazása ...................................................................................................................................... 227 5.6. Indexsorok .................................................................................................................................................................................. 229 5.6.1. Az indexsorok közötti összefüggések ................................................................................................................................ 234 5.7. Területi indexek .......................................................................................................................................................................... 235 5.8. Gyakorlófeladatok ....................................................................................................................................................................... 238 A. Irodalom ............................................................................................................................................................................................... 247 6. Tárgymutató .......................................................................................................................................................................................... 248
iv
Az ábrák listája 2.1. A háztartások taglétszám szerinti eloszlásának bot-ábrája ...................................................................................................................... 48 2.2. A lakások vízfogyasztás szerinti megoszlásának hisztogramja ................................................................................................................ 49 2.3. A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok ............................................................................. 50 2.4. A biztosítások biztosítási díj szerinti megoszlásának hisztogramja .......................................................................................................... 52 2.5. A lakások vízfogyasztás szerinti megoszlásának gyakorisági poligonja ................................................................................................... 53 2.6. A biztosítások biztosítási díj szerinti megoszlásának gyakorisági poligonja .............................................................................................. 54 2.7. ............................................................................................................................................................................................................. 55 2.8. ............................................................................................................................................................................................................. 56 2.9. A lakások vízfogyasztás szerinti megoszlása ......................................................................................................................................... 58 2.10. A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése ...................................................................... 69 2.11. ........................................................................................................................................................................................................... 71 2.12. A népesség koncentrációja Nógrád és Zala megyében (Lorenz-görbe) ................................................................................................. 86 2.13. A takarékbetét-állomány alakulása ...................................................................................................................................................... 93 2.14. A Magyarországra érkező turisták számának alakulása ........................................................................................................................ 94 2.15. Az épített lakások számának alakulása ............................................................................................................................................... 98 3.1. A statisztikai táblák típusai .................................................................................................................................................................. 110 3.2. Az egészségügyi ellátás alakulása az 1985-ös bázisévhez viszonyítva ................................................................................................. 121 3.3. Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva ................................................. 121 3.4. A lakásállomány szobaszám szerinti összetételének alakulása ............................................................................................................. 132 3.5. A lakásállomány szobaszám szerinti összetételének alakulása ............................................................................................................. 133 3.6. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat ................................................................................... 168 5.1. ........................................................................................................................................................................................................... 224
v
A táblázatok listája 1.1. Példák a sokaságokra ............................................................................................................................................................................ 3 1.2. Csoportosító sor általános sémája ........................................................................................................................................................ 10 1.3. A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban ............................................................................... 11 1.4. A népesség megyék szerinti megoszlása 1994. január 1-jén .................................................................................................................. 12 1.5. Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál ............................................................................................................. 14 1.6. Az 1 főre jutó GDP néhány európai országban 1993-ban ....................................................................................................................... 14 1.7. A 20–24 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén .......................................................................................... 16 1.8. A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál ................................................................................................ 17 1.9. Magyarország 1993. évi idegenforgalmát jellemző adatok ...................................................................................................................... 17 3 2.1. Egy társasház 50 lakásának az elmúlt kéthavi vízfogyasztása a leolvasás sorrendjében (adatok m -ben) .................................................. 30 3 2.2. A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m -ben) ........................................................................................................ 31 2.3. A gyakorisági sorok általános sémája ................................................................................................................................................... 33 2.4. A lakások szobaszám szerinti eloszlása ................................................................................................................................................ 35 2.5. A társasház lakásainak megoszlása a vízfogyasztás szerint ................................................................................................................... 36 2.6. A lakások vízfogyasztás szerinti megoszlása ......................................................................................................................................... 37 2.7. A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában .............................................................................................. 38 2.8. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................... 39 2.9. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................... 40 2.10. Az értékösszegsor általános sémája .................................................................................................................................................... 41 2.11. A település háztartásainak taglétszám szerinti eloszlása ...................................................................................................................... 42 2.12. A település lakosainak eloszlása az egyes háztartások taglétszáma szerint .......................................................................................... 42 2.13. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 43 2.14. Munkatábla az osztályközép meghatározásához .................................................................................................................................. 44 2.15. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 45 2.16. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 46 2.17. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................. 47 2.18. Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint ......................................................... 50 2.19. Munkatábla a medián becsléséhez ...................................................................................................................................................... 61 2.20. Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok ....................................................................................... 63 2.21. Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok ......................................................................................... 65 2.22. A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás) .................................................................................... 70 2.23. Munkatábla az átlagos eltérés és a szórás számításához ..................................................................................................................... 75 2.25. A szimmetrikus és aszimmetrikus eloszlások jellemzői ......................................................................................................................... 81 2.26. Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január 1-jén ........................................... 84 2.27. Munkatábla a koncentráció vizsgálatához (a fejrovatba csak a jelöléseket írva) ..................................................................................... 85 vi
Általános statisztika I 2.28. Magyarország személygépkocsi-állományának alakulása (az évek december 31-én) ............................................................................. 88 2.29. Magyarországra érkező külföldi turisták számának alakulása ................................................................................................................ 88 2.30. A bázis- és láncviszonyszámok számítása ........................................................................................................................................... 90 2.31. A lakosság takarékbetét-állományának alakulása (az évek december 31-én) ......................................................................................... 90 2.32. Valamely utazási iroda valutakészletének és valutaértékesítésének adatai ............................................................................................ 95 2.33. Az épített lakások számának alakulása Magyarországon ...................................................................................................................... 97 3.1. A budapesti székhelyű külföldi érdekeltségű vállalkozások számának alakulása (december 31-i adatok) ................................................. 107 3.2. A magyarországi népesség életkor szerinti megoszlásának alakulása ................................................................................................... 108 3.3. A magyarországi lakott lakások számának megoszlása komfortosság és településtípusok szerint (1990. január 1.) .................................. 109 3.4. Az orvosi ellátás néhány adata (december 31-i adatok) ....................................................................................................................... 111 3.5. Orvosi ellátásra vonatkozó adatok ....................................................................................................................................................... 114 3.6. Az egészségügyi ellátásra vonatkozó adatok (december 31-i adatok) ................................................................................................... 118 3.7. Az egészségügyi ellátásra vonatkozó adatok ....................................................................................................................................... 118 3.8. A csoportosító tábla általános sémája ................................................................................................................................................. 123 3.9. Magyarország népességére és a magyarországi lakásokra vonatkozó adatok (1994. január 1.) .............................................................. 125 3.10. A magyarországi népességszám és lakásellátottság településtípusonként (1994. január 1.) .................................................................. 126 3.11. A magyarországi lakások számának megoszlása szobaszám szerint (január 1-jei adatok) .................................................................... 127 3.12. A magyarországi lakásállomány nagyságának és szobaszám szerinti összetételének alakulása ............................................................ 128 3.13. Magyarország népességszámának és megoszlásának alakulása településtípusonként (január 1-jei adatok) .......................................... 129 3.14. A magyarországi lakásállományra vonatkozó adatok .......................................................................................................................... 131 3.15. A kontingenciatábla sémája ............................................................................................................................................................... 135 3.16. A közép- és felsőfokú tanintézetekben nappali tagozaton tanulók számának megoszlása lakóhelyük és a tanintézet típusa szerint (1990. január 1.) ....................................................................................................................................................................................... 136 3.17. A kontingenciatábla sémája relatív gyakoriságokkal (megoszlási viszonyszámokkal) ............................................................................ 137 3.18. A tanulók relatív gyakoriságai lakóhelyük és a tanintézet típusa szerint ............................................................................................... 138 3.19. A tanulók %-os megoszlása lakóhelyük és a tanintézet típusa szerint ................................................................................................. 138 3.20. Az E ismérv szerinti rész- és összetett megoszlási viszonyszámok ..................................................................................................... 139 3.21. Kontingenciatáblázat alternatív ismérvek esetén ................................................................................................................................. 141 3.22. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) ............................................................ 143 3.23. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) ............................................................ 144 3.24. A függetlenség feltételezésével számított gyakoriságok (
) ............................................................................................................... 146
3.25. A számítása ................................................................................................................................................................................ 3.26. A vegyes kapcsolat adatbázisa ......................................................................................................................................................... 3.27. Egy bizonyos települési székhellyel működő jogi személyiségű ipari szervezetek létszámadatai (főben) ................................................ 3.28. A kontingenciatábla sémája vegyes kapcsolat esetén ......................................................................................................................... 3.29. Egy bizonyos települési székhellyel működő ipari szervezetek megoszlása gazdálkodási forma és létszám szerint .................................
vii
147 149 150 152 153
Általános statisztika I 3.30. A vizsgált ipari szervezetekre vonatkozó rész- és főátlagok ................................................................................................................ 156 3.31. A vizsgált ipari szervezetekre vonatkozó adatok ................................................................................................................................. 160 3.32. A korrelációs tábla sémája ................................................................................................................................................................ 165 3.33. Egy társasházban lévő lakások megoszlása a szobák száma és a lakásban lakó személyek száma szerint ........................................... 166 3.34. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye ................................. 167 3.35. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye ................................. 171 4.1. Jövedelem- és létszámadatok két vállalkozásnál .................................................................................................................................. 180 4.2. Két összetett intenzitási viszonyszám meghatározása és összehasonlítása ........................................................................................... 182 4.3. Két ország halandósági viszonyainak alakulása (fiktív adatok) .............................................................................................................. 184 4.4. Egy megye forgalmi és népességadatai az 1994. és 1995. évben ........................................................................................................ 190 4.5. A lakosság összetételének változása ................................................................................................................................................... 195 4.6. Egy vállalkozás munkaügyi adatai ....................................................................................................................................................... 196 4.7. 4.7. táblázat ....................................................................................................................................................................................... 196 4.8. Egy homogén árucsoportba tartozó három cikk értékesítési adatai ....................................................................................................... 200 5.1. Jövedelem Egy iparcikkeket forgalmazó fővárosi áruház Videoton teletextes televízióforgalma az 1993–1994-es években ........................ 210 5.2. Az egyes televíziótípusok érték-, ár- és mennyiségváltozását jelző egyedi indexek ................................................................................ 211 5.3. Az indexek kiszámítási képleteinek áttekintő táblázata ......................................................................................................................... 217 5.4. A Videoton televíziók forgalmának alakulása az 1993–1994. években egy fővárosi, iparcikkeket forgalmazó üzletben .............................. 225 5.5. Néhány gyümölcs felvásárlására vonatkozó adatok az 1990–1993. években ......................................................................................... 229 5.6. Az 1990–1993. évi felvásárlás összértéke különböző évi árakon számítva ............................................................................................ 230 5.7. Néhány cikk felhozatalára vonatkozó adatok két alföldi város piacán 1995 júniusában ........................................................................... 236
viii
1. fejezet - A statisztika alapfogalmai 1.1. A statisztika tárgya és szerepe A bennünket körülvevő világ megismeréséhez, a társadalom és a gazdaság működéséhez, bármilyen szintű döntéshez sokféle információra van szükség. Az információk között kitüntetett szerepe van a számszerű információknak, mert ezek a másféle információknál tömörebbek és egyértelműbbek. A számszerű információk gyűjtésében, feldolgozásában, elemzésében és publikálásában fontos szerepe van a statisztikának. A statisztika a valóság tömör, számszerű jellemzésére szolgáló tudományos módszertan, illetve gyakorlati tevékenység. A statisztikai tevékenység az emberiség fejlődése folyamán jóval korábban kialakult, mint a statisztika tudománya. A statisztikai tevékenység úgyszólván egyidős az állammal, kezdetben az állam fenntartásához szükséges információk (pl. a fegyverforgatásra alkalmas férfiak száma, a termények mennyisége stb.) gyűjtése és közlése volt a feladata. A statisztikatudomány kialakulása azonban csupán a kapitalizmus kifejlődésével vette kezdetét. Ekkor a népesség és a termelés koncentrálódása következtében a korábbi egyszerű nyilvántartási formák már nem voltak alkalmasak az egyre sokoldalúbb statisztikai jellegű állami és társadalmi igények kielégítésére. A statisztikatudomány fokozatosan fejlődve – amihez nagy lendületet adott a valószínűség-számítás kialakulása és tételeinek elterjedése – önálló módszertudománnyá vált. Eredményeit a társadalomtudományok mellett széles körben alkalmazzák a természettudomány különböző területein is. A statisztikának egyre nagyobb szerepe van a gazdasági döntések előkészítése, az üzleti problémák elemzése mellett pl. az orvosi és biológiai kérdések megválaszolásában is. A statisztika mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk gyűjtése, feldolgozása, elemzése, ennek alapján a vizsgált jelenség egészének tömör, számszerű jellemzése. A statisztika másrészt az információk összegyűjtésének, leírásának, elemzésének, értékelésének és közlésének tudományos módszertana. A fenti megfogalmazásban igen fontos a tömeges jelző. A statisztika mindig tömegesen (nagy számban) előforduló jelenségek vizsgálatával foglalkozik. E tömegjelenségek igen sokfélék lehetnek, pl. egy ország népessége, egy áruház forgalma, egy ország gépkocsiállománya, az energiatermelés, a lakosság fogyasztása stb. A statisztikai módszerek között vannak egészen egyszerű eljárások és vannak bonyolultabb, matematikai-statisztikai módszerek. A statisztikai módszertanon belül megkülönböztetünk leíróstatisztikát és statisztikai következtetést. A leíró statisztika az információk összegyűjtését, összegzését, tömör, számszerű jellemzését szolgáló módszereket foglalja magában. Ide sorolhatjuk az adatgyűjtést, az adatok ábrázolását, csoportosítását, az adatokkal végzett egyszerűbb aritmetikai műveleteket, az eredmények áttekinthető formában való megjelenítését. Leíró statisztikai módszereket alkalmazunk például akkor, ha valamely település háztartásait (tömegjelenség) megfigyeljük taglétszámuk, jövedelmük, kiadásaik, fogyasztási szokásaik stb. szerint. A begyűjtött információkat rögzítjük, majd csoportosítjuk a háztartásokat jövedelem, taglétszám stb. szerint, kiszámíthatjuk a háztartások átlagos jövedelmét, átlagos rezsiköltségét stb. A csoportosított adatokat, eredményeket szemléletes módon (ábrákkal, táblázatos formában) megjelenítjük, közzétesszük. 1
A statisztika alapfogalmai A statisztikai következtetést akkor alkalmazzuk, ha a tömegjelenségek egyedeinek teljes körű megfigyelésére nincs lehetőség, vagy a teljes körű megfigyelés túl költséges – így gazdaságtalan – és időigényes. Ilyen esetben az egyedek egy szűkebb csoportját figyeljük meg. A viszonylag kis számú egyedre vonatkozó információk és az azokból számított eredmények alapján következtetünk a tömegjelenség egészére, jellemzőire, tulajdonságaira. Következtetéses statisztikai módszereket alkalmazunk például a közvélemény-kutatásoknál, a forgalomba kerülő termékek minőségének ellenőrzésekor, a lakosok életkörülményeinek vizsgálatánál. További alkalmazással találkozhatunk különböző tényezők közötti összefüggések vizsgálatánál. A lakosság jövedelme (vagy annak változása) pl. miként befolyásolja a tartós fogyasztási cikkekre fordított kiadási összegeket (vagy azok változását), vagy különböző ráfordítások hogyan befolyásolják a termelés eredményességét. Könyvünk mind a leíró statisztikai, mind a következtetéses statisztikai módszerek közül a komoly matematikai apparátust nem igénylő, leggyakrabban használt elemzési eszközöket tárgyalja. A statisztikai módszertant más szempont szerint is csoportosíthatjuk. Megkülönböztetünk általános statisztikát és szakstatisztikát. Az általános statisztika a statisztika általános elméleti kérdéseivel, a statisztikai vizsgálatok során alkalmazásra kerülő módszerekkel általánosságban foglalkozik, a szakstatisztika a társadalmi-gazdasági élet egy-egy területének statisztikai módszerekkel való vizsgálatát tárgyalja. Ilyen például a népességstatisztika, az idegenforgalmi statisztika stb.
1.2. A statisztikai sokaság és ismérv A statisztika – mint már említettük – mindig tömegesen előforduló jelenségek és az azokat alkotó egységek vizsgálatával foglalkozik. A statisztikai sokaság a megfigyelés tárgyát képező egyedek összessége, halmaza. A sokaságot alkotó egyedeket – a halmaz elemeit – a sokaság egységeinek nevezzük. Statisztikai sokaságot alkothatnak élőlények, pl. a magyar felsőoktatás hallgatói, a Magyarországra érkező külföldi turisták, az ország lóállománya; tárgyak, pl. az ország lakásállománya, a kórházakban használt röntgenkészülékek; szervezetek, pl. a magyar főiskolák, ipari vállalkozások; képzett egységek, pl. bruttó hazai termék, gyümölcsfogyasztás stb. Az élőlényekből, tárgyakból, szervezetekből álló sokaságok egyértelműen elkülönülő egységekből állnak. Az ilyen sokaságokat diszkrét sokaságoknak nevezzük. A képzett egységekből álló, ún. folytonos sokaságoknál az egységeket önkényesen határozhatjuk meg. Pl. a sokaság egy egysége: 1 Mrd Ft GDP, 1 kg gyümölcsfogyasztás stb. A statisztikai sokaságok abból a szempontból is különböznek egymástól, hogy csak egy időpontra vonatkozóan vagy csak időtartamra vonatkoztatva 1 2 értelmezhetők. Pl. egy megye népessége a természetes szaporodás (fogyás) és a vándorlási különbözet miatt állandóan változhat. Ezért e 1
Az élveszületések és halálozások különbsége.
2
A statisztika alapfogalmai 3
sokaság csak időpontban (pl. 1995. december 31. 0 óra, 00 perckor) értelmezhető, „ragadható meg”. Ugyanakkor a Videoton-gyár termelése – mivel a termelés egy folyamat – időpontban nem, csak egy időtartamban (a termelés egy napon, egy hónapban, egy évben stb.) értelmezhető. Az időpontra vonatkoztatva értelmezhető sokaságokat álló sokaságoknak, az időtartamra vonatkoztatva értelmezhetőket pedig mozgó sokaságoknak nevezzük. A sokaság tartalmazhat véges (a gépkocsiállomány egy adott időpontban és területen) és végtelen (azonos körülmények között tetszőlegesen sokszor megismételhető kísérletek eredményeinek halmaza) elemszámú egyedet. A társadalmi-gazdasági vizsgálatokat általában véges számú egyed megfigyelésével végezzük. A sokaságok fajtáit szemlélteti az 1.1. táblázat:
1.1. táblázat - Példák a sokaságokra A sokaság megnevezése
egysége
fajtája
Zala megye személygépkocsi-állománya 1995. december 31-én
egy személygépkocsi diszkrét, álló, véges
A lakosság takarékbetétállománya 1995. július 31-én
egymilliárd (millió folytonos, álló, véges stb.) Ft betétállomány
1995-ben Nógrád megyében
egy gyermek
diszkrét, mozgó, véges
született gyermekek Magyarország 1995. évi sörfogyasztása
egy liter (hektoliter, üveg stb.) sörfogyasztás
folytonos, mozgó, véges
A statisztika a sokaságot az egyedeken keresztül vizsgálja, ugyanis bármely sokaság az egységei tulajdonságainak felsorolásával jellemezhető. Statisztikai ismérv a statisztikai sokaság egyedeit jellemző tulajdonság. Az ismérv lehetséges kimenetelei az ismérvváltozatok. Ismérv pl. a gépkocsik típusa, fogyasztása, gyártási helye, ipari vállalkozásoknál a foglalkoztatottak száma, a bruttó kibocsátás, a területi elhelyezkedés, a vállalkozás profilja. 2
A megyébe letelepülő és elköltöző népesség különbsége. Ezt az időpontot a megfigyelés eszmei időpontjának szokás nevezni.
3
3
A statisztika alapfogalmai Ismérvváltozatok pl. a gépkocsik típusánál a Lada, Opel stb., az ipari vállalkozások területi elhelyezkedésénél Baranya megye, Békés megye stb., a gépkocsi fogyasztása esetén pedig számadatok. Ha az ismérv csak két változattal rendelkezik, alternatív ismérvnek nevezzük. Ilyen pl. a nem (változatai: férfi, nő). A kettőnél több változattal rendelkező ismérvek is átalakíthatók alternatív ismérvvé. Pl. az aktív keresők évi jövedelme kettőnél több változattal rendelkező ismérv (elvileg annyi változata lehetséges, ahány aktív kereső van), alternatívvá alakítva: legfeljebb 500 000 Ft, ill. 500 000 Ft-nál nagyobb évi jövedelemmel rendelkezők. Egy adott sokaságra vonatkozóan beszélhetünk közös és megkülönböztető ismérvekről. Azokat az ismérveket, amelyek szerint a sokaság egységei egyformák (pl. amelyek a sokaságot definiálják), közös ismérveknek nevezzük. Azokat az ismérveket, amelyek szerint az egyedek különböznek egymástól (ezek alapján a sokaság részsokaságokra bontható), megkülönböztető ismérveknek nevezzük. Ha a megfigyelt sokaságot a Pénzügyi és Számviteli Főiskola Zalaegerszegi Intézete nappali tagozatára 1995. szeptember 11-én beiratkozott I. évfolyamos hallgatók képezik, akkor a definiáló közös ismérvek: a beiratkozás helye (PSZF Zalaegerszegi Intézete), az évfolyam (I.), a beiratkozás időpontja (1995. szept. 11.), megkülönböztető ismérvek pl. a hallgatók neme, iskolai végzettsége, lakcíme, életkora, a felvételi vizsgán elért pontszáma stb. Attól függően, hogy az ismérvváltozatok milyen jellegű információt adnak a sokaság egyedeiről, különböző fajta ismérveket különböztetünk meg. Az ismérvek fajtái: – időbeli ismérvek: az egységek időbeli elhelyezésére szolgáló rendező elvek. Ismérvváltozatai: időpontok, időszakok. (Pl. a főiskolai hallgatók születési ideje, a gépkocsik gyártási ideje.) – területi ismérvek: az egységek térbeli elhelyezésére szolgáló rendező elvek. Ismérvváltozatai: földrajzi egységek. (Pl. a főiskolai hallgatók lakhelye, a gépkocsik gyártási helye.) – minőségi ismérvek: az egyedek számszerűen nem mérhető tulajdonságai. (Pl. a főiskolai hallgatók neme, a gépkocsik típusa.) – mennyiségi ismérvek: az egyedek számszerűen mérhető (megszámlálható) tulajdonságai. Ismérvváltozatait ismérvértékeknek nevezzük. (Pl. a főiskolai hallgatók felvételi pontszáma, a gépkocsik fogyasztása.) 4
A statisztika alapfogalmai Mérési szintek A felsorolt ismérvek közül csak a mennyiségi ismérv változatai számadatok. Bizonyos szabályok betartása mellett azonban minden ismérv lehetséges változatai számértékekké alakíthatók. Például a nem ismérvének két változata van: férfi és nő. E változatokhoz számértékeket rendelhetünk: férfi:1; nő:2. Ilyen alapon a sokasági egységek bármilyen tulajdonságának megfigyelése és rögzítése az egységek számokkal való jellemzésének, azaz mérésének tekinthető. A mérés számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgokhoz, tárgyakhoz, eseményekhez), illetve ezek bizonyos tulajdonságaihoz. A hozzárendelési szabályok alapján négy mérési skálát (szintet) különböztetünk meg: – névleges skála, – sorrendi skála, – intervallumskála, – arányskála. A névleges (nominális)mérési skála (mérési szint) a számok kötetlen hozzárendelését jelenti. Nominális skálát alkalmazunk a területi és minőségi ismérvek szerinti megfigyeléseknél. E skálán való méréskor a számok (kódszámok) csak a sokaság egyedeinek azonosítására szolgálnak. Ilyen nominális skála pl. a rendszám, irányítószám, biztosítási szám stb. Mivel a számok csak az egyedek azonosítását (megkülönböztetését) szolgálják, közöttük az egyéb relációk (pl. nagyobb, kisebb) nem értelmezhetők, ezért e számokkal végzett különböző számtani műveleteknek semmi értelme nincs. A sorrendi (ordinális) mérési skála a sokaság egyedeinek egy közös tulajdonság alapján való sorba rendezése. Ilyen sorrendi skála pl. a hallgatók osztályzata, a tornászok helyezési sorrendje, az országok hitelképességi sorrendje, a termékek minőségi osztályai stb. A skálán – bár a sorszámok közötti különbség azonos (egy-egy) – az egyes egyedek nem feltétlenül egyenlő távolságra helyezkednek el egymástól. Az első és második helyre sorolt tornász teljesítménye között pl. nem biztos, hogy ugyanakkora a különbség, mint a negyedik és ötödik helyre sorolté között. A mérésből származó adatokkal (sorszámokkal) ezért csak azok a műveletek végezhetők, amelyek során kizárólag a skálát képező számértékek sorrendisége kerül kihasználásra. Az intervallumskála (különbségi skála) már a szó hagyományos értelmében is mérést jelent, ugyanis a skálaértékek különbségei is valós információt adnak a sokaság egységeiről. Az intervallumskálának egy jellegzetes tulajdonsága, hogy a mértékegység és a nullapont meghatározása önkényes, és e nulla érték nem tükrözi a tulajdonság hiányát. Ilyen skálán mérik például a hőmérsékletet. Ha a skála mértékegysége a Celsius-fok (pl. a Fahrenheit-fok is használatos mértékegység), a skála nullpontja a víz fagyáspontja, és ez nyilvánvalóan nem tekinthető abszolút nullpontnak. A skálán két érték összege vagy aránya nem értelmezhető. Pl. nem mondhatjuk, hogy a + 20 °C-os és a + 5 °C-os hőmérséklet összege + 25 °C, vagy hogy a 20 °C-os hőmérséklet kétszerese a 10 °C-osnak. Ugyanakkor két-két adat különbsége, a két különbség összege és aránya már értelmezhető. 5
A statisztika alapfogalmai Pl. az 5 °C és a 10 °C közötti különbség azonos a 15 °C és 20 °C közötti különbséggel. A 20 °C és 30 °C közötti különbség kétszerese az előbbi bármelyik különbségnek. Az arányskálán történő mérés – a legmagasabb mérési szint – nyújtja a legtöbb információt. A skálának valódi nullpontja van, mely nullpont a tulajdonság hiányát jelzi. A skála bármely két értékének aránya független a mértékegységtől. E skálán nyert számokkal a statisztikai elemzésekhez szükséges összes művelet elvégezhető. Arányskálán mért értékek pl. a hosszúság, a jövedelem, a költség, a termelés mennyisége stb.
1.3. Statisztikai adat A statisztikatudomány fontos alapfogalmai közé tartozik a statisztikai adat fogalma. A statisztikai adat valamely statisztikai sokaság elemeinek száma vagy a sokaság valamilyen másféle számszerű jellemzője, mérési eredmény. A statisztikai adat mindig tartalmaz fogalmi jegyeket, időbeli, térbeli vagy másféle azonosítókat és ezek mellett egy számértéket. A statisztikai adat tehát nem pusztán a számérték maga. Statisztikai adat pl.: 1994-ben hazánkban 657 ezer tonna volt az almatermés; Magyarország népessége 1994. január 1-jén 10 277 ezer fő volt; 1992-ről 1993-ra az 1 főre jutó reáljövedelem 5%-kal csökkent. Azokat a statisztikai adatokat, melyekhez mérés vagy számlálás útján jutunk, alapadatoknak nevezzük (almatermés, népesség száma). Két vagy több alapadattal végzett műveletek eredményeként leszármaztatott adatokhoz jutunk. Pl. az ország személygépkocsi-állománya 1992. december 31-én 2 058 334 db, 1993. december 31-én 2 091 623 db volt. E két alapadatból osztással képzett leszármaztatott adat:
A személygépkocsi-állomány 1 év alatt 1,016-szeresére, vagyis 101,6%-ra, azaz 1,6%-kal nőtt. Statisztikai mutatószámok: azok a statisztikai adatok (általában leszármaztatott adatok), melyekkel valamilyen rendszeresen megismétlődő (pl. társadalmi, gazdasági) jelenséget statisztikailag jellemezhetünk. Az életszínvonal egyik mutatószáma pl. az 1 főre jutó reáljövedelem, a gazdasági fejlettségé az 1 főre jutó GDP, a termelékenységé az 1 órára jutó termelés stb. A statisztikai vizsgálatok kiindulópontját az alapadatok képezik. Az alapadatokkal szemben többféle követelményt támasztunk. 6
A statisztika alapfogalmai – Az adatok legyenek a felhasználás szempontjából elfogadható pontosságúak. Minél pontosabbakaz adatok,annál megalapozottabb döntéseket hozhatunk. – Az adatok kellő időben álljanak rendelkezésre. Az adatszolgáltatás gyorsasága ugyanis fontos szerepet játszik a társadalmi-gazdasági folyamatok alakításában. – A szükséges adatokhoz a lehető legkisebb ráfordítással (költséggel) jussunk hozzá. E követelményeknek – az elfogadható pontosság, a gyorsaság és a gazdaságosság – egy időben általában tökéletesen megfelelni nem lehet (például a gyorsaság a pontosság ellen hat). Az alapadatokhoz többféle módon juthatunk. A statisztikai elemzések forrását képezhetik az eredetileg nem statisztikai célra készült kimutatások, nyilvántartások. (Pl. az önkormányzatok lakónyilvántartása, gépkocsik nyilvántartásai, a gazdasági szervezetek különféle számviteli nyilvántartásai stb.) A statisztikai adatok másik forrását az e célra szervezett adatgyűjtések (adatfelvételek) képezik. Az adatgyűjtést (adatfelvételt) minden esetben megelőzi egy olyan adatfelvételi program kidolgozása, melyben a statisztikai tevékenység egészét megtervezzük. Az adatfelvétel végrehajtása előtt a vizsgálat eredményessége szempontjából tisztázni kell a felvétel célját, az adatfeldolgozás, az elemzés és a közlés menetét. Ennek elmaradása használhatatlan alapadatokhoz, téves információhoz vezethet. Az ilyen adatok, információk pedig megalapozatlan, hibás döntéseket eredményezhetnek. Ez csak úgy kerülhető el, hogy a vizsgálat céljának alárendelten tervezzük meg a statisztikai tevékenység teljes folyamatát az adatgyűjtéstől kezdve az adatközlésig. Az adatgyűjtés megtervezésénél dönteni kell arról is, hogy az adatfelvétel a vizsgált sokaság minden egységére kiterjedjen-e, vagy csak a sokaság megfelelő módon kiválasztott részére. Az adatfelvétel, attól függően, hogy a sokaság mekkora részére terjed ki, lehet teljes körű és részleges. A teljes körű felvétel a vizsgált sokaság valamennyi egyedére kiterjed. Ilyen felvételt csak véges elemszámú sokaság esetén lehet megvalósítani. A teljes körű megfigyelések jellegzetes példái a népszámlálások. A részleges felvétel a sokaságnak csak egy kiválasztott részére terjed ki. Végtelen elemszámú sokaság megfigyelése csak részleges adatfelvétellel lehetséges. Véges és nagy számú sokaság esetén is gyakran kerül sor azonban ilyen felvételre. Ennek elsősorban az a magyarázata, hogy a sokaság teljes körű megfigyelése jelentős költséggel jár és időigényes. Egy szakszerűen végzett részleges megfigyelés, amellett hogy olcsóbb és gyorsabb a teljes körű felvételnél, alkalmas a teljes sokaságra vonatkozó következtetések levonására is. A részleges adatfelvétel jellegzetes típusai: a reprezentatív adatfelvétel, a monográfia és egyéb részleges (nem reprezentatív) adatfelvételek. Reprezentatív (mintavételes) adatfelvételnek nevezzük a részleges felvételnek azt a fajtáját, amelynél a megfigyelésbe vont részsokaság kiválasztása meghatározott elvek, módszerek alapján történik, és a kiválasztott részsokaság hűen tükrözi (reprezentálja) az egész sokaságot. A megfigyelt sokaság egészét alapsokaságnak, a kiválasztott részsokaságot mintasokaságnak vagy röviden mintának nevezzük. A mintából származó minden eredményt a sokaság egészének jellemzésére használunk fel, a felvétel részlegessége ellenére a sokaság egészére általánosítjuk. E mintából való következtetés – éppen a felvétel részlegessége miatt – csak bizonyos hibával valósítható meg, amit mintavételi hibának nevezünk. 7
A statisztika alapfogalmai Ilyen mintavételes adatfelvételt alkalmazunk pl. a lakosság jövedelmének, fogyasztási szokásainak vizsgálatánál, a mezőgazdaságban a várható termésmennyiség becsléséhez, a közvélemény-kutatásoknál stb. A monográfia a sokaság egy vagy néhány kiemelt egyedének részletes statisztikai vizsgálatát jelenti. Ilyen például egy nagyon jó és egy nagyon rossz eredményt elérő bank tevékenységének, gazdálkodásának sokoldalú elemzése. Egyéb, részleges adatgyűjtéssel is találkozhatunk a gyakorlatban. Például, ha egy adott termék (pl. egy mosópor) vásárlói kérdőívet kapnak, és az önként kitöltött és beküldött kérdőíveket feldolgozzák. Az ilyen adatgyűjtések, bár hasznos információkat szolgáltatnak, nem általánosíthatók az alapsokaságra. A részleges felvétel megismert típusai közül a társadalmi-gazdasági statisztika legfontosabb és leggyakrabban használt módszere a reprezentatív megfigyelés. Az adatgyűjtések során általában kérdőíveket használunk, melyek a kérdések mellett a válaszok rögzítésére szolgáló üres rovatokat is tartalmaznak. A kérdőív lehet egyéni kérdőív és lajstrom. Az egyéni kérdőívre egy, a lajstromra több megfigyelési egység adatai kerülnek. A felvétel tárgyát képező sokaság egyedeit megfigyelési egységeknek nevezzük (azon egyedeket tehát, akikre (amikre) vonatkozóan adatokat (információkat) gyűjtünk). Ezek az egyedek nem feltétlenül azonosak az adatszolgáltató, az ún. számbavételi egységekkel. Például állatszámlálás esetén a megfigyelési egységek az egyes állatok, a számbavételi egységek pedig az egyes gazdálkodók, vállalkozók. A kérdőíveket önszámlálás esetén maga az adatszolgáltató tölti ki, kikérdezéses eljárásnál a számlálóbiztosok jegyzik fel a válaszokat. A statisztikai adatfelvételek egyik kulcskérdése a kérdőívek helyes megszerkesztése, ami a módszertani ismeretek mellett az adott terület alapos szakmai ismeretét is igényli. A feltett kérdéseknek egyértelműeknek, közérthetőeknek kell lenniük, és igazodniuk kell a vizsgálat céljaihoz. A nem eléggé körültekintően megfogalmazott kérdések ugyanis a valóságtól eltérő irányba terelhetik a válaszadást. Az előzőekből következik, hogy minden adatfelvétel bizonyos hibalehetőséget rejt magában. Hibát eredményezhet a pontatlan kérdéseket, fogalmakat tartalmazó kérdőív, az adatszolgáltató valóságostól eltérő válaszai, szervezési-végrehajtási hibák. Az eddig leírtakból látható, hogy a statisztikai adatok általában csak korlátozottan pontosak lehetnek. Egyrészt a már említett adatfelvételi hibák szinte elkerülhetetlen fellépése miatt, másrészt az adatfeldolgozás és adatközlés során előforduló hibák miatt. Ezért a valóságos (pontos) adat és a hibákkal torzított mért adat egymástól eltér. A valóságos adat (A) és a mért adat
különbségét a statisztikai adat abszolút hibájának nevezzük és a-val jelöljük:
A gyakorlatban az abszolút hibát nem tudjuk meghatározni, mivel a valóságos adat (A) nem ismert. Ezért becslést adunk arra a számértékre, amelynél az abszolút hiba biztosan nem nagyobb. 8
A statisztika alapfogalmai
Az adott becslést a közelítő érték (mért adat) abszolút hibakorlátjának megadási mód arra utal, hogy a valóságos adat (A) valahol az
és
nevezzük. Így minden statisztikai adat megadható az
módon. Ez a
határok között helyezkedik el.
A statisztikai adatok módon történő megadása helyett a gyakorlatban igen elterjedt megoldás az is, hogy a statisztikai adatokat bizonyos nagyságrendre kerekítve adjuk meg, azaz a statisztikai adatban számszerűen csak az ún. szignifikáns számjegyek jelennek meg. Szignifikáns számjegyeknek nevezzük azokat a számjegyeket, melyekben még feltétlenül megbízunk, amelyeket még pontosnak fogadunk el. Ha a legutolsó kiírt számjegy helyi értéke
akkor az abszolút hibakorlát:
Magyarország népességének száma 1994. január 1-jén a Magyar Statisztikai Évkönyv szerint 10 277 ezer fő. A közölt statisztikai adatban a legutolsónak (számszerűen) kiírt szignifikáns számjegy helyi értéke . (Ez a közlési mód azt sugallja, hogy az utolsó három – százas, tízes, egyes helyi értékű – számjegy nem megbízható (nem szignifikáns), ezért számszerűen nem írjuk ki.) A statisztikai adat (népességszám) abszolút hibakorlátja:
Gyakran célszerűbb, kifejezőbb az elkövetett hibát (vagy hibakorlátot) a valóságos (vagy mért) adathoz viszonyítani. Az abszolút hiba (a) és a valóságos adat (A)
hányadosát relatív hibának, az abszolút hibakorlát
és a mért adat
hányadosát a statisztikai adat relatív hibakorlátjának nevezzük. A relatív hibát és a relatív hibakorlátot általában százalékos formában szokták megadni. 9
A statisztika alapfogalmai A népességszám relatív hibakorlátja:
Megállapíthatjuk, hogy a fenti példában a statisztikai adat hibája rendkívül kicsi. A korlátozott pontosságú (pontatlan) statisztikai adatokkal végzett minden számítási művelet eredménye ugyancsak korlátozottan pontos (pontatlan) lesz. Ezért mind az adatok kezelésénél, mind a belőlük levont következtetéseknél figyelembe kell vennünk az adatok korlátozott pontosságát. Így elkerülhető például, hogy nem szignifikáns eltérések alapján rangsorolást végezzünk vagy nem valós különbségeket magyarázzunk.
1.4. Statisztikai csoportosítás és összehasonlítás Csoportosítás A statisztikai megfigyelés eredményeként nagy tömegű adathoz jutunk, amely a vizsgált sokaságról különböző ismérvek alapján nyújt széles körű információt, számszerű ismereteket. Ahhoz, hogy a sokaságot, annak összetételét megismerhessük, a sokaságot a különböző ismérvek szerint osztályoznunk, csoportosítanunk kell. A csoportosítás a sokaság felosztása a sokaság egységeit jellemző megkülönböztető ismérv szerint. A csoportosításnál ügyelni kell arra, hogy olyan sokaságrészeket, ún. osztályokat alakítsunk ki, hogy azok átfedésmentesek és teljesek legyenek. E két követelmény együtt azt jelenti, hogy a sokaság minden egysége egyértelműen besorolható legyen valamelyik – de csak egy – kialakított osztályba. Ha a csoportképző ismérv változatainak száma kevés (pl. ha az aktív keresőket nemek vagy megyék szerint csoportosítjuk), az osztályok képzése nem okoz gondot. Ilyen esetben általában egy ismérvváltozat képez egy osztályt. Ha az ismérvváltozatok száma nagy, az osztályok képzése már nem egyértelmű, és a módszertani ismereteken túl szakmai ismereteket is igényel. (Pl. az aktív keresők foglalkozás, kereset szerinti, vagy a vállalkozások tevékenységtípus szerinti csoportosításánál.) Ha a vállalkozások esetén minden tevékenységtípust felsorolnánk, egy hosszú „listát” kapnánk, ami nehezen áttekinthető. Ilyen esetben szükség lehet arra, hogy az adott ismérv egynél több változata képezzen egy osztályt. A gyakorlatban ilyen csoportosításoknál általában az ún. nómenklatúrákat – szabványnak tekinthető, rendszeres felhasználásra kerülő osztályozási rendszereket – alkalmazzák. Az egy ismérv szerinti osztályozás eredménye egy csoportosító sor, melynek általános sémája (1.2. táblázat):
1.2. táblázat - Csoportosító sor általános sémája Osztály
Egységek száma 10
A statisztika alapfogalmai
Összesen ahol
N
a csoportképző ismérv alapján képzett i-edik osztály azonosítója,
a sokaság
osztályba sorolt egységeinek száma, ún. gyakorisága,
k : a kialakított osztályok száma, N : a sokaság egységeinek száma. A sémából is látható, hogy a gyakoriságok
összege egyenlő a sokaság elemszámával (N).
Tehát
A csoportképző ismérv fajtájától függően a csoportosító sorok lehetnek: minőségi, mennyiségi, területi és idősorok. A mennyiségi és idősorok képzésével, jellemzőivel a tankönyv 2. fejezetében részletesen foglalkozunk, ezért itt csak a minőségi és területi sort szemléltetjük egy-egy példával. Minőségi sor (1.3 táblázat):
1.3. táblázat - A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban Utazás jellege
Külföldiek száma (E fő)
Turista
22 804
Kiránduló
11 719 11
A statisztika alapfogalmai Átutazó
6 076
Összesen
40 599
Területi sor (1.4. táblázat):
1.4. táblázat - A népesség megyék szerinti megoszlása 1994. január 1-jén Megye Budapest egyik megyéhez
Budapest
sem tartozik közigazgatásilag, ezért a statisztikai kiadványokban külön sorban tüntetik fel.
Népesség száma (fő) 1 955 696 416 405 538 560
Baranya Bács-Kiskun Békés Borsod-Abaúj-Zemplén Csongrád Fejér Győr-Moson-Sopron Hajdú-Bihar Heves Jász-Nagykun-Szolnok Komárom-Esztergom Nógrád Pest
401 323 743 835 436 639 422 448 426 738 548 942 328 754 418 858 312 295 221 032 964 939 338 245 560 888 12
A statisztika alapfogalmai Somogy
249 938
Szabolcs-Szatmár-Bereg
272 835
Tolna
377 531
Vas
301 067
Veszprém Zala Összesen
10 276 968
Az egy ismérv szerinti csoportosítás a sokaságról kevés információt nyújt, ezért gyakran alkalmazzuk az ún. kombinatív csoportosítást. Ennek lényege, hogy az egyik ismérv szerint képzett osztályokon belül egy másik ismérv szerint is csoportosítunk. Pl. a lakott lakásokat csoportosítjuk területi elhelyezkedés és komfortfokozat szerint (a megfigyelés időpontja:1990. január 1.).
K: komfortos, FK: félkomfortos, KN: komfort nélküli. A kombinatív csoportosítással kapott adatokat táblázatba is rendezhetjük, statisztikai táblát készíthetünk. Ennek részleteiről a 3. fejezetben lesz szó. 13
A statisztika alapfogalmai Összehasonlítás A mindennapi életben és a statisztikai elemző munkában is gyakran találkozunk az összehasonlítás mozzanatával. Az összehasonlítás két vagy több statisztikai adat egymáshoz való viszonyítása. Az összehasonlítás az adatok egyszerű összevetésén túl általában különbség és hányados képzésével történik. Pl. Az ATS devizaszámla kamata az IBUSZ Banknál 1995. június 23-án 3,437%, július 23-án 3,375% volt. Az adatok puszta összevetése alapján azt tudjuk megállapítani, hogy a devizaszámla kamata csökkent. Ha a változás nagyságára is kíváncsiak vagyunk, akkor a két időpont kamatának a különbségét vagy hányadosát számítjuk ki. A két szám különbsége: A két szám hányadosa: A devizaszámla kamata 0,062 százalékponttal, illetve 1,8 százalékkal csökkent. Két százalékban (ezrelékben) kifejezett adat (mutatószám) különbségének mértékegységét százalékpontnak(ezrelékpontnak) szokás nevezni. (A kamatváltozás mértékét a gyakorlatban általában százalékpontban adják meg.) Az összehasonlítandó adatokat is statisztikai sorba rendezhetjük. Az így képzett sorokat összehasonlító soroknak nevezzük, melyeket – a csoportosító sorokhoz hasonlóan – az ismérvek fajtája szerint is megkülönböztethetünk. A különböző időpontokban megfigyelt devizaszámla-kamatokat sorba rendezve idősort képezhetünk (1.5. táblázat).
1.5. táblázat - Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál Időpont
Kamat (%)
1995. június 23.
3,437
július 23.
3,375
Az összehasonlító területi sor pedig a különböző földrajzi területeken végzett megfigyelések eredményeit rögzíti. Az 1.6. táblázat ilyen sort szemléltet.
1.6. táblázat - Az 1 főre jutó GDP néhány európai országban 1993-ban Ország
1 főre jutó GDP (USD) 14
A statisztika alapfogalmai Albánia
340
Ausztria
23 120
Hollandia
20 710
Lengyelország
2 020
Magyarország
3 300
Németország
23 560
Portugália
7 890
Románia
1 120
Spanyolország
13 650
Svájc
36 410
Szlovákia
1 900
1.5. Viszonyszámok A csoportosított, sorba rendezett adatok elemzésének egyik legegyszerűbb eszköze a viszonyszám. A viszonyszám két egymással logikai kapcsolatban álló statisztikai adat hányadosa. Képlettel:
ahol V: a viszonyszám, A: a viszonyítás tárgyát képező adat, amit viszonyítunk, B: a viszonyítás alapját képező adat, amihez viszonyítunk. A viszonyszámokat számíthatjuk azonos fajta (azonos mértékegységű) és különböző fajta (általában különböző mértékegységű) adatokból. 15
A statisztika alapfogalmai Az azonos fajta adatokból számított viszonyszámok azt fejezik ki, hogy egyik adat hányszorosa a másiknak. Jellegzetes fajtái a megoszlási, a koordinációs és a dinamikus viszonyszámok. A megoszlási viszonyszám a sokaság egyes részeinek a sokaság egészéhez viszonyított arányát fejezi ki.
1.7. táblázat - A 20–24 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén Nem
Népesség száma (fő)
Férfi
372 425
Nő
354 289
Összesen
726 714
Az 1.7. táblázat szerinti minőségi sorból számítható megoszlási viszonyszámok: – a férfiak aránya: – a nők aránya: A 20–24 év közötti népesség 51,2%-a férfi, 48,8%-a nő volt 1994. január 1-jén. A koordinációs viszonyszám a sokaság két részadatának hányadosa. A 1.7. táblázat adataiból számítható koordinációs viszonyszámok: – 1000 férfira jutó nők száma: – 1000 nőre jutó férfiak száma: A dinamikus viszonyszám két időszak (időpont) adatának hányadosa.
16
A statisztika alapfogalmai
1.8. táblázat - A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál Időpont
Árfolyam (Ft/DEM)
1994. július 10.
66,12
1995. július 10.
90,76
Dinamikus viszonyszám:
(az 1.8. táblázat adataival számolva).
A német márka eladási árfolyama 1 év alatt 37,3%-kal nőtt. A különböző fajta, általában különböző mértékegységű adatokból számított viszonyszámokat intenzitási viszonyszámoknak nevezzük. Az intenzitási viszonyszámok azt fejezik ki, hogy egyik mennyiségből (számláló) mennyi jut a másik mennyiség (nevező) egy egységére. E viszonyszámok általában két – egymással valamilyen kapcsolatban álló – sokaság nagyságának adatából képzett hányadosok. Pl. 1994. január 1jén a lakások száma 3955 ezer db, a lakásokban felszerelt távbeszélő-állomások (telefonok) száma 1 134 884 db volt. Az intenzitási viszonyszám az 1000 lakásra jutó távbeszélő-állomások száma:
A különböző fajta, különböző mértékegységű – de egymással kapcsolatban álló – adatokat is statisztikai sorba rendezhetjük. Az így képzett sort leíró sornak nevezzük. A leíró sorokat általában abból a célból készítjük, hogy valamilyen társadalmi-gazdasági egységet (pl. egy országot, egy vállalkozást, egy intézményt stb.) vagy jelenséget (pl. az egészségügyi ellátást, a külkereskedelmet stb.) jellemezzünk. E sortípust az alábbi példával szemléltetjük (1.9. táblázat).
1.9. táblázat - Magyarország 1993. évi idegenforgalmát jellemző adatok Megnevezés
Adat
Külföldre utazó magyarok száma (E fő)
12 115
Magyarországra érkező külföldiek száma (E fő)
40 599
– ebből turisták (E fő)
22 804
Idegenforgalom bevétele (M Ft)
110 312 17
A statisztika alapfogalmai Idegenforgalom kiadása (M Ft)
68 961
1.6. Átlagok A viszonyszámok mellett talán a leggyakrabban használt elemzési eszközök az átlagok, melyeket középértékeknek is szokás nevezni. Az átlagokat azonos fajta adatok halmazának tömör, számszerű jellemzésére használjuk. Ilyen halmazt képezhetnek például a mennyiségi ismérv értékei, az idősor adatai, a viszonyszámok stb. Az adatok jellegétől függően az átlagukat számtani, harmonikus, mértani vagy négyzetes átlaggal számíthatjuk ki. Az egyes átlagok alkalmazási területeivel tankönyvünk későbbi fejezeteiben ismerkedünk meg. Az átlagszámítás során az átlagolandó értékeket a következő módon jelöljük:
ahol: N : a megfigyelt átlagolandó értékek száma, az i-edik átlagolandó érték. A különböző átlagok kiszámítását az alábbi,
adatból álló számpéldával is szemléltetjük:
2 , 6 , 4 , 2 , 6 , 4 , 6 , 2 , 5 , 6. Számtani átlag A számtani átlag (jele:
) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok összege változatlan marad.
Tehát
Ebből a számtani átlag:
Adataink alapján: 18
A statisztika alapfogalmai
Mivel az átlagolandó értékek között azonos értékek is előfordulnak, ezért a következő formában is kiszámíthatjuk az átlagot:
Az alapadatokat áttekinthető formába rendezve csoportosító sort kapunk. (Ennek sémáját az 1.2. táblázatban mutattuk be.) Az egyforma átlagolandó értékeket egy osztályba sorolva k számú csoportot képezünk. Ezért a továbbiakban a szummázás értékkel dolgozunk, de ezeket csoportba soroltuk be.) Átlagolandó értékek száma (gyakorisága) 2
3
4
2
5
1
6
4
Összesen
10
A csoportosító sor sémájában bevezetett jelölések szerint:
ahol: k : az egymástól különböző átlagolandó értékek száma, a gyakoriságok, melyeket az átlagszámítás során súlyoknak nevezünk. Ezt a számítási formát súlyozott formának nevezzük. 19
-ig terjed. (Továbbra is 10 átlagolandó
A statisztika alapfogalmai A számtani átlag nagysága nem változik, ha a súlyokat (gyakoriságokat) egy konstans számmal megszorozzuk vagy elosztjuk. Ha a gyakoriságokat
elosztjuk az átlagolandó értékek számával (N), megoszlási viszonyszámokat kapunk, melyeket
Jellemző, hogy
Példánkban:
2
0,3
4
0,2
5
0,1
6
0,4
Összesen
1,0
Könnyű belátni, hogy az átlagot e megoszlási viszonyszámok alapján is számíthatjuk.
Számszerűen:
Az előző számítási módból látható, hogy a számtani átlag nagyságát két tényező befolyásolja: a) az átlagolandó értékek
abszolút nagysága. 20
-vel jelölünk:
A statisztika alapfogalmai Az átlag mindig a legkisebb és legnagyobb érték közé esik:
b) A súlyok viszonylagos nagysága, a súlyarányok. A súlyarányokon múlik, hogy az átlag az
intervallumban hol helyezkedik el.
Ha a kisebb átlagolandó értékeknek nagyobb a súlyaránya, akkor az átlag az intervallum alsó, ha a nagyobb átlagolandó értékeknek nagyobb a súlyaránya, akkor az átlag az intervallum felső határához esik közelebb. A fenti megállapítások nemcsak a számtani átlagra, hanem a később ismertetendő átlagfajtákra is igazak. A számtani átlag tulajdonságai: 1. Az átlagolandó értékek és a számtani átlag különbségeinek algebrai összege nulla.
Ez azt jelenti, hogy ha minden átlagolandó értéket a számtani átlaggal helyettesítünk, akkor e helyettesítéssel elkövetett eltérő előjelű hibák (különbségek) összességükben kiegyenlítik egymást. E tulajdonság könnyen belátható:
mert az átlag definíciója szerint
2. Ha az átlagolandó értékekből levonunk egy konstans számot (A)és a különbségeket négyzetre emeljük, akkor ezen négyzetek összege (vagy ahogy mondani szokták: az eltérések négyzetösszege) akkor lesz a legkisebb, ha a konstans a számtani átlaggal azonos. Tehát
Az átlag e tulajdonságát négyzetes minimum tulajdonságnak nevezzük. 21
A statisztika alapfogalmai A tulajdonság úgy bizonyítható, hogy az eltérés-négyzetösszegnek mint A-nak a függvénye ott lehet minimális, ahol az első derivált nulla:
Ebből:
Mivel
pozitív, az
valóban minimális.
3. Ha az átlagolandó értékek mindegyikéhez ugyanazt az A állandót hozzáadjuk, akkor a számtani átlag éppen ezen A állandóval változik meg. Tehát, ha
(
), akkor
.
Ugyanis
4. Ha az átlagolandó értékeket egy B állandóval megszorozzuk, a számtani átlag is B-szeresére változik. Tehát, ha
(
), akkor
Ugyanis Harmonikus átlag Aharmonikus átlag (jele:
)az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad. 22
A statisztika alapfogalmai Tehát
Ebből a harmonikus átlag :
Példánkban:
Súlyozott formában:
Adataink alapján:
Mértani átlag Amértani átlag(jele:
)az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok szorzata változatlan marad.
Tehát:
23
A statisztika alapfogalmai Ebből a mértani átlag :
(Itt feltételezzük, hogy
)
Példánkban:
Súlyozott formában:
Adataink alapján:
Négyzetes átlag A négyzetes átlag (jele:
) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok négyzetösszege változatlan marad.
Tehát:
Ebből a négyzetes átlag:
Példánkban: 24
A statisztika alapfogalmai
Súlyozott formában:
Adataink alapján:
Két nemnegatív szám számtani és mértani közepének összehasonlításáról már középiskolában is volt szó, itt bizonyítás nélkül közöljük a különböző átlagok közötti összefüggéseket. Ha ugyanazokból az átlagolandó értékekből, azonos súlyarányokkal számítunk különböző átlagokat, közöttük az alábbi nagyságrendi viszony áll fenn:
Példánkban:
(Az átlagok között egyenlőség csak akkor fordulhat elő, ha minden átlagolandó érték egyforma.)
1.7. Gyakorlófeladatok 1. A főiskolai hallgatók anyagi és szociális helyzetét kívánjuk felmérni. Feladat: a) Definiáljuk a felméréshez szükséges sokaságot! b) Fogalmazzunk meg olyan kérdéseket, amelyeket feltennénk egy elképzelt kérdőívben! 25
A statisztika alapfogalmai c) Milyen ismérvek vannak az egyes kérdések mögött? Nevezzük meg ezeket, és adjuk meg ezek néhány lehetséges változatát! d) Rendezzük a választott ismérveket aszerint, hogy hány változatuk van! e) Képezzünk sorokat egy 30 fős csoportra vonatkozóan tetszőleges adatokkal! 2. Néhány sokaság: – Az 1994-ben Magyarországon kiadott könyvek összessége. – Az iskolai könyvtárak összes könyvállománya 1994. január 5-én. – Színházlátogatások száma egy adott napon Budapesten. – Egy áruház cipőosztályának forgalma a téli kiárusítás hetében. – Üzembe helyezett beruházások nagysága 1994-ben. – A lakosság villamosenergia-fogyasztása 1994 decemberében. – Békés megye állatállományának nagysága 1994. március 31-én. – Budapest népessége 1995. január 1-jén. Feladat: a) Nevezzük meg a fenti sokaságok típusait! b) Mondjunk megkülönböztető ismérveket az egyes sokaságokra vonatkozóan! c) Megfelelő módon bővítsük vagy szűkítsük az egyes sokaságokat! d) Milyen mérési skálákon mérhetők az egyes ismérvek? 3. A közgazdaság-tudományi ághoz tartozó nappali tagozatos hallgatók adatai 1992-ben: Nem
Hallgatók száma (fő)
Férfi
3731
Nő
5069 26
A statisztika alapfogalmai Összesen
8800
Feladat: Nevezzük meg a statisztikai sor típusát! 4. A gazdaságilag aktív népesség számának alakulása Magyarországon: Év, január 1.
Népesség (ezer fő)
1985
5591
1986
5580
1987
5595
1988
5559
1989
5519
1990
5496
1991
5404
1992
5202
Feladat: a) Nevezzük meg a statisztikai sor típusát! b) Számítsuk ki, hogy mennyi egy-egy adat abszolút, illetve relatív hibakorlátja! 5. A hazánkba érkező turisták közül a legtöbben Romániából (5498 ezer fő), Németországból (2838 ezer fő) és Jugoszlávia utódállamaiból (2585 ezer fő) érkeztek 1992-ben. Ismerjük továbbá, hogy Európából összesen 16 688 ezer fő, Ázsiából 151 ezer fő, Afrikából 20 ezer fő, Amerikából 304 ezer fő, Ausztráliából és Óceánia országaiból pedig 25 ezer turista érkezett. Feladat: Rendezzük az adatokat statisztikai sorokba! 27
A statisztika alapfogalmai 6. Statisztikai kiadványokból származnak az alábbi információk: – 1991-ben a GDP 29,1%-a az ipari ágazatból származott. – Az 1000 lakosra jutó élveszületések száma Magyarországon 1992-ben 11,8‰ volt. – Az 1 főre jutó évi átlagos sertéshúsfogyasztás 1990-ben 38,8 kg volt. – 1992-ben 25 807 lakás épült Magyarországon. A lakásépítések kedvezőtlen alakulását jellemzi, hogy 1970-hez képest 67,85%-kal épült kevesebb lakás. Hány lakás épült 1970-ben? – Az orvosellátottság jellemzésére kiszámított mutató számszerű értéke 1980-ban 28,8; 1992-ben 39,6 orvos/tízezer lakos. – Az ipari ágazatban a maximum 500 főt foglalkoztató vállalkozások átlagos árbevétele 137 millió Ft volt 1992-ben. – Svédországban a házasságkötési arányszám 1992-ben 4,3 ‰ volt. – 100 aktív háztartásra 1991-ben 103 hűtőszekrény jutott. Feladat: Nevezzük meg az itt szereplő viszonyszámok fajtáját, adjuk meg kiszámítási módját! 7. Átlagolandó értékek
Súlyok
6
6
16
3
20
1
Feladat: a) Számítsuk ki a megadott értékek súlyozott: számtani, harmonikus, mértani és négyzetes átlagát! b) Állapítsuk meg az átlagok nagyságrendjét! c) Határozzuk meg a
kifejezés értékeit a következő A értékek mellett: 5, 6, 8 és az esetén! 28
A statisztika alapfogalmai 8. Valamely ismérv két változata 10 és 15. Feladat: a) Rendeljünk ezen átlagolandó értékek mellé súlyokat többféleképpen úgy, hogy a súlyok összege először 20, majd 50, 10 és 7 legyen, továbbá a kapott átlagok mindig kisebbek legyenek a megelőzőnél! b) Milyen súlyarányok mellett lesz az átlag éppen 12?
29
2. fejezet - Egy ismérv szerinti elemzés 2.1. A mennyiségi ismérv szerinti elemzés 2.1.1. A mennyiségi ismérv A mennyiségi ismérvek rendkívül nagy szerepet töltenek be a statisztikai elemző munkában. A mennyiségi ismérveket változóknak, lehetséges kimeneteleiket (ismérvváltozataikat) ismérvértékeknek nevezzük. Az ismérvértékek intervallum- vagy arányskálán mért, valamilyen mértékegységgel bíró számértékek. A mennyiségi ismérv lehet: diszkrét és folytonos. A diszkrét mennyiségi ismérv csak véges vagy megszámlálhatóan végtelen, egymástól jól elkülönülő értéket vehet fel. A folytonos mennyiségi ismérv egy adott intervallumon belül bármilyen, tehát kontinuumszámosságú értéket felvehet. A lakásokat például (a megfigyelés időpontjában) jellemezhetjük szobaszámuk és alapterületük szerint. A lakások szobaszáma csak pozitív egész 2 szám lehet, tehát diszkrét mennyiségi ismérv. A lakások alapterülete egy adott intervallumban (pl. 50 és 55 m között) bármilyen értéket felvehet, tehát folytonos mennyiségi ismérv. A diszkrét mennyiségi ismérv értékei – elvileg, de általában gyakorlatilag is – pontosan, a folytonos mennyiségi ismérv értékei mindig csak bizonyos pontosságra kerekítve adhatók meg. 2
2
Például a lakások alapterülete megadható két tizedes pontossággal: 53,78 m , ugyanez egy tizedes pontossággal: 53,8 m , egész számra kerekítve: 2 2 54 m . Ezért két háromszobás lakás szobaszáma biztosan azonos, de két 54 m -es lakás alapterülete már nem biztos, hogy „pontosan” azonos (az 2 2 2 egyik lehet 53,78 m , a másik 54,11 m , de a mérési – kerekítési – pontosság miatt mindkettőt 54 m -nek tekintjük). Ha egy sokaságot valamilyen mennyiségi ismérv szerint vizsgálunk, akkor első lépésként általában az ismérvértékeket sorba rendezzük, ún. rangsort készítünk. A rangsor a mennyiségi ismérv értékeinek monoton sorozata. Szemléltető példánk a következő (2.1. és 2.2. táblázat): 3
2.1. táblázat - Egy társasház 50 lakásának az elmúlt kéthavi vízfogyasztása a leolvasás sorrendjében (adatok m -ben) 36
14
21
23
23 30
Egy ismérv szerinti elemzés 10
34
22
26
20
20
40
18
16
22
23
26
25
17
21
16
16
31
19
15
31
17
30
21
23
24
28
22
33
18
22
29
19
24
27
20
21
17
32
17
18
12
19
11
36
Az adatok (ismérvértékek) rendezésének legegyszerűbb módja a rangsor készítése. 3
2.2. táblázat - A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m -ben) 10
17
20
23
29
11
17
21
23
30
12
18
21
23
31
14
18
21
24
31
15
18
21
24
32
16
19
22
25
33
16
19
22
26
34
16
19
22
26
36
17
20
22
27
36
31
Egy ismérv szerinti elemzés 17
20
23
28
40 3
A lakások vízfogyasztása folytonos mennyiségi ismérv, a rangsorban található azonos értékek (pl. négy lakásnál 21 m a fogyasztás) 1 valószínűséggel csak a mérési pontosság miatt nem különböznek egymástól.
2.1.2. Gyakorisági sorok A rangsor segít a vizsgált jelenség természetének vizsgálatában, azonban ha a megfigyelt sokaság elemszáma nagy – a statisztikai vizsgálatoknál általában ez jellemző –, a rangsor már nehezen áttekinthető, és nem teszi lehetővé a sokaság mennyiségi ismérv szerinti megoszlásában mutatkozó szabályszerűség felismerését. Ahhoz, hogy a sokaság összetételéről, szerkezetéről, belső arányairól áttekinthető képet kapjunk, az adatokat (ismérvértékeket) tömörítenünk kell. Az adatokban rejlő információk tömörítésének, sűrítésének legelterjedtebb módja a sokaság egységeinek mennyiségi ismérv szerinti osztályozása (csoportosítása). A rangsort általában éppen abból a célból készítjük, hogy megkönnyítse a sokaság egységeinek mennyiségi ismérv szerinti osztályozását. Az osztályozás eredménye egy csoportosító sor, melynek általános sémáját az 1.4. alfejezetben már megismertük (1.2. táblázat). Ebben az esetben a ( ) osztályok a mennyiségi ismérv lehetséges értékeinek részhalmazai. Ha az ismérvnek kevés változata van (pl. a lakások szobaszáma), akkor általában egy-egy ismérvváltozat képez egy-egy osztályt. Ha az ismérvváltozatok száma nagy (pl. ha a lakásokat alapterületük szerint, vagy 2 az aktív keresőket havi keresetük szerint csoportosítjuk), akkor az osztályok egynél több ismérvértéket magukba foglaló intervallumok (pl. 50–55 m közötti alapterület, 20 000–25 000 Ft közötti kereset stb.), melyeket osztályközöknek nevezünk. Az 1.2. táblázatból látható, hogy a csoportosító sor tartalmazza a
osztályok mellett a gyakoriságokat
is.
A gyakoriság azt mutatja, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hány egysége tartozik. A gyakoriságok
helyett a csoportosító sorban szerepeltethetjük a
relatív gyakoriságokat is, melyek nem mások, mint a gyakoriságokból számított megoszlási viszonyszámok. A relatív gyakoriságokat általában százalékos formában (az
hányadosok 100-zal szorzott értékei) fejezzük ki.
A relatív gyakoriságok azt mutatják, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hányad része (hány százaléka) tartozik. 32
Egy ismérv szerinti elemzés A mennyiségi ismérv szerinti osztályozás eredményeként kapott speciális csoportosító sort gyakorisági sornak nevezzük. Ha az osztályok egyetlen ismérvértékből állnak, a gyakorisági sort gyakorisági eloszlásnak, röviden eloszlásnak nevezzük, más esetekben gyakorisági megoszlásnak, 1 röviden megoszlásnak nevezzük . Az eloszlás, illetve a megoszlás, mint a neve is jelzi, azt mutatja meg, hogy az ismérvértékek hogyan oszlanak meg az egyes osztályok között. Mint látni fogjuk, az általános az, hogy az osztályok közül némelyikben sok ismérvérték van (nagy a gyakoriság), másutt viszont kevés, és általában minél távolabb vagyunk a nagy gyakoriságú osztályoktól, annál kevesebb.
2.3. táblázat - A gyakorisági sorok általános sémája a) változat (eloszlás) Ismérvérték
b) változat (megoszlás) Gyakoriság
Az osztályközök alsó határa
Összesen
N
c) változat (eloszlás) Ismérvérték
Gyakoriság
felső határa
Összesen
N
d) változat (megoszlás) Relatív gyakoriság
Az osztályközök alsó határa
Relatív gyakoriság
felső határa
11
Megjegyezzük, hogy a statisztikai gyakorlatban az eloszlást és a megoszlást egymás szinonimáiként is használjuk, noha a fent leírtak elméletileg mindenképpen indokoltak. Bizonyos elméleti tételek ugyanis csak az egyik esetben érvényesek.
33
Egy ismérv szerinti elemzés
Összesen
1
Összesen
1
ahol az i-edik ismérvérték, az i-edik osztályköz alsó határa, az i-edik osztályköz felső határa, az i-edik osztályhoz (osztályközhöz) rendelt gyakoriság, az i-edik osztályhoz (osztályközhöz) rendelt relatív gyakoriság, k : a kialakított osztályok (osztályközök) száma, N : a sokaság elemszáma. A gyakoriságok összege mindig egyenlő a sokaság elemszámával, azaz
A relatív gyakoriságok összege mindig egyenlő 1-gyel, tehát
és jellemző, hogy
34
Egy ismérv szerinti elemzés
A 2.3. táblázat c) és d) változatban felírt gyakorisági sorát relatív gyakorisági sornak nevezzük. (Az is szokás nevezni, a
gyakoriságokat abszolút gyakoriságoknak
relatív gyakoriságoktól való megkülönböztetés érdekében.)
A gyakorisági (relatív gyakorisági) sorok képzésének – mint azt a 2.3. táblázat is mutatja – a mennyiségi ismérv fajtájától és az ismérvváltozatok számától függően alapvetően két módja van: a) Ha a mennyiségi ismérv diszkrét és kevés változattal rendelkezik, akkor a gyakorisági sorban minden ismérvértéket felsorolunk. Pl. a társasház 50 lakását csoportosítjuk a lakások szobaszáma szerint (2.4. táblázat).
2.4. táblázat - A lakások szobaszám szerinti eloszlása Szobák száma
Lakások száma
Szobák száma
Lakások %-os megoszlása
1
5
1
10
2
22
2
44
3
17
3
34
4
6
4
12
Összesen
50
Összesen
100
b) Ha a mennyiségi ismérv sokféle értéket vesz fel, akkor az ismérvértékek tartományát egymást át nem fedő intervallumokra, ún. osztályközökre bontjuk. Az így képzett sort osztályközös gyakorisági (relatív gyakorisági) sornak (megoszlásnak) nevezzük. Az osztályközös gyakorisági sor képzésénél a következő követelményeknek kell eleget tenni: – Az osztályközhatárokat úgy kell meghatározni, hogy az ismérvértékek egyértelműen besorolhatók legyenek valamelyik – de csak egy – osztályközbe. – Annyi és olyan hosszúságú osztályközöket képezzünk, hogy a kapott gyakorisági sor jól tükrözze a sokaság mennyiségi ismérv szerinti összetételét. Mutassa meg a sokaság egységeinek az X ismérv (változó) nagysága szerinti megoszlásában mutatkozó szabályszerűséget. Az első követelmény azt jelenti, hogy az osztályközhatárok megadásánál kifejezésre kell juttatni, hogy egy adott, éppen az osztályközhatárra eső érték melyik osztályközbe tartozik. Ez elsősorban akkor okoz gondot, ha a mennyiségi ismérv folytonos. Például ha a lakásokat alapterületük szerint csoportosítjuk, az ismérv folytonos jellege azt kívánná, hogy az 35
Egy ismérv szerinti elemzés 2
2
2
intervallumok hézagmentesen illeszkedjenek egymáshoz, azaz az osztályközöket a következő módon jelöljük ki: 45–50 m ; 50–55 m ; 55–60 m stb. A hézagmentesen illeszkedő osztályközhatárokat valódi határoknak nevezzük. Ebben az esetben azonban gondot jelenthet, hogy az éppen 2 osztályközhatárra eső 50, illetve 55 m -es alapterület melyik osztályközbe tartozik.
Az egyértelmű besorolhatóságot a statisztikában kétféleképpen biztosíthatjuk. Az osztályközhatárokat a mérési pontosságnál nagyobb pontossággal adjuk meg (1. változat), vagy az osztályközök alsó határát a mérési pontosság egy egységével megnöveljük (2. változat). Az egyértelmű besorolás érdekében megkülönböztetett osztályközhatárokat közölt határoknak szokás nevezni. 3
A kétféle változatot az alábbi gyakorisági sorok szemléltetik (2.5. táblázat). Mindkét esetben 10 m -es hosszúságú osztályközöket képezünk, és 3 figyelembe vesszük, hogy az adatok 1 m pontosságúak .
2.5. táblázat - A társasház lakásainak megoszlása a vízfogyasztás szerint 1. változat
2. változat
Vízfogyasztás 3 (m )
Lakások száma
Vízfogyasztás 3 (m )
Lakások száma
– 20,0
21
– 20
21
20,1 – 30,0
21
21 – 30
21
30,1 –
8
31 –
8
Összesen
50
Összesen
50
Az osztályközök számának, illetve hosszának meghatározása már bonyolultabb feladat. Minden csoportosítás mindig bizonyos információveszteséggel: az egységek egyedi tulajdonságaira vonatkozó ismereteink elvesztésével jár. Ugyanakkor egy jó csoportosítás segíti a vizsgált sokaság egészének megismerését, ami az alapadatokhoz képest többletinformációt eredményez. Ezért olyan osztályközök kialakítására kell törekedni, amelyek jól tömörítik a vizsgált jelenség törvényszerűségeit, de még nem eredményeznek számottevő információveszteséget. Az utóbbi feltétel az osztályközök számának növelését, míg az előbbi a csökkentését indokolja. Ezért minden osztályozás esetén törekedni kell a tömörítés és részletezés közötti ésszerű kompromisszumra. Az osztályközök számának és hosszának meghatározásához a szakmai ismereteken túl jó támpontot adnak a 2.1.4. alpontban ismertetendő grafikus ábrák és az alábbiakban közölt információelméleti eredményeken alapuló becslések is. Az osztályközök száma megbecsülhető a következő módon. Az osztályközök száma azon legkisebb k, melyre már teljesül:
ahol k : az osztályközök száma, 36
Egy ismérv szerinti elemzés N: a sokaság elemszáma. Az osztályközök számának ismeretében az osztályközök hosszát – egyenlő hosszúságú osztályközök esetén – az alábbi módon határozhatjuk meg:
ahol h: az osztályköz hossza, a legnagyobb ismérvérték, a legkisebb ismérvérték. Az osztályközök számának és hosszának meghatározásához megismert módszerek nem minden esetben alkalmazható és követendő szabályok. Ezek csak támpontot adnak, és alkalmazásuk olyan esetben célszerű, amikor az az
különbség nem túl nagy, és az ismérvértékek zöme nem
intervallum egy szűkebb szakaszán sűrűsödik.
A lakások vízfogyasztásának rangsorából (2.2. táblázat) látható, hogy e feltételek teljesülnek, így a fenti módszereket alkalmazva az osztályközök száma meghatározható. Mivel
elegendő az ismérvértékeket 6 osztályközbe sorolni. Az osztályközök hossza:
Így a gyakorisági (relatív gyakorisági) sor a 2.6. táblázatban látható:
2.6. táblázat - A lakások vízfogyasztás szerinti megoszlása Vízfogyasztás
Lakások
Vízfogyasztás
(m )
száma
(m )
megoszlása
– 15
5
– 15
10
3
3
Lakások %-os
37
Egy ismérv szerinti elemzés 16 – 20
16
16 – 20
32
21 – 25
15
21 – 25
30
26 – 30
6
26 – 30
12
31 – 35
5
31 – 35
10
36 –
3
36 –
6
Összesen
50
Összesen
100
A gyakorisági sorok készítésénél azonban nem törvényszerű az egyenlő hosszúságú osztályközök képzése. A gyakorlatban sokszor különböző (egyenlőtlen) hosszúságú osztályközöket képezünk, hogy a megoszlásban mutatkozó szabályszerűség felismerhető legyen. Erre általában akkor kerül sor, ha az különbség igen nagy és az ismérvértékek nem egyenletesen helyezkednek el az intervallumon belül, hanem zömmel az intervallum egy vagy néhány szűkebb szakaszán sűrűsödnek. Ilyen esetben kevésbé hosszú osztályközöket képezünk az intervallum azon szakaszán, ahol az ismérvértékek zöme található, és hosszabbakat az intervallum más szakaszain. Különböző hosszúságú osztályközöket képezünk például, ha a lakossági devizaszámlákat vagy betétkönyveket csoportosítjuk a betétösszeg nagysága szerint. A legnagyobb és legkisebb betétösszeg közötti különbség igen nagy, és jellemző, hogy a kisebb betétösszegek nagyobb gyakorisággal, a nagyobb betétek kisebb gyakorisággal fordulnak elő. Így az
intervallum alsó szakaszán kisebb hosszúságú, a felső szakaszán nagyobb hosszúságú osztályközöket képezünk.
Ezt a megoldást választjuk a népesség 1 főre jutó jövedelem szerinti, illetve a nyugdíjasok nyugdíjnagyság szerinti csoportosításánál is. A 2.7. táblázat szerinti – és az előző gyakorisági sorokban is – az első és utolsó (alsó és felső) osztályköz ún. nyitott osztályköz. A további számítások, elemzések során ezeket úgy kezeljük, mintha zártak lennének. Az első intervallumot ugyanolyan hosszúságúnak tételezzük fel, mint az őt követőt
az utolsót pedig, mint az őt megelőzőt
Kumulált gyakorisági sorok A gyakorisági (relatív gyakorisági) sorokban rejlő információk tovább bővíthetők a gyakoriságok (relatív gyakoriságok) halmozott összeadásával, azaz kumulálásával.
2.7. táblázat - A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában Nyugdíj
Nyugdíjas nők
(Ft)
száma (fő)
Osztályközök hossza
38
Egy ismérv szerinti elemzés – 5 999
478
?
6 000 – 6 999
998
1000
7 000 – 7 999
46 162
1000
8 000 – 8 999
87 555
1000
9 000 – 9 999
201 385
1000
10 000 – 11 999
258 245
2000
12 000 – 14 999
522 029
3000
15 000 – 19 999
112 483
5000
20 000 – 24 999
23 027
5000
25 000 –
7 388
?
1 259 750
–
Összesen
A kumulált gyakoriságok (jele:
), ill. kumulált relatív gyakoriságok (jele:
megfelelő és annál kisebb ismérvértékek hányszor sort úgy képezzük, hogy a gyakoriságokat
, ill. milyen arányban
) adatai azt mutatják, hogy az adott osztályköz felső határának
fordulnak elő. A kumulált gyakorisági, ill. kumulált relatív gyakorisági
, ill. relatív gyakoriságokat
rendre halmozva összeadjuk.
A kumulált gyakoriságok (relatív gyakoriságok) számítását a lakások vízfogyasztására vonatkozó példa alapján mutatjuk be (2.8. táblázat).
2.8. táblázat - A társasház vízfogyasztására vonatkozó adatok Lakások száma
tényleges
Vízfogyasztás 3
(m )
Lakások megoszlása (%)
tényleges
kumulált
(
kumulált
)
(
)
– 15
5
5
10
10
16 – 20
16
21
32
42 39
Egy ismérv szerinti elemzés 21 – 25
15
36
30
72
26 – 30
6
42
12
84
31 – 35
5
47
10
94
36 –
3
50
6
100
50
–
100
–
Összesen Például:
A lakások 72%-ában – összesen 36 lakásban – a vízfogyasztás 25 m3 vagy annál kevesebb. A gyakorisági (relatív gyakorisági) sorokból lefelé kumulált gyakorisági (relatív gyakorisági) sor is képezhető. E sorok adatai azt mutatják, hogy az adott osztályköz alsó határánál nagyobb ismérvértékek hányszor
, ill. milyen arányban
2.9. táblázat - A társasház vízfogyasztására vonatkozó adatok Lakások száma Vízfogyasztás
tényleges
lefelé kumulált
(m3)
Lakások megoszlása (%) tényleges (
lefelé kumulált
)
(
)
– 15
5
50
10
100
16 – 20
16
45
32
90
21 – 25
15
29
30
58
26 – 30
6
14
12
28
31 – 35
5
8
10
16
36 –
3
3
6
6 40
fordulnak elő (2.9. táblázat).
Egy ismérv szerinti elemzés Összesen
50
–
100
–
Például:
A lakások 58%-ának – összesen 29 lakásnak – a vízfogyasztása 20 m3-nél nagyobb.
2.1.3. Értékösszegsor Az előző alfejezetben a sokaság egységeit mennyiségi ismérv szerint osztályoztuk. Az osztályozás eredménye a gyakorisági sor, ami a mennyiségi sorok egyik típusa. A másik típus az értékösszegsor. Az értékösszegsor (2.10. táblázat) a mennyiségi ismérv alapján kialakított osztályokhoz (osztályközökhöz) az azokba tartozó egységek ismérvértékeinek összegét rendeli. A vizsgált mennyiségi ismérv értékeinek egyes osztályokon (osztályközökön) belüli összegeit értékösszegeknek (jele: ) nevezzük.
2.10. táblázat - Az értékösszegsor általános sémája a) változat (eloszlás) Ismérvérték
b) változat (megoszlás)
Értékösszeg
Az osztályközök alsó határa
Összesen ahol
S
Értékösszeg
felső határa
Összesen
S
az i-edik osztályhoz (osztályközhöz) rendelt értékösszeg, 41
Egy ismérv szerinti elemzés S : a sokaság teljes értékösszege. Eloszlás esetén az egyes osztályokhoz tartozó értékösszegeket az ismérvértékek
és a gyakoriságok
szorzataként kapjuk:
A sokaság teljes értékösszege:
A következő gyakorisági sor valamely település háztartásainak taglétszám szerinti megoszlását mutatja (a megfigyelés időpontjában) (2.11. táblázat).
2.11. táblázat - A település háztartásainak taglétszám szerinti eloszlása Taglétszám (fő)
Háztartások száma
1
51
2
89
3
145
4
85
5
34
6
21
Összesen
425
A gyakorisági sor alapján képzett értékösszegsort pedig a 2.12. táblázatban látjuk.
2.12. táblázat - A település lakosainak eloszlása az egyes háztartások taglétszáma szerint Taglétszám (fő)
Lakosok száma (fő) 42
Egy ismérv szerinti elemzés
1
51
2
178
3
435
4
340
5
170
6
126
Összesen
1300
Például: fő. Összesen 435 fő él 3 fős háztartásban. fő. A település lakosainak száma 1300 fő. Osztályközös gyakorisági sor esetén az egyes osztályközök tényleges értékösszegei csak akkor határozhatók meg, ha ismerjük az eloszlást. A vízfogyasztás rangsora (adatok a 2.2. táblázatban) alapján a tényleges értékösszegsort a 2.13. táblázat mutatja.
2.13. táblázat - Az összes vízfogyasztás megoszlása Vízfogyasztás
3
Összes vízfogyasztás (m )
3
(m ) – 15
62
16 – 20
287
21 – 25
337
26 – 30
166
31 – 35
161 43
Egy ismérv szerinti elemzés 36 –
112
Összesen
1125
Például:
(a rangsorból az ötödik osztályközbe sorolt ismérvértékek összege).
A sokaság teljes értékösszege: . A társasház összes vízfogyasztása 1125 m3. Ha csak az osztályközös gyakorisági sor (a megoszlás) áll rendelkezésre, akkor az értékösszegeket a gyakoriságok szorzataként becsüljük.
és az osztályközepek
Az i-edik osztályközépső:
Az értékösszegek becslését a lakások vízfogyasztás szerinti megoszlását mutató osztályközös gyakorisági sorból (2.6. táblázat) végezzük.
2.14. táblázat - Munkatábla az osztályközép meghatározásához Vízfogyasztás
Lakások száma
3
(m )
Osztályközök
Osztályközép
hossza
– 15
5
5
12,5
16 – 20
16
5
17,5
21 – 25
15
5
22,5
26 – 30
6
5
27,5
31 – 35
5
5
32,5
36 –
3
5
37,5
50
–
–
Összesen
44
Egy ismérv szerinti elemzés A gyakorisági sor első és utolsó osztályköze nyitott, de a gyakorisági sor alapján végzett számítások során azokat úgy kezeljük, mintha zártak lennének:
Az osztályközepek meghatározásánál nem vesszük figyelembe az egyértelmű besorolás érdekében megkülönböztetett felső és alsó osztályközhatárokat, hanem a hézagmentesen illeszkedő, ún. valódi osztályközhatárok alapján számítjuk ki őket. Pl.
2.15. táblázat - Az összes vízfogyasztás megoszlása Vízfogyasztás
3
Összes vízfogyasztás (m )
3
(m ) – 15
62,5
16 – 20
280,0
21 – 25
337,5
26 – 30
165,0
31 – 35
162,5
36 –
112,5
Összesen
1120,0
Például:
A 2.14. és 2.15. táblázat adataiból látható, hogy a tényleges és becsült értékösszegek eltérnek egymástól. Az eltérés abból adódik, hogy a becslés során az ötödik osztályközben feltételezzük pl., hogy az ide besorolt lakások mindegyike 32,5 m3 (az osztályközépnek megfelelő) vizet fogyaszt. Az osztályközös gyakorisági sor alapján történő becslés annál jobban közelíti meg a tényleges értékösszegeket, minél egyenletesebb az ismérvértékek eloszlása az osztályközökön belül. 45
Egy ismérv szerinti elemzés Ha az értékösszegek – ismérvértékek szerinti – megoszlásáról is képet akarunk kapni, akkor relatív értékösszegsort képezünk. Relatív értékösszegen egy olyan megoszlási viszonyszámot értünk, amely az egyes osztályok (osztályközök) értékösszegét ( ) a teljes értékösszeghez (S) viszonyítja. Az i-edik osztály relatív értékösszege (jele: ):
A relatív értékösszegekre is igaz, hogy
A 2.15. táblázat alapján a relatív értékösszegsor (2.16. táblázat):
2.16. táblázat - Az összes vízfogyasztás megoszlása Vízfogyasztás 3
(m )
Összes vízfogyasztás megoszlása (%)
– 15
5,6
16 – 20
25,0
21 – 25
30,1
26 – 30
14,7
31 – 35
14,5
36 –
10,1
Összesen
100,0
A gyakorisági sorokhoz hasonlóan az értékösszegsorból és a relatív értékösszegsorból is képezhetünk kumulált, ill. lefelé kumulált sorokat (2.17. táblázat). 46
Egy ismérv szerinti elemzés
2.17. táblázat - A társasház vízfogyasztására vonatkozó adatok Összes vízfogyasztás (m3) Kumulált
Vízfogyasztás 3
(m )
( )
Összes vízfogyasztás megoszlása (%)
Lefelé
Kumulált
kumulált (
(
)
)
Lefelé kumulált (
)
– 15
62,5
62,5
1120,0
5,6
5,6
100,0
16 – 20
280,0
342,5
1057,5
25,0
30,6
94,4
21 – 25
337,5
680,0
777,5
30,1
60,7
69,4
26 – 30
165,0
845,0
440,0
14,7
75,4
39,3
31 – 35
162,5
1007,5
275,0
14,5
89,9
24,6
36 –
112,5
1120,0
112,5
10,1
100,0
10,1
1120,0
–
–
100,0
–
–
Összesen Például:
A társasházban elfogyasztott vízmennyiség 60,7%-át – összesen 680 m3-t – azokban a lakásokban használták fel, amelyekben a vízfogyasztás 25 m3 és annál kisebb volt.
2.1.4. A gyakorisági sorok grafikus ábrázolása A statisztikai adatok szemléltetésének, a statisztikai adatok közötti arányok bemutatásának fontos eszköze a grafikus ábrázolás. A helyesen készített ábrákkal áttekinthetőbbé válik a sokaság szerkezete, felismerhetővé a sokaság mennyiségi ismérv szerinti megoszlásában mutatkozó szabályszerűség. A gyakorisági (relatív gyakorisági) sorok ábrázolása derékszögű koordináta-rendszerben történik. A vízszintes tengelyen a mennyiségi ismérv értékeit, a függőleges tengelyen pedig a gyakoriságokat (relatív gyakoriságokat) vagy azok kumulált értékeit tüntetjük fel.
47
Egy ismérv szerinti elemzés A kevés értéket felvevő diszkrét mennyiségi ismérvek esetén csak az ábrázolni kívánt gyakoriságokkal (relatív gyakoriságokkal) arányos hosszúságú, valamilyen feltűnő módon megjelölt végpontú egyenes szakaszokkal történhet az ábrázolás. Az ilyen típusú ábrát az eloszlás bot-ábrájának nevezzük. A 2.11. táblázat adatai alapján készített bot-ábra a 2.1. ábrán látható:
2.1. ábra - A háztartások taglétszám szerinti eloszlásának bot-ábrája
A 2.1. ábra jellege nem változna meg, ha a függőleges tengelyen az abszolút gyakoriságok helyett a relatív gyakoriságok szerepelnének. Az osztályközös gyakorisági sorokat, amelyeket leggyakrabban folytonos mennyiségi ismérv szerinti csoportosítással képezünk, hisztogrammal és gyakorisági poligonnal ábrázoljuk. A hisztogram hézagmentesen egymás mellé illesztett téglalapokkal szemlélteti a gyakorisági (relatív gyakorisági) sort. (Mi a relatív gyakoriságok alapján készítettük a 2.2. ábrát.) 48
Egy ismérv szerinti elemzés
2.2. ábra - A lakások vízfogyasztás szerinti megoszlásának hisztogramja
A kumulált gyakorisági (relatív gyakorisági) sorok is szemléltethetők (2.3. ábra).
49
Egy ismérv szerinti elemzés
2.3. ábra - A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok
A hisztogram téglalapjainak területe arányos a relatív gyakoriságokkal, így a gyakoriságokkal is. A különböző osztályközhosszúságokkal képzett gyakorisági (relatív gyakorisági) sor ábrázolásánál az arányosság csak úgy biztosítható, ha az eredeti gyakoriságok (relatív gyakoriságok) helyett az egységnyi osztályközhosszúságra jutó gyakoriságokat relatív gyakoriságokat vagy azok valamilyen többszörösét ábrázoljuk. Az eredeti gyakoriságok (relatív gyakoriságok) alapján történő ábrázolás ugyanis torzítana, mivel a hosszabb osztályköz nagyobb súlyt kapna, a téglalap területe az arányosnál nagyobb lenne. Ennek bemutatására szolgál a következő példa. Az adatokat a 2.18. táblázat tartalmazza.
2.18. táblázat - Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint Biztosítás díja (Ft)
Biztosítások száma (db)
Osztályközök 1000 osztályközhosszúságra jutó gyakoriság hossza
– 2000
15
1000
15,0
2001 – 3000
50
1000
50,0 50
Egy ismérv szerinti elemzés 3001 – 4000
60
1000
60,0
4001 – 6000
80
2000
40,0
6001 – 8000
25
2000
12,5
8001 – 10 000
15
2000
7,5
10 001 –
5
2000
2,5
250
–
–
Összesen
Az 1000 osztályközhosszúságra jutó gyakoriság:
Pl. a negyedik osztályközben:
(A hisztogramot a 2.4. ábra mutatja.)
Ha a relatív gyakoriságokat úgy ábrázoljuk, hogy az osztályköz az egység vagy a téglalapok magassága 1. Ebben az esetben sűrűséghisztogramról beszélünk.
(
), akkor a téglalapok összterülete
A kumulált relatív gyakoriságok ábrázolásánál monoton növekvő függvényt kapunk, amelynek legkisebb értéke 0 és a legnagyobb 1 (százalékos formánál 100). Ilyen függvényt közvetlenül az eloszlásból is készíthetünk, ekkor eloszlásfüggvénynek nevezzük. A gyakorisági poligon az osztályközepeknél felmért gyakoriságok (a különböző hosszúságú osztályközöknél az egységnyi osztályközhosszúságra jutó gyakoriságok) pontjait összekötő, egyenes szakaszokból álló vonaldiagram. Az első és utolsó pontot összekötjük az X tengelyen az első osztályközt megelőző (azzal azonos hosszúságú) osztályköz, ill. az utolsó osztályközt követő (azzal azonos hosszúságú) osztályköz középpontjával.
51
Egy ismérv szerinti elemzés
2.4. ábra - A biztosítások biztosítási díj szerinti megoszlásának hisztogramja
52
Egy ismérv szerinti elemzés
2.5. ábra - A lakások vízfogyasztás szerinti megoszlásának gyakorisági poligonja
53
Egy ismérv szerinti elemzés
2.6. ábra - A biztosítások biztosítási díj szerinti megoszlásának gyakorisági poligonja
A 2.5 és 2.6. grafikus ábrák szemléletesen mutatják a gyakorisági eloszlás jellegzetességeit. A következő alfejezetekben megismerkedünk azokkal a mutatószámokkal, amelyek további és egyben valamilyen számszerű információt nyújtanak a gyakorisági sorok jellegzetességeiről, az eloszlás helyzetéről, szóródásáról és alakjáról. E mutatószámok alapján, majd később látni fogjuk, akkor is képet kapunk az eloszlásról, ha nem állnak rendelkezésre az alapadatok és/vagy a grafikus ábrák. Az eloszlás helyzete: a jellemzőnek tartott értékek – a középértékek (módusz, medián, átlag) és a kvantilisek – helye az X tengelyen. E mutatókat ezért helyzetmutatóknak is szokás nevezni. Az eloszlás szóródása: az ismérvértékek különbözősége, változékonysága, melyet a szóródás mérőszámaival vizsgálunk. Az eloszlás alakja: szimmetrikus vagy aszimmetrikus, melyről az aszimmetriamérőszámai (alakmutatók) adnak számszerű információt.
2.1.5. Helyzetmutatók Módusz A módusz (jele: Mo) azt az értéket jelöli, amelyik a szó hétköznapi értelmében a legáltalánosabb, amelyik a tipikus a sokaságban. Ezért tipikus értéknek is szokásnevezni . 54
Egy ismérv szerinti elemzés Az eloszlás módusza a leggyakrabban előforduló ismérvérték, ha van ilyen érték. A 2.11. táblázat (a háztartások taglétszám szerinti megoszlása) adataiból : Mo = 3 A háztartások tipikus (leggyakoribb) taglétszáma 3 fő. A gyakorisági megoszlás ún. nyers módusza a gyakorisági poligon maximumhelye, az az ismérvérték, amely körül az előforduló ismérvértékek legjobban sűrűsödnek.
2.7. ábra -
A 2.7. ábrán látható gyakorisági poligonnak egy maximumhelye van. Az ilyen megoszlást (illetve eloszlást) egymóduszú megoszlásnak, illetve eloszlásnak nevezzük, és a móduszt mint helyzetmutatót elsősorban ilyen megoszlások, illetve eloszlások jellemzésére használjuk. Ha a gyakorisági poligonnak több helyi maximuma van, a megoszlást, illetve az eloszlást többmóduszú megoszlásnak, illetve eloszlásnak nevezzük. Ilyen eloszlást szemléltet a 2.8. ábra.
55
Egy ismérv szerinti elemzés
2.8. ábra -
A többmóduszú eloszlások gyakran heterogén (nem egynemű) sokaságra utalnak, azaz az eloszlás több (a 2.8. ábrán kettő) egymóduszú eloszlást mutató részsokaságból tevődik össze. Ilyen esetben a teljes sokaság vizsgálata mellett – ha a heterogenitást okozó ismérv ismert – a sokaságot részsokaságokra bonthatjuk, és az elemzést a részekre bontott sokaságokra is elvégezhetjük. Ennek részleteiről a 3. fejezetben lesz szó. A folytonos (és a sok változattal rendelkező diszkrét) mennyiségi ismérv móduszát osztályközös gyakorisági sor alapján becsüljük. A móduszt az az osztályköz tartalmazza, amelyben az egységnyi osztályközhosszúságra jutó gyakoriság (relatív gyakoriság) a legnagyobb. (Az ismérvértékek sűrűsége, tömörülése ebben az osztályközben a legnagyobb.) A móduszt tartalmazó osztályközt modális osztályköznek nevezzük. Azonos hosszúságú osztályközök esetén ez a legnagyobb gyakoriságú (relatív gyakoriságú) osztályköz. Különböző hosszúságú osztályközök esetén az egységnyi osztályközhosszúságra jutó gyakoriságok (relatív gyakoriságok) alapján keressük meg a modális osztályközt. A modális osztályköz közepét nyers módusznak nevezzük. Ha szimmetrikus a megoszlás, akkor a nyers módusz maga a módusz. Ha nem szimmetrikus a megoszlás, akkor a módusz becsléséhez a modális osztályközzel szomszédos osztályközök gyakoriságát is figyelembe vesszük. Ebben az esetben ugyanis a módusz közelebb van valamelyik osztályközhatárhoz. Feltételezhető, hogy a sűrűsödési hely közelebb esik a modális osztályköz azon (alsó vagy felső) határához, amelynek nagyobb a gyakorisága. A módusz becsült értéke:
ahol:
a modális osztályköz alsó határa, 56
Egy ismérv szerinti elemzés
a modális és az azt megelőző osztályköz (egységnyi osztályközhosszúságra jutó) gyakoriságának (relatív gyakoriságának) különbsége, a modális és az azt követő osztályköz (egységnyi osztályközhosszúságra jutó) gyakoriságának (relatív gyakoriságának) különbsége, h : a modális osztályköz hossza. A módusz becslését a lakások vízfogyasztásának gyakorisági sora alapján mutatjuk be (adatok a 2.6. táblázatban): – modális osztályköz: 15–20 m3, – osztályközök azonos hosszúságúak, – (mivel
ezért a módusz az osztályköz felső határához esik közelebb),
A lakások tipikus vízfelhasználása 19,6 m3. A tipikus vízfelhasználás becslése a relatív gyakorisági sor alapján (adatok a 2.6. táblázatban):
57
Egy ismérv szerinti elemzés
2.9. ábra - A lakások vízfogyasztás szerinti megoszlása
A módusz grafikus úton is becsülhető. A gyakorisági (relatív gyakorisági) sor jól szerkesztett hisztogramjának segítségével a módusz becsült értéke szerkeszthető. A 2.9. ábrán két hasonló háromszöget látunk:
Ebből:
A módusz becslését különböző hosszúságú osztályközös gyakorisági sor alapján is bemutatjuk. A lakások tipikus biztosítási díjának becslése (adatok a 2.18. táblázatban): Az egységnyi (1000) osztályközhosszúságra jutó gyakoriságok alapján a modális osztályköz: 3000 – 4000 Ft; 58
Egy ismérv szerinti elemzés
Medián A medián (jele: Me) a mennyiségi ismérvnek az az értéke, amelynél ugyanannyi kisebb, mint nagyobb érték fordul elő. A grafikus ábrákra gondolva, az X tengelyen az a pont, melyben az X tengelyre állított merőleges a hisztogram területét, illetve a gyakorisági poligon alatti területet felezi (két egyenlő részre osztja). A mediánnak van egy érdekes tulajdonsága. Ha minden ismérvértéket a mediánnal helyettesítenénk, akkor ezzel összességében a lehető legkisebb hibát követnénk el, ha ezt a hibát az
módon mérjük. Igaz ugyanis, hogy a
A mediánt az ismérvértékek rangsorából a következő módon határozzuk meg: – Ha a megfigyelt sokaság elemszáma (N) páratlan, akkor a medián a rangsor
(azaz a középső) ismérvértékével azonos. – Ha a sokaság elemszáma páros, akkor a a medián a két középső, azaz az
ismérvérték számtani átlaga. A társasház vízfogyasztásának rangsora (2.2. táblázat) alapján a medián a következő módon számítható. A megfigyelt lakások száma: 59
Egy ismérv szerinti elemzés
Tehát a medián a rangsor 25. és 26. ismérvértékének átlaga. A rangsor 25. ismérvértéke: 21 m3, a 26. ismérvértéke: 22 m3.
A lakások felében (50%-ában) a vízfogyasztás 21,5 m3-nél kevesebb, másik felében (50%-ában) ennél több. Az osztályközös gyakorisági (relatív gyakorisági) sor esetén a mediánt csak becsléssel tudjuk meghatározni. A mediánt az az i-edik osztályköz tartalmazza, amelynél
teljesül, ahol:
az i-edik osztályköz kumulált gyakorisága,
az i-edik osztályköz kumulált relatív gyakorisága, az i-edik osztályközt megelőző osztályköz kumulált gyakorisága, az i-edik osztályközt megelőző osztályköz kumulált relatív gyakorisága. Feltételezve, hogy a mediánt tartalmazó osztályközön belül az ismérvértékek egyenletesen helyezkednek el, az osztályköz arányos részét az osztályköz alsó határához hozzáadva, a mediánra megfelelő becslést kapunk.
ahol:
a mediánt magába foglaló osztályköz alsó határa,
a mediánt megelőző osztályköz kumulált gyakorisága, a mediánt megelőző osztályköz kumulált relatív gyakorisága, 60
Egy ismérv szerinti elemzés
a mediánt magába foglaló osztályköz gyakorisága, a mediánt magába foglaló osztályköz relatív gyakorisága, h: a mediánt magába foglaló osztályköz hossza. A medián becslését a vízfogyasztás gyakorisági sora alapján mutatjuk be (2.19. táblázat).
2.19. táblázat - Munkatábla a medián becsléséhez Vízfogyasztás 3
(m ) – 15
5
5
0,10
0,10
16 – 20
16
21
0,32
0,42
21 – 25
15
36
0,30
0,72
26 – 30
6
42
0,12
0,84
31 – 35
5
47
0,10
0,94
36 –
3
50
0,06
1,00
Összesen
50
–
A harmadik osztályköz kumulált gyakorisága
1,00
–
az első, amely már meghaladja a 25-öt, így a medián a
A medián becsült értéke:
illetve a relatív gyakoriságok alapján: 61
közötti intervallumban van.
Egy ismérv szerinti elemzés
A gyakorisági sor alapján becsült érték (21,33 m3) jól közelíti a medián rangsor alapján meghatározott értékét (21,5 m3). Az átlag Az eloszlás helyzetének jellemzésére leggyakrabban az átlagot(jele: ) használjuk. Az ismérvértékek átlaga egyenlő az ismérvértékek összegének és a sokaság elemszámának hányadosával, mely hányados az ismérvértékek számtani átlaga.
A számtani átlag definíciója alapján könnyen belátható, hogy ha minden ismérvértéket az átlaggal helyettesítünk, akkor ezek összege egyenlő az eredeti értékek összegével:
A vízfogyasztás rangsora (2.2. táblázat) alapján a lakások átlagos vízfogyasztása:
Az ismérvértékek átlagát nemcsak az alapadatokból kiindulva, hanem – a sokasághoz tartozó értékösszegből, – egy gyakorisági sor adataiból, vagy – egy értékösszegsor adataiból is számíthatjuk. Az első esetben az átlag:
62
Egy ismérv szerinti elemzés ahol S: a sokaság teljes értékösszege. Példánkban a társasház összes vízfogyasztása:
így az átlagos vízfogyasztás:
Gyakorisági sor alapján az ismérvértékek átlagát súlyozott számtani átlagformában számítjuk.
ahol
az átlagolni kívánt ismérvértékek (osztályközös gyakorisági sor esetén az osztályközepek),
az egyes osztályokhoz (osztályközökhöz) tartozó gyakoriságok, melyeket az átlagszámítás során súlyoknak nevezünk. A megoszlásból az osztályközepekkel történő számítás esetén az eloszlás átlagára becsült értéket kapunk.
2.20. táblázat - Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok Biztosítási díj (Ft)
Biztosítások száma (db)
– 2000
15
1 500
0,06
2001 – 3000
50
2 500
0,20
3001 – 4000
60
3 500
0,24
4001 – 6000
80
5 000
0,32
6001 – 8000
25
7 000
0,10
8001 – 10 000
15
9 000
0,06
10 001 –
5
11 000
0,02 63
Egy ismérv szerinti elemzés Összesen
250
–
1,00
Az átlagos biztosítási díj (átlagdíj):
Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem az aránya befolyásolja, ezért súlyként a gyakoriságok a relatív gyakoriságok
helyett használhatók
is.
Az átlagos biztosítási díj:
A számításokat a 2.20. táblázat adatainak felhasználásával végeztük. Az ismérvértékek átlagát az értékösszegsorból súlyozott harmonikusátlag formában számítjuk. Mivel
ahol
az i-edik osztály (osztályköz) értékösszege, ezért az átlag a következő formában is számítható:
mely nem más, mint az
értékek (osztályközepek) súlyokkal számított harmonikus átlaga. Mivel az átlag nagyságát a súlyarányok befolyásolják,
ezért súlyként az értékösszegek helyett az
hányadosok, azaz a relatív értékösszegek is használhatók: 64
Egy ismérv szerinti elemzés
A lakásbiztosításokra vonatkozó példa alapján (2.21. táblázat):
2.21. táblázat - Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok Összes bevétel
Biztosítási díj (Ft)
(Ft)
megoszlása (%)
– 2000
1500
22 500
2,00
2001 – 3000
2500
125 000
11,14
3001 – 4000
3500
210 000
18,71
4001 – 6000
5000
400 000
35,63
6001 – 8000
7000
175 000
15,59
8001 – 10 000
9000
135 000
12,03
10 001 –
11 000
55 000
4,90
–
1 122 500
100,00
Összesen Az átlagos biztosítási díj:
65
Egy ismérv szerinti elemzés Kvantilisek A középértékek mellett fontos helyzetmutatók a kvantilisek. Legyen 0 < q < 1. Ha a rangsorba rendezett sokaságot egy X ismérvérték q-adik kvantilisnek nevezzük (jele:
arányban osztja ketté, akkor ezt az ismérvértéket q-ad rendű vagy
).
Kumulált gyakoriságokkal, illetve kumulált relatív gyakoriságokkal felírva:
Ha a feltételnek két ismérvérték is eleget tesz, akkor
ezen intervallumot
arányban osztó pont lesz.
A gyakran előforduló kvantiliseket külön névvel és jelöléssel is illetjük. Tercilisek: Kvartilisek:
(alsó tercilis),
(felső tercilis),
(alsó kvartilis),
(medián),
(felső kvartilis),
Kvintilisek: Decilisek: Percentilisek:
..., ...,
A kvartilisek – és egyben az összes kvantilis – rangsorból való meghatározásának és osztályközös gyakorisági (relatív gyakorisági) sorból történő becslésének menete azonos a mediánnál ismertetett eljárással. Ha a
kvantilist a rangsorból kiindulva határozzuk meg, akkor legyen
ahol:
az egész részt,
a törtrészt jelöli. 66
Egy ismérv szerinti elemzés Ekkor:
A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban) a kvartilisek meghatározása a következő. Az alsó kvartilis számítása:
A szám egész része: ismérvértékéhez, az
törtrésze:
Az alsó kvartilis tehát a rangsor 12. és 13. értéke között van; úgy határozzuk meg, hogy a rangsor 12.
hozzáadjuk a 13. és 12. ismérvérték közötti különbség 0,75-szeresét:
A lakások 25%-ában a vízfogyasztás 17,75 m3-nél kevesebb, 75%-ában ennél több. A felső kvartilis:
így
és
A rangsor 38. ismérvértékéhez hozzáadjuk a 39. és 38. ismérvérték közötti különbség 0,25-szeresét:
A lakások 75%-ának a vízfogyasztása 26,25 m3-nél kevesebb, 25%-ának ennél nagyobb. Osztályközös gyakorisági (relatív gyakorisági) sorból történő becslés esetén a
illetve relatív gyakorisági sor esetén a 67
kvantilist az az i-edik osztályköz tartalmazza, amelyre
Egy ismérv szerinti elemzés
teljesül. Ekkor
ahol
az i-edik osztályköz alsó határa,
az i-edik osztályköz hossza. A kvartilisek becslését a vízfogyasztás gyakorisági sora (adatok a 2.19. táblázatban) alapján mutatjuk be. Az alsó kvartilis becslése:
Az
és a második osztályközben a kumulált gyakoriság
már nagyobb, mint 12,5. Így az alsó kvartilis 15–20 m3 között van.
A felső kvartilis becslése:
A kumulált gyakoriság
először a negyedik osztályközben nagyobb, mint 37,5. Ezért a felső kvartilis
m3 között van.
(A gyakorisági sorból történő becslés – már a mediánnál is láttuk – elfogadható pontosságú.) A kvantilisek jól szerkesztett ábra – a kumulált gyakoriságok (relatív gyakoriságok) hisztogramja – alapján is becsülhetők (2.10. ábra). 68
Egy ismérv szerinti elemzés
2.10. ábra - A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése
A lakossági jövedelmek vizsgálatánál gyakran a deciliseket számítjuk ki. A 2.7. táblázat a nyugdíjas nők nyugdíjnagyság szerinti megoszlását mutatja. A gyakorisági sorból a kvartilisek becslésénél megismert módon becsülhetjük a deciliseket is. Az első decilis becslése:
A negyedik osztályközben a kumulált gyakoriság ennél nagyobb, így
Ebből:
A nyugdíjas nők 10%-ának nyugdíja 8894 Ft-nál kisebb, 90%-ának ennél nagyobb volt 1994 áprilisában. 69
Egy ismérv szerinti elemzés Az ötödik decilis (medián) becslése:
A nyugdíjas nők 50%-ának a nyugdíja 12 200 Ft-nál kevesebb, 50%-ának pedig több volt 1994 áprilisában. (A
tehát valóban a mediánnal azonos.)
A többi decilist is hasonló módon kiszámítva (becsülve), az eredményeket sorba rendezve egy speciális gyakorisági (relatív gyakorisági) sort, ún. deciliseloszlást képezhetünk, melyet a 2.22. táblázat tartalmaz.
2.22. táblázat - A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás) Nyugdíj
Nyugdíjas nők
Nyugdíj
Nyugdíjas nők
(Ft)
száma (fő)
(Ft)
megoszlása (%)
– 8894
125 975
– 8894
10
8894 – 9579
125 975
8894 – 9579
10
9579 – 10 319
125 975
9579 – 10 319
10
10 319 – 11 295
125 975
10 319 – 11 295
10
11 295 – 12 200
125 975
11 295 – 12 200
10
12 200 – 12 924
125 975
12 200 – 12 924
10
12 924 – 13 648
125 975
12 924 – 13 648
10
13 648 – 14 372
125 975
13 648 – 14 372
10
14 372 – 15 751
125 975
14 372 – 15 751
10
15 751 –
125 975
15 751 –
10
Összesen
1 259 750
Összesen
100 70
Egy ismérv szerinti elemzés A fenti osztályközös gyakorisági sorokban az osztályközök határai a decilisek, az osztályközök gyakorisága (relatív gyakorisága) pedig azonos. Például a hetedik osztályköz alsó határa: a felső határa: 125 975 főnek, a nyugdíjas nők 10%-ának a nyugdíja 12 924 és 13 648 Ft között volt, 70%-ának a nyugdíja pedig 13 648 Ft-nál kevesebb volt 1994 áprilisában. Az olyan – nem egyenlő hosszúságú osztályközös gyakorisági (relatív gyakorisági) – sorokat, melyekben minden osztályköz gyakorisága (relatív gyakorisága) azonos és az osztályközhatárok a kvantilisek (kvartilis, kvintilis, decilis stb.), a gyakorlatban kvantilis eloszlásnak nevezzük. (Az eddig használt terminológiák szerint indokoltabb lenne a kvantilis megoszlás elnevezés.)
2.1.6. Szóródási mutatók A középértékek és a kvantilisek csak egyetlen tulajdonságát rögzítik az eloszlásnak, az elhelyezkedését (a vízszintes tengelyen elfoglalt helyét). Ettől azonban a sokaság eloszlása még nagyon sokféle lehet.
2.11. ábra -
A 2.11. ábrán három eloszlás gyakorisági poligonját mutatjuk be. Mivel szimmetrikusak, az átlaguk, móduszuk és a mediánjuk ugyanakkora, mégis lényegesen különböznek egymástól. Mi okozza az eltérést? Az, hogy az adatok szétszórtsága, ún. szóródása erősen különbözik az eloszlásokban. Az egyiknél az átlag körül tömörül az ismérvértékek zöme, a másiknál kevésbé, a harmadiknál teljesen szétszórtan helyezkednek el. 71
Egy ismérv szerinti elemzés Ahhoz, hogy a középérték jellemző erejét értékelni tudjuk, szükséges, hogy az ismérvértékek szóródásáról is legyen ismeretünk. Az olyan középérték, amely körül kicsi az ismérvértékek szóródása, jobb jellemzője a sokaságnak, mint az olyan, amelytől az egyes ismérvértékek nagymértékben különböznek. Szóródáson azonos fajta számszerű adatok (általában egy mennyiségi ismérv értékeinek) különbözőségét értjük. Önmagában tehát azt a tényt jelenti, hogy pl. a megfigyelt társasház lakásainak vízfogyasztása különböző nagyságú. Az ismérvértékek szóródásáról a gyakorisági sor és a grafikus ábrák is adnak információt, emellett azonban szükség van a szóródás mérésére, a szóródás jelenségének egyetlen számértékben való tömörítésére. A szóródás mérése az ismérvértékek valamely középértéktől (általában a számtani átlagtól) vett eltérései vagy egymás közötti különbségei alapján történik. Ezen eltérések, különbségek alapján számított mérőszámok a szóródás abszolút mutatói, amelyek mértékegysége megegyezik a megfigyelt ismérv mértékegységével. A szóródás relatív mutatói elvonatkoztatnak az ismérvértékek mértékegységétől, nagyságrendjétől (általában %-os formában fejezzük ki őket), a szóródás térbeli vagy időbeli összehasonlítására szolgálnak. Valamennyi mérőszám közös tulajdonsága, hogy a szóródás hiányát (ha minden ismérvérték egyenlő) nullával, meglétét pedig valamilyen nullától különböző pozitív értékkel jelzi. A leggyakrabban használt szóródási mérőszámok: – a szóródás terjedelme, – az átlagos eltérés, – a szórás, – az átlagos különbség és – a relatív szórás. A szóródás terjedelme A szóródás terjedelme (jele: R) az előforduló legnagyobb és legkisebbismérvérték különbsége:
A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban): 72
Egy ismérv szerinti elemzés
A terjedelem a szóródásnak igen szemléletes kifejezője (pl. egy adott termék legkisebb és legnagyobb fogyasztói árának különbsége, vagy egy adott évben befizetett legkisebb és legnagyobb személyi jövedelemadó különbsége), a gyakorlatban mégis kevésbé használatos a szóródás mérésére. Ennek az az oka, hogy értékét a véletlen szerepe számottevően befolyásolhatja, mivel nagysága csak a két legszélsőségesebb ismérvértéktől függ. Ezért gyakran használják a terjedelem helyett az ún. interkvantilis terjedelemmutatókat is, amelyek két szélső kvantilis különbségével azonosak (pl. az első és kilencedik decilis vagy az alsó és felső kvartilis különbsége). Átlagos eltérés Az átlagos eltérés (jele: δ) az ismérvértékek számtani átlagtól vett eltérésein alapul, ezen eltérések átlaga. Mivel az átlagtól vett
eltérések algebrai összege nulla – a számtani átlag első tulajdonsága, lásd 1.6. pont –, ezért az eltérések abszolút értékeit átlagoljuk. Az átlagos eltérésaz egyes értékek számtani átlagtól vett eltérései abszolút értékeinek számtani átlaga:
Az átlagos eltérés azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól. A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban):
Az egyes lakások vízfogyasztása átlagosan 5,26 m3-rel tér el az átlagos fogyasztástól. A gyakorisági sor adataiból az átlagos eltérést súlyozott formában számítjuk (osztályközös gyakorisági sor esetén becsüljük).
73
Egy ismérv szerinti elemzés Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem a súlyok aránya befolyásolja, az átlagos eltérés számításánál súlyként a relatív gyakoriságok itt is használhatók.
A lakások vízfogyasztását vizsgáló példánkban (a részeredményeket a 2.23. táblázat tartalmazza):
illetve:
E mérőszámot a gyakorlatban viszonylag ritkán használjuk, mert az abszolút érték matematikailag elég nehézkesen kezelhető. Szórás A szórás (jele: eltérésein A
) a legfontosabb és egyben a leggyakrabban használt szóródási mérőszám. Számítása szintén az ismérvértékek átlagtól vett
alapul. Az eltérések pozitív és negatív előjele okozta problémától úgy is „megszabadulhatunk”, hogy a
értékekből tehát négyzetes átlagot számítunk.
A szórás az egyes értékek számtani átlagtól vett eltéréseinek négyzetes átlaga:
A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban) a szórás:
74
eltéréseket négyzetre emeljük.
Egy ismérv szerinti elemzés
Gyakorisági sor alapján a szórást súlyozott formában számítjuk (osztályközös gyakorisági sor alapján becsüljük). Súlyként a gyakoriságokat vagy a relatív gyakoriságokat
használjuk.
vagy
A szórás azt mutatja, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlagtól. Jelentése tehát ugyanaz, mint az átlagos eltérésé, mivel mindkettő a eltérések átlaga. Az átlagos eltérés (δ) a értékek számtani, a szórás pedig a értékek négyzetes átlaga. Ugyanazon értékek különféle átlagainak az 1.6. alfejezetben megismert nagyságrendi viszonya miatt az átlagos eltérés mindig kisebb értékkel méri a szóródást, mint a szórás
.
A szórás súlyozott formában történő számítását a vízfogyasztás gyakorisági sora alapján mutatjuk be. (A fejrovatokba csak a már korábban megismert jelöléseket írjuk.) (2.23. táblázat.)
2.23. táblázat - Munkatábla az átlagos eltérés és a szórás számításához Vízfogyasztás 3
(m ) – 15
5
0,10
12,5
62,5
– 9,9
49,5
98,01
490,05
9,8010
16 – 20
16
0,32
17,5
280,5
– 4,9
78,4
24,01
384,16
7,6832
21 – 25
15
0,30
22,5
337,5
– 0,1
1,5
0,01
0,15
0,0030
26 – 30
6
0,12
27,5
165,0
5,1
30,6
26,01
156,06
3,1212
31 – 35
5
0,10
32,5
162,5
10,1
50,5
102,01
510,05 10,2010
36 –
3
0,06
37,5
112,5
15,1
45,3
228,01
684,03 13,6806
75
Egy ismérv szerinti elemzés Összesen
50
1,00
–
1120,0
–
255,8
–
2224,50 44,4900
A szórás rangsor alapján számított (6,685 m3) és az osztályközös gyakorisági sor alapján becsült (6,67 m3) értéke közel esik egymáshoz. Az egyes lakások vízfogyasztása átlagosan 6,7 m3-rel tér el az átlagos vízfogyasztástól. A statisztikai elemző munkában – a következő fejezetben majd látni fogjuk – fontos szerepe van a szórás négyzetének is, amit szórásnégyzetnek vagy varianciának nevezünk és
-tel jelölünk.
A variancia számlálója az eltérés-négyzetösszeg (jele: SS):
A szórás tulajdonságai 1. Ha az ismérvértékekhez hozzáadunk egy állandót (A), a szórás nem változik. Tehát: Mivel ilyenkor a számtani átlag is
lesz
22
, ezért
2. Ha az ismérvértékeket megszorozzuk egy állandóval (B), a szórás 2
Lásd az 1.6. pontbeli bizonyításokat.
76
Egy ismérv szerinti elemzés
-szeresére változik. Tehát: Mivel ilyenkor a számtani átlag
2
lesz , ezért
3. A szórás az eredeti értékek négyzetes és számtani átlaga alapján is meghatározható.
Átlagos különbség Az átlagos eltérés és a szórás a számtani átlag alapján méri az ismérvértékek különbözőségét. A szóródás az ismérvértékek egymás közötti különbségei alapján is vizsgálható, illetve mérhető. E mutató bevezetését Corrado Gini olasz statisztikus javasolta, ezért szokás Gini-féle mérőszámnak is nevezni. 77
Egy ismérv szerinti elemzés Az átlagos különbség (jele: G) az ismérvértékek egymástól számított különbségei abszolút értékeinek számtani átlaga. Mivel N db ismérvérték mindegyikének – önmagát is beleértve – N db ismérvértékkel vehetjük a különbségét, összesen Ezek abszolút értékeinek átlaga:
különbség képezhető.
Gyakorisági sor alapján a mutatót súlyozott formában számítjuk (osztályközös gyakorisági sorból becsüljük).
Az átlagos különbség azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el egymástól. Számítását a vízfogyasztás gyakorisági sora alapján mutatjuk be. (A 2.24. táblázatban kiszámított különbségek, illetve szorzatok az átlóra szimmetrikusak, ezért elegendő az átló alatti vagy fölötti különbségeket és szorzatokat kiszámítani és 2-vel szorozni.) a) Az ismérvértékek különbségei:
3
Adatok: m
12,5 17,5 22,5
12,5
17,5
22,5
27,5
32,5
37,5
0
5
10
15
20
25
0
5
10
15
20
0
5
10
15
0
5
10
0
5
27,5 32,5 37,5
0 78
Egy ismérv szerinti elemzés b) Az ismérvértékekhez tartozó súlyok szorzatai:
5
5
16
15
6
5
3
*
80
75
30
25
15
*
240
96
80
48
*
90
75
45
*
30
18
*
15
16 15 6 5 3
*
c) Az előző táblák megfelelő rovatainak szorzatai:
Adatok: m3
12,5
12,5
17,5
22,5
27,5
32,5
37,5
Összesen
0
400
750
450
500
375
2475
0
1200
960
1200
960
4320
0
450
750
675
1875
0
150
180
330
0
75
75
0
0
2265
9075
17,5 22,5 27,5 32,5 37,5 Összesen
0
400
1950
1860
2600
Az ismérvértékek különbségeinek összege a táblázat c) részében kapott szorzatösszeg kétszeresével azonos: 2 · 9075 = 18 150 m3.
79
Egy ismérv szerinti elemzés
Az egyes lakások vízfogyasztása átlagosan 7,26 m3-rel tér el egymástól. Relatív szórás A szóródás eddig megismert mérőszámai a megfigyelt mennyiségi ismérv mértékegységében mérik a szóródást. Sok esetben szükség lehet arra, hogy az értékek nagyságrendjétől és mértékegységétől elvonatkoztatott mérőszámmal mérjük és tegyük összehasonlíthatóvá a szóródást. Ilyen mérőszám a relatív szórás (jele: V):
Megmutatja, hogy a szórás az átlagnak hányad része. A relatív szórást százalékban szoktuk kifejezni és viszonyszámként értelmezzük.
A képlet átalakításával belátható az is, hogy a relatív szórás az egyedi eltérések viszonylagos nagyságának, a átlaga.
hányadosoknak a négyzetes
Ezért úgy is értelmezhető, hogy az egyes ismérvértékek átlagosan hány %-kal térnek el az átlagtól. A lakások vízfogyasztására vonatkozó példánkban az átlagos vízfogyasztás 22,4 m3, a szórás pedig 6,67 m3 volt. A szóródás relatív mértéke :
A relatív szórást viszonyszámként értelmezve megállapíthatjuk, hogy a szórás az átlagnak közel 30%-a. Másként fogalmazva az egyes lakások vízfogyasztása átlagosan 29,8%-kal tér el a 22,4 m3-es átlagtól. A A relatív szórás ezen értékek közé esik. 80
értékek – %-ban kifejezve – rendre: 44,2; 21,9; 0,4; 22,8; 45,1 és 67,4.
Egy ismérv szerinti elemzés
2.1.7. Az aszimmetria mérőszámai Az előző alfejezetekben megismerkedtünk azokkal a grafikus ábrákkal, melyekkel a gyakorisági sorok (gyakorisági eloszlások, illetve megoszlások) szemléltethetők, illetve azokkal a mutatószámokkal (középértékek, kvantilisek, szóródási mutatók), amelyek a gyakorisági sorok helyzetéről és szóródásáról számszerű információt nyújtanak. A gyakorisági sorokat ábrázolva megállapítható, hogy a görbék (poligonok) igen változatosak lehetnek, de nagy többségük bizonyos szabályszerűséget mutat, így besorolható néhány jellegzetes típusba. Az eloszlások következő típusaival foglalkozunk: – egymóduszú eloszlás – szimmetrikus, – aszimmetrikus (vagy ferde); – többmóduszú eloszlás. Az egymóduszú gyakorisági sorok poligonjának egy helyi maximuma (csúcsa) van. A helyzetmutatók elhelyezkedésétől függően az eloszlás szimmetrikus és aszimmetrikus lehet. Az egymóduszú eloszlások jellegzetességeit a 2.25. táblázat tartalmazza.
2.25. táblázat - A szimmetrikus és aszimmetrikus eloszlások jellemzői Szimmetrikus eloszlás
Aszimmetrikus eloszlás bal oldali
jobb oldali
A társadalmi-gazdasági jelenségek körében a bal oldali aszimmetria a leggyakoribb. Például a lakossági megtakarítások nagyságának, a vállalkozások nyereségének, a családok egy főre jutó jövedelmének eloszlása tipikusan bal oldali aszimmetriát mutat. 81
Egy ismérv szerinti elemzés A 2.25. táblázatból látható, hogy a már megismert grafikus ábrák (a hisztogram és a gyakorisági poligon), a középértékek és kvantilisek alapján az eloszlás típusát, az aszimmetria irányát meg tudjuk állapítani. A továbbiakban olyan mutatókkal (mérőszámokkal) ismerkedünk meg, amelyek egy számba sűrítve kifejezésre juttatják az aszimmetria fennállását, irányát és fokát is. Arra a kérdésre kapunk választ, hogy milyen mértékűnek ítélhető a szimmetrikushoz képest a megoszlás aszimmetriája, más szóval ferdesége. Az aszimmetria leggyakrabban használt mérőszámai a Pearson-féle mutatószám és az F mutató. Az aszimmetria Pearson-féle mutatószáma (jele: A) a számtani átlag és a módusz egyes eloszlástípusok esetén jellemző nagyságrendi viszonyán alapul:
Az különbség nagysága a ferdeség fokán kívül a szóródás nagyságától is függ. Nagymértékű szóródás esetén ugyanis a különbség akkor is viszonylag nagy lehet, ha az aszimmetria viszonylag kisfokú. Ezért, ha a két középérték különbségét elosztjuk a szórással, olyan mérőszámot kapunk, melynek értékéből következtetni tudunk az aszimmetria mértékére. A mérőszám (önmagában a számláló) előjele az aszimmetria irányát mutatja. Bal oldali aszimmetria esetén , jobb oldali aszimmetria esetén Szimmetrikus eloszlás esetén A mérőszám abszolút értékének nincs határozott felső korlátja, azonban már 1-nél nagyobb abszolút érték meglehetősen erős aszimmetriára utal. A lakások vízfogyasztására vonatkozó példa alapján:
A lakások vízfogyasztás szerinti eloszlása mérsékelten bal oldali aszimmetriát mutat. Az aszimmetria másik mérőszáma,az F mutató (jele: F) az alsó és felső kvartilis mediántól való eltérésének egymáshoz viszonyított nagyságán alapul. Bal oldali aszimmetria esetén a medián az alsó Ha a van:
, jobb oldali aszimmetria esetén a felső
kvartilishez esik közelebb.
eltérések különbségét elosztjuk azok összegével, olyan mérőszámot kapunk, amely abszolút értékének határozott felső korlátja . Az F mutató lényegesen kisebb értékkel jelzi a már nagyfokúnak tekinthető aszimmetriát, mint az A:
82
Egy ismérv szerinti elemzés E mutatószám ugyanolyan feltételek mellett ad nulla, pozitív és negatív eredményt, mint az A mutató. Az F mutatót nemcsak a kvartilisek, hanem a többi kvantilis, például a decilisek alapján is számíthatjuk.
vagy a
illetve
helyett akár a
illetve
is behelyettesíthető.
A lakások vízfogyasztására vonatkozó példánkban (a kvartiliseket felhasználva):
E mutató is enyhe bal oldali aszimmetriát jelez. Az F mutató – szemben az A-val – többmóduszú eloszlásoknál is használható a ferdeség fokának vizsgálatára. Több gyakorisági sor ferdeségének összehasonlításakor, valamint ugyanazon jelenség eloszlásának időbeli vizsgálatára mindig ugyanazt a mérőszámot kell használni.
2.1.8. A koncentráció elemzése Valamely sokaságnak egy mennyiségi ismérv szerinti vizsgálata arra is irányulhat, hogy az értékösszeg mennyire koncentrálódik a sokaság bizonyos egységeire. Pl. vizsgálhatjuk a termelés, a jövedelem, a vagyon, a betétösszeg, a népesség stb. koncentrációját. A koncentráción általában tömörülést, összpontosulást értünk. Pl. a népesség nagy része a nagyobb településeken, a városokban összpontosul, a magánvagyon egyre nagyobb része tömörül (koncentrálódik) a lakosság egy szűkebb körénél stb. Koncentrációnak nevezzük azt a jelenséget, hogy a sokasághoz tartozó teljes értékössszeg jelentős része a sokaság kevés egységére összpontosul. Ha a sokaság elemszáma (N) kicsi, akkor az már önmagában is koncentrációt jelent, hiszen a teljes értékösszeg (S) a szó szoros értelmében kevés egységre összpontosul. Ha a sokaság elemszáma nagy, akkor a definícióban szereplő „kevés egységet” relatív módon értelmezzük. Ilyen esetben a koncentráció abban nyilvánul meg, hogy a sokaság teljes értékösszege egyenlőtlenül oszlik meg a sokaság egységei között. 83
Egy ismérv szerinti elemzés
A koncentráció a relatív gyakoriságok (osztályközökhöz) tartozó
és a relatív értékösszegek
összehasonlításával mutatható ki. Ha az egyes osztályokhoz
értékek azonosak, az a koncentráció hiányaként értelmezhető, eltérésük viszont a koncentrációt jelzi.
2.26. táblázat - Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január 1-jén Települések Népességnagyság
száma
(fő)
össznépessége (fő) (tényleges)
Települések számának össznépességének
%-os megoszlása
– 499
150
35 570
58,4
11,8
500 – 999
65
48 021
25,3
16,0
1000 – 1999
31
42 506
12,0
14,1
2000 – 4999
6
20 119
2,3
6,7
5000 – 9999
2
16 620
0,8
5,5
10 000 – 49 999
1
22 263
0,4
7,4
50 000 – 99 999
2
115 968
0,8
38,5
257
301 067
100,0
100,0
Összesen
A 2.26. táblázatból látható, hogy a megye népességének 11,8%-a él a települések 58,4%-át kitevő kistelepüléseken, ugyanakkor a népesség nagy hányada (38,5%-a) a települések mindössze 0,8%-át kitevő nagytelepüléseken (városokban) koncentrálódik. A koncentráció vizsgálatának egyik legfontosabb és egyben legelterjedtebb eszköze a Lorenz-görbe, amely a koncentráció meglétén kívül annak mértékét is szemléletesen mutatja. A Lorenz-görbe egy egységnyi oldalú négyzetben elhelyezett vonaldiagram, mely a kumulált relatív gyakoriságok függvényében ábrázolja a kumulált relatív értékösszegeket
.
A görbét úgy készítjük, hogy a
84
Egy ismérv szerinti elemzés
pontokat egyenes szakaszokkal összekötjük. (A görbe végpontja a 2.12. ábrán is.
pont.) Általában a
illetve
adatokat ábrázoljuk, mint ahogyan a
A koncentráció hiánya esetén a görbe egybeesik az átlóval. Ebben az esetben az egyes osztályokhoz (osztályközökhöz) tartozó azonosak (a teljes értékösszeg egyenletesen oszlik meg a sokaság egységei között).
és
értékek
Minél távolabb esik a görbe az átlótól, annál nagyobb fokú a koncentráció, így az ábra alkalmas a koncentráció időbeli vagy térbeli összehasonlítására is. A 2.26. és 2.27. táblázat adatait felhasználva összehasonlítjuk Nógrád és Zala megye népességének koncentrációját (az 1994. január 1-jei adatok alapján).
2.27. táblázat - Munkatábla a koncentráció vizsgálatához (a fejrovatba csak a jelöléseket írva) Népesség-
Nógrád megye
Zala megye
nagyság (fő) –499
22,4
4,0
22,4
4,0
58,4
11,8
500 –999
35,2
14,7
57,6
18,7
83,7
27,8
1000 –1999
25,6
19,.9
83,2
38,6
95,7
41,9
2000 – 4999
12,8
17,7
96,0
56,3
98,0
48,6
5000 – 9999
0,8
2,9
96,8
59,2
98,8
54,1
10 000 – 49 999
3,2
40,8
100,0
100,0
99,2
61,5
50 000 – 99 999
–
–
–
–
100,0
100,0
100,0
100,0
–
–
–
–
Összesen
85
Egy ismérv szerinti elemzés
2.12. ábra - A népesség koncentrációja Nógrád és Zala megyében (Lorenz-görbe)
A 2.12. ábráról leolvasható, hogy Zala megyében a népesség koncentrációja nagyobb fokú, mint Nógrád megyében. A Lorenz-görbe és az átló által bezárt területet koncentrációs területnek nevezzük. Ha a koncentrációs területet a háromszög területéhez viszonyítjuk, akkor e hányados alapján következtetni tudunk a koncentráció fokára. A koncentrációs terület arányát a koncentrációs együtthatóval (jele: K) mérjük. 86
Egy ismérv szerinti elemzés A koncentrációs együtthatót – a bizonyítást nem részletezzük – számíthatjuk a következő módon is:
ahol G: az átlagos különbség (Gini-féle szóródási mérőszám), az ismérvértékek átlaga. Koncentráció hiánya esetén:
( a görbe egybeesik az átlóval); minél közelebb van K értéke az 1-hez, annál nagyobb fokú a koncentráció.
Zala megyében (a 2.26. táblázat adataiból számítva): átlagos különbség: átlagos népességszám:
Zala megyében a népesség koncentrációja viszonylag nagy fokú, a Lorenz-görbe is ezt jelzi (2.12. ábra).
2.2. Az időbeli ismérv szerinti elemzés 2.2.1. Idősorok A statisztikai elemzések során fontos szerepük van az időbeli összehasonlításoknak, az időbeli változások vizsgálatának. Segítik az elmúlt időszak tendenciáinak, összefüggéseinek feltárását és egyben támpontot is adnak a jövő várható folyamatainak előrejelzéséhez. A társadalmi-gazdasági jelenségek egymástól egyenlő távolságra levő időpontokban, illetve időszakokban megfigyelt értékei idősorokat alkotnak, melyek a vizsgált jelenség természetétől függően állapot- és tartamidősorok lehetnek. Az állapotidősorok az álló sokaságok időbeli változását mutatják, az egyes időpontokra vonatkozó állapotfelvételek eredményeit rögzítik. E sorok sohasem csoportosítás eredményeként jönnek létre, így a bennük szereplő adatok összegezésének nincs tárgyi értelme. A tartamidősorok mozgó sokaságok időbeli alakulását mutatják. A sor elemei egy-egy időtartam folyamán bekövetkező események adatait tükrözik. 87
Egy ismérv szerinti elemzés Mindkét típusú idősornál – éppen az időbeliség lényegéből következően – az ismérvváltozatok (időpontok, időszakok) sorrendje szigorúan kötött, a sor elemei nem cserélhetők fel tetszés szerint. Az idősorokat a következő példák szemléltetik: Állapotidősor (2.28. táblázat):
2.28. táblázat - Magyarország személygépkocsi-állományának alakulása (az évek december 31-én) Év
Személygépkocsi (db)
1985
1 435 937
1986
1 538 877
1987
1 660 258
1988
1 789 562
1989
1 732 385
1990
1 944 553
1991
2 015 455
1992
2 058 334
1993
2 091 623
Tartamidősor (2.29. táblázat):
2.29. táblázat - Magyarországra érkező külföldi turisták számának alakulása Év
Turisták száma (E fő)
1985
9 724
1986
10 613
1987
12 087
1988
10 766 88
Egy ismérv szerinti elemzés 1989
14 490
1990
20 510
1991
21 860
1992
20 188
1993
22 804
A továbbiakban azokkal az egyszerű elemzési eszközökkel foglalkozunk, amelyek alkalmasak az idősorban rejlő információk szemléltetésére, a tendenciák, törvényszerűségek feltárására. Az idősorok vizsgálatának általánosan alkalmazott eszközei a dinamikus viszonyszámok, a grafikusábrázolás és az átlagok.
2.2.2. Dinamikus viszonyszámok A dinamikus viszonyszám (az 1.5. alfejezetben már szóltunk róla) az összehasonlítás tárgyát képező tárgyidőszak (időpont) és az összehasonlítás alapjául szolgáló bázisidőszak (időpont) adatának hányadosa. A kettőnél több adatból álló idősor esetén kétfajta dinamikus viszonyszám számítható: bázis- és láncviszonyszám. A bázisviszonyszámok (jele:
ahol
) az idősor egyes adatainak a bázisul választott időszak (időpont) adatához viszonyított arányát fejezik ki:
az idősor egymást követő adatai, az
pedig a bázisul választott időszak (időpont) adata.
Bázisul az idősor bármelyik időszaka (időpontja) választható, sőt az idősoron kívüli időszak (időpont) is. A bázis megválasztásánál alapelvként rögzíthetjük, hogy bázisként olyan időszak (időpont) adatát helyes választani, melynek nagyságát kivételes, véletlen körülmények nem befolyásolják, így reálisan lemérhető a vizsgált jelenség változása. A statisztikai elemzések során leggyakrabban az első időszakot (időpontot) választjuk bázisul. A láncviszonyszámok (jele:
) az idősor egyes adatainak a közvetlenül megelőző időszak (időpont) adatához viszonyított arányát fejezik ki:
A bázis- és láncviszonyszámok számítását szemlélteti a 2.30. táblázat: 89
Egy ismérv szerinti elemzés
2.30. táblázat - A bázis- és láncviszonyszámok számítása Időszak,
Idősor adata
Bázisviszonyszám
Láncviszonyszám
időpont 1.
–
2. 3. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
t.
n. Vizsgáljuk meg bázis- és láncviszonyszámokkal a lakossági megtakarítások alakulását. Az alapadatokat és a megfelelő viszonyszámokat a 2.31. táblázatbanközöljük.
2.31. táblázat - A lakosság takarékbetét-állományának alakulása (az évek december 31-én) Betétállomány
Év 1980
(milliárd Ft)
1980 = 100,0%
Előző év = 100,0%
145,3
100,0
– 90
Egy ismérv szerinti elemzés 1981
160,1
110,2
110,2
1982
175,7
120,9
109,7
1983
197,1
135,6
112,2
1984
219,4
160,0
111,3
1985
244,1
168,0
111,3
1986
274,9
189,2
112,6
1987
287,5
197,9
104,6
1988
312,7
215,2
108,8
1989
309,5
213,0
199,0
1990
368,6
253,7
119,1
1991
466,0
320,7
126,2
1992
634,7
436,8
136,2
1993
732,9
504,4
115,5
Az 1986. évi bázisviszonyszám:
Az 1986. évi betétállomány az 1980. évinek (a megfigyelés időpontja mindkét évben december 31.) 1,892-szerese, azaz 189,2%-a. Tehát a betétállomány 1980-ról 1986-ra 89,2%-kal nőtt. Az 1986. évi láncviszonyszám:
1985-ről 1986-ra a betétállomány 12,6%-kal nőtt. 91
Egy ismérv szerinti elemzés 1980. évre nem tudunk láncviszonyszámot számítani, mert a példánkban nem ismert az 1979. évi betétállomány. Az 1981. évi bázis- és láncviszonyszám (általában is igaz, hogy a bázisul választott időszak (időpont) utáni időszak (időpont) bázis- és láncviszonyszáma) azonos, mindkettő az 1980-ról 1981-re bekövetkező változást mutatja. A betétállomány 1980-ról 1981-re 10,2%-kal nőtt. A bázis- és láncviszonyszámok közötti összefüggés A bázis- és láncviszonyszámok az idősor eredeti adatainak ismerete nélkül is közvetlenül kölcsönösen kiszámíthatók egymásból. Bázisviszonyszámokból láncviszonyszámokat ugyanúgy számítunk, mint az idősor eredeti adataiból. Az összehasonlítani kívánt időszak (időpont) bázisviszonyszámát elosztjuk az őt közvetlenül megelőző időszak (időpont) bázisviszonyszámával. A t-edik láncviszonyszám
Ugyanis a bázisviszonyszámokat úgy képezzük, hogy az idősor adatait rendre egy konstanssal (a bázisidőszak adatával) osztjuk, ezért a bázisviszonyszámok egymás közötti aránya megegyezik az eredeti adatok egymás közötti arányával.
Példánkban az 1986. évi láncviszonyszám a bázisviszonyszámokból számítva:
Láncviszonyszámokból bázisviszonyszámokat a megfelelő láncviszonyszámok szorzataként kapunk. Az első szorzata a k-adik időszak (időpont) bázisviszonyszámával egyenlő. A k-adik bázisviszonyszám:
ugyanis:
92
számú láncviszonyszám
Egy ismérv szerinti elemzés Példánkban az 1986. évi bázisviszonyszám a láncviszonyszámokból számítva:
2.2.3. Az idősorok grafikus ábrázolása Az idősorok tendenciáinak tömör, áttekinthető jellemzésére gyakran használjuk a grafikus ábrákat. Az idősorokat – mivel általában az ábrákkal a társadalmi-gazdasági jelenségek időbeli változásának tendenciáját szemléltetjük – derékszögű koordináta-rendszerben, vonaldiagrammal ábrázoljuk. A vízszintes tengelyen az időszakokat (időpontokat), a függőleges tengelyen az idősor adatait mérjük fel. Az idősor egyes értékeit jellemző pontokat – azért, hogy a változás tendenciája érzékelhető legyen – egyenes szakaszokkal (teljesen önkényesen) összekötjük. Tartamidősorok esetén az idősor adatait jelölő pontok a megfelelő időintervallum közepén, állapotidősorok esetén pedig az intervallum megfelelő szélén helyezkednek el.
2.13. ábra - A takarékbetét-állomány alakulása
A 2.13. ábra a takarékbetét-állomány alakulását szemlélteti. Ez az idősor állapotidősor, a megfigyelések időpontja minden évben december 31-e volt. Ezért az idősor adatait jellemző pontok az időintervallumok (évek) végén helyezkednek el. A 2.29. táblázat a Magyarországra érkező külföldi turisták számának alakulását mutató tartamidősor. Ábrázolásakor (2.14. ábra) az időintervallumok (évek) közepén felmért pontokat kötjük össze egyenes szakaszokkal. Az idősorban előforduló legkisebb érték 9724 ezer fő (a legnagyobb 22 804 ezer fő), ezért a függőleges tengelyt megszakítva a beosztást 8000 ezer főnél kezdhetjük. (Ha a tengely beosztása ugyanis 0-tól folyamatos lenne, a vonaldiagram nagyon „magasra” kerülne.) 93
Egy ismérv szerinti elemzés
2.14. ábra - A Magyarországra érkező turisták számának alakulása
A grafikus ábrázolással az ábrázolt adatok közötti arányokat szemléltetjük. Mivel a bázisviszonyszámok között ugyanolyan arányok vannak, mint az idősor eredeti adatai között, ezért a bázisviszonyszámok alapján is készíthetünk vonaldiagramot. Különösen indokolt a bázisviszonyszámok ábrázolása akkor, ha több, egymással összefüggő jelenség időbeli alakulását egy koordináta-rendszerben akarjuk szemléltetni.
2.2.4. Az idősorok elemzése átlagokkal A középérték az azonos fajta adatok halmazának számszerű jellemzője. Az idősorok adatait úgy tekintjük mint ugyanazon jelenség különböző időszakokban (időpontokban) felvett értékeinek összességét, tehát azonos fajta adatok halmazát. Az átlagolás ezért idősorok esetén is indokolt lehet. Az átlagolás célja egyrészt az idősor átlagos értékének meghatározása, másrészt az idősorban végbemenő átlagos változások kimutatása lehet. Az idősorok átlagos értékének meghatározása Az állapot- és tartamidősor adatait eltérő módon átlagoljuk. 94
Egy ismérv szerinti elemzés A tartamidősorok adatai összegezhetők, ezért átlagolásukra a számtani átlagot használjuk.
Az így kiszámított átlag a megfigyelt jelenség egy időszakrajutóátlagos értékét mutatja. Az állapotidősorok adatai egy-egy időpontra vonatkoznak, összegüknek nincs tárgyi értelme. Ebben az esetben az idősor átlaga az átlagos állomány- (készlet-) nagyságot mutatja. Két időpont esetén ez a nyitó- és záróállomány számtani átlaga két időpont közötti időszakokra számított átlagos állományok számtani átlaga.
,több időpont esetén pedig a két-
Ezt az átlagot kronologikus átlagnak nevezzük (jele: ), és kizárólag állapotidősorok adatainak átlagolására használjuk. A megfigyelt időpontok adataiból (
) közvetlenül az alábbi egyszerűbb alakra hozott formában számítjuk:
A kronologikus átlag tehát olyan súlyozott számtani átlag, melynél az első összege (a nevezőben szereplő szám) így:
és utolsó
adat súlya
a közbeeső adatok súlya pedig 1. A súlyok
Tekintsük a következő példát (2.32. táblázat).
2.32. táblázat - Valamely utazási iroda valutakészletének és valutaértékesítésének adatai Valutakészlet Hónap
(a hónap utolsó napján) (E USD)
Valutaértékesítés (E USD)
95
Egy ismérv szerinti elemzés június
18,8
....
július
19,6
35,8
augusztus
20,2
35,2
szeptember
19,8
34,3
október
21,1
33,5
november
20,3
32,4
december
19,2
35,8
A második félévben a havi átlagos valutaértékesítés (6 hónap átlaga):
Az adatok összegének van értelme (a II. félévben összesen 207 ezer USD valutát adott el az utazási iroda), ezért átlagolásukra a számtani átlagot használtuk. A második félévben az átlagos valutakészlet (július 1-je és december 31-e között):
( a július 1-jei készlet a június 30-ival – 18,8 E USD – azonos). A valutakészlet csak időpontokban értelmezhető (példánkban a hónap utolsó napján záráskor), ezért átlagolásukra a kronologikus átlagot használtuk. Az idősor átlagos változásának vizsgálata Az idősor lényeges tulajdonságát kifejező tendenciát az időszakról időszakra (időpontról időpontra) bekövetkező változások átlagolásával ragadhatjuk meg. A változást kétféleképpen mérhetjük: abszolút és relatív módon. Az abszolútváltozás két egymást követő időszak (időpont) adatának különbsége a relatív változás pedig valamely időszak (időpont) adatának a megelőző időszak (időpont) adatához viszonyított aránya átlagos változást (növekedést vagy csökkenést) két mutatóval mérhetjük: a fejlődés átlagos mértéke és a fejlődés átlagos ütememutatókkal. 96
Az
Egy ismérv szerinti elemzés
A fejlődés átlagos mértéke (jele: jelenség mértékegységében.
) az időszakról időszakra (időpontról időpontra) bekövetkező átlagos abszolút változást mutatja a vizsgált
Számítása úgy történik, hogy az egymást követő időszakokra (időpontokra) kiszámítjuk a növekedés (csökkenés) mértékét átlaggal átlagoljuk.
, majd azokat számtani
Ebből azonnal adódik:
A mutató elsősorban az időszakról időszakra (időpontról időpontra) közel azonos mértékben növekvő (csökkenő), azaz megközelítőleg lineáris fejlődést leíró idősorok fejlődési tendenciájának jellemzésére használható. Mivel értéke csak az idősor első és utolsó adatától függ, ezért csak akkor jellemzi jól a változás átlagos mértékét, ha ezek nem kiugróan magas vagy alacsony (esetleg változó előjelű) értékek.
2.33. táblázat - Az épített lakások számának alakulása Magyarországon Év
Épített lakások száma (db)
1985
72 507
–
1986
69 428
–3 079
1987
57 200
–12 228
1988
50 566
–6 634
1989
51 487
921
1990
43 771
–7 716
1991
33 164
–10 607
1992
25 807
–7 357 97
Egy ismérv szerinti elemzés 1993
20 925
–4 882
2.15. ábra - Az épített lakások számának alakulása
Az épített lakások számának alakulását mutató vonaldiagram (2.15. ábra) alapján látható, hogy a 2.33. táblázatban egy lineárisnak tekinthető változást leíró idősor szerepel, ezért a
mutató alkalmazása célszerű.
– Az évenkénti változások (növekedések, csökkenések) átlagaként:
– Az 1993-as és az 1985-ös év megfigyelt adata alapján:
98
Egy ismérv szerinti elemzés Az épített lakások száma 1985 és 1993 között évente átlagosan 6448 db-bal csökkent. A fejlődés átlagos üteme (jele: ) az időszakról időszakra (időpontról időpontra) bekövetkező átlagos relatív változást mutatja. A mutató a láncviszonyszámok mértani átlaga. A mértani átlag alkalmazását az indokolja, hogy a láncviszonyszámok szorzatának van tárgyi értelme. Valamennyi láncviszonyszám szorzata ugyanis a megfigyelt utolsó időszak (időpont) bázisviszonyszámával azonos.
Mivel
ezért a fejlődés átlagos üteme az n-edik bázisviszonyszámból is kiszámítható.
Mivel
ezért a fejlődés átlagos üteme az idősor első és utolsó adatából az
alakban is számítható. A mutató számítása olyan idősorok esetén célszerű, melyeknél az idősor adata időszakról időszakra (időpontról időpontra) közel azonos ütemben nő (csökken), azaz közelítőleg exponenciális fejlődést mutat. Ilyen idősor a takarékbetét-állomány alakulása (2.31. táblázat), jól szemlélteti az exponenciális növekedésnek tekinthető fejlődést a grafikus ábra is (2.13. ábra). A fejlődés átlagos üteme: 99
Egy ismérv szerinti elemzés – a láncviszonyszámok alapján:
– az utolsó bázisviszonyszámból:
– a megfigyelt adatokból:
A lakosság takarékbetét-állománya 1980 és 1993 között évenként átlagosan 1,133-szeresére, azaz 13,3%-kal nőtt. Az idősorok fejlődési tendenciáit kifejező, itt ismertetett mutatószámok végeredményben csak az első ( ) és az utolsó ( ) adatra támaszkodnak. Ezért az ilyen számítások csak akkor adnak jellemző értékeket, ha az idősor alapvető tendenciája az egyenletes fejlődés (növekedés vagy csökkenés; lineáris vagy exponenciális értelemben). Tankönyvünk II. kötetében megismerkedünk majd az idősorok fejlődési törvényszerűségeinek függvényekkel történő leírásával, elemzésével. Az ott megismert eljárások pontosabb képet adnak a jelenségek, folyamatok alakulásáról.
2.3. Gyakorlófeladatok 1. Háztartások élelmiszerre fordított egynapi kiadásai (Ft-ban) az alábbiak: 820,
920,
760,
600,
650,
720,
680,
880,
1020,
730,
520,
620,
780,
480,
490,
520,
1010,
1200,
750,
630,
700,
830,
900,
600,
700,
760,
900,
1200.
Feladat: a) Készítsünk rangsort! b) A rangsor alapján készítsünk gyakorisági sorokat különböző osztályközökkel! 100
Egy ismérv szerinti elemzés c) A legjobbnak ítélt gyakorisági sor alapján készítsünk értékösszegsort és kumulált sorokat! d) Számítsuk ki a napi élelmiszer-kiadás átlagát, móduszát, mediánját és kvartiliseit! Vizsgáljuk az aszimmetriát! e) Készítsünk hisztogramábrát! 2. Egy budapesti pénzváltó helyen valamely napon 107-en váltottak valutát forintra. Az ügyfelek megoszlása a váltott összeg nagysága szerint az alábbi: Összeg (1000 Ft)
Fő
– 10
12
10 – 20
20
20 – 30
33
30 – 40
23
40 – 50
12
50 – 60
3
60 felett
4
Összesen
107
Feladat: a) Ábrázoljuk a váltott összeg nagysága szerinti megoszlást! b) Készítsük el a mennyiségi sor lehetséges típusait! Értelmezzük egy-egy adatát! c) Számítsuk ki és értelmezzük az átlagot, móduszt, mediánt és a kvartiliseket! Jelöljük az a) pontbeli ábrán ezeket az értékeket! d) Vizsgáljuk a szóródást! e) Számítsuk ki az aszimmetria A és F mérőszámát! 3. A személyi jövedelemadó-bevallások alapján az adóalanyokat az alábbi kategóriákba sorolták: 101
Egy ismérv szerinti elemzés Az adót fizetők %os megoszlása
Adóköteles jövedelem (ezer Ft)
1991
1992
0 –90
20,3
15,2
90 – 150
26,9
22,5
150 – 240
27,9
27,8
240 – 360
14,7
18,7
360 – 600
7,5
11,2
600 – 1500
2,7
4,6
100,0
100,0
Összesen Feladat:
a) Ábrázoljuk a jövedelem szerinti megoszlást az egyes években hisztogrammal külön-külön! b) Készítsünk gyakorisági poligont egy koordináta-rendszerben! c) Mennyi az adóalanyok átlagos jövedelme az egyes években? d) Melyik évben volt nagyobb a jövedelmek szóródása? e) Jellemezzük a jövedelemeloszlás aszimmetriáját F mutatóval! 4. A saját jogú nyugdíjasok adatai 1993 márciusában: Nyugdíj összege
Férfiak
(1000 Ft)
Nők
Összes nyugdíjas
%-os megoszlása
–6
0,4
0,3
0,3
6–8
6,2
16,2
11,7
8 – 10
21,3
31,3
26,8 102
Egy ismérv szerinti elemzés 10 – 12
26,2
39,7
33,6
12 – 15
24,8
8,9
16,1
15 – 20
14,7
2,9
8,3
20 – 25
5,1
0,6
2,6
25 –
1,3
0,1
0,6
Összesen
100,0
100,0
100,0
Kiszámított adatok: Az 1015,2 ezer férfi átlagos nyugdíja 12 679 Ft, a 1218,4 ezer nő átlagos nyugdíja pedig 10 205 Ft volt. A férfiaknál 4149 Ft az átlagtól való átlagos eltérés, a nőknél pedig 2483 Ft. (Az eltérések négyzetei alapján.) Feladat: a) Hasonlítsuk össze a nyugdíjak nagyságát a tanult helyzetmutatókkal! b) Ábrázoljuk a nyugdíj összege szerinti megoszlást poligonnal, egy grafikonon! c) Számítsuk ki az aszimmetria A mutatóját a férfiak és a nők csoportjára! Hasonlítsuk össze a kapott eredményeket! 5. Az ipari ágazatban tevékenykedő vállalkozások fontosabb adatai 1992-ben: Foglalkoztatottak száma
A foglalkoztatottak
Vállalatok
Árbevétel
nagyságcsoportjai (fő)
száma
(milliárd Ft)
21 –50
1361
60
57
51 –100
782
73
62
101 –300
850
183
162
301 –500
264
130
102
501 –1000
259
310
185
1001 –2000
124
293
169
(1000 fő)
103
Egy ismérv szerinti elemzés 2001 –5000
57
413
169
5001 – 10 000
9
106
57
10 000-nél több
2
167
34
Összesen
3708
1735
997
Feladat: a) Hány főt foglalkoztat átlagosan egy vállalat? b) A vállalatok hány %-a foglalkoztat maximum 500 főt? Mennyi ezen vállalatok összes foglalkoztatottjainak létszáma ténylegesen, illetve a nagyságcsoportok alapján becsülve? c) Számítsuk ki a vállalatok és az összes foglalkoztatottak %-os megoszlását! Hasonlítsuk össze az egyes létszámkategóriákhoz tartozó arányokat! Nevezzük meg a kiszámított viszonyszámokat! d) Készítsünk Lorenz-görbét a vállalatok létszám szerinti koncentrációjának bemutatására! e) Vizsgáljuk meg a létszámnagyság szerinti szóródást! f) Becsüljük meg a mediánt és a kvartiliseket! Vizsgáljuk a létszám szerinti megoszlás aszimmetriáját! 6. Öt hallgató elért pontszáma egy 50 pontos zárthelyin a következő volt: 36; 40; 28; 48; 16. Feladat: a) Számítsuk ki, hogy: 1. egy-egy hallgató pontszáma mennyivel tér el az átlagos pontszámtól! 2. mennyivel térnek el az eredmények egymástól átlagosan! b) A korábban írt 30 pontos zárthelyit a hallgatók átlagosan 20 pontra írták meg, 9 pontos szórással. Melyik zárthelyin volt nagyobb a pontszámok ingadozása, szóródása? 7. Használjuk fel az 1.7. Gyakorlófeladatok 4. példájának adatait! 104
Egy ismérv szerinti elemzés Feladat: a) Vizsgáljuk meg az aktív népesség számának alakulását bázis- és láncviszonyszámokkal! b) Értelmezzük a kiszámított viszonyszámokat! c) Számítsuk ki a csökkenés átlagos mértékét és átlagos ütemét! 8. Nemzetközi idegenforgalmi bevételek és kiadások alakulása Magyarországon: Milliárd Ft Év
Bevételek
Kiadások
1985
25
10
1986
27
10
1987
37
12
1988
39
33
1989
48
59
1990
63
38
1991
78
38
1992
98
53
Feladat: a) Vizsgáljuk meg a bevételek és a kiadások alakulását 1985-höz képest, valamint évről évre! b) Ábrázoljuk a két jelenség adatait egy grafikonon! c) Hány Mrd Ft-tal nőttek évente átlagosan az idegenforgalmi bevételek? d) Mennyi volt a bevételek, kiadások, illetve az egyenleg növekedési üteme a vizsgált időszakban átlagosan? 9. A takarékbetét-állomány alakulása Magyarországon: 105
Egy ismérv szerinti elemzés
Év
Betétállomány 1980 = 100% (milliárd Ft)
1985 = 100%
Előző év = 100%
1985
244,1
168,0
100,0
–
1986
274,9
189,2
112,6
...
1987
287,5
...
...
...
1988
...
...
...
108,8
1989
...
...
126,8
...
1990
...
...
...
119,1
1991
466,0
...
...
...
1992
...
436,8
260,0
...
Feladat: a) Számítsuk ki a tábla hiányzó adatait! b) Ábrázoljuk a betétállomány alakulását! c) Évente átlagosan hány %-kal nőtt a betétállomány: – 1985 és 1990 között? – 1985 és 1992 között? – 1980 és 1992 között? d) Hány Mrd Ft volt a betétállomány 1980-ban? Mennyi volt a növekedés évi átlagos mértéke 1980 és 1992 között?
106
3. fejezet - A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése 3.1. A statisztikai táblákról általában A sokaságok több szempont szerinti megfigyelésének eredménye statisztikai táblák formájában is megadható. Statisztikai táblának nevezzük a megfelelő külső formával ellátott statisztikai sorok összefüggő rendszerét. A tábla külső formáján rovatokból álló hálózatot értünk. A rovatok egy része statisztikai adatokat, számokat, más része megnevezéseket, magyarázó szövegeket tartalmaz. A megnevezéseket tartalmazó rovatok közül azokat, amelyek a tábla bal oldalán helyezkednek el, oldalrovatoknak nevezzük. Ezek a rovatok a vízszintesen elhelyezkedő sorok elnevezéseit tartalmazzák. A tábla felső részén elhelyezkedő feliratos, szöveges rovatokat fejrovatoknak nevezzük. A fejrovatokban található megnevezések a függőlegesen elhelyezkedő oszlopokra vonatkoznak. Az egyes sorok és oszlopok adatainak összegét, illetve a sokaság(ok) egészére jellemző adatokat tartalmazó rovatok az ún. összesen rovatok. A statisztikai tábla definíciójából – amely szerint: „statisztikai sorok összefüggő rendszere” – következik, hogy a tábla minden egyes adata egyidejűleg több, de legalább két (egy vízszintesen és egy függőlegesen elhelyezkedő) statisztikai sornak tagja. Azt a számot, amelyik azt jelzi, hogy a tábla egy-egy adata hány statisztikai sorhoz tartozik, a statisztikai tábla dimenziószámának nevezzük. Definiálhatnánk a statisztikai táblát oly módon is, hogy a statisztikai sort is táblának
Tehát az előbbi definíció szerint a statisztikai táblák legalább kétdimenziósak tekintenénk, mégpedig egydimenziós táblának. . A statisztikai táblákat – a dimenziószám mellett – leggyakrabban a csoportosításnak (az osztályozásnak) a tábla elkészítésében betöltött szerepe szerint különböztetjük meg. A csoportosítás szerepe szerint a statisztikai táblák lehetnek egyszerű, csoportosító és kombinációs táblák. Az egyszerű táblák A csoportosítást nem tartalmazó adatsorok összefüggő rendszere az egyszerű tábla. Az egyszerű táblákban általában leíró és összehasonlító sorok szerepelnek. Formai ismertetőjegyük, hogy nincsenek összesen rovataik. Példaként nézzük a budapesti székhelyű külföldi érdekeltségű vállalkozások néhány fontosabb adatának alakulását tartalmazó táblát (3.1. táblázat).
3.1. táblázat - A budapesti székhelyű külföldi érdekeltségű vállalkozások számának alakulása (december 31-i adatok) Megnevezés
1989
1991
1993 107
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Vállalkozások száma
886
5111
10 953,1
Összes jegyzett tőke (Mrd Ft)
64,3
270,3
725,1
Ebből külföldi részesedés
15,5
123,7
411,7
A tábla nem tartalmaz csoportosítást, ezért összesen rovatok sem szerepelnek benne. Három – vízszintesen elhelyezkedő – összehasonlító, állapotidősor és három – függőlegesen elhelyezkedő – leíró sor alkotja a táblát. A tábla minden adata egyidejűleg két statisztikai sornak tagja, tehát a 3.1. táblázat egy kétdimenziós egyszerű tábla. A csoportosító táblák Az egy ismérv szerinti csoportosítást tartalmazó statisztikai sorok összefüggő rendszere a csoportosító tábla. A csoportosító táblában egy ismérv szerinti csoportosítás eredményeként keletkezett csoportosító sorok összehasonlítással vagy (és) leíró sorokkal szerepelnek együtt. A csoportosító tábla egy irányban összesen rovatokat is tartalmaz. A következő táblában az egy ismérv szerinti csoportosítás összehasonlítással társul (3.2. táblázat). A tábla függőleges irányban tartalmazza a csoportosítást. A csoportosítás alapja – az életkor – mennyiségi ismérv, ezért a táblában függőlegesen három mennyiségi sor helyezkedik el. Vízszintesen kilenc összehasonlító, állapotidősor található. Ebben a táblában vízszintes irányban helyezkednek el az összesen rovatok. Az összesen rovatban lévő adatok alkotják azt az idősort, amely az egész népesség számának alakulását mutatja.
3.2. táblázat - A magyarországi népesség életkor szerinti megoszlásának alakulása Népességszám (E fő)
Korcsoport (év)
1980
1990
1995
(január 1.) 0–5
1 045
738
720
6 – 14
1 296
1 392
1 151
15 – 24
1 465
1 445
1 619
25 – 29
892
620
675
30 – 49
2 814
3 014
2 897 108
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése 50 – 59
1 368
1 206
1 198
60 – 69
928
1 116
1 058
70 –
902
844
927
10 710
10 375
10 245
Összesen
A kombinációs táblák A sokaság több ismérv szerinti kombinatív osztályozásának eredményeként kapott adatokat kombinációs vagy kontingenciatáblába foglalhatjuk. A kombinációs tábla legalább két ismérv szerinti kombinatív csoportosítást tartalmaz. Az 1.4. pontban a magyarországi lakott lakások két ismérv szerinti kombinatív csoportosítása eredményeként adódó sémát közöltünk. A kétszeresen csoportosított adatokból kiindulva és az adatokat függőleges és vízszintes irányban elrendezve, felírhatjuk a statisztikai sorok olyan összefüggő rendszerét, amely kombinációs táblát alkot (3.3. táblázat).
3.3. táblázat - A magyarországi lakott lakások számának megoszlása komfortosság és településtípusok szerint (1990. január 1.) Komfortosság
Budapest
A többi város
Községek
Összesen
Komfortos
673
1259
780
2712
Félkomfortos
40
88
159
287
Komfort nélküli
63
193
433
689
Összesen
776
1540
1372
3688
A tábla kétféle minőségi ismérv – a komfortosság és a településtípus – szerinti kombinatív csoportosítást tartalmaz. Függőlegesen a komfortosság szerinti csoportosításból keletkezett négy minőségi sor helyezkedik el. Ezek a lakások számának komfortosság szerinti megoszlását mutatják településtípusonkénti bontásban, valamint az összes lakásra vonatkozóan. A vízszintes irányban elhelyezkedő négy – ugyancsak – minőségi sor a különböző komfortfokozatú lakások és az összes lakás településtípusonkénti megoszlását jellemzi. A kétféle csoportosításnak megfelelően két irányban találhatók összesen adatok. A statisztikai táblák három típusát szemlélteti a 3.1. ábra.
109
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
3.1. ábra - A statisztikai táblák típusai
A különböző típusú statisztikai táblák formájában rendelkezésre álló adatok elemzésénél különböző jellegzetes elemzési esetek adódnak, a vizsgálathoz különböző elemzési eszközöket, módszereket használunk. A 3. fejezet további részében kétdimenziós statisztikai táblákhoz kapcsolódóan tekintünk át jellegzetes elemzési eseteket, és bemutatjuk, hogy az egyes esetekben milyen statisztikai elemzési eszközök, módszerek, mutatószámok alkalmazhatók.
3.2. Az egyszerű táblák elemzése Az egyszerű táblák nem tartalmaznak csoportosítást, az ilyen táblákban általában leíró sorok és összehasonlító sorok – leggyakrabban idősorok – találhatók. Az elemzés során intenzitási viszonyszámokat és összehasonlító viszonyszámokat számíthatunk, bizonyos esetekben a tábla információtartalmát megfelelő grafikus ábrák segítségével is megjeleníthetjük. 110
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
3.2.1. Intenzitási viszonyszámok és dinamikus viszonyszámok együttes alkalmazása Az eddigiekben már megismert (például dinamikus vagy megoszlási) viszonyszámok azonos fajta, azonos mértékegységű adatok hányadosai voltak. Ezzel szemben az intenzitási viszonyszám két különböző fajta és általában különböző mértékegységű statisztikai adat hányadosa. Az intenzitási viszonyszám azt mutatja meg, hogy az egyik sokaság milyen intenzitással fordul elő a másik sokaság környezetében. Általában mértékegysége van, amely a viszonyszám számlálójában és nevezőjében szereplő adat – nem feltétlenül azonos – mértékegységéből adódik. Mivel az egyszerű táblák általában leíró sorokat is tartalmaznak, elemzésük során az ilyen típusú viszonyszámok alkalmazására tág lehetőségek nyílnak. Az intenzitási viszonyszámok jellegzetes típusai – a viszonyszám tartalma szerint – a következők: – sűrűségmutatók, – ellátottságot kifejező mutatók, – arányszámok, – átlagjellegű mutatók. Sűrűségmutató például a népsűrűség mutatószáma, amely a népességnek a számára rendelkezésre álló területen való elhelyezkedésének sűrűségét, intenzitását mutatja. Az ellátottsági mutatók a szociális, a kulturális stb. ellátás színvonalának mérőszámai. (Például a 10 000 lakosra jutó kórházi ágyak száma, amely az egészségügyi ellátás egyik mutatószáma.) Az arányszám elnevezésű mutatószámokat főleg a népességstatisztikában használják, ilyenek a születési, halálozási stb. arányszámok. Átlagjellegű mutatók például az 1 főre jutó GDP nagysága, 1 termék előállításához szükséges munkaidő stb. Tekintsük át a 3.4. táblázat adatait.
3.4. táblázat - Az orvosi ellátás néhány adata (december 31-i adatok) Megnevezés
1980
1993
Népesség száma (E fő)
10 705
10 278
Orvosok száma (fő)
30 842
41 397
Háziorvosok száma (fő)
5 092
6 381
Az egészségügyi ellátás színvonalát jellemezni lehet például a 111
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
mutatóval, vagy az
mutatóval. 1980-ban: a 10 000 lakosra jutó orvosok száma: az 1 orvosra jutó lakosok száma:
orvos/10 000 lakos, lakos/orvos.
1993-ban: a 10 000 lakosra jutó orvosok száma: az 1 orvosra jutó lakosok száma:
orvos/10 000 lakos, lakos/orvos.
Példánk alapján látható, hogy az intenzitási viszonyszámok bizonyos körénél a viszonyítás tárgyát képező adat és a viszonyítás alapját képező adat felcserélhető, vagyis az intenzitási viszonyszám számítása céljából kijelölhető tört számlálójában és nevezőjében szereplő adatok felcserélhetők. Ha ugyanazon két sokaság adata alapján ilyen módon kétféle intenzitási viszonyszám képezhető, az egyiket egyenes, a másikat fordított intenzitási viszonyszámnak szokás nevezni. A két intenzitási viszonyszám közül azt célszerű egyenesnek nevezni, amely értékének növekedése kedvező irányú változást jelez. A 10 000 lakosra jutó orvosok számának növekedése az orvosellátottság javulását jelzi, ezért ezt tekintjük egyenes intenzitási viszonyszámnak; az 1 orvosra jutó lakosok számát pedig fordított intenzitási viszonyszámnak, ugyanis ennek nagysága fordított arányban áll a vizsgált jelenség színvonalával. 1
Az ugyanazon két adat alapján számított, egymásnak megfelelő egyenes és fordított intenzitási viszonyszámok fordított arányban állnak egymással . 12
Az orvosellátottság két említett mutatószámánál ügyeljünk arra, hogy az egyenes intenzitási viszonyszám 10 000 lakosra vetítve mutatja az orvosok számát.
112
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Ha abból a sokaságból – amelynek a nagyságát jellemző adat (B) az elemzés céljából kiszámítandó intenzitási viszonyszám nevezőjében szerepel – kiválasztható egy olyan részsokaság (a nagyságát b jellemzi), amely – az egész sokaságnál – közvetlenebb kapcsolatban áll a számlálóban levő adattal (A-val), akkor kétféle intenzitási viszonyszám számítható. A viszonyítandó adatot a teljes viszonyítási alappal elosztva nyers intenzitási viszonyszámot adatával osztva tisztított intenzitási viszonyszámot
a vele szorosabb kapcsolatban álló részsokaság
kapunk.
A kétféle viszonyszám kiszámításához felhasznált adatok lehetővé teszik még egy megoszlási viszonyszám kiszámítását is, amely a tisztított intenzitási viszonyszám nevezőjében szereplő részsokaság adatának arányát mutatja a nyers intenzitási viszonyszám nevezőjében szereplő teljes sokaság adatához viszonyítva
Ezt az arányt a „tiszta” rész arányának szokás nevezni.
A két intenzitási viszonyszám és a megoszlási viszonyszám között fennáll a következő összefüggés:
a nyers intenzitási viszonyszám egyenlő a tisztított intenzitási viszonyszám és a tiszta rész arányának szorzatával. Az összefüggés alapján bármelyik viszonyszám kiszámítható a másik kettő ismeretében. Az összefüggés arra is rámutat, hogy a nyers intenzitási viszonyszám két tényező hatásának eredménye. A nyers és tisztított intenzitási viszonyszámok alkalmazásának számos területe van, legjellemzőbb a használatuk a népességstatisztikában alkalmazott arányszámok esetében. Például a születési arányszám számításánál a születések számát viszonyíthatjuk az egész népesség számához, illetve viszonyítási alap lehet a szülőképeskorú (15–49 éves) női népesség száma. A korábbi példánkban az 1 orvosra jutó lakosok száma nyers intenzitási viszonyszámnak tekinthető. Az orvosok sokaságán belül ugyanis van egy olyan rész – a háziorvosok sokasága –, amely közelebbi kapcsolatban van az ellátandó népességgel. Ezért kiszámítható az 1 háziorvosra jutó lakosok száma is, amely tisztított intenzitási viszonyszámnak minősül. Az orvosellátottság nyers és tisztított viszonyszámai 1980-ban: a 1 orvosra jutó lakosok száma: az 1 háziorvosra jutó lakosok száma:
lakos/orvos, lakos/orvos. 113
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
A háziorvosok aránya: Összefüggésük: 1993-ban:
a 1 orvosra jutó lakosok száma: :
lakos/orvos,
az 1 háziorvosra jutó lakosok száma:
lakos/orvos.
A háziorvosok aránya: Összefüggésük: A 3.4. táblázatban megadott adatok nemcsak intenzitási, hanem dinamikus viszonyszámokkal is elemezhetők.
A 3.5. táblázatban megadjuk a kiszámított viszonyszámokat is és az összefüggések általánosításához szükséges jelöléseket. 3.5. táblázat
2
3.5. táblázat - Orvosi ellátásra vonatkozó adatok Megnevezés
1980
1993
(0)
(1)
1980=100,0%
2
Annak érdekében, hogy az eredmények közötti pontos, számszerű összefüggéseket bemutathassuk, a viszonyszámok számításánál 2 tizedes pontossággal számoltunk.
A táblázatban található megoszlási viszonyszámok és dinamikus viszonyszámok százalékos formában kifejezett viszonyszámok. A viszonyszámok számításának képletszerű felírásakor a 100-zal való szorzás kijelölésétől eltekintettünk.
114
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Népesség száma (E fő)
A
10 705,11
10 278,11
96,01
Orvosok száma (fő)
B
30 842,11
41 397,11
134,22
Háziorvosok száma (fő)
b
5092,11
6381,11
125,31
10 000 lakosra jutó orvosok száma
28,81
40,28
139,81
1 orvosra jutó lakosok
347,09
248,28
71,53
1 háziorvosra jutó lakosok száma
2102,31
1610,72
76,62
Háziorvosok aránya (%)
16,51
15,41
93,33
száma
A táblázatban, amely ugyancsak egyszerű statisztikai tábla, az abszolút adatok mellett különféle típusú intenzitási viszonyszámok, megoszlási viszonyszámok, az utolsó oszlopban pedig dinamikus viszonyszámok foglalnak helyet. Mint látható, nemcsak az abszolút adatok összehasonlításából számíthatunk összehasonlító – jelen esetben dinamikus – viszonyszámokat, hanem az intenzitási viszonyszámokból is. Fontos megjegyezni, hogy a különféle típusú intenzitási viszonyszámok közötti összefüggések az azokból számított dinamikus (és egyéb összehasonlító) viszonyszámok között is fennállnak. Intenzitási viszonyszámok dinamikus viszonyszámának számítása Az intenzitási viszonyszámok összehasonlítása esetén a dinamikus viszonyszámot kétféleképpen is kiszámíthatjuk. Például az 1 orvosra jutó lakosok számának változását jelző dinamikus viszonyszám kiszámítható: 115
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése a) Az 1993-as és az 1980-as év intenzitási viszonyszámainak hányadosaként:
b) A népesség és az orvosok számának változását jelző dinamikus viszonyszámok hányadosaként:
Az 1 orvosra jutó lakosok száma tehát 28,47% -kal csökkent 1980-ról 1993-ra.
Általánosságban is igaz, hogy az intenzitási viszonyszám dinamikus viszonyszáma
kétféleképpen számítható:
a) A tárgyidőszaki és a bázisidőszaki intenzitási viszonyszámok hányadosaként:
b) Az intenzitási viszonyszám számlálójában és nevezőjében szereplő adatok dinamikus viszonyszámának hányadosaként:
A kétféle számítás azonos eredményre vezet, mert megfelelő átrendezéssel:
Az ugyanazon két adat alapján számított egymásnak megfelelő egyenes és fordított intenzitási viszonyszámok egymás reciprokai. Egyenes intenzitási viszonyszám fordított intenzitási viszonyszám 116
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
Összefüggésük:
Példánkban:
orvos jutott 10 000 lakosra 1980-ban.
(A 10 000-rel való szorzást az indokolja, hogy az egyik viszonyszámnál a nevező 1 egységéről, a másik viszonyszámnál a nevező 10 000 egységéről van szó.) A reciprok viszony fennáll az egyenes és fordított intenzitási viszonyszámok dinamikus viszonyszámai között is:
Például: a 10 000 lakosra jutó orvosok számának 1980-ról 1993-ra bekövetkezett változását jelző dinamikus viszonyszám kiszámítható a következőképpen is:
3.2.2. A fejlődési tendenciák kimutatása, összehasonlítása Ha az egyszerű táblában kettőnél több időpontra (időszakra) vonatkozó adatok vannak, akkor lehetőségünk van a vizsgált jelenség változási, fejlődési tendenciáinak kimutatására is. Egy sokaság változásának tendenciája kirajzolódik a sokaság nagyságadatait tartalmazó – viszonylag hosszabb – idősorból, illetve szemléletesen tükrözi ezt az idősor adatai alapján készített vonaldiagram. Ha két vagy több – egymással valamilyen kapcsolatban lévő – sokaság változásának tendenciáját kívánjuk összehasonlítani, akkor az adatok eltérő nagyságrendje, eltérő mértékegysége miatt csak a dinamikus viszonyszámok alapján vonhatunk le következtetéseket. Követelmény továbbá, hogy mindegyik adatsor összehasonlítási bázisa azonos legyen. Ha pedig grafikusan akarjuk szemléltetni a különböző jelenségek fejlődési tendenciáit, akkor célszerű közös (egyetlen) koordináta-rendszerben ábrázolni azokat. Bemutató példánkat ismét az egészségügy területéről vesszük. A 3.6. táblázat az 1985 és 1993 közötti időszakra (kettőnél több időbeli adat alapján) mutatja be az ellátottságot jellemző néhány adatot.
117
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
3.6. táblázat - Az egészségügyi ellátásra vonatkozó adatok (december 31-i adatok) Év
Kórházi ágyak száma
Népesség száma
Orvosok száma
(ezer fő)
előző év = 100,00%
1985
10 560
–
107,13
1986
10 509
101,17
108,62
1987
10 464
101,40
109,46
1988
10 421
102,10
109,73
1989
10 375
101,72
109,85
1990
10 355
103,70
110,00
1991
10 337
103,50
108,93
1992
10 310
103,44
106,56
1993
10 278
101,29
105,12
1980 = 100,00%
Figyeljük meg, hogy a népességszám ezer főben adott, az orvosok számának a láncviszonyszámai, a kórházi ágyak számának pedig a bázisviszonyszámai (1980-as bázison) ismertek. A bekövetkezett változások jellemzése és reális összehasonlítása a három jelenség bázis- vagy láncviszonyszámai alapján lehetséges. Ezek ismeretében történhet ezután a megfelelő intenzitási viszonyszámok dinamikus viszonyszámainak kiszámítása. A 3.7. táblázat első három oszlopa az alapadatok bázisviszonyszámait, további oszlopai pedig a kiszámítható intenzitási viszonyszámok (1985-ös bázison számított) bázisviszonyszámait tartalmazzák.
3.7. táblázat - Az egészségügyi ellátásra vonatkozó adatok Népesség Év száma 1985=100%
Orvosok
Kórházi ágyak száma száma 1985=100% 1985=100%
10 000 lakosra jutó orvosok
1 orvosra jutó lakosok
118
10 000 lakosra jutó kórházi
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése száma száma 1985=100% 1985=100%
ágyak száma 1985=100%
1.
2.
3.
4.
5.
6.
1985
100,00
100,00
100,00
100,00
100,00
100,00
1986
99,52
101,17
101,39
101,66
98,37
101,87
1987
99,09
102,59
102,18
103,53
96,59
103,12
1988
98,68
104,74
102,43
106,14
94,21
103,80
1989
98,25
106,54
102,54
108,44
92,22
104,37
1990
98,06
110,48
102,68
112,67
88,75
104,71
1991
97,89
114,36
101,68
116,83
85,59
103,87
1992
97,63
118,30
99,47
121,18
82,53
101,88
1993
97,33
119,81
98,12
123,10
81,24
100,81
A 3.7. táblázatban található viszonyszámok számításával kapcsolatban a következőket említjük meg. Mielőtt a táblázat adatait tanulmányoznánk, gondoljuk végig az alábbiakat. – A Dinamikus viszonyszámok című 2.2.2. alpontban megismerkedtünk a bázis- és a láncviszonyszámok közötti összefüggésekkel. Láncviszonyszámokból bázisviszonyszámok közvetlenül számíthatók, a megfelelő láncviszonyszámok szorzataként. Például az 1990. évi viszonyszám számítása (a táblázat 2. oszlopában):
– A kórházi ágyak számának alakulását jellemző viszonyszámok a 3.6. táblázatban 1980-as bázishoz viszonyítva mérik a változást. E bázisviszonyszámokat az összehasonlíthatóság érdekében átszámítottuk 1985-ös bázisra. Az átszámítás úgy történt, hogy az 1980. évi bázison számított bázisviszonyszámokat rendre elosztottuk az „új” bázisul választott 1985. év 1980as bázison számított viszonyszámával, az 1,0713-del. Például a kórházi ágyak számának 1990. évi bázisviszonyszáma, 1985-ös bázishoz viszonyítva 119
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
A két bázisviszonyszám hányadosa ugyanarra az eredményre vezet, mintha a két alapadatot osztottuk volna el egymással. Általánosságban is megállapíthatjuk, hogy új bázisra úgy térünk át, hogy a viszonyszámsor minden elemét elosztjuk az új bázisnak választott időszak (időpont) eredeti bázisviszonyszámával. – A táblázat 4., 5. és 6. oszlopában szereplő intenzitási viszonyszámok bázisviszonyszámait az ebben a fejezetben megismert összefüggések alapján számítottuk ki. Például – a 10 000 lakosra jutó kórházi ágyak számának bázisviszonyszáma 1990-ben:
(Az eredeti viszonyszámtört számlálójának – a kórházi ágyak számának – bázisviszonyszámát osztottuk az eredeti tört nevezőjének – a népesség számának – a viszonyszámával.) – az 1 orvosra jutó lakosok számának bázisviszonyszáma 1993-ban:
(Az eredeti viszonyszámtört számlálójának – a népesség számának – bázisviszonyszámát osztottuk az eredeti tört nevezőjének – az orvosok számának – a viszonyszámával.) A 3.7. táblázat alapján látható, hogy a népesség számának csökkenő tendenciája mellett az orvosok száma növekedést mutat. A népességszám és az orvosok számának bázisviszonyszámait összehasonlítva egyértelműen következtethetünk az orvosellátottság javulására, amelyet közvetlenül jeleznek a 10 000 lakosra jutó orvosok számának, illetve az 1 orvosra jutó lakosok számának bázisviszonyszámai. A kórházi ágyak számának alakulását 1985 és 1991 között viszonylag egyenletes, de kismértékű növekedés jellemezte. A csökkenő népességszám mellett ez a 10 000 lakosra jutó kórházi ágyak számának növekedését eredményezte. 1991-től kezdődően azonban a kórházi ágyak száma évről évre csökkent, nagyobb arányban, mint a népességszám. Ezért 1991-től kezdődően a 10 000 lakosra jutó kórházi ágyak száma is – viszonylagosan – csökkent. A változások alapvető tendenciáját – az előzőekben említett módon – vonaldiagramokkal szemléltethetjük. 120
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
3.2. ábra - Az egészségügyi ellátás alakulása az 1985-ös bázisévhez viszonyítva
A 3.2. ábra alapján is következtethetünk az egészségügyi ellátás – különböző intenzitási viszonyszámokkal jellemzett – színvonalának alakulására. Az egészségügyi ellátottság változásának tendenciáját – egyértelműbben – a 3.3. ábra szemlélteti.
3.3. ábra - Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva
121
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése A változás tendenciájának tömör jellemzésére alkalmazhatjuk az átlagos változás mérőszámait, nevezetesen a fejlődés átlagos mértéke fejlődés átlagos üteme
és a
mutatószámokat.
Az ismert adatok alapján a fejlődés átlagos mértékének mutatószámával csak a népesség számának alakulását vizsgálhatjuk. (Az orvosokra és a kórházi ágyakra ugyanis nem ismertek az abszolút számok.) A népesség változásának átlagos mértékét a legegyszerűbben a következőképpen számíthatjuk:
Ezt úgy értelmezhetjük, hogy Magyarországon a népesség száma 1985 és 1993 között évenként átlagosan 35 250 fővel csökkent. A népességszám változásának átlagos üteme pedig:
amely alapján megfogalmazható, hogy a népesség száma 1985 és 1993 között évenként átlagosan 0,34%-kal csökkent. Nézzük meg, hány %-kal változott a kórházi ágyak száma 1985 és 1993 között:
tehát évenként átlagosan 0,24%-kal csökkent. A 10 000 lakosra jutó kórházi ágyak számának 1985 és 1993 közötti átlagos relatív változására vonatkozó mutatószám értékét kiszámíthatjuk a kórházi ágyak számának és a népesség számának mutatószámai alapján is a következőképpen:
Ez természetesen kiszámítható a 10 000 lakosra jutó kórházi ágyak számának adataiból közvetlenül is:
122
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Az orvosok számának, valamint az orvosellátottság 1985 és 1993 közötti alakulásának jellemzésére az előbbiekhez hasonló módon elvégezhetők a számítások.
3.3. A csoportosító táblák elemzése A csoportosító táblában a sokaság(ok)nak egy ismérv szerinti csoportosítása (osztályozása) található, amely általában valamilyen leíró sorral vagy összehasonlítással társul. Ha a sokaság(ok)nak a csoportosítással kialakított részeit külön-külön is fontosnak, vizsgálatra érdemesnek tartjuk, akkor a csoportokat, az osztályokat részsokaság(ok)nak tekintjük. Ebben az esetben az egész sokaságo(ka)t teljes sokaság(ok)nak vagy fősokaság(ok)nak nevezzük.
3.8. táblázat - A csoportosító tábla általános sémája Részsokaságok (csoportok)
Fősokaság ahol: valamely ismérv alapján képzett j-edik részsokaságok (csoportok) megnevezése,
a j-edik részsokaságokra vonatkozó adatok, 123
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése M: a képzett részsokaságok (csoportok) száma.
3.3.1. Rész- és összetett viszonyszámok Csoportosított sokaság esetén az egyes részsokaságokra számított azonos típusú viszonyszámokat részviszonyszámoknak (jele: fősokaságra vonatkozó viszonyszámot összetett viszonyszámnak (jele:
), a
) nevezzük.
A részviszonyszám képlete:
Az összetett viszonyszám képlete:
A részviszonyszám képletéből
-t
illetve
-t kifejezve
az összetett viszonyszám a következőképpen is felírható:
Ezek az összefüggések arra mutatnak rá, hogy az összetett viszonyszám egyúttal átlag is, a részviszonyszámok súlyozott számtani, illetve harmonikus átlaga. Ez indokolja a jelölését is. Ebből következően minden összetett viszonyszám a legkisebb
és legnagyobb részviszonyszám
között helyezkedik el, vagyis: Az összetett viszonyszámra vonatkozó képleteket szövegesen megfogalmazva a következők mondhatók el. Az összetett viszonyszám háromféleképpen számítható ki: 1. a fősokaság(ok)ra vonatkozó adatok hányadosaként; 124
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése 2. a
részviszonyszámok súlyozott számtani átlagaként, ahol a súlyok szerepét a részviszonyszámok számítása céljából kijelölhető törtek
nevezőiben szereplő 3. a
adatok töltik be;
részviszonyszámok súlyozott harmonikus átlagaként, ahol a súlyok a részviszonyszámok számítása céljából kijelölhető törtek számlálóiban
szereplő
adatok.
Az összetett viszonyszámok súlyozott átlagként történő számításánál a súlyként szereplő adatok helyettesíthetők az azokból számított megoszlási
viszonyszámokkal. A
adatok helyett a
az
adatok helyett az
megoszlási viszonyszámok használhatók fel.
A következőkben a rész- és összetett viszonyszámoknak különböző elemzési helyzetekben betöltött szerepére mutatunk be példákat. Az átlagos színvonal vizsgálata csoportosított sokaságok esetén
3.9. táblázat - Magyarország népességére és a magyarországi lakásokra vonatkozó adatok (1994. január 1.) Népességszám
Lakások száma
(ezer fő)
(ezer db)
Budapest
1 995,7
810
A többi város
4 561,9
1692
Községek
3 719,4
1453
Összesen
10 277,0
3955
Megnevezés
A 3.9. táblázatban szereplő adatok felhasználásával jellemezhető a magyarországi lakásellátottság színvonala. Kiszámítható a lakásellátottság egyik leggyakrabban használt mutatószáma, a 100 lakásra jutó lakosok száma .
A lakásellátottság színvonalát tehát intenzitási viszonyszámmal fejezzük ki. 125
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Ebben az elemzési helyzetben a településtípusokra vonatkozó intenzitási viszonyszámok részviszonyszámok intenzitási viszonyszám összetett viszonyszámnak
míg az egész országot jellemző
tekinthető.
A 3.9. táblázat adataiból – mivel azok részekre bontott sokaságok adatai – megoszlási viszonyszámok is számíthatók. Ezek a viszonyszámok a népesség, illetve a lakások településtípusonkénti összetételét jellemzik. A 3.9. táblázatban szereplő adatokat a belőlük számítható viszonyszámokkal kiegészítve állítottuk össze a 3.10. táblázatot.
3.10. táblázat - A magyarországi népességszám és lakásellátottság településtípusonként (1994. január 1.) Népesség száma ezer fő
%-os megoszlás
Lakások száma ezer db
100 lakásra
%-os
jutó
megoszlás
népesség (fő)
Megnevezés Budapest A többi város Községek Összesen
1 995,7
19,42
810
20,48
246
4 561,9
44,39
1692
42,78
270
3 719,4
36,19
1453
36,74
256
10 277,0
100,00
3955
100,00
260
A 3.10. táblázat utolsó oszlopában található adatok rész- és összetett intenzitási viszonyszámok. Részintenzitási viszonyszám például a Budapestre vonatkozó 100 lakásra jutó népesség:
Az egész ország lakásellátottságát jellemző összetett viszonyszám kiszámítása a következő:
126
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Az átlagos viszonyszám a megismert összefüggések alapján az alábbiak szerint is kiszámítható: – a részviszonyszámok súlyozott számtani átlagaként: a településtípusonkénti lakásszámadatokkal súlyozva
vagy megoszlási viszonyszámokkal súlyozva
– a részviszonyszámok súlyozott harmonikus átlagaként: a településtípusonkénti népességszámadatokkal súlyozva
vagy megoszlási viszonyszámokkal súlyozva
(Figyeljük meg, hogy az egész országot jellemző mutatószám értéke (260) a legkisebb (246) és a legnagyobb érték (270) közé esik.)
3.3.2. Szerkezet- és dinamikai változás vizsgálata Ha egy sokaság belső szerkezetében bekövetkezett (összetétel vagy struktúra) változását kívánjuk vizsgálni, akkor is csoportosító táblából indulunk ki (3.11. táblázat). A szerkezetváltozás mellett módunk van a jelenség dinamikai (időbeli) változásának vizsgálatára is.
3.11. táblázat - A magyarországi lakások számának megoszlása szobaszám szerint (január 1-jei adatok) Ezer db 127
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése 1980
1994
1
973
644
2
1720
1710
3 és több
849
1601
3542
3955
Szobák száma
Összesen
A lakásállomány szobaszám szerinti szerkezetét, összetételét a különböző időpontokban megoszlási viszonyszámokkal, az állomány nagyságának változását pedig dinamikus viszonyszámokkal elemezhetjük. Az egyes csoportokra (részsokaságokra) részviszonyszámok összetett dinamikus viszonyszám
a fősokaságokra
számítható. Számításukra és a közöttük levő összefüggésekre a korábbiakban elmondottak érvényesek.
Figyelmünket most elsősorban a szerkezetvizsgálat és a dinamikai változások összefüggéseire fordítjuk. A 3.12. táblázat az előző táblázat adatait kibővíti a kiszámítható viszonyszámokkal is.
3.12. táblázat - A magyarországi lakásállomány nagyságának és szobaszám szerinti összetételének alakulása 1980.
1994.
1994. évi
évi állomány %-os
1980. évi
megoszlás
%-ában
644
16,28
66,2
48,56
1710
43,24
99,4
849
23,97
1601
40,48
188,6
3542
100,00
3955
100,00
111,7
%-os
Szobák száma
ezer db
1
973
27,47
2
1720
3 és több Összesen
állomány az
megoszlás
ezer db
A 3.12. táblázatban található viszonyszámok alapján a következőket fogalmazhatjuk meg. 128
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése A lakásállomány szerkezetének 1980 és 1994 közötti változására az 1 szobás lakások arányának jelentős, a 2 szobások arányának kismértékű csökkenése és a 3 szobás lakások arányának nagyfokú növekedése jellemző. (Lásd a %-os megoszlásokat.) 1980 és 1994 között az egész lakásállomány 11,7%-kal nőtt, miközben a különböző szobaszámú lakások száma ettől eltérő módon változott. Míg az 1 szobás lakások állománya számottevően csökkent, a 2 szobásoké alig csökkent, addig a 3 szobás lakások száma nagymértékben megnőtt. E változások eredményezték a lakásállomány szobaszám szerinti szerkezetének az előzőekben vázolt változását. Az összetétel-változás viszonyszámokkal történő elemzésére tekintsük még a következő példát is (3.13. táblázat).
3.13. táblázat - Magyarország népességszámának és megoszlásának alakulása településtípusonként (január 1-jei adatok) 1980.
1994.
1994. évi népességszám az
évi népesség Megnevezés
Budapest A város
többi
Községek Összesen
ezer fő
%-os megoszlás
ezer fő
%-os
1980. évi
megoszlás
%-ában
2 059,3
19,23
1 995,7
19,42
96,9
4 551,3
42,50
4 561,9
44,39
100,2
4 098,9
38,27
3 719,4
36,19
90,7
10 709,5
100,00
10 277,0
100,00
96,0
Magyarország népessége 1980 és 1994 között 4,0%-kal csökkent. A budapesti népességszám ettől alig eltérően – de valamivel kisebb mértékben –, 3,1%-kal csökkent, emiatt a budapesti népesség aránya csekély mértékben (19,23%-ról 19,42%-ra, tehát 0,19 százalékponttal) nőtt. A többi városban a népességszám igen kis mértékben, 0,2%-kal nőtt, mivel a teljes népességszám viszont csökkent, e településcsoport népességének részaránya megnőtt. A községekben élő népesség száma 1994-ben 9,3%-kal volt kevesebb, mint 1980-ban (tehát nagyobb mértékű csökkenés tapasztalható, mint az egész országban), ennek hatására a községekben élő népesség aránya 1994-ben kisebb, mint 1980-ban. A példák alapján könnyen belátható, hogy összefüggés van a fősokaság és a részsokaságok nagyságának és a fősokaság szerkezetének változása között. 129
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése A részsokaságok nagyságának eltérő mértékű változása mindig a fősokaság összetételének megváltozását eredményezi. Ha
a j-edik részsokaság (csoport) tárgyidőszaki adata, a j-edik részsokaság (csoport) bázisidőszaki adata, a j-edik részsokaság (csoport) rész-dinamikus viszonyszáma, a fősokaság összetett dinamikus viszonyszáma,
M: a képzett részsokaságok (csoportok) száma, akkor általánosságban megállapíthatók a következő:
a) Ha akkor ebből átrendezéssel következik, ami azt jelenti, hogy ha valamely részsokaság (csoport) dinamikus viszonyszáma kisebb, mint az összetett dinamikus viszonyszám, akkor a részsokaság aránya a fősokaságon belül csökkent. Ehhez hasonlóan:
b) ha akkor tehát ha valamely részsokaság (csoport) dinamikus viszonyszáma nagyobb, mint az összetett dinamikus viszonyszám, akkor a részsokaság aránya a fősokaságon belül nőtt;
c) ha
akkor ebből
következik, ami azt jelenti, hogy a j-edik részsokaság aránya nem változott.
A dinamikus viszonyszámok ismeretében tehát következtetni tudunk a sokaság összetételében, szerkezetében bekövetkezett változásokra. Minél jobban eltér valamely részviszonyszám az összetett viszonyszámtól, annál nagyobb mértékű az adott sokaság részarányának változása. Tekintsük a következő számszerű példát! 130
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Tételezzük fel, hogy ismerjük a lakásépítések területi megoszlását 1980-ban és az 1994-re bekövetkezett dinamikai változást. Az adatok a 3.14. táblázatban találhatók.
3.14. táblázat - A magyarországi lakásállományra vonatkozó adatok A lakások számának
A lakások számának változása
%-os megoszlása 1980-ban
1980-ról 1994-re (1980=100,0%)
Megnevezés Budapest
20,53
111,4
A többi város
34,27
139,4
Községek
45,20
90,8
Összesen
100,00
...
A teljes lakásállomány nagyságának 1980 és 1994 közötti változását jellemző összetett dinamikus viszonyszámot a 3.14. táblázatban szereplő adatok alapján a településcsoportokra vonatkozó rész-dinamikus viszonyszámok
súlyozott számtani átlagaként számíthatjuk ki.
Tehát megállapítható, hogy az egész lakásállomány 1980-ról 1994-re 11,7%-kal nőtt. A budapesti lakások száma ennél valamivel kisebb mértékben (11,4%-kal) nőtt, emiatt a budapesti lakások aránya a teljes lakásállományon belül 1980-ról 1994-re kissé csökkent. Tehát az 1994. évi részarányt jelző megoszlási viszonyszám 20,53%-nál (nem számottevően) kisebb. A többi városban a lakásállomány a teljes állomány növekedésénél nagyobb fokú növekedést mutat, e tényből az is következik, hogy a többi város részesedése az ország lakásállományából megnőtt, 1994-ben a részesedési arány 34,27%-nál nagyobb. A községi lakások száma a vizsgált időszakban csökkent (míg az egész lakásállomány nőtt), így a községi lakások aránya csökkent, az arány 1994-ben 45,20%-nál kisebb volt. A sokaságok nagyságának és szerkezetének változására vonatkozó információkat nemcsak csoportosító táblák formájában jeleníthetjük meg, hanem megfelelően megválasztott, megszerkesztett grafikon segítségével is. 131
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése A sokaságok nagyságának és összetételének változását leggyakrabban osztott oszlopdiagramokkal vagy osztott kördiagramokkal szemléltetjük. Oszlopdiagrammal történő ábrázolás esetén az adatokat célszerű eltérő szélességű, azonos magasságú oszlopokkal ábrázolni. Az oszlopok (téglalapok) eltérő szélességében a sokaság(ok) nagyságának időbeli változását juttatjuk kifejezésre, és az azonos magasságokat az adott időszaki összetételnek megfelelően megosztjuk, így a szerkezetváltozás is érzékelhetővé válik.
3.4. ábra - A lakásállomány szobaszám szerinti összetételének alakulása
A 3.4. ábra elkészítéséhez szükséges viszonyszámok a 3.12. táblázatban találhatók. A téglalapok szélességeinek arányai 1:1,117. 132
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése A kördiagram a sokaság szerkezeti megoszlásának igen kifejező ábrázolási módja. Az összetételt a kör területének körcikkekre történő osztásával szemléltetjük. A részsokaságok arányát jelző megoszlási viszonyszámoknak megfelelő körcikkeket abból az egyszerű összefüggésből határozzuk meg, hogy a kör területe, azaz a 360°-os középponti szög megfelel a 100%-nak, így 1%-nak 3,6°-os középponti szög, azaz a hozzátartozó körcikk területe felel meg. Az összetétel ábrázolása mellett lehetőség van arra is, hogy a sokaságok nagyságának időbeli változását is érzékeltessük. Két időszak adatának összehasonlítása esetén két különálló (esetleg két koncentrikus), eltérő sugarú körrel ábrázolunk. Síkidomokkal való ábrázolás esetén azok területe arányos az adatok nagyságával, viszont síkidomok megszerkesztésekor egydimenziós jellemzőkből indulunk ki, így a köröket a sugaruk segítségével szerkesztjük. Ehhez fontos tisztázni, milyen arányban áll a sugarak nagysága egymással. Ha azt akarjuk, hogy a körök területaránya a –, a sugarak aránya
viszonyszámot fejezze ki – mivel a körök területaránya azonos a sugarak négyzetének arányával
lesz.
3.5. ábra - A lakásállomány szobaszám szerinti összetételének alakulása
Természetesen a 3.5. ábra elkészítéséhez is szükségesek a 3.12. táblázatból kiolvasható viszonyszámok. Az 1994-es lakásállomány nagyságát szemléltető kör sugara a az 1980. évi állományt reprezentálóénak
-szerese.
3.4. A kombinációs táblák (a sztochasztikus kapcsolatok) elemzése Azok a gazdasági és társadalmi jelenségek, folyamatok, amelyek vizsgálatával a statisztika foglalkozik, összefüggésben állnak egymással. Az elemző munka során fontos feladat ezeknek az összefüggéseknek a feltárása, a statisztika eszközeivel történő leírása. A jelenségeket, folyamatokat az ismérveik alapján jellemezhetjük, ezért a közöttük lévő összefüggések az ismérvek közötti kapcsolatként jelennek meg. 133
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Mielőtt a módszerek ismertetésére rátérnénk, ismerkedjünk meg az összefüggések lehetséges eseteivel. Az ismérvek közötti kapcsolat lehet függvényszerű, lehet sztochasztikus, illetve az ismérvek lehetnek egymástól függetlenek. Függvényszerű a kapcsolat két ismérv között, ha az egyik ismérv szerinti hovatartozás (ismérvváltozat) egyértelműen meghatározza a másik ismérv szerinti hovatartozást (ismérvváltozatot). Ilyen összefüggés van például a lakosok születési éve és életkora között. Sztochasztikus kapcsolatról beszélhetünk akkor, ha az ismérvek között tendenciaszerű összefüggést észlelünk, ha az egyed egyik ismérv szerinti hovatartozásából csupán a másik ismérv szerinti hovatartozásnak a valószínűsége határozható meg. Ilyen összefüggés van például a munkavállalók képzettsége és szakmai elismertsége között; a vállalkozások árbevétele és jövedelmezősége között stb. A két ismérvet egymástól függetlennek mondjuk, ha az egyik ismérv szerinti hovatartozás (ismérvváltozat) ismerete semmiféle információt nem ad a másik ismérv szerinti hovatartozásról (ismérvváltozatról). Pontos definícióját a 3.4.1. pontban adjuk meg. A statisztika a sztochasztikus kapcsolat vizsgálatával foglalkozik. Ezt a kapcsolatot – az elmondottak alapján – úgy tekinthetjük, mint a két szélsőség (a teljes függvényszerűség, illetve a kapcsolat teljes hiánya) közötti átmenetet. A kapcsolat erősségét (intenzitását) aszerint ítéljük meg, hogy az melyik szélsőséghez áll közelebb. A kapcsolatot annál lazábbnak, gyengébbnek nevezzük, minél közelebb van a függetlenséghez és annál szorosabbnak, erősebbnek, minél közelebb áll a függvényszerű kapcsolathoz. A sztochasztikus kapcsolatról elmondottak általánosíthatók kettőnél több ismérv esetére is, de ebben a fejezetben csak a két ismérv közötti (kétváltozós) sztochasztikus kapcsolatok vizsgálatának néhány egyszerű elemzési eszközével foglalkozunk. A vizsgálatba bevont ismérvek fajtája szerint a sztochasztikus kapcsolatnak háromféle típusát különböztetjük meg: a) Asszociáció(s)kapcsolat: az egymással kapcsolatban álló ismérvek minőségi vagy területi ismérvek (nominális változók, illetve egyikük ordinális mérési szintű változó). b) Vegyes kapcsolat: az egyik ismérv minőségi vagy területi ismérv (nominális, illetve ordinális skálán mért változó), a másik ismérv mennyiségi ismérv (intervallum- vagy arányskálán mért változó). c) Korreláció(s) kapcsolat: mindkét vizsgált ismérv mennyiségi ismérv (intervallum- és (vagy) arányskálán mért változó). Tekintsük a következő példát: a közalkalmazottakat megfigyeljük az iskolai végzettség, a vezetésben betöltött szerep (beosztás), a közalkalmazotti munkaviszony hossza és a kereset nagysága szerint. Ha összefüggést tapasztalunk az iskolai végzettség és a beosztás között, ezt a kapcsolatot asszociációnak nevezzük, mert mindkét jellemző minőségi ismérv. Az iskolai végzettség (minőségi ismérv) és a kereset nagysága (mennyiségi ismérv) közötti kapcsolat, illetve a beosztás (minőségi ismérv) és a kereset nagysága (mennyiségi ismérv) közötti kapcsolat vegyes kapcsolat. A munkaviszony hossza és a kereset nagysága közötti kapcsolatot pedig korrelációnak nevezzük, mert mindkét jellemző mennyiségi ismérv. 134
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Abból a szempontból, hogy melyik ismérv hat a másikra, háromféle összefüggés képzelhető el. Közvetlen ok-okozati kapcsolat, amikor az egyik ismérv az ok, a másik az okozat, vagyis az egyik független, a másik függő változónak tekinthető. A munkaviszony hossza és a kereset nagysága közötti kapcsolatban például a munkaviszony hossza tekinthető független változónak, a kereset nagysága pedig függő változó. Az ismérvek kölcsönhatásban lehetnek egymással, mint például az ár és a kereslet nagyságának összefüggésében. Egy termék árának nagysága befolyásolja a termék iránti keresletet, és viszont, a kereslet visszahat az árra. Közvetett kapcsolat, amikor az ismérvek között kizárólag azért tapasztalható összefüggés, mert azokat közös tényezők befolyásolják. Az oksági összefüggések természetét általában a jelenségek szakmai ismerete alapján lehet tisztázni. A sztochasztikus kapcsolatok statisztikai elemzéséhez a sokaság minden egységét egyidejűleg két (vagy több) ismérv szerint vizsgáljuk. Ebben a fejezetben csak két ismérv összefüggésének vizsgálatával foglalkozunk. Az asszociáció és a vegyes kapcsolat elemzése általában a sokaságnak a vizsgált két ismérv szerinti kombinatív csoportosításával (osztályozásával) kezdődik. A kombinatív csoportosítás során az egyik ismérv szerinti csoportosítással kapott részsokaságokon belül a másik ismérv szerint is osztályozunk. A kombinatív osztályozás eredményét kombinációs (kontingencia-) tábla formájában szokás megadni, emiatt tárgyaljuk a sztochasztikus kapcsolatok vizsgálatát – a tananyagunknak ebben a részében – a kombinációs táblák elemzéséhez kapcsolódóan. A kontingenciatáblák a korreláció bizonyos vizsgálataikor is kiindulópontot jelenthetnek, de a mennyiségi ismérvekben rejlő információk tökéletesebb 3 kihasználása olyan módszerek alkalmazását igényli, amelyek másféle adatbázist kívánnak meg. Két ismérv közötti kapcsolat vizsgálata a kombinációs tábla alapján történhet. A sokaságoknak két ismérv szerinti kombinatív csoportosítását (osztályozását) tartalmazó kontingenciatábla sémájaként tekintsük a 3.15. táblázatot.
3.15. táblázat - A kontingenciatábla sémája D ismérv E ismérv
N 3
A korreláció elemzését lásd a tankönyv II. kötetében.
135
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése ahol: az E ismérv szerint képzett i-edik csoport (osztály) (
),
a D ismérv szerint képzett j-edik csoport (osztály) (
),
a sokaság azon egységeinek száma (gyakorisága), amelyek E ismérv szerint az tartoznak (
osztályba és ezzel egyidejűleg D ismérv szerint a
osztályba
),
a sokaság azon egységeinek száma (gyakorisága), amelyek az E ismérv szerint a a sokaság azon egységeinek száma (gyakorisága), amelyek a D ismérv szerint a
osztályba tartoznak ( osztályba tartoznak (
), ),
s : az E ismérv szerint képzett csoportok (osztályok) száma, t : a D ismérv szerint képzett csoportok (osztályok) száma . Az előbbiekből következik, hogy
Az
gyakoriságok a sokaságoknak csak az E ismérv szerinti (függőleges irányú), az
gyakoriságok a sokaságoknak csak a D ismérv
szerinti (vízszintes irányú) megoszlását mutatják. Ezeket a gyakoriságokat peremgyakoriságoknak, az gyakoriságoknak nevezzük.
(
) gyakoriságokat együttes
Nézzünk egy példát (területi és minőségi ismérvek esetén) (3.16. táblázat).
3.16. táblázat - A közép- és felsőfokú tanintézetekben nappali tagozaton tanulók számának megoszlása lakóhelyük és a tanintézet típusa szerint (1990. január 1.) Megnevezés
Szakmunkás-Szakiskolai Középiskolai Egyetemi, tanuló tanuló tanuló főiskolai
Összesen
136
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése hallgató Budapest
28
12
66
22
128
Vidéki város
85
20
128
42
275
Község
84
13
77
16
190
Összesen
197
45
271
80
593
Példánkban
peremgyakoriságok,
együttes gyakoriság.
A kontingenciatábla sémáját megoszlási viszonyszámokkal (relatív gyakoriságokkal) is felírhatjuk (3.17. táblázat).
3.17. táblázat - A kontingenciatábla sémája relatív gyakoriságokkal (megoszlási viszonyszámokkal) D ismérv E ismérv
1 ahol: a sokaság azon egységeinek aránya (relatív gyakorisága), amelyek egyidejűleg tartoznak az E ismérv szerint az szerint a
osztályba (
osztályba és a D ismérv
). Ezeket együttes megoszlási viszonyszámoknak(relatív gyakoriságoknak) nevezzük, 137
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
az E ismérv szerinti megoszlási viszonyszámok (relatív gyakoriságok) (
),
a D ismérv szerinti megoszlási viszonyszámok (relatív gyakoriságok) (
).
Ez utóbbiakat perem megoszlási viszonyszámoknak (perem relatív gyakoriságoknak) nevezzük. A 3.16. táblázat adatai alapján készítsük el a relatív gyakoriságok táblázatát! (3.18. táblázat.)
3.18. táblázat - A tanulók relatív gyakoriságai lakóhelyük és a tanintézet típusa szerint Megnevezés
Egyetemi, SzakmunkásSzakiskolai Középiskolai főiskolai tanuló tanuló tanuló hallgató
Összesen (peremmegoszlás)
Budapest Vidéki város Községek
Összesen
1
(peremmegoszlás) A statisztikai gyakorlatban általában ezek 100-szorosát adjuk meg, amely százalékos megoszlást jelent (3.19. táblázat).
3.19. táblázat - A tanulók %-os megoszlása lakóhelyük és a tanintézet típusa szerint Megnevezés
Egyetemi, Szakmunkás-Szakiskolai Középiskolai főiskolai tanuló tanuló tanuló hallgató
Összesen
138
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Budapest
4,72
2,03
11,13
3,71
21,59
Vidéki város
14,33
3,37
21,59
7,08
46,37
Község
14,17
2,19
12,98
2,70
32,04
Összesen
33,22
7,59
45,70
13,49
100,00
3.4.1. Függvényszerű kapcsolat. Függetlenség Az E és D között függvényszerű a kapcsolat és E a független változó, ha abból, hogy a sokaság valamelyik eleme egy adott tartozik, egyértelműen következik, hogy a D ismérv szerint melyik
ismérvváltozathoz
ismérvváltozatban van. Ebből azonnal adódik, hogy a 3.15. kombinációs tábla
minden sorában csak egy együttes gyakoriság különbözik nullától (az ). Hasonlóan látható be, ha D ismérv a független változó és függvényszerű a kapcsolat, akkor minden oszlopban csak egyetlen nullától különböző együttes gyakoriság található. A 3.16. táblázatot tekintve nincs az ismérvek között függvényszerű kapcsolat. Ha E és D mindegyike tekinthető független változónak és függvényszerű a kapcsolat, akkor ez csak úgy lehet, hogy valamint az E és D ismérvek változatai között kölcsönösen egyértelmű leképezés létesíthető. Ez a kontingenciatábla szempontjából azt jelenti, hogy minden sorban és oszlopban csak egyetlen gyakoriság lehet nullától különböző. Ha nem hangsúlyozzuk, hogy melyik ismérv a független változó, akkor függvényszerű kapcsolaton ez utóbbit értjük. Most térjünk át a függetlenségre! Tekintsük a 3.15. táblázatot. Az E és D ismérv akkor független egymástól, ha az E ismérv szerinti megoszlás nem függ a D ismérv szerintitől és fordítva. A fősokaság E ismérv szerinti megoszlását jellemző (összetett) megoszlási viszonyszámok az
A
részsokaságok E ismérv szerinti megoszlását jellemző (rész)megoszlási viszonyszámok az
viszonyszámok
viszonyszámok
Foglaljuk ezt táblázatba (3.20. táblázat)!
3.20. táblázat - Az E ismérv szerinti rész- és összetett megoszlási viszonyszámok D ismérv
139
.
.
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése E ismérv
1 Az E ismérvváltozatok szerinti megoszlási viszonyszámok nem függhetnek attól, hogy melyik D szerinti ismérvváltozatról van szó. Ezért ezeknek minden oszlopban egyenlőknek kell lenni. Írjuk fel ezt például az első sorra:
Általánosan:
Vagy ami ugyanaz: ; Könnyű belátni, hogy ezen feltételek teljesülése esetén a D ismérv szerinti rész- és összetett megoszlás sem függ az E ismérvváltozattól. Vagyis azt mondhatjuk, hogy az E és D ismérv akkor függetlenek egymástól, ha ez az egyenletből álló
140
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése egyenletrendszer teljesül. Olyan megállapításnak tehát, hogy a D ismérv független E-től, nincs helye, mert a függetlenség szimmetrikus reláció. Azonnal látható, hogy a fenti egyenletrendszer ekvivalens az
egyenletrendszerrel. A fenti definíció így is fogalmazható (lásd a 3.17. táblázatot): az E és D ismérvek akkor függetlenek egymástól, ha a perem megoszlási viszonyszámok (relatív gyakoriságok) szorzata egyenlő a megfelelő együttes viszonyszámokkal. A 3.18. táblázat alapján könnyen ellenőrizhetjük, hogy a tanulók iskolatípus szerinti és település szerinti megoszlása nem független, mert pl.
3.4.2. Az asszociáció szorosságának mérése A sztochasztikus kapcsolat – mint már tudjuk – átmenetet képez a kapcsolat teljes hiánya (a függetlenség) és a függvényszerű kapcsolat között. Vizsgálni kell, hogy egy összefüggés mennyire áll közel a függetlenséghez, illetve mennyire közelíti a függvényszerű kapcsolatot. A két szélsőséges kapcsolathoz való viszonya alapján a sztochasztikus kapcsolatot annál szorosabbnak (erősebbnek) tekintjük, minél jobban közelít a függvényszerű kapcsolathoz, és annál lazábbnak (gyengébbnek), minél közelebb áll a függetlenséghez. Az asszociáció szorosságának mérésére többféle mutatószámot szerkesztettek, ezeket asszociációs együtthatóknak nevezzük. A következőkben a Yule-féle, a Csuprov-féle és a Cramer-féle asszociációs együtthatókat mutatjuk be. A Yule-féle asszociációs együttható Olyan esetekben, amikor mindkét ismérv alternatív (két változata van), gyakran alkalmaznak az asszociáció kimutatására koordinációs viszonyszámokat. A koordinációs viszonyszámok két részsokaság nagyságának egymáshoz viszonyított arányát mutatják. Kombinatív osztályozás esetén, a kontingenciatáblából kiindulva azonos tartalmú rész- és összetett koordinációs viszonyszámokat képezhetünk (3.21. táblázat).
3.21. táblázat - Kontingenciatáblázat alternatív ismérvek esetén D E 141
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
N Ha E és D függetlenek, azaz
akkor
Úgy is mondhatjuk, hogy a főátlóban lévő együttes gyakoriságok szorzata egyenlő a mellékátlóban lévő együttes gyakoriságok szorzatával:
Ha ez nem teljesül, vagyis
akkor E és D között sztochasztikus kapcsolat van. Ha e szorzatok különbségét elosztjuk ugyanezen szorzatok összegével, akkor a Yule-féle asszociációs együtthatóhoz (jele: Y) jutunk:
Általánosságban megállapíthatók a következők: – – – a két ismérv függetlensége esetén Y = 0, 142
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése – függvényszerű kapcsolat esetén – sztochasztikus kapcsolat esetén Ha az együttható abszolút értéke 0-hoz áll közel, akkor laza kapcsolatról, ha pedig 1-hez áll közel, akkor szoros sztochasztikus kapcsolatról beszélhetünk. Hiányossága a mérőszámnak, hogy abszolút értéke akkor is lehet 1, ha a kapcsolat nem függvényszerű. Könnyen belátható, ha a kontingenciatáblában található egy 0 gyakoriság, akkor az együttható abszolút értéke 1 lesz, annak ellenére, hogy ebben az esetben nem egyértelműen határozható meg az egyik ismérv szerinti hovatartozás alapján a másik ismérv szerinti hovatartozás. Az együttható képlete alapján belátható, ha ha Tehát pozitív Y érték akkor adódik, ha az azonos indexszel jelzett gyakoriságok a nagyobbak (ezek adnak nagyobb szorzatot), más szóval, ha az egyik ismérv 1-es jelű változata a másik ismérvnek ugyancsak 1-gyel jelzett változatát „vonzza”, ugyanígy vonzzák egymást a 0-ás jelű változatok is, míg az egyik ismérvnél 1-gyel, a másik ismérvnél 0-val jelölt változatok „taszítják” egymást. Fordított esetben negatív értéket kapunk. Nominális mérési szintű változók esetén általában önkényesen döntjük el, hogy melyik ismérvváltozatot tesszük az első helyre, ez a döntés az együttható abszolút értékét nem befolyásolja, csak az előjelet. Az előjelnek ilyenkor nem tulajdonítunk különösebb jelentőséget. Ordinális skálán mérhető változók esetén (lásd később) az előjelnek már lesz értelme, jelentősége. Nézzünk egy példát!
3.22. táblázat - Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) Ezer fő Gazdaságilag aktív
Gazdaságilag nem aktív
Összesen
Férfiak
2583,5
2359,9
4 943,4
Nők
2431,5
2935,3
5 366,8
Összesen
5015,0
5295,2
10 310,2
Megnevezés
143
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
A 3.22. táblázat alapján a nem és a gazdasági aktivitás nem független ismérvek (pl. ). Ugyanakkor nem függvényszerű a kapcsolat, hiszen ha választunk egy egyedet és tudjuk, hogy férfi (E első ismérvváltozata), mégsem tudjuk megmondani, hogy gazdaságilag aktív vagy nem. Csupán azt tudjuk, hogy annak a valószínűsége, hogy gazdaságilag aktív,
és annak a valószínűsége, hogy gazdaságilag nem aktív,
Így a kapcsolat közöttük sztochasztikus. Vizsgáljuk meg a 3.22. táblázat adatai alapján a nem és a gazdasági aktivitás ismérve közötti asszociációs kapcsolat szorosságát a Yule-féle együtthatóval:
A mérőszám a két ismérv között laza kapcsolatot jelez. Nézzük meg, hogy hogyan alakul az együttható értéke, ha a 3.22. táblázat sorait megcseréljük, vagyis az új táblázatban a nők adatait írjuk az első sorba, a férfiakét a második sorba (3.23. táblázat).
3.23. táblázat - Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) Ezer fő Gazdaságilag aktív
Gazdaságilag nem aktív
Összesen
Nők
2431,5
2935,3
5 366,8
Férfiak
2583,5
2359,9
4 943,4
Összesen
5015,0
5295,2
10 310,2
Megnevezés
A Yule-féle asszociációs együttható a 3.23. táblázatból:
A kapcsolat szorosságára ugyanakkora abszolút értékű számot kaptunk, mint korábban, csak negatív előjellel. A Csuprov-féle és a Cramer-féle asszociációs együttható 144
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése A Yule-féle asszociációs együttható – mint az a számítás módjából egyértelműen látszik – csak alternatív ismérvek szorosságának mérésére alkalmas. Ha a két ismérv valamelyikének kettőnél több változata van, az eredeti adatokból nem számítható. Ilyen esetben is hasznosíthatjuk ugyan, de mérsékelt hatásfokkal, ha a nem alternatív ismérvet csoportok összevonásával alternatívvá alakítjuk. Amennyiben az ismérvek nem alternatívak, az ismérvváltozatok összevonása helyett célszerűbb olyan mutatószámot választani az asszociáció szorosságának mérésére, amely ebben az esetben is alkalmazható. Ilyenek – többek között – a Csuprov-féle és a Cramer-féle asszociációs együtthatók. A Csuprov-féle és a Cramer-féle asszociációs együtthatók alapgondolata a függetlenség feltételezésével számított gyakoriságokhoz (
) kapcsolódik.
Mint láttuk, az ismérvek függetlenségének feltétele az
(lásd a 3.15. táblázatot) egyenletek teljesülése. Ez azt jelenti, hogy bevezetve az
jelölést, az E és D ismérvek akkor függetlenek, ha
minden
esetben. Ha nem egyenlők, akkor nincs függetlenség, és azt gondolhatjuk, hogy a függetlenség feltételezésével számított
értékek minél jobban eltérnek a tényleges
értékektől, annál „messzebb” vagyunk a függetlenségtől, vagyis annál szorosabb a kapcsolat.
Például a 3.16. táblázat alapján meghatározhatjuk a függetlenség feltételezésével számított gyakoriságokat. Ezeket tartalmazza a 3.24. táblázat. A 3.16. táblázat alapján a budapesti szakmunkástanulók száma függetlenség esetén:
A két ismérv függetlensége esetén a 28 ezer (lásd 3.16. táblázat), budapesti lakosú, szakmunkásképzőbe járó tanulóval szemben jóval több tanuló tartozna ebbe a csoportba. 145
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
3.24. táblázat - A függetlenség feltételezésével számított gyakoriságok ( ) Ezer fő Megnevezés
Egyetemi, Szakmunkás-Szakiskolai Középiskolai főiskolai tanuló tanuló tanuló hallgató
Összesen
Budapest
42,52
9,71
58,50
17,27
128,00
Vidéki város
91,36
20,87
125,67
37,10
275,00
Községek
63,12
14,42
86,83
25,63
190,00
Összesen
197,00
45,00
271,00
80,00
593,00
A 3.16. és 3.24. táblázat adatait összehasonlítva is megállapíthatjuk, hogy sztochasztikus kapcsolat van a két ismérv között, mert a tényleges gyakoriságok eltérnek a függetlenség feltételezésével számított gyakoriságoktól. Ha nem lenne kapcsolat a két ismérv között, akkor a tényleges ( és a függetlenség feltételezésével számított ( Az
(tényleges) és
)
) gyakoriságok rendre megegyeznének.
(feltételezett) gyakoriságok eltérésének mérésére szolgáló nevezetes mennyiség a
(Khi négyzet)
4
amely az eltérések négyzetének relatív nagyságát juttatja kifejezésre. Érvényes rá a következő egyenlőtlenség:
és
A
a 0 értéket akkor veszi fel, ha a vizsgált két ismérv független egymástól, azaz ha i és j minden értékére teljesül az
4
egyenlőség.
A szerepe a matematikai statisztikában igen széles körű. Az asszociációvizsgálat csupán egyik alkalmazási területe. A legjellegzetesebb alkalmazásával a Tankönyv II. kötetében, a Hipotézisek ellenőrzése című fejezetben foglalkozunk.
146
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Függvényszerű kapcsolat esetén (ekkor s = t). Más szóval a ezt a maximális értékét akkor éri el, ha a kontingenciatábla minden sorában csak egy 0-tól különböző gyakoriság található, és e gyakoriságok mind különböző oszlopba tartoznak. Térjünk vissza bemutató példánkhoz. Az alapadatokat és a számításokat a 3.25. táblázat tartalmazza. A
mérőszám ismeretében képezhető a Csuprov-féle asszociációs együttható (jele: T):
A Csuprov-féle asszociációs együttható értéke 0 és 1 között van. A 0 értéket akkor veszi fel, ha a két ismérv független egymástól. Függetlenség esetén ugyanis a = 0 (és fordítva, ha = 0, akkor a két ismérv független egymástól). A T = 1 értéket csak az s = t esetben érheti el (csak ilyenkor képzelhető el az, hogy az egyik ismérv szerinti hovatartozás kölcsönösen egyértelműen meghatározza a másik ismérv szerinti hovatartozást), az esetekben T < 1. Az esetekben a T által elérhető maximális érték:
3.25. táblázat - A
számítása
Megnevezés 28
42,52
–14,52
210,83
4,96
12
9,71
2,29
5,24
0,54
66
58,50
7,50
56,25
0,96
22
17,27
4,73
22,37
1,30
85
91,36
–6,36
40,45
0,44
Vidéki
20
20,87
–0,87
0,76
0,04
város
128
125,67
2,33
5,43
0,04
42
37,10
4,90
24,01
0,65
Budapest
147
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
Község
Összesen
84
63,12
20,88
435,97
6,91
13
14,42
–1,42
2,02
0,14
77
86,83
–9,83
96,63
1,11
16
25,63
–9,63
92,74
3,62
593
593,00
0,00
–
A középfokú és felsőfokú tanintézetekben tanulók településforma szerinti hovatartozása és a tanintézetük típusa közötti kapcsolat szorosságát jellemző Csuprov-féle asszociációs együttható:
Az asszociációs együttható alapján azt a megállapítást tehetjük, hogy a vizsgált ismérvek között laza kapcsolat van. Az asszociációs összefüggések térbeli vagy időbeli összehasonlítására szolgál a Cramer-féleasszociációs együttható (jele: C). Ez a mutatószám kétféleképpen számítható. 1. A
értékét viszonyítjuk annak maximális értékéhez:
2. A Csuprov-féle asszociációs együttható korrekciójával a következőképpen:
A Cramer-féle együttható az ismérvváltozatok számától függetlenül mindig 0 és 1 között veszi fel értékét
.
Amennyiben s = t, akkor T = C, tehát ha a két ismérv változatainak száma azonos, akkor a Csuprov-féle és a Cramer-féle asszociációs együttható számszerű értéke megegyezik. A Cramer-féle asszociációs együttható példánkban:
148
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
illetve a Csuprov-féle együttható értékének módosításával:
A Cramer-féle együttható is gyenge sztochasztikus kapcsolatot jelez.
3.4.3. A vegyes kapcsolat elemzése Vegyes kapcsolatnak nevezzük a sztochasztikus kapcsolatnak azt a típusát, amelyben az ok (a független változó) szerepét minőségi (vagy területi ismérv), az okozat (a függő változó) szerepét mennyiségi ismérv tölti be. Egy minőségi és egy mennyiségi ismérvet tartalmazó vegyes kapcsolat elemzését a következőképpen rendezett adathalmazból kiindulva vizsgáljuk (3.26. táblázat).
3.26. táblázat - A vegyes kapcsolat adatbázisa A mennyiségi ismérv megfigyelt értékeinek sorszáma
A minőségi ismérv változatai
ahol: a minőségi ismérv j-edik változata (a minőségi ismérv alapján képzett j-edik részsokaság azonosítója), 149
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése a mennyiségi ismérvnek a j-edik részsokaság i-edik eleménél felvett értéke (
),
a j-edik részsokaság elemszáma (a j-edik részsokasághoz tartozó megfigyelt X értékek száma). Megjegyezzük, hogy az egyes részsokaságok elemszáma (az egyes részsokaságokhoz tartozó megfigyelések száma) különböző lehet, vagyis pl. (
nem feltétlenül egyezik meg
-mel
).
Például egy település ipari szervezeteit vizsgáljuk gazdálkodási forma (minőségi ismérv) és a foglalkoztatott létszám nagysága (mennyiségi ismérv) szerint. A megfigyelt létszámadatokat gazdálkodási forma szerint rendezve írhatjuk fel (3.27. táblázat).
3.27. táblázat - Egy bizonyos települési székhellyel működő jogi személyiségű ipari szervezetek létszámadatai (főben) A megfigyelt szervezet sorszáma
Vállalat
Korlátolt felelősségű Részvénytársaság Szövetkezet társaság
1.
260
10
120
55
2.
290
11
280
70
3.
470
11
295
88
4.
600
12
570
97
5.
–
12
800
143
6.
–
13
1500
150
7.
–
14
–
215
8.
–
14
–
244
9.
–
15
–
260
10.
–
15
–
305
11.
–
16
–
–
12.
–
17
–
– 150
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése 13.
–
17
–
–
14.
–
18
–
–
15.
–
18
–
–
16.
–
18
–
–
17.
–
19
–
–
18.
–
19
–
–
19.
–
19
–
–
20.
–
20
–
–
21.
–
21
–
–
22.
–
22
–
–
23.
–
25
–
–
24.
–
26
–
–
25.
–
28
–
–
26.
–
29
–
–
27.
–
30
–
–
28.
–
35
–
–
29.
–
40
–
–
30.
–
45
–
–
31.
–
48
–
–
32.
–
50
–
–
151
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése 33.
–
55
–
–
34.
–
58
–
–
35.
–
60
–
–
36.
–
65
–
–
37.
–
90
–
–
38.
–
150
–
–
39.
–
200
–
–
40.
–
302
–
–
Mivel általában nagyszámú megfigyelést végzünk, az adatokat célszerű kombinációs (kontingencia-) táblába rendezni (3.28. táblázat).
3.28. táblázat - A kontingenciatábla sémája vegyes kapcsolat esetén D minőségi ismérv X mennyiségi ismérv
N
152
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése ahol: a minőségi ismérv j-edik változata (illetve a minőségi ismérv alapján képzett j-edik részsokaság azonosítója), az X mennyiségi ismérv alapján képzett i-edik csoport (osztály) azonosítója. Ha X diszkrét, akkor jelentheti az osztályközt is.
ismérvértéket, de jelölhet
k: az X mennyiségi ismérv alapján képzett csoportok (osztályok) száma, a sokaság azon elemeinek száma – gyakorisága –, amelyek a D minőségi ismérv szerint ismérv szerint a
csoportba (osztályba) tartoznak (
részsokaságba és ezzel egyidejűleg X mennyiségi
),
a sokaság azon elemeinek száma, amelyek az X ismérv szerint
csoportba (osztályba) tartoznak (
),
a sokaság azon elemeinek száma, amelyek a minőségi ismérv szerint a j-edik csoportba, részsokaságba tartoznak (
),
.
Például az ipari szervezeteket a megfigyelésekre támaszkodva csoportosíthatjuk – egyidejűleg – gazdálkodási forma és a létszám nagysága szerint, a két ismérvet egymással kombinálva. A mennyiségi ismérv szerinti osztályozás különösebb mérlegelést igényel. Látjuk, hogy a legkisebb és legnagyobb létszámadat között nagy a különbség, és a kis létszámú szervezetek adják a cégek zömét. Ezért egyenlőtlen hosszúságú osztályközöket jelölünk ki. A kombinatív osztályozás eredményét a 3.29. táblázatban adjuk meg.
3.29. táblázat - Egy bizonyos települési székhellyel működő ipari szervezetek megoszlása gazdálkodási forma és létszám szerint Gazdálkodási forma
Vállalat
Létszám (fő)
Korlátolt Részvényfelelősségű Szövetkezet Összesen társaság társaság
– 20
–
20
–
–
20
21 – 50
–
12
–
–
12
51 – 100
–
5
–
4
9
101 – 300
2
2
3
5
12 153
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése 301 – 500
1
1
–
1
3
501 – 1000
1
–
2
–
3
1000 –
–
–
1
–
1
Összesen
4
40
6
10
60
A vegyes kapcsolat vizsgálatának első mozzanata szintén annak a vizsgálata, hogy van-e sztochasztikus kapcsolat a vizsgálatba bevont ismérvek között. A feladat ebben az esetben úgy is megfogalmazható, hogy szerepet játszik-e a minőségi ismérv a mennyiségi ismérv szerinti eloszlásban? Ez vizsgálható a kontingenciatáblából kiindulva a 3.4.1. pontban tárgyalt módszerekkel. Megjegyezzük, hogy ezen vizsgálatok eredményét befolyásolhatja, hogy milyen módon választjuk az osztályközöket. Mivel vegyes kapcsolat esetén az egyik vizsgálatba bevont ismérv mennyiségi ismérv, az összefüggés-vizsgálat során felhasználhatjuk az átlag– részátlag-, főátlag- – számítást, szórásszámítást, a szórásnégyzet-felbontás módszerét. Ezek segítségével számszerűsíthetjük a minőségi ismérv alapján képzett részsokaságok mennyiségi ismérv szerinti különbözőségét, a minőségi ismérv szerepét a mennyiségi ismérv értékeinek különbözőségében. Rész- és főátlagok A minőségi ismérv szerint csoportosított sokaságban az egyes részsokaságokra számított átlagot részátlagnak (jele: átlagot pedig főátlagnak (jele: ) nevezzük. A j-edik csoport részátlaga (a 3.26. táblázat alapján)
ahol : a j-edik részsokaság értékösszege (
[MA
),
:#-#]
A főátlag 154
), a fősokaságokra vonatkozó
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
Mivel
a részátlagok és a főátlag között fennállnak az alábbi összefüggések:
Tehát a főátlag ( ) kiszámítható a részátlagok (
) súlyozott átlagaként is:
– súlyozott számtani átlag formában, ahol a súly szerepét a részsokaságok elemszámai, az – súlyozott harmonikus átlag formában, ahol súlyként a részsokaságok
adatok töltik be,
értékösszegadatai szerepelnek.
A főátlag súlyozott átlagként történő számításánál a súlyként szereplő adatok helyettesíthetők az azokból számított megoszlási viszonyszámokkal. A két ismérv függetlensége esetén (ha a minőségi ismérv szerinti hovatartozás semmiféle hatást nem gyakorol a mennyiségi ismérv nagyságára) az egyenlőek (minden j-re megegyeznek). Ebből következően (minden j-re). Fontos: az állítás nem fordítható meg. A részátlagok egyenlőségéből nem következik a függetlenség. Ha arra vagyunk kíváncsiak, hogy az ismérvek függetlenek-e, a 3.4.1. pontban tárgyalt módon járhatunk el. Ha a 3.28. kontingenciatáblát vizsgáljuk, két ismérv függetlensége esetén a minőségi ismérv szerint képzett részsokaságokban az relatív gyakoriságok i-t tetszőlegesen rögzítve minden j-re megegyeznek. Függetlenség esetén tehát a minőségi ismérv szerint képzett részsokaságokban a relatív gyakorisági sorok azonosak. Az egyforma relatív gyakorisági sorokból pedig a részátlagokra azonos becslések származnak. A részátlagok és a főátlag számításával, ezek összehasonlításával képet kaphatunk az ismérvek közötti kapcsolatról. Amennyiben a részátlagok jelentősen eltérnek egymástól és a főátlagtól, ez azt jelzi, hogy van kapcsolat az osztályozás alapját képező minőségi ismérv és mennyiségi ismérv között. A 3.27., illetve 3.29. táblázatból meghatározhatjuk a részátlagokat és a főátlagot, illetve azok becsült értékeit. Ha az eredeti adatokat nem ismerjük, akkor a kontingenciatáblából csak az utóbbiak számíthatók. Ezeket az átlagokat a 3.30. táblázat tartalmazza. 155
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
3.30. táblázat - A vizsgált ipari szervezetekre vonatkozó rész- és főátlagok
Megnevezés
Vállalat Korlátolt felelősségű társaság Részvénytársaság Szövetkezet Összesen
Szervezetek száma
Összlétszám a 3.27. táblázat alapján
4
1620
405,0
387,5
40
1687
42,2
47,4
6
3565
594,2
558,3
10
1627
162,7
170,0
60
8499
141,7
141,6
Átlagos létszám
3.29. táblázat segítségével becsült átlagos létszám*
*A számításnál az első osztályközépsőt 15-nek, az utolsót 1250-nek vettük. Mivel a részátlagok egymástól és a főátlagtól is eltérnek (ez a helyzet a becsült értékeknél is), a két ismérv közötti kapcsolat megléte nyilvánvaló. A vegyes kapcsolat szorosságának vizsgálata a szóródásszámítás segítségével történik. Ahhoz, hogy a mérőszámig eljuthassunk, meg kell ismerkednünk néhány új fogalommal. A rész- és fősokaságok szórása, szórásnégyzete Amennyiben a sokaságot részsokaságokra bontva vizsgáljuk – a viszonyszámok és az átlagok számításához hasonlóan –, a fősokaságra és a részsokaságokra vonatkozóan is számítunk szórást. A részsokaságokra vonatkozó szórást részszórásnak vagy részsokaságokon belüli szórásnak, a fősokaságra vonatkozó szórást teljes szórásnak nevezzük. A közöttük lévő összefüggés kevésbé egyszerű, mint a részviszonyszámok és az összetett viszonyszám vagy a részátlagok és a főátlag összefüggése. Az összefüggések bemutatásához nézzük a következőket! Ha a sokaságot részekre bontva vizsgáljuk, akkor a szórásszámításra alkalmas, ún. átlagtól való eltérést háromféleképpen értelmezhetjük. a)
(
)
az ún. teljes eltérés, amely egy adott ismérvérték és a főátlag közötti eltérés. 156
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése b)
(
)
az ún. belső eltérés, amely egy adott j-edik részsokasághoz tartozó ismérvérték és j-edik részátlag közötti eltérés. c)
(
)
az ún. külső eltérés, amely a j-edik részátlag és a főátlag eltérése. Könnyen belátható, hogy a háromféle eltérés között az alábbi összefüggés áll fenn:
Egy 800 fős Rt. esetén pl.
A 658,3 fős eltérés ebben az esetben azzal magyarázható, hogy a kiválasztott Rt. létszáma saját csoportján belül mintegy 206 fővel nagyobb, s az Rt.-k létszámnagysága a szervezetek összességére jellemző átlagot is meghaladja. A három eltérés közötti összefüggés alapján megállapíthatjuk, hogy adott
érték főátlagtól való eltérését két tényező okozhatja:
– egyrészt a részsokaságokon belül különbözőek lehetnek az ismérvértékek, ezeket a különbségeket a – másrészt a részátlagok eltérhetnek egymástól, ingadozhatnak a főátlag körül. Ezt fejezi ki a hatása mutatkozik meg. Mind a háromféle eltérés alapján számítható valamilyen szórás, illetve szórásnégyzet. A teljes eltérések
felhasználásával adódó
szórás a teljes szórás. 157
eltérés fejezi ki,
eltérés, amelyben a csoportosító (minőségi) ismérv
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése A teljes szórás négyzete a teljes szórásnégyzet. A belső eltérésekből
kiindulva számíthatók az egyes részsokaságokra vonatkozó
részszórások, vagy részsokaságokon belüli szórások. A részszórások négyzetének az egész sokaságra vonatkozó átlaga a belső szórásnégyzet
, tehát a belső szórás:
. Ha az ( ) eltérésnégyzetek egész sokaságra vonatkozó átlagát vesszük, akkor a külső szórásnégyzetet kapjuk, és ennek négyzetgyöke a külső szórás:
A háromféle szórásnégyzet között a
összefüggés áll fenn. Ennek igazolására (a definíciókat felhasználva) elegendő a megismert szórásnégyzetek számlálói – az ún. eltérésnégyzetösszegek – közötti összefüggés bizonyítása.
158
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Mivel
valamint
minden j-re, ezért írhatjuk, hogy
Az eltérés-négyzetösszegeket a következőképpen is szokás jelölni: teljes eltérés-négyzetösszeg: SS, belső eltérés-négyzetösszeg: külső eltérés-négyzetösszeg: Az eltérés-négyzetösszegekre vonatkozó azonosság a következő formában is felírható:
A háromféle eltérés-négyzetösszeg, illetve szórásnégyzet összegszerű összefüggése természetesen arra is felhasználható, hogy kettő ismeretében kiszámítsuk az ismeretlen harmadikat. Az elmondottak alapján megfogalmazható az is, hogy a fősokaságra vonatkozó teljes szórás kétféleképpen számítható ki: – az egyes ismérvértékek főátlagtól való eltérései alapján 159
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
– a háromféle szórásnégyzet összefüggése alapján
Ezek után nézzük a példánkat. A 3.27. és 3.30. táblázat alapján meghatározhatók a fenti paraméterek, értékeiket a 3.31. táblázat tartalmazza (a tényleges és nem a becsült értékekkel számoltunk). A teljesség kedvéért a 3.30. táblázat néhány adatát is feltüntettük.
3.31. táblázat - A vizsgált ipari szervezetekre vonatkozó adatok Szervezetek
Összlét-
Átlagos
Eltérés-négy-
Szórás
száma
%
szám (fő)
létszám (fő)
zetösszeg
(fő)
Vállalat
4
6,67
1620
405,0
76 500
138,3
Korlátolt fele-lősségű társaság
40
66,67
1687
42,2
124 204
55,7
6
10,00
3565
594,2
1 276 521
461,3
10
16,66
1627
162,7
69 700
83,5
60
100,00
8499
141,7 =
Megnevezés
Részvénytársaság Szövetkezet Összesen
1 546 925 =
239,9 =
A táblázat adatait a következőképpen kaptuk: Az eltérés-négyzetösszeg – a fejrovatban kijelölt képlet szerint – például a vállalatoknál a következő (lásd a 3.27. táblázatot is): 160
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
A szórás a vállalatoknál:
A teljes szórás:
Az egyes ipari szervezetek létszáma tehát átlagosan mintegy 240 fővel tér el – a négyzetes eltérések alapján számolva – a 60 szervezetre jellemző 141,7 fős átlagtól. A továbbiakban meghatározzuk a 3.31. táblázat alapján a háromféle eltérés-négyzetösszeget, és bemutatjuk azok összefüggését.
A teljes eltérés-négyzetösszeget (SS) a megfigyelt ipari szervezetek számával osztva kapjuk a teljes szórásnégyzetet:
amely a teljes eltérés-négyzetösszeghez hasonlóan bomlik összetevőkre. Az összes ipari szervezetre vonatkozó belső eltérés-négyzetösszeg ( 161
) alapján a belső szórásnégyzet:
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
A külső eltérés-négyzetösszegből (
) kiindulva a külső szórásnégyzet:
A teljes szórásnégyzet tehát:
A teljes szórás az összetevők alapján:
Számítsuk ki a 60 megfigyelt ipari szervezet létszámának belső és külső szórását is. A belső szórás
az előzőekben már bemutatott összefüggés alapján kiszámítható a különböző típusú gazdasági szervezetek létszámának szóródását jellemző szórások
súlyozott négyzetes átlagaként is:
a súly szerepét betöltő részsokasági elemszámadatok helyettesíthetők azok megoszlási viszonyszámaival, így
A belső szórás megmutatja, hogy az egyes ipari szervezetek – mind a 60 ipari szervezetet figyelembe véve – létszáma átlagosan 160,6 fővel tér el a „saját” gazdálkodási formáját jellemző átlagos létszámtól. (A négyzetes eltérések alapján számolva.) 162
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése A külső szórás
A külső szórás megmutatja, hogy a megfigyelt vállalatok, kft.-k, részvénytársaságok, szövetkezetek átlagos létszáma az együttes átlagos létszámuktól átlagosan 178,2 fővel tér el. (A négyzetes eltérések alapján számolva.) A vegyes kapcsolat szorosságának mérése Visszatérve a szórásnégyzetek összefüggésére, a teljes szórásnégyzet összetevői alapján az ismérvek sztochasztikus kapcsolatára a következőket állapíthatjuk meg. a) Ha az -k egyenlőek (minden j-re), vagyis az egyes részátlagok megegyeznek egymással és ebből következően a főátlaggal, akkor a két ismérv között nincs kapcsolat. De ez nem jelenti azt, hogy a két ismérv független. Könnyű olyan példát mondani, amelyben a részátlagok egyenlőek és a függetlenség 3.4.1.-ben megfogalmazott feltétele nem teljesül. Tehát a függetlenségből következik, hogy az E mennyiségi ismérv és a D minőségi ismérv között nincs kapcsolat, de fordítva nem. b) Ha ( ), vagyis a részsokaságokon belül nincs szóródás ( ), akkor Ebben az esetben az ismérvértékek szóródása teljes egészében a csoportosítás alapját képező minőségi ismérv következménye. A két ismérv között olyan függvényszerű kapcsolat van, hogy a minőségi ismérv a független változó. Ugyanis ekkor minden D szerinti részsokaságban egyetlen E ismérvváltozat gyakorisága különbözik nullától. És fordítva, ha a két ismérv között ilyen függvényszerű kapcsolat van, azaz a minőségi ismérv egyértelműen meghatározza a mennyiségi ismérv nagyságát, akkor:
c) Ha
, akkor sztochasztikus kapcsolat van a két ismérv között.
A részekre bontott sokaságból képezhető háromféle szórásnégyzet – a teljes szórásnégyzet és összetevői – alapján következtethetünk a vizsgálatba bevont két ismérv kapcsolatára, illetve arra, hogy hatást gyakorol-e az osztályozás alapját képező minőségi ismérv a sokaság egységeinek mennyiségi ismérv szerinti hovatartozására. Ismert a háromféle szórásnégyzet összefüggése:
163
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Ismert az is, hogy a külső szórásnégyzet ( ) a részátlagoknak a főátlagtól való eltérései alapján számított szórásnégyzet, ami éppen az osztályozás alapját képező minőségi ismérv hatásának tulajdonítható rész a teljes szórásnégyzeten belül. A belső szórásnégyzet (
) az egyéb, nem vizsgált tényezők együttes hatása.
Ezért a vegyes kapcsolat szorosságának vizsgálatakor kiemelt szerepe van a
ún. szórásnégyzet-hányadosnak, amely a mennyiségi ismérv szórásnégyzetének a minőségi ismérv által megmagyarázott hányada. A szórásnégyzet-hányados kiszámítható a következő formában is:
A
Ha
, illetve
összefüggés következtében belátható, hogy a megismert hányados a
, akkor azt mondjuk, hogy a két ismérv között nincs kapcsolat. A
intervallumban vehet fel értéket:
eset akkor fordulhat elő, ha a részátlagok mind egyformák, és
ezért Ha
, ez a két ismérv függvényszerű kapcsolatára utal.
eset akkor következhet be, ha a részsokaságokban az X értékek nem szóródnak
( ). A minőségi ismérv szerinti hovatartozás egyértelműen meghatározza a mennyiségi ismérvet, a sokaság elemeinek mennyiségi ismérv szerinti hovatartozását. Ha A
, a két ismérv között sztochasztikus kapcsolat van. szórásnégyzet-hányadost megoszlási viszonyszám jellege miatt százalékos formában szokás kifejezni.
A vegyes kapcsolat szorosságának mérőszámaként a szórásnégyzet-hányados négyzetgyökét, a szóráshányadost (jele: H) használjuk. A szóráshányados – a szórásnégyzet-hányadossal ellentétben – nem értelmezhető megoszlási viszonyszámként, ezért nem fejezhető ki %-os formában. 164
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Az ipari szervezetek gazdálkodási formája és a foglalkoztatott létszám közötti kapcsolatot vizsgálva, a korábbiakban kiszámított adatok alapján
A gazdálkodási forma 55,2%-ban magyarázza meg a létszám szóródását (ingadozását). A fennmaradó 44,8% egyéb nem vizsgált (ebben az összefüggésben véletlenként kezelt) tényezők hatása. A szóráshányados
meglehetősen szoros kapcsolatot jelez a gazdálkodási forma és a létszám nagysága között.
3.4.4. A korreláció elemzése csoportosított adatokból kiindulva Ha mindkét vizsgálatba bevont ismérv mennyiségi ismérv, akkor bizonyos egyszerűbb elemzési eszközök alkalmazásánál ugyancsak kiindulópontot jelenthet a kombinációs (kontingencia-) tábla. Azt a statisztikai táblát, amely a sokaság egységeinek mennyiségi ismérvek szerinti kombinatív osztályozását tartalmazza, korrelációs táblának nevezzük (3.32. táblázat).
3.32. táblázat - A korrelációs tábla sémája Y X
N A táblázatban X az ok szerepét játszó mennyiségi ismérvet (független változót, tényezőváltozót), Y az okozat szerepét betöltő mennyiségi ismérvet (függő változót, eredményváltozót) jelenti, amennyiben ilyenek egyáltalán megkülönböztethetők. Ha két ismérv kölcsönhatásban áll egymással, nincs jelentősége annak, hogy a vizsgált ismérvek közül melyiket jelöljük X-szel, illetve Y-nal. 165
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése az X ismérv alapján képzett i-edik osztály azonosítója, jelenthet
ismérvértéket, de jelölhet osztályközt is.
az Y ismérv alapján képzett j-edik osztály azonosítója, jelenthet Az
együttes gyakoriságok,
ismérvértéket, illetve osztályközt.
peremgyakoriságok jelentése és ezek összefüggései már ismertek.
Mindkét ismérv mennyiségi ismérv, de most is eljárhatunk úgy, hogy az egyik ismérvet (pl: X-et) csak osztályozásra, részsokaságok kialakítására használjuk, a másikat (az Y-t) pedig átlag- és szórásszámítás segítségével vizsgáljuk, vagyis ugyanúgy járunk el, mint a vegyes kapcsolat vizsgálatánál. Tekintsük a következő példát (3.33. táblázat):
3.33. táblázat - Egy társasházban lévő lakások megoszlása a szobák száma és a lakásban lakó személyek száma szerint Személyek száma (fő)
1
2
3
4
5
6
7
Összesen
1
1
2
1
1
–
–
–
5
2
1
2
10
7
1
1
–
22
3
–
1
2
7
2
4
1
17
4
–
–
–
–
3
2
1
6
2
5
13
15
6
7
2
50
Szobák száma
Összesen
A társasház lakásait egyidejűleg a szobák száma (X) és a lakásban élő személyek száma (Y) szerint figyeltük meg. Már a táblázat adataiból is kitűnik, hogy a kisebb szobaszámú lakásokban általában kevesebb személy lakik, a nagyobb szobaszámúakban pedig több. Esetünkben, mivel mindkét jellemző tulajdonság mennyiségi ismérv, korrelációs kapcsolatról beszélünk. Attól függően, hogy az X ismérv nagyobb (kisebb) értékeihez az Y ismérv nagyobb (kisebb) értékei tartoznak vagy éppen fordítva, kétféle korrelációról beszélhetünk. Pozitív korreláció áll fenn két ismérv között, ha az X nagyobb értékeihez általában Y nagyobb értékei, illetve X kisebb értékeihez Y kisebb értékei tartoznak. Fordított esetben negatív korrelációról beszélünk (X nagyobb értékeihez általában Y kisebb értékei tartoznak, illetve fordítva). 166
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Ha a szobaszámot (X) csoportosító ismérvnek tekintjük és kiszámítjuk a különböző szobaszámú tömörebben fejeződik ki a két ismérv sztochasztikus összefüggése.
lakásokban élők átlagos számát
Az X ismérv szerint képzett ( ) osztályok halmazán értelmezett függvényt, amely vonatkozó (X szerinti) tapasztalati regressziófüggvényének nevezzük.
részátlagot rendeli, az Y változó X változóra
-hez az
akkor
Példánkban (3.34. táblázat):
3.34. táblázat - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye Szobaszám
Átlagos lakószám (fő)
1
2,40
2
3,36
3
4,53
4
5,67
Az egyszobás lakásokban élő személyek átlagos száma például:
A tapasztalati regressziófüggvény a két ismérv közötti kapcsolatra vonatkozó – a jelenlegi elemzési helyzetben a korrelációs táblába foglalt – információt egyetlen statisztikai sorba ( -hez rendelt részátlagok sorozata) sűríti. Egyértelműen láthatóvá vált, hogy a két ismérv között van korreláció, mégpedig pozitív irányú korreláció. (A szobaszámok nagyobb értékeihez az átlagos lakószám növekvő értékei tartoznak.) A tapasztalati regressziófüggvény nemcsak a korreláció létezésének kimutatására alkalmas, hanem a kapcsolat lényegét, természetét is tömören kifejezi. Grafikusan is ábrázolható a
pontokat összekötő vonaldiagram formájában, ahol
vagy az
ismérvérték, vagy az X
szerint képzett i-edik osztályköz osztályközepe. A pontokat összekötő szakaszoknak mint függvényértékeknek ugyan nincs statisztikai jelentése, ennek ellenére a statisztikai gyakorlatban e pontokat összekötjük. Így alkothatunk szemléletesebb képet a két mennyiségi ismérv közötti sztochasztikus kapcsolat jellegéről, tendenciájáról. 167
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése A tapasztalati regressziófüggvényt célszerű az egyedi értékadatok alapján (a két mennyiségi ismérvnek a sokaság egyes egységeit jellemző, összetartozó értékpárjai alapján) készített pontdiagrammal közös koordináta-rendszerben ábrázolni. A vonaldiagram és a ponthalmaz kölcsönös helyzete tájékoztat a korrelációs kapcsolat szorosságáról is. Példánkban 50 lakást figyeltünk meg egyidejűleg a szobák száma (X) és a lakásban élő személyek száma (Y) szerint. Minden lakást jellemez egy szobaszámés egy lakószámadat. Az összetartozó értékeket derékszögű koordináta-rendszerben egy-egy pontként ábrázolva készítjük el a korrelációt szemléltető pontdiagramot és ugyanebben a koordináta-rendszerben ábrázoljuk a tapasztalati regressziófüggvényt (3.6. ábra).
3.6. ábra - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat
A korreláció szorosságának mérése A csoportosított adatokból kiinduló korrelációelemzés során a kapcsolat szorosságának mérése a vegyes kapcsolat szorosságának mérésével analóg módon történik. Ha az osztályozást X ismérv szerint végezzük, úgy az Y értékekre vonatkozó részátlagokhoz ( ) és főátlaghoz ( ) háromféle szórásnégyzet kapcsolódik. Az Y belső szórásnégyzete a függő változó (Y) szórásnégyzetéről van szó.) Közöttük a
az Y külső szórásnégyzete
168
az Y teljes szórásnégyzete
(Az Y arra utal, hogy
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése összefüggés áll fenn.
A szórásnégyzet-hányadoshoz hasonlóan képezhetjük a ún. determinációs hányadost. Megkülönböztetésül, a helyen a „szóródó”, a második helyen a csoportosító ismérvet tüntettük fel.
indexében első
A determinációs hányados azt mutatja meg, hogy az X ismérv mekkora hányadát magyarázza meg az Y ismérv szórásnégyzetének. Szokás %os formában is kifejezni. A korreláció szorosságának mérésére használhatjuk a determinációs hányados négyzetgyökét, a
A korrelációs hányados a szórásnégyzet-hányadoshoz hasonlóan a
közötti intervallumban vehet fel értéket.
Függvényszerű kapcsolat esetén : A korreláció hiánya esetén: Korreláció esetén: Ha az oksági kapcsolat nem egyirányú, akkor logikailag indokolt lehet, hogy az X ismérvnek az Y ismérv szerinti szorossági mérőszámait számítsuk ki, vagyis a
Ebben az esetben az X a „szóródó” ismérv, az Y pedig a csoportosító ismérv szerepét tölti be. Ha az X és az Y közötti kapcsolat sztochasztikus, akkor általában a kétféle megközelítésből számított mutatószámok nem egyeznek meg: 169
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
Ha az ismérvek (változók) függetlenek, akkor abból, hogy Ha
(ekkor
Ez azt is jelenti, hogy a tapasztalati regressziós függvény állandó. Fordítva nem igaz:
is nulla), nem következik a függetlenség.
akkor azt mondjuk, hogy az ismérvek (változók) korrelálatlanok. A korrelálatlanság is szimmetrikus reláció.
Függvényszerű kapcsolat esetén, mint az előző pontban is láttuk, Vizsgáljuk meg a lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat szorosságát. A kapcsolat szorosságának jellemzésére kiszámítjuk a
determinációs hányadost és a
korrelációs hányadost. E mutatószámok meghatározásához szükség van a Y ismérv
főátlagára, a megfigyelt lakásokban élő személyek átlagos számára ( ), a
külső szórásnégyzetre, a
Egy lakás lakóinak átlagos száma (a főátlag):
(Természetesen az
kiszámítható az
részátlagok súlyozott átlagaként is.)
A külső szórásnégyzet:
Az előző lépésben kiszámított főátlag, valamint a 3.34. táblázatban közölt részátlagok alapján:
A teljes szórásnégyzet: 170
teljes szórásnégyzetre.
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
A 3.33. táblázat adatai és a kiszámított főátlag alapján:
A determinációs hányados:
kifejezhető százalékos formában:
= 42,0%.
Ez úgy értelmezhető, hogy a lakásokban levő szobák száma 42%-ban magyarázza meg a lakásokban élő személyek számának szóródását. (A fennmaradó 58% a szobaszámon kívüli, egyéb, most nem vizsgált tényezők hatása.) A korrelációs hányados
A szorossági mérőszám alapján megállapítható, hogy a szobák száma és a lakásokban élő személyek száma között közepes erősségű sztochasztikus kapcsolat van. A következőkben – a részletes számítás mellőzésével – felírjuk az ismérvek (a változók) felcserélésével értelmezett – X-nek Y-ra vonatkozó – tapasztalati regressziófüggvényét (3.35. táblázat) és az ehhez rendelhető
determinációs hányadost és
korrelációs hányadost.
3.35. táblázat - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye Lakószám (fő) Átlagos szobaszám
171
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése
1
1,50
2
1,80
3
2,08
4
2,40
5
3,33
6
3,14
7
3,50
Az X-nek Y-ra vonatkozó tapasztalati regressziófüggvénye is jelzi, hogy pozitív irányú kapcsolat van az ismérvek között. A
pedig közepes erősségű kapcsolatra utalnak. A számítások ellenőrzését az olvasóra bízzuk.
3.5. Gyakorlófeladatok 1. Szerkesszünk olyan statisztikai táblát (adatok nélkül), amely tartalmazza a Magyarországon bejegyzett fuvarozócégek 1994. I. és II. félévi teljesítményeit (félévenként, külön-külön) a szállítás módja (közúti, vasúti, légi és egyéb) és cégforma (vállalat, gazdasági társaság, magánfuvarozó) szerint! Elemezzük a megszerkesztett táblát! Állapítsuk meg típusát, dimenziószámát, sorait! 2. Szerkesszünk (adatok nélkül) olyan statisztikai táblát, amely a fogyasztói árak alakulását mutatja 1985-höz viszonyítva napjainkig kiadási főcsoportok (élelmiszerek, élvezeti cikkek, ... egyéb iparcikkek és szolgáltatások) szerint! 3. A népességgel kapcsolatos adatok Magyarországon: Megnevezés
1990
1993
1990=100% 172
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Népesség (ezer fő)*
10 375
10 310
99,37
Nők száma (ezer fő)*
5 390
5 367
99,57
125 679
111 033
88,35
Élveszületések száma (fő) *Január 1-jei adatok. Feladat:
a) Állapítsuk meg a tábla típusát és dimenziószámát! b) Elemezzük a népesség nemek szerinti összetételét és a dinamikai változást! c) Számítsuk ki az ezer férfira jutó nők számát! Vizsgáljuk a változást! d) Számítsunk nyers és tisztított születési arányszámokat! Elemezzük a változást! 4. Két megyében az orvosok és a lakosok számára, valamint az orvosellátottság mutatószámaira vonatkozóan az alábbi adatokat ismerjük: Adatok: főben Megye
Orvosok száma
Lakosok száma
Egy orvosra jutó lakosok száma
Tízezer lakosra jutó orvosok száma
A
640
...
312,5
...
B
...
400 000
...
35
Feladat: a) Számítsuk ki a hiányzó adatokat és mutatószámokat! b) Vonjunk le következtetéseket! 5. Néhány ország jellemző adata 1992-ben: Megnevezés
Magyarország
173
Ausztria
Spanyolország
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Évközepi népesség (millió fő) 2
Terület (1000 km )
10,31
7,88
39,08
A főváros népessége (1000 fő)
93,0
83,9
504,8
A születéskor várható átlagos élettartam (év)
2016
1505
3108
a férfiaknál
64,6
72,6
73,1
a nőknél
73,7
79,2
79,6
Aktív keresők (1000 fő)
4242
3536
150073
100 aktív keresőre jutó eltartott és inaktív
143
...
...
kereső
663
193
2260
A munkanélküliek száma (1000 fő)
–4,5
1,5
1,0
A GDP változása (1992/91, %) Feladat: a) Elemezzük a tábla adatait a megadott és a még kiszámítható viszonyszámok alapján! b) Végezzünk területi összehasonlítást! 6. A környezeti feltételeket jellemző néhány adat 1992-ben: Adatok:1000 m Megnevezés
Debrecen
Pécs
Erdő
346
8260,0
Park
2935
3210,0
Összes zöldterület
3281
11 470,0
15,1
67,0
200
255,0
Egy lakosra jutó zöldterület
2
174
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése A játszóterek területe Feladat: Hasonlítsuk össze a két várost a környezeti feltételek szempontjából! 7. Magyarország népességére és a villamosenergia-termelés alakulására vonatkozóan az alábbi adatokat ismerjük: Év
Népesség száma az év elején (ezer fő)
Villamosenergia-termelés
1988
10 464
100,0
1989
10 421
101,4
1990
10 375
97,2
1991
10 355
102,6
1992
10 337
107,0
1993
10 310
111,8
1988=100%
A széntermelés 1988-ban 20 875 ezer tonna volt, ami 1993-ra 60,3%-ra csökkent. Feladat: a) Hogyan alakult évről évre az 1 főre jutó villamosenergia-termelés? b) Mennyi volt 1993-ban az 1 főre jutó széntermelés? c) Évente átlagosan hány %-kal változott (nőtt, csökkent) – az 1 főre jutó villamosenergia-termelés, – az 1 főre jutó széntermelés? d) A kiszámított változási tendenciát feltételezve mennyi a várható termelés ezen ipari termékekből 1996-ban? (1993-ban 32 630 millió kWh villamos energiát állítottak elő.) 175
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése 8. A népesség megoszlása gazdasági aktivitás szerint január 1-jén: Népességcsoportok
1990
1991
1992
Munkavállalási kornál fiatalabb
2 130,5
2 063,7
2 009,8
Munkavállalási korú
5 956,8
5 997,4
6 031,4
Nyugdíjas korú
2 287,5
2 293,7
2 296,0
Összesen
10 374,8
10 354,8
10 337,2
Feladat: a) Nevezzük meg a tábla típusát és sorait! b) Számítsuk ki, hogyan változott a munkavállalási korú népesség 1990-hez képest, illetve évről évre! c) Számítsunk megoszlási viszonyszámokat 1990-ben és 1992-ben! Hasonlítsuk össze a két időszakot! d) Számítsuk ki, hogy hány %-kal változott a népesség az egyes csoportokban és együttesen! e) Hasonlítsuk össze a szerkezet- és dinamikai változást! 9. A gazdaságilag aktív népesség adatai Magyarországon: Csoportok
1990. január 1.
1993as év az 1990. év
1993. január 1.
Ezer fő
%
Ezer fő
%
%-ában
4795,2
87,2
3866,9
...
...
244,7
4,5
262,1
...
...
Foglalkoztatott nyugdíjasok
432,0
7,9
223,0
...
...
Foglalkoztatottak együtt
5471,9
99,6
4352,0
...
...
24,2
0,4
663,0
...
...
5496,1
100,0
5015,0
100,0
91,25
Aktív keresők GYES-en, GYED-en lévők
Munkanélküliek Összesen
176
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Feladat: Számítsuk ki a hiányzó adatokat, és vonjuk le következtetéseket a szerkezet- és dinamikai változásra vonatkozóan! 10. Vállalkozásokat vizsgálunk jövedelmezőségük alapján két egymást követő évben. Az eredményeket az alábbi tábla tartalmazza: 1994-ben
Alacsony
Közepes
Magas
Összesen
Alacsony
100
80
–
180
Közepes
60
90
10
160
Magas
–
30
30
60
160
200
40
400
1993-ban
Összesen Feladat: a) Töltsük ki a tábla adatait:
1. függvényszerű kapcsolat feltételezésével, 2. függetlenséget feltételezve! b) Számítsuk ki a Csuprov- és a Cramer-féle együtthatót a tényleges helyzetnek megfelelően! Értelmezzük a kapott eredményt! 11. Valamely városban a kereskedelmi szálláshelyek vendégforgalmát a szállás típusa és a turisták lakhelye szerint vizsgáltuk. A megfigyelt adatok 1994-ben 1000 főben a következők voltak: Szállás típusa
Belföldi
Külföldi
Együtt
Szálloda
50
150
200
Turistaszállás
30
10
40
Kemping
60
120
180
Fizető-vendéglátás
160
220
380
Együtt
300
500
800 177
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Feladat: a) Vizsgáljuk a sokaság megoszlását különböző módokon! Vonjunk le következtetéseket! b) Számítsuk ki a két ismérv kapcsolatát jellemző szorossági mérőszámokat! 12. Főiskolai hallgatók lakáshelyzetét és havi kiadásuk nagyságát vizsgáltuk. A szüleinél lakó 8 hallgató havi kiadásai Ft-ban: 1300; 1800; 2000; 2000; 2800; 3000; 3100 és 4000 Ft. A kollégisták adatai: 2500; 3000; 3000; 3100; 3300; 3500; 3800; 4000; 4000; 4400 és 5000 Ft. Az albérletben lakók havi kiadásai pedig: 4000; 4800; 5000; 5000 és 5200 Ft. Feladat: a) Számítsuk ki az átlagos havi kiadást a különböző lakáshelyzetű hallgatói csoportokban! Vonjunk le következtetéseket! b) Vizsgáljuk a szóródást különböző módokon! c) Számítsuk ki, hogy: – a szóródás milyen mértékben magyarázható a lakáshelyzettel, – milyen szoros kapcsolat van a lakáshelyzet és a havi kiadások nagysága között! 13. Egy tanulócsoport 15 hallgatójánál megvizsgáltuk, hogy van-e összefüggés a matematikafelvételin elért összpontszám és a felkészülés között. (Járt-e előkészítő tanfolyamra vagy sem.) A vizsgálat eredményéből a következő számítási eredmények ismertek: Csoport
Létszám (fő)
Átlagos pontszám
Szórás
Előkészítős
15
26
2,61
Nem előkészítős
10
20
4,43
Összesen
15
...
... 178
A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése Feladat: a) Számítsuk ki a teljes szórásnégyzetet és a szórást! b) Vizsgáljuk a felkészülés módja és a pontszám közötti kapcsolat szorosságát! c) Írjuk le a
jelentését!
14. Egy 25 pontos statisztika-zárthelyi eredményei: Feladatsor
Hallgatók száma Átlagos pontszám
Relatív szórás (%)
A
11
17,00
16,47
B
8
16,25
31,63
C
6
18,30
18,03
25
...
...
Összesen Feladat:
a) Számítsuk ki az összes – belső eltérésnégyzetet, – külső eltérésnégyzetet, – teljes eltérésnégyzetet! b) Határozzuk meg a belső, a külső és a teljes szórást! c) Számítsuk ki, hogy a feladatsorok „nehézsége” és az elért pontszám között milyen szoros a kapcsolat! d) A pontszámok ingadozását, szóródását hány %-ban befolyásolja az, hogy melyik feladatsort írta a hallgató?
179
4. fejezet - Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása 4.1. A standardizálás módszere Ha valamilyen jelenség színvonalát (pl. termékek önköltségét, lakosok orvosellátottságát, munkavállalók átlagbérét stb.) akarjuk jellemezni, akkor erre a célra a 3. fejezetben megismert intenzitási viszonyszámokat használhatjuk fel. Ha a sokaság a vizsgált színvonal szempontjából heterogén, akkor a vizsgálatot a heterogenitást előidéző ismérv megfelelő homogén csoportjaira is el kell végezni. A sokaság egészére számított intenzitási viszonyszámokat összetett intenzitási viszonyszámoknak neveztük és jelöltük, a csoportokra pedig intenzitási részviszonyszámokat számítottunk és azokat
jelöltük. Ha a vizsgált színvonalat átlaggal fejeztük ki, akkor a sokaság egészére főátlagot ( ), a homogén csoportokra pedig
részátlagokat ( ) számítottunk. Beláttuk, hogy az átlagos színvonalat kifejező mutatókat (összetett intenzitási viszonyszám, illetve főátlag) két tényező befolyásolja: 1. milyen az egyes csoportokban a vizsgált színvonal nagysága, 2. milyen a sokaság szerkezete, összetétele. Fejezetünkben azzal foglalkozunk, hogy hogyan történik az átlagos színvonal térbeli különbözőségének vagy időbeli változásának vizsgálata. Látni fogjuk, hogy a heterogenitás figyelembevétele ebben az esetben még fontosabb. Előfordulhat ugyanis, hogy nemcsak a vizsgált színvonal (önköltség, orvosellátottság, átlagbér) változik két időszak között, hanem a csoportosító ismérv szerinti összetétel is. (Pl. a különböző önköltséggel dolgozó üzemek termelésének, eltérő ellátottságú települések lakosainak, különböző átlagkeresetű dolgozók létszámának aránya.) Így előfordulhat, hogy minden csoportban csökken a részátlag (pl. az átlagbér), a főátlag (a sokaság egészére számított átlagbér) mégis nő. Ha térbeli összehasonlítást végzünk (pl. két vállalkozást hasonlítunk össze), akkor az eltérésekre (különbségekre) irányítjuk figyelmünket. Tekintsük a következő példát (4.1. táblázat). Két vállalkozásnál hasonlítjuk össze a dolgozók átlagos havi jövedelmét. A-nál 45 E Ft, B-nél 40 E Ft. Ebből megállapíthatjuk, hogy B-nél 5 E Ft-tal kevesebb az átlagos jövedelem. E megállapítás fedi a valóságot, de hogy elemzésünk kielégítő legyen, a különbség okait, tényezőit is vizsgálnunk kell. Valóban rosszabbak-e a kereseti lehetőségek B-nél? Nemek szerint is vizsgálva a jövedelmeket bővítsük a példát:
4.1. táblázat - Jövedelem- és létszámadatok két vállalkozásnál A Nem
Összes jövedelem
B Létszám (fő)
Összes jövedelem
180
Létszám (fő)
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása (ezer Ft)
(ezer Ft)
Férfi
2400
50
1000
20
Nő
300
10
1000
30
Összesen
2700
60
2000
50
Átlagos jövedelem A-nál: Férfiak: Nők: Együtt: Átlagos jövedelem B-nél: Férfiak: Nők: Együtt: Megállapíthatjuk, hogy B vállalkozásnál mind a férfiak, mind a nők jobban keresnek, mint A-nál. (A férfiak átlagos jövedelme 2 E Ft-tal, a nőké 3,3 E Ft-tal magasabb.) Ez a megállapítás látszólag ellentmond annak, hogy B-ben alacsonyabb az átlagos jövedelem. Két összetett intenzitási viszonyszám (főátlag) eltérése azonban nem magyarázható meg egyedül az intenzitási részviszonyszámok (részátlagok) eltérésével. Az eltérésben a nemek szerinti eltérő összetétel is szerepet játszik. Példánkban A-nál a magasabb jövedelmű férfiak aránya 83% B-nél pedig csak 40% módszerével történik.
,
. Ahhoz, hogy megállapításaink helytállók legyenek, külön kell választanunk e két ok hatását. Ez a standardizálás
181
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása A standardizálás módszerével a térben (illetve időben) eltérő összetett intenzitási viszonyszámok (főátlagok) közötti különbséget (vagy hányadost) összetevőkre (illetve tényezőkre) bontjuk. A standardizálás módszerét Kőrösy József (1844–1906) magyar származású statisztikus (demográfus) dolgozta ki és alkalmazta először. Különböző területeken élők korcsoportos halálozási arányszámait (1000 lakosra jutó halálozások száma egy adott területen vagy időszakban) vizsgálta, hasonlította össze. E tevékenysége során jött rá arra, hogy helytelen következtetések levonásához vezet az, ha csak az átlagos halálozási arányszámok alapján végzi el az összehasonlítást. Ugyanis az egyes népességcsoportok életkörülményein, egészségügyi ellátásának színvonalán kívül a halálozások számát nagymértékben befolyásolja a népesség életkor szerinti összetétele is. Tudott dolog, hogy a csecsemőkortól (0–1 éves kor) eltekintve, minél idősebb korosztályt vizsgálunk, rendszerint annál nagyobb a halálozások előfordulása. Tehát olyan népességcsoportoknál, ahol kedvezőbb életkörülmények, jobb orvosi ellátás hatására magasabb az átlagos életkor – ennélfogva nagyobb arányú az idősebb korosztály népességen belüli aránya –, magasabb lehet az átlagos halálozási arányszám, mint egyéb, kedvezőtlenebb körülmények között élő népességcsoportoknál, annak ellenére, hogy az egyes korosztályoknál valószínűleg ellentétes irányú eltérés tapasztalható. A felismert probléma megoldására dolgozta ki Kőrösy József a standardizálás módszerét. A különböző területek népességének átlagos halálozási arányszámát úgy értelmezte, mint az egyes életkorcsoportok halálozási arányszámainak összetett intenzitási viszonyszámát, melyet a részviszonyszámok nagysága és a népesség kor szerinti összetétele, megoszlása együttesen határoz meg. A két tényező hatását pedig úgy választotta el egymástól, hogy egy-egy tényező hatásának elemzésekor a másik tényezőt standardnak (állandónak) tételezte fel. Az összetett intenzitási viszonyszámok (illetve főátlagok) térbeli összehasonlításánál azt vizsgáljuk, hogy azok mennyivel térnek el egy másik, azonos módon csoportosított statisztikai sokaság összetett intenzitási viszonyszámától (vagy főátlagától), azaz a különbségeket képezzük. Az időbeli elemzés során azt elemezzük, hogy az összetett intenzitási viszonyszám (vagy főátlag) hány %-kal változott az egyik időszakról a másik időszakra, azaz a hányadosokat számítjuk ki. Ismeretes, hogy az intenzitási viszonyszám és a számtani átlag között igen közeli a rokonság. Ugyanazt a színvonalmutatót általában kifejezhetjük viszonyszámként vagy átlagként, attól függően, hogy milyen adatokból számítottuk. Ebből következik, hogy megállapításaink mindkét mutatószámra vonatkoznak. Ebben a fejezetben elsősorban olyan problémákat tárgyalunk, amelyek intenzitási viszonyszámokkal jellemezhetők. Ezért a továbbiakban a módszert az intenzitási viszonyszámokra mutatjuk be, és a elmondunk, az átlagokra is érvényes.
alapképletnek megfelelő jelöléseket használjuk. De mindaz, amit
Tekintsük át az adatbázist és a kiszámítható mutatószámokat a 4.2. táblázat szerinti formában:
4.2. táblázat - Két összetett intenzitási viszonyszám meghatározása és összehasonlítása Összehasonlítandó területek, illetve időszakok Vizsgált
„0”
„1”
Különbség Hányados 182
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása csoportok 1 2 j M Vizsgált sokaság
K
I
ahol a táblázat két utolsó oszlopában a részviszonyszámok összehasonlítására szolgáló helyeztük el. Az összesen sorban pedig a
különbség és az
különbségeket és az
hányadosokat
hányados szerepel.
A két szóban forgó ok hatását oly módon fogjuk kimutatni, hogy a két összehasonlítandó összetett viszonyszám közötti (K) tényleges különbséget, illetve a két mutató tényleges hányadosát (I) úgy bontjuk fel két részre, hogy: 1. a illetve a megfelelő részviszonyszámok közötti különbségeknek, illetve a hányadosaiknak a két összetett viszonyszám különbségére, illetve hányadosára gyakorolt hatását, a illetve pedig a két sokaság eltérő összetételének a két összetett viszonyszám különbségére, illetve hányadosára gyakorolt hatását mutassa; 2. teljesüljön továbbá, hogy az egyes hatásokat kifejező különbségek összege a teljes különbséggel egyenlő: pedig az összetett viszonyszámok hányadosával egyenlő: . A különbségfelbontást elsősorban térbeli, a hányadosfelbontást pedig időbeli összehasonlításnál használjuk.
183
A hányadosok szorzata
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása
4.2. Az összetett intenzitási viszonyszámok (főátlagok) különbségének felbontása összetevőire A statisztikai elemzésben gyakran kerül sor valamilyen jelenség átlagos színvonalának térbeli összehasonlítására. Az összehasonlítás korlátozódhat az eltérés irányának megállapítására, amikor csak azt vizsgáljuk, hogy a két összetett intenzitási viszonyszám közül melyik a nagyobb. Ezzel azonban rendszerint nem elégszünk meg, hanem amint azt az előző pontban tárgyaltuk, az eltérést előidéző tényezők számszerű hatását a standardizálás módszerével kimutatjuk. Tekintsük a következő példát (4.3. táblázat):
4.3. táblázat - Két ország halandósági viszonyainak alakulása (fiktív adatok) A ország („0”) Korcso-portok (év)
Meghaltak száma (fő)
Lakosság (millió fő)
B ország („1”) Halálozási Meghaltak arányszám
száma
(‰)
(fő)
Lakosság (millió fő)
Arány-
Halálozási
számok
arányszám
különbsége
(‰)
(‰)
0 −14
25 200
1,8
14,0
9 460
1,1
8,6
–5,4
5 − 14
1 900
3,8
0,5
880
2,2
0,4
–0,1
15 − 39
11 200
8,0
1,4
7 280
5,6
1,3
–0,1
40 − 59
26 400
4,0
6,6
24 700
3,8
6,5
–0,1
60 −11
124 800
2,4
52,0
117 990
2,3
51,3
–0,7
Összesen
189 500
20,0
...
160 310
15,0
...
...
Halálozási arányszám (1000 lakosra jutó halálozások száma) =
184
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása B ország átlagos halálozási arányszáma:
Egyszerűbben írva:
1
Súlyozott számtani átlag formában :
A ország átlagos halálozási arányszáma:
Egyszerűbben írva:
Súlyozott számtani átlag formában: 1
A „súlyok” szerepét a relatív súlyok (megoszlási viszonyszámok) is betölthetik (lásd itt is a 3.3.1. pontban leírtakat).
185
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása
Példánkban: K = 10,7‰ – 9,5‰ = 1,2 ‰. B országban tehát 1,2 ezrelékponttal nagyobb a halálozási arányszám. Ha csak ezt az arányszámot ismernénk, azt gondolnánk, hogy B országban lényegesen rosszabbak az életkörülmények és az egészségügyi viszonyok. Ha azonban a korcsoportos halálozási arányszámokat vizsgáljuk (lásd a 4.3. táblázat adatait), egészen más következtetésre jutunk, mert B országban minden egyes korcsoportban alacsonyabb a halálozási arányszám. E feltűnő ellentmondás magyarázata abban van, hogy B országban magasabb a viszonylag magas halandóságú idősebb korúak aránya. A standardizálás módszerével kimutatjuk, hogy a megállapított 1,2 ezrelékpontos különbséget milyen mértékben magyarázhatjuk a korcsoportonkénti halálozási arányszámok eltéréseivel a népesség eltérő korösszetételével
, illetve
.
4.2.1. A részviszonyszámok (részátlagok) különbözőségének hatása Ahhoz, hogy a részviszonyszámok különbözőségének hatását kimutathassuk, az összetétel szempontjából összehasonlíthatóvá tesszük a két összetett intenzitási viszonyszámot. Ezt úgy érjük el, hogy mindkettőt standard (azonos, állandó) összetétellel számítjuk ki.
ahol:
a j-edik csoport standard súlya, részaránya. 2
Egyszerűbben írva : 2
A továbbiakban az egyszerűbb formát használjuk, tehát nem tüntetjük fel a szummációs határokat.
186
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása
A részhatáskülönbség azt fejezi ki, hogy csupán a megfelelő részviszonyszámok eltérése milyen hatást gyakorolt az összetett intenzitási viszonyszámok eltérésére. Példánkban a B ország lakossági adatait választjuk standardnak
.
B ország összetett viszonyszáma nem változik:
A ország összetett viszonyszáma, ha súlyként a B ország megoszlási gyakoriságait használjuk (ez a standard), pedig:
A két arányszám különbsége:
Megállapíthatjuk, hogy 0,6 ezrelékponttal alacsonyabb az átlagos halálozási arányszám amiatt, hogy minden korcsoportban alacsonyabbak az arányszámok (lásd a 4.3. táblázat utolsó oszlopát). A
az intenzitási részviszonyszámok különbségeinek
átlagaként is értelmezhető és kiszámítható:
Példánkban:
187
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása Mivel a átlag, ezért a mindig a és a eltérés –0,1 (pl. az 5−14 éves korcsoportnál).
között helyezkedik el. Példánkban a legkisebb eltérés –5,4 (az első korcsoportban), a legnagyobb
4.2.2. Az összetétel különbözőségének hatása Ahhoz, hogy az összetétel különbözőségének hatását ( ) kimutathassuk, a vizsgált színvonal szempontjából összehasonlíthatóvá tesszük a két összetett intenzitási viszonyszámot. Ezt úgy érjük el, hogy mindkettőt standard részviszonyszámok feltételezésével számítjuk ki.
ahol
az egyes csoportok standard részviszonyszáma.
A összetételhatás-különbség azt fejezi ki, hogy csupán az összetétel különbözősége milyen hatást gyakorolt az összetett intenzitási viszonyszámok eltérésére. Ennek a tényezőnek a hatását példánkban úgy tudjuk kimutatni, ha mindkét ország halálozási arányszámát azonos részviszonyszámok (korcsoportonkénti halálozási arányszámok) figyelembevételével számítjuk ki és azután megállapítjuk a különbségüket. Megoldásunkat úgy folytatjuk, hogy az A ország korcsoportonkénti halálozási arányszámait tekintjük standardnak (
).
B ország együttes viszonyszáma:
A ország együttes arányszáma nem változik:
A kimutatott pozitív előjelű 1,8‰ azt jelenti, hogy B országban, kizárólag abból adódóan, hogy a lakosság nagyobb hányadát teszik ki az idősebbek, 1000 lakosra 1,8 ezrelékponttal több halálozás jutott. 188
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása Ha a standard adatsorokat úgy választjuk meg, hogy A ország lakosság-összetételét és B ország korcsoportonkénti halálozási arányszámait vesszük standardnak (tehát az előzőekkel éppen ellentétesen), az országos halálozási arányszámok különbségének felbontására (a számítások mellőzésével) az alábbieredményeket kapjuk:
A kétféle standard adatsor választása esetén a és számszerű eredménye ugyan eltér egymástól, de tendenciájukban hasonló módon mutatják az egyes tényezőknek a különbség kialakításában játszott szerepét. Ha
számításánál B ország a standard, akkor
számításánál A országot kell standardnak venni (és fordítva). Ugyanis ekkor
mivel a két középső tag kiesik. A 4.1. pontban szereplő problémafelvető példánk megoldását (
és
kiszámítását) az olvasóra bízzuk.
4.3. Indexszámítás standardizálás alapján (hányadosfelbontás) Ha a tényleges, illetve (valamelyik tényező kimutatásának céljából) standardizált összetett intenzitási viszonyszámoknak nem a különbségét, hanem a hányadosát képezzük, összehasonlító dinamikus viszonyszámokat kapunk. Ezeket összetettségük, komplex tartalmuk miatt indexeknek nevezzük. 189
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása
A tényleges összetett intenzitási viszonyszámok hányadosát főátlagindexnek, a standard összetétellel számított hányadost ( ) 3 részátlagindexnek, a standard részviszonyszámokkal számított hányadost ( ) pedig összetételhatás-indexnek nevezzük. Az indexek számítását a következő példán mutatjuk be (4.4. táblázat).
4.4. táblázat - Egy megye forgalmi és népességadatai az 1994. és 1995. évben 1994. év
Település
Ipari
Lakosság 1 lakosra jutó forg. (1000 (1000 Ft) fő) (Ft/fő)
Forgalom
640 000
Mezőgaz-dasági 1 440 000 Összesen
1995. év
2 080 000
Forgalom
Lakosság
(1000 Ft)
(1000 fő)
1 lakosra jutó forgalom
1 lakosra jutó forg.
változása
(Ft/fő)
(1994=100%)
160
4000,0
774 000
180
4300,0
107,5
480
3000,0
1 408 000
440
3200,0
106,7
640
3250,0
2 182 000
620
3519,4
...
4.3.1. A főátlagindex A főátlagindex azt fejezi ki, hogy az intenzitási viszonyszámmal kifejezhető átlagos színvonal hogyan változott egyik (bázis-) időszakról a másik (tárgy-) időszakra. Példánkban az 1 lakosra jutó kereskedelmi forgalom változását vizsgáljuk.
A főátlagindexet háromféle módon is kiszámíthatjuk: 1. A viszonyszámtört számlálójának és nevezőjének ismeretében 3
A szakirodalomban és néhány korábbi tankönyvben használatos terminológia szerint: I: változó állományú index; I': változatlan állományú index; I'': arányeltolódási index.
190
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása
2. A viszonyszámtört számlálójának és nevezőjének összetett dinamikus viszonyszáma alapján:
A forgalom változása: A lakosság számának változása:
3. A részviszonyszámok súlyozott számtani átlagai alapján:
Mindhárom számítás ugyanarra az eredményre vezet. Míg az első kettőnek gyakorlati jelentősége van, addig a harmadik számítási forma bizonyítja, hogy a főátlagindex nagyságát két tényező befolyásolja: a) az intenzitási részviszonyszámok változása, b) az eltérő színvonallal jellemzett sokaság szerkezetének, összetételének változása. A megyei átlagos 1 lakosra jutó forgalom 8,3%-os növekedését két tényező okozta: 191
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása a) a településenkénti 1 lakosra jutó forgalomnak 7,5%-os, illetve 6,7%-os növekedése, valamint b) a lakosság településforma szerinti összetételének megváltozása.
4.3.2. A részátlagindex A részátlagindex a részviszonyszámok változásának az összetett viszonyszám változására gyakorolt hatását fejezi ki. Eltekint a sokaság összetétel-változásától. Ezért a részátlagindexet változó részviszonyszámokkal és standard összetétellel képzett hányadosként számítjuk ki. Mindig a tárgyidőszak tényleges összetételét tekintjük standardnak
.
Számítása tehát az alábbi módokon történhet: 1. A standardizált összetett intenzitási viszonyszámok hányadosaként:
4
2. Aggregát formában : Az előző képletet
-gyel egyszerűsítve kapjuk az aggregát formát:
Példánkban:
4
Az 5. fejezetben ismertetésre kerülő indexek analógiájára. Jelentését lásd ott.
192
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása 3. Az aggregát forma átalakításával:
a) A csoportok színvonalváltozásainak (az egyedi indexeknek,
) súlyozott számtani átlagaként:
Példánkban:
b) A csoportok színvonalváltozásainak súlyozott harmonikus átlagaként:
Példánkban
Megállapíthatjuk, hogy az 1 lakosra jutó forgalom értékének településtípusonkénti növekedése 7,0%-kal növelte a megyei 1 lakosra jutó forgalmat. A részátlagindex mindenkor a legnagyobb és legkisebb egyedi indexek ( ) között foglal helyet, mivel azok súlyozott átlaga. A főátlagindex, mivel a részátlagok változásán kívül a sokaság összetétel-változásának hatását is tartalmazza, kerülhet az egyedi indexek közé, de mutathat az egyedi indexeknél nagyobb vagy kisebb százalékos változást is. (A képletek jobb megértéséhez tekintsük át ismét a 4.2. táblázatban közölt jelölésrendszert!) 193
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása
4.3.3. Az összetételhatás indexe Az összetételhatás indexe megmutatja, hogy a részsokaság összetételében bekövetkezett változás milyen hatást gyakorolt az összetett intenzitási viszonyszám változására. Az összetételhatás indexének számításánál mindig a bázisidőszak részviszonyszámait vesszük standardnak
.
Számítási képlete a standardizált összetett intenzitási viszonyszámok hányadosaként:
Példánkban:
Megállapíthatjuk, hogy az összetétel-változás (1,2%-os mértékben) növelte az egy lakosra jutó forgalmat. Ha a részátlagindex számításánál a tárgyidőszakot vettük standardnak, akkor ebből már következik, hogy itt a bázisidőszaknak kell standardnak lenni, mert ekkor igaz, hogy
azaz főátlagindex = részátlagindex · összetételhatás-index
Még egyszer hangsúlyozzuk, hogy az egyenlőség fennállásának feltétele, hogy az intenzitási részviszonyszámokkal számoljuk. (Vagy fordítva:
-t
adatsorral; 194
-t pedig
-t tárgyidőszaki összetétellel, az adatsorral.)
-t pedig bázisidőszaki
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása Ebből következik, hogy:
Leggyakrabban az össszetétel-változás hatását számítjuk közvetett úton. Példánkban:
Hogy az összetétel hogyan változott, azt a 4.5. táblázat szemlélteti megoszlási viszonyszámokkal.
4.5. táblázat - A lakosság összetételének változása A megye népessége Település
1994-ben
1995-ben
ezer főben
%-ban
ezer főben
%-ban
Ipari
160
25
180
29
Mezőgazdasági
480
75
440
71
Összesen
640
100
620
100
A megoszlási viszonyszámok alátámasztják előbbi megállapításunkat. A megye népességén belül megnőtt az ipari települések népességének aránya, ahol (érthetően) nagyobb az 1 főre jutó kereskedelmi forgalom.
4.4. Alkalmazási területek A statisztikai elemzésben a standardizálás módszerét a gazdaságstatisztika és a népességstatisztika számos területén alkalmazzák. Az ismertetett módszerek segítségével vizsgálhatjuk pl. a munka termelékenységének, a termékek önköltségének, a költségszínvonalnak, a termésátlagoknak, a születési és halálozási arányszámoknak, az egy főre jutó fogyasztásnak az alakulását. Jelentős alkalmazási terület továbbá az átlagos bérek, jövedelmek alakulásának vizsgálata is. Az árak statisztikai elemzésének bizonyos területe is e témakörhöz kapcsolódik. A továbbbiakban e két utóbbi alkalmazást mutatjuk be. 195
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása
4.4.1. Az átlagbérek időbeli változásának vizsgálata Az átlagbérek (pl. az egy főre jutó bruttó vagy nettó bér) időbeli változását általában állománycsoportonként, szakmánként, területi egységenként vizsgáljuk, ezek együttes, átlagos változását indexmódszerrel elemezhetjük. Vizsgáljuk meg az átlagbérek alakulását egy vállalkozásnál 1994. és 1995. január hónapjában (4.6. táblázat).
4.6. táblázat - Egy vállalkozás munkaügyi adatai 1994. január
1995. január
Béralap
Létszám
Béralap
Létszám
(1000 Ft)
(fő)
(1000 Ft)
(fő)
Fizikai
28 800
800
33 660
850
Nem fizikai
6 000
150
4 400
100
Együtt
34 800
950
38 060
950
Állománycsoport
A bruttó átlagkeresetet a béralap és a létszám hányadosaként ( ) mint intenzitási viszonyszámot értelmezzük. Az egyes állománycsoportokra és a vállalkozás dolgozóinak összességére kiszámított bruttó átlagkereseteket és azok időbeli változását a 4.7. táblázat tartalmazza:
4.7. táblázat - 4.7. táblázat Bruttó átlagkereset (Ft) Állománycsoport
1994. január
1995. január (%)
Fizikai
36 000
39 600
110,0
Nem fizikai
40 000
44 000
110,0
Együtt
36 632
40 063
109,4 196
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása Megállapíthatjuk, hogy az átlagkereset mind a két állománycsoportban egyaránt 10–10%-kal nőtt. Ugyanakkor az együttes (átlagos) átlagkeresetnövekedés csak 9,4%. Ennek a látszólagos ellentmondásnak az a magyarázata, hogy az egyes állománycsoportok összlétszámon belüli aránya is megváltozott. Az alacsonyabb átlagkeresettel rendelkező fizikai állománycsoport összlétszámon belüli aránya növekedett (mert az összlétszám változatlansága mellett létszámuk nőtt), ugyanakkor a magasabb átlagkeresetű, nem fizikai állománycsoportban lévő dolgozók aránya csökkent (változatlan összlétszám mellett létszámuk csökkent). A kiszámított 9,4%-os átlagkereset-növekedés az egyes állománycsoportonkénti átlagkereset-változást és az állománycsoportok létszámarányváltozásának a hatását is tükrözi. Ebből következik, hogy a 109,4%-os index az átlagkeresetek elemzésének főátlagindexe.
Az állománycsoportonkénti átlagkeresetek változásának hatását az 1995-ös létszámadatok feltételezésével mutathatjuk ki. A bruttó átlagkereset részátlagindexe:
Mint azt a 4.3.2. pontban bizonyítottuk, a részátlagindex az egyedi indexek között helyezkedik el. Példánk ebből a szempontból speciálisnak tekinthető, ugyanis mindkét állománycsoportban egyaránt 10%-kal nőtt az átlagkereset. Így a bruttó átlagkereset növekedésének átlagos nagysága is éppen 10%. A részátlagindex tehát az átlagkereset vizsgált csoportonkénti változásainak átlagát fejezi ki, rövidebben szólva az átlagkereset átlagos változását. Mint láttuk, az együttes bruttó átlagkereset ennél kisebb mértékben nőtt (I = 109,4%). A létszámarányok változásának hatását az összetételhatás indexével mutatjuk ki. A számításnál feltételezzük, hogy 1995-re is az 1994-es kereseti adatok jellemzőek. A bruttó átlagkereset összetételhatás-indexe:
A másik két index alapján: Az átlagkereset változása különbségszámítással is elemezhető, bár azt mondtuk, hogy az időbeli változást általában az indexekkel elemezzük. 197
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása A bruttó átlagkereset összes növekedése:
A növekedés tényezői:
(A számításnál a standardizálás egyes lépéseiben ugyanúgy jártunk el, mint a megfelelő
és
indexnél.)
A 3431 Ft-os keresetnövekedésben az állománycsoportonkénti átlagkereset-növekedések (fizikaiaknál 600 Ft, nem fizikaiaknál 4000 Ft) együttes hatása 3643 Ft volt, amit „lerontott” a kedvezőtlen összetétel-változás. (Az alacsony keresetű csoport létszámaránya nőtt meg 84,2%-ról 89,5%-ra.)
4.4.2. Az átlagárak időbeli változásának vizsgálata Az árakat (pontosabban az egységárakat) általában úgy értelmezzük, mint egy meghatározott egyedi termék (szolgáltatás) egy szokásos mértékegységben kifejezett mennyiségi egységére jutó forintértéket. A gyakorlatban azonban számtalan esetben előfordul, hogy több termék (szolgáltatás, cikk) árát egy adattal, egy átlagos árral kívánjuk jellemezni. A számítás szükségessége felmerülhet térben és időben is. Az árstatisztikai vizsgálatnál megkülönböztetjük az egyedi (elemi) ár és az átlagár fogalmát. Egyedi ár fogalma alatt egy adott minőségű termék vagy szolgáltatás meghatározott körülmények között történt adásvétele során a termék vagy szolgáltatás egy egységéért fizetett pénzösszeget értjük. Az átlagár pedig bizonyos okok miatt különböző (pl. a termék minősége, a feljegyzés időpontja vagy helye) elemi árak átlaga. Az átlagár számításainak két előfeltétele van: – a vizsgált termékek, cikkek, szolgáltatások homogén csoportba tartozzanak, tehát olyan árucsoportba, amelybe tartozó cikkek, szolgáltatások azonos szükségleteket elégítenek ki, az egyes cikkek, szolgáltatások eltérő árainak oka a minőségi különbségekben keresendő. (A statisztikai gyakorlatban meghatározott esetekben heterogén termékek, cikkek, szolgáltatások átlagárát is elemezzük, ezzel tananyagunkban nem foglalkozunk.) – a termékek, cikkek természetes mértékegységben összesíthetők legyenek (ez ún. technikai előfeltétele az átlagárszámításnak). Az átlagár tehát csak homogén csoportba tartozó és természetes mértékegységben összesíthető termékek, szolgáltatások körére értelmezhető. Átlagárat számíthatunk például a különböző minőségű kenyér elemi áraiból. 198
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása Vezessük be a következő jelöléseket. –
az értékesített (fogyasztott, felhasznált stb.) mennyiség,
–
az értékesített (fogyasztott, felhasznált stb.) termékek egyedi (elemi) ára,
n – a termékcsoporthoz tartozó termékek száma. Az átlagár
számításának lehetséges módozatai:
– intenzitási viszonyszámként, ha a mennyiségek
mellett az értékesítési árbevétel
ismert:
ahol v megfelel az A típusú adatnak, q pedig a B típusú adatnak. (Az összetett intenzitási viszonyszámra bevezetett – az egyedi (elemi) árak súlyozott számtani átlagaként számíthatjuk az alábbiak szerint:
– az egyedi (elemi) árak súlyozott harmonikus átlagaként, ha a mennyiségi adatok mellett a
A továbbiakban a képletek felírásakor eltekintünk a szummációs határok kijelölésétől. 199
adatok ismertek:
jelölésrendszer szerint.)
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása Az átlagár nagysága – nyilvánvalóan – függ az elemi árak nagyságától és a különböző nagyságú elemi árakkal jellemzett termékek értékesítési részarányától. A termékcsoport átlagárának időbeli változását, a változás okainak feltárását az itt megismert indexek szolgálják. Az alkalmazást a következő példa segítségével mutatjuk be (4.8. táblázat).
4.8. táblázat - Egy homogén árucsoportba tartozó három cikk értékesítési adatai Március Cikk
Április Árváltozás
Forgalom Értékesített Ár Forgalom Értékesített Ár mennyiség mennyiség (1000 (Ft/ (1000 (Ft/ Ft) (db) db) Ft) (db) db)
(Március= =100%)
A
720,0
800
900
940,5
950
990
110
B
660,0
600
1100 1012,0
800
1265
115
C
1000,0
500
2000 1440,0
600
2400
120
Összesen 2380,0
1900
2350
...
...
...
3392,5
Márciusi átlagár:
Áprilisi átlagár:
Főátlagindex:
Ha az átlagár 15,2%-os növekedésében csak az árak változásának hatását akarjuk kimutatni, akkor az átlagárat mindkét időszakban az áprilisban forgalmazott cikkek áprilisi mennyiségi adataival kell súlyoznunk. Így az átlagár részátlagindexéhez jutunk: 200
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása
Általánosítva
(A részátlagindex tükrözi.)
képlete azonos a következő fejezetben bemutatásra kerülő árindex képletével, tehát ténylegesen csak az árak változását
A részátlagindex súlyozott harmonikus átlag (esetleg súlyozott számtani átlag) formában is kiszámítható:
(A súlyozott számtani átlag formát a gyakorlatban nem használjuk, ezért ennek számszerű bemutatásától eltekintünk.) A két időszak között megváltozott a forgalmazott mennyiség cikkek szerinti összetétele, ennek az átlagár változására gyakorolt hatását az összetételhatás-index segítségével mutatjuk ki. Ebben az indexben a márciusi termékenkénti árakat használjuk mindkét időszak átlagárának kiszámításához:
201
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása Általánosítva:
A három index között szintén fennáll a következő összefüggés:
Ennek feltétele, hogy a változatlannak tekintett tényezőt ( -nél a temékösszetételt,
-nél az egyedi árakat) ellentétes időszakból válasszuk.
Példánkban:
Az átlagár változását tehát döntően az egyedi árak változása okozta (15,6%-os mértékben), valamelyest csökkentő hatást gyakorolt a termékösszetétel megváltozása. Megnőtt ugyanis a viszonylag olcsóbb B cikk aránya (31,6%-ról 34%-ra). Nyomatékosan felhívjuk a figyelmet arra, hogy az itt ismertetett átlagárindexek csak a mennyiségben közvetlenül összesíthető termékek viszonylag szűkebb körére értelmezhetők. (Mint azt már a bevezetőben is hangsúlyoztuk.) A következő fejezetben a közvetlenül nem összesíthető, különnemű, általában különböző mértékegységű termékek értékének, árának és mennyiségének időbeli összehasonlítására szolgáló indexekkel ismerkedünk meg.
4.5. Gyakorlófeladatok 1. Két országban (A és B) vizsgáljuk a születési viszonyokat. A születések számára és a szülőképes korú nők számára vonatkozó adatok az alábbiak: Életkor
A nők száma (millió fő)
A születések száma (ezer)
(év)
A ország
B ország
A ország
B ország
15 – 19
3,6
8,0
288
400
20 – 29
6,4
14,0
1280
2100
30 – 39
6,0
10,0
260
320 202
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása 40 – 49
4,0
8,0
60
40
Összesen
20,0
40,0
1888
2860
Feladat: a) Hasonlítsuk össze az 1000 nőre jutó születést a szülőképes korú nők egyes korcsoportjaiban és az ország egészében! b) Standardizálással mutassuk ki, hogy: 1. a születési arányszámok különbözősége miatt mennyivel (hány ezrelékponttal) magasabb az A ország arányszáma? (A ország összetételével számoljunk.) 2. az eltérő korösszetétel miatt kedvezőbb vagy kedvezőtlenebb-e A ország születési arányszáma? Megállapításainkat támasszuk alá a megoszlási viszonyszámok kiszámításával is! 2. Az öregségi nyugdíjak adatai a nyugdíjasok életkora és nemek szerint 1994 áprilisában: Férfiak
Nők
száma
nyugdíj összege
száma
nyugdíj összege
(1000 fő)
(1000 Ft/fő)
(1000 fő)
(1000 Ft/fő)
11 – 54
7,1
19,8
6,7
12,6
55 – 59
19,5
20,1
171,2
12,0
60 – 64
144,6
16,3
221,3
12,3
65 – 69
168,7
16,4
205,2
12,2
70 – 74
143,7
16,0
170,4
12,3
75 – 79
64,6
16,5
75,2
12,7
80 – 11
91,4
15,4
103,4
12,6
Összesen
639,6
16,3
953,4
12,3
Életkor (év)
Feladat: Hasonlítsuk össze a férfiak és a nők átlagos nyugdíját! Mutassuk ki a különbséget kialakító tényezőket! 203
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása 3. Két ország halandósági viszonyaira vonatkozó fiktív adatok: A ország
B ország
Népesség
Halálozási arány
Népesség
Halálozási arány
(millió fő)
(‰)
(millió fő)
(‰)
10 – 14
6
2,0
3
1,5
15 – 59
12
3,5
15
2,5
60 és felett
2
50,0
12
45,0
Összesen
20
...
30
...
Életkor (év)
Feladat: a) Hasonlítsuk össze a két országot a halandósági viszonyok szempontjából! b) Mutassuk ki standardizálás segítségével a befolyásoló tényezőket! c) Megállapításainkat szövegesen is fogalmazzuk meg! 4. A hozzáadott érték és a létszám alakulása valamely vállalkozásnál az alábbi volt: Üzem
Hozzáadott érték
Létszám
(millió Ft)
(fő)
1993
1994
1993
1994
A
100
110
20
20
B
100
110
15
15
C
70
130
9
15
Összesen
270
350
44
50
Feladat: a) Számítsuk ki az egy főre jutó hozzáadott értéket mindkét évre üzemenként és a vállalkozás egészére! Vizsgáljuk a változást 1993-ról 1994-re! 204
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása b) Mutassuk ki megfelelő indexekkel, hogy milyen szerepet játszott a vállalkozás termelékenységének javulásában (romlásában): 1. a termelékenység üzemenkénti változása, 2. a különböző termelékenységi szinten dolgozó üzemek közötti létszámösszetétel-változás! c) Írjunk szöveges elemzést! 5. Egy termékről, amelyet három gyáregységben termelnek, az alábbiakat ismerjük: Gyáregység
Önköltség (ezer Ft/db)
A termelés megoszlása
1993
1994
1994-ben (%)
I.
8
8,4
20
II.
10
10,6
40
III.
12
13,2
40
Összesen
...
...
100
1993-ról 1994-re a termék átlagos önköltsége 4%-kal nőtt. Feladat: a) Számítsuk ki a részátlagindexet! b) Hogyan hatott a termelés összetételének gyáregységek közötti megváltozása az átlagos önköltségváltozásra? c) Melyik gyáregység(ek) részaránya nőhetett meg? 6. Magyarország kenyérgabona-termelésének adatai: Megnevezés
Vetésterület (1000 ha)
Termésátlag (kg/hektár)
1991
1993
1991
1993
Búza
1152
986
5190
3050
Rozs
358
429
2370
1660
Kenyérgabona
1510
1415
...
... 205
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása Feladat: a) Hány %-kal nőtt (csökkent) az összes kenyérgabona-termelés Magyarországon? b) Bontsuk fel ezt a változást a termésátlag, illetve a vetésterület változásának hatására! c) Milyen tényezők befolyásolták az együttes termésátlag változását? Mutassuk ki e hatásokat a standardizálás módszerével! 7. Egy vállalatnál 1993-ban a vezető beosztásúak átlagos bruttó bére 60 ezer Ft, a beosztottaké pedig 24 ezer Ft volt. 1994-re a vezetők átlagbére 21%-kal, a beosztottaké pedig 15%-kal nőtt. 1993-ban a vezetők aránya 20%, 1994-ben pedig 10% volt. Feladat: a) Rendezzük az adatokat statisztikai táblába! b) Elemezzük a vállalatnál foglalkoztatottak átlagbérének változását indexekkel! Az eredményeket szövegesen is értékeljük! 8. Egy vállalkozás adatai: Szakképzettség szerinti csoportok
A kifizetett bruttó bérek
A létszám
1994-ben az 1990-es év %-ában
Szakmunkás
140
120
Betanított munkás
130
120
Segédmunkás
150
130
Összesen
132
123
Ismert továbbá, hogy 1994-ben az összes kifizetett bruttó bérek 40%-át a szakmunkásoknak, 30%-át a betanított munkásoknak, a többit a segédmunkásoknak fizették ki. Feladat: Számítsuk ki, hogyan változott az átlagbér: a) az egyes szakképzettségi csoportokban, b) a munkások összességére vonatkozóan, 206
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása c) a szakképzettség szerinti csoportoknál átlagosan, d) a munkások összességére vonatkozóan csupán a létszámarányok megváltozása következtében! 9. Egy terméket három telephelyen gyártanak. A termelékenység alakulását jellemző adatok: Telephely
Egy főre jutó termelés (db/fő)
A létszám megoszlása
1990
1994
1994-ben (%)
A
20
18
20
B
30
15
40
C
40
36
40
A temelékenység főátlagindexe: 92,3%. Feladat: a) Az adatok tanulmányozása alapján (számolás nélkül) válasszuk ki, hogy az alábbi három változat közül melyik felelhet meg a valóságnak? A létszám 1990-es (bázisidőszaki) megoszlása a telephelyek sorrendjében (%): Telephely
A
B
C
1.
20
40
40
2.
10
40
50
3.
60
20
20
Változat
Indokoljuk meg válaszunkat! b) Számítsuk ki az
és
indexeket! Ellenőrizzük a létszámösszetétellel kapcsolatos döntésünket!
10. Egy felsőoktatási intézményben valamennyi oktatói csoportban (tanársegéd, adjunktus, docens, főiskolai tanár) 5,6%-kal nőttek az átlagbérek egyik időszakról a másikra. Az összes oktatóra számított átlagbér növekedése pedig csak 2%-os volt. 207
Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása Feladat: a) Állapítsuk meg az átlagbérekre számított főátlag-, részátlag- és összetételhatás-indexet! b) Írjunk szöveges magyarázatot! 11. Egy magánkereskedő háromféle minőségű burgonyát értékesít. Az értékesítéssel kapcsolatos adatok az alábbiak: Burgonya minősége
Bázisidőszak Értékesítés árbevétele (Ft)
Beszámolási időszak
Ár (Ft/kg)
Értékesítés árbevétele (Ft)
Ár (Ft/kg)
I osztályú
9 600
80
10 000
100
II osztályú
2 400
60
1 750
70
III osztályú
2 000
50
1 500
60
Együtt
14 000
...
13 250
...
Feladat: a) Számítsuk ki a burgonya átlagárát mindkét időszakban! b) Elemezzük az átlagár változására ható tényezőket megfelelő indexekkel! c) Írjunk szöveges értékelést
208
5. fejezet - Érték-, ár- és volumenindexek 5.1. Az indexszám fogalma A gazdasági elemzésekben kiemelkedő jelentősége van az összehasonlításnak. Az azonos jellegű, azonos mértékegységű adatoknál ez egyszerű módon megoldható, pl. viszonyszámokkal. Gyakran van azonban szükség a közvetlenül nem összesíthető adatokra vonatkozó átlagos változás meghatározására. A gazdasági egységeknél nagyon lényeges információ a termelés vagy a forgalom teljes volumenének alakulása, melynek megállapítása – hacsak nem egyféle cikket gyárt, forgalmaz a cég – a már ismert számításokkal nem végezhető el. Nemzetgazdasági és nemzetközi szinten úgyszintén fontos az egyes gazdasági folyamatokban bekövetkezett mennyiségi változás kimutatása, s ez is megfelelő – az eddig tárgyaltaktól eltérő – módszerek alkalmazását követeli meg. Napjainkban az árváltozás mértékének ismeretére vonatkozó igény is különösen nagy, mikro- és makro-összehasonlítás vonatkozásában egyaránt. A mértékegységbeli különbözőség vagy a termékek eltérő volta nem teszi lehetővé direkt módon a viszonyítást. Ezért olyan eljárásra volt szükség, amely az összehasonlíthatóság nehézségét kiküszöböli. Bizonyos termékeknél az átszámított természetes mértékegységben történő számbavétel kivitelezhető (pl. égetett szeszes italoknál 50°-os szesz, állattenyésztésben számosállat stb.), többnyire azonban csak nagyon körülményesen vagy egyáltalán nem lehetséges. Olyan közös jellemzőt kell találni, melynek segítségével az összehasonlítás a termékek széles körében megoldható. Ez a közös jellemző az ár, amellyel az értékben történő számbavétel elvégezhető. Az érték a mennyiség és az egységár szorzatából határozható meg. Az értékadatok összeadhatóak, tehát ily módon az egyes termékek, termékcsoportok mennyisége összesíthetővé válik. Az értékben való összesítést aggregálásnak, az összesített értékadatot pedig aggregátumnak nevezzük. A közvetlenül nem összesíthető, de valamilyen szempontból összetartozó adatok átlagos változását mutató összetett összehasonlító viszonyszám az indexszám. Az indexszám viszonyszámnak is és átlagnak is felfogható. Viszonyszám, mert két adat hányadosa, amely időbeli és területi összehasonlításnál is alkalmazható. Átlag, mert az egyes termékekre (jelenségekre) vonatkozó viszonyszámok átlagaként is meghatározható. Indexek számításával már az előző fejezet is foglalkozott az összetett intenzitási viszonyszámok (főátlagok) összehasonlítása során. Ezeket az indexeket standardizáláson alapuló indexeknek is szokták nevezni. Azokat az indexeket, amelyekkel ebben a fejezetben fogunk megismerkedni, értéken alapuló indexeknek nevezzük.
5.2. Érték-, ár- és volumenindex-számítás Az egyes termékek, szolgáltatások érték-, ár- és volumenváltozását dinamikus viszonyszámokkal elemezhetjük. Az indexszámítás keretében a termékekre számított dinamikus viszonyszámokat egyedi indexeknek hívjuk. A termék egységárát p-vel, a termelt, eladott, fogyasztott stb. 209
Érték-, ár- és volumenindexek
mennyiséget q-val, a kettő szorzatát , az értéket v-vel jelöljük. Az összehasonlítandó két időszak jelölése bázisidőszak esetén 0, tárgyidőszak (vagy beszámolási időszak) esetén 1 indexszel történik. Így tehát az egyedi indexek meghatározásának módja: egyedi értékindex
egyedi árindex
egyedi volumenindex
A számítások egy konkrét példa kapcsán (5.1. táblázat) a következőképpen végezhetők el:
5.1. táblázat - Jövedelem Egy iparcikkeket forgalmazó fővárosi áruház Videoton teletextes televízióforgalma az 1993–1994-es években Eladott Televíziók mennyiség (db) 1993
Ár
Eladás értéke (ezer Ft)
(Ft)
(aggregátumok)
típusa
1993
1994
1994
1993
1994
TS 3354 TXT
43
39
43 900 49 900 1887,7 1946,1 1712,1 2145,7
TS 3353 TXT
32
29
47 900 52 900 1532,8 1534,1 1389,1 1692,8
TS 5355 TXT
40
37
55 900 62 900 2236,0 2327,3 2068,3 2516,0
210
Érték-, ár- és volumenindexek TS 6354 TXT
21
16
Összesen
–
–
59 900 74 900 1257,9 1198,4 –
–
958,4
1572,9
6914,4 7005,9 6127,9 7927,4
(Megjegyezzük, hogy a táblázat utolsó két oszlopában szereplő értékadatokra csak a későbbi számításoknál lesz szükség.)
5.2. táblázat - Az egyes televíziótípusok érték-, ár- és mennyiségváltozását jelző egyedi indexek Egyedi indexek (%) Televíziók típusa
Értékindex
Volumenindex
Árindex
TS 3354 TXT
103,1
90,7
113,7
TS 3353 TXT
100,1
90,6
110,4
TS 5355 TXT
104,1
92,5
112,5
TS 6354 TXT
95,3
76,2
125,0
A fenti indexek tehát azt jelentik, hogy az egyes televíziótípusok forgalmának értéke, árai s az eladott mennyiségek miként alakultak a vizsgált időszakban. Pl. a TS 3354 TXT készülékből az eladás értéke 3,1%-kal emelkedett, ára 13,7%-kal nőtt, értékesített mennyisége pedig 9,3%-kal csökkent 1994-ben 1993-hoz viszonyítva (5.2. táblázat). Több termékre, termékcsoportra az átlagos érték-, ár- és volumenváltozást az indexszámok mutatják, melyek kiszámítása aggregátumokkal és átlagolással történhet.
5.2.1. Indexszám számítása aggregát formában Az értékindex (jele: ) a termékek vagy termékcsoportok meghatározott körére vonatkozó érték átlagos változását fejezi ki. Kiszámítása a vizsgált termékek két időszakra vonatkozó összesített értékadataiból (aggregátumaiból) képzett hányadossal történhet. 1
Az értékindex aggregát formája: 1
A továbbiakban már csak az „egyszerű” formát használjuk, tehát az összegzés határainak és az összegzési indexeknek a feltüntetését mellőzzük. Az összegzés mindig az egyidejűleg vizsgált n termékféleségre értendő.
211
Érték-, ár- és volumenindexek
Az előző példa alapján kiszámított értékindex tehát azt mutatja, hogy a négyfajta teletextes televízió forgalmának értéke átlagosan 1,3%-kal emelkedett a vizsgált időszakban. A képletből látható, hogy az értékváltozást két tényező befolyásolja: – a termékek árváltozása és – a termékek mennyiségváltozása. Ezen hatások kimutatására szolgál a másik két index, az árindex és a volumenindex, melyek az értékindexből kiindulva is kiszámíthatóak. Az árindex (jele: ) a különböző termékek, árucikkek, szolgáltatások árainak átlagos változását, az árszínvonal alakulását fejezi ki. Az árindex is meghatározható két összesített értékadat (aggregátum) hányadosából. Miután azonban csak az árváltozást akarjuk mérni, a mennyiségváltozás hatását ki kell szűrni. Ez oly módon történhet, hogy a két aggregátum csak az árakban tér el, a mennyiség mindkét időszakra azonos, tehát az csak a súlyszám szerepét tölti be. Attól függően, hogy a két vizsgált időszak közül melyik mennyiséget tekintjük állandónak (a bázisidőszaki
vagy a tárgyidőszaki
adatokat), kétféle árindex számítása lehetséges:
bázisidőszaki súlyozású
tárgyidőszaki súlyozású
A képletekben szereplő nevezzük.
, illetve
szorzatok összegzéseként kapott értékadatokat (ezek a valóságban nem léteznek) fiktív aggregátumoknak
212
Érték-, ár- és volumenindexek A két árindex általában nem ad azonos eredményt az eltérő súlyszámok miatt. (A kétféle súlyozású index különbözőségének magyarázatára a későbbiekben kerül sor.) Jelen példánkban is bázismennyiségekkel súlyozva 14,6, míg beszámolási súlyokkal számolva 14,3%-os átlagos áremelkedés mutatható ki a vizsgált időszakban. A volumenindex (jele: ) különböző termékek volumenének átlagos változását mutatja meg. Kiszámítása az árindexhez hasonlóan történhet, csak a hányadosban szereplő aggregátumok jelen esetben a mennyiségi adatokban különböznek egymástól. Az árak mint súlyszámok változatlanok. Attól függően, hogy a bázis- vagy a beszámolási időszak áradatait használjuk fel, a volumenindex is kétféle lehet: bázisidőszaki súlyozású
tárgyidőszaki súlyozású
A vizsgált cikkcsoportban tehát bázisárakkal súlyozva 11,4, beszámolási áradatokkal súlyozva pedig 11,6%-os átlagos volumencsökkenés mutatható ki 1993-ról 1994-re. A szakirodalom a bázisidőszaki súlyozású ár- és volumenindexet Laspeyres-féle, a tárgyidőszaki súlyozású indexeket pedig Paasche-féle indexeknek nevezi, az alkotók nevéből kiindulva. (Elvileg bármely más időszak árait is fel lehet használni a volumenindex kiszámításához, mint ahogy az árindex meghatározásához is többféle mennyiségi adat jöhet számításba. Közgazdasági megfontolásból és gyakorlati kivitelezhetőségi okokból azonban az előzőekben ismertetett bázisés tárgyidőszaki súlyozás terjedt el.)
5.2.2. Az indexek átlagformái Az előző fejezetben összetett viszonyszámokat súlyozott átlagként már számítottunk. Miután az indexszám összetett viszonyszám is egyben, ezt a módszert itt is alkalmazhatjuk. Az aggregát formát átalakíthatjuk átlagformára. Átlagolandó értékek a megfelelő egyedi indexek, a súlyok pedig az aggregát formában felírt törtek megfelelő értékadatai lesznek. Az átlagformában való számítás a gyakorlatban azért jelentős, mert bizonyos esetekben nem a q és a p adatsorok, hanem értékadatok és egyedi indexek állnak rendelkezésre. 213
Érték-, ár- és volumenindexek Az értékindex átlagformái Az értékindex ilyen formában történő kiszámítására a gyakorlatban ritkán kerül sor, miután a tényleges értékadatok (aggregátumok) többnyire rendelkezésre állnak, tehát az aggregát formában történő számolás általában megoldható. Esetenként azonban szükség lehet az átlagformában történő számításra is, melynek formái a következők: számtani átlagforma
Az 1,3%-os átlagos értékváltozást oly módon számítottuk ki, hogy az egyes televíziótípusok egyedi értékindexeit az 1993-as, bázisforgalmakkal súlyoztuk. harmonikus átlagforma
Ez esetben az átlagos értékváltozás meghatározása az egyedi indexek 1994-es, beszámolási forgalmi adatokkal történő súlyozásával került kiszámításra. Az árindex átlagformái Az árindex meghatározása számtani átlaggal: Laspeyres-féle árindex 214
Érték-, ár- és volumenindexek
Az átlagolandó értékek (egyedi árindexek) súlya a tényleges bázisidőszaki érték, azaz az index nevezőjében szereplő aggregátum Paasche-féle árindex
A fentiekben az egyedi árindexek súlya fiktív értékadat (tárgyidőszaki mennyiség bázisárakon). Az árindex meghatározása harmonikus átlaggal: Paasche-féle árindex
Ennél a formulánál a tárgyidőszaki tényleges forgalmi adatokkal történik az egyedi árindexek súlyozása. Laspeyres-féle árindex 215
.
Érték-, ár- és volumenindexek
Itt a súly szerepét betöltő aggregátum nem valós adat, hanem a bázismennyiség tárgyidőszaki áron számított értéke. A volumenindex átlagformái Az árindexhez hasonlóan mindkét típusú volumenindex meghatározható átlagokkal is. Volumenindex meghatározása számtani átlaggal: Laspeyres-féle volumenindex
A számtani átlaggal számolt, bázissúlyozású volumenindexnél ez esetben az egyedi volumenindexek súlyszámai a bázisidőszaki, 1993-as forgalmi adatok. Paasche-féle volumenindex
Ez esetben az egyedi volumenindexeket fiktív forgalomadatokkal (bázismennyiség beszámolási árakon) súlyozzuk. 216
Érték-, ár- és volumenindexek Volumenindex meghatározása harmonikus átlaggal: Paasche-féle volumenindex
Laspeyres-féle volumenindex
Természetesen az indexek értéke nem függ attól, hogy aggregát vagy átlagformában kerültek kiszámításra, tehát mint példánkból is kiderült, azonos eredményt ad mindkét számítási mód. Az indexek kiszámításának lehetséges módozatait a következő oldalon, az 5.3. táblázatban foglaljuk össze.
5.3. táblázat - Az indexek kiszámítási képleteinek áttekintő táblázata Átlagformák Index neve
Definíciója
Egyedi indexek súlyozott számtani átlaga Képlet
Súlyok Bázisidőszak aggregátuma
Értékindex,
217
Egyedi indexek súlyozott harmonikus átlaga Képlet
Súlyok Tárgy(beszámolási) időszak
Érték-, ár- és volumenindexek aggregátuma Árindex
Bázisidőszak aggregátuma
Fiktív
Fiktív
Tárgy(beszámolási) időszak
Bázisidőszaki súlyozású,
aggregátum
(Laspeyres-féle) Árindex
aggregátum
Tárgyidőszaki súlyozású,
aggregátuma
(Paasche-féle) Volumenindex Bázisidőszaki súlyozású,
Bázis-
Fiktív
időszaki
aggregátum
aggregátum
(Laspeyres-féle) Volumenindex Tárgyidőszaki súlyozású,
Fiktív
Tárgyidőszak
aggregátum
aggregátuma
(Paasche-féle)
5.3. Az indexek súlyozása Az indexszámításban a súly fogalmát kétféle értelemben használjuk. A szó egyik értelme az aggregát formával, a másik pedig az átlagformákkal kapcsolatos. Az aggregát formánál attól függően, hogy az árak vagy a mennyiség változását kívántuk kimutatni, az súlyszámmá. Az átlagformáknál a súly mindig valamely aggregátum
a q, az
a p adat vált
értékadat.
A volumenindexnél, csakúgy, mint az árindexnél valós és fiktív (nem azonos időszakhoz tartozó mennyiség- és áradatok szorzatából számított – illetve –) értékadatokkal is történhet a súlyozás. (Meg kell jegyezni, hogy a gyakorlatban a tényleges adatokkal történő súlyozásnak van jelentősége, mert azok közvetlenül rendelkezésre állnak, míg a fiktív értékadatok csak számítással határozhatók meg.) Már utaltunk rá s a számszaki példa is bizonyította, hogy a bázis- és beszámolási súlyozású indexek értékei nem egyeznek meg egymással. Az átlagolandó értékek mindkét esetben azonosak, a különbözőség egyértelműen a súlyozás eltéréséből fakad, abból, hogy a súlyarányok 218
Érték-, ár- és volumenindexek megváltoznak. Ennek oka, hogy az egyedi volumen- és árindexek között sztochasztikus kapcsolat – többnyire negatív korreláció – található. Ez azt jelenti, hogy általában egy-egy termék áremelkedése az adott termék eladott mennyiségének csökkenését vonja maga után, jelentősebb árnövekedés pedig erőteljesebb mennyiség-visszaesést eredményez. Tehát nagyobb
értékhez kisebb
általában azon termékek mennyiségi aránya nő, melyeknél s azoké csökken, ahol számszerű értéke magasabb, mint a tárgyidőszaki súlyozásúé:
érték tartozik és viszont, s ennek következtében
Ez azt vonja maga után, hogy a bázissúlyozású index
(Pozitív korreláció esetén természetesen a nagyságrendi reláció fordított.) Példánkban is nagyobb értékűek a bázissúlyozású indexek, mint a beszámolási súlyozásúak (114,6% és 114,3%, illetve 88,6% és 88,4%). A kétféle súlyozású index értékének eltérése azonban kicsi, mert bár a negatív korreláció egyértelműen megfigyelhető, az egyedi indexek szóródása csak nagyon kis mértékű. Bortkiewicz mutatta ki, hogy a bázis- és tárgyidőszaki súlyozású indexek számszerű értékének eltérése három tényezővel magyarázható: – az egyedi árindexek relatív szórásával (
),
– az egyedi volumenindexek relatív szórásával (
) és
– a kétféle egyedi index közötti sztochasztikus kapcsolatot mérő lineáris korrelációs együtthatóval
2
.
A kétféle súlyozású index hányadosa közötti összefüggés a Bortkiewicz-tétel szerint:
(A kétféle súlyozású index értéke tehát csak akkor egyezik meg, ha az egyedi ár- vagy az egyedi volumenindexek nem szóródnak, illetve az egyedi ár- és volumenalakulás között nincsen korreláció.) Már szó volt róla, hogy mindkét index elfogadható, egyaránt jól jellemzi az ár-, illetve a volumenváltozást, bár mindkettő meghatározott feltételezéssel él. (Tárgyidőszakban is bázisidőszaki árak, vagy bázisidőszakban is tárgyidőszaki árak.) Abban az esetben, ha a két index értéke közötti eltérés nem nagymértékű, elegendő csak az egyik alkalmazása. Nagyobb különbség esetén azonban célszerű a két alapforma eredményét átlagolni. Az átlagolással ún. keresztezett indexformulák képezhetők. A gyakorlatban legtöbbször a Fisher-féle keresztezett formula kerül kiszámításra a kétféle súlyozású index mértani átlagaként: 22
A lineáris korrelációs együttható két mennyiségi ismérv közötti kapcsolat szorosságát jellemzi. Határai:
219
Tankönyvünk második kötetében foglalkozunk vele.
Érték-, ár- és volumenindexek Fisher-féle indexek Árindex
Volumenindex
Különböző indexformulák használhatók tehát, a közülük való választást az ún. indexpróbákkal lehet megalapozottá tenni. Az indexpróbák az indexekkel szemben támasztott követelményeket fogalmazzák meg, melyek alapján az egyes mutatószámok értékelhetőek. A legfontosabb indexpróbák a következők: Összemérhetőségi próba: az index értéke legyen független a volumenadatok mértékegységétől. Időpróba: ugyanazon indexformulával számított index értéke az időszakok felcserélése mellett reciproka legyen az index eredeti értékének. Tényezőpróba: az ugyanazon típusú formulával számított volumen- és árindex szorzata legyen egyenlő az értékindexszel. Arányossági (átlag-) próba: az index legyen átlaga az egyedi indexeknek. Láncpróba: a valamely formulával számított láncindexek szorzata legyen egyenlő az ugyanazon formulával számítható bázisindexszel. (Ez a próba a később tárgyalásra kerülő indexsorok ismeretében válik érthetővé.) A Fisher-index tekinthető az egyik legjobb formulának, mert az tesz leginkább eleget az indexekkel szemben támasztott követelményeknek (l. a következő pontot); az első négynek teljes mértékben, az utolsónak, a láncpróbának jó közelítéssel felel meg. A Fisher-index mellett más keresztezett indexformulák is használatosak, így pl. az ún. Marshall–Edgeworth–Bowley-féle formulák:
220
Érték-, ár- és volumenindexek
Ez esetben nem az indexek eredményeit, hanem a súlyszámokat átlagolják.
5.4. Összefüggések az indexszámításban 5.4.1. Az indexszámok közötti összefüggések Az alapvető összefüggés következtében, mely szerint az ár (p) és a mennyiség (q) szorzata az értéket adja, megállapítható, hogy az egyedi indexek között hasonló kapcsolat található. Tehát:
Példánkban a TS 3354 TXT típusú tv-készülék esetében:
Ez az összefüggés nemcsak az egyes termékeknél, hanem a vizsgált termékcsoportok körében is fennáll. Az értékindex egyenlő az ár- és volumenindex szorzatával, ha azok eltérő súlyozásúak. A Fisher-féle indexnél ez a feltétel nem szerepel, nincs is értelme.
(kerekítésből adódik az eltérés). A vizsgált termékcsoportban 1993-ról 1994-re az átlagos, hozzávetőleges 14%-os árnövekedés és a kb. 12%-os volumencsökkenés hatására az árbevétel 1,3%-kal emelkedett. 221
Érték-, ár- és volumenindexek Az indexszámok közötti összefüggéseknek a gyakorlatban nagy jelentőségük van, mert ezek felhasználásával két index ismeretében a harmadik előállítható. Általában a volumenindexet számítják ki ilyen közvetett módszerrel. Ennek oka, hogy az értékindex meghatározása nem ütközik nehézségbe, hiszen a folyó áras forgalmi adatok teljes körűen rendelkezésre állnak, s az árindex kiszámítása is megoldható, bár többnyire csak reprezentatív megfigyeléssel nyert adatokból. (Elvben az átlagos volumenváltozás is megállapítható reprezentatív felmérés eredményeként, azonban csak nagyobb hibával és olyan körülményes módon, annyi többletmunkával, hogy a gyakorlatban ezért ezt nem alkalmazzák.) Az átlagos volumenváltozás meghatározása tehát a legegyszerűbben az alábbi módon történhet:
A példában szereplő adatok szerint:
Az árindexszel való osztás az árváltozás kiszűrését jelenti. A folyó áras aggregátum árindexszel történő osztását deflálásnak hívják, mely a gazdasági számításoknál gyakran alkalmazott eljárás. (Elvben csak a tárgyidőszaki súlyozású árindex töltheti be a deflátor szerepét, gyakorlatilag azonban más, az árszínvonal változását jól jellemző index is használható.)
5.4.2. Az aggregátumok közötti összefüggések Az aggregátumok hányadosaiból az indexeket lehetett meghatározni. Nemcsak a hányadosok, hanem az aggregátumok különbségeinek vizsgálata is jól hasznosítható a közgazdasági elemzésben. Ily módon az értékváltozás ( illetve a mennyiség változása (
) abszolút számokkal jellemezhető, s kimutatható, hogy az árak (
) erre milyen hatással voltak. Az aggregátumokból a következő különbségek képezhetőek:
A közöttük levő összefüggés :
222
),
Érték-, ár- és volumenindexek A volumenváltozás és az árváltozás hatásának számszerűsítése a kétféle felbontással általában eltér egymástól. (Ez az alkalmazott indexformulák különbözőségével magyarázható.) A bevételmódosulást jelzi. A
a mennyiségváltozásból fakadó bevételváltozást mutatja, míg a
az árváltozásból adódó
pozitív előjel esetén az árváltozás okozta lakossági többletkiadást, negatív előjel esetén megtakarítást adja.
Az előző példa alapján:
1993-ról 1994-re az árbevétel 91,5 ezer Ft-tal emelkedett. A volumencsökkenés 786,5 ezer Ft bevételkiesést okozott, míg az áremelkedés 878 ezer Ft árbevétel-növekedést idézett elő. Az árnövekedésből eredő lakossági többletkiadás 878 ezer Ft, tehát az 1994-ben megvásárolt televíziómennyiség 1993-as árakon 878 ezer Ft-tal kevesebbe került volna. Az indexek és az aggregátumok összefüggését az 5.1. ábra szemlélteti:
223
Érték-, ár- és volumenindexek
5.1. ábra -
5.4.3. Csoportosított sokaságra számított indexek Gyakran előfordul, hogy az átlagos érték-, ár- és volumenváltozást olyan áruk körére kell meghatározni, melyeknél a termékek valamilyen lényeges tulajdonság szerinti csoportosítása fontos lehet. Ez esetben az indexekből levonható helyes következtetésekhez szükséges az egyes árucsoportok elkülönült vizsgálata is, tehát az érték-, ár-, volumenindex árucsoportonkénti kiszámítása. Ekkor az egyes csoportokra kapott indexeket részindexeknek , az összes termékre vonatkozó indexet főindexnek nevezik. A rész- és főindexek között ugyanolyan összefüggés van, mint a részátlagok és a főátlag vagy a részviszonyszámok és az összetett viszonyszám között. A főindex kiszámítása tehát többféle módon is történhet: 1. Az azonos jellegű aggregátumok (részaggregátumok) összegeinek hányadosaként:
224
Érték-, ár- és volumenindexek
2. A részindexek részaggregátumokkal súlyozott átlagaként: – súlyozott számtani átlagformában
– súlyozott harmonikus átlagformában
ahol: a j-edik termék érték-, ár- vagy volumenindexe, a vizsgált részindex számlálójában szereplő aggregátum, a nevezőben található aggregátum. Az előző feladatoknál az eladott Videoton teletextes tv-készülékek érték-, ár- és volumenváltozását számoltuk ki. Az ott kapott eredmények részindexként kezelhetők abban az esetben, ha valamennyi, az üzlet által forgalmazott Videoton tv-készülékre vonatkozó átlagos változást vizsgáljuk, amely ez esetben főindexek segítségével történik (5.4. táblázat).
5.4. táblázat - A Videoton televíziók forgalmának alakulása az 1993–1994. években egy fővárosi, iparcikkeket forgalmazó üzletben Árucsoport
Forgalom (ezer Ft)
Részindexek (%) 225
Érték-, ár- és volumenindexek 1994-ben 1993-ban
1994-ben
az 1993-as árakon
Teletextes Videoton készülék Nem teletextes Videoton készülék Összesen:
6 914,4
7 002,9
6 123,9
101,3
114,3
88,6
6 361,1
5 591,1
4 945,1
87,9
113,1
77,7
13 275,5
12 594,0
11 069,0
–
–
–
A Videoton televíziók forgalmának értéke tehát összességében 5,1%-kal csökkent annak következtében, hogy bár a teletextes készülékek forgalma átlagosan 1,3%-kal nőtt, a nem teletextes televíziók értékesítése átlagosan 12,1%-kal esett vissza. A valamivel nagyobb részarányt képviselő teletextes tv-k forgalomalakulása tehát erőteljesebb hatással volt az átlagra. Az átlagos árváltozás a vizsgált termékcsoportnál a következőképpen alakult:
226
Érték-, ár- és volumenindexek A két termékcsoport együttes volumenváltozása:
A forgalom 5,1%-os csökkenése tehát a két termékcsoport árainak átlagos 13,8%-os emelkedése és az eladott mennyiségük 16,6%-os visszaesése miatt következett be. Figyeljük meg, hogy a megfelelő főindexek
az árucsoportokra számított részindexek
közé esnek.
5.5. Az indexszámok gyakorlati alkalmazása Az indexszámokat a gazdasági elemzésben nagyon sok területen alkalmazzák. Az értékindex segítségével elemezhető pl. a gazdasági egységek termelési értékének, árbevételének, forgalmának változása, a felhasznált anyagok, energia stb. értékének változása, az export és import értékének alakulása, a fogyasztás változása stb. Az árindexek alkalmazási területe is igen széles körű. A termelés, forgalom, fogyasztás elemzésében egyaránt fontos szerepet játszik. Az alábbiakban felhasználásának csak néhány lényeges aspektusa kerül kiemelésre. A fogyasztói árindex az infláció általános mérőszáma és a gazdaság állapotának fontos jellemzője. A lakosság által vásárolt fogyasztási cikkek, szolgáltatások árainak átlagos változását fejezi ki, így fontos szerepe van az életszínvonal mérésében. Meghatározása hazánkban olyan módon történik, hogy az ún. fogyasztói kosárba került mintegy 1800 termék, szolgáltatás „reprezentáns” árait figyelik havonta több alkalommal, s ezen árfeljegyzések számtani átlagát súlyozzák a háztartásoktól begyűjtött fogyasztási szerkezetadatokkal. A reprezentánsok egyedi árindexe a tárgyhavi és bázishavi átlagárak hányadosa. A fogyasztói árindex a reprezentások egyedi árindexeinek súlyozott átlaga, mégpedig bázissúlyozású, éven belül változatlan súlyozással. A magyar gyakorlatban a Laspeyres-típusú árindexet számolják, mert a lakossági adatszolgáltatási rendszer 12 ezer háztartást számláló reprezentatív mintájából nyert fogyasztási szerkezet aktuális adatai (a súlyszámok) csak bizonyos időeltolódással állnak rendelkezésre. A fogyasztói kosár árindexén kívül a termékek meghatározott körére is kiszámolják az árváltozást. Az árindex jelenleg három fokozatú csoportosításban készül: – a termékek és szolgáltatások részletes csoportjai (ezek száma 160), – összegzőcsoportok a részletes csoportokból (számuk 40), 227
Érték-, ár- és volumenindexek – főcsoportok, melyek az összegzőcsoportokból épülnek fel (számuk 8–10). A teljes lakossági fogyasztásra vonatkozó árindexen kívül az egyes rétegekre külön is kiszámítják az átlagos árváltozás mértékét. Az árindexeket havonta közzéteszik, jelezve az előző év hasonló hónapjához, az előző év decemberéhez és a közvetlenül megelőző hónaphoz viszonyított áralakulást. Az éves árindexek a tárgyévi átlagos árakat veszik alapul, s kétféle viszonyítással, bázis- és láncárindexekként is meghatározásra kerülnek. Az árindexet az indexáláshoz is felhasználják, azaz a különféle jellegű ki- vagy befizetési kötelezettségeket (pl. bérek, biztosítási díj) az inflációhoz igazítják. Az árstatisztikában lényeges az árarányok változásának vizsgálata is. Ez szintén az árindexek segítségével történik. A különböző termékek árindexeinek összehasonlításával határozható meg az árolló.Azt mutatja meg, hogy valamilyen bevételt biztosító termékek bázisidőszakival azonos volumenéért a tárgyidőszakban mennyivel nagyobb vagy kisebb volumenű másféle termék kapható cserébe. Az agrárolló a mezőgazdasági termékek értékesítési árindexének és a mezőgazdaságban felhasznált iparcikkek beszerzési árindexének hányadosa. 1993-ban Magyarországon például a mezőgazdasági termelői felvásárlási árak 18,5%-kal haladták meg az előző évit, míg a termelésben felhasznált iparcikkek árai 20%-kal emelkedtek, tehát a két árindex hányadosából kiszámítható az agrárolló:
Ez azt jelenti, hogy 1993-ban 1,3%-kal magasabb volumenű mezőgazdasági termék eladása szükséges annyi bevétel eléréséhez, amely az 1992es szinttel azonos volumenű ipari termékek megvásárlását lehetővé teszi. Az árollók másik jelentős alkalmazási területeként az ún. cserearány-mutatókat említhetjük. Ezek a gazdálkodó szervezetek által eladott termékek árindexét viszonyítják a vásárolt termékek árindexéhez. E mutatók értéke akkor kedvező, ha 100% felett van. A külkereskedelmi cserearány mutatója az ún. cserearányindex (terms of trade), az adott ország által exportált és az általa importált termékek árindexeinek hányadosa. A mutató értéke azt fejezi ki, hogy az azonos volumenű export az importtermékek fogyasztásának milyen változását teszi lehetővé. Hazánkban 1993-ban az importált termékek árai 9,4%-kal haladták meg az előző évi árakat, míg az exportált cikkeknél 11,9%-os áremelkedés következett be. Így a cserearány-mutató a következőképpen alakult:
1993-ban 2,3%-kal nagyobb volumenű terméket importálhattunk volna, ha az exportból származó bevételt csak importra fordítjuk, tehát javult a cserearány. 228
Érték-, ár- és volumenindexek A volumenindexeket, mint már ismert, többnyire az árindexek segítségével számítják ki. A hagyományos felhasználási területeken túl pl. a fogyasztás reálértékének vagy a reálkereseteknek az alakulását is mérhetik vele, abból fakadóan, hogy az értékváltozásból az árváltozás hatását kiszűrve csak a volumenváltozás marad.
5.6. Indexsorok Az eddigiek során az indexszámok csak két időszak adatainak az összehasonlítására szolgáltak. A dinamikus viszonyszámokhoz hasonlóan az indexeket szintén ki lehet számítani hosszabb időszakra is. A kettőnél több időszakra vonatkozó indexek sorozatát indexsornak hívják. Az indexsoroknak többféle fajtája különböztethető meg az alábbi szempontok alapján: a) tartalma szerint (tehát, hogy milyen jelenség változását fejezik ki) – értékindexsor, – árindexsor, – volumenindexsor; b) a viszonyítás rendje szerint (a dinamikus viszonyszámokhoz hasonlóan) – bázisindexsor; – láncindexsor; c) a súlyozás módja szerint az ár- és volumenindexsoroknál – állandó súlyozású indexsor, – változó súlyozású indexsor. Az előzőek alapján tehát különböző indexsorokat lehet felírni, melyek konkrét kiszámítási módját néhány gyümölcs felvásárlására vonatkozó adatok alapján mutatjuk be (5.5. táblázat).
5.5. táblázat - Néhány gyümölcs felvásárlására vonatkozó adatok az 1990–1993. években Megnevezés
1990
Felvásárlás mennyisége
Termelői felvásárlási átlagárak
(1000 tonna)
(1000 Ft/tonna)
1991
1992
1993 229
1990
1991
1992
1993
Érték-, ár- és volumenindexek
Alma
462
268
277
237
10,4
13,8
10,9
8,8
Málna
15
10
12
6
33,3
35,3
76,7
142,9
Meggy
22
26
41
22
28,5
56,6
29,0
21,5
Szilva
18
18
17
7
11,3
22,1
12,3
14,2
A többféle indexsor meghatározásához célszerű egy összes lehetséges értékadatot ( ) tartalmazó táblát összeállítani oly módon, hogy az egyes évek volumenadatait megszorozzuk valamennyi év áradataival. Így minden, összegzésre alkalmas aggregátum rendelkezésre áll, amely az indexsorok kiszámításához szükséges (5.6. táblázat).
5.6. táblázat - Az 1990–1993. évi felvásárlás összértéke különböző évi árakon számítva 1990
A felvásárlás
1991
1992
1993
évi árakon számítva (ezer Ft)
1990
6134,7
8548,1
7045,7
6937,7
1991
4064,6
5920,8
4663,6
4602,0
1992
4641,0
6942,5
5337,8
5275,3
1993
3370,7
4882,3
3767,6
3515,4
A táblázat adataiból néhány indexsor kiszámítását mutatjuk be. Bázis-értékindexsor
ahol az idősor elemei: 0, 1, 2, ..., n;
230
Érték-, ár- és volumenindexek
lánc-értékindexsor
Figyeljük meg, hogy az értékindexekhez a táblázat „átlójában” szereplő értékadatokat használtuk fel. Állandó súlyozású bázis-volumenindexsor (állandó súly a 0 időszak ára)
231
Érték-, ár- és volumenindexek
állandó súlyozású lánc-árindexsor (állandó súly a 0 időszak mennyisége)
változó súlyozású bázis-árindexsor
232
Érték-, ár- és volumenindexek
változó súlyozású lánc-volumenindexsor
Figyeljük meg, hogy a volumenindexsor egy-egy elemét mindig azonos oszlopban szereplő (tehát azonos árakon számított) értékadatokból számítottuk. Az árindexek számításánál pedig a táblázat vízszintes sorában szereplő (azonos felvásárlási mennyiségre vonatkozó) értékadatok alapján számítottuk ki az indexsor egy-egy elemét. Az állandó súlyozású indexsornál tehát a súlyszám az indexsor minden egyes tagjánál azonos, míg változó súlyozásnál a súlyadatok indexenként különbözőek. Attól függően, hogy mely időszak ár-, illetve volumenadata állandó, lehet az indexsor Laspeyres- vagy Paasche-típusúnak megfelelő. Egyébként az indexsoroknál nem lehet egyértelmű Laspeyres- és Paasche-formuláról beszélni, csak az elvek követése szempontjából történhet a besorolás. A változó súlyozású indexsoroknál az egyes tagok kiszámításánál a kétféle formula pontosan használható. Az előző példában a változó súlyozású bázis-árindexsor elemei Paasche-típusúak, a volumenindexsor tagjai Laspeyres-típusúak. (Természetesen a súlyozás kérdése csak az ár- és a volumenindexsoroknál merül fel.) A kétféle súlyozású indexsor számszerű eredményei eltérnek egymástól, de tartalmuk, mondanivalójuk lényegileg megegyezik. A különböző indexsorok más-más előnyökkel és hátrányokkal rendelkeznek. Az állandó súlyozású indexsor számítása egyszerűbb, s amennyiben a legelső időszak mennyiségi, illetve áradata a súlyszám, az indexsor egymást követő tagjait folyamatosan meg lehet határozni. Problémát a súlyok elavulása okoz, az, hogy a súlyarányok eltolódnak a tényleges arányoktól. Ennek oka, hogy hosszabb időszak alatt az első időszak arányai nagymértékben megváltozhatnak, és a termékcserélődés következtében jelentősen szűkülhet az összehasonlítható termékek köre is. 233
Érték-, ár- és volumenindexek A változó súlyozású indexsor számítása bonyolultabb, de a súlyarányok jól követik a változásokat. A változó súlyozást elsősorban a láncindexeknél használják. Az állandó és a változó súlyozás előnyeinek összekapcsolására a gyakorlatban a kétféle súlyozást általában kombináltan alkalmazzák, ún. szakaszosan állandó súlyú indexsort számolnak. Ez azt jelenti, hogy egy bizonyos időszakra (általában 5–10 év) a súlyadatokat rögzítik, majd az időszak eltelte után megváltoztatják, felfrissítik azokat. A különböző periódusok indexeit pedig láncszerűen kapcsolják össze.
5.6.1. Az indexsorok közötti összefüggések Az indexsorok rendszerében több összefüggés írható fel, melyek közül az alábbiakban a két legfontosabb került kiemelésre: – az érték-, ár- és volumenindexsor közötti összefüggés és a – bázis- és láncindexsorok közötti összefüggés. 1. Az érték-, ár-, volumenindexsor összefüggése szerint az ár- és volumenindexsor azonos időszakra vonatkozó tagjainak szorzata egyenlő az adott időszak értékindexével. Ez az összefüggés azonban csak meghatározott feltételek mellett érvényesül: a) változó súlyozású láncindexek között, ha az egyik indexsor Laspeyres-, a másik indexsor pedig Paasche-formulával került kiszámításra:
b) bázisindexsorok között, ha az egyik indexsor bázisidőszaki állandó súlyozású, a másik pedig a mindenkori tárgyidőszaki változó súlyozású indexsor:
234
Érték-, ár- és volumenindexek
c) Fisher-formulával számított indexsorok között (bázis- és láncindexsoroknál egyaránt). 2. A bázis- és láncindexek összefüggése alapján a láncindexek szorzata egyenlő a bázisindexszel, illetve a két szomszédos bázisindex hányadosából a láncindex meghatározható. Az értékindexsorok között ez az összefüggés mindenkor fennáll, az ár- és volumenindexsoroknál azonban csak az állandó súlyozású indexsorok esetében. Állandó súlyozású árindexek összefüggése: (pl. ha az n-edik időszak mennyiségeivel számítjuk ki mindegyik láncindexet)
Mivel a változó súlyozású indexsor tartalmi mondanivalóját tekintve megegyezik az állandó súlyozásúval, a fenti művelet – a képletszerű összefüggés fennállása nélkül – a változó súlyozású indexsoroknál is elvégezhető. Általában is megállapítható, hogy mivel a súlyozás módja nem érinti az index alapvető tartalmát, az indexekkel minden olyan művelet elvégezhető, amely a megfelelő egyedi indexek között logikus.
5.7. Területi indexek Az indexszámok, mint ahogyan arról szó volt, összehasonlító viszonyszámok. Összehasonlításra azonban nemcsak időben, hanem térben is sor kerülhet. A területi összehasonlítás eredményeként kapott indexek a területi indexek. A területi volumenindex azt fejezi ki, hogy az összehasonlítandó területeken a termelés, értékesítés mennyisége hányszorosa, hányad része az összehasonlítás alapjául szolgáló terület termelésének, értékesítésének. A területi árindex azt mutatja meg, hogy az egyik területen kialakult árszínvonal milyen arányban áll a másik terület árszínvonalával. A területi értékindexet nem értelmezzük, az csak a területi volumenindex és területi árindex közötti összekötő kapocsként szerepel. Az előzőekben tárgyalt bármely indexformula területi indexként is értelmezhető, a különbség csak annyi, hogy az összehasonlítandó időszakok helyett két területi 235
Érték-, ár- és volumenindexek egység adatainak viszonyítására kerül sor. Az eddigi jelölésben a 0, 1 (bázis-, tárgyidőszak) vagy más értelmet kap (0, 1 terület), vagy megváltozik pl. A-ra, B-re, az adott területek adatainak azonosítása céljából. A súlyszámok tehát A vagy B terület mennyiség-, illetve áradatai lehetnek, a bázisvagy beszámolási súlyok helyett. A másik lényeges különbség a területiindex-számítás és az időbeli összehasonlítás között az, hogy míg az egyes időszakok adatai a viszonyítás során nem felcserélhetőek – mindig a későbbit hasonlítjuk a korábbihoz –, addig a területi indexeknél a sorrend nem kötött. Bármelyik területi egység adatait viszonyíthatjuk a másikhoz és viszont. Ebből következik, hogy A/B relációjú összehasonlítás eredménye reciprokviszonyban kell legyen a B/A relációjú összehasonlítás eredményével. Ez az ún. felcserélési próba, amely a már ismert időpróbának felel meg. Másik követelmény a területi indexekkel szemben a tranzitivitás követelménye, ami az időszakok összehasonlítására használt indexeknél a láncpróba volt. Ez azt jelenti, hogy két terület közvetlen összehasonlítása a közvetett összehasonlítással azonos eredményt kell, hogy adjon. (Azaz A és C területek közvetlen viszonyításánál az A/C index a B területen keresztüli közvetett összehasonlításnál az A/B és a B/C indexek szorzatával megegyező érték legyen.) A különböző súlyozású indexformulák eredményei között lényegesen nagyobb eltérés lehet, mint az időbeli összehasonlításnál, ezért különösen indokolt a Fisher-féle index használata. Az összehasonlítandó területeket A-val és B-vel jelölve a területi árindex Fisher-formája :
a területi volumenindex Fisher-formája:
A területi indexek kiszámításának módját az alábbi példán mutatjuk be (5.7. táblázat).
5.7. táblázat - Néhány cikk felhozatalára vonatkozó adatok két alföldi város piacán 1995 júniusában A város Termék megnevezése
felhozatal mennyisége (kg)
B város átlagár (Ft/kg)
felhozatal mennyisége (kg)
átlagár (Ft/kg)
Burgonya
150 000
85,0
70 000
100,0
Sárgarépa
12 000
165,0
6 500
150,0
236
Érték-, ár- és volumenindexek Vöröshagyma
20 000
42,0
12 000
45,0
Bab (száraz)
7 000
320,0
5 000
300,0
A két város felhozatalának összértéke mindkét város árain számolva (ezer Ft-ban) A felhozatal mennyisége Városok
A város
B város árain számítva
A város
17 810,0
19 800,0
B város
9 126,5
10 015,0
A táblázat adatai alapján a területi árindex tehát:
A vizsgált termékek árszínvonala a Fisher-index szerint 9,5%-kal volt alacsonyabb A városban B városhoz viszonyítva. A területi volumenindexek a példa alapján:
237
Érték-, ár- és volumenindexek A négy vizsgált termék piaci felhozatalának mennyisége az A városba a Fisher-index alapján átlagosan 96,4%-kal haladta meg B város felhozatalának mennyiségét. A területi indexnél – mint arról szó volt – a viszonyítási alap és a viszonyítás tárgya felcserélhetőek, ezért vizsgálható jelen esetben az is, hogy B város piaci felhozatala A városhoz viszonyítva miként alakult. Pl.:
B város piaci felhozatalának árai a vizsgált cikkeknél tehát átlagosan 10,4%-kal voltak magasabbak A városhoz képest (a volumenalakulás ebben a relációban hasonlóképpen vizsgálható). Miután a kétféle viszonyítású indexek egymással reciprokviszonyban állnak, a számítás a következő módon is elvégezhető, pl. az árindexek esetében:
A területi indexek legfontosabb alkalmazási területe a nemzetközi összehasonlítás. Ez esetben a területi indexeknek olyan sajátossága is jelentkezik, amely a különböző országok eltérő valutaegységéből fakad. Annak következtében, hogy az árindex számlálójának és nevezőjének nem azonos a mértékegysége, az eredmény nem fejezhető ki százalékos formában. Az árindex ilyenkor a két ország valutái vásárlóerejének arányát fejezi ki a vizsgált termékek vonatkozásában. Azt mutatja tehát, hogy egy adott (az összehasonlítás alapjául szolgáló) ország egységnyi valutája a másik (összehasonlítandó) ország hány valutájával egyenlő az összehasonlított termékek körében. A volumenindex a különböző országok gazdasági fejlettségének, a lakosság életszínvonalának összehasonlítását is szolgálhatja. Kimutatható pl., hogy az egy főre jutó fogyasztás volumene miként alakul két ország vonatkozásában. Amennyiben nem két, hanem több terület összehasonlítását végezzük el, az indexsoroknál leírt módon járhatunk el.
5.8. Gyakorlófeladatok 1. A Magyar Statisztikai Évkönyvből (KSH, 1994) valók az alábbi információk: – A magyar háztartások összes élelmiszer-fogyasztása 1991-ben 374 Mrd Ft, 1992-ben pedig 452 Mrd Ft volt folyó áron számolva. 238
Érték-, ár- és volumenindexek – Az élelmiszerek fogyasztói ára 1992-ről 1993-ra Magyarországon 29,2%-kal, Ausztriában pedig 2,9%-kal nőtt. – A nyerskávé-behozatal 1993-ban 3487 millió Ft volt. – Behozatali forgalmunk folyó áron számítva 1992-ről 1993-ra 32,3%-kal nőtt, kiviteli forgalmunk pedig 2,8%-kal csökkent. – 1992-ről 1993-ra az importált termékek volumene átlagosan 20,9%-kal nőtt, az exportált termékekre vonatkozóan pedig átlagosan 13,1%-os csökkenés volt tapasztalható. – A külkereskedelmi forgalom egyenlege – folyó áron számítva – 1993-ban –342 576 millió Ft volt. – 1990-ben Magyarországon 427 ezer db színes tv-t gyártottak. 1993-ra a gyártott mennyiség 45,1%-ra csökkent. Feladat: Értelmezzük az információkat! 2. Egy piaci árus feljegyezte néhány termékének fontosabb értékesítési adatait: Eladott mennyiség Termék
Mértékegység
Egységár (Ft/kg)
márciusban áprilisban márciusban áprilisban
Alma
kg
150
130
100
120
Narancs
kg
200
240
130
150
Burgonya
kg
60
80
70
85
Tojás
db
200
300
10*
12*
*Ft/db Feladat: a) Mennyi volt az árus bevétele az egyes termékekből, valamint összesen? Vizsgáljuk meg a változást is! b) Hogyan változott márciusról áprilisra: – az értékesítés volumene (termékenként), 239
Érték-, ár- és volumenindexek – a termékek ára? c) Mennyi volt a négy termék árszínvonal-változása? A kapott eredményt vessük össze a termékenkénti árváltozásokkal! d) Számítsuk ki az együttes volumenváltozást – az alapadatokból, – a már kiszámított indexekből, – az egyedi volumenindexek alapján! A számításokat Laspeyres-formula szerint végezzük el! e) Hány Ft-tal volt több az árus bevétele: – az árváltozások miatt, – az értékesített mennyiségek változása miatt? 3. A 4.5. Gyakorlófeladatok 11. példájához kapcsolódva számítsuk ki: a) a forgalom értékének változását, és b) elemezzük az erre ható tényezőket! 4. Egy háztartási gépeket is forgalmazó vállalkozás értékesítésére vonatkozó adatok: Árucikk
Értékesített mennyiség (db)
Árbevétel (ezer Ft)
1993
1994
1993
1994
Hűtőszekrény
1400
1800
46 200
68 400
Hűtő-fagyasztó
300
400
12 000
18 000
Fagyasztószekrény
500
700
20 000
33 600
Fagyasztóláda
700
500
26 600
25 000
Feladat: 240
Érték-, ár- és volumenindexek a) Vizsgáljuk az értékesítési forgalom alakulását árucikkenként és együttesen! b) Számítsuk ki, hogyan változott az értékesítés mennyisége árucikkenként külön-külön és a felsorolt árucikkekre átlagosan! c) Mutassuk ki az árszínvonal-változást és az ebből eredő forgalomnövekedést! d) Melyik árucikknek nőtt legnagyobb mértékben az ára 1993-ról 1994-re? 5. Egy kisvállalkozás belkereskedelmi tevékenységére vonatkozó adatok:
Árucsoport
Árbevétel
Az értékesített
A folyó áras
1990-ben (ezer Ft)
mennyiség
árbevétel
1995-ben az 1990. évi %-ában
A
3 000
140,0
154,0
B
8 000
120,0
126,0
C
1 000
150,0
150,0
D
10 000
95,0
114,0
22 000
...
...
Összesen Feladat:
a) Számítsuk ki a négy árucsoportra vonatkozóan az érték-, ár- és volumenindexet! b) Számítsuk ki, hogy hány millió Ft-tal nőtt az árbevétel: – az árváltozás miatt, – az értékesített mennyiségek változása miatt! c) Határozzuk meg az ellentétes súlyozású ár- és volumenindexeket! Magyarázzuk meg a megfelelő indexek eltérését! 6. A háztartások fogyasztására vonatkozó adatok: Fogyasztási javak
Összes fogyasztás folyó áron Mrd Ft-ban
Volumenindex*
241
Érték-, ár- és volumenindexek 1991
1992
(%)
Élelmiszerek
374
452
100,4
Italok, kávé, tea
143
165
99,6
Dohányáru
37
43
93,4
Ruházkodás
99
120
98,6
Együtt
653
780
...
*Bázissúlyozású Feladat: a) Hány Mrd Ft-tal, illetve hány %-kal nőtt a fogyasztás nominálértékben? b) Hogyan alakultak az árak az egyes fogyasztási javaknál, illetve átlagosan? c) Hány Mrd Ft-tal nőtt a fogyasztás az árak növekedése miatt? d) A fogyasztás csökkenő mennyiségei miatt hány Mrd Ft-tal lett kevesebb 1992-ben az összes fogyasztási kiadás? 7. Egy család 1992-ben összes kiadásának 30%-át élelmiszerekre, 20%-át ruházati cikkekre, 25%-át szolgáltatásokra, 15%-át tartós fogyasztási cikkekre, 10%-át pedig egyéb dolgokra költötte. A termékcsoportok árváltozásáról az alábbiak ismertek: Kiadási csoport
Árindex* 1991=100%
Élelmiszerek
122
Ruházati cikkek
132
Szolgáltatások
142
Tartós fogyasztási cikkek
110
Egyéb
128
242
Érték-, ár- és volumenindexek Összesen *1992-es számolva
... fogyasztási
mennyiségekkel
A család éves jövedelme 1991-ben 380 ezer Ft, 1992-ben pedig 460 ezer Ft volt, és sem 1991-ben, sem 1992-ben nem volt megtakarításuk. Feladat: a) Hány %-kal nőtt a család jövedelme nominálértékben? b) Hogyan változott a fogyasztási cikkek árszínvonala? c) Hogyan változott a család reáljövedelme (jövedelmének vásárlóértéke)? 8. A nominálkeresetek alakulása Magyarországon: Év
Nominál átlagkereset* 1980=100%
1990
249,9
1991
313,6
1992
380,4
1993
447,7
* Egy keresőre számítva A fogyasztói árak 1990-ről 1991-re 35%-kal, 1991-ről 1992-re 23%-kal és 1992-ről 1993-ra további 22,5%-kal nőttek. Feladat: Hogyan alakultak a reálkeresetek 1990-hez képest, illetve évről évre? 9. Három termék értékesítésére vonatkozó adatok: Termék
Értékesítési forgalom Mennyiségváltozás 1993-ban (millió Ft) (%)
Árváltozás (%)
243
Érték-, ár- és volumenindexek
1993-ról 1994-re
1993-ról 1994-re
A
40
+ 10
+ 15
B
60
+ 20
+ 27
C
100
+ 40
+ 60
Együtt
200
...
...
Feladat: a) Számítsuk ki a volumenindexet mindkét súlyozással! Indokoljuk az eltérő eredményt, magyarázzuk meg a nagyságrendet! b) Számítsuk ki a Fisher-féle árindexet! Ellenőrizzük számszerű nagyságát! 10. Egy kiskereskedő fontosabb áruinak mennyiségi és áralakulását vizsgálta. Az alábbi adatokat ismerjük: Termék
Volumenindex (%)
Árindex (%)
A
102
110
B
105
130
C
110
150
Feladat: Állapítsuk meg, hogy az alábbi megállapítások közül melyek lehetnek „igazak” és melyek „hamisak”: a) A három termék árszínvonala nőtt. b) A három termék mennyiségének növekedése átlagosan nem több, mint 10%. c) A Paasche-súlyozású árindex kisebb árnövekedést mutat, mint a Laspeyres-súlyozással számított index. d) Az együttes árindex 110 és 150% között helyezkedik el. e) A bázisidőszak forgalmiérték-adatainak ismeretében a kiskereskedő pontosan ki tudja számítani valamelyik árindexet (a három termékre). f) A három termékre számított értékindex 100%-nál kisebb. 244
Érték-, ár- és volumenindexek
g) A Paasche-súlyozású volumenindex
nagyobb, mint a Laspeyres-súlyozású
.
11. A piacgazdálkodást folytató országokkal kapcsolatos külkereskedelmi forgalom adatai: Behozatali forgalom Év
Mrd Ft folyó áron
1985
Kiviteli forgalom
Árindex
Árindex
Előző év=100%
Év
Mrd Ft folyó áron
175
–
1985
162
–
1986
186
105,5
1986
154
98,2
1987
209
110,8
1987
188
110,6
1988
234
114,0
1988
240
114,9
1989
291
114,6
1989
301
116,9
1990
344
116,2
1990
376
114,6
1991
637
126,5
1991
584
120,3
1992
649
111,7
1992
646
168,8
1993
805
110,9
1993
599
110,3
Előző év=100%
Az árindexek Fisher-formulával kerültek kiszámításra. Feladat: a) Vizsgáljuk meg a folyó áras forgalmak alakulását 1985-höz viszonyítva, valamint évről évre! Milyen indexsorokat számoltunk? b) Vizsgáljuk meg a behozatali, valamint a kiviteli forgalom volumenének alakulását évről évre! Állapítsuk meg az indexsorok típusát! c) Számítsuk ki, hogy 1985 és 1993 között melyik területen (az importnál vagy az exportnál) volt nagyobb az árváltozás átlagos növekedési üteme! d) Számítsuk ki a cserearány-mutatókat! 245
Érték-, ár- és volumenindexek 12. Egy vállalat termelésének alakulására vonatkoznak az alábbi adatok: A termelés értéke (millió Ft) Év
1990
1991
1992
1993
évi áron 1990
120
124
130
140
1991
117
120
126
132
1992
115
119
124
130
1993
121
124
126
135
Feladat: a) Vizsgáljuk meg a termelési érték változását! b) Számítsunk állandó (1992-es) súlyozású lánc-volumenindexeket! Mutassuk be a lánc- és a bázisindexek közötti összefüggést! c) Számítsuk ki a változó súlyozású lánc-árindexsor elemeit a Laspeyres- és a Paasche-féle súlyozásnak megfelelően is! Magyarázzuk meg az 1993-ra számított indexek eltérését!
246
A. függelék - Irodalom Hajdú–Pintér–Rappai–Rédey: Statisztika I–II. JPTE, Pécs, 1994. Hunyadi László–Vita László: Statisztika I. Aula Kiadó, Budapest, 1991. Hunyadi László–Mundruczó György–Vita László: Statisztika II. Aula Kiadó, Budapest, 1992. Kerékgyártó Györgyné–Mundruczó György: Statisztikai módszerek a gazdasági elemzésben. Aula Kiadó, Budapest, 1995. Korpás Attiláné–Molnár Máténé–Szűts István: Általános statisztika I. rész. Tankönyvkiadó, Budapest, 1992. Köves Pál–Párniczky Gábor: Általános statisztika I–II. Közgazdasági és Jogi Könyvkiadó, Budapest, 1981.
247
6. fejezet - Tárgymutató adat alap~ leszármaztatott ~ adatfelvétel reprezentatív ~ részleges ~ teljes körű ~ aggregálás aggregátum agrárolló aszimmetria ~ mérőszámai asszociáció ~s együttható Cramer-féle ~ Csuprov-féle ~ Yule-féle ~ ár árindex 248
Tárgymutató egyedi ~ Fisher-féle ~ fogyasztói ~ Laspeyres-féle ~ Marshall–Edgeworth–Bowley-féle Paasche-féle területi árolló átlag fő~ harmonikus ~ kronologikus ~ mértani ~ négyzetes ~ rész~ számtani ~ ~ tulajdonságai átlagár ~változás Bortkiewicz-tétel bot-ábra 249
Tárgymutató cserearány-index csoportosítás deflálás determinációs hányados egység (egyed) megfigyelési számbavételi eltérés-négyzetösszeg belső ~ külső ~ teljes ~ értékindex egyedi ~ értékösszeg kumulált ~ relatív ~ ~sor fejlődés átlagos mértéke fejlődés átlagos üteme főátlag ~index 250
Tárgymutató ~ok hányadosának elemzése ~ok különbségének elemzése főindex függetlenség függvényszerű kapcsolat gyakoriság együttes ~ kumulált ~ perem~ relatív ~ ~i eloszlás ~i megoszlás ~i poligon ~i sor helyzetmutatók hiba abszolút ~ relatív ~ hibakorlát hisztogram idősor 82 251
Tárgymutató állapot~ tartam~ indexpróbák indexsor ár~ érték~ volumen~ indexszám ismérv alternatív ~ diszkrét ~ folytonos ~ időbeli ~ közös ~ megkülönböztető ~ mennyiségi ~ területi ~ ~változat kérdőív koncentráció ~s együttható 252
Tárgymutató korreláció ~s hányados ~s tábla kördiagram kumulálás kvantilis ~ eloszlás kvartilis alsó ~ felső ~ Lorenz-görbe medián mérési skála arány~ intervallum~ névleges ~ sorrendi ~ módusz mutatószám oszlopdiagram osztályköz 253
Tárgymutató ~határok ~ös gyakorisági sor osztályközépső összehasonlítás összetételhatás-index összetételhatás-különbség rangsor részátlagindex részhatáskülönbség részindex sokaság álló ~9 diszkrét ~ folytonos ~ fő~ mozgó ~ rész~ véges ~ végtelen ~ sor csoportosító ~ 254
Tárgymutató idő~ leíró ~ mennyiségi ~ minőségi ~ összehasonlító ~ területi ~ statisztika leíró ~ statisztikai következtetés statisztikai tábla csoportosító ~ egyszerű ~ kombinációs ~ kontingencia~ ~dimenziószáma szórás ~hányados ~négyzet-hányados szórásnégyzet belső ~ külső ~ 255
Tárgymutató teljes ~ ~-felbontás szóródás ~ mutatói átlagos eltérés átlagos különbség relatív szórás sztochasztikus összefüggés vegyes kapcsolat viszonyszám bázis~ dinamikus ~ intenzitási ~ koordinációs ~ lánc~ megoszlási ~ összetett ~ rész~ volumenindex egyedi ~ Fisher-féle ~ 256
Tárgymutató Laspeyres-féle ~ Marshall–Edgeworth–Bowley-féle ~ Paasche-féle ~ területi ~ vonaldiagram
257